CN107491101A - 一种麦克风阵列拾音角度的调节方法、装置及电子设备 - Google Patents
一种麦克风阵列拾音角度的调节方法、装置及电子设备 Download PDFInfo
- Publication number
- CN107491101A CN107491101A CN201710828074.8A CN201710828074A CN107491101A CN 107491101 A CN107491101 A CN 107491101A CN 201710828074 A CN201710828074 A CN 201710828074A CN 107491101 A CN107491101 A CN 107491101A
- Authority
- CN
- China
- Prior art keywords
- angle
- user
- camera
- current
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D3/00—Control of position or direction
- G05D3/12—Control of position or direction using feedback
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Studio Devices (AREA)
Abstract
本发明公开了一种麦克风阵列拾音角度的调节方法、装置及电子设备,该调节方法包括:根据麦克风阵列的当前拾音角度调整摄像头拍摄角度,以使用户面部位于摄像头获取的初始面部图像中的第一位置处;控制摄像头采集用户的当前面部图像,并识别出用户面部在当前面部图像中的当前位置;根据第一位置和当前位置计算出用户的移动角度;根据移动角度更新当前拾音角度。通过本发明实施例的方法,就能够调节麦克风阵列的拾音角度,更新波束形成的角度,使具有该麦克风阵列的设备能够准确连贯的拾取用户的声音。
Description
技术领域
本发明涉及麦克风拾音领域,更具体地,本发明涉及一种麦克风拾音角度的调节方法、装置及电子设备。
背景技术
由于智能家居的迅速发展,人们对于生活质量的要求越来越高,智能语音操控也逐步深入家庭生活。国内外厂商也纷纷推出了相应的智能语音产品来抢占智能家居的入口,这些智能语音产品在一定程度上方便了人们的生活。
智能语音产品通常包含两个或两个以上的麦克风组成的麦克风阵列来拾取说话人的声音。在使用时,首先要求用户说出一个特定的唤醒词,在唤醒智能语音设备的同时推定出用户所在的方位角度,以利于麦克风阵列波束形成拾取用户角度方向的声音指令,进而送给语音识别引擎,以便作出下一步反应。这种使用模式要求用户在说话的时候不能随意移动位置,否则麦克风阵列就会拾取错误方向(非用户方向)的声音;当周围环境噪声较大或混响较强时,拾取到的用户语音里就会含有较多的噪声或混响,造成后续的语音识别率急剧下降。当用户改变角度位置时,唯一的方法就是再次说出唤醒词,重新唤醒并推定新的角度来拾音,这样就影响了用户体验。
发明内容
本发明的一个目的是提供一种能够调节麦克风阵列的拾音角度的新技术方案。
根据本发明的第一方面,提供了一种麦克风阵列拾音角度的调节方法,包括:
根据麦克风阵列的当前拾音角度调整摄像头拍摄角度,以使用户面部位于所述摄像头获取的初始面部图像中的第一位置处;
控制所述摄像头采集所述用户的当前面部图像,并识别出用户面部在所述当前面部图像中的当前位置;
根据所述第一位置和所述当前位置计算出用户的移动角度;
根据所述移动角度更新所述当前拾音角度。
可选的是,所述根据当前拾音角度调整摄像头拍摄角度之前还包括:
根据所述麦克风阵列接收到的唤醒语音确定所述当前拾音角度。
可选的是,所述第一位置为所述初始面部图像的中心位置。
可选的是,所述根据所述拾音角度调整摄像头拍摄角度,以使用户面部位于所述摄像头获取的初始图像的第一位置处包括:
根据所述当前拾音角度调整所述摄像头的拍摄角度;
控制所述摄像头采集所述用户的第一面部图像;
识别出所述第一面部图像中用户面部所在的位置作为第二位置;
判断所述第二位置与所述第一位置是否重合,如是,则:控制所述摄像头采集所述用户的当前面部图像,并识别出用户面部在所述当前面部图像中的当前位置;如否,则:
根据所述第二位置和所述中心位置计算所述摄像头的第二调整角度;
根据所述第二调整角度调整所述摄像头的拍摄角度。
可选的是,所述根据所述第一位置和所述当前位置计算出用户的移动角度包括:
计算所述当前位置至所述第一位置的在水平方向上的水平距离、及在垂直方向上的垂直距离;
根据所述水平距离计算出所述用户的横向移动角度,根据所述垂直距离计算所述用户的纵向移动角度;
根据所述横向移动角度和所述纵向移动角度计算得到所述移动角度。
可选的是,所述根据所述移动角度更新所述当前拾音角度包括:
计算所述当前拾音角度和所述移动角度的矢量和,得到更新后的当前拾音角度。
可选的是,所述调节方法还包括:
根据所述移动角度调整所述摄像头的拍摄角度,以使所述用户面部位于所述摄像头获取的第二面部图像中的所述第一位置处。
可选的是,所述根据所述移动角度调整所述摄像头的拍摄角度包括:
根据所述移动角度调整所述摄像头的航向角。
根据本发明的第二方面,提供了一种麦克风阵列拾音角度的调节装置,包括:
第一调整模块,用于根据麦克风阵列的当前拾音角度调整摄像头拍摄角度,以使用户面部位于所述摄像头获取的初始面部图像中的第一位置处;
第一控制模块,用于控制所述摄像头采集所述用户的当前面部图像,并识别出用户面部在所述当前面部图像中的当前位置;
第一计算模块,用于根据所述第一位置和所述当前位置计算出用户的移动角度;
更新模块,用于根据所述移动角度更新所述当前拾音角度。
可选的是,所述装置还包括:
确定模块,用于根据所述麦克风阵列接收到的唤醒语音确定所述当前拾音角度。
可选的是,所述第一位置为所述初始面部图像的中心位置。
可选的是,所述第一调整模块包括:
第一调整单元,用于根据所述当前拾音角度调整所述摄像头的拍摄角度;
第一控制单元,用于控制所述摄像头采集所述用户的第一面部图像;
识别单元,用于识别出所述第一面部图像中用户面部所在的位置作为第二位置;
判断单元,用于判断所述第二位置与所述第一位置是否重合;
计算单元,用于在所述判断单元的判断结果为否的情况下,根据所述第二位置和所述中心位置计算所述摄像头的第二调整角度;
第二调整单元,用于根据所述第二调整角度调整所述摄像头的拍摄角度;
所述第一控制模块还用于在所述判断模块的判断结果为是的情况下,控制所述摄像头采集所述用户的当前面部图像,并识别出用户面部在所述当前面部图像中的当前位置。
可选的是,所述第一计算模块还包括:
距离计算单元,用于计算所述当前位置至所述第一位置在水平方向上的水平距离、及在垂直方向上的垂直距离;
第一角度计算单元,用于根据所述水平距离计算出所述用户的横向移动角度,根据所述垂直距离计算所述用户的纵向移动角度;
第二角度计算单元,用于根据所述横向移动角度和所述纵向移动角度计算得到所述移动角度。
可选的是,所述更新模块还用于计算所述当前拾音角度和所述移动角度的矢量和,得到更新后的当前拾音角度。
根据本发明的第三方面,提供了一种电子设备,包括处理器和存储器,所述存储器用于存储指令,所述指令用于控制所述处理器进行操作以执行根据本发明第一方面所述的调节方法。
本发明的一个有益效果在于,通过本发明实施例的方法,就能够调节麦克风阵列的拾音角度,更新波束形成的角度,使具有该麦克风阵列的设备能够准确连贯的拾取用户的声音。在用户初始唤醒后再次改变位置时,就可以及时将更新的拾音角度送给麦克风阵列进行波束形成拾音,而不需要用户的人为干预,这样,用户就可以随意走动而不影响拾音效果,实现了对移动说话人的持续准确拾音。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是根据本发明一种麦克风阵列拾音角度的调节方法的一种实施方式的流程图;
图2是根据本发明一种麦克风阵列拾音角度的调节方法的另一种实施方式的流程图;
图3是根据本发明一种麦克风阵列拾音角度的调节装置的一种实施结构的方框原理图;
图4是根据本发明一种麦克风阵列拾音角度的调节装置的另一种实施结构的方框原理图;
图5是根据本发明一种电子设备的方框原理图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本发明为了解决现有技术中存在的具有麦克风阵列的电子设备在被用户唤醒后,用户无法在拾音过程中移动的问题,提供了一种调节麦克风阵列拾音角度的新的技术方案。
图1是根据本发明的一种麦克风阵列拾音角度的调节方法的一种实施方式的流程图。
根据图1所示,包括如下步骤:
步骤S110,根据麦克风阵列的当前拾音角度调整摄像头的拍摄角度,以使用户面部位于摄像头的采集的初始面部图像中的第一位置处。
其中,摄像头可以是光学摄像头,也可以是红外摄像头。调整摄像头的拍摄角度可以是调整摄像头的航向角和俯仰角。具体的,可以预先建立空间直角坐标系,该坐标系中包括相互正交于一点的X轴、Y轴和Z轴,且用户和摄像头均处于该空间直角坐标系中。航向角为摄像头绕Z轴转动的角度,俯仰角为摄像头绕X轴转动的角度,翻滚角为摄像头绕Y轴转动的角度,且摄像头绕对应坐标轴顺时针转动时的角度为正,绕对应坐标轴逆时针转动时的角度为负。在本发明的实施例中未用到摄像头的翻滚角。
在本发明的一个具体实施例中,当前拾音角度可以是根据麦克风阵列接收到的唤醒语音确定的初始拾音角度。具体的,在用户初始唤醒具有麦克风阵列的设备时,会根据唤醒语音到达麦克风阵列中各麦克风的幅度差和相位差的不同,推定出初始拾音角度,也即当前拾音角度。
在本发明的另一个具体实施例中,当前拾音角度也可以是已经对初始拾音角度进行过一次或者多次自适应调节之后得到的,其中,初始拾音角度是根据麦克风阵列接收到的唤醒语音确定的。
进一步地,第一位置可以是初始面部图像的中心位置。在摄像头的拍摄过程中,会同时进行面部识别,具体可以参考手机拍摄过程中的面部识别功能,会在检测到面部时生成面部检测框,因此,可以将该面部检测框的中心位置作为用户面部在初始面部图像中的位置。在第一位置为初始面部图像的中心位置的情况下,面部检测框的中心位置与初始面部图像的中心位置重合。
但是,如果仅仅根据当前拾音角度调整摄像头的拍摄角度,可能会使得面部检测框的中心位置与初始面部图像的第一位置无法重合,因此,在此基础上,执行该步骤S110的具体方法包括如图2所示的步骤S111~S116:
步骤S111,根据当前拾音角度调整摄像头的拍摄角度。
例如,可以在当前拾音角度为α时,将摄像头的航向角也调整为α。
步骤S112,控制摄像头采集用户的第一面部图像。
步骤S113,识别出用户面部在该第一面部图像中的位置作为第二位置。
步骤S114,判断第二位置与第一位置是否重合,如否,则执行步骤S115,;如是,则执行步骤S120。
步骤S115,根据第二位置和第一位置确定摄像头的第二调整角度。
步骤S116,根据第二调整角度调整摄像头的拍摄角度。
在执行完步骤S116之后,继续执行步骤S114,直至步骤S114的判断结果为是,即面部检测框的中心位置与初始面部图像的第一位置重合,用户面部位于初始面部图像中的第一位置处。
步骤S120,控制摄像头采集用户的当前面部图像,并识别出用户面部在当前面部图像中的当前位置。
其中,当前位置为面部检测框的中心位置在当前面部图像中的位置。
步骤S130,根据第一位置和当前位置计算出用户的移动角度。
具体的,可以预先针对摄像头采集的图像建立平面直角坐标系,该坐标系包括垂直于一点的水平坐标轴和垂直坐标轴。该平面直角坐标系是针对于面部图像的,用于确定面部图像中面部检测框的中心位置的坐标,于前述的空间直角坐标系不同。
在本发明的一个具体实施例中,当前位置至第一位置在水平方向上的水平距离与用户的横向移动角度之间具有一一对应的关系。当前位置至第一位置在垂直方向上的垂直距离与用户的纵向移动角度之间具有一一对应关系。其中,用户的横向移动角度具体是指用户在上述空间直角坐标系中绕Z轴转动的角度;用户的纵向移动角度具体是指用户在上述空间直角坐标系中绕X轴转动的角度。
例如,摄像头的当前焦距为m,当前位置至第一位置水平距离为a、垂直距离为b,用户的横向移动角度为β、纵向移动角度为γ,水平距离a与横向移动角度之间的关系可以为垂直距离b与纵向移动角度之间的关系可以为
进一步地,如果当前位置的坐标为(x1,y1),第一位置的坐标为(x2,y2),那么,当前位置至第一位置的水平距离a=x2-x1,当前位置至第一位置的垂直距离b=y2-y1,其中,水平距离a和垂直距离b可以是正数也可以是负数。而且,横向移动角度α在水平距离a为正数的情况下也为正数,在水平距离a为负数的情况下也为负数;纵向移动角度β在垂直距离b为正数的情况下也为正数,在垂直距离b为负数的情况下也为负数。
再根据用户在上述空间直角坐标系中的横向移动角度和纵向移动角度,就可以计算得到矢量的移动角度。
在此基础上,移动角度其中,分别代表空间直角坐标系中X、Y、Z轴上的单位向量。
步骤S140,根据移动角度更新当前拾音角度。
具体的,当前拾音角度加上移动角度即可得到更新后的当前拾音角度。其中,当前拾音角度和移动角度均为矢量。
例如,在当前拾音角度为Φ的情况下,如果移动角度为θ,更新后的当前拾音角度则为Φ+θ。
在本发明的一个具体实施例中,在执行完步骤S140之后,该方法还包括步骤S210:根据移动角度调整摄像头的拍摄角度,以使用户面部位于摄像头获取的第二面部图像中的第一位置处。其中,第二面部图像是摄像头在根据移动角度调整摄像头的拍摄角度之后采集的。具体的,可以是根据用户的横向移动角度调整摄像头的航向角,根据用户的纵向移动角度调整摄像头的俯仰角。
这样,通过本发明实施例的方法,就能够调节麦克风阵列的拾音角度,更新波束形成的角度,使具有该麦克风阵列的设备能够准确连贯的拾取用户的声音。在用户初始唤醒后再次改变位置时,就可以及时将更新的拾音角度送给麦克风阵列进行波束形成拾音,而不需要用户的人为干预,这样用户就可以随意走动而不影响拾音效果,实现了对移动说话人的持续准确拾音。
与上述方法相对应的,本发明还提供了一种麦克风阵列拾音角度调节装置。图3为根据本发明一种麦克风阵列拾音角度的调节装置的一种实施结构的方框原理图。
如图3所示,该调节装置包括第一调整模块310、第一控制模块320、第一计算模块330和更新模块340,该第一调整模块310用于根据麦克风阵列的当前拾音角度调整摄像头拍摄角度,以使用户面部位于摄像头获取的初始面部图像中的第一位置处;该第一控制模块320用于控制摄像头采集用户的当前面部图像,并识别出用户面部在当前面部图像中的当前位置;该第一计算模块330用于根据第一位置和当前位置计算出用户的移动角度;该更新模块340用于根据移动角度更新当前拾音角度。
在本发明的一个具体实施例中,第一计算模块330还用于计算当前位置至第一位置的位移;根据位移计算得到移动角度。
进一步地,更新模块340还还用于计算当前拾音角度和移动角度的和,得到更新后的当前拾音角度。
具体的,如图4所示,该调节装置还包括确定模块410用于根据麦克风阵列接收到的唤醒语音确定当前拾音角度。
其中,第一位置为初始面部图像的中心位置。
进一步地,如图4所示,第一调整模块310包括第一调整单元311、第一控制单元312、识别单元313、判断单元314、计算单元315和第二调整单元316,该第一调整单元311用于根据当前拾音角度调整摄像头的拍摄角度;该第一控制单元312用于控制摄像头采集用户的第一面部图像;该识别单元313用于识别出用户面部在第一面部图像中的位置作为第二位置;改判断单元314用于判断第二位置与第一位置是否重合;该计算单元315用于在判断单元314的判断结果为是的情况下,根据第二位置和中心位置计算摄像头的第二调整角度;该第二调整单元316用于根据第二调整角度调整摄像头的拍摄角度。第一控制模块320用于在判断模块314的判断结果为是的情况下,控制摄像头采集用户的当前面部图像,并识别出用户面部在当前面部图像中的当前位置。
再进一步地,如图4所示,第一计算模块330还包括距离计算单元331、第一角度计算单元332和第二角度计算单元333,该距离计算单元331用于计算所述当前位置至所述第一位置在水平方向上的水平距离、及在垂直方向上的垂直距离;该第一角度计算单元332用于根据所述水平距离计算出所述用户的横向移动角度,根据所述垂直距离计算所述用户的纵向移动角度;该第二角度计算单元333用于根据所述横向移动角度和所述纵向移动角度计算得到所述移动角度。
在此基础上,更新模块340还用于计算所述当前拾音角度和所述移动角度的矢量和,得到更新后的当前拾音角度。
在本发明的一个具体实施例中,如图4所示,该调节装置还包括第二调整模块420用于根据移动角度调整摄像头的拍摄角度,以使用户面部位于摄像头获取的第二面部图像中的第一位置处。
本发明还提供了一种电子设备,在一方面,该电子设备包括前述的麦克风阵列拾音角度的调节装置。
图5为根据本发明另一方面的该电子设备的实施结构的方框原理图。
根据图5所示,该电子设备500包括存储器501和处理器502,该存储器501用于存储指令,该指令用于控制处理器502进行操作以执行上述麦克风阵列拾音角度的调节方法。
该处理器502例如可以是中央处理器CPU、微处理器MCU等。该存储器501例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。
除此之外,根据图5所示,该电子设备500还包括接口装置503、输入装置504、显示装置505、通信装置506、扬声器507、麦克风阵列508等等。尽管在图5中示出了多个装置,但是,本发明电子设备可以仅涉及其中的部分装置,例如,处理器501、存储器502和麦克风阵列508等。
上述通信装置506例如能够进行有有线或无线通信。
上述接口装置503例如包括耳机插孔、USB接口等。
上述输入装置504例如可以包括触摸屏、按键等。
上述显示装置505例如是液晶显示屏、触摸显示屏等。
本发明电子设备例如可以是具有麦克风阵列的手机、平板电脑、智能音箱等智能语音电子产品。
上述各实施例主要重点描述与其他实施例的不同之处,但本领域技术人员应当清楚的是,上述各实施例可以根据需要单独使用或者相互结合使用。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分相互参见即可,每个实施例重点说明的都是与其他实施例的不同之处,但本领域技术人员应当清楚的是,上述各实施例可以根据需要单独使用或者相互结合使用。另外,对于装置实施例而言,由于其是与方法实施例相对应,所以描述得比较简单,相关之处参见方法实施例的对应部分的说明即可。以上所描述的系统实施例仅仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的。
本发明可以是装置、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
Claims (10)
1.一种麦克风阵列拾音角度的调节方法,其特征在于,包括:
根据麦克风阵列的当前拾音角度调整摄像头拍摄角度,以使用户面部位于所述摄像头获取的初始面部图像中的第一位置处;
控制所述摄像头采集所述用户的当前面部图像,并识别出用户面部在所述当前面部图像中的当前位置;
根据所述第一位置和所述当前位置计算出用户的移动角度;
根据所述移动角度更新所述当前拾音角度。
2.根据权利要求1所述的调节方法,其特征在于,所述根据当前拾音角度调整摄像头拍摄角度之前还包括:
根据所述麦克风阵列接收到的唤醒语音确定所述当前拾音角度。
3.根据权利要求1所述的调节方法,其特征在于,所述第一位置为所述初始面部图像的中心位置。
4.根据权利要求1或3所述的调节方法,其特征在于,所述根据所述拾音角度调整摄像头拍摄角度,以使用户面部位于所述摄像头获取的初始图像的第一位置处包括:
根据所述当前拾音角度调整所述摄像头的拍摄角度;
控制所述摄像头采集所述用户的第一面部图像;
识别出所述第一面部图像中用户面部所在的位置作为第二位置;
判断所述第二位置与所述第一位置是否重合,如是,则:控制所述摄像头采集所述用户的当前面部图像,并识别出用户面部在所述当前面部图像中的当前位置;如否,则:
根据所述第二位置和所述中心位置计算所述摄像头的第二调整角度;
根据所述第二调整角度调整所述摄像头的拍摄角度。
5.根据权利要求1所述的调节方法,其特征在于,所述根据所述第一位置和所述当前位置计算出用户的移动角度包括:
计算所述当前位置至所述第一位置在水平方向上的水平距离、及在垂直方向上的垂直距离;
根据所述水平距离计算出所述用户的横向移动角度,根据所述垂直距离计算所述用户的纵向移动角度;
根据所述横向移动角度和所述纵向移动角度计算得到所述移动角度。
6.根据权利要求1所述的调节方法,其特征在于,所述根据所述移动角度更新所述当前拾音角度包括:
计算所述当前拾音角度和所述移动角度的矢量和,得到更新后的当前拾音角度。
7.根据权利要求1所述的调节方法,其特征在于,所述调节方法还包括:
根据所述移动角度调整所述摄像头的拍摄角度,以使所述用户面部位于所述摄像头获取的第二面部图像中的所述第一位置处。
8.根据权利要求7所述的调节方法,其特征在于,所述根据所述移动角度调整所述摄像头的拍摄角度包括:
根据所述移动角度调整所述摄像头的航向角。
9.一种麦克风阵列拾音角度的调节装置,其特征在于,包括:
第一调整模块,用于根据麦克风阵列的当前拾音角度调整摄像头拍摄角度,以使用户面部位于所述摄像头获取的初始面部图像中的第一位置处;
第一控制模块,用于控制所述摄像头采集所述用户的当前面部图像,并识别出用户面部在所述当前面部图像中的当前位置;
第一计算模块,用于根据所述第一位置和所述当前位置计算出用户的移动角度;
更新模块,用于根据所述移动角度更新所述当前拾音角度。
10.一种电子设备,其特征在于,包括处理器和存储器,所述存储器用于存储指令,所述指令用于控制所述处理器进行操作以执行根据权利要求1-8中任一项所述的调节方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710828074.8A CN107491101A (zh) | 2017-09-14 | 2017-09-14 | 一种麦克风阵列拾音角度的调节方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710828074.8A CN107491101A (zh) | 2017-09-14 | 2017-09-14 | 一种麦克风阵列拾音角度的调节方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107491101A true CN107491101A (zh) | 2017-12-19 |
Family
ID=60652421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710828074.8A Pending CN107491101A (zh) | 2017-09-14 | 2017-09-14 | 一种麦克风阵列拾音角度的调节方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107491101A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108172236A (zh) * | 2018-01-12 | 2018-06-15 | 歌尔科技有限公司 | 一种拾音降噪方法以及智能电子设备 |
CN108490980A (zh) * | 2018-04-12 | 2018-09-04 | 东莞职业技术学院 | 一种智能拾音系统 |
CN109961781A (zh) * | 2017-12-22 | 2019-07-02 | 深圳市优必选科技有限公司 | 基于机器人的语音信息接收方法、系统及终端设备 |
CN110085258A (zh) * | 2019-04-02 | 2019-08-02 | 深圳Tcl新技术有限公司 | 一种提高远场语音识别率的方法、系统及可读存储介质 |
CN110389597A (zh) * | 2018-04-17 | 2019-10-29 | 北京京东尚科信息技术有限公司 | 基于声源定位的摄像头调整方法、装置和系统 |
CN110401793A (zh) * | 2018-04-25 | 2019-11-01 | 北京京东尚科信息技术有限公司 | 用于控制智能终端的方法和装置 |
CN110767246A (zh) * | 2018-07-26 | 2020-02-07 | 深圳市优必选科技有限公司 | 一种噪声处理的方法、装置及机器人 |
CN111782045A (zh) * | 2020-06-30 | 2020-10-16 | 歌尔科技有限公司 | 一种设备角度调节方法、装置、智能音箱及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1901663A (zh) * | 2006-07-25 | 2007-01-24 | 华为技术有限公司 | 一种具有声音位置信息的视频通讯系统及其获取方法 |
JP2008271157A (ja) * | 2007-04-19 | 2008-11-06 | Fuji Xerox Co Ltd | 音声強調装置及び制御プログラム |
CN102045618A (zh) * | 2009-10-19 | 2011-05-04 | 联想(北京)有限公司 | 自动调整的麦克风阵列、方法和携带麦克风阵列的装置 |
CN104703090A (zh) * | 2013-12-05 | 2015-06-10 | 北京东方正龙数字技术有限公司 | 一种基于人脸识别的自动调节拾音设备及自动调节方法 |
CN105474667A (zh) * | 2014-05-09 | 2016-04-06 | 松下知识产权经营株式会社 | 指向性控制装置、指向性控制方法、存储介质及指向性控制系统 |
-
2017
- 2017-09-14 CN CN201710828074.8A patent/CN107491101A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1901663A (zh) * | 2006-07-25 | 2007-01-24 | 华为技术有限公司 | 一种具有声音位置信息的视频通讯系统及其获取方法 |
JP2008271157A (ja) * | 2007-04-19 | 2008-11-06 | Fuji Xerox Co Ltd | 音声強調装置及び制御プログラム |
CN102045618A (zh) * | 2009-10-19 | 2011-05-04 | 联想(北京)有限公司 | 自动调整的麦克风阵列、方法和携带麦克风阵列的装置 |
CN104703090A (zh) * | 2013-12-05 | 2015-06-10 | 北京东方正龙数字技术有限公司 | 一种基于人脸识别的自动调节拾音设备及自动调节方法 |
CN105474667A (zh) * | 2014-05-09 | 2016-04-06 | 松下知识产权经营株式会社 | 指向性控制装置、指向性控制方法、存储介质及指向性控制系统 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109961781A (zh) * | 2017-12-22 | 2019-07-02 | 深圳市优必选科技有限公司 | 基于机器人的语音信息接收方法、系统及终端设备 |
CN108172236A (zh) * | 2018-01-12 | 2018-06-15 | 歌尔科技有限公司 | 一种拾音降噪方法以及智能电子设备 |
CN108172236B (zh) * | 2018-01-12 | 2021-08-20 | 歌尔科技有限公司 | 一种拾音降噪方法以及智能电子设备 |
CN108490980B (zh) * | 2018-04-12 | 2020-12-25 | 东莞职业技术学院 | 一种智能拾音系统 |
CN108490980A (zh) * | 2018-04-12 | 2018-09-04 | 东莞职业技术学院 | 一种智能拾音系统 |
CN110389597B (zh) * | 2018-04-17 | 2024-05-17 | 北京京东尚科信息技术有限公司 | 基于声源定位的摄像头调整方法、装置和系统 |
CN110389597A (zh) * | 2018-04-17 | 2019-10-29 | 北京京东尚科信息技术有限公司 | 基于声源定位的摄像头调整方法、装置和系统 |
CN110401793A (zh) * | 2018-04-25 | 2019-11-01 | 北京京东尚科信息技术有限公司 | 用于控制智能终端的方法和装置 |
CN110767246A (zh) * | 2018-07-26 | 2020-02-07 | 深圳市优必选科技有限公司 | 一种噪声处理的方法、装置及机器人 |
WO2020199971A1 (zh) * | 2019-04-02 | 2020-10-08 | 深圳Tcl新技术有限公司 | 一种提高远场语音识别率的方法、系统及可读存储介质 |
CN110085258B (zh) * | 2019-04-02 | 2023-11-14 | 深圳Tcl新技术有限公司 | 一种提高远场语音识别率的方法、系统及可读存储介质 |
CN110085258A (zh) * | 2019-04-02 | 2019-08-02 | 深圳Tcl新技术有限公司 | 一种提高远场语音识别率的方法、系统及可读存储介质 |
CN111782045A (zh) * | 2020-06-30 | 2020-10-16 | 歌尔科技有限公司 | 一种设备角度调节方法、装置、智能音箱及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107491101A (zh) | 一种麦克风阵列拾音角度的调节方法、装置及电子设备 | |
CN106686365A (zh) | 用于头戴显示设备的镜头调节方法、装置及头戴显示设备 | |
US11126140B2 (en) | Electronic device, external device capable of being combined with the electronic device, and a display method thereof | |
US20180213339A1 (en) | Adapting hearing aids to different environments | |
JP2020038699A (ja) | 汎用学習済モデルの生成方法 | |
CN106573376A (zh) | 机器人的动作监控 | |
CN108174096A (zh) | 拍摄参数设置的方法、装置、终端及存储介质 | |
CN107832836A (zh) | 无模型深度增强学习探索方法及装置 | |
EP3788621B1 (en) | Adaptive diarization model and user interface | |
CN111105016A (zh) | 一种数据处理方法、装置、电子设备及可读存储介质 | |
CN110149476A (zh) | 一种延时摄影方法、装置、系统及终端设备 | |
CN106203275A (zh) | 用于指纹解锁的方法、装置及电子设备 | |
CN109858614A (zh) | 神经网络训练方法及装置、电子设备和存储介质 | |
CN108196258A (zh) | 外接设备的位置的确定方法及装置、虚拟现实设备及系统 | |
CN107376341A (zh) | 一种用于游戏手柄的数据处理方法、装置及游戏手柄 | |
CN110390934A (zh) | 一种信息提示的方法和语音交互终端 | |
CN107830604A (zh) | 一种室内温度控制方法、装置、系统及机器人 | |
CN110188865A (zh) | 信息处理方法及装置、电子设备和存储介质 | |
CN105764101A (zh) | 移动终端切换网络路由的方法和移动终端 | |
CN107798675A (zh) | 显示图像中拖影的检测方法及装置 | |
CN108304060A (zh) | 一种虚拟现实设备的供电方法、装置及虚拟现实设备 | |
CN111046742A (zh) | 一种眼部行为检测方法、装置以及存储介质 | |
CN106851622A (zh) | 一种空中升级方法、装置、中心设备及外围设备 | |
CN108241404A (zh) | 一种获取离线操作时间的方法、装置及电子设备 | |
CN108259738A (zh) | 摄像头控制方法、设备及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171219 |