CN104661150A

CN104661150A - 用于识别语音的装置和方法

Info

Publication number: CN104661150A
Application number: CN201410160179.7A
Authority: CN
Inventors: 吴昔珉
Original assignee: Hyundai Motor Co
Current assignee: Hyundai Motor Co
Priority date: 2013-11-25
Filing date: 2014-04-21
Publication date: 2015-05-27
Anticipated expiration: 2034-04-21
Also published as: US20150149164A1; CN104661150B; US9530406B2; KR101491354B1

Abstract

本发明涉及一种用于识别语音的装置和方法。其中，用于识别语音的装置包括：多个被配置成具有至少一个麦克风的阵列式麦克风；座椅控制器，被配置成检查置于车辆中的座椅的位置；以及麦克风控制器，被配置成基于检查到的座椅的位置设定波束形成区，并控制阵列式麦克风，以便从所设定的波束形成区获得声源数据。用于识别语音的方法，包括：在从外部收到用于进入语音识别模式的信号时，启动多个阵列式麦克风；检查置于车辆中的座椅的位置；基于所检查到的座椅的位置，设定波束形成区；从波束形成区获得声源数据；以及从所获得的声源数据中提取语音数据。

Description

用于识别语音的装置和方法

技术领域

本发明涉及一种用于识别语音的装置和方法，更特别涉及一种用于车辆的免提装置等的语音识别装置，以及通过根据驾驶者的位置来改变阵列式麦克风的波束形成区，从而能够提高语音识别率的语音识别装置和方法。

背景技术

用于识别驾驶者语音的普通装置，例如车辆的免提装置等，被实施为通过利用具有朝向驾驶者座椅方向的方向性的单麦克风，或者通过朝着驾驶者的座椅方向、用于波束形成的阵列式麦克风，使得包含在驾驶者语音中的噪声的影响最小。

然而，由于驾驶者的语音通常是在未考虑驾驶者的坐高，驾驶者的位置等的状态下获得的，因此可能不足以提供高质量的呼叫环境。

发明内容

为了解决现有技术中出现的上述问题，同时保持现有技术具有的优点，而提出本发明。

本发明的一个方面提供一种语音识别装置和方法，通过检查驾驶者的座椅位置，并把阵列式麦克风的波束形成区设定成检查到的位置，从而能够更精确地获得驾驶者的语音数据。

根据本发明的示例性实施例，用于识别语音的装置包括：多个被配置成具有至少一个麦克风的阵列式麦克风；座椅控制器，被配置成检查置于车辆中的座椅的位置；以及麦克风控制器，被配置成基于检查到的座椅的位置设定波束形成区，并控制阵列式麦克风，以便从所设定的波束形成区获得声源数据。

麦克风控制器将座椅的总移动距离识别成阵列式麦克风的总波束形成角度。

麦克风控制器将座椅的总移动距离等分成多个区间，并根据所分割的区间，将阵列式麦克风的总波束形成角度等分成多个区间，从而形成第一波束形成区间。

麦克风控制器可以将第一波束形成区间中与座椅位置相对应的区间设定成第一波束形成区。

麦克风控制器可以将第一波束形成区分成多个区间，从而产生多个第二波束形成区间。

麦克风控制器可以控制第一阵列式麦克风和第二阵列式麦克风，以便从多个第二波束形成区间获得不同区间的声源数据。

麦克风控制器可以将从第一阵列式麦克风和第二阵列式麦克风获得的声源数据的信号中获得的具有最大强度的信号的区间，设定成第二波束形成区。

该装置还可以包括语音识别器，该语音识别器从自第二波束形成区获得的声源数据中提取语音数据。

根据本发明另一个实施例，用于识别语音的方法包括：在从外部收到用于进入语音识别模式的信号时，启动多个阵列式麦克风；检查置于车辆中的座椅的位置；基于所检查到的座椅的位置，设定波束形成区；从波束形成区获得声源数据；以及从所获得的声源数据中提取语音数据。

检查座椅位置的步骤可以包括：将座椅的总移动距离等分成多个区间，并检查座椅是否位于经划分的区间的任意位置上。

设定波束形成区的步骤可以包括：通过将阵列式麦克风的总波束形成角度划分成等于通过划分总移动距离而获得的区间，形成第一波束形成区间；和将第一波束形成区间中与座椅位置相对应的区间设定成第一波束形成区。

该方法还可以包括在将与座椅位置相对应的区间设定成第一波束形成区的步骤之后，选择第二波束形成区。

选择所述第二波束形成区的步骤可以包括：将第一波束形成区划分成多个区间；通过第一阵列式麦克风和第二阵列式麦克风，从多个第二波束形成区间获得不同区间的声源数据；将从第一阵列式麦克风和第二阵列式麦克风获得的声源数据信号的强度进行比较；以及根据比较结果，选择从中获得具有最大强度信号的区间，作为第二波束形成区。

附图说明

通过以下的详细说明，并结合附图，本发明的上述和其它目的、特征和优点将会更加显而易见，其中：

图1是表示根据本发明的示例性实施例的语音识别装置的主要结构的方框图；

图2是用来说明根据本发明的示例性实施例的语音识别方法的流程图；

图3-5示出根据本发明的示例性实施例的设定用于识别语音的阵列式麦克风的波束形成区的方法。

具体实施方式

下面结合附图，更详细地说明本发明的示例性实施例。然而，在说明本发明的示例性实施例时，如果可能的话，为本领域的技术人员众所周知，并且不直接与本发明相关的技术内容将被省略。这是为了通过省略不必要的说明，更清楚地讲述本发明的要点，以便不会模糊本发明。

图1是示出根据本发明示例性实施例的语音识别装置的主要结构的方框图。

参见图1，语音识别装置100可以包括通信器110、座椅开关120、座椅控制器130、座椅驱动器140、麦克风控制器150、阵列式麦克风160和语音识别器170。

通信器110执行控制器局域网（CAN）通信，用于实现座椅控制器130与麦克风控制器150之间的通信。

座椅开关120生成用于改变置于车辆中的座椅的位置的信号，并把该信号提供给座椅控制器130。

座椅控制器130根据从座椅开关120提供的信号，控制座椅驱动器140以改变座椅位置。座椅控制器130检查车辆的当前座椅位置信息，并将其提供给麦克风控制器150。座椅控制器130将座椅的总移动距离等分成多个区间，并将多个区间中的、其中安置有座椅的区间的信息提供给麦克风控制器150。

座椅驱动器140基于座椅控制器130的控制，改变座椅的位置。

麦克风控制器150从外部接收用于进入语音识别模式的信号，从而启动阵列式麦克风160。在这种情况下，可以通过独立的输入装置（未示出）接收从外部接收的信号，语音识别模式可以是实现诸如免提服务，利用语音识别的音频、视频和导航（AVN）控制服务，利用语音识别的目的地设定服务之类功能的模式。

当收到用于进入语音识别模式的信号时，麦克风控制器150通过通信器110，向座椅控制器130请求置于车辆中的座椅的位置信息。麦克风控制器150利用从座椅控制器130接收的信息，检查座椅的位置。麦克风控制器150基于检查的当前座椅位置，设定第一波束形成区。更具体地，麦克风控制器150将座椅的总移动距离确定为阵列式麦克风160的总波束形成区间。麦克风控制器150将总波束形成区间划分成与从座椅的总移动距离划分的相等的区间。另外，麦克风控制器150将与从座椅控制器130收到的、座椅置于其中的区间相对应的波束形成区间，设定成第一波束形成区。

麦克风控制器150将第一波束形成区划分成具有相同角度的多个第二波束形成区间。麦克风控制器150将第二波束形成区间中能够更精确地获得声源信号的区间，确定成第二波束形成区。更具体地，麦克风控制器150控制第一阵列式麦克风161，以便获得多个第二波束形成区间中的第一区间的声源信号，并控制第二阵列式麦克风162，以获得多个第二波束形成区间中的第二区间的声源信号。麦克风控制器150将第一区间的声源信号（第一信号）与第二区间的声源信号（第二信号）彼此进行比较，并将第一阵列式麦克风161固定到具有较大信号强度的区间。在此情况下，当第一信号的电平大于第二信号的电平时，麦克风控制器150将第一阵列式麦克风161布置在第一区间中，并将第二阵列式麦克风162移动到第三区间。如果第一信号的电平小于第二信号的电平，则麦克风控制器150将第一阵列式麦克风161移动到第二区间，并将第二阵列式麦克风162移动到第三区间。因而，麦克风控制器150在整个第二波束形成区间内，对分别从第一阵列式麦克风161和第二阵列式麦克风162获得的声源信号强度进行比较。麦克风控制器150将多个第二波束形成区间中的、其中检查到声源信号的最大强度的区间确定成第二波束形成区，并将第一阵列式麦克风161布置在该第二波束形成区中，从而获得声源信号。

另外，麦克风控制器150将获得的声源信号提供给语音识别器170。因而，本发明通过基于驾驶者的位置，对能够获得阵列式麦克风160的声源信号的位置进行改变，可以确保更精确的语音识别性能。

阵列式麦克风160可包括第一阵列式麦克风161和第二阵列式麦克风162。第一阵列式麦克风161可以是收集声源数据的主麦克风，第二阵列式麦克风162可以是用于分析声源信号以确定从第一阵列式麦克风161收集声源数据的最佳区间的副麦克风。

语音识别器170分析从麦克风控制器150提供的声源信号，从而提取语音数据。从语音识别器170提取的语音数据被用于免提服务，利用语音识别的音频、视频和导航（AVN）控制服务，利用语音识别的目的地设定服务，等等。

图2是用于说明根据本发明示例性实施例的语音识别方法的流程图。图3-5是用于说明根据本发明示例性实施例的用于识别语音的阵列式麦克风的波束形成区的设定方法的图示。

参见图1-5，当从外部接收到用于进入语音识别模式的信号时（S11），麦克风控制器150前进到S13。在此情况下，可通过独立的输入装置（未示出）接收来自外部的信号，并且语音识别模式可以是实现诸如免提服务，利用语音识别的音频、视频和导航（AVN）控制服务，以及利用语音识别的目的地设定服务等功能的模式。

麦克风控制器150启动第一阵列式麦克风161和第二阵列式麦克风162（S13）。阵列式麦克风160可以是由两个麦克风构成的一个阵列式麦克风160。

麦克风控制器150通过通信器110，向座椅控制器130请求与置于车辆中的座椅的位置有关的信息（S15）。麦克风控制器150利用从座椅控制器130接收到的信息，检查座椅位置（S17）。参见图3，置于车辆中的座椅S从点A移动到点B。座椅控制器130将从点A到点B的移动距离等分成区间。座椅控制器130可以将座椅S从点A到点B的移动距离定义成n电压，并且可依据从座椅开关120输入的电压电平，检查座椅S的变化后的当前位置。在此情况下，如图3所示，电压电平可被大致分成5个区间，从点A到点B，每个区间的电压值依次为0、n/5、2n/5、3n/5、4n/5和n。座椅控制器130提供被映射成电压值的N值，座椅S通过通信器110以该值被布置成麦克风控制器150。

麦克风控制器150设定第一波束形成区（S19）。更具体地，参考图3和4来说明，麦克风控制器150将座椅S从A点到B点的移动距离确定为阵列式麦克风160的总波束形成区间。麦克风控制器150将总波束形成区间等分成5个区间，如图3所示。另外，麦克风控制器150将与从座椅控制器130接收到的座椅S的位置、被映射成电压值的N值相对应的波束形成区间，设定成第一波束形成区。例如，当麦克风控制器150从座椅控制器130接收到的与座椅S的位置的N值相对应的数值3时，其将总波束形成区间中与数值3相对应的区间，设定为第一波束形成区。

麦克风控制器150然后将第一波束形成区分成具有相同角度的M个第二波束形成区间（S21）。从而，本发明可精确地检查座椅S的位置，从而改善驾驶者语音识别的性能。第二波束形成区间的划分可以如图5所示。与N=3相对应的区域，即第一波束形成区，可被分成总共10个第二波束形成区间。在这种情况下，由于更精细地进行第二波束形成区间的划分，因此可以更精确地获得驾驶者的语音数据。

前进到S23，麦克风控制器150从第一阵列式麦克风161和第二阵列式麦克风162，获得M个经划分的第二波束形成区间中的每个区间的声源信号。参见图5，麦克风控制器150控制阵列式麦克风160，以便获得在10个经划分的第二波束形成区间中、对应于附图标记a的第二波束形成区间和对应于附图标记b的第二波束形成区间中的声源信号。

麦克风控制器150将从与附图标记a相对应的区间获得的第一信号的电平，和从与附图标记b相对应的区间获得的第二信号的电平彼此进行比较（S25）。作为比较的结果，当第一信号的电平大于第二信号的电平时，麦克风控制器150前进到S27；当第二信号的电平大于第一信号的电平时，麦克风控制器150前进到S37。

作为步骤S25的结果，当第一信号的电平大于第二信号的电平时，麦克风控制器150前进到S27，从而将第一阵列式麦克风161固定到与附图标记a相对应的区间，并且从对应于附图标记a的区间获得第一信号。麦克风控制器150控制阵列式麦克风160，以使第二阵列式麦克风162从与附图标记c相对应的第二波束形成区间获得第二信号（S29）。

前进到S31，当第二阵列式麦克风162在其中获得声源信号的第二波束形成区间不是附图标记j时，麦克风控制器150返回到步骤S23，重复上述操作。相反地，当第二阵列式麦克风162在其中获得声源信号的第二波束形成区间是附图标记j时，麦克风控制器150前进到S33。

当第二阵列式麦克风162直到与附图标记j相对应的第二波束形成区间才获得第二信号时，麦克风控制器150将固定第一阵列式麦克风161的第二波束形成区间，识别成具有最大强度声源信号的区间，并将其确定成第二波束形成区（S33）。通过将从被确定成第二波束形成区的区间获得的声源信号提供给语音识别器170，麦克风控制器150控制语音识别器170以获得语音数据（S35）。

作为S25的检查结果，当第一信号的电平小于第二信号的电平时，麦克风控制器150前进到S37，从而控制第一阵列式麦克风161，使得从与附图标记b相对应的第二波束形成区间，获得第一信号。此外，麦克风控制器150前进到S29，从而控制第二阵列式麦克风162，以便从与附图标记b相对应的第二波束形成区间获得第二信号的第二阵列式麦克风162，从与附图标记c相对应的第二波束形成区间获得第二信号。

参考图5进行说明，从第一阵列式麦克风获得区间a的信号，且从第二阵列式麦克风获得区间b的信号。通过对区间a和b的信号进行比较，当区间a的信号的电平大于区间b的信号的电平时，第一阵列式麦克风连续获得区间a的信号，第二阵列式麦克风获得区间c的信号。

当区间c的信号强度大于区间a的信号强度时，第一阵列式麦克风从区间a移动到区域c，从而获得区间c的信号，第二阵列式麦克风获得区间d的信号。当区间c的信号强度大于区间d的信号强度时，第一阵列式麦克风连续获得区间c的信号，第二阵列式麦克风获得区间e的信号。

因而，第二阵列式麦克风一边顺序地将区间从区间b改变到区间j，一边获得信号，直到获得区间j的信号为止。第一阵列式麦克风将从第一阵列式麦克风获得的信号强度，与从第二阵列式麦克风获得的信号强度彼此进行比较，从而将波束形成区改变并固定到具有较大信号强度的区间。

根据本发明的示例性实施例，通过检查驾驶者的座椅位置，并将阵列式麦克风的波束形成区设定成检查到的位置以获得驾驶者的语音数据，可以更精确地获得驾驶者的语音数据。

上面参考本发明的示例性实施例，对根据本发明示例性实施例的语音识别装置和方法进行说明。在本说明书和附图中公开了本发明的示例性实施例，并且使用了特定的术语，但是这些术语只是在普通意义上地使用，以便易于说明本发明的技术内容，帮助理解本发明，并不限制本发明的范围。对本领域的技术人员来说，显然除了在此公开的示例性实施例之外，根据本发明的技术理念，还可进行各种变形。

Claims

1.一种用于识别语音的装置，所述装置包括：

多个被配置成具有至少一个麦克风的阵列式麦克风；

座椅控制器，被配置成检查置于车辆中的座椅的位置；以及

麦克风控制器，被配置成基于检查到的所述座椅的位置设定波束形成区，并控制所述阵列式麦克风，以便从所设定的波束形成区获得声源数据。

2.如权利要求1所述的装置，其中所述麦克风控制器将所述座椅的总移动距离识别成所述阵列式麦克风的总波束形成角度。

3.如权利要求2所述的装置，其中所述麦克风控制器将所述座椅的总移动距离等分成多个区间，并根据所分割的区间，将所述阵列式麦克风的总波束形成角度等分成多个区间，从而形成第一波束形成区间。

4.如权利要求3所述的装置，其中所述麦克风控制器将所述第一波束形成区间中与所述座椅位置相对应的区间设定成第一波束形成区。

5.如权利要求4所述的装置，其中所述麦克风控制器将所述第一波束形成区分成多个区间，从而产生多个第二波束形成区间。

6.如权利要求5所述的装置，其中所述麦克风控制器控制第一阵列式麦克风和第二阵列式麦克风，以便从所述多个第二波束形成区间获得不同区间的声源数据。

7.如权利要求6所述的装置，其中所述麦克风控制器将从所述第一阵列式麦克风和所述第二阵列式麦克风获得的声源数据的信号中获得的具有最大强度的信号的区间，设定成第二波束形成区。

8.如权利要求7所述的装置，还包括语音识别器，所述语音识别器从自所述第二波束形成区获得的声源数据中提取语音数据。

9.一种用于识别语音的方法，所述方法包括：

在从外部收到用于进入语音识别模式的信号时，启动多个阵列式麦克风；

检查置于车辆中的座椅的位置；

基于所检查到的所述座椅的位置，设定波束形成区；

从所述波束形成区获得声源数据；以及

从所获得的声源数据中提取语音数据。

10.如权利要求9所述的方法，其中检查所述座椅位置的步骤包括：将所述座椅的总移动距离等分成多个区间，并检查所述座椅是否位于经划分的区间的任意位置上。

11.如权利要求10所述的方法，其中设定波束形成区的步骤包括：

通过将所述阵列式麦克风的总波束形成角度划分成等于通过划分总移动距离而获得的区间，形成第一波束形成区间；和

将所述第一波束形成区间中与所述座椅位置相对应的区间设定成第一波束形成区。

12.如权利要求11所述的方法，还包括在将与所述座椅位置相对应的区间设定成第一波束形成区的步骤之后，选择第二波束形成区。

13.如权利要求12所述的方法，其中选择所述第二波束形成区的步骤包括：

将所述第一波束形成区划分成多个区间；

通过第一阵列式麦克风和第二阵列式麦克风，从多个第二波束形成区间获得不同区间的声源数据；

将从所述第一阵列式麦克风和第二阵列式麦克风获得的声源数据信号的强度进行比较；以及

根据比较结果，选择从中获得具有最大强度信号的区间，作为第二波束形成区。

14.如权利要求1所述的装置，还包括：

座椅开关，生成用于改变座椅位置的信号，并将所述信号提供给所述座椅控制器；以及

座椅驱动器，被配置成基于所述座椅控制器的控制来改变所述座椅位置。