CN211669969U - 一种语音识别设备 - Google Patents

一种语音识别设备 Download PDF

Info

Publication number
CN211669969U
CN211669969U CN201922202875.0U CN201922202875U CN211669969U CN 211669969 U CN211669969 U CN 211669969U CN 201922202875 U CN201922202875 U CN 201922202875U CN 211669969 U CN211669969 U CN 211669969U
Authority
CN
China
Prior art keywords
recognition device
speech recognition
target
microphone array
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201922202875.0U
Other languages
English (en)
Inventor
夏严辉
熊友军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ubtech Technology Co ltd
Original Assignee
Shenzhen Ubtech Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ubtech Technology Co ltd filed Critical Shenzhen Ubtech Technology Co ltd
Priority to CN201922202875.0U priority Critical patent/CN211669969U/zh
Application granted granted Critical
Publication of CN211669969U publication Critical patent/CN211669969U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请适用于语音处理技术领域,尤其涉及一种语音识别设备。所述语音识别设备包括运行语音算法的CPU芯片、麦克风阵列和多个目标部件,麦克风阵列包括至少一个麦克风;多个目标部件设置于语音识别设备的不同位置处,且各目标部件均与麦克风阵列相通;麦克风阵列与CPU芯片连接,以向CPU芯片发送从声源处直接接收的初始语音数据以及自声源处发出的语音信号经多个目标部件中的至少一个目标部件后到达至少一麦克风的目标语音数据。本申请通过在至少一个麦克风的语音识别设备中设置与麦克风阵列相通的目标部件,以通过目标部件来形成目标语音数据,从而实现至少一个麦克风的语音识别设备的声源定位功能,减少声源定位中所需的麦克风数量,降低定位成本。

Description

一种语音识别设备
技术领域
本申请涉及语音处理技术领域,尤其涉及一种语音识别设备。
背景技术
语音识别设备一般通过获取麦克风阵列采集的语音数据,并通过对所获取的语音数据进行分析处理来进行声源定位。但目前的语音识别设备只有在麦克风阵列具有四个或四个以上的麦克风时,才能实现声源定位功能,而无法通过单麦克风、双麦克风和三麦克风进行声源定位,使得声源定位的成本较高,另外某些语音识别设备的CPU处理器不支持多个麦克风,而无法通过传统的方法进行声源定位。
实用新型内容
本申请实施例提供了一种语音识别设备,可以解决现有语音识别设备无法通过单麦克风、双麦克风和三麦克风进行声源定位,声源定位需要较多的麦克风使得声源定位成本较高的问题,也可以解决某些语音识别设备的CPU处理器不支持多个麦克风,而无法通过传统的方法进行声源定位的问题。
本申请实施例,提供了一种语音识别设备,所述语音识别设备包括运行语音算法的CPU芯片、麦克风阵列和多个目标部件,所述麦克风阵列包括至少一个麦克风;
所述多个目标部件设置于所述语音识别设备的不同位置处,且各所述目标部件均与所述麦克风阵列相通;
所述麦克风阵列与所述CPU芯片连接,以向所述CPU芯片发送从声源处直接接收的初始语音数据以及自所述声源处发出的语音信号经所述多个目标部件中的至少一个目标部件后到达所述至少一麦克风的目标语音数据。
在一种可能的实现方式中,所述目标部件为设置于所述语音识别设备中的通孔。
可选地,所述通孔与所述麦克风阵列设置于所述语音识别设备的同一水平表面。
在一种可能的实现方式中,所述麦克风阵列设置于所述语音识别设备的第一水平表面,所述通孔设置于所述语音识别设备中垂直于所述第一水平表面的第二水平表面。
在另一种可能的实现方式中,所述麦克风阵列设置于所述语音识别设备的第一水平表面,所述通孔设置于所述语音识别设备的第二水平表面,所述第一水平表面和所述第二水平表面相对设置。
示例的,各所述通孔具有不同的形状。
在另一种可能的实现方式中,所述目标部件为所述语音识别设备上设置的凸起,且各所述凸起具有不同的形状。
可选地,所述凸起与所述麦克风阵列设置于所述语音识别设备的同一水平表面。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例通过在至少一个麦克风(包括单麦克风、双麦克风和三麦克风)的语音识别设备中设置与麦克风阵列相通的目标部件,以通过目标部件来形成目标语音数据,使得麦克风阵列可直接接收从声源处发出的初始语音数据和自声源处发出的语音信号经多个目标部件中的至少一个目标部件后到达至少一麦克风的目标语音数据,并可将所采集的初始语音数据和目标语音数据发送至运行语音算法的CPU芯片,从而使得CPU芯片可基于初始语音数据和目标语音数据进行声源定位,以实现单麦克风、双麦克风或三麦克风的语音识别设备的声源定位功能,减少声源定位中所需的麦克风数量,降低声源定位的定位成本,并实现不能支持多麦克风的语音识别设备的声源定位功能。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种语音识别设备的结构示意图;
图2为本申请实施例提供的一种语音识别设备在一个应用场景下的结构示意图;
图3为本申请实施例提供的一种语音识别设备在另一个应用场景下的结构示意图;
图4为本申请实施例提供的一种语音识别设备在另一个应用场景下的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。为了说明本申请所述的技术方案,下面通过具体实施例来进行详细说明。
如图1所示,本申请实施例提供了一种语音识别设备,所述语音识别设备包括运行语音算法的CPU芯片10、麦克风阵列11和多个目标部件12,所述麦克风阵列11包括至少一个麦克风;
所述多个目标部件12设置于所述语音识别设备的不同位置处,且各所述目标部件12均与所述麦克风阵列11相通;
所述麦克风阵列11与所述CPU芯片10连接,以向所述CPU芯片10发送从声源处直接接收的初始语音数据以及自所述声源处发出的语音信号经所述多个目标部件12中的至少一个目标部件后到达所述至少一麦克风的目标语音数据。
本申请实施例中,所述目标部件12的数量可根据所述语音识别设备的具体结构确定,其中,所述目标部件的数量可大于或者等于所述麦克风阵列11中所具有的麦克风的数量,以使得所述麦克风阵列11中的各麦克风可采集到多个目标语音数据发送至运行语音算法的CPU芯片10,从而使得所述CPU芯片10 可根据各麦克风采集的多个语音数据来实现声源的准确定位。在此,各所述目标部件12可以设置于所述语音识别设备的不同位置处,具体地,可以设置于所述麦克风阵列11的周边,例如所述目标部件12可以环绕所述麦克风阵列11均匀设置。
需要说明的是,各所述目标部件12的一端可以与所述语音识别设备的外部相通,各所述目标部件12的另一端则可以与所述麦克风阵列11相通,以使得声源处产生的声波在经过所述目标部件12的反射等操作所形成的声波可再传输至所述麦克风阵列11,从而使得所述麦克风阵列11可采集到所述目标语音数据。即所述目标部件12与所述麦克风阵列11相通是指声源处产生的声波经所述目标部件12的反射等操作后可再传输至所述麦克风阵列11,在此,所述目标部件12与所述麦克风阵列11相通可以是所述目标部件12与所述麦克风阵列11相连接在一起,当然所述目标部件12与所述麦克风阵列11也可以是相隔开设置的。应理解,所述目标部件12与所述麦克风阵列11之间也可以具有其他的位置关系,本申请实施例对此不作限定,只要所述目标部件12与所述麦克风阵列11之间的位置关系可使得所述目标部件12能影响所述麦克风阵列11采集的目标语音数据的波形,以使得所述CPU芯片10可根据各目标语音数据的波形确定各目标语音数据对应的目标部件即可。
在一具体应用中,所述目标部件12可以为所述语音识别设备中所设置的通孔。应理解,声源处产生的声波一方面可以直接传输至所述麦克风阵列11,使得所述麦克风阵列11采集到直接来自声源处的所述初始语音数据,另一方面声源处产生的声波还可以传输至所述通孔,并可以在通孔内经连续反射和混合后形成混响声波,所形成的混响声波则可以进一步传输至所述麦克风阵列11,使得所述麦克风阵列11采集到经通孔形成的所述目标语音数据。在此,由靠近声源处的通孔所形成的目标语音数据所对应的混响效果等信号特征较强,容易被所述麦克风阵列11采集到,而由远离声源处的通孔所形成的目标语音数据所对应的混响效果等信号特征则较弱,不易被所述麦克风阵列11采集到,以使得所述CPU芯片10可以根据所接收到的目标语音数据对应的混响效果等信号特征的强弱来进行声源定位。
在一种可能的实现方式中,如图2所示,所述通孔(图2中所示的×)与所述麦克风阵列11(图2中所示的MIC)可以设置于所述语音识别设备的同一水平表面,例如,所述通孔和所述麦克风阵列11可以均设置于所述语音识别设备的上表面。
在另一种可能的实现方式中,如图3所示,所述麦克风阵列11(图3中所示的MIC)可以设置于所述语音识别设备的第一水平表面,所述通孔(图3中所示的×)则可以设置于所述语音识别设备中垂直于所述第一水平表面的第二水平表面,例如所述麦克风阵列11可以设置于所述语音识别设备的上表面,所述通孔则可以设置于所述语音识别设备中与所述上表面垂直的侧表面。
在另一种可能的实现方式中,所述麦克风阵列11可以设置于所述语音识别设备的第一水平表面,所述通孔则可以设置于所述语音识别设备的第二水平表面,其中,在所述语音识别设备中,所述第一水平表面和所述第二水平表面可以相对设置,例如,所述麦克风阵列11可以设置于所述语音识别设备的上表面,所述通孔则可以设置于所述语音识别设备中与上表面相对的下表面。
应理解,所述语音识别设备的不同位置处设置的通孔具有不同的形状,以使得声源处产生的声波经过各通孔的反射与混合后所形成的混响声波互不相同,即使得各所述目标语音数据对应的波形互不相同,以方便所述CPU芯片 10区分出各目标语音数据所对应的通孔,从而使得所述CPU芯片10可以根据各目标语音数据对应的混响效果等信号特征的强弱来进行声源定位。例如,可以在所述语音识别设备中为各通孔设置不同的弯曲程度,或者可以在各通孔中增加不同类型的阻塞物,或者还可以在各通孔中增加不同类型的发声物,以使得声波经过各通孔的反射与混合后能形成不同的混响声波。
在另一具体应用中,所述目标部件12可以为所述语音识别设备中设置的凸起,且设置于不同位置处的凸起具有不同的形状,例如,所述凸起可以为所述语音识别设备中设置的按钮、提手、动物形机器人的耳朵或者其他专门用于进行声源定位的突出部分。
应理解,声源处产生的声波一方面可以直接传输至所述麦克风阵列11,使得所述麦克风阵列11采集到直接来自声源处的所述初始语音数据,另一方面声源处产生的声波还可以传输至各凸起,各凸起则可以对声波进行反射以形成回声声波,所形成的回声声波则可进一步传输至所述麦克风阵列11,其中,靠近声源处的凸起将阻塞声波的传输,所形成的回声声波是向远离所述麦克风阵列 11的方向传输,即由靠近声源处的凸起所形成的回声声波可能不会被所述麦克风阵列11采集到,而远离声源处的凸起对声波进行反射所形成回声声波往往是向所述麦克风阵列11的方向传输,将会被所述麦克风阵列11所采集并传输至所述CPU芯片10,所述CPU芯片10则可根据回声声波对应的目标语音数据和所述初始语音数据之间的时间间隔和/或声压值大小等来进行声源定位。
需要说明的,所述凸起可设置于所述语音识别设备的不同位置处,例如所述凸起可环绕所述麦克风阵列11均匀设置。如图4所示,所述凸起与所述麦克风阵列11可设置于所述语音识别设备的同一水平表面,以通过所述凸起的阻挡和/或反射来形成能被所述麦克风阵列11采集的回声声波,从而使得所述CPU 芯片10能获取到所述目标语音数据,并可根据所述初始语音数据和所述目标语音数据之间的时间间隔和/或声压值大小来进行声源定位。
本申请实施例通过在至少一个麦克风(包括单麦克风、双麦克风和三麦克风)的语音识别设备中设置与麦克风阵列相通的目标部件,以通过目标部件来形成目标语音数据,使得麦克风阵列可直接接收从声源处发出的初始语音数据和自声源处发出的语音信号经多个目标部件中的至少一个目标部件后到达至少一麦克风的目标语音数据,并可将所采集的初始语音数据和目标语音数据发送至运行语音算法的CPU芯片,从而使得CPU芯片可基于初始语音数据和目标语音数据进行声源定位,以实现单麦克风、双麦克风或三麦克风的语音识别设备的声源定位功能,减少声源定位中所需的麦克风数量,降低声源定位的定位成本,并实现不能支持多麦克风的语音识别设备的声源定位功能。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (8)

1.一种语音识别设备,其特征在于,所述语音识别设备包括运行语音算法的CPU芯片、麦克风阵列和多个目标部件,所述麦克风阵列包括至少一个麦克风;
所述多个目标部件设置于所述语音识别设备的不同位置处,且各所述目标部件均与所述麦克风阵列相通;
所述麦克风阵列与所述CPU芯片连接,以向所述CPU芯片发送从声源处直接接收的初始语音数据以及自所述声源处发出的语音信号经所述多个目标部件中的至少一个目标部件后到达所述至少一麦克风的目标语音数据。
2.如权利要求1所述的语音识别设备,其特征在于,所述目标部件为设置于所述语音识别设备中的通孔。
3.如权利要求2所述的语音识别设备,其特征在于,所述通孔与所述麦克风阵列设置于所述语音识别设备的同一水平表面。
4.如权利要求2所述的语音识别设备,其特征在于,所述麦克风阵列设置于所述语音识别设备的第一水平表面,所述通孔设置于所述语音识别设备中垂直于所述第一水平表面的第二水平表面。
5.如权利要求2所述的语音识别设备,其特征在于,所述麦克风阵列设置于所述语音识别设备的第一水平表面,所述通孔设置于所述语音识别设备的第二水平表面,所述第一水平表面和所述第二水平表面相对设置。
6.如权利要求2至5中任一项所述的语音识别设备,其特征在于,各所述通孔具有不同的形状。
7.如权利要求1所述的语音识别设备,其特征在于,所述目标部件为所述语音识别设备上设置的凸起,且各所述凸起具有不同的形状。
8.如权利要求7所述的语音识别设备,其特征在于,所述凸起与所述麦克风阵列设置于所述语音识别设备的同一水平表面。
CN201922202875.0U 2019-12-10 2019-12-10 一种语音识别设备 Active CN211669969U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201922202875.0U CN211669969U (zh) 2019-12-10 2019-12-10 一种语音识别设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201922202875.0U CN211669969U (zh) 2019-12-10 2019-12-10 一种语音识别设备

Publications (1)

Publication Number Publication Date
CN211669969U true CN211669969U (zh) 2020-10-13

Family

ID=72733270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201922202875.0U Active CN211669969U (zh) 2019-12-10 2019-12-10 一种语音识别设备

Country Status (1)

Country Link
CN (1) CN211669969U (zh)

Similar Documents

Publication Publication Date Title
CN107976651B (zh) 一种基于麦克风阵列的声源定位方法及装置
US6826284B1 (en) Method and apparatus for passive acoustic source localization for video camera steering applications
WO2020151133A1 (zh) 一种分布式麦克风阵列拾音系统及方法
CN111060874B (zh) 一种声源定位方法、装置、存储介质及终端设备
US8116478B2 (en) Apparatus and method for beamforming in consideration of actual noise environment character
EP4079000A1 (en) Audio device auto-location
EP3734992B1 (en) Method for acquiring spatial division information, apparatus for acquiring spatial division information, and storage medium
Ayllón et al. Indoor blind localization of smartphones by means of sensor data fusion
CN107329114A (zh) 声源定位方法和装置
Hu et al. Sound source localization using relative harmonic coefficients in modal domain
US10871543B2 (en) Direction of arrival estimation of acoustic-signals from acoustic source using sub-array selection
CN103458220A (zh) 一种图像处理方法以及电子设备
CN106992010A (zh) 无直达声条件下的麦克风阵列语音增强装置
CN208001363U (zh) 一种麦克风装置
US10070244B1 (en) Automatic loudspeaker configuration
CN211669969U (zh) 一种语音识别设备
Parisi et al. Source localization in reverberant environments by consistent peak selection
EP3182734B1 (en) Method for using a mobile device equipped with at least two microphones for determining the direction of loudspeakers in a setup of a surround sound system
JP2007027939A (ja) 音響信号処理装置
Ding et al. DOA estimation of multiple speech sources by selecting reliable local sound intensity estimates
Aprea et al. Acoustic reconstruction of the geometry of an environment through acquisition of a controlled emission
CN111157949A (zh) 一种语音识别及声源定位方法
KR20090017208A (ko) 음원 위치 추적 방법 및 장치
CN109309888A (zh) 语音信息处理方法、播放设备及计算机可读存储介质
Kwon et al. Sound source localization for robot auditory system using the summed GCC method

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant