JP2010056763A - 音声認識装置 - Google Patents
音声認識装置 Download PDFInfo
- Publication number
- JP2010056763A JP2010056763A JP2008218399A JP2008218399A JP2010056763A JP 2010056763 A JP2010056763 A JP 2010056763A JP 2008218399 A JP2008218399 A JP 2008218399A JP 2008218399 A JP2008218399 A JP 2008218399A JP 2010056763 A JP2010056763 A JP 2010056763A
- Authority
- JP
- Japan
- Prior art keywords
- cardioid
- speech recognition
- signal
- noise
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 abstract description 78
- 238000011156 evaluation Methods 0.000 abstract description 16
- 238000000034 method Methods 0.000 abstract description 14
- 230000003111 delayed effect Effects 0.000 description 11
- 230000005855 radiation Effects 0.000 description 9
- 238000004088 simulation Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000011410 subtraction method Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000005534 acoustic noise Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000007769 metal material Substances 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
【解決手段】マイクロホンアレー10は例えば正三角錐の各頂点に配置された4個のマイクロホン1〜4を備えて構成される。減算形アレー回路30は、各マイクロホン1〜4からの音声信号に基づいて減算形アレー法を用いて各マイクロホンから各マイクロホンに対する方向にゼロ点を生成するカージオイドを生成してそれらに対応する複数のカージオイド信号を発生する。信号評価及び選択回路50は複数のカージオイド信号のうちより高い信号対雑音電力比を有する複数のカージオイド信号を検出して選択し、選択した複数のカージオイド信号を加算し、加算結果のカージオイド信号を出力する。音声認識回路52はカージオイド信号に基づいて音声認識を行って音声認識結果を出力する。
【選択図】図4
Description
角錐の各頂点のうち上部頂点において、放射主軸が話者の口元に実質的に向くように設けられた第1のマイクロホンと、上記角錐の底面の少なくとも2つの頂点において、放射主軸が話者の口元方向に実質的に平行となるように設けられた複数の第2のマイクロホンとを備えたマイクロホンアレーと、
上記各マイクロホンからの音声信号に基づいて減算形アレー法を用いて上記各マイクロホンから上記各第2のマイクロホンに対する方向にゼロ点を生成するカージオイドを生成してそれらに対応する複数のカージオイド信号を発生する減算形アレー手段と、
上記複数のカージオイド信号のうちより高い信号対雑音電力比を有する複数のカージオイド信号を検出して選択し、選択した複数のカージオイド信号を加算し、加算結果のカージオイド信号を出力する評価選択手段と、
上記評価選択手段から出力されるカージオイド信号に基づいて音声認識を行って音声認識結果を出力する音声認識手段とを備えたことを特徴とする。
(B)マイクロホン2のXYZ座標=(0,√(6)d/3,√(3)d/3);正三角錐の底面の一頂点の位置であって、XY平面の0度及びXZ平面の55度の方位に位置する。
(C)マイクロホン3のXYZ座標=(d/2,√(6)d/3,−√(3)d/6);正三角錐の底面の一頂点の位置であって、XY平面の30度及びXZ平面の110度の方位に位置する。
(D)マイクロホン4のXYZ座標=(−d/2,√(6)d/3,−√(3)d/6);正三角錐の底面の一頂点の位置であって、XY平面の300度及びXZ平面の110度の方位に位置する。
(1)所定のしきい値以上の信号レベルを有すること。
(2)所定のパワーレベル以上離れたカージオイド信号が存在しないこと。これは、口元方向に対応する3つのカージオイド信号と、顔平面方向に対応するカージオイド信号について、口元方向からの音声に対しては、前者3つのカージオイド音声信号はもちろん、後者6つのカージオイド音声信号も少しパワーが上がるのに対して、口元以外の方向からの音声信号は、1つ以上のカージオイドの死角に入る可能性が高く、9つの中で相対的にパワー差が開く傾向にあることを利用しようというものである。
(3)音声区間として検出されたフレームの前後500ミリ秒を音声区間として扱う。
X2(f)=max{x(f)−αN(f),βN(f)} (1)
―――――――――――――――――
SNR(C1)=25.8dB
SNR(C2)=24.4dB
SNR(C3)=24.1dB
SNR(C4)=15.0dB
SNR(C5)=14.8dB
SNR(C6)=13.6dB
SNR(C7)=13.8dB
SNR(C8)=14.9dB
SNR(C9)=14.9dB
―――――――――――――――――
―――――――――――――――――
SNRADD(T2)=25.3dB
SNRADD(T3)=25.9dB
SNRADD(T4)=23.3dB
SNRADD(T5)=21.6dB
SNRADD(T6)=20.7dB
SNRADD(T7)=20.0dB
SNRADD(T8)=19.4dB
SNRADD(T9)=18.7dB
――――――――――――――――――
―――――――――――――――――
SNR(C1)=5.2dB
SNR(C2)=0.8dB
SNR(C3)=16.4dB
SNR(C4)=−6.5dB
SNR(C5)=1.3dB
SNR(C6)=16.0dB
SNR(C7)=−8.6dB
SNR(C8)=−6.6dB
SNR(C9)=1.6dB
―――――――――――――――――
―――――――――――――――――
SNRADD(T2)=16.2dB
SNRADD(T3)=9.5dB
SNRADD(T4)=7.1dB
SNRADD(T5)=6.5dB
SNRADD(T6)=5.0dB
SNRADD(T7)=2.7dB
SNRADD(T8)=1.3dB
SNRADD(T9)=−0.5dB
――――――――――――――――――
―――――――――――――――――
SNR(C1)=9.3dB
SNR(C2)=6.4dB
SNR(C3)=9.4dB
SNR(C4)=−1.5dB
SNR(C5)=0.8dB
SNR(C6)=−0.2dB
SNR(C7)=−2.9dB
SNR(C8)=−1.2dB
SNR(C9)=1.0dB
―――――――――――――――――
―――――――――――――――――
SNRADD(T2)=10.0dB
SNRADD(T3)=7.6dB
SNRADD(T4)=7.0dB
SNRADD(T5)=6.4dB
SNRADD(T6)=5.6dB
SNRADD(T7)=4.9dB
SNRADD(T8)=4.3dB
SNRADD(T9)=−3.4dB
――――――――――――――――――
[表7]
―――――――――――――――――
SNRADD(T2)=8.0dB
SNRADD(T3)=7.3dB
――――――――――――――――――
―――――――――――――――――――――――――――
SNRSS(α=1.0;β=0.001)=8.0dB
SNRSS(α=2.0;β=0.001)=10.3dB
―――――――――――――――――――――――――――
―――――――――――――――――――――――――――――――――――――――
(A)音声認識ソフトウエア:日本電気製音声認識テストアプリケーション
(B)認識辞書:数字認識辞書4桁
(C)使用マイクロホン:
(C1)日本電気製ヘッドセットマイクロホン(比較例1;単一性音声用マイクロホンと、無指向性雑音用マイクロホンとを備えて構成される)
(C2)ゼンハイザー製HMD−25型マイクロホン(比較例2)
(C3)本実施形態に係るマイクロホンアレー(実施形態;図1乃至図3に示すように、1個の無指向性音声用マイクロホン1と、3個の無指向性雑音用マイクロホン2,3,4とを備えて構成される。)
―――――――――――――――――――――――――――――――――――――――
5…口元先端部、
6…音声放射方向、
10…マイクロホンアレー、
11…マイクロホン筐体、
12…フレキシブルアーム、
21,22,23,24…低周波増幅器、
26,27,28,29…A/D変換器、
30…遅延形アレー回路、
31,32,33,34,35,36,37,38,39…遅延器、
41,42,43,44,45,46,47,48,49…減算器、
50…信号評価及び選択回路、
51…雑音除去回路、
52…音声認識回路、
53…液晶ディスプレイ(LCD)、
C1,C2,C3,C4,C5,C6,C7,C8,C9…カージオイド、
Nst11,Nst12,Nst13,Nst32,Nst41…定常雑音、
Nsu21,Nsu31…突発性雑音。
Claims (5)
- 角錐の各頂点のうち上部頂点において、放射主軸が話者の口元に実質的に向くように設けられた第1のマイクロホンと、上記角錐の底面の少なくとも2つの頂点において、放射主軸が話者の口元方向に実質的に平行となるように設けられた複数の第2のマイクロホンとを備えたマイクロホンアレーと、
上記各マイクロホンからの音声信号に基づいて減算形アレー法を用いて上記各マイクロホンから上記各第2のマイクロホンに対する方向にゼロ点を生成するカージオイドを生成してそれらに対応する複数のカージオイド信号を発生する減算形アレー手段と、
上記複数のカージオイド信号のうちより高い信号対雑音電力比を有する複数のカージオイド信号を検出して選択し、選択した複数のカージオイド信号を加算し、加算結果のカージオイド信号を出力する評価選択手段と、
上記評価選択手段から出力されるカージオイド信号に基づいて音声認識を行って音声認識結果を出力する音声認識手段とを備えたことを特徴とする音声認識装置。 - 上記評価選択手段と上記音声認識手段との間に挿入して設けられ、上記評価選択手段から出力されるカージオイド信号においてスペクトルサブトラクション法を用いて雑音を除去した後、上記音声認識手段に出力する雑音除去手段をさらに備えたことを特徴とする請求項1記載の音声認識装置。
- 上記角錐は三角錐であることを特徴とする請求項1又は2記載の音声認識装置。
- 上記角錐は正三角錐であることを特徴とする請求項1又は2記載の音声認識装置。
- 上記正三角錐の底面の3つの頂点において、3つの第2のマイクロホンを設けたことを特徴とする請求項4記載の音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008218399A JP5270259B2 (ja) | 2008-08-27 | 2008-08-27 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008218399A JP5270259B2 (ja) | 2008-08-27 | 2008-08-27 | 音声認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010056763A true JP2010056763A (ja) | 2010-03-11 |
| JP5270259B2 JP5270259B2 (ja) | 2013-08-21 |
Family
ID=42072236
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008218399A Expired - Fee Related JP5270259B2 (ja) | 2008-08-27 | 2008-08-27 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5270259B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018098672A (ja) * | 2016-12-14 | 2018-06-21 | 株式会社東芝 | 電子装置、方法及びプログラム |
| CN111583927A (zh) * | 2020-05-08 | 2020-08-25 | 安创生态科技(深圳)有限公司 | 多通道i2s语音唤醒低功耗电路数据处理方法及装置 |
| WO2020263754A1 (en) * | 2019-06-27 | 2020-12-30 | Amazon Technologies, Inc. | Wireless earbud |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110824427A (zh) * | 2019-10-21 | 2020-02-21 | 中国人民解放军陆军勤务学院 | 一种斜三棱锥声压测试装置及其空间次声源定向定位方法 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0286397A (ja) * | 1988-09-22 | 1990-03-27 | Nippon Telegr & Teleph Corp <Ntt> | マイクロホンアレー |
| JP2006126424A (ja) * | 2004-10-28 | 2006-05-18 | Matsushita Electric Ind Co Ltd | 音声入力装置 |
| WO2007018293A1 (ja) * | 2005-08-11 | 2007-02-15 | Asahi Kasei Kabushiki Kaisha | 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム |
-
2008
- 2008-08-27 JP JP2008218399A patent/JP5270259B2/ja not_active Expired - Fee Related
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0286397A (ja) * | 1988-09-22 | 1990-03-27 | Nippon Telegr & Teleph Corp <Ntt> | マイクロホンアレー |
| JP2006126424A (ja) * | 2004-10-28 | 2006-05-18 | Matsushita Electric Ind Co Ltd | 音声入力装置 |
| WO2007018293A1 (ja) * | 2005-08-11 | 2007-02-15 | Asahi Kasei Kabushiki Kaisha | 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018098672A (ja) * | 2016-12-14 | 2018-06-21 | 株式会社東芝 | 電子装置、方法及びプログラム |
| WO2020263754A1 (en) * | 2019-06-27 | 2020-12-30 | Amazon Technologies, Inc. | Wireless earbud |
| US11134329B2 (en) | 2019-06-27 | 2021-09-28 | Amazon Technologies, Inc. | Wireless earbud |
| US11765495B2 (en) | 2019-06-27 | 2023-09-19 | Amazon Technologies, Inc. | Wireless earbud |
| CN111583927A (zh) * | 2020-05-08 | 2020-08-25 | 安创生态科技(深圳)有限公司 | 多通道i2s语音唤醒低功耗电路数据处理方法及装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5270259B2 (ja) | 2013-08-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9438985B2 (en) | System and method of detecting a user's voice activity using an accelerometer | |
| US9313572B2 (en) | System and method of detecting a user's voice activity using an accelerometer | |
| TWI307609B (en) | Method and apparatus to detect and remove audio disturbances | |
| KR101566649B1 (ko) | 근거리 널 및 빔 형성 | |
| CN107039045B (zh) | 用于语音增强的全局优化最小二乘后滤波 | |
| US9363596B2 (en) | System and method of mixing accelerometer and microphone signals to improve voice quality in a mobile device | |
| US7995773B2 (en) | Methods for processing audio input received at an input device | |
| US20080175408A1 (en) | Proximity filter | |
| JP3789685B2 (ja) | マイクロホンアレイ装置 | |
| KR101340215B1 (ko) | 멀티채널 신호의 반향 제거를 위한 시스템, 방법, 장치 및 컴퓨터 판독가능 매체 | |
| US20100098266A1 (en) | Multi-channel audio device | |
| KR20090037692A (ko) | 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치 | |
| US20080187152A1 (en) | Apparatus and method for beamforming in consideration of actual noise environment character | |
| JP2012058360A (ja) | 雑音除去装置および雑音除去方法 | |
| JP5270259B2 (ja) | 音声認識装置 | |
| JP2010056762A (ja) | マイクロホンアレー | |
| CN116110421B (zh) | 语音活动检测方法、系统、语音增强方法以及系统 | |
| JP7248048B2 (ja) | 収音装置、収音プログラム及び収音方法、並びに、キーボード | |
| WO2011149969A2 (en) | Separating voice from noise using a network of proximity filters | |
| CN113132519B (zh) | 电子设备、电子设备的语音识别方法及存储介质 | |
| JP4552034B2 (ja) | ヘッドセット型マイクロフォンアレイ音声入力装置 | |
| KR102897449B1 (ko) | 휴대용 노래방을 위한 저복잡도 하울링 억제 | |
| US20250141998A1 (en) | Conference terminal and echo cancellation method | |
| JP2011101407A (ja) | ロボット、及び収音装置 | |
| JP2010256421A (ja) | 集音エリア制御方法および音声入力装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110617 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120731 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120924 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130423 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130509 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |