JP5614767B2 - 音声処理装置 - Google Patents
音声処理装置 Download PDFInfo
- Publication number
- JP5614767B2 JP5614767B2 JP2009097652A JP2009097652A JP5614767B2 JP 5614767 B2 JP5614767 B2 JP 5614767B2 JP 2009097652 A JP2009097652 A JP 2009097652A JP 2009097652 A JP2009097652 A JP 2009097652A JP 5614767 B2 JP5614767 B2 JP 5614767B2
- Authority
- JP
- Japan
- Prior art keywords
- peak value
- range
- value
- voice
- gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
Gnew =Gnow+(Dmid−Ymid)
に従って演算される(S78)。
Gnew=Gnow +2dB
に従って算出される。即ち、マイクアンプ12のゲイン値が2dBだけ増加される。これは、ヒストグラムで表わされるピーク値の統計的分布範囲が、全体として音声認識エンジン120のダイナミックレンジより2dBだけ低い側に寄っているので、今後その音声信号のピーク値の統計的分布(ヒストグラム)範囲が前記ダイナミックレンジに収まるようにするため、マイクアンプ12のゲイン値が2dBだけ増加されるものである。
Gnew =Gnow+(Dmin−Rmin)
に従って演算される。
Gnew =Gnow +4dB
に従って算出される。即ち、マイクアンプ12のゲイン値が4dBだけ増加される。これは、ヒストグラムにおいて総度数が大きく主要となる範囲(検出ピーク値主要範囲)が、全体として音声認識エンジン120のダイナミックレンジより4dBだけ低い側に寄っているので、今後その音声信号のピーク値の統計的分布(ヒストグラム)範囲が前記ダイナミックレンジに収まるようにするため、マイクアンプ12のゲイン値が4dBだけ増加されるものである。
11 マイク
12 マイクアンプ(増幅手段)
13 A/D変換器
110 音声データ格納部
120 音声認識エンジン(音声処理手段)
130 ピーク値算出処理部
131 データ最大振幅算出部
132 過大入力判定部
133 突出量推定部
140 ヒストグラム算出処理部
141 発話ピーク値格納部
142 ヒストグラム算出部
150 ゲイン算出部
151 レンジ内判定部
152 ゲイン更新部
Claims (10)
- 利用者の発話に応答してマイクから出力される音声信号を設定されたゲイン値に基づいて増幅する増幅手段と、該増幅手段での増幅を経た音声信号を所定の手法に従って処理する音声処理手段とを有する音声処理装置であって、
前記利用者の発話に際して前記増幅手段での増幅を経た音声信号のピーク値を検出する音声ピーク値検出手段と、
前記ピーク値検出手段にて検出される音声信号のピーク値の統計的分布を表わす音声ピーク値分布情報を生成する手段と、
前記音声ピーク値分布情報と予め定めた基準ピーク値範囲とに基づいて前記増幅手段に設定すべきゲイン値を決定するゲイン値決定手段とを有し、
前記ゲイン値決定手段は、前記音声ピーク値分布情報にて表わされるピーク値分布範囲の幅が前記基準ピーク値範囲の幅以下であるか否かを判定するピーク値範囲判定手段を有し、
前記ピーク値分布範囲の幅が前記基準ピーク値範囲の幅以下であると判定された場合に、ピーク値分布範囲の各ピーク値を前記基準ピーク値範囲に収めるに必要なゲイン値の変化分に基づいて前記ゲイン値を決定する音声処理装置。 - 前記音声ピーク値検出手段にて検出される音声信号のピーク値が前記基準ピーク値範囲内にあるか否かを判定する判定手段と、
前記検出された音声信号のピーク値が前記基準ピーク値範囲内にあると判定されたときに、前記ゲイン値決定手段は、前記音声ピーク値分布情報と前記基準ピーク値範囲とに基づいて新たなゲイン値を決定することなく、既に設定されているゲイン値を維持する請求項1記載の音声処理装置。 - 前記音声ピーク値分布情報を、前記基準ピーク値範囲に納められた前記ピーク値分布範囲の音声信号のピーク値の統計的分布を表すように更新する第1音声ピーク値分布情報更新手段を有する請求項1または2記載の音声処理装置。
- 前記ゲイン値決定手段は、前記ピーク値分布範囲の中間のピーク値と、前記基準ピーク値範囲の中間のピーク値との差分を前記ゲイン値の変化分として前記ゲイン値を決定する請求項1乃至3のいずれかに記載の音声処理装置。
- 前記ゲイン値決定手段は、前記ピーク値分布範囲の幅が前記基準ピーク値範囲の幅以下ではないと判定されたときに、前記ピーク値分布範囲から、前記基準ピーク値範囲の幅以下の幅で、各ピーク値の度数の総数が最大となる範囲である検出ピーク値主要範囲を決める主要範囲決定手段を有し、
前記検出ピーク値主要範囲の各ピーク値を前記基準ピーク値範囲に収めるに必要なゲイン値の変化分に基づいて前記ゲイン値を決定する請求項1乃至4のいずれかに記載の音声処理装置。 - 前記音声ピーク値分布情報を、前記基準ピーク値範囲に収められた前記検出ピーク値主要範囲を含むピーク値分布範囲の音声信号のピーク値の統計的分布を表すように更新する第2音声ピーク値分布情報更新手段を有する請求項5記載の音声処理装置。
- 前記ゲイン値決定手段は、前記検出ピーク値主要範囲の境界のピーク値と、前記基準ピーク値範囲の対応する境界のピーク値との差分を前記ゲイン値の変化分として前記ゲイン値を決定する請求項5または6記載の音声処理装置。
- 前記主要範囲決定手段は、前記ピーク値分布範囲から、前記基準ピーク値範囲の幅と同じ幅で、各ピーク値の度数の総数が最大となる範囲を検出ピーク値主要範囲として決定する請求項5乃至7のいずれかに記載の音声処理装置。
- 前記音声ピーク値検出手段は、前記利用者の発話に際して前記増幅手段での増幅を経た音声信号レベルをサンプルするサンプリング手段と、
該サンプリング手段にてサンプルされた音声信号レベルに基づいて前記音声信号のピーク値を決定するピーク値決定手段とを有し、
前記サンプリング手段は、音声信号レベルが所定値を超えるときに、サンプリングする音声信号レベルを前記所定値に制限するものであって、
前記ピーク値決定手段は、サンプリングされた音声信号レベルに前記所定値が含まれる場合、サンプリングされた音声信号レベルに基づいて前記音声信号のピーク値を推定するピーク値推定手段を有する請求項1乃至8のいずれかに記載の音声処理装置。 - 前記音声ピーク値分布情報は、検出された音声信号の各ピーク値の度数を表わすヒストグラムを含む請求項1乃至9のいずれかに記載の音声処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009097652A JP5614767B2 (ja) | 2009-04-14 | 2009-04-14 | 音声処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009097652A JP5614767B2 (ja) | 2009-04-14 | 2009-04-14 | 音声処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010251937A JP2010251937A (ja) | 2010-11-04 |
JP5614767B2 true JP5614767B2 (ja) | 2014-10-29 |
Family
ID=43313803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009097652A Active JP5614767B2 (ja) | 2009-04-14 | 2009-04-14 | 音声処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5614767B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017067812A (ja) * | 2015-09-28 | 2017-04-06 | アルパイン株式会社 | 音声認識システム及びコンピュータ |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9799349B2 (en) * | 2015-04-24 | 2017-10-24 | Cirrus Logic, Inc. | Analog-to-digital converter (ADC) dynamic range enhancement for voice-activated systems |
KR20160132574A (ko) | 2015-05-11 | 2016-11-21 | 현대자동차주식회사 | 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법 |
CN105224279B (zh) * | 2015-09-21 | 2018-08-28 | 福州瑞芯微电子股份有限公司 | 一种音频输出控制方法、控制系统及电子设备 |
CN105810204A (zh) * | 2016-03-16 | 2016-07-27 | 深圳市智骏数据科技有限公司 | 音频电平检测调整方法及装置 |
JP7275711B2 (ja) * | 2019-03-20 | 2023-05-18 | ヤマハ株式会社 | オーディオ信号の処理方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6172299A (ja) * | 1984-09-17 | 1986-04-14 | 日立電子エンジニアリング株式会社 | 音声認識装置 |
JP3731516B2 (ja) * | 2001-09-21 | 2006-01-05 | ヤマハ株式会社 | 波形修正方法 |
JP2007199337A (ja) * | 2006-01-26 | 2007-08-09 | Sony Corp | デジタル録音装置,デジタル録音方法,そのプログラムおよび記憶媒体 |
-
2009
- 2009-04-14 JP JP2009097652A patent/JP5614767B2/ja active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017067812A (ja) * | 2015-09-28 | 2017-04-06 | アルパイン株式会社 | 音声認識システム及びコンピュータ |
US10319393B2 (en) | 2015-09-28 | 2019-06-11 | Alpine Electronics, Inc. | Speech recognition system and gain setting system |
Also Published As
Publication number | Publication date |
---|---|
JP2010251937A (ja) | 2010-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5614767B2 (ja) | 音声処理装置 | |
CN108630202B (zh) | 语音识别装置、语音识别方法以及记录介质 | |
WO2010131470A1 (ja) | ゲイン制御装置及びゲイン制御方法、音声出力装置 | |
US8755546B2 (en) | Sound processing apparatus, sound processing method and hearing aid | |
US9460731B2 (en) | Noise estimation apparatus, noise estimation method, and noise estimation program | |
JPH0677894A (ja) | 無線端末装置 | |
JP2006227499A (ja) | 音声認識装置 | |
JPH096394A (ja) | 音声認識装置及び音声認識方法 | |
JP5234117B2 (ja) | 音声検出装置、音声検出プログラムおよびパラメータ調整方法 | |
JPH08185196A (ja) | 音声区間検出装置 | |
JP4548953B2 (ja) | 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム | |
KR100482477B1 (ko) | 음성 인식 장치, 음성 인식 방법 및 음성 인식 프로그램을 기록한 기록 매체 | |
JP2016033530A (ja) | 発話区間検出装置、音声処理システム、発話区間検出方法およびプログラム | |
JPH06236196A (ja) | 音声認識方法および装置 | |
JP2004012151A (ja) | 音源方向推定装置 | |
JP2001228893A (ja) | 音声認識装置 | |
JP2005157086A (ja) | 音声認識装置 | |
JP7013789B2 (ja) | 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法 | |
JP4999267B2 (ja) | 音声入力装置 | |
JPH09258783A (ja) | 音声認識装置 | |
JPH056193A (ja) | 音声区間検出方式及び音声認識装置 | |
KR102017261B1 (ko) | 잡음 패턴 분석에 의한 차량용 오디오의 음질 개선 시스템 및 그 개선 방법 | |
JPH07225592A (ja) | 有音区間検出装置 | |
JP2004069772A (ja) | 雑音除去装置、及び、音声認識装置、並びに音声通信装置 | |
US7276967B2 (en) | Signal level adjusting apparatus, gain value updating method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120321 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130510 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130927 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131002 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140903 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Ref document number: 5614767 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |