JP2015215528A - 音声強調装置、音声強調方法及びプログラム - Google Patents
音声強調装置、音声強調方法及びプログラム Download PDFInfo
- Publication number
- JP2015215528A JP2015215528A JP2014099177A JP2014099177A JP2015215528A JP 2015215528 A JP2015215528 A JP 2015215528A JP 2014099177 A JP2014099177 A JP 2014099177A JP 2014099177 A JP2014099177 A JP 2014099177A JP 2015215528 A JP2015215528 A JP 2015215528A
- Authority
- JP
- Japan
- Prior art keywords
- band
- frequency
- voice
- average power
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Telephone Function (AREA)
Abstract
【解決手段】音声強調装置1は、狭帯域音声を入力とし、狭帯域音声を明瞭化した強調音声を出力する。帯域拡張部10は、入力された狭帯域音声を広帯域化して帯域拡張音声を生成する。明瞭化部11は、帯域拡張部10の出力する帯域拡張音声を明瞭化した強調音声を生成する。これにより、音声強調装置1は、狭帯域音声を騒音下でも明瞭に聴取可能な音声に変換することができる。
【選択図】図1
Description
電話帯域などの狭帯域では、どのような強調処理により音声を強調したとしてもその効果には限界がある。例えばフォルマントの強調による方法を適用しても電話帯域ではせいぜい第3フォルマントまでしか含まれないため高々3個のフォルマントだけを強調することしかできず第4フォルマント以降の強調ができないため効果が限定されてしまう。またロンバード効果に基づくスペクトル変形方法においても、ロンバート効果で前提にしている実際の音声に含まれる高域成分が狭帯域音声には存在しないため適切な変換を行うことができない。
一般的に静かな環境では広帯域化により自然性が向上し狭帯域音声より聞き取り易さは向上するが、騒音下においてはその騒音の周波数特性により効果は異なる。例えば高域のパワーが強い騒音であれば、高域を再現しても騒音に打ち消されるため聞き取り易さはほとんど向上しない。さらに過大な音量の上昇によるスピーカーでの歪の発生を考慮し通常は帯域拡張後の音声と原音声のパワーを同一にするため、高域を再現することで低域のパワーが低下しむしろ原音より聞き取りにくくなってしまう可能性もある。
騒音の周波数特性が正確に測定できれば、その特性にあわせて狭帯域音声に対してなんらかの処理をすることで音声の聞き取り易さを向上することが可能である。例えば騒音の周波数特性で1〜2KHzのパワーが低い場合、当該帯域を強調すれば音声の聞き取り易さは向上する。しかし電話や携帯電話のマイクは様々な特性を有しているためそうしたマイクで騒音を集音し周波数特性を測定しようとしても実際の騒音の周波数特性とは異なり不正確なため得られた特性に基づく処理に効果があるとは限らない。
この発明の第一実施形態に係る音声強調装置及び方法は、帯域拡張処理と強調処理の統合を行う。従来は自然性の向上を目的にしていた帯域拡張処理を音声強調処理と併用することで、狭帯域での強調処理と比較してより効果的な音声の強調処理を実現することができる。
この発明の第二実施形態に係る音声強調装置及び方法は、第一実施形態に係る音声強調装置及び方法の応用例であり、騒音の周波数特性を考慮した帯域拡張の制限を行う。騒音の周波数特性を考慮して拡張する帯域を制限することで、強調効果が期待できる周波数帯域での強調処理を実現することができる。
この発明の第三実施形態に係る音声強調装置及び方法は、第一実施形態に係る音声強調装置及び方法の応用例であり、騒音の低域部と高域部の平均的なパワーのみを考慮した強調処理を行う。正確な騒音の周波数特性が測定できない場合、高域部と低域部の平均的なパワーだけ測定するだけで、騒音特性を考慮しない場合と比較して効果的な音声の強調処理を実現することができる。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
10、23 帯域拡張部
11、24 明瞭化部
21 周波数特性分析部
22 上限周波数決定部
31 低域部平均パワー決定部
32 高域部平均パワー決定部
33 低域部明瞭化部
34 低域部削除高域部補正部
Claims (7)
- 入力された狭帯域音声を広帯域化して帯域拡張音声を生成する帯域拡張部と、
上記帯域拡張音声を明瞭化した強調音声を生成する明瞭化部と、
を含む音声強調装置。 - 請求項1に記載の音声強調装置であって、
入力された騒音の周波数特性を分析する周波数特性分析部と、
上記騒音の周波数特性に基づいて上限周波数を決定する上限周波数決定部と、
をさらに含み、
上記帯域拡張部は、上記上限周波数を帯域の上限として広帯域化して上記帯域拡張音声を生成するものである
音声強調装置。 - 請求項1に記載の音声強調装置であって、
入力された騒音の上記狭帯域音声の帯域におけるパワーを平均した低域部平均パワーを決定する低域部平均パワー決定部と、
上記騒音の上記帯域拡張音声の帯域から上記狭帯域音声の帯域を除いた帯域におけるパワーを平均した高域部平均パワーを決定する高域部平均パワー決定部と、
上記狭帯域音声を上記狭帯域音声の帯域のみを明瞭化した強調音声を生成する低域部明瞭化部と、
上記明瞭化部の出力から上記狭帯域音声の帯域を削除し、残りの帯域のパワーが上記狭帯域音声のパワーに合うように補正する低域部削除高域部補正部と、
をさらに含み、
上記低域部平均パワーが上記高域部平均パワーよりも大きく、かつ、上記低域部平均パワーが予め定めた第一の閾値より大きい場合には、上記低域部削除高域部補正部を実行し、上記低域部平均パワーが上記高域部平均パワー以下であり、かつ、上記高域部平均パワーが予め定めた第二の閾値より大きい場合には、上記低域部明瞭化部を実行するものである
音声強調装置。 - 入力された狭帯域音声を広帯域化して帯域拡張音声を生成する帯域拡張ステップと、
上記帯域拡張音声を明瞭化した強調音声を生成する明瞭化ステップと、
を含む音声強調方法。 - 請求項4に記載の音声強調方法であって、
入力された騒音の周波数特性を分析する周波数特性分析ステップと、
上記騒音の周波数特性に基づいて上限周波数を決定する上限周波数決定ステップと、
をさらに含み、
上記帯域拡張ステップは、上記上限周波数を帯域の上限として広帯域化して上記帯域拡張音声を生成するものである
音声強調方法。 - 請求項4に記載の音声強調方法であって、
入力された騒音の上記狭帯域音声の帯域におけるパワーを平均した低域部平均パワーを決定する低域部平均パワー決定ステップと、
上記騒音の上記帯域拡張音声の帯域から上記狭帯域音声の帯域を除いた帯域におけるパワーを平均した高域部平均パワーを決定する高域部平均パワー決定ステップと、
上記狭帯域音声を上記狭帯域音声の帯域のみを明瞭化した強調音声を生成する低域部明瞭化ステップと、
上記明瞭化ステップの出力から上記狭帯域音声の帯域を削除し、残りの帯域のパワーが上記狭帯域音声のパワーに合うように補正する低域部削除高域部補正ステップと、
をさらに含み、
上記低域部平均パワーが上記高域部平均パワーよりも大きく、かつ、上記低域部平均パワーが予め定めた第一の閾値より大きい場合には、上記低域部削除高域部補正ステップを実行し、上記低域部平均パワーが上記高域部平均パワー以下であり、かつ、上記高域部平均パワーが予め定めた第二の閾値より大きい場合には、上記低域部明瞭化ステップを実行するものである
音声強調方法。 - 請求項1から3のいずれかに記載の音声強調装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014099177A JP6282925B2 (ja) | 2014-05-13 | 2014-05-13 | 音声強調装置、音声強調方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014099177A JP6282925B2 (ja) | 2014-05-13 | 2014-05-13 | 音声強調装置、音声強調方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015215528A true JP2015215528A (ja) | 2015-12-03 |
JP6282925B2 JP6282925B2 (ja) | 2018-02-21 |
Family
ID=54752454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014099177A Active JP6282925B2 (ja) | 2014-05-13 | 2014-05-13 | 音声強調装置、音声強調方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6282925B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102016221409A1 (de) | 2015-11-02 | 2017-05-04 | Toyota Jidosha Kabushiki Kaisha | Verwaltungsvorrichtung für sekundärbatterie |
WO2020054141A1 (ja) | 2018-09-11 | 2020-03-19 | 川崎重工業株式会社 | 乗物の音声システム及び音声出力方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188599A (ja) * | 1999-10-19 | 2001-07-10 | Matsushita Electric Ind Co Ltd | オーディオ信号復号装置 |
JP2009134260A (ja) * | 2007-10-30 | 2009-06-18 | Nippon Telegr & Teleph Corp <Ntt> | 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体 |
WO2011001578A1 (ja) * | 2009-06-29 | 2011-01-06 | パナソニック株式会社 | 通信装置 |
JP2012073295A (ja) * | 2010-09-27 | 2012-04-12 | Fujitsu Ltd | 音声帯域拡張装置および音声帯域拡張方法 |
WO2013098885A1 (ja) * | 2011-12-27 | 2013-07-04 | 三菱電機株式会社 | 音声信号復元装置および音声信号復元方法 |
JP2013130673A (ja) * | 2011-12-21 | 2013-07-04 | Yamaha Corp | 音響処理装置および音響処理方法 |
JP2014063004A (ja) * | 2012-09-21 | 2014-04-10 | Oki Electric Ind Co Ltd | 帯域拡張装置及び方法 |
-
2014
- 2014-05-13 JP JP2014099177A patent/JP6282925B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188599A (ja) * | 1999-10-19 | 2001-07-10 | Matsushita Electric Ind Co Ltd | オーディオ信号復号装置 |
JP2009134260A (ja) * | 2007-10-30 | 2009-06-18 | Nippon Telegr & Teleph Corp <Ntt> | 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体 |
WO2011001578A1 (ja) * | 2009-06-29 | 2011-01-06 | パナソニック株式会社 | 通信装置 |
JP2012073295A (ja) * | 2010-09-27 | 2012-04-12 | Fujitsu Ltd | 音声帯域拡張装置および音声帯域拡張方法 |
JP2013130673A (ja) * | 2011-12-21 | 2013-07-04 | Yamaha Corp | 音響処理装置および音響処理方法 |
WO2013098885A1 (ja) * | 2011-12-27 | 2013-07-04 | 三菱電機株式会社 | 音声信号復元装置および音声信号復元方法 |
JP2014063004A (ja) * | 2012-09-21 | 2014-04-10 | Oki Electric Ind Co Ltd | 帯域拡張装置及び方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102016221409A1 (de) | 2015-11-02 | 2017-05-04 | Toyota Jidosha Kabushiki Kaisha | Verwaltungsvorrichtung für sekundärbatterie |
DE102016221409B4 (de) | 2015-11-02 | 2020-07-16 | Toyota Jidosha Kabushiki Kaisha | Verwaltungsvorrichtung für sekundärbatterie |
WO2020054141A1 (ja) | 2018-09-11 | 2020-03-19 | 川崎重工業株式会社 | 乗物の音声システム及び音声出力方法 |
US11557275B2 (en) | 2018-09-11 | 2023-01-17 | Kawasaki Motors, Ltd. | Voice system and voice output method of moving machine |
Also Published As
Publication number | Publication date |
---|---|
JP6282925B2 (ja) | 2018-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Reddy et al. | An individualized super-Gaussian single microphone speech enhancement for hearing aid users with smartphone as an assistive device | |
US20210409877A1 (en) | Systems and methods for providing personalized audio replay on a plurality of consumer devices | |
JP6290429B2 (ja) | 音声処理システム | |
JP5542206B2 (ja) | オーディオ・システムの知覚品質を判定する方法およびシステム | |
ES2966063T3 (es) | Separación de fuentes mediante una estimación y control de la calidad de sonido | |
JP2010224321A (ja) | 信号処理装置 | |
JP2015050685A (ja) | オーディオ信号処理装置および方法、並びにプログラム | |
CN104919525B (zh) | 用于评估退化语音信号的可理解性的方法和装置 | |
US9478235B2 (en) | Voice signal processing device and voice signal processing method | |
JP5136378B2 (ja) | 音響処理方法 | |
TW201443887A (zh) | 用於使用次頻帶時間平滑技術產生頻率增強信號之裝置及方法 | |
Morita et al. | Robust voice activity detection based on concept of modulation transfer function in noisy reverberant environments | |
JP6282925B2 (ja) | 音声強調装置、音声強調方法及びプログラム | |
JP5086442B2 (ja) | 雑音抑圧方法及び装置 | |
Gaoxiong et al. | The perceptual objective listening quality assessment algorithm in telecommunication: introduction of itu-t new metrics polqa | |
JP6157926B2 (ja) | 音声処理装置、方法およびプログラム | |
Voishvillo | Assessment of Nonlinearity in Transducers and Sound Systems–from THD to Perceptual Models | |
JP2006126859A (ja) | 音声処理装置及び音声処理方法 | |
US9697848B2 (en) | Noise suppression device and method of noise suppression | |
JP2012208177A (ja) | 帯域拡張装置及び音声補正装置 | |
GB2536727B (en) | A speech processing device | |
JP5609157B2 (ja) | 係数設定装置および雑音抑圧装置 | |
JP2020190606A (ja) | 音声雑音除去装置及びプログラム | |
JP6707914B2 (ja) | ゲイン処理装置及びプログラム、並びに、音響信号処理装置及びプログラム | |
WO2022078164A1 (zh) | 一种音质评估方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160714 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6282925 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |