JP2005202335A - 音声処理方法と装置及びプログラム - Google Patents
音声処理方法と装置及びプログラム Download PDFInfo
- Publication number
- JP2005202335A JP2005202335A JP2004011111A JP2004011111A JP2005202335A JP 2005202335 A JP2005202335 A JP 2005202335A JP 2004011111 A JP2004011111 A JP 2004011111A JP 2004011111 A JP2004011111 A JP 2004011111A JP 2005202335 A JP2005202335 A JP 2005202335A
- Authority
- JP
- Japan
- Prior art keywords
- processing
- audio signal
- calculating
- coefficient
- mean square
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】A/D変換器11によりディジタル化された音声信号を窓掛け処理部12に入力してフレーム分割した後に、FFT13を経て対数スペクトル計算部14により対数スペクトルを計算し、対数スペクトルに対してIFFT15を施すことでケプストラム係数を生成した後、回帰係数計算部16−1〜16−nにより時間方向にケプストラム係数を見た場合の回帰係数を計算し、2乗平均部17により回帰係数の2乗平均(D値)を計算し、D値を閾値処理部18に通して音声信号の定常部を求め、求められた定常部に対して乗算器19により音声信号の振幅を抑圧し、D/A変換器20を介して出力する。
【選択図】 図3
Description
荒井隆行,木下慶介,程島奈緒,楠本亜希子,喜田村朋子,"音声の定常部抑圧処理の残響に対する効果",日本音響学会(秋期研究発表会)講演論文集,vol. 1, 449-450, 2001年10月 S. Furui, "On the role of spectral transition for speech perception,"J. Acoust. Soc. Am., 80(4):1016-1025, 1986
残響環境は、コンピュータ上で音声信号と残響のインパルス応答を畳み込むことによって実現した。使用したインパルス応答は、東大和市大ホール(反射板無し)で測定されたインパルス応答を基に、それらを人工的に加工することによって残響時間0.4秒から1.3秒までの範囲に変化させたものである。
11…A/D変換器
12…窓掛け処理部
13…高速フーリエ変換器
14…対数スペクトル計算部
15…逆高速フーリエ変換器
16−1〜16−n…回帰係数計算部
17…2乗平均計算部
18…閾値処理部
19…乗算器
20…D/A変換器
21…出力端子
Claims (3)
- 入力された音声信号に対してスピーカに出力される前に処理を施す音声処理方法であって、
前記音声信号に対して窓掛け処理を行って該音声信号を複数のフレームに分割するステップと、
分割された各フレームの音声信号について対数スペクトルを計算するステップと、
前記対数スペクトルからケプストラム係数を計算するステップと、
前記ケプストラム係数を時間方向に見た場合の回帰係数を計算するステップと、
前記回帰係数の2乗平均を求めるステップと、
前記2乗平均について閾値処理を行うことにより前記音声信号の定常部を求めるステップと、
前記定常部について前記音声信号の振幅を抑圧するステップとを具備することを特徴とする音声処理方法。 - 入力された音声信号に対してスピーカに出力される前に処理を施す音声処理装置であって、
前記音声信号に対して窓掛け処理を行って該音声信号を複数のフレームに分割する窓掛け処理部と、
前記窓掛け処理部により分割された各フレームの音声信号にフーリエ変換を施すフーリエ変換部と、
前記フーリエ変換部からの出力信号に基づき対数スペクトルを計算する対数スペクトル計算部と、
前記対数スペクトルに対して逆フーリエ変換を施すことによりケプストラム係数を生成するケプストラム係数計算部と、
前記ケプストラム係数を時間方向に見た場合の回帰係数を計算する回帰係数計算部と、
前記回帰係数の2乗平均を求める2乗平均部と、
前記2乗平均について閾値処理を行うことにより前記音声信号の定常部を求める閾値処理部と、
前記定常部について前記音声信号の振幅を抑圧する抑圧処理部とを具備することを特徴とする音声処理装置。 - 入力された音声信号に対してスピーカに出力される前に処理を施す音声処理をコンピュータに行わせるプログラムであって、
前記音声信号に対して窓掛け処理を行って該音声信号を複数のフレームに分割する処理と、
分割された各フレームの音声信号について対数スペクトルを計算する処理と、
前記対数スペクトルからケプストラム係数を計算する処理と、
前記ケプストラム係数を時間方向に見た場合の回帰係数を計算する処理と、
前記回帰係数の2乗平均を求める処理と、
前記2乗平均について閾値処理を行うことにより前記音声信号の定常部を求める処理と、
前記定常部について前記音声信号の振幅を抑圧する処理とを前記コンピュータに行わせる音声処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004011111A JP2005202335A (ja) | 2004-01-19 | 2004-01-19 | 音声処理方法と装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004011111A JP2005202335A (ja) | 2004-01-19 | 2004-01-19 | 音声処理方法と装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005202335A true JP2005202335A (ja) | 2005-07-28 |
JP2005202335A5 JP2005202335A5 (ja) | 2007-02-22 |
Family
ID=34823634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004011111A Pending JP2005202335A (ja) | 2004-01-19 | 2004-01-19 | 音声処理方法と装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005202335A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007065285A (ja) * | 2005-08-31 | 2007-03-15 | Takayuki Arai | 音声信号処理方法、装置及びプログラム |
JP2008245159A (ja) * | 2007-03-28 | 2008-10-09 | Toshiba Corp | 音響信号発生装置および方法 |
KR100876794B1 (ko) | 2007-04-03 | 2009-01-09 | 삼성전자주식회사 | 이동 단말에서 음성의 명료도 향상 장치 및 방법 |
US8675882B2 (en) | 2008-01-21 | 2014-03-18 | Panasonic Corporation | Sound signal processing device and method |
WO2021031942A1 (zh) * | 2019-08-16 | 2021-02-25 | 阿里巴巴集团控股有限公司 | 一种针对目标频谱矩阵的处理方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001083978A (ja) * | 1999-07-15 | 2001-03-30 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2001100763A (ja) * | 1999-09-29 | 2001-04-13 | Yamaha Corp | 波形分析方法 |
-
2004
- 2004-01-19 JP JP2004011111A patent/JP2005202335A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001083978A (ja) * | 1999-07-15 | 2001-03-30 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2001100763A (ja) * | 1999-09-29 | 2001-04-13 | Yamaha Corp | 波形分析方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007065285A (ja) * | 2005-08-31 | 2007-03-15 | Takayuki Arai | 音声信号処理方法、装置及びプログラム |
JP2008245159A (ja) * | 2007-03-28 | 2008-10-09 | Toshiba Corp | 音響信号発生装置および方法 |
KR100876794B1 (ko) | 2007-04-03 | 2009-01-09 | 삼성전자주식회사 | 이동 단말에서 음성의 명료도 향상 장치 및 방법 |
US8019603B2 (en) | 2007-04-03 | 2011-09-13 | Samsung Electronics Co., Ltd | Apparatus and method for enhancing speech intelligibility in a mobile terminal |
US8675882B2 (en) | 2008-01-21 | 2014-03-18 | Panasonic Corporation | Sound signal processing device and method |
WO2021031942A1 (zh) * | 2019-08-16 | 2021-02-25 | 阿里巴巴集团控股有限公司 | 一种针对目标频谱矩阵的处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110473567B (zh) | 基于深度神经网络的音频处理方法、装置及存储介质 | |
Hu et al. | Effects of early and late reflections on intelligibility of reverberated speech by cochlear implant listeners | |
Roman et al. | Intelligibility of reverberant noisy speech with ideal binary masking | |
JP2002014689A (ja) | デジタルに圧縮されたスピーチの了解度を向上させる方法および装置 | |
Gordon-Salant et al. | Recognition of time-compressed speech does not predict recognition of natural fast-rate speech by older listeners | |
EP3113183B1 (en) | Speech intelligibility improving apparatus and computer program therefor | |
Hummersone | A psychoacoustic engineering approach to machine sound source separation in reverberant environments | |
Huang et al. | Lombard speech model for automatic enhancement of speech intelligibility over telephone channel | |
Cao et al. | Improvement of intelligibility of ideal binary-masked noisy speech by adding background noise | |
US10176824B2 (en) | Method and system for consonant-vowel ratio modification for improving speech perception | |
Rennies et al. | Intelligibility-Enhancing Speech Modifications-The Hurricane Challenge 2.0. | |
Kusumoto et al. | Modulation enhancement of speech by a pre-processing algorithm for improving intelligibility in reverberant environments | |
Hazrati et al. | Reverberation suppression in cochlear implants using a blind channel-selection strategy | |
Kleczkowski et al. | Lombard effect in Polish speech and its comparison in English speech | |
Jayan et al. | Automated modification of consonant–vowel ratio of stops for improving speech intelligibility | |
Schoenmaker et al. | The multiple contributions of interaural differences to improved speech intelligibility in multitalker scenarios | |
JP4774255B2 (ja) | 音声信号処理方法、装置及びプログラム | |
JP4876245B2 (ja) | 子音加工装置、音声情報伝達装置及び子音加工方法 | |
Arai et al. | Using steady-state suppression to improve speech intelligibility in reverberant environments for elderly listeners | |
Bhattacharya et al. | Combined spectral and temporal enhancement to improve cochlear-implant speech perception | |
Ngo et al. | Increasing speech intelligibility and naturalness in noise based on concepts of modulation spectrum and modulation transfer function | |
JP2005202335A (ja) | 音声処理方法と装置及びプログラム | |
Villegas et al. | Effects of task and language nativeness on the Lombard effect and on its onset and offset timing | |
JP2006333396A (ja) | 音声信号拡声装置 | |
JP2008102551A (ja) | 音声信号の処理装置およびその処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070109 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070109 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090825 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091026 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100420 |