JP4774255B2 - 音声信号処理方法、装置及びプログラム - Google Patents
音声信号処理方法、装置及びプログラム Download PDFInfo
- Publication number
- JP4774255B2 JP4774255B2 JP2005251233A JP2005251233A JP4774255B2 JP 4774255 B2 JP4774255 B2 JP 4774255B2 JP 2005251233 A JP2005251233 A JP 2005251233A JP 2005251233 A JP2005251233 A JP 2005251233A JP 4774255 B2 JP4774255 B2 JP 4774255B2
- Authority
- JP
- Japan
- Prior art keywords
- length
- audio signal
- time
- vowel
- stationary part
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
T. Arai, K. Kinoshita, N. Hodoshima, A. Kusumoto and T. Kitamura, "Effects of suppressing steady-state portions of speech on intelligibility in reverberant environments," Proc. Autumn Meet. Acoust. Soc. Jpn., pp. 449-450 (2001). T. Arai, K. Kinoshita, N. Hodoshima, A. Kusumoto and T. Kitamura, "Effects of suppressing steady-state portions of speech on intelligibility in reverberant environments," Acoust. Sci. & Tech., 23, 229-232 (2002). N. Hodoshima, T. Goto, N. Ohata, T. Inoue and T. Arai, "The effect of pre-processing approach for improving speech intelligibility in a hall: Comparison between diotic and dichotic listening conditions," Acoust. Sci. & Tech., 26, 212-214 (2005).
図2は、本発明の第1の実施形態に係る音声信号処理装置を示している。入力端子11からのディジタル化された音声信号は、定常部検出部12と零系列挿入部13に入力される。定常部検出部12は、入力される音声信号の母音部などに存在する定常部(音声の音節の中心部の核など)を検出し、例えば定常部で“1”、非定常部で“0”となるような定常部検出信号を発生する。零系列挿入部13は、定常部検出部12からの定常部検出信号を受け、入力される音声信号の定常部内に零系列を挿入する処理を行う。こうして定常部内に零系列が挿入された後の音声信号は、出力端子16から出力される。
図3は、本発明の第2の実施形態に係る音声信号処理装置を示しており、図2に対して母音長測定部14と零系列長設定部15が追加されている。母音長測定部14は入力される音声信号から母音部を抽出して母音部の時間的な長さ(以下、母音長という)Tvを測定する。零系列長設定部15は、零系列挿入部13で挿入される零系列の長さ(以下、零系列長という)Tzを母音長測定部14により測定された母音長Tvに応じて、例えば母音長Tvに比例するように設定する。なお、定常部検出部12により定常部の長さTs(以下、定常部長という)を求め、零系列長Tzを定常部長Tsに応じて、例えば定常部長Tsに比例するように設定してもよい。
次に、図2または図3における定常部検出部12について説明する。図4及び図5は、定常部検出部の具体例を示している。
まず、図4に示す定常部検出部について説明すると、入力端子20にはディジタル化された音声信号が入力される。入力された音声信号は、まず例えば1/3オクターブ帯域の複数(N)個の帯域通過フィルタ(BPF)21−1〜21−Nからなるフィルタバンクによって、N個の帯域に分割される。分割されたN個の各帯域の音声信号は時間包絡抽出部22−1〜22−Nに入力され、時間包絡が抽出される。抽出された時間包絡は、低域通過フィルタ(LPF)23−1〜23−Nにより平滑化され、さらにこの後の処理を容易にするためダウンサンプラ24−1〜24−Nによって1/Mにダウンサンプリングされる。ダウンサンプリング比は、例えばM=160に設定される。
(1)帯域通過フィルタ21−1〜21−Nからなるフィルタバンクを省略し、これに伴い時間包絡抽出部、低域通過フィルタ、ダウンサンプラ、対数計算部及び回帰係数計算部についてはそれぞれ1個とする。すなわち、フィルタバンクによる帯域分割を行わず、全帯域について時間包絡抽出から回帰係数計算までの処理を行う。
(2)フィルタバンクによる帯域分割を行うが、時間包絡抽出部、低域通過フィルタ、ダウンサンプラ、対数計算部及び回帰係数計算部についてはそれぞれ1個とする。
(3)上記(2)の変形で、時間包絡抽出部については各帯域毎に設ける。
(4)上記(2)の変形で、回帰係数計算部については各帯域毎に設ける。
(5)図4では回帰係数の2乗平均を求めたが、これに限られるものではなく、他の方法で回帰係数を平均してもよい。
図9は、本発明に関連する技術に係る音声信号処理装置であり、入力端子41に入力される音声信号は、時間軸伸長部42によって時間軸が伸長された後、定常部検出部43と乗算器45の一方の入力端子に入力される。定常部検出部43は、例えば図4あるいは図5に示した通りである。図4または図5の出力端子30から出力される定常部検出信号は、定常部抑圧関数計算部44に入力される。定常部抑圧関数計算部44では、例えば定常部抑圧検出信号の“1”(定常部)に対応してα(0≦α<1)をとり、定常部抑圧検出信号の“0”(非定常部)に対応して1をとるような二値信号からなる関数(定常部抑圧関数という)の信号を発生する。なお、図9中に示した例ではα=0.4としているが、0≦α<1の値であれば何でもよい。この定常部抑圧関数の信号は、乗算器45の他方の入力端子に入力される。乗算器45では、時間軸伸長部42から出力される音声信号に定常部抑圧関数の信号を乗じることにより、定常部の振幅を抑圧した音声信号を出力端子46へ出力する。
12・・・定常部検出部
13・・・零系列挿入部
14・・・母音長測定部
15・・・零系列長設定部
16・・・音声信号出力端子
20・・・音声信号入力端子
21−1〜21−N・・・帯域通過フィルタ
22−1〜22−N・・・時間包絡抽出部
23−1〜23−N・・・低域通過フィルタ
24−1〜24−N・・・ダウンサンプラ
25−1〜25−N・・・対数計算部
26−1〜26−N・・・回帰係数計算部
27・・・2乗平均計算部
28・・・アップサンプラ
29・・・閾値処理部
30・・・定常部検出信号出力端子
31・・・窓掛け処理部
32・・・高速フーリエ変換部
33・・・対数スペクトル計算部
34・・・逆高速フーリエ変換部
35−1〜35−N・・・回帰係数計算部
36・・・2乗平均計算部
37・・・閾値処理部
41・・・音声信号入力端子
42・・・時間軸伸長部
43・・・定常部検出部
44・・・定常部抑圧関数計算部
45・・・乗算器
46・・・音声信号出力端子
Claims (8)
- 入力される音声信号に対してスピーカから音声が出力される前に処理を施す音声信号処理方法において、
前記音声信号の母音部に存在する定常部を検出するステップと、
前記検出された母音部の定常部内に、母音長又は定常部長に応じてその長さが短い場合には時間長が短く、長さが長い場合には時間長が長くなるように設定された零系列を挿入するステップと
を具備することを特徴とする音声信号処理方法。 - 入力される音声信号に対してスピーカから音声が出力される前に処理を施す音声信号処理装置において、
前記音声信号の母音部に存在する定常部を検出する定常部検出部と、
前記検出された母音部の定常部内に、母音長又は定常部長に応じてその長さが短い場合には時間長が短く、長さが長い場合には時間長が長くなるように設定された零系列を挿入する零系列挿入部と
を具備することを特徴とする音声信号処理装置。 - 前記音声信号の母音部の時間長を測定する母音長測定部と、
前記測定された母音部の時間長に比例するように前記零系列の時間長を変化させて設定する母音長設定部と
をさらに具備することを特徴とする請求項2記載の音声信号処理装置。 - 前記定常部検出部は、前記入力される音声信号から時間包絡を抽出する時間包絡抽出部と、前記時間包絡の対数の各時間サンプルについて当該時間サンプルを含む前後複数の時間サンプルの値から回帰係数を計算する回帰係数計算部と、前記回帰係数の平均を計算する平均計算部と、前記平均について閾値処理を行うことにより前記母音部に存在する定常部を求める閾値処理部とを有することを特徴とする請求項2記載の音声信号処理装置。
- 前記定常部検出部は、前記入力される音声信号から時間包絡を抽出する時間包絡抽出部と、前記時間包絡を平滑化する平滑フィルタと、平滑化された時間包絡をダウンサンプリングするダウンサンプラと、ダウンサンプリングされた時間包絡の対数を計算する対数計算部と、前記対数の各時間サンプルについて当該時間サンプルを含む前後複数の時間サンプルの値から回帰係数を計算する回帰係数計算部と、前記回帰係数の平均を計算する平均計算部と、前記平均をアップサンプリングするアップサンプラと、アップサンプリングされた平均について閾値処理を行うことにより前記母音部に存在する定常部を求める閾値処理部とを有することを特徴とする請求項2記載の音声信号処理装置。
- 前記定常部検出部は、前記入力される音声信号を複数の帯域に分割するフィルタバンクをさらに含み、前記時間包絡抽出部は分割された各帯域の音声信号から時間包絡を抽出する請求項4または5のいずれか1項記載の音声信号処理装置。
- 前記定常部検出部は、前記入力される音声信号に対して窓掛け処理を行って該音声信号を複数のフレームに分割する窓掛け処理部と、分割された各フレームの音声信号にフーリエ変換を施すフーリエ変換部と、前記フーリエ変換部からの出力信号に基づき対数スペクトルを計算する対数スペクトル計算部と、前記対数スペクトルに対して逆フーリエ変換を施すことによりケプストラム係数を生成するケプストラム係数計算部と、前記ケプストラム係数を時間方向に見た場合の回帰係数を計算する回帰係数計算部と、前記回帰係数の平均を計算する平均計算部と、前記平均について閾値処理を行うことにより前記音声信号の母音部に存在する定常部を求める閾値処理部とを有することを特徴とする請求項2記載の音声信号処理装置。
- 入力された音声信号に対してスピーカから音声が出力される前に施すべき音声信号処理をコンピュータに行わせるプログラムであって、
前記音声信号の母音部に存在する定常部を検出する処理と、この検出された定常部内に、母音長又は定常部長に応じてその長さが短い場合には時間長が短く、長さが長い場合には時間長が長くなるように設定された零系列を挿入する処理とを含む音声信号処理をコンピュータに行わせる音声信号処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005251233A JP4774255B2 (ja) | 2005-08-31 | 2005-08-31 | 音声信号処理方法、装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005251233A JP4774255B2 (ja) | 2005-08-31 | 2005-08-31 | 音声信号処理方法、装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007065285A JP2007065285A (ja) | 2007-03-15 |
JP4774255B2 true JP4774255B2 (ja) | 2011-09-14 |
Family
ID=37927568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005251233A Active JP4774255B2 (ja) | 2005-08-31 | 2005-08-31 | 音声信号処理方法、装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4774255B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5330183B2 (ja) * | 2009-10-05 | 2013-10-30 | パナソニック株式会社 | パケット挿入削除方法及び通話システム |
JP5596618B2 (ja) * | 2011-05-17 | 2014-09-24 | 日本電信電話株式会社 | 擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム |
JP6032832B2 (ja) * | 2012-03-09 | 2016-11-30 | 学校法人千葉工業大学 | 音声合成装置 |
GB2549103B (en) * | 2016-04-04 | 2021-05-05 | Toshiba Res Europe Limited | A speech processing system and speech processing method |
GB2551499B (en) * | 2016-06-17 | 2021-05-12 | Toshiba Kk | A speech processing system and speech processing method |
CN114299977B (zh) * | 2021-11-30 | 2022-11-25 | 北京百度网讯科技有限公司 | 混响语音的处理方法、装置、电子设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5879400A (ja) * | 1981-11-06 | 1983-05-13 | Gen Eng:Kk | 補聴器 |
JPH1097267A (ja) * | 1996-09-24 | 1998-04-14 | Hitachi Ltd | 声質変換方法および装置 |
JP2005202335A (ja) * | 2004-01-19 | 2005-07-28 | Takayuki Arai | 音声処理方法と装置及びプログラム |
-
2005
- 2005-08-31 JP JP2005251233A patent/JP4774255B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007065285A (ja) | 2007-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8611554B2 (en) | Hearing assistance apparatus | |
EP2064699B1 (en) | Method and apparatus for extracting and changing the reverberant content of an input signal | |
Moore | Temporal integration and context effects in hearing | |
Kokkinakis et al. | A channel-selection criterion for suppressing reverberation in cochlear implants | |
Stone et al. | Quantifying the effects of fast-acting compression on the envelope of speech | |
Kim et al. | Nonlinear enhancement of onset for robust speech recognition. | |
EP2984650B1 (en) | Audio data dereverberation | |
JP4774255B2 (ja) | 音声信号処理方法、装置及びプログラム | |
Yoo et al. | Speech signal modification to increase intelligibility in noisy environments | |
US10176824B2 (en) | Method and system for consonant-vowel ratio modification for improving speech perception | |
Li et al. | The contribution of obstruent consonants and acoustic landmarks to speech recognition in noise | |
Kusumoto et al. | Modulation enhancement of speech by a pre-processing algorithm for improving intelligibility in reverberant environments | |
JP2010091897A (ja) | 音声信号強調装置 | |
Tsilfidis et al. | Blind single-channel suppression of late reverberation based on perceptual reverberation modeling | |
Desloge et al. | Masking release for hearing-impaired listeners: The effect of increased audibility through reduction of amplitude variability | |
JP3411648B2 (ja) | 車載用オーディオ装置 | |
Li et al. | Factors affecting masking release in cochlear-implant vocoded speech | |
JP2001100774A (ja) | 音声処理装置 | |
JP2008102551A (ja) | 音声信号の処理装置およびその処理方法 | |
RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке | |
Kociński et al. | Time-compressed speech intelligibility in different reverberant conditions | |
KR101682796B1 (ko) | 소음 환경에서 음절 형태 기반 음소 가중 기법을 이용한 음성의 명료도 향상 방법 및 이를 기록한 기록매체 | |
JP3303446B2 (ja) | 音声信号処理装置 | |
EP2063420A1 (en) | Method and assembly to enhance the intelligibility of speech | |
JP2005202335A (ja) | 音声処理方法と装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110614 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110627 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140701 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4774255 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140701 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140701 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |