JP2012242468A - 擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム - Google Patents
擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム Download PDFInfo
- Publication number
- JP2012242468A JP2012242468A JP2011110142A JP2011110142A JP2012242468A JP 2012242468 A JP2012242468 A JP 2012242468A JP 2011110142 A JP2011110142 A JP 2011110142A JP 2011110142 A JP2011110142 A JP 2011110142A JP 2012242468 A JP2012242468 A JP 2012242468A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- gain
- signal
- pseudo
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】周波数変換部は、離散値化された狭帯域音声・音響信号を、一定時間ごとに区切られたフレームごとに周波数領域の低域領域の信号に変換する。高域信号生成部は、低域領域の信号の全部または一部を複写して高域領域の信号を生成する。自己相関係数計算部は、狭帯域音声・音響信号の自己相関係数を所定の複数の次数についてフレームごとに計算する。ゲイン決定部は、低域領域内の2つの異なる周波数範囲の信号のパワーまたは振幅の絶対値和の大小関係と自己相関係数とからゲイン係数を決定する。ゲイン乗算部は、高域領域の信号にゲイン係数を乗じて強調高域信号を生成する。結合部は、低域領域の信号と強調高域信号とを合わせて擬似広帯域周波数信号を生成する。周波数逆変換部は、擬似広帯域周波数信号を時間領域の擬似広帯域音声信号に変換する。
【選択図】図1
Description
SH(k)=SL(k) 1≦k≦D (1)
または
−1≦ci(1)≦1 (6)
である(ただし、自己相関係数やパワーの計算方法により、下限が−1より小さくなる場合や、上限が1よりも大きくなる場合もあるが、およそプラスマイナス1の範囲であると考えてよい)。また、ci(1)が負のときは、図7(a)に示すようにスペクトルが「高域上がり」すなわち、およそ実施例1におけるQ1<Q2のときに相当するスペクトル形状である。ci(1)が正のときは、図7(b)に示すようにスペクトルが「高域下がり」すなわち、およそ実施例1におけるQ1>Q2のときに相当するスペクトル形状である。ここでは一例として、
r=ci(1)+1 (7)
とし、
0≦r≦2 (8)
とする。スペクトルの傾きを表すパラメータrはゲイン係数計算手段242に送られる。
ゲイン係数計算手段342の詳細動作例を、図10を用いて説明する。ゲイン係数計算手段342は、内部にFの時系列を保持するメモリを持つ。定常/非定常判定結果Fsが定常区間であることを示し、現フレームのフラグがF=1、前フレームのフラグがF=1であるときには、ゲイン係数gとして、あらかじめ決められたゲイン係数g1を出力する。定常/非定常判定結果Fsが定常区間であることを示し、現フレームのフラグがF=0、前フレームのフラグがF=0であるときには、スペクトルの傾きを表すパラメータrに応じたゲイン値を出力する。一例として、以下の式(10)のように、ゲイン値の上下限を設けたうえで、rが大きいほどゲイン値が小さく、rが小さいほどゲイン値が大きくなるようにする。
図18(a)、(b)に、中域ゲイン決定部510の動作例として、ゲイン係数gから中域ゲインGM(k)を決める規則例を示す。図18(a)はg>1のときの例であり、式で書くと、
GM(k)=1 0≦k≦4(kHz)のとき
とする。
Claims (15)
- 離散値化された狭帯域音声・音響信号を、一定時間ごとに区切られたフレームごとに周波数領域の低域領域の信号に変換する周波数変換部と、
前記低域領域の信号の全部または一部を複写して高域領域の信号を生成する高域信号生成部と、
前記狭帯域音声・音響信号の自己相関係数を、所定の複数の次数について前記フレームごとに計算する自己相関係数計算部と、
前記低域領域内の2つの異なる周波数範囲の信号のパワーまたは振幅の絶対値和(以下、総称して「パワー」と呼ぶ。)の大小関係と前記自己相関係数とからゲイン係数を決定するゲイン決定部と、
前記高域領域の信号に前記ゲイン係数を乗じて強調高域信号を生成するゲイン乗算部と、
前記低域領域の信号と前記強調高域信号とを合わせて擬似広帯域周波数信号を生成する結合部と、
前記擬似広帯域周波数信号を時間領域の擬似広帯域音声信号に変換する周波数逆変換部と、
を備える擬似広帯域音声信号生成装置。 - 請求項1に記載の擬似広帯域音声信号生成装置において、
前記ゲイン決定部は、
一方の前記周波数範囲のパワーを計算する第1パワー計算手段と、
他方の前記周波数範囲のパワーを計算する第2パワー計算手段と、
前記第1パワー計算手段での計算結果と前記第2パワー計算手段での計算結果とからスペクトルの傾きを表すパラメータを計算する傾き計算手段と、
各次数の前記自己相関係数から音声のピッチ周期に対応する自己相関係数を特定するピッチ相関探索手段と、
前記ピッチ相関探索手段で特定された音声のピッチ周期に対応する自己相関係数の値をあらかじめ決められた閾値と比較し、比較結果をフラグ値としてセットするピッチ相関判定手段と、
前記フラグ値と前記パラメータとの組み合わせに基づきゲイン係数を決定するゲイン係数計算手段と、
を備える擬似広帯域音声信号生成装置。 - 離散値化された狭帯域音声・音響信号を、一定時間ごとに区切られたフレームごとに周波数領域の低域領域の信号に変換する周波数変換部と、
前記低域領域の信号の全部または一部を複写して高域領域の信号を生成する高域信号生成部と、
前記狭帯域音声・音響信号の自己相関係数を、所定の複数の次数について前記フレームごとに計算する自己相関係数計算部と、
前記自己相関係数からゲイン係数を決定するゲイン決定部と、
前記高域領域の信号に前記ゲイン係数を乗じて強調高域信号を生成するゲイン乗算部と、
前記低域領域の信号と前記強調高域信号とを合わせて擬似広帯域周波数信号を生成する結合部と、
前記擬似広帯域周波数信号を時間領域の擬似広帯域音声信号に変換する周波数逆変換部と、
を備え、
前記ゲイン決定部は、
前記自己相関係数からスペクトルの傾きを表すパラメータを計算する傾き計算手段と、
各次数の前記自己相関係数から音声のピッチ周期に対応する自己相関係数を特定するピッチ相関探索手段と、
前記ピッチ相関探索手段で特定された音声のピッチ周期に対応する自己相関係数の値をあらかじめ決められた閾値と比較し、比較結果をフラグ値としてセットするピッチ相関判定手段と、
前記フラグ値と前記パラメータとの組み合わせに基づきゲイン係数を決定するゲイン係数計算手段と、
を備える
擬似広帯域音声信号生成装置。 - 請求項3に記載の擬似広帯域音声信号生成装置において、
前記ゲイン決定部は、フレームごとに、前記自己相関係数及び/又は前記狭帯域音声・音響信号のパワーに基づき、当該フレームが定常区間であるか非定常区間であるかを判定する定常/非定常判定手段を更に備え、
前記ゲイン係数計算手段は、前記フラグ値と前記パラメータと前記定常/非定常判定手段における判定結果との組み合わせに基づきゲイン係数を決定する
ことを特徴とする擬似広帯域音声信号生成装置。 - 請求項2乃至4のいずれかに記載の擬似広帯域音声信号生成装置において、
前記ゲイン乗算部と前記結合部との間に高域白色化部を更に備え、
前記高域白色化部は、前記強調高域信号に白色雑音またはガウス雑音を加算して前記結合部に与え、
加算する雑音量は、前記ゲイン係数または前記フラグ値を用いてコントロールする
ことを特徴とする擬似広帯域音声信号生成装置。 - 請求項2乃至4のいずれかに記載の擬似広帯域音声信号生成装置において、
前記周波数逆変換部の後段に高域白色化部を更に備え、
前記高域白色化部は、前記擬似広帯域音声信号に白色雑音またはガウス雑音を加算して出力し、
加算する雑音量は、前記ゲイン係数または前記フラグ値を用いてコントロールする
ことを特徴とする擬似広帯域音声信号生成装置。 - 請求項1乃至6のいずれかに記載の擬似広帯域音声信号生成装置において、
中域ゲイン決定部と中域ゲイン乗算部を更に備え、
前記中域ゲイン決定部は、前記ゲイン係数に基づき中域ゲインを決定し、
前記中域ゲイン乗算部は、前記周波数変換部と前記結合部との間に設けられ、前記低域領域の信号に前記中域ゲインを乗算して前記結合部に与える
ことを特徴とする擬似広帯域音声信号生成装置。 - 離散値化された狭帯域音声・音響信号を、一定時間ごとに区切られたフレームごとに周波数領域の低域領域の信号に変換する周波数変換ステップと、
前記低域領域の信号の全部または一部を複写して高域領域の信号を生成する高域信号生成ステップと、
前記狭帯域音声・音響信号の自己相関係数を、所定の複数の次数について前記フレームごとに計算する自己相関係数計算ステップと、
前記低域領域内の2つの異なる周波数範囲の信号のパワーまたは振幅の絶対値和(以下、総称して「パワー」と呼ぶ。)の大小関係と前記自己相関係数とからゲイン係数を決定するゲイン決定ステップと、
前記高域領域の信号に前記ゲイン係数を乗じて強調高域信号を生成するゲイン乗算ステップと、
前記低域領域の信号と前記強調高域信号とを合わせて擬似広帯域周波数信号を生成する結合ステップと、
前記擬似広帯域周波数信号を時間領域の擬似広帯域音声信号に変換する周波数逆変換ステップと、
を実行する擬似広帯域音声信号生成方法。 - 請求項8に記載の擬似広帯域音声信号生成方法において、
前記ゲイン決定ステップは、
一方の前記周波数範囲のパワーを計算する第1パワー計算サブステップと、
他方の前記周波数範囲のパワーを計算する第2パワー計算サブステップと、
前記第1パワー計算サブステップでの計算結果と前記第2パワー計算サブステップでの計算結果とからスペクトルの傾きを表すパラメータを計算する傾き計算サブステップと、
各次数の前記自己相関係数から音声のピッチ周期に対応する自己相関係数を特定するピッチ相関探索サブステップと、
前記ピッチ相関探索サブステップで特定された音声のピッチ周期に対応する自己相関係数の値をあらかじめ決められた閾値と比較し、比較結果をフラグ値としてセットするピッチ相関判定サブステップと、
前記フラグ値と前記パラメータとの組み合わせに基づきゲイン係数を決定するゲイン係数計算サブステップと、
を実行する擬似広帯域音声信号生成方法。 - 離散値化された狭帯域音声・音響信号を、一定時間ごとに区切られたフレームごとに周波数領域の低域領域の信号に変換する周波数変換ステップと、
前記低域領域の信号の全部または一部を複写して高域領域の信号を生成する高域信号生成ステップと、
前記狭帯域音声・音響信号の自己相関係数を、所定の複数の次数について前記フレームごとに計算する自己相関係数計算ステップと、
前記自己相関係数からゲイン係数を決定するゲイン決定ステップと、
前記高域領域の信号に前記ゲイン係数を乗じて強調高域信号を生成するゲイン乗算ステップと、
前記低域領域の信号と前記強調高域信号とを合わせて擬似広帯域周波数信号を生成する結合ステップと、
前記擬似広帯域周波数信号を時間領域の擬似広帯域音声信号に変換する周波数逆変換ステップと、
を実行し、
前記ゲイン決定ステップは、
前記自己相関係数からスペクトルの傾きを表すパラメータを計算する傾き計算サブステップと、
各次数の前記自己相関係数から音声のピッチ周期に対応する自己相関係数を特定するピッチ相関探索サブステップと、
前記ピッチ相関探索サブステップで特定された音声のピッチ周期に対応する自己相関係数の値をあらかじめ決められた閾値と比較し、比較結果をフラグ値としてセットするピッチ相関判定サブステップと、
前記フラグ値と前記パラメータとの組み合わせに基づきゲイン係数を決定するゲイン係数計算サブステップと、
を実行する
擬似広帯域音声信号生成方法。 - 請求項10に記載の擬似広帯域音声信号生成方法において、
前記ゲイン決定ステップは、フレームごとに、前記自己相関係数及び/又は前記狭帯域音声・音響信号のパワーに基づき、当該フレームが定常区間であるか非定常区間であるかを判定する定常/非定常判定サブステップを更に実行し、
前記ゲイン係数計算サブステップは、前記フラグ値と前記パラメータと前記定常/非定常判定サブステップにおける判定結果との組み合わせに基づきゲイン係数を決定する
ことを特徴とする擬似広帯域音声信号生成方法。 - 請求項9乃至11のいずれかに記載の擬似広帯域音声信号生成方法において、
前記ゲイン乗算ステップと前記結合ステップとの間に高域白色化ステップを更に実行し、
前記高域白色化ステップは、前記強調高域信号に白色雑音またはガウス雑音を加算して前記結合ステップに与え、
加算する雑音量は、前記ゲイン係数または前記フラグ値を用いてコントロールする
ことを特徴とする擬似広帯域音声信号生成方法。 - 請求項9乃至11のいずれかに記載の擬似広帯域音声信号生成方法において、
前記周波数逆変換ステップの後に高域白色化ステップを更に実行し、
前記高域白色化ステップは、前記擬似広帯域音声信号に白色雑音またはガウス雑音を加算して出力し、
加算する雑音量は、前記ゲイン係数または前記フラグ値を用いてコントロールする
ことを特徴とする擬似広帯域音声信号生成方法。 - 請求項8乃至13のいずれかに記載の擬似広帯域音声信号生成方法において、
中域ゲイン決定ステップと中域ゲイン乗算ステップを更に実行し、
前記中域ゲイン決定ステップは、前記ゲイン係数に基づき中域ゲインを決定し、
前記中域ゲイン乗算ステップは、前記周波数変換ステップと前記結合ステップとの間で実行され、前記低域領域の信号に前記中域ゲインを乗算して前記結合ステップに与える
ことを特徴とする擬似広帯域音声信号生成方法。 - 請求項1乃至7のいずれかに記載の擬似広帯域音声信号生成装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011110142A JP5596618B2 (ja) | 2011-05-17 | 2011-05-17 | 擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011110142A JP5596618B2 (ja) | 2011-05-17 | 2011-05-17 | 擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012242468A true JP2012242468A (ja) | 2012-12-10 |
JP5596618B2 JP5596618B2 (ja) | 2014-09-24 |
Family
ID=47464272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011110142A Active JP5596618B2 (ja) | 2011-05-17 | 2011-05-17 | 擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5596618B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014167557A (ja) * | 2013-02-28 | 2014-09-11 | Oki Electric Ind Co Ltd | 音声帯域拡張装置及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003044098A (ja) * | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
JP2004512562A (ja) * | 2000-10-18 | 2004-04-22 | ノキア コーポレーション | 広帯域音声コーデック復号器における高周波拡張階層符号化 |
JP2007065285A (ja) * | 2005-08-31 | 2007-03-15 | Takayuki Arai | 音声信号処理方法、装置及びプログラム |
JP2009134260A (ja) * | 2007-10-30 | 2009-06-18 | Nippon Telegr & Teleph Corp <Ntt> | 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体 |
-
2011
- 2011-05-17 JP JP2011110142A patent/JP5596618B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004512562A (ja) * | 2000-10-18 | 2004-04-22 | ノキア コーポレーション | 広帯域音声コーデック復号器における高周波拡張階層符号化 |
JP2003044098A (ja) * | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
JP2007065285A (ja) * | 2005-08-31 | 2007-03-15 | Takayuki Arai | 音声信号処理方法、装置及びプログラム |
JP2009134260A (ja) * | 2007-10-30 | 2009-06-18 | Nippon Telegr & Teleph Corp <Ntt> | 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014167557A (ja) * | 2013-02-28 | 2014-09-11 | Oki Electric Ind Co Ltd | 音声帯域拡張装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5596618B2 (ja) | 2014-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2552184C2 (ru) | Устройство для расширения полосы частот | |
EP2491558B1 (en) | Determining an upperband signal from a narrowband signal | |
JP4520732B2 (ja) | 雑音低減装置、および低減方法 | |
US10141008B1 (en) | Real-time voice masking in a computer network | |
JP2013517531A (ja) | ノイズ抑制システムのための歪み測定 | |
CN111508519B (zh) | 一种音频信号人声增强的方法及装置 | |
CN110875049B (zh) | 语音信号的处理方法及装置 | |
JP2011501206A (ja) | オーディオ送信システムの音声理解度測定方法およびシステム | |
RU2625945C2 (ru) | Устройство и способ для генерирования сигнала с улучшенным спектром, используя операцию ограничения энергии | |
JP4738213B2 (ja) | 利得調整方法及び利得調整装置 | |
CN105144290B (zh) | 信号处理装置、信号处理方法和信号处理程序 | |
CN111739544A (zh) | 语音处理方法、装置、电子设备及存储介质 | |
KR20050049103A (ko) | 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치 | |
CN117219102A (zh) | 一种基于听觉感知的低复杂度语音增强方法 | |
JP5596618B2 (ja) | 擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム | |
JP2012208177A (ja) | 帯域拡張装置及び音声補正装置 | |
CN111477246B (zh) | 语音处理方法、装置及智能终端 | |
JP5609157B2 (ja) | 係数設定装置および雑音抑圧装置 | |
US10482893B2 (en) | Sound processing method and sound processing apparatus | |
JP2007310298A (ja) | 帯域外信号生成装置及び周波数帯域拡張装置 | |
CN111326166B (zh) | 语音处理方法及装置、计算机可读存储介质、电子设备 | |
JP5458057B2 (ja) | 信号広帯域化装置、信号広帯域化方法、及びそのプログラム | |
Li et al. | A near-end listening enhancement system by RNN-based noise cancellation and speech modification | |
JP6065488B2 (ja) | 帯域拡張装置及び方法 | |
CN112908351A (zh) | 一种音频变调方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130718 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140306 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140729 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140807 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5596618 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |