WO2007037359A1 - 音声符号化装置および音声符号化方法 - Google Patents
音声符号化装置および音声符号化方法 Download PDFInfo
- Publication number
- WO2007037359A1 WO2007037359A1 PCT/JP2006/319435 JP2006319435W WO2007037359A1 WO 2007037359 A1 WO2007037359 A1 WO 2007037359A1 JP 2006319435 W JP2006319435 W JP 2006319435W WO 2007037359 A1 WO2007037359 A1 WO 2007037359A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- spectrum
- speech
- adaptive codebook
- signal
- masking threshold
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
符号化レートを削減しつつ、再生音声信号の品質劣化を防止することができる音声符号化装置等を開示する。この装置の音声信号変更部(101)において、マスキング閾値算出部(114)は、入力音声信号のスペクトルS(f)のマスキング閾値M(f)を算出する。ACB音源モデルスペクトル算出部(117)は、適応符号帳音源モデルスペクトルSACB(f)を算出する。入力スペクトル変形処理部(112)は、マスキング閾値M(f)およびLPCスペクトル包絡を付与された適応符号帳音源モデルスペクトルS'ACB(f)の双方の値を参照し、スペクトルS(f)に対し、後段のCELP符号化部(102)に適合するようなスペクトルに変形する前処理を施す。この装置のCELP符号化部(102)は、前処理後の音声信号に対しCELP方式の符号化を施し、符号化パラメータを出力する。
Description
音声符号化装置および音声符号化方法
技術分野
[0001] 本発明は、 CELP (Code-Excited Linear Prediction)方式を採用した音声符号化装 置および音声符号化方法に関する。
背景技術
[0002] 音声信号またはオーディオ信号を低ビットレートで圧縮する符号化技術は、移動体 通信システムリソースの有効活用のために重要である。音声信号の符号化方式に、 I
Sector)で規格化されている G726、 G729等の方式がある。これらの方式は、狭帯 域信号(300Hz〜3. 4kHz)を対象とし、 8kbitZs〜32kbitZsのビットレートで音 声信号を高品質に符号ィ匕することができる。また、広帯域信号 (50Hz〜7kHz)の符 号化方式として、 ITU— Tの G722、 G722. 1や、 3GPP (The 3rd Generation Partn ership Project)の AMR— WB等が存在する。これらの方式は、 6. 6kbitZs〜64kbi tZsのビットレートで広帯域の音声信号を高品質に符号ィ匕することができる。
[0003] また、音声信号を低ビットレートで高能率に符号ィ匕する方式に CELP符号化がある 。 CELP符号化は、人間の音声生成モデルを工学的に模擬したモデルに基づき、乱 数やパルス列で表される励振信号を周期性の強さに対応するピッチフィルタと声道 特性に対応する合成フィルタとに通し、その出力信号と入力信号との二乗誤差が聴 覚特性の重み付けの下で最小になるように符号ィ匕パラメータを決定する方式である。 最近の標準音声符号化方式の多くが CELP符号化に基づいており、例えば、 G729 は 8kbitZsのビットレートで狭帯域信号の符号化をすることができ、 AMR— WBは 6 . 6kbitZs〜23. 85kbitZsのビットレートで広帯域信号を符号化することができる。
[0004] CELP符号ィ匕を用いて低ビットレートで高品質に符号ィ匕を行う技術として、予め聴 感マスキング閾値を計算し、聴感重み付けを行う際に、この閾値をも考慮して符号ィ匕 を行う技術がある (例えば、特許文献 1参照)。聴感マスキングとは、周波数軸上で、 ある信号の近傍に位置する信号が聞こえなくなる(マスクされる)という人間の聴感特
性を利用した技術である。聴感マスキング閾値よりも振幅が小さ 、スペクトルは人間 の聴感に知覚されないため、このスペクトルを符号ィ匕対象から除外しても人間に聴感 的な歪みが知覚されることはほとんどない。よって、音質劣化をある程度抑えつつ符 号ィ匕レートを削減することができる。
特許文献 1 :特開平 7— 160295号公報 (要約)
発明の開示
発明が解決しょうとする課題
[0005] しかしながら、上記技術において、聴感重み付きフィルタのフィルタ係数は、マスキ ング閾値を考慮することによって振幅方向には高精度になるものの、フィルタの次数 そのものは変わっていないので、フィルタ係数の周波数軸方向の精度は変わらない 。すなわち、上記技術では、聴感重み付きフィルタのフィルタ係数の精度が不充分で あるために、再生音声信号の品質が劣化するという問題がある。
[0006] 本発明の目的は、聴感マスキング技術等を利用して符号レートの削減を図っても、 再生音声信号の品質劣化を防止することができる音声符号化装置および音声符号 化方法を提供することである。
課題を解決するための手段
[0007] 本発明の音声符号化装置は、音声信号に対して CELP方式の符号化を行う符号 化手段と、前記符号化手段の前段に設けられ、前記 CELP方式の符号化により適合 するように、前記音声信号に対し周波数領域にお!、て前処理を施す前処理手段と、 を具備する構成を採る。
[0008] また、前記前処理手段は、前記音声信号を周波数領域変換して前記音声信号の スペクトルを求める変換手段と、前記音声信号に基づ!、て適応符号帳モデルスぺク トルを生成する生成手段と、前記音声信号のスペクトルと前記適応符号帳モデルス ベクトルとを比較し、前記音声信号のスペクトルが前記適応符号帳モデルスペクトル に類似するように、前記音声信号のスペクトルを変形する変形手段と、変形されたス ベクトルを逆周波数領域変換して時間領域信号に戻す逆変換手段と、を具備する構 成を採る。
発明の効果
[0009] 本発明によれば、符号化レートを削減しつつ、再生音声信号の品質劣化を防止す ることがでさる。
図面の簡単な説明
[0010] [図 1]実施の形態 1に係る音声符号化装置の主要な構成を示すブロック図
[図 2]実施の形態 1に係る CELP符号ィ匕部内部の主要な構成を示すブロック図
[図 3]入力音声のスペクトルとマスキング閾値との関係を模式的に示した図
[図 4]変形後の入力音声スペクトルの例を示す図
[図 5]変形後の入力音声スペクトルの例を示す図
[図 6]実施の形態 2に係る音声符号ィ匕装置の主要な構成を示すブロック図
[図 7]実施の形態 2に係る CELP符号ィ匕部内部の主要な構成を示すブロック図 発明を実施するための最良の形態
[0011] 以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
[0012] (実施の形態 1)
図 1は、本発明の実施の形態 1に係る音声符号化装置の主要な構成を示すブロッ ク図である。
[0013] 本実施の形態に係る音声符号化装置は、主に音声信号変更部 101と CELP符号 化部 102とからなり、音声信号変更部 101は、入力音声信号に対し、周波数領域に おいて下記の前処理を施し、 CELP符号ィ匕部 102は、前処理後の音声信号に対し C ELP方式の符号化を施し、 CELP符号化パラメータを出力する。
[0014] まず、音声信号変更部 101について説明する。
[0015] 音声信号変更部 101は、 FFT部 111、入力スペクトル変形処理部 112、 IFFT部 1 13、マスキング閾値算出部 114、スペクトル包絡付与部 115、ラグ抽出部 116、 ACB 音源モデルスペクトル算出部 117、および LPC分析部 118を備え、各部は以下の動 作を行う。
[0016] FFT部 111は、入力音声信号に対して、符号化フレーム周期で周波数領域変換、 具体的には高速フーリエ変換 (FFT)を施し、周波数領域の信号 S (f)に変換し、入 力スペクトル変形処理部 112およびマスキング閾値算出部 114に出力する。
[0017] マスキング閾値算出部 114は、 FFT部 111から出力される周波数領域の信号、す なわち入力音声信号のスペクトルから、マスキング閾値 M (f)の計算を行う。マスキン グ閾値の計算は、周波数帯域分割後の各帯域に対する音圧レベルを決定し、最小 可聴値を決定し、入力音声信号の純音成分および非純音成分を検出し、意味のある マスカ一(聴、感マスキングの主体のこと)だけを得るためにマスカ一を間引きし、個々 のマスキング閾値および全体のマスキング閾値を計算し、個々の分割帯域の最小マ スキング閾値を決定する処理によって行われる。
[0018] ラグ抽出部 116は、 CELP符号ィ匕の適応符号帳 (以下 ACBと略すことがある)を備 え、入力音声信号 (入力スペクトル変形処理部 112に入力される前の音声信号)に対 し、適応符号帳探索を行うことにより適応符号帳ラグ Tを抽出し、 ACB音源モデルス ベクトル算出部 117に出力する。この適応符号帳ラグ Tは、 ACB音源モデルスぺタト ルの算出に必要なものである。なお、入力音声信号に対するオープンループでのピ ツチ分析によりピッチ周期を求め、これを Tとしても良い。
[0019] ACB音源モデルスペクトル算出部 117は、ラグ抽出部 116から出力される適応符 号帳ラグ Tを用いて、以下の式(1)を用いて、 ACB音源モデルスペクトル (調波構造 スペクトル (f)を算出し、スペクトル包絡付与部 115に出力する。
ACB
1/ (1 -ζ"τ) - (1)
[0020] LPC分析部 118は、入力音声信号の LPC分析 (線形予測分析)を行い、得られる
LPCパラメータをスペクトル包絡付与部 115に出力する。
[0021] スペクトル包絡付与部 115は、 LPC分析部 118から出力される LPCパラメータを用
V、て、 ACB音源モデルスペクトル S (f)に対し、 LPCスペクトル包絡を付与する。 L
ACB
PCスペクトル包絡を付与された ACB音源モデルスペクトル S' (f)は、入カスペタト
ACB
ル変形処理部 112に出力される。
[0022] 入力スペクトル変形処理部 112は、 FFT部 111から出力される入力音声のスぺタト ル (入力スペクトル)に対し、フレーム毎に所定の変形処理を施し、変形後のスぺタト ル S' (f)を IFFT部 113に出力する。この変形処理は、入力スペクトルを後段の CEL P符号ィ匕部 102に適合するようなスペクトルに変形する処理であり、詳細については 後ほど図を交えて詳述する。
[0023] IFFT部 113は、入力スペクトル変形処理部 112から出力される変形処理後のスぺ タトル S' (f)に対し、逆周波数領域変換、具体的には逆高速フーリエ変換 (IFFT)を 施し、得られる時間領域信号 (変更後の入力音声)を CELP符号ィ匕部 102に出力す る。
[0024] 図 2は、 CELP符号ィ匕部 102内部の主要な構成を示すブロック図である。 CELP符 号ィ匕部 102の各部は以下の動作を行う。
[0025] LPC分析部 121は、 CELP符号ィ匕部 102の入力信号 (変更後の入力音声)に対し て線形予測分析を施し、 LPCパラメータを求める。 LPC量子化部 122は、 LPCパラメ ータを量子化し、得られる量子化 LPCパラメータを LPC合成フィルタ 123に出力する と共に、この量子化 LPCパラメータを示すインデックス Cを出力する。
し
[0026] 一方、適応符号帳 127は、歪み最小化部 126から指示された適応符号帳ラグに従 つて、記憶して 、る過去の駆動音源から 1サブフレーム分の音源ベクトルを生成する 。固定符号帳 128は、歪み最小化部 126からの指示に従い、予め記憶している所定 形状の固定符号帳ベクトルを出力する。ゲイン符号帳 129は、歪み最小化部 126か らの指示に従って、適応符号帳ゲインおよび固定符号帳ゲインを生成する。乗算器 1 30および乗算器 131は、適応符号帳ゲインおよび固定符号帳ゲインを、適応符号 帳 127および固定符号帳 128の出力にそれぞれ乗じる。加算器 132は、ゲイン乗算 後の適応符号帳 127および固定符号帳 128の出力を加算し、 LPC合成フィルタ 123 に出力する。
[0027] LPC合成フィルタ 123は、 LPC量子化部 122から出力される量子化 LPCパラメ一 タをフィルタ係数とし、加算器 132からの出力を駆動音源としたフィルタ関数を用いて 合成信号を生成する。
[0028] 加算器 124は、 CELP符号ィ匕部 102の入力信号 (変更後の入力音声)から上記合 成信号を減じ、符号ィ匕歪みを算出する。聴感重み付け部 125は、 LPC分析部 121か ら出力される LPCパラメータをフィルタ係数とする聴感重み付けフィルタを用いて、加 算器 124から出力される符号ィ匕歪みに対して聴感的な重み付けを施す。歪み最小 化部 126は、閉ループ制御(帰還制御)の符号帳探索により、符号化歪みが最小と なるような適応符号帳 127、固定符号帳 128、およびゲイン符号帳 129のインデック
ス c、 c、 cを求める。
A D G
[0029] 次いで、入力スペクトル変形処理部 112において行われる上記変形処理について 、図 3〜5を用いて、より詳細に説明する。
[0030] 図 3は、周波数領域の入力音声信号、すなわち入力音声のスペクトル S (f)とマスキ ング閾値 M(f)との関係を模式的に示した図である。この図において、入力音声のス ベクトル S (f)を実線で、マスキング閾値 M(f)を破線で示している。また、 LPCスぺク トル包絡を付与された ACB音源モデルスペクトル S' (f)を一点鎖線で示して!/、る
ACB
[0031] 入力スペクトル変形部 112は、マスキング閾値 M (f)および LPCスペクトル包絡を付 与された ACB音源モデルスペクトル S' (f)の双方の値を参照して、入力音声のス
ACB
ベクトル S (f)に対する変形処理を行う。
[0032] この変形処理は、入力音声のスペクトル S(f)と ACB音源モデルスペクトル S' (f)
ACB
との類似度が高まるように、入力音声のスペクトル S(f)を変形するものである。その際 、スペクトル S (f)と変更後のスペクトル S' (f)との間の誤差が、マスキング閾値 M (f) 以下となるようにする。
[0033] 上記の条件および変形処理を具体的に数式を用いて説明すると、変形後のスぺク トル S' (f)は以下のように表される。
S'(f)=S' (f) -{2)
ACB
(但し、 I s' (f)-s(f) I ≤M(f))
ACB
S'(f)=S(f) -(3)
(但し、 I S' (f)-S(f) I >M(f))
ACB
[0034] 図 4は、図 3に示した入力音声のスペクトルに対し、上記の変形処理を施した場合 の変形後の入力音声スペクトル S'(f)を示す図である。この図からわ力るように、上記 の変形処理は、換言すると、入力音声のスペクトル S(f)と ACB音源モデルスペクトル S' (f)との間の差分の絶対値がマスキング閾値 M (f)以下の場合は、入力音声の
ACB
スペクトル S (f)の振幅を S' (f)と一致するように伸展させる処理である。一方、入
ACB
力音声のスペクトル S (f)と ACB音源モデルスペクトル S' (f)との間の差分の絶対
ACB
値がマスキング閾値 M (f)を越える場合は、マスキング効果を期待することができな!/ヽ
ので、入力音声のスペクトル S (f)の振幅はそのまま維持する。
[0035] このように、本実施の形態によれば、入力音声信号に対して、 CELP符号ィ匕の音声 モデルに適合するような変形処理を人間の聴感特性を考慮して行う。より詳細には、 変更処理として、周波数領域変換を施して得られるスペクトルに基づ!、てマスキング 閾値を算出し、この処理と並行して、入力音声信号の適応符号帳ラグ (ピッチ周期) に基づいて適応符号帳モデルスペクトルの算出を行う。そして、これらの処理により 得られる値を基に入力音声のスペクトルを変形し、変形後のスペクトルを逆周波数領 域変換して時間領域信号に戻す。この時間領域信号が後段の CELP符号ィ匕の入力 信号となる。
[0036] これにより、 CELP符号ィ匕のビットレート、符号化精度、演算時間等の符号化効率を 向上させることができる。すなわち、符号ィ匕レートを削減しつつ再生音声信号の品質 劣化を防止することができる。
[0037] 特に、本実施の形態によれば、 CELP符号ィ匕に先立ち、入力音声信号から適応符 号帳モデルスペクトルを求め、このスペクトルと入力音声信号のスペクトルとを比較し て、入力音声信号が後段の CELP符号化、特に適応符号帳探索に適合するように、 周波数領域において入力音声信号に対し変形処理を施す。そして、変形処理後の スペクトルを CELP符号化の入力とする。
[0038] よって、周波数帯域にお!、て入力音声信号の変形処理を行って 、ることとなるので 、時間領域でこれを行うよりも分解能が高くなり精度も高くなる。また、聴感重み付きフ ィルタの次数よりも、より高精度で、人間の聴感特性に適応した変形処理を行うことが でき、 CELPの符号ィ匕効率をさらに高めることができる。
[0039] また、上記の変形処理においては、入力音声信号力 得られる聴感マスキング閾 値を考慮し、人間の聴感的に差のな!、範囲内での変形が施される。
[0040] これにより、適応符号帳探索後の符号化歪みを抑えることができ、固定符号帳の駆 動音源によってより精密な符号ィ匕を行うことが可能となり、符号ィ匕効率を向上させるこ とができる。すなわち、上記の変更処理を施しても、再生音声信号の品質は劣化しな い。
[0041] また、上記の変形処理は音声信号変更部 101で行われ、 CELP符号化とは独立し
た処理であるため、既存の CELP方式の音声符号ィ匕装置の構成を変更する必要が なぐ実装し易い。
[0042] なお、本実施の形態では、入力音声のスペクトルに対する変形処理の具体例として 、上記式(2)および(3)を用いる例を示したが、変形処理は以下の式 (4)〜(6)に従 つても良い。
S'(f)=S' (f) …(
ACB
(但し、 I s' (f)-s(f) I ≤M(f))
ACB
S'(f)=S(f)— M(f) -(5)
(但し、 | S, (f)-S(f) I >M(f)かつ S(f)≥S (f))
ACB ACB
S'(f)=S(f)+M(f) -(6)
(但し、 | S, (f)-S(f) I >M(f)かつ S(f)<S (f))
ACB ACB
[0043] 図 5は、図 3に示した入力音声のスペクトルに対し、上記の変形処理を施した場合 の変形後の入力音声スペクトル S'(f)を示す図である。式(3)の処理によれば、入力 音声のスペクトル S (f)と LPCスペクトル包絡を付与された ACB音源モデルスペクトル S' (f)との間の差分の絶対値がマスキング閾値 M (f)よりも大きな値となってマスキ
ACB
ング効果を期待できない場合は、入力音声のスペクトル S(f)に変更を加えな力つた。 しかし、式(5)および (6)によれば、スペクトルの振幅力もマスキング閾値を加算また は減算した結果は、マスキング効果が得られる範囲内の値となるので、この範囲内で 入力音声スペクトルを変形する。これにより、より詳細にスペクトルを変形することがで きる。
[0044] (実施の形態 2)
図 6は、本発明の実施の形態 2に係る音声符号化装置の主要な構成を示すブロッ ク図である。なお、実施の形態 1に示した音声符号ィ匕装置と同一の構成要素につい ては同一の符号を付し、その説明を省略する。
[0045] 本実施の形態に係る音声符号化装置において、ラグ抽出部 116から出力された適 応符号帳ラグ Tは、 CELP符号ィ匕部 102aへも出力される。この適応符号帳ラグ Tは、
CELP符号化部 102aにおける符号化処理に流用される。すなわち、 CELP符号ィ匕 部 102a自体は、適応符号帳ラグ Tを求める処理を行わな 、。
[0046] 図 7は、 CELP符号ィ匕部 102a内部の主要な構成を示すブロック図である。なお、実 施の形態 1に示した CELP符号ィ匕部 102と同一の構成要素については同一の符号 を付し、その説明を省略する。
[0047] CELP符号ィ匕部 102aにおいて、歪み最小化部 126aには、音声信号変更部 101a から適応符号帳ラグ Tが入力される。歪み最小化部 126aは、この適応符号帳ラグ T に基づいて、適応符号帳 127に記憶されている過去の駆動音源から 1サブフレーム 分の音源ベクトルを生成する。歪み最小化部 126a自体は、適応符号帳ラグ Tの算出 を行わない。
[0048] このように、本実施の形態によれば、音声信号変更部 101aで得られた適応符号帳 ラグ Tを CELP符号ィ匕部 102aにおける符号ィ匕処理にも流用する。よって、 CELP符 号ィ匕部 102aは適応符号帳ラグ Tを算出する必要はなぐ符号ィ匕処理の負担を軽減 することができる。
[0049] 以上、本発明の各実施の形態について説明した。
[0050] 本発明に係る音声符号化装置および音声符号化方法は、上記各実施の形態に限 定されず、種々変更して実施することが可能である。例えば、入力信号を音声信号と したが、オーディオ信号をも含む、より広帯域の信号であっても良い。
[0051] 本発明に係る音声符号ィ匕装置は、移動体通信システムにおける通信端末装置お よび基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有 する通信端末装置、基地局装置、および移動体通信システムを提供することができ る。
[0052] なお、ここでは、本発明をノヽードウエアで構成する場合を例にとって説明したが、本 発明をソフトウェアで実現することも可能である。例えば、本発明に係る音声符号ィ匕 方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記 憶しておいて情報処理手段によって実行させることにより、本発明に係る音声符号ィ匕 装置と同様の機能を実現することができる。
[0053] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路 である LSIとして実現される。これらは個別に 1チップ化されても良いし、一部または 全てを含むように 1チップィ匕されても良い。
[0054] また、ここでは LSIとした力 集積度の違いによって、 IC、システム LSI、スーパー L
SI、ウノレ卜ラ LSI等と呼称されることちある。
[0055] また、集積回路化の手法は LSIに限るものではなぐ専用回路または汎用プロセッ サで実現しても良い。 LSI製造後に、プログラム化することが可能な FPGA (Field Pro grammable Gate Array)や、 LSI内部の回路セルの接続もしくは設定を再構成可能な リコンフィギユラブル ·プロセッサを利用しても良 、。
[0056] さらに、半導体技術の進歩または派生する別技術により、 LSIに置き換わる集積回 路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行って も良い。バイオ技術の適応等が可能性としてあり得る。
[0057] 本明糸田書 ίま、 2005年 9月 30日出願の特願 2005— 286531に基づく。この内容【ま すべてここに含めておく。
産業上の利用可能性
[0058] 本発明に係る音声符号化装置および音声符号化方法は、移動体通信システムに おける通信端末装置、基地局装置等の用途に適用することができる。
Claims
[1] 音声信号に対して CELP方式の符号ィ匕を行う符号ィ匕手段と、
前記符号化手段の前段に設けられ、前記 CELP方式の符号化に、より適合するよう に、前記音声信号に対し周波数領域にお!、て前処理を施す前処理手段と、 を具備する音声符号化装置。
[2] 前記前処理手段は、
前記音声信号を周波数領域変換して前記音声信号のスペクトルを求める変換手段 と、
前記音声信号に基づいて適応符号帳モデルスペクトルを生成する生成手段と、 前記音声信号のスペクトルと前記適応符号帳モデルスペクトルとを比較し、前記音 声信号のスペクトルが前記適応符号帳モデルスペクトルに類似するように、前記音声 信号のスペクトルを変形し、変形後のスペクトルを得る変形手段と、
前記変形後のスペクトルを逆周波数領域変換して時間領域信号に戻す逆変換手 段と、
を具備する請求項 1記載の音声符号化装置。
[3] 前記音声信号のスぺ外ルのマスキング閾値を算出する算出手段をさらに具備し、 前記変形手段は、
前記マスキング閾値に基づ 、て、聴感的に差のな 、範囲内で前記音声信号のス ベクトルを変形し、変形後のスペクトルを得る、
請求項 2記載の音声符号化装置。
[4] 前記変形手段は、
前記音声信号のスペクトルと前記適応符号帳モデルスペクトルとの差の絶対値が 前記マスキング閾値以下である場合、前記適応符号帳モデルスペクトルを前記変形 後のスペクトルとし、
前記音声信号のスペクトルと前記適応符号帳モデルスペクトルとの差の絶対値が 前記マスキング閾値より大きい場合、前記音声信号のスペクトルを前記変形後のスぺ タトルとする、
請求項 3記載の音声符号化装置。
[5] 前記変形手段は、
前記音声信号のスペクトルと前記適応符号帳モデルスペクトルとの差の絶対値が 前記マスキング閾値以下である場合、前記適応符号帳モデルスペクトルを前記変形 後のスペクトルとし、
前記音声信号のスペクトルと前記適応符号帳モデルスペクトルとの差の絶対値が 前記マスキング閾値より大きぐかつ、前記音声信号のスペクトルが前記適応符号帳 モデルスペクトル以上である場合、前記音声信号のスペクトルと前記マスキング閾値 との差を前記変形後のスペクトルとし、
前記音声信号のスペクトルと前記適応符号帳モデルスペクトルとの差の絶対値が 前記マスキング閾値より大きぐかつ、前記音声信号のスペクトルが前記適応符号帳 モデルスペクトルより小さ 、場合、前記音声信号のスペクトルと前記マスキング閾値と の和を前記変形後のスペクトルとする、
請求項 3記載の音声符号化装置。
[6] 前記音声信号からピッチ周期を抽出する抽出手段と、
前記音声信号を LPC分析して LPCパラメータを得る分析手段と、
をさらに具備し、
前記生成手段は、
前記ピッチ周期および前記 LPCパラメータに基づいて前記適応符号帳モデルスぺ タトルを生成する、
請求項 2記載の音声符号化装置。
[7] 前記符号化手段は、
前記抽出手段で抽出されたピッチ周期を前記 CELP方式の符号化に用いる、 請求項 6記載の音声符号化装置。
[8] 請求項 1記載の音声符号化装置を具備する通信端末装置。
[9] 請求項 1記載の音声符号化装置を具備する基地局装置。
[10] 音声信号に対して CELP方式の符号化を行う符号化ステップと、
前記符号化ステップの前段で実行され、前記 CELP方式の符号化に、より適合す るように、前記音声信号に対し周波数領域にぉ 、て前処理を施す前処理ステップと、
を具備する音声符号化方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007537695A JPWO2007037359A1 (ja) | 2005-09-30 | 2006-09-29 | 音声符号化装置および音声符号化方法 |
US12/088,318 US20100153099A1 (en) | 2005-09-30 | 2006-09-29 | Speech encoding apparatus and speech encoding method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005286531 | 2005-09-30 | ||
JP2005-286531 | 2005-09-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2007037359A1 true WO2007037359A1 (ja) | 2007-04-05 |
Family
ID=37899780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2006/319435 WO2007037359A1 (ja) | 2005-09-30 | 2006-09-29 | 音声符号化装置および音声符号化方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20100153099A1 (ja) |
JP (1) | JPWO2007037359A1 (ja) |
WO (1) | WO2007037359A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2009004727A1 (ja) * | 2007-07-04 | 2010-08-26 | 富士通株式会社 | 符号化装置、符号化方法および符号化プログラム |
US9076440B2 (en) | 2008-02-19 | 2015-07-07 | Fujitsu Limited | Audio signal encoding device, method, and medium by correcting allowable error powers for a tonal frequency spectrum |
CN107210042A (zh) * | 2015-01-30 | 2017-09-26 | 日本电信电话株式会社 | 编码装置、解码装置、它们的方法、程序以及记录介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012144128A1 (ja) | 2011-04-20 | 2012-10-26 | パナソニック株式会社 | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08123490A (ja) * | 1994-10-24 | 1996-05-17 | Matsushita Electric Ind Co Ltd | スペクトル包絡量子化装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
JP3235703B2 (ja) * | 1995-03-10 | 2001-12-04 | 日本電信電話株式会社 | ディジタルフィルタのフィルタ係数決定方法 |
US5839098A (en) * | 1996-12-19 | 1998-11-17 | Lucent Technologies Inc. | Speech coder methods and systems |
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
US6937979B2 (en) * | 2000-09-15 | 2005-08-30 | Mindspeed Technologies, Inc. | Coding based on spectral content of a speech signal |
US20100042406A1 (en) * | 2002-03-04 | 2010-02-18 | James David Johnston | Audio signal processing using improved perceptual model |
DE602004027750D1 (de) * | 2003-10-23 | 2010-07-29 | Panasonic Corp | Spektrum-codierungseinrichtung, spektrum-decodierungseinrichtung, übertragungseinrichtung für akustische signale, empfangseinrichtung für akustische signale und verfahren dafür |
WO2006070751A1 (ja) * | 2004-12-27 | 2006-07-06 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
-
2006
- 2006-09-29 JP JP2007537695A patent/JPWO2007037359A1/ja active Pending
- 2006-09-29 WO PCT/JP2006/319435 patent/WO2007037359A1/ja active Application Filing
- 2006-09-29 US US12/088,318 patent/US20100153099A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08123490A (ja) * | 1994-10-24 | 1996-05-17 | Matsushita Electric Ind Co Ltd | スペクトル包絡量子化装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2009004727A1 (ja) * | 2007-07-04 | 2010-08-26 | 富士通株式会社 | 符号化装置、符号化方法および符号化プログラム |
US8244524B2 (en) | 2007-07-04 | 2012-08-14 | Fujitsu Limited | SBR encoder with spectrum power correction |
JP5071479B2 (ja) * | 2007-07-04 | 2012-11-14 | 富士通株式会社 | 符号化装置、符号化方法および符号化プログラム |
US9076440B2 (en) | 2008-02-19 | 2015-07-07 | Fujitsu Limited | Audio signal encoding device, method, and medium by correcting allowable error powers for a tonal frequency spectrum |
CN107210042A (zh) * | 2015-01-30 | 2017-09-26 | 日本电信电话株式会社 | 编码装置、解码装置、它们的方法、程序以及记录介质 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2007037359A1 (ja) | 2009-04-16 |
US20100153099A1 (en) | 2010-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3701527B1 (en) | Apparatus, method or computer program for generating a bandwidth-enhanced audio signal using a neural network processor | |
RU2389085C2 (ru) | Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx | |
US8364495B2 (en) | Voice encoding device, voice decoding device, and methods therefor | |
TWI480857B (zh) | 在不活動階段期間利用雜訊合成之音訊編解碼器 | |
JP3235703B2 (ja) | ディジタルフィルタのフィルタ係数決定方法 | |
RU2414010C2 (ru) | Трансформация шкалы времени кадров в широкополосном вокодере | |
EP1881487B1 (en) | Audio encoding apparatus and spectrum modifying method | |
EP2096631A1 (en) | Audio decoding device and power adjusting method | |
JP4679513B2 (ja) | 階層符号化装置および階層符号化方法 | |
US8909539B2 (en) | Method and device for extending bandwidth of speech signal | |
WO2007088853A1 (ja) | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 | |
KR101849613B1 (ko) | 스피치 관련 스펙트럼 정형 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념 | |
WO2007037359A1 (ja) | 音声符号化装置および音声符号化方法 | |
US20240127832A1 (en) | Decoder | |
JP6644848B2 (ja) | ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法 | |
EP2051244A1 (en) | Audio encoding device and audio encoding method | |
Li et al. | Basic audio compression techniques | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP2007513364A (ja) | デジタル音声符号器における高調波ノイズ重み付け | |
KR100624545B1 (ko) | 티티에스 시스템의 음성압축 및 합성방법 | |
Liang et al. | A new 1.2 kb/s speech coding algorithm and its real-time implementation on TMS320LC548 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application | ||
ENP | Entry into the national phase |
Ref document number: 2007537695 Country of ref document: JP Kind code of ref document: A |
|
WWE | Wipo information: entry into national phase |
Ref document number: 12088318 Country of ref document: US |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 06810841 Country of ref document: EP Kind code of ref document: A1 |