JP3566220B2 - 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 - Google Patents
音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 Download PDFInfo
- Publication number
- JP3566220B2 JP3566220B2 JP2001067631A JP2001067631A JP3566220B2 JP 3566220 B2 JP3566220 B2 JP 3566220B2 JP 2001067631 A JP2001067631 A JP 2001067631A JP 2001067631 A JP2001067631 A JP 2001067631A JP 3566220 B2 JP3566220 B2 JP 3566220B2
- Authority
- JP
- Japan
- Prior art keywords
- code
- excitation
- speech
- drive
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 61
- 230000005284 excitation Effects 0.000 claims abstract description 425
- 239000013598 vector Substances 0.000 claims abstract description 192
- 230000003044 adaptive effect Effects 0.000 claims description 134
- 230000000737 periodic effect Effects 0.000 claims description 65
- 230000003595 spectral effect Effects 0.000 claims description 26
- 238000000926 separation method Methods 0.000 claims description 21
- 230000002708 enhancing effect Effects 0.000 claims description 12
- 230000001965 increasing effect Effects 0.000 claims description 11
- 238000001228 spectrum Methods 0.000 claims description 9
- 230000002123 temporal effect Effects 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 36
- 230000015572 biosynthetic process Effects 0.000 description 35
- 238000003786 synthesis reaction Methods 0.000 description 35
- 230000000694 effects Effects 0.000 description 17
- 238000011156 evaluation Methods 0.000 description 11
- 230000002411 adverse Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
この発明は、ディジタル音声信号を少ない情報量に圧縮する音声符号化装置及び音声符号化方法に関し、また、上記音声符号化装置により生成された音声符号を復号化してディジタル音声信号を生成する音声復号化装置及び音声復号化方法に関するものである。
【0002】
【従来の技術】
従来の多くの音声符号化方法及び音声復号化方法では、入力音声をスペクトル包絡情報と音源情報に分けて、所定長区間のフレーム単位で各々を符号化して音声符号を生成し、この音声符号を復号化して、合成フィルタによってスペクトル包絡情報と音源情報を合わせることで復号音声を得る構成をとっている。最も代表的な音声符号化方法及び音声復号化方法を適用した音声符号化装置及び音声復号化装置としては、符号駆動線形予測符号化(Code−Excited Linear Prediction:CELP)方式を用いたものがある。
【0003】
図13は従来のCELP系の音声符号化装置を示す構成図であり、図において、1は入力音声を分析して、その入力音声のスペクトル包絡情報である線形予測係数を抽出する線形予測分析手段、2は線形予測分析手段1により抽出された線形予測係数を符号化して多重化手段6に出力する一方、その線形予測係数の量子化値を適応音源符号化手段3、駆動音源符号化手段4及びゲイン符号化手段5に出力する線形予測係数符号化手段である。
【0004】
3は線形予測係数符号化手段2から出力された線形予測係数の量子化値を用いて仮の合成音を生成し、仮の合成音と入力音声の距離が最小になる適応音源符号を選択して多重化手段6に出力するとともに、その適応音源符号に対応する適応音源信号(過去の所定長の音源信号が周期的に繰り返された時系列ベクトル)をゲイン符号化手段5に出力する適応音源符号化手段、4は線形予測係数符号化手段2から出力された線形予測係数の量子化値を用いて仮の合成音を生成し、仮の合成音と符号化対象信号(入力音声から適応音源信号による合成音を差し引いた信号)との距離が最小になる駆動音源符号を選択して多重化手段6に出力するとともに、その駆動音源符号に対応する時系列ベクトルである駆動音源信号をゲイン符号化手段5に出力する駆動音源符号化手段である。
【0005】
5は適応音源符号化手段3から出力された適応音源信号と駆動音源符号化手段4から出力された駆動音源信号にゲインベクトルの各要素を乗算し、各乗算結果を相互に加算して音源信号を生成する一方、線形予測係数符号化手段2から出力された線形予測係数の量子化値を用いて、その音源信号から仮の合成音を生成し、仮の合成音と入力音声の距離が最小になるゲイン符号を選択して多重化手段6に出力するゲイン符号化手段、6は線形予測係数符号化手段2により符号化された線形予測係数の符号と、適応音源符号化手段3から出力された適応音源符号と、駆動音源符号化手段4から出力された駆動音源符号と、ゲイン符号化手段5から出力されたゲイン符号とを多重化して音声符号を出力する多重化手段である。
【0006】
図14は駆動音源符号化手段4の内部を示す構成図であり、図において、11は駆動音源符号帳、12は合成フィルタ、13は歪み計算手段、14は歪み評価手段である。
【0007】
図15は従来のCELP系の音声復号化装置を示す構成図であり、図において、21は音声符号化装置から出力された音声符号を分離して、線形予測係数の符号を線形予測係数復号化手段22に出力し、適応音源符号を適応音源復号化手段23に出力し、駆動音源符号を駆動音源復号化手段24に出力し、ゲイン符号をゲイン復号化手段25に出力する分離手段、22は分離手段21から出力された線形予測係数の符号を復号化し、その復号結果である線形予測係数の量子化値を合成フィルタ29に出力する線形予測係数復号化手段である。
【0008】
23は分離手段21から出力された適応音源符号に対応する適応音源信号(過去の音源信号が周期的に繰り返された時系列ベクトル)を出力する適応音源復号化手段、24は分離手段21から出力された駆動音源符号に対応する時系列ベクトルである駆動音源信号を出力する駆動音源復号化手段、25は分離手段21から出力されたゲイン符号に対応するゲインベクトルを出力するゲイン復号化手段である。
【0009】
26はゲイン復号化手段25から出力されたゲインベクトルの要素を適応音源復号化手段23から出力された適応音源信号に乗算する乗算器、27はゲイン復号化手段25から出力されたゲインベクトルの要素を駆動音源復号化手段24から出力された駆動音源信号に乗算する乗算器、28は乗算器26の乗算結果と乗算器27の乗算結果を加算して音源信号を生成する加算器、29は加算器28により生成された音源信号に対する合成フィルタリング処理を実行して出力音声を生成する合成フィルタである。
【0010】
図16は駆動音源復号化手段24の内部を示す構成図であり、図において、31は駆動音源符号帳である。
【0011】
次に動作について説明する。
従来の音声符号化装置及び音声復号化装置では、5〜50ms程度を1フレームとして、フレーム単位で処理を行う。
【0012】
まず、音声符号化装置の線形予測分析手段1は、音声を入力すると、その入力音声を分析して、音声のスペクトル包絡情報である線形予測係数を抽出する。
線形予測係数符号化手段2は、線形予測分析手段1が線形予測係数を抽出すると、その線形予測係数を符号化し、その符号を多重化手段6に出力する。また、その線形予測係数の量子化値を適応音源符号化手段3、駆動音源符号化手段4及びゲイン符号化手段5に出力する。
【0013】
適応音源符号化手段3は、過去の所定長の音源信号を記憶する適応音源符号帳を内蔵し、内部で発生させる各適応音源符号(適応音源符号は数ビットの2進数で示される)に応じて、過去の音源信号が周期的に繰り返された時系列ベクトルを生成する。
次に、各時系列ベクトルに適切なゲインを乗じた後、線形予測係数符号化手段2から出力された線形予測係数の量子化値を用いる合成フィルタに各時系列ベクトルを通すことにより、仮の合成音を生成する。
【0014】
そして、適応音源符号化手段3は、符号化歪みとして、例えば、仮の合成音と入力音声との距離を調査し、この距離を最小とする適応音源符号を選択して多重化手段6に出力するとともに、その選択した適応音源符号に対応する時系列ベクトルを適応音源信号として、ゲイン符号化手段5に出力する。
また、入力音声から適応音源信号による合成音を差し引いた信号を符号化対象信号として、駆動音源符号化手段4に出力する。
【0015】
次に、駆動音源符号化手段4の動作について説明する。
駆動音源符号化手段4の駆動音源符号帳11は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み評価手段14から出力される各駆動音源符号(駆動音源符号は数ビットの2進数値で示される)に応じて、時系列ベクトルを順次出力する。次に、各時系列ベクトルは適切なゲインを乗じられた後、合成フィルタ12に入力される。
合成フィルタ12は、線形予測係数符号化手段2から出力された線形予測係数の量子化値を用いて、ゲインが乗じられた各時系列ベクトルの仮の合成音を生成して出力する。
【0016】
歪み計算手段13は、符号化歪みとして、例えば、仮の合成音と、適応音源符号化手段3から出力された符号化対象信号との距離を計算する。
歪み評価手段14は、歪み計算手段13により計算された仮の合成音と符号化対象信号との距離を最小とする駆動音源符号を選択して多重化手段6に出力するとともに、その選択した駆動音源符号に対応する時系列ベクトルを駆動音源信号としてゲイン符号化手段5に出力する旨の指示を駆動音源符号帳11に出力する。
【0017】
ゲイン符号化手段5は、ゲインベクトルを格納するゲイン符号帳を内蔵し、内部で発生させる各ゲイン符号(ゲイン符号は数ビットの2進数値で示される)に応じて、そのゲイン符号帳からのゲインベクトルの読み出しを順次実行する。
そして、各ゲインベクトルの要素を、適応音源符号化手段3から出力された適応音源信号と、駆動音源符号化手段4から出力された駆動音源信号にそれぞれ乗算し、各乗算結果を相互に加算して音源信号を生成する。
次に、その音源信号を線形予測係数符号化手段2から出力された線形予測係数の量子化値を用いる合成フィルタに通すことにより、仮の合成音を生成する。
【0018】
そして、ゲイン符号化手段5は、符号化歪みとして、例えば、仮の合成音と入力音声との距離を調査し、この距離を最小とするゲイン符号を選択して多重化手段6に出力する。また、そのゲイン符号に対応する音源信号を適応音源符号化手段3に出力する。これにより、適応音源符号化手段3は、ゲイン符号化手段5により選択されたゲイン符号に対応する音源信号を用いて、内蔵する適応音源符号帳の更新を行う。
【0019】
多重化手段6は、線形予測係数符号化手段2により符号化された線形予測係数の符号と、適応音源符号化手段3から出力された適応音源符号と、駆動音源符号化手段4から出力された駆動音源符号と、ゲイン符号化手段5から出力されたゲイン符号とを多重化し、その多重化結果である音声符号を出力する。
【0020】
音声復号化装置の分離手段21は、音声符号化装置が音声符号を出力すると、その音声符号を分離して、線形予測係数の符号を線形予測係数復号化手段22に出力し、適応音源符号を適応音源復号化手段23に出力し、駆動音源符号を駆動音源復号化手段24に出力し、ゲイン符号をゲイン復号化手段25に出力する。線形予測係数復号化手段22は、分離手段21から線形予測係数の符号を受けると、その符号を復号化し、その復号結果である線形予測係数の量子化値を合成フィルタ29に出力する。
【0021】
適応音源復号化手段23は、過去の所定長の音源信号を記憶する適応音源符号帳を内蔵し、分離手段21から出力された適応音源符号に対応する適応音源信号(過去の音源信号が周期的に繰り返された時系列ベクトル)を出力する。
また、駆動音源復号化手段24の駆動音源符号帳31は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離手段21から出力された駆動音源符号に対応する時系列ベクトルを駆動音源信号として出力する。
ゲイン復号化手段25は、ゲインベクトルを格納するゲイン符号帳を内蔵し、分離手段21から出力されたゲイン符号に対応するゲインベクトルを出力する。
【0022】
そして、適応音源復号化手段23から出力された適応音源信号と駆動音源復号化手段24から出力された駆動音源信号は、乗算器26,27により当該ゲインベクトルの要素が乗算され、加算器28により乗算器26,27の乗算結果が相互に加算される。
【0023】
合成フィルタ29は、加算器28の加算結果である音源信号に対する合成フィルタリング処理を実行して出力音声を生成する。なお、フィルタ係数としては、線形予測係数復号化手段22により復号化された線形予測係数の量子化値を用いる。
最後に、適応音源復号化手段23は、上記音源信号を用いて、内蔵する適応音源符号帳の更新を行う。
【0024】
次に、上述したCELP系の音声符号化装置及び音声復号化装置の改良を図った従来の技術について説明する。
Wang他「Improved excitation for phonetically−segmented VXC speech coding below 4kb/s」Proc.GLOBECOM’90、pp.946〜950(文献1)や特開平8−44397号公報(文献2)には低ビットレートでも高品質な音声を得ることを目的として、音源信号のピッチ性を強調させる方法が提案されている。
また、これと同様の方法が3GPP技術仕様書3G TS 26.090(文献3)やITU−T勧告G.729に記載の音声符号化方式で採用されている。
【0025】
図17は音源信号のピッチ性を強調する駆動音源符号化手段4の内部を示す構成図であり、図において、図14と同一符号は同一または相当部分を示すので説明を省略する。なお、駆動音源符号化手段4の内部構成以外は図13と同様の構成とする。
図17において、15は駆動符号ベクトルにピッチ性を与える周期化手段である。
【0026】
図18は音源信号のピッチ性を強調する駆動音源復号化手段24の内部を示す構成図であり、図において、図16と同一符号は同一または相当部分を示すので説明を省略する。なお、駆動音源復号化手段24の内部構成以外は図15と同様の構成とする。 図18において、32は駆動符号ベクトルにピッチ性を与える周期化手段である。
【0027】
次に動作について説明する。
ただし、駆動音源符号化手段4の周期化手段15及び駆動音源復号化手段24の周期化手段32が付加されている点以外は、上述したCELP系の音声符号化装置及び音声復号化装置と同様であるため相違点のみ説明する。
【0028】
周期化手段15は、駆動音源符号帳11から出力された時系列ベクトルのピッチ周期性を強調して出力する。
周期化手段32は、駆動音源符号帳31から出力された時系列ベクトルのピッチ周期性を強調して出力する。
【0029】
周期化手段15及び周期化手段32における時系列ベクトルのピッチ周期性の強調は、例えば、コムフィルタにより実現する。
文献1ではコムフィルタのゲイン(周期強調係数)を一定値としており、また、文献2では周期強調係数として、符号化するフレームにおける音声信号の長周期予測ゲインを用い、さらに、文献3では過去のフレームで符号化された適応音源信号に対するゲインを用いている。
【0030】
【発明が解決しようとする課題】
従来の音声符号化装置及び音声復号化装置は以上のように構成されているので、ピッチ周期性を強調するための周期強調係数を、全ての駆動符号ベクトルに対して同じ値としている。したがって、この周期強調係数が不適当な値であった場合には全ての駆動符号ベクトルがその悪影響を受けるので、周期強調による十分な品質改善が得られず、また、逆に劣化する場合もあるなどの課題があった。
【0031】
例えば、図19に示すように、符号化対象信号が周期Tの強い周期性を示しているのに対し、駆動符号ベクトルを周期化するコムフィルタのインパルス応答が弱い周期性を示すように周期強調係数が設定されている場合、全ての駆動符号ベクトルが弱い周期強調しかされないので、強い周期性を示す符号化対象信号に対する符号化歪みが大きく、品質劣化が起こっていた。
また、逆に、符号化対象信号が弱い周期性を示しているのに対し、駆動符号ベクトルに強い周期性を与えるように周期強調係数が設定されている場合も、同様に符号化歪みが大きく、品質劣化が起こっていた。
【0032】
音声符号化の情報量圧縮率を上げるためには、フレーム長を長くすることが有効であるが、この場合には、フレーム長が長いために分析フレーム内にピッチ変動などの周期強調係数の計算に悪影響を与える要因が入りやすくなり(文献2の構成)、また、過去のフレームのゲインと現在のフレームに適当な周期強調係数との相関が小さくなる(文献3の構成)。このことより周期強調係数が不適当になることが多くなり、上記課題がより顕著であった。
【0033】
また、音声符号化の情報量圧縮率を上げるためには、格納している駆動符号ベクトルの性質が異なる複数の駆動音源符号帳を用いることが有効であるが、この場合には、適当な周期強調係数は駆動音源符号帳毎に異なり、上記の単一の周期強調係数を用いることによる品質劣化という課題がより顕著であった。
例えば、雑音的な駆動符号ベクトルを格納する駆動音源符号帳と、フレーム内に少数のパルスしかない非雑音的(パルス的)な駆動符号ベクトルを格納する駆動音源符号帳とを備えた場合、雑音的な駆動符号ベクトルは常に強い周期化を行った方が、出力音声の雑音的な音質が軽減され、主観的な品質が向上するが、同様に非雑音的な駆動符号ベクトルも常に強い周期化を行うと、本来周期的でない雑音的な入力音声に対しては出力音声がパルス的な音質になり、主観的な品質劣化につながるという課題があった。
【0034】
また、例えば、フレーム前半にのみ信号があり、フレーム後半は零信号であるなど、時間的なパワー分布に偏りがある駆動符号ベクトルを格納する駆動音源符号帳を備えた場合、当該駆動符号ベクトルに対しては常に強い周期化を行わないと、フレーム後半における符号化特性の劣化が顕著となるなど、パワーが小さい部分で主観的な品質劣化が起こるという課題があった。
【0035】
この発明は上記のような課題を解決するためになされたもので、主観的に品質の高い出力音声を得ることができる音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法を得ることを目的とする。
【0036】
【課題を解決するための手段】
この発明に係る音声符号化装置は、駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化手段と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化手段とを備えるようにしたものである。
【0037】
この発明に係る音声符号化方法は、駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化工程と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化工程とを備えるようにしたものである。
【0038】
この発明に係る音声符号化方法は、入力音声を分析して第1の周期強調係数を決定するようにしたものである。
【0039】
この発明に係る音声符号化方法は、音声符号から第1の周期強調係数を決定するようにしたものである。
【0040】
この発明に係る音声符号化方法は、音声の様態を判定し、その判定結果に応じて第1の周期強調係数を決定するようにしたものである。
【0041】
この発明に係る音声符号化方法は、音声の摩擦音区間を判定し、その摩擦音区間では第1の周期強調係数の強調度合を弱めるようにしたものである。
【0042】
この発明に係る音声符号化方法は、音声の有声定常区間を判定し、その有声定常区間では第1の周期強調係数の強調度合を強めるようにしたものである。
【0043】
この発明に係る音声符号化方法は、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用するようにしたものである。
【0044】
この発明に係る音声符号化方法は、駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用するようにしたものである。
【0045】
この発明に係る音声復号化装置は、駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化手段と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化手段とを備えるようにしたものである。
【0046】
この発明に係る音声復号化方法は、駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化工程と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化工程とを備えるようにしたものである。
【0047】
この発明に係る音声復号化方法は、音声符号に含まれている周期強調係数の符号を復号化して第1の周期強調係数を求めるようにしたものである。
【0048】
この発明に係る音声復号化方法は、音声符号から第1の周期強調係数を決定するようにしたものである。
【0049】
この発明に係る音声復号化方法は、音声の様態を判定し、その判定結果に応じて第1の周期強調係数を決定するようにしたものである。
【0050】
この発明に係る音声復号化方法は、音声の摩擦音区間を判定し、その摩擦音区間では第1の周期強調係数の強調度合を弱めるようにしたものである。
【0051】
この発明に係る音声復号化方法は、音声の有声定常区間を判定し、その有声定常区間では第1の周期強調係数の強調度合を強めるようにしたものである。
【0052】
この発明に係る音声復号化方法は、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用するようにしたものである。
【0053】
この発明に係る音声復号化方法は、駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用するようにしたものである。
【0054】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態1.
図1はこの発明の実施の形態1による音声符号化装置を示す構成図であり、図において、41は入力音声を分析して、その入力音声のスペクトル包絡情報である線形予測係数を抽出する線形予測分析手段、42は線形予測分析手段41により抽出された線形予測係数を符号化して多重化手段46に出力する一方、その線形予測係数の量子化値を適応音源符号化手段43、駆動音源符号化手段44及びゲイン符号化手段45に出力する線形予測係数符号化手段である。
なお、線形予測係数分析手段41及び線形予測係数符号化手段42からスペクトル包絡情報符号化手段が構成されている。
【0055】
43は線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いて仮の合成音を生成し、仮の合成音と入力音声の距離が最小になる適応音源符号を選択して多重化手段46に出力するとともに、その適応音源符号に対応する適応音源信号(過去の所定長の音源信号が周期的に繰り返された時系列ベクトル)をゲイン符号化手段45に出力する適応音源符号化手段、44は入力音声を分析して周期強調係数を求め、この周期強調係数を符号化して多重化手段46に出力する一方、その周期強調係数の量子化値及び線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いて仮の合成音を生成し、仮の合成音と符号化対象信号(入力音声から適応音源信号による合成音を差し引いた信号)との距離が最小になる駆動音源符号を選択して多重化手段46に出力するとともに、その駆動音源符号に対応する時系列ベクトルである駆動音源信号をゲイン符号化手段45に出力する駆動音源符号化手段である。
【0056】
45は適応音源符号化手段43から出力された適応音源信号と駆動音源符号化手段44から出力された駆動音源信号にゲインベクトルの各要素を乗算し、各乗算結果を相互に加算して音源信号を生成する一方、線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いて、その音源信号から仮の合成音を生成し、仮の合成音と入力音声の距離が最小になるゲイン符号を選択して多重化手段46に出力するゲイン符号化手段である。 なお、適応音源符号化手段43、駆動音源符号化手段44及びゲイン符号化手段45から音源情報符号化手段が構成されている。
【0057】
46は線形予測係数符号化手段42により符号化された線形予測係数の符号と、適応音源符号化手段43から出力された適応音源符号と、駆動音源符号化手段44から出力された周期強調係数の符号及び駆動音源符号と、ゲイン符号化手段45から出力されたゲイン符号とを多重化して音声符号を出力する多重化手段である。
【0058】
図2は駆動音源符号化手段44の内部を示す構成図であり、図において、51は入力音声を分析して周期強調係数(第1の周期強調係数)を決定する周期強調係数計算手段、52は周期強調係数計算手段51により求められた周期強調係数を符号化する一方、その周期強調係数の量子化値を第1の周期化手段54に出力する周期強調係数符号化手段、53は複数の非雑音的(パルス的)な時系列ベクトル(駆動符号ベクトル)を格納する第1の駆動音源符号帳、54は周期強調係数符号化手段52から出力された周期強調係数の量子化値を用いて各時系列ベクトルの周期性を強調する第1の周期化手段、55は線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いて各時系列ベクトルの仮の合成音を生成する第1の合成フィルタ、56は仮の合成音と適応音源符号化手段43から出力された符号化対象信号との距離を計算する第1の歪み計算手段である。
【0059】
57は複数の雑音的な時系列ベクトル(駆動符号ベクトル)を格納する第2の駆動音源符号帳、58は予め定めた固定の周期強調係数(第2の周期強調係数)を用いて各時系列ベクトルの周期性を強調する第2の周期化手段、59は線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いて各時系列ベクトルの仮の合成音を生成する第2の合成フィルタ、60は仮の合成音と適応音源符号化手段43から出力された符号化対象信号との距離を計算する第2の歪み計算手段、61は第1の歪み計算手段56の計算結果と第2の歪み計算手段60の計算結果を比較評価して駆動音源符号を選択する歪み評価手段である。
【0060】
図3はこの発明の実施の形態1による音声復号化装置を示す構成図であり、図において、71は音声符号化装置から出力された音声符号を分離して、線形予測係数の符号を線形予測係数復号化手段72に出力し、適応音源符号を適応音源復号化手段73に出力し、周期強調係数の符号及び駆動音源符号を駆動音源復号化手段74に出力し、ゲイン符号をゲイン復号化手段75に出力する分離手段、72は分離手段71から出力された線形予測係数の符号を復号化し、その復号結果である線形予測係数の量子化値を合成フィルタ79に出力する線形予測係数復号化手段である。
【0061】
73は分離手段71から出力された適応音源符号に対応する適応音源信号(過去の音源信号が周期的に繰り返された時系列ベクトル)を出力する適応音源復号化手段、74は分離手段71から出力された周期強調係数の符号及び駆動音源符号に対応する時系列ベクトルである駆動音源信号を出力する駆動音源復号化手段、75は分離手段71から出力されたゲイン符号に対応するゲインベクトルを出力するゲイン復号化手段である。
【0062】
76はゲイン復号化手段75から出力されたゲインベクトルの要素を適応音源復号化手段73から出力された適応音源信号に乗算する乗算器、77はゲイン復号化手段75から出力されたゲインベクトルの要素を駆動音源復号化手段74から出力された駆動音源信号に乗算する乗算器、78は乗算器76の乗算結果と乗算器77の乗算結果を加算して音源信号を生成する加算器、79は加算器78により生成された音源信号に対する合成フィルタリング処理を実行して出力音声を生成する合成フィルタである。
【0063】
図4は駆動音源復号化手段74の内部を示す構成図であり、図において、81は分離手段71から出力された周期強調係数の符号を復号化し、その復号結果である周期強調係数(第1の周期強調係数)の量子化値を第1の周期化手段83に出力する周期強調係数復号化手段、82は複数の非雑音的(パルス的)な時系列ベクトル(駆動符号ベクトル)を格納する第1の駆動音源符号帳、83は周期強調係数復号化手段81から出力された周期強調係数の量子化値を用いて各時系列ベクトルの周期性を強調する第1の周期化手段、84は複数の雑音的な時系列ベクトル(駆動符号ベクトル)を格納する第2の駆動音源符号帳、85は予め定めた固定の周期強調係数(第2の周期強調係数)を用いて各時系列ベクトルの周期性を強調する第2の周期化手段である。
【0064】
次に動作について説明する。
音声符号化装置では、5〜50ms程度を1フレームとして、フレーム単位で処理を行う。
【0065】
まず、スペクトル包絡情報の符号化について説明する。
線形予測分析手段41は、音声を入力すると、その入力音声を分析して、音声のスペクトル包絡情報である線形予測係数を抽出する。
線形予測係数符号化手段42は、線形予測分析手段41が線形予測係数を抽出すると、その線形予測係数を符号化し、その符号を多重化手段46に出力する。また、その線形予測係数の量子化値を適応音源符号化手段43、駆動音源符号化手段44及びゲイン符号化手段45に出力する。
【0066】
次に、音源情報の符号化について説明する。
適応音源符号化手段43は、過去の所定長の音源信号を記憶する適応音源符号帳を内蔵し、内部で発生させる各適応音源符号(適応音源符号は数ビットの2進数で示される)に応じて、過去の音源信号が周期的に繰り返された時系列ベクトルを生成する。
次に、各時系列ベクトルに適切なゲインを乗じた後、線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いる合成フィルタに各時系列ベクトルを通すことにより、仮の合成音を生成する。
【0067】
そして、適応音源符号化手段43は、符号化歪みとして、例えば、仮の合成音と入力音声との距離を調査し、この距離を最小とする適応音源符号を選択して多重化手段46に出力するとともに、その選択した適応音源符号に対応する時系列ベクトルを適応音源信号として、ゲイン符号化手段45に出力する。
また、選択した適応音源符号に対応するピッチ周期と、入力音声から適応音源信号による合成音を差し引いた信号である符号化対象信号を、駆動音源符号化手段44に出力する。
【0068】
次に、駆動音源符号化手段44の動作について説明する。
周期強調係数計算手段51は、入力音声を分析して周期強調係数を決定する。周期強調係数は、例えば、入力音声の長周期予測ゲインを基に、スペクトル特徴が有声的であれば強調の度合を強め、無声的であれば強調の度合を弱め、また、長周期予測ゲイン及びピッチ周期の時間変動が小さければ強調の度合を強め、時間変動が大きければ強調の度合を弱めるなどして決定する。
周期強調係数符号化手段52は、周期強調係数計算手段51が周期強調係数を決定すると、その周期強調係数を符号化し、その符号を多重化手段46に出力する。また、その周期強調係数の量子化値を第1の周期化手段54に出力する。
【0069】
第1の駆動音源符号帳53は、複数の非雑音的(パルス的)な時系列ベクトルである駆動符号ベクトルを格納し、歪み評価手段61から出力される各駆動音源符号に応じて、時系列ベクトルを順次出力する。第1の周期化手段54は、周期強調係数符号化手段52から出力された周期強調係数の量子化値を用いて、第1の駆動音源符号帳53から出力された時系列ベクトルの周期性を強調して出力する。第1の周期化手段54における時系列ベクトルの周期性の強調は、例えば、コムフィルタにより実現する。 次に、周期性を強調された各時系列ベクトルは適切なゲインが乗じられた後、第1の合成フィルタ55に入力される。
【0070】
第1の合成フィルタ55は、線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いて、ゲインが乗じられた各時系列ベクトルの仮の合成音を生成して出力する。
そして、第1の歪み計算手段56は、符号化歪みとして、例えば、仮の合成音と適応音源符号化手段43から出力された符号化対象信号との距離を計算し、歪み評価手段61に出力する。
【0071】
一方、第2の駆動音源符号帳57は、複数の雑音的な時系列ベクトルである駆動符号ベクトルを格納し、歪み評価手段61から出力される各駆動音源符号に応じて、時系列ベクトルを順次出力する。第2の周期化手段58は、予め定めた固定の周期強調係数を用いて、第2の駆動音源符号帳57から出力された時系列ベクトルの周期性を強調して出力する。第2の周期化手段58における時系列ベクトルの周期性の強調は、例えば、コムフィルタにより実現する。
【0072】
ここで、第2の周期化手段58が用いる固定の周期強調係数は、例えば、学習用の入力音声を符号化し、第1の周期化手段54が用いる周期強調係数が不適当であるフレームを抽出し、このフレームにおける符号化品質が平均的によくなるように決定するなどの方法により、予め設定しておく。
【0073】
次に、周期性を強調された各時系列ベクトルは適切なゲインが乗じられた後、第2の合成フィルタ59に入力される。
第2の合成フィルタ59は、線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いて、ゲインが乗じられた各時系列ベクトルの仮の合成音を生成して出力する。
そして、第2の歪み計算手段60は、符号化歪みとして、例えば、仮の合成音と適応音源符号化手段43から入力された符号化対象信号との距離を計算し、歪み評価手段61に出力する。
【0074】
歪み評価手段61は、前記仮の合成音と符号化対象信号との距離を最小とする駆動音源符号を選択して多重化手段46に出力する。また、その選択した駆動音源符号に対応する時系列ベクトルを出力する旨の指示を第1の駆動音源符号帳53又は第2の駆動音源符号帳57に出力する。第1の周期化手段54又は第2の周期化手段58は、第1の駆動音源符号帳53又は第2の駆動音源符号帳57から出力された時系列ベクトルのピッチ周期性を強調し、駆動音源信号としてゲイン符号化手段45に出力する。
【0075】
上記のようにして、駆動音源符号化手段44が駆動音源信号を出力すると、ゲイン符号化手段45は、ゲインベクトルを格納するゲイン符号帳を内蔵し、内部で発生させる各ゲイン符号(ゲイン符号は数ビットの2進数値で示される)に応じて、そのゲイン符号帳からゲインベクトルの読み出しを順次実行する。 そして、各ゲインベクトルの要素を、適応音源符号化手段43から出力された適応音源信号と、駆動音源符号化手段44から出力された駆動音源信号にそれぞれ乗算し、各乗算結果を相互に加算して音源信号を生成する。
次に、その音源信号を線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いる合成フィルタに通すことにより、仮の合成音を生成する。
【0076】
そして、ゲイン符号化手段45は、符号化歪みとして、例えば、仮の合成音と入力音声との距離を調査し、この距離を最小とするゲイン符号を選択して多重化手段46に出力する。また、そのゲイン符号に対応する音源信号を適応音源符号化手段43に出力する。これにより、適応音源符号化手段43は、ゲイン符号化手段45により選択されたゲイン符号に対応する音源信号を用いて、内蔵する適応音源符号帳の更新を行う。
【0077】
多重化手段46は、線形予測係数符号化手段42により符号化された線形予測係数の符号と、適応音源符号化手段43から出力された適応音源符号と、駆動音源符号化手段44から出力された周期強調係数の符号及び駆動音源符号と、ゲイン符号化手段45から出力されたゲイン符号とを多重化し、その多重化結果である音声符号を出力する。
【0078】
音声復号化装置の分離手段71は、音声符号化装置が音声符号を出力すると、その音声符号を分離して、線形予測係数の符号を線形予測係数復号化手段72に出力し、適応音源符号を適応音源復号化手段73に出力し、周期強調係数の符号及び駆動音源符号を駆動音源復号化手段74に出力し、ゲイン符号をゲイン復号化手段75に出力する。
線形予測係数復号化手段72は、分離手段71から線形予測係数の符号を受けると、その符号を復号化し、その復号結果である線形予測係数の量子化値を合成フィルタ79に出力する。
【0079】
適応音源復号化手段73は、過去の所定長の音源信号を記憶する適応音源符号帳を内蔵し、分離手段71から出力された適応音源符号に対応する適応音源信号(過去の音源信号が周期的に繰り返された時系列ベクトル)を出力する。
【0080】
次に、駆動音源復号化手段74の動作について説明する。 周期強調係数復号化手段81は、分離手段71から周期強調係数の符号を受けると、その符号を復号化し、その復号結果である周期強調係数の量子化値を第1の周期化手段83に出力する。
第1の駆動音源符号帳82は、複数の非雑音的(パルス的)な時系列ベクトルを格納し、また、第2の駆動音源符号帳84は、複数の雑音的な時系列ベクトルを格納している。そして、第1の駆動音源符号帳82又は第2の駆動音源符号帳84は、分離手段71から出力された駆動音源符号に対応する時系列ベクトルを出力する。
【0081】
第1の駆動音源符号帳82が駆動音源符号に対応する時系列ベクトルを出力した場合、第1の周期化手段83は、周期強調係数復号化手段81から出力された周期強調係数の量子化値を用いて、第1の駆動音源符号帳82から出力された時系列ベクトルの周期性を強調し、駆動音源信号として出力する。
一方、第2の駆動音源符号帳84が駆動音源符号に対応する時系列ベクトルを出力した場合、第2の周期化手段85は、予め定めた固定の周期強調係数を用いて、第2の駆動音源符号帳84から出力された時系列ベクトルの周期性を強調し、駆動音源信号として出力する。
【0082】
ゲイン復号化手段75は、ゲインベクトルを格納するゲイン符号帳を内蔵し、分離手段71から出力されたゲイン符号に対応するゲインベクトルを出力する。そして、適応音源復号化手段73から出力された適応音源信号と駆動音源復号化手段74から出力された駆動音源信号は、乗算器76,77により当該ゲインベクトルの要素が乗算され、加算器78により乗算器76,77の乗算結果が相互に加算される。
【0083】
合成フィルタ79は、加算器78の加算結果である音源信号に対する合成フィルタリング処理を実行して出力音声を生成する。なお、フィルタ係数としては、線形予測係数復号化手段72により復号化された線形予測係数の量子化値を用いる。
最後に、適応音源復号化手段73は、上記音源信号を用いて、内蔵する適応音源符号帳の更新を行う。
【0084】
以上で明らかなように、この実施の形態1によれば、駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化手段と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化手段とを備えるように構成したので、図5に示すように、第1の周期強調係数又は第2の周期強調係数のどちらか一方が不適当な値であっても、その不適当な周期強調係数による悪影響が一部の駆動符号ベクトルに限定され、主観的に品質の高い出力音声を得ることができる効果を奏する。
【0085】
また、入力音声を分析して求めたパラメータを基に第1の周期強調係数を決定するように構成したので、入力音声から抽出できる数多くのパラメータを使用し、精密な規則により周期強調係数を決定することができる。そのため、不適当な周期強調係数が求まる頻度が軽減され、主観的に品質の高い出力音声を得ることができる効果を奏する。
【0086】
さらに、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用するように構成したので、雑音的な駆動符号ベクトルは常に強い周期化を行うことができ、出力音声の雑音的な音質が軽減される。また、非雑音的な駆動符号ベクトルは常には強い周期化を行うことがなく、出力音声がパルス的な音質になることを回避でき、主観的に品質の高い符号化音声を得ることができる効果を奏する。
【0087】
実施の形態2.
図6はこの発明の実施の形態2による音声符号化装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
47は適応音源信号のゲインから周期強調係数を求め、その周期強調係数及び線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いて仮の合成音を生成し、仮の合成音と符号化対象信号(入力音声から適応音源信号による合成音を差し引いた信号)との距離が最小になる駆動音源符号を選択して多重化手段49に出力するとともに、その駆動音源符号に対応する時系列ベクトルである駆動音源信号をゲイン符号化手段48に出力する駆動音源符号化手段である。
【0088】
48は適応音源符号化手段43から出力された適応音源信号と駆動音源符号化手段47から出力された駆動音源信号にゲインベクトルの各要素を乗算し、各乗算結果を相互に加算して音源信号を生成する一方、線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いて、その音源信号から仮の合成音を生成し、仮の合成音と入力音声の距離が最小になるゲイン符号を選択して多重化手段49に出力するゲイン符号化手段である。
【0089】
図7は駆動音源符号化手段47の内部を示す構成図であり、図において、図2と同一符号は同一または相当部分を示すので説明を省略する。
62は適応音源信号のゲインから周期強調係数を求める周期強調係数計算手段である。
【0090】
図8はこの発明の実施の形態2による音声復号化装置を示す構成図であり、図において、図3と同一符号は同一または相当部分を示すので説明を省略する。
80は適応音源信号のゲインから周期強調係数を求め、その周期強調係数及び分離手段71から出力された駆動音源符号に対応する時系列ベクトルである駆動音源信号を出力する駆動音源復号化手段である。
【0091】
図9は駆動音源復号化手段80の内部を示す構成図であり、図において、図4と同一符号は同一または相当部分を示すので説明を省略する。
86は適応音源信号のゲインから周期強調係数を求める周期強調係数計算手段である。
【0092】
次に動作について説明する。
ただし、駆動音源符号化手段47の周期強調係数計算手段62、ゲイン符号化手段48及び駆動音源復号化手段80の周期強調係数計算手段86以外は、上記実施の形態1と同様であるため相違点のみ説明する。
【0093】
周期強調係数計算手段62は、ゲイン符号化手段48から出力された適応音源信号に対するゲインから、例えば、前フレームの適応音源信号に対するゲインを用いるなどして、周期強調係数を決定し、その周期強調係数を第1の周期化手段54に出力する。
【0094】
ゲイン符号化手段48は、ゲインベクトルを格納するゲイン符号帳を内蔵し、内部で発生させる各ゲイン符号(ゲイン符号は数ビットの2進数値で示される)に応じて、そのゲイン符号帳からゲインベクトルの読み出しを順次実行する。
そして、各ゲインベクトルの要素を、適応音源符号化手段43から出力された適応音源信号と、駆動音源符号化手段47から出力された駆動音源信号にそれぞれ乗算し、各乗算結果を相互に加算して音源信号を生成する。
次に、その音源信号を線形予測係数符号化手段42から出力された線形予測係数の量子化値を用いる合成フィルタに通すことにより、仮の合成音を生成する。
【0095】
そして、ゲイン符号化手段48は、符号化歪みとして、例えば、仮の合成音と入力音声との距離を調査し、この距離を最小とするゲイン符号を選択して多重化手段49に出力する。また、そのゲイン符号に対応する音源信号を適応音源符号化手段43に出力する一方、そのゲイン符号に対応する適応音源信号のゲインを駆動音源符号化手段47に出力する。
【0096】
周期強調係数計算手段86は、ゲイン復号化手段75から出力された適応音源信号のゲインから、駆動音源符号化手段47の周期強調係数計算手段62と同様にして、周期強調係数を決定し、その周期強調係数を第1の周期化手段83に出力する。
【0097】
以上で明らかなように、この実施の形態2によれば、音声符号から求めることができるパラメータを基に第1の周期強調係数を決定するように構成したので、周期強調係数を個別に符号化する必要はなく、低ビットレートでも所定の規則に基づき適応的に求めた第1の周期強調係数又は予め定めた固定の第2の周期強調係数を用いて駆動符号ベクトルに対する周期性の強調を行うことができ、主観的に品質の高い出力音声を得ることができる効果を奏する。
【0098】
実施の形態3.
図10は駆動音源符号化手段47の内部を示す構成図であり、図2と同一符号は同一または相当部分を示すので説明を省略する。
63は線形予測係数の量子化値、ピッチ周期及び適応音源信号のゲインから音声の様態を判定する音声様態判定手段、64は音声様態の判定結果と適応音源信号のゲインから周期強調係数を決定する周期強調係数計算手段である。
【0099】
図11はこの発明の実施の形態3による音声復号化装置を示す構成図であり、図において、図3と同一符号は同一または相当部分を示すので説明を省略する。91は線形予測係数の量子化値、ピッチ周期及び適応音源信号のゲインから音声の様態を判定し、その音声様態の判定結果と適応音源信号のゲインから周期強調係数を求め、その周期強調係数と分離手段71から出力された駆動音源符号に対応する時系列ベクトルである駆動音源信号を出力する駆動音源復号化手段である。
【0100】
図12は駆動音源復号化手段91の内部を示す構成図であり、図4と同一符号は同一または相当部分を示すので説明を省略する。
87は線形予測係数の量子化値、ピッチ周期及び適応音源信号のゲインから音声の様態を判定する音声様態判定手段、88は音声様態の判定結果と適応音源信号のゲインから周期強調係数を決定する周期強調係数計算手段である。
【0101】
次に動作について説明する。
ただし、駆動音源符号化手段47の音声様態判定手段63及び周期強調係数計算手段64、駆動音源復号化手段91の音声様態判定手段87及び周期強調係数計算手段88以外は、上記実施の形態2と同様であるため相違点のみ説明する。
【0102】
音声様態判定手段63は、線形予測係数符号化手段42から出力された線形予測係数の量子化値、適応音源符号化手段43から出力されたピッチ周期及びゲイン符号化手段48から出力された適応音源信号のゲインから、入力音声の様態を、例えば、摩擦音、有声定常又はそれ以外に判定し、その判定結果を周期強調係数計算手段64に出力する。
音声様態の判定は、例えば、線形予測係数の量子化値からスペクトルの傾斜を求め、それが周波数低域より高域に向かって音声のパワーが増大するような様態を示していれば摩擦音とし、ピッチ周期及びゲインの時間変動を求め、変動が小さければ有声定常とし、以上の条件に合致しなければその他とするなどとする。
【0103】
周期強調係数計算手段64は、音声様態判定手段63から出力された音声様態の判定結果とゲイン符号化手段48から出力された適応音源信号に対するゲインから、例えば、前フレームの適応音源信号に対するゲインを用いて周期強調係数を決定し、その周期強調係数を第1の周期化手段54に出力する。
【0104】
ここで、前記周期強調係数は、音声様態が摩擦音であれば強調の度合を弱め、音声様態が有声定常であれば強調の度合を強める。
これにより、本来は入力音声に周期性がない摩擦音区間で駆動音源ベクトルに対して強い周期強調を行ったり、あるいは、本来は入力音声の周期性が強い有声定常区間で駆動音源ベクトルに対して弱い周期強調しか行われないなどの、不適当な周期強調を行うことがなくなり、主観的に品質の高い符号化音声を得ることができる効果を奏する。
【0105】
音声様態判定手段87は、線形予測係数復号化手段72から出力された線形予測係数の量子化値、適応音源復号化手段73から出力されたピッチ周期及びゲイン復号化手段75から出力された適応音源信号のゲインから、駆動音源符号化手段47の音声様態判定手段63と同様にして、音声の様態を判定し、その判定結果を周期強調係数計算手段88に出力する。
【0106】
周期強調係数計算手段88は、音声様態判定手段87から出力された音声様態の判定結果とゲイン復号化手段75から出力された適応音源信号に対するゲインから、駆動音源符号化手段47の周期強調係数計算手段64と同様にして、周期強調係数を決定し、その周期強調係数を第1の周期化手段83に出力する。
【0107】
これにより、音声符号から求めることができるパラメータから音声様態を判定して、この判定結果に応じて周期強調係数を決定しているので、伝送情報量を増やすことなく、より細かく周期強調係数を制御でき、主観的に品質の高い符号化音声を得ることができる効果を奏する。
【0108】
また、音声様態の判定結果が、本来は周期性がない摩擦音のときには、周期強調係数の強調の度合を弱めるようにしたので、主観的に品質の高い符号化音声を得ることができる効果を奏する。
さらに、音声様態の判定結果が、本来周期性が強い有声定常のときには、周期強調係数の強調の度合を強めるようにしたので、主観的に品質の高い符号化音声を得ることができる効果を奏する。
【0109】
実施の形態4.
上記実施の形態1〜3では、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用するものについて示したが、第1の駆動音源符号帳53,82は時間的なパワー分布が平坦な複数の時系列ベクトル(駆動符号ベクトル)を格納し、第2の駆動音源符号帳57,84は時間的なパワー分布がフレーム前半に偏っている複数の時系列ベクトル(駆動符号ベクトル)を格納するように構成してもよい。
【0110】
このように構成したことにより、パワー分布に偏りがある駆動符号ベクトルは常に強い周期化を行うことができ、周期化後の駆動符号ベクトルのパワー分布の偏りが軽減し、主観的に品質の高い符号化音声を得ることができる効果を奏する。
【0111】
実施の形態5.
上記実施の形態1〜4では、駆動音源符号帳を2個用意しているが、3つ以上の駆動音源符号帳を用意して駆動音源符号化手段44,47及び駆動音源復号化手段74,80,91を構成するようにしてもよい。
【0112】
また、上記実施の形態1〜4では、明示的に複数個の駆動音源符号帳を備えるものについて示したが、単一の駆動音源符号帳に格納される時系列ベクトルを複数の部分集合に分割して、各部分集合を個別の駆動音源符号帳と見倣すようにしてもよい。
【0113】
また、上記実施の形態1〜4では、第1の駆動音源符号帳53,82と第2の駆動音源符号帳57,84とが異なる駆動符号ベクトルを格納しているが、同一の符号ベクトルを格納するとしてもよい。即ち、単一の駆動音源符号帳に対して第1の周期化工程及び第2の周期化工程を適用するとしてもよい。
【0114】
また、上記実施の形態1〜4では、第1の合成フィルタ55と第2の合成フィルタ59の2つの合成フィルタを備える構成としているが、これらは同一の動作をすることから、一つの合成フィルタを共通に用いる構成としてもよい。同様に、第1の歪み計算手段56と第2の歪み計算手段60も、一つの歪み計算手段を共通に用いる構成としてもよい。
【0115】
【発明の効果】
以上のように、この発明によれば、駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化手段と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化手段とを備えるように構成したので、第1の周期強調係数又は第2の周期強調係数のどちらか一方が不適当な値であっても、その不適当な周期強調係数による悪影響が一部の駆動符号ベクトルに限定され、主観的に品質の高い出力音声を得ることができる効果がある。
【0116】
この発明によれば、駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化工程と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化工程とを備えるように構成したので、第1の周期強調係数又は第2の周期強調係数のどちらか一方が不適当な値であっても、その不適当な周期強調係数による悪影響が一部の駆動符号ベクトルに限定され、主観的に品質の高い出力音声を得ることができる効果がある。
【0117】
この発明によれば、入力音声を分析して第1の周期強調係数を決定するように構成したので、不適当な周期強調係数が求まる頻度が軽減され、主観的に品質の高い出力音声を得ることができる効果がある。
【0118】
この発明によれば、音声符号から第1の周期強調係数を決定するように構成したので、周期強調係数を個別に符号化することなく、すなわち、伝送情報量を増やすことなく駆動符号ベクトルに対する周期性の強調を行うことができ、主観的に品質の高い出力音声を得ることができる効果がある。
【0119】
この発明によれば、音声の様態を判定し、その判定結果に応じて第1の周期強調係数を決定するように構成したので、より細かく周期強調係数を制御でき、主観的に品質の高い符号化音声を得ることができる効果がある。
【0120】
この発明によれば、音声の摩擦音区間を判定し、その摩擦音区間では第1の周期強調係数の強調度合を弱めるように構成したので、主観的に品質の高い符号化音声を得ることができる効果がある。
【0121】
この発明によれば、音声の有声定常区間を判定し、その有声定常区間では第1の周期強調係数の強調度合を強めるように構成したので、主観的に品質の高い符号化音声を得ることができる効果がある。
【0122】
この発明によれば、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用するように構成したので、出力音声の雑音的な音質が軽減され、また、出力音声がパルス的な音質になることが回避され、主観的に品質の高い符号化音声を得ることができる効果がある。
【0123】
この発明によれば、駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用するように構成したので、周期化後の駆動符号ベクトルのパワー分布の偏りが軽減し、主観的に品質の高い符号化音声を得ることができる効果がある。
【0124】
この発明によれば、駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化手段と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化手段とを備えるように構成したので、第1の周期強調係数又は第2の周期強調係数のどちらか一方が不適当な値であっても、その不適当な周期強調係数による悪影響が一部の駆動符号ベクトルに限定され、主観的に品質の高い出力音声を得ることができる効果がある。
【0125】
この発明によれば、駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化工程と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化工程とを備えるように構成したので、第1の周期強調係数又は第2の周期強調係数のどちらか一方が不適当な値であっても、その不適当な周期強調係数による悪影響が一部の駆動符号ベクトルに限定され、主観的に品質の高い出力音声を得ることができる効果がある。
【0126】
この発明によれば、音声符号に含まれている周期強調係数の符号を復号化して第1の周期強調係数を求めるように構成したので、主観的に品質の高い出力音声を得ることができる効果がある。
【0127】
この発明によれば、音声符号から第1の周期強調係数を決定するように構成したので、周期強調係数を個別に符号化することなく、すなわち、伝送情報量を増やすことなく駆動符号ベクトルに対する周期性の強調を行うことができ、主観的に品質の高い出力音声を得ることができる効果がある。
【0128】
この発明によれば、音声の様態を判定し、その判定結果に応じて第1の周期強調係数を決定するように構成したので、より細かく周期強調係数を制御でき、主観的に品質の高い符号化音声を得ることができる効果がある。
【0129】
この発明によれば、音声の摩擦音区間を判定し、その摩擦音区間では第1の周期強調係数の強調度合を弱めるように構成したので、主観的に品質の高い符号化音声を得ることができる効果がある。
【0130】
この発明によれば、音声の有声定常区間を判定し、その有声定常区間では第1の周期強調係数の強調度合を強めるように構成したので、主観的に品質の高い符号化音声を得ることができる効果がある。
【0131】
この発明によれば、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用するように構成したので、出力音声の雑音的な音質が軽減され、また、出力音声がパルス的な音質になることが回避され、主観的に品質の高い符号化音声を得ることができる効果がある。
【0132】
この発明によれば、駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用するように構成したので、周期化後の駆動符号ベクトルのパワー分布の偏りが軽減し、主観的に品質の高い符号化音声を得ることができる効果がある。
【図面の簡単な説明】
【図1】この発明の実施の形態1による音声符号化装置を示す構成図である。
【図2】駆動音源符号化手段の内部を示す構成図である。
【図3】この発明の実施の形態1による音声復号化装置を示す構成図である。
【図4】駆動音源復号化手段の内部を示す構成図である。
【図5】駆動符号ベクトルに対する周期強調の説明図である。
【図6】この発明の実施の形態2による音声符号化装置を示す構成図である。
【図7】駆動音源符号化手段の内部を示す構成図である。
【図8】この発明の実施の形態2による音声復号化装置を示す構成図である。
【図9】駆動音源復号化手段の内部を示す構成図である。
【図10】駆動音源符号化手段の内部を示す構成図である。
【図11】この発明の実施の形態3による音声復号化装置を示す構成図である。
【図12】駆動音源復号化手段の内部を示す構成図である。
【図13】従来のCELP系の音声符号化装置を示す構成図である。
【図14】駆動音源符号化手段の内部を示す構成図である。
【図15】従来のCELP系の音声復号化装置を示す構成図である。
【図16】駆動音源復号化手段の内部を示す構成図である。
【図17】周期化手段を備える駆動音源符号化手段の内部を示す構成図である。
【図18】周期化手段を備える駆動音源復号化手段の内部を示す構成図である。
【図19】駆動符号ベクトルに対する周期強調の説明図である。
【符号の説明】
1 線形予測分析手段、2 線形予測係数符号化手段、3 適応音源符号化手段、4 駆動音源符号化手段、5 ゲイン符号化手段、6 多重化手段、11 駆動音源符号帳、12 合成フィルタ、13 歪み計算手段、14 歪み評価手段、21 分離手段、22 線形予測係数復号化手段、23 適応音源復号化手段、24 駆動音源復号化手段、25 ゲイン復号化手段、26 乗算器、27乗算器、28 加算器、29 合成フィルタ、31 駆動音源符号帳、41 線形予測分析手段(スペクトル包絡情報符号化手段)、42 線形予測係数符号化手段(スペクトル包絡情報符号化手段)、43 適応音源符号化手段(音源情報符号化手段)、44 駆動音源符号化手段(音源情報符号化手段)、45 ゲイン符号化手段(音源情報符号化手段)、46 多重化手段、47 駆動音源符号化手段(音源情報符号化手段)、48 ゲイン符号化手段(音源情報符号化手段)、49 多重化手段、51 周期強調係数計算手段、52 周期強調係数符号化手段、53、82 第1の駆動音源符号帳、54、83 第1の周期化手段、55 第1の合成フィルタ、56 第1の歪み計算手段、57、84 第2の駆動音源符号帳、58、85 第2の周期化手段、59 第2の合成フィルタ、60 第2の歪み計算手段、61 歪み評価手段、62、86 周期強調係数計算手段、63、87 音声様態判定手段、64、88 周期強調係数計算手段、71 分離手段、72 線形予測係数復号化手段(スペクトル包絡情報復号化手段)、73 適応音源復号化手段(音源情報復号化手段)、74 駆動音源復号化手段(音源情報復号化手段)、75 ゲイン復号化手段(音源情報復号化手段)、76、77 乗算器(音源情報復号化手段)、78 加算器(音源情報復号化手段)、79 合成フィルタ、80 駆動音源復号化手段(音源情報復号化手段)、81 周期強調係数復号化手段、91 駆動音源復号化手段(音源情報復号化手段)。
Claims (18)
- 入力音声のスペクトル包絡情報を抽出し、そのスペクトル包絡情報を符号化するスペクトル包絡情報符号化手段と、上記スペクトル包絡情報符号化手段により抽出されたスペクトル包絡情報を用いて符号化歪みが最小になる合成音を生成する適応音源符号、駆動音源符号及びゲイン符号を決定する音源情報符号化手段と、上記スペクトル包絡情報符号化手段により符号化されたスペクトル包絡情報と上記音源情報符号化手段により決定された適応音源符号、駆動音源符号及びゲイン符号とを多重化して音声符号を出力する多重化手段とを備えた音声符号化装置において、上記音源情報符号化手段は複数の駆動音源符号帳に格納されている駆動符号ベクトルの符号化歪みを評価して駆動音源符号を決定する駆動音源符号化手段を備えるとともに、その駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化手段と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化手段とを備えることを特徴とする音声符号化装置。
- 入力音声のスペクトル包絡情報を抽出し、そのスペクトル包絡情報を符号化するスペクトル包絡情報符号化工程と、上記スペクトル包絡情報符号化工程で抽出されたスペクトル包絡情報を用いて符号化歪みが最小になる合成音を生成する適応音源符号、駆動音源符号及びゲイン符号を決定する音源情報符号化工程と、上記スペクトル包絡情報符号化工程で符号化されたスペクトル包絡情報と上記音源情報符号化工程で決定された適応音源符号、駆動音源符号及びゲイン符号とを多重化して音声符号を出力する多重化工程とを備えた音声符号化方法において、上記音源情報符号化工程では複数の駆動音源符号帳に格納されている駆動符号ベクトルの符号化歪みを評価して駆動音源符号を決定する駆動音源符号化工程を備えるとともに、その駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化工程と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化工程とを備えることを特徴とする音声符号化方法。
- 入力音声を分析して第1の周期強調係数を決定することを特徴とする請求項2記載の音声符号化方法。
- 音声符号から第1の周期強調係数を決定することを特徴とする請求項2記載の音声符号化方法。
- 音声の様態を判定し、その判定結果に応じて第1の周期強調係数を決定することを特徴とする請求項3または請求項4記載の音声符号化方法。
- 音声の摩擦音区間を判定し、その摩擦音区間では第1の周期強調係数の強調度合を弱めることを特徴とする請求項5記載の音声符号化方法。
- 音声の有声定常区間を判定し、その有声定常区間では第1の周期強調係数の強調度合を強めることを特徴とする請求項5記載の音声符号化方法。
- 駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用することを特徴とする請求項2から請求項7のうちのいずれか1項記載の音声符号化方法。
- 駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用することを特徴とする請求項2から請求項7のうちのいずれか1項記載の音声符号化方法。
- 音声符号からスペクトル包絡情報と音源情報である適応音源符号、駆動音源符号及びゲイン符号を分離する分離手段と、上記分離手段により分離されたスペクトル包絡情報を復号化するスペクトル包絡情報復号化手段と、上記分離手段により分離された適応音源符号、駆動音源符号及びゲイン符号から音源信号を復号化する音源情報復号化手段とを備えた音声復号化装置において、上記音源情報復号化手段は複数の駆動音源符号帳に格納されている駆動符号ベクトルの中から駆動音源符号に対応する駆動符号ベクトルを抽出する駆動音源復号化手段を備えるとともに、その駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化手段と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化手段とを備えることを特徴とする音声復号化装置。
- 音声符号からスペクトル包絡情報と音源情報である適応音源符号、駆動音源符号及びゲイン符号を分離する分離工程と、上記分離工程で分離されたスペクトル包絡情報を復号化するスペクトル包絡情報復号化工程と、上記分離工程で分離された適応音源符号、駆動音源符号及びゲイン符号から音源信号を復号化する音源情報復号化工程とを備えた音声復号化方法において、上記音源情報復号化工程では複数の駆動音源符号帳に格納されている駆動符号ベクトルの中から駆動音源符号に対応する駆動符号ベクトルを抽出する駆動音源復号化工程を備えるとともに、その駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第1の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第1の周期化工程と、予め設定された第2の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第2の周期化工程とを備えることを特徴とする音声復号化方法。
- 音声符号に含まれている周期強調係数の符号を復号化して第1の周期強調係数を求めることを特徴とする請求項11記載の音声復号化方法。
- 音声符号から第1の周期強調係数を決定することを特徴とする請求項11記載の音声復号化方法。
- 音声の様態を判定し、その判定結果に応じて第1の周期強調係数を決定することを特徴とする請求項13記載の音声復号化方法。
- 音声の摩擦音区間を判定し、その摩擦音区間では第1の周期強調係数の強調度合を弱めることを特徴とする請求項14記載の音声復号化方法。
- 音声の有声定常区間を判定し、その有声定常区間では第1の周期強調係数の強調度合を強めることを特徴とする請求項14記載の音声復号化方法。
- 駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用することを特徴とする請求項11から請求項16のうちのいずれか1項記載の音声復号化方法。
- 駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第1の周期化工程又は第2の周期化工程の何れか一方を当該駆動音源符号帳に適用することを特徴とする請求項11から請求項16のうちのいずれか1項記載の音声復号化方法。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001067631A JP3566220B2 (ja) | 2001-03-09 | 2001-03-09 | 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 |
TW091103258A TW550541B (en) | 2001-03-09 | 2002-02-25 | Speech encoding apparatus, speech encoding method, speech decoding apparatus, and speech decoding method |
IL14841302A IL148413A0 (en) | 2001-03-09 | 2002-02-27 | Speech encoding apparatus, speech encoding method, speech decoding apparatus, and speech decoding method |
US10/083,556 US7006966B2 (en) | 2001-03-09 | 2002-02-27 | Speech encoding apparatus, speech encoding method, speech decoding apparatus, and speech decoding method |
EP02004644A EP1239464B1 (en) | 2001-03-09 | 2002-02-28 | Enhancement of the periodicity of the CELP excitation for speech coding and decoding |
DE60201766T DE60201766T2 (de) | 2001-03-09 | 2002-02-28 | Verbesserung der Periodizität der CELP-Anregung für die Sprachkodierung und -dekodierung |
CNB021069808A CN1172294C (zh) | 2001-03-09 | 2002-03-08 | 音频编码装置、音频编码方法、音频解码装置及音频解码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001067631A JP3566220B2 (ja) | 2001-03-09 | 2001-03-09 | 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002268690A JP2002268690A (ja) | 2002-09-20 |
JP3566220B2 true JP3566220B2 (ja) | 2004-09-15 |
Family
ID=18925954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001067631A Expired - Fee Related JP3566220B2 (ja) | 2001-03-09 | 2001-03-09 | 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7006966B2 (ja) |
EP (1) | EP1239464B1 (ja) |
JP (1) | JP3566220B2 (ja) |
CN (1) | CN1172294C (ja) |
DE (1) | DE60201766T2 (ja) |
IL (1) | IL148413A0 (ja) |
TW (1) | TW550541B (ja) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7996234B2 (en) * | 2003-08-26 | 2011-08-09 | Akikaze Technologies, Llc | Method and apparatus for adaptive variable bit rate audio encoding |
US7329383B2 (en) | 2003-10-22 | 2008-02-12 | Boston Scientific Scimed, Inc. | Alloy compositions and devices including the compositions |
US8090586B2 (en) | 2005-05-26 | 2012-01-03 | Lg Electronics Inc. | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
WO2006126844A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
US8185403B2 (en) | 2005-06-30 | 2012-05-22 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
WO2007004828A2 (en) | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
JP2009500656A (ja) | 2005-06-30 | 2009-01-08 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
JP5173811B2 (ja) | 2005-08-30 | 2013-04-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
JP4859925B2 (ja) | 2005-08-30 | 2012-01-25 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
US7788107B2 (en) | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
WO2007055463A1 (en) | 2005-08-30 | 2007-05-18 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
KR100857105B1 (ko) | 2005-09-14 | 2008-09-05 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
US7696907B2 (en) | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7672379B2 (en) | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
US7646319B2 (en) | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
KR100878828B1 (ko) | 2005-10-05 | 2009-01-14 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7751485B2 (en) | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
CN101283250B (zh) | 2005-10-05 | 2013-12-04 | Lg电子株式会社 | 信号处理的方法和装置以及编码和解码方法及其装置 |
US7653533B2 (en) | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
US7752053B2 (en) | 2006-01-13 | 2010-07-06 | Lg Electronics Inc. | Audio signal processing using pilot based coding |
WO2007083953A1 (en) | 2006-01-19 | 2007-07-26 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
KR100885700B1 (ko) | 2006-01-19 | 2009-02-26 | 엘지전자 주식회사 | 신호 디코딩 방법 및 장치 |
TWI329465B (en) | 2006-02-07 | 2010-08-21 | Lg Electronics Inc | Apparatus and method for encoding / decoding signal |
TWI333795B (en) | 2006-02-23 | 2010-11-21 | Lg Electronics Inc | Method and apparatus for processing a audio signal |
TWI483619B (zh) | 2006-03-30 | 2015-05-01 | Lg Electronics Inc | 一種媒體訊號的編碼/解碼方法及其裝置 |
US20080235006A1 (en) | 2006-08-18 | 2008-09-25 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
US7780798B2 (en) | 2006-10-13 | 2010-08-24 | Boston Scientific Scimed, Inc. | Medical devices including hardened alloys |
EP2116997A4 (en) * | 2007-03-02 | 2011-11-23 | Panasonic Corp | AUDIO DECODING DEVICE AND AUDIO DECODING METHOD |
US8423371B2 (en) * | 2007-12-21 | 2013-04-16 | Panasonic Corporation | Audio encoder, decoder, and encoding method thereof |
US9208798B2 (en) * | 2012-04-09 | 2015-12-08 | Board Of Regents, The University Of Texas System | Dynamic control of voice codec data rate |
US20140046670A1 (en) * | 2012-06-04 | 2014-02-13 | Samsung Electronics Co., Ltd. | Audio encoding method and apparatus, audio decoding method and apparatus, and multimedia device employing the same |
US11430464B2 (en) * | 2018-01-17 | 2022-08-30 | Nippon Telegraph And Telephone Corporation | Decoding apparatus, encoding apparatus, and methods and programs therefor |
CN111602196B (zh) * | 2018-01-17 | 2023-08-04 | 日本电信电话株式会社 | 编码装置、解码装置、它们的方法及计算机可读记录介质 |
JP6962269B2 (ja) * | 2018-05-10 | 2021-11-05 | 日本電信電話株式会社 | ピッチ強調装置、その方法、およびプログラム |
JP6962268B2 (ja) * | 2018-05-10 | 2021-11-05 | 日本電信電話株式会社 | ピッチ強調装置、その方法、およびプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3192051B2 (ja) | 1994-07-28 | 2001-07-23 | 日本電気株式会社 | 音声符号化装置 |
JP3328080B2 (ja) | 1994-11-22 | 2002-09-24 | 沖電気工業株式会社 | コード励振線形予測復号器 |
JP3206497B2 (ja) * | 1997-06-16 | 2001-09-10 | 日本電気株式会社 | インデックスによる信号生成型適応符号帳 |
EP2154681A3 (en) | 1997-12-24 | 2011-12-21 | Mitsubishi Electric Corporation | Method and apparatus for speech decoding |
JP4308345B2 (ja) | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6556966B1 (en) * | 1998-08-24 | 2003-04-29 | Conexant Systems, Inc. | Codebook structure for changeable pulse multimode speech coding |
-
2001
- 2001-03-09 JP JP2001067631A patent/JP3566220B2/ja not_active Expired - Fee Related
-
2002
- 2002-02-25 TW TW091103258A patent/TW550541B/zh not_active IP Right Cessation
- 2002-02-27 IL IL14841302A patent/IL148413A0/xx unknown
- 2002-02-27 US US10/083,556 patent/US7006966B2/en not_active Expired - Fee Related
- 2002-02-28 DE DE60201766T patent/DE60201766T2/de not_active Expired - Lifetime
- 2002-02-28 EP EP02004644A patent/EP1239464B1/en not_active Expired - Fee Related
- 2002-03-08 CN CNB021069808A patent/CN1172294C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1375818A (zh) | 2002-10-23 |
EP1239464A2 (en) | 2002-09-11 |
JP2002268690A (ja) | 2002-09-20 |
CN1172294C (zh) | 2004-10-20 |
EP1239464A3 (en) | 2004-01-28 |
DE60201766T2 (de) | 2005-12-01 |
US20020128829A1 (en) | 2002-09-12 |
TW550541B (en) | 2003-09-01 |
DE60201766D1 (de) | 2004-12-09 |
EP1239464B1 (en) | 2004-11-03 |
IL148413A0 (en) | 2002-09-12 |
US7006966B2 (en) | 2006-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3566220B2 (ja) | 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 | |
US5864798A (en) | Method and apparatus for adjusting a spectrum shape of a speech signal | |
JP3404024B2 (ja) | 音声符号化方法および音声符号化装置 | |
WO1998006091A1 (fr) | Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications | |
KR101797679B1 (ko) | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 | |
KR100218214B1 (ko) | 음성 부호화 장치 및 음성 부호화 복호화 장치 | |
EP1096476B1 (en) | Speech signal decoding | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
JP3404016B2 (ja) | 音声符号化装置及び音声符号化方法 | |
CN107945813B (zh) | 解码方法、解码装置、和计算机可读取的记录介质 | |
JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
JP3579276B2 (ja) | 音声符号化/復号化方法 | |
JP3510643B2 (ja) | 音声信号のピッチ周期処理方法 | |
JP4510977B2 (ja) | 音声符号化方法および音声復号化方法とその装置 | |
JP3785363B2 (ja) | 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法 | |
JP3319556B2 (ja) | ホルマント強調方法 | |
JPH08234795A (ja) | 音声符号化装置 | |
JPH11272297A (ja) | ピッチ強調方法及びその装置 | |
JPH0990997A (ja) | 音声符号化装置、音声復号化装置、音声符号化復号化方法および複合ディジタルフィルタ | |
JP3954050B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP3199128B2 (ja) | 音声の符号化方法 | |
JP3576805B2 (ja) | 音声符号化方法及びシステム並びに音声復号化方法及びシステム | |
JPH0426119B2 (ja) | ||
JPH09185396A (ja) | 音声符号化装置 | |
JPH0426120B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040609 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3566220 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080618 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080618 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090618 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100618 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100618 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110618 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120618 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130618 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |