JP2004061558A - Method and device for code conversion between speed encoding and decoding systems and storage medium therefor - Google Patents
Method and device for code conversion between speed encoding and decoding systems and storage medium therefor Download PDFInfo
- Publication number
- JP2004061558A JP2004061558A JP2002215766A JP2002215766A JP2004061558A JP 2004061558 A JP2004061558 A JP 2004061558A JP 2002215766 A JP2002215766 A JP 2002215766A JP 2002215766 A JP2002215766 A JP 2002215766A JP 2004061558 A JP2004061558 A JP 2004061558A
- Authority
- JP
- Japan
- Prior art keywords
- gain
- code
- acb
- fcb
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 186
- 238000006243 chemical reaction Methods 0.000 title claims description 129
- 230000005284 excitation Effects 0.000 claims description 126
- 238000004364 calculation method Methods 0.000 claims description 115
- 230000005236 sound signal Effects 0.000 claims description 49
- 238000012937 correction Methods 0.000 claims description 48
- 238000000926 separation method Methods 0.000 claims description 47
- 238000011156 evaluation Methods 0.000 claims description 44
- 230000004044 response Effects 0.000 claims description 40
- 230000007774 longterm Effects 0.000 claims description 35
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 16
- 238000003786 synthesis reaction Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 22
- 238000013139 quantization Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 2
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 description 1
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、音声信号を低ビットレートで伝送あるいは蓄積するための符号化及び復号方法に関し、特に、異なる符号化復号方式を用いて音声通信を行うに際し、音声をある方式により符号化して得た符号を、他の方式により復号可能な符号に高音質かつ低演算量で変換する、符号変換方法及び装置ならびにその記録媒体に関する。
【0002】
【従来の技術】
音声信号を中低ビットレートで高能率に符号化する方法として、音声信号を線形予測(Linear Prediction: LP)フィルタとそれを駆動する励振信号に分離して符号化する方法が広く用いられている。その代表的な方法の一つにCode Excited Linear Prediction(符号励振線形予測:「CELP」という)がある。CELPでは、入力音声の周波数特性を表すLP係数が設定されたLPフィルタを、入力音声のピッチ周期を表す適応コードブック(Adaptive Codebook: 「ACB」という)と、乱数やパルスから成る固定コードブック(Fixed Codebook: 「FCB」という)との和で表される励振信号により駆動することで、合成音声信号が得られる。このとき、前記ACB成分と前記FCB成分には各々ゲイン(「ACBゲイン」と「FCBゲイン」)を乗ずる。なお、CELPに関してはM. SchroederとB.S.Atalによる「Code excited linear prediction: High quality speech at very low bit rates」(Proc. of IEEE Int. Conf.on Acoust., Speech and Signal Processing, pp.937−940, 1985)(「文献1」という)が参照される。
【0003】
ところで、例えば3G移動体網と有線パケット網間の相互接続を想定した場合、各網で用いられる標準音声符号化方式が異なるため、直接接続できないという問題がある。これに対する最も簡単な解法はタンデム接続である。しかしながら、タンデム接続では、一方の標準方式を用いて音声を符号化して得た符号列からその標準方式を用いて音声信号を一旦復号し、この復号された音声信号を他方の標準方式を用いて再度符号化を行う。このため、各音声符号化復号方式で符号化と復号を一度だけ行う場合に比べて、一般に音質の低下、遅延の増加、計算量の増加を招くという問題がある。
【0004】
これに対して、一方の標準方式を用いて音声を符号化して得た符号を他方の標準方式により復号可能な符号に、符号領域又は符号化パラメータ領域で変換する、符号変換方式は前述の問題に対し有効である。符号を変換する方法については、Hong−Goo Kangらによる「Improving Transcoding Capability of Speech Coders in Clean and Frame Erasured Channel Environments」 (Proc. of IEEE Workshop on Speech Coding 2000, pp.78−80, 2000)(「文献2」という)が参照される。
【0005】
図12は、第1の音声符号化方式(「方式A」という)を用いて音声を符号化して得た符号を、第2の方式(「方式B」という)により復号可能な符号に変換する、符号変換装置の構成の一例を示す図である。図12を参照すると、符号変換装置は、入力端子10と、符号分離回路1010と、LP係数符号変換回路100と、ACB符号変換回路200と、FCB符号変換回路300と、ゲイン符号変換回路400と、符号多重回路1020と、出力端子20とを備えている。図12を参照して、従来の符号変換装置の各構成要素について説明する。
【0006】
入力端子10から、方式Aにより音声を符号化して得た第1の符号列を入力する。
【0007】
符号分離回路1010は、入力端子10から入力した第1の符号列から、LP係数、ACB、FCB、ACBゲイン及びFCBゲインに対応する符号、すなわちLP係数符号、ACB符号、FCB符号、ゲイン符号を分離する。ここで、ACBゲインとFCBゲインはまとめて符号化復号されるものとし、簡単のため、これをゲイン、その符号をゲイン符号と呼ぶことにする。また、LP係数符号、ACB符号、FCB符号、ゲイン符号を各々第1のLP係数符号、第1のACB符号、第1のFCB符号、第1のゲイン符号と呼ぶことにする。そして、第1のLP係数符号をLP係数符号変換回路100へ出力し、第1のACB符号をACB符号変換回路200へ出力し、第1のFCB符号をFCB符号変換回路300へ出力し、第1のゲイン符号をゲイン符号変換回路400へ出力する。
【0008】
LP係数符号変換回路100は、符号分離回路1010から出力される第1のLP係数符号を入力し、第1のLP係数符号を方式Bにより復号可能な符号に変換する。この変換されたLP係数符号を、第2のLP係数符号として符号多重回路1020へ出力する。
【0009】
ACB符号変換回路200は、符号分離回路1010から出力される第1のACB符号を入力し、第1のACB符号を方式Bにより復号可能な符号に変換する。この変換されたACB符号を、第2のACB符号として符号多重回路1020へ出力する。
【0010】
FCB符号変換回路300は、符号分離回路1010から出力される第1のFCB符号を入力し、第1のFCB符号を方式Bにより復号可能な符号に変換する。この変換されたFCB符号を、第2のFCB符号として符号多重回路1020へ出力する。
【0011】
ゲイン符号変換回路400は、符号分離回路1010から出力される第1のゲイン符号を入力し、第1のゲイン符号を方式Bにより復号可能な符号に変換する。この変換されたゲイン符号を、第2のゲイン符号として符号多重回路1020へ出力する。
【0012】
各変換回路のより具体的な動作を以下に説明する。
【0013】
LP係数符号変換回路100は、符号分離回路1010から入力した第1のLP係数符号を、方式AにおけるLP係数復号方法により復号して、第1のLP係数を得る。次に、LP係数符号変換回路100は、第1のLP係数を、方式BにおけるLP係数の量子化方法及び符号化方法により量子化及び符号化して第2のLP係数符号を得る。そして、LP係数符号変換回路100は、第2のLP係数符号を方式BにおけるLP係数復号方法により復号可能な符号として符号多重回路1020へ出力する。
【0014】
ACB符号変換回路200は、符号分離回路1010から入力した第1のACB符号を、方式Aにおける符号と方式Bにおける符号との対応関係を用いて読み替えることにより、第2のACB符号を得る。そして、ACB符号変換回路200は、第2のACB符号を方式BにおけるACB復号方法により復号可能な符号として符号多重回路1020へ出力する。
【0015】
FCB符号変換回路300は、符号分離回路1010から入力した第1のFCB符号を、方式Aにおける符号と方式Bにおける符号との対応関係を用いて読み替えることにより、第2のFCB符号を得る。そして、FCB符号変換回路300は、第2のFCB符号を方式BにおけるFCB復号方法により復号可能な符号として符号多重回路1020へ出力する。
【0016】
ゲイン符号変換回路400は、符号分離回路1010から入力した第1のゲイン符号を、方式Aにおけるゲイン復号方法により復号して、第1のゲインを得る。次に、ゲイン符号変換回路400は、第1のゲインを、方式Bにおけるゲインの量子化方法及び符号化方法により量子化及び符号化して、第2のゲインとその符号(第2のゲイン符号)を得る。そして、ゲイン符号変換回路400は、第2のゲイン符号を方式Bにおけるゲイン復号方法により復号可能な符号として符号多重回路1020へ出力する。
【0017】
符号多重回路1020は、LP係数符号変換回路100から出力される第2のLP係数符号と、ACB符号変換回路200から出力される第2のACB符号と、FCB符号変換回路300から出力される第2のFCB符号と、ゲイン符号変換回路400から出力される第2のゲイン符号を入力し、これらを多重化して得られる符号列を第2の符号列として出力端子20を介して出力する。以上により図12の説明を終える。
【0018】
【発明が解決しようとする課題】
しかしながら、図12を参照して説明した従来の符号変換装置は、非音声区間における背景雑音の音質が劣化する、という問題点を有している。
【0019】
その理由は、非音声区間において背景雑音エネルギーの時間変動が大きいためである。これは、第1のゲインを再量子化することによって得られる第2のゲインが、非音声区間において時間的に大きく変動することに起因する。
【0020】
したがって、本発明は、上記問題点に鑑みてなされたものであって、その主たる目的は、非音声区間における背景雑音音質の劣化を低減できる装置及び方法ならびにそのプログラムを記録した記録媒体を提供することにある。これ以外の本発明の目的、特徴、利点等は以下の説明から、当業者には直ちに明らかとされるであろう。
【0021】
【課題を解決するための手段】
前記目的を達成する、本発明の第1のアスペクトに係る方法は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法において、前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成するステップと、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づき最適ゲインを計算するステップと、前記最適ゲインを修正するステップと、修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるステップと、を含む。本発明に係る方法において、最適ゲインは、好ましくは、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲインとして求められる。
【0022】
本発明の第2のアスペクトに係る方法は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法において、前記第1の符号列からゲイン情報を復号するステップと、復号されたゲイン(復号ゲイン)を修正するステップと、修正された復号ゲイン(修正復号ゲイン)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるステップ、を含む。
【0023】
上記第1のアスペクトに係る発明において、好ましくは、前記修正最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0024】
上記第2のアスペクトに係る発明において、好ましくは、前記修正復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0025】
上記第1のアスペクトに係る発明において、好ましくは、前記修正最適ゲインが、前記最適ゲインの長時間平均に基づく。
【0026】
上記第2のアスペクトに係る発明において、好ましくは、前記修正復号ゲインが、前記復号ゲインの長時間平均に基づく。
【0027】
本発明の第3のアスペクトに係る装置は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置において、前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成する音声復号回路と、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づき、最適ゲインを計算する最適ゲイン計算回路と、前記最適ゲインを修正する最適ゲイン修正回路と、修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるゲイン符号化回路、を含む。本発明に係る装置において、最適ゲイン計算回路は、好ましくは、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲインを最適ゲインとして求める。
【0028】
本発明の第4のアスペクトに係る装置は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置において、前記第1の符号列からゲイン情報を復号するゲイン復号回路と、復号されたゲイン(復号ゲイン)を修正する復号ゲイン修正回路と、修正された復号ゲイン(修正復号ゲイン)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるゲイン符号化回路、を含む。
【0029】
上記第3のアスペクトに係る発明において、ゲイン符号化回路は、好ましくは、前記修正最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0030】
上記第4のアスペクトに係る発明において、ゲイン符号化回路は、好ましくは、前記修正復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0031】
上記第3のアスペクトに係る発明の最適ゲイン修正回路において、好ましくは、前記修正最適ゲインが、前記最適ゲインの長時間平均に基づく。
【0032】
上記第4のアスペクトに係る発明の復号ゲイン修正回路において、好ましくは、前記修正復号ゲインが、前記復号ゲインの長時間平均に基づく。
【0033】
本発明の第5のアスペクトに係るプログラムは、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置を構成するコンピュータに、
(a)前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成する処理と、
(b)第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づきゲイン(最適ゲイン)を計算する処理と、
(c)前記最適ゲインを修正する処理と、
(d)修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める処理、を実行させるためのプログラムを提供する。本発明において、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲインを最適ゲインとして求める。
【0034】
本発明の第6のアスペクトに係るプログラムは、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置を構成するコンピュータに、
(a)前記第1の符号列からゲイン情報を復号する処理と、
(b)復号されたゲイン(復号ゲイン)を修正する処理と、
(c)修正された復号ゲイン(修正復号ゲイン)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める処理、を実行させるためのプログラムを提供する。
【0035】
上記第5のアスペクトに係る発明のプログラムにおいて、好ましくは、前記修正最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0036】
上記第6のアスペクトに係る発明のプログラムにおいて、好ましくは、前記修正復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0037】
上記第5のアスペクトに係る発明のプログラムにおいて、好ましくは、前記修正最適ゲインが、前記最適ゲインの長時間平均に基づく。
【0038】
上記第6のアスペクトに係る発明のプログラムにおいて、好ましくは、前記修正復号ゲインが、前記復号ゲインの長時間平均に基づく。
【0039】
本願の第7のアスペクトに係る発明は、前記第5及び第6のアスペクトに係る発明の前記プログラムを記録した記録媒体を提供する。
【0040】
【発明の実施の形態】
以下本発明の実施の形態について説明する。まず本発明の装置と方法の概要と原理を説明したあと、実施例について以下に詳細に説明する。
【0041】
本発明に係る符号変換装置において、音声復号回路(1500)は、第1の方式に準拠する第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成し、ゲイン符号生成回路(1400)は、第2の方式に準拠する第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲイン(最適ゲイン)を計算し、前記最適ゲインを修正し、修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める。
【0042】
本発明に係る方法は以下のステップを有する。
【0043】
ステップa:第1の符号列から第1の線形予測係数を得る。
【0044】
ステップb:第1の符号列から励振信号の情報を得る。
【0045】
ステップc:励振信号の情報から励振信号を得る。
【0046】
ステップd:第1の線形予測係数をもつフィルタを前記励振信号によって駆動することで第1の音声信号を生成する。
【0047】
ステップe:第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲイン(最適ゲイン)を計算する。
【0048】
ステップf:前記最適ゲインを修正する。
【0049】
ステップg:修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める。
【0050】
本発明では、非音声区間において、第2のゲインの時間変動が小さくなるような評価関数を用いて、前記第2のゲインを求める。
【0051】
このため、前記非音声区間において、得られた第2のゲインの時間変動は小さくなり、同区間での背景雑音エネルギーの時間変動が小さくなる。
【0052】
その結果、前記非音声区間における背景雑音音質の劣化を低減できる。
【0053】
【実施例】
次に、本発明の実施例について図面を参照して詳細に説明する。
【0054】
図1は、本発明による符号変換装置の第1の実施例の構成を示す図である。図1において、図12と同一又は同等の要素には、同一の参照符号が付されている。図1を参照すると、入力端子10と、符号分離回路1010と、LP係数符号変換回路1100と、LSP−LPC変換回路1110と、インパルス応答計算回路1120と、ACB符号変換回路1200と、目標信号計算回路1700と、FCB符号生成回路1800と、ゲイン符号生成回路1400と、音声復号回路1500と、第2の励振信号計算回路1610と、第2の励振信号記憶回路1620と、符号多重回路1020と、出力端子20とを備えている。入力端子10、出力端子20、符号分離回路1010、符号多重回路1020は、結線の一部が分岐する以外は、基本的に、図12に示した要素と同じである。以下では、上述した同一又は同等の要素の説明は省略し、主に、図12に示した構成との相違点について説明する。
【0055】
また、方式Aにおいて、LP係数の符号化は、
msec周期(フレーム)毎に行われ、ACB、FCB及びゲインなど励振信号の構成要素の符号化は、
msec周期(サブフレーム)毎に行われるものとする。
【0056】
一方、方式Bにおいては、LP係数の符号化は、
msec周期(フレーム)毎に行われ、励振信号の構成要素の符号化は、
msec周期(サブフレーム)毎に行われるものとする。
【0057】
また、方式Aのフレーム長、サブフレーム数、及びサブフレーム長を、それぞれ、
、
及び
とする。
【0058】
方式Bのフレーム長、サブフレーム数、及び、サブフレーム長を、それぞれ、
、
及び、
とする。
【0059】
以下の説明では、簡単のため、
とする。
【0060】
ここで、例えば、サンプリング周波数を、8000Hzとし、
及び
を10 msecとすれば、
及び
は160サンプル、
及び
は80サンプルとなる。
【0061】
LP係数符号変換回路1100は、符号分離回路1010から第1のLP係数符号を入力する。ここで、「3GPP AMR Speech Codec」(文献3)や、ITU−T勧告G.729など多くの標準方式では、LP係数を線スペクトル対(Line Spectral Pair: LSP)で表現し、LSPを符号化及び復号することが多いため、LP係数の符号化及び復号は、LSP領域で行われるとする。LP係数からLSPへの変換、及びLSPからLP係数への変換については、周知の方法、例えば「文献3」の第5.2.3節及び第5.2.4節の記載が参照される。LP係数符号変換回路1100は、前記第1のLP係数符号を方式AにおけるLSP復号方法により復号して、第1のLSPを得る。
【0062】
次に、LP係数符号変換回路1100は、前記第1のLSPを、方式BにおけるLSP量子化方法及び符号化方法により量子化及び符号化して、第2のLSPとこれに対応する符号(第2のLP係数符号)を得る。そして、LP係数符号変換回路1100は、前記第2のLP係数符号を方式BにおけるLSP復号方法により復号可能な符号として符号多重回路1020へ出力し、前記第1のLSPと第2のLSPをLSP−LPC変換回路1110へ出力する。
【0063】
図2は、LP係数符号変換回路1100の構成を示す図である。図2を参照すると、LP係数符号変換回路1100は、LSP復号回路110と、第1のLSPコードブック111と、LSP係数符号化回路130と、第2のLSPコードブック131とを備えている。図2を参照して、LP係数符号変換回路1100の各構成要素について説明する。
【0064】
LSP復号回路110は、LP係数符号から対応するLSPを復号する。LSP復号回路110は、複数セットのLSPが格納された第1のLSPコードブック111を備えており、符号分離回路1010から出力される第1のLP係数符号を、入力端子31を介して入力し、第1のLP係数符号に対応するLSPを第1のLSPコードブック111より読み出し、読み出されたLSPを第1のLSPとしてLSP符号化回路130へ出力するとともに、出力端子33を介してLSP−LPC変換回路1110へ出力する。ここで、LP係数符号からのLSPの復号は、方式AにおけるLSPの復号方法に従い、方式AのLSPコードブックを用いる。
【0065】
LSP符号化回路130は、LSP復号回路110から出力される第1のLSPを入力し、複数セットのLSPが格納された第2のLSPコードブック131から第2のLSPとそれに対応するLP係数符号の各々を順次読み込み、第1のLSPとの誤差が最小となる第2のLSPを選択し、それに対応するLP係数符号を、第2のLP係数符号として出力端子32を介して符号多重回路1020へ出力し、第2のLSPを出力端子34を介してLSP−LPC変換回路1110へ出力する。ここで、第2のLSPの選択方法、すなわちLSPの量子化及び符号化方法は、方式BにおけるLSPの量子化方法及び符号化方法に従い、方式BのLSPコードブックを用いる。ここで、LSPの量子化及び符号化については、例えば「文献3」の第5.2.5節の記載が参照される。
【0066】
以上により、図2によるLP係数符号変換回路1100の説明を終え、再び図1の説明に戻る。
【0067】
LSP−LPC変換回路1110は、LP係数符号変換回路1100から出力される第1のLSPと第2のLSPとを入力し、第1のLSPを第1のLP係数a1,iに変換し、第2のLSPを第2のLP係数a2,iに変換し、第1のLP係数a1,iを目標信号計算回路1700と、音声復号回路1500と、インパルス応答計算回路1120へ出力し、第2のLP係数a2,iを目標信号計算回路1700とインパルス応答計算回路1120へ出力する。ここで、LSPからLP係数への変換については、「文献3」の第5.2.4節の記載が参照される。
【0068】
ACB符号変換回路1200は、符号分離回路1010から入力した第1のACB符号を、方式Aにおける符号と方式Bにおける符号との対応関係を用いて読み替えることにより、第2のACB符号を得る。そして、ACB符号変換回路1200は、第2のACB符号を方式BにおけるACB復号方法により復号可能な符号として符号多重回路1020へ出力する。また、ACB符号変換回路1200は、第2のACB符号に対応するACB遅延を第2のACB遅延として目標信号計算回路1700へ出力する。
【0069】
ここで、図3を参照して、符号の読み替えについて説明する。例えば、方式AにおけるACB符号
が56のとき、これに対応するACB遅延
が76であるとする。方式Bでは、ACB符号
が53のとき、これに対応するACB遅延
が76であるとすると、ACB遅延の値が同一(この場合では76)となるように、方式Aから方式BへとACB符号を変換するには、方式AにおけるACB符号56を方式BにおけるACB符号53に対応付ければよい。以上により、符号の読み替えについての説明を終え、再び図1の説明に戻る。
【0070】
音声復号回路1500は、符号分離回路1010から出力される第1のACB符号、第1のFCB符号、第1のゲイン符号を入力し、LSP−LPC変換回路1110から第1のLP係数を入力する。次に、音声復号回路1500は、方式Aにおける、ACB信号復号方法、FCB信号復号方法及びゲイン復号方法の各々を用いて、第1のACB符号、第1のFCB符号及び第1のゲイン符号の各々から、ACB遅延、FCB信号及びゲインの各々を復号し、各々を第1のACB遅延、第1のFCB信号及び第1のゲインとする。音声復号回路1500は、第1のACB遅延を用いてACB信号を生成し、これを第1のACB信号とする。そして、音声復号回路1500は、第1のACB信号、第1のFCB信号及び第1のゲインと、第1のLP係数とから、音声を生成し、音声を目標信号計算回路1700へ出力する。
【0071】
図4は、音声復号回路1500の構成を示す図である。図4を参照すると、音声復号回路1500は、ACB復号回路1510と、FCB復号回路1520と、ゲイン復号回路1530とを有する励振信号情報復号回路1600と、励振信号計算回路1540と、励振信号記憶回路1570と、合成フィルタ1580を備えている。図4を参照して、音声復号回路1500の各構成要素について説明する。
【0072】
励振信号情報復号回路1600は、励振信号の情報に対応する符号から励振信号の情報を復号する。符号分離回路1010から出力される第1のACB符号、第1のFCB符号及び第1のゲイン符号を各々入力端子51、52及び53を介して入力し、第1のACB符号、第1のFCB符号及び第1のゲイン符号の各々から、ACB遅延、FCB信号及びゲインの各々を復号し、各々を第1のACB遅延、第1のFCB信号及び第1のゲインとする。ここで、第1のゲインは、ACBゲインとFCBゲインとからなり、各々を第1のACBゲインと第1のFCBゲインとする。また、励振信号情報復号回路1600は、励振信号記憶回路1570から出力される過去の励振信号を入力する。励振信号情報復号回路1600は、過去の励振信号と第1のACB遅延とを用いてACB信号を生成し、これを第1のACB信号とする。そして、励振信号情報復号回路1600は、第1のACB信号、第1のFCB信号、第1のACBゲイン及び第1のFCBゲインを、励振信号計算回路1540へ出力する。
【0073】
次に、励振信号情報復号回路1600の構成要素であるACB復号回路1510、FCB復号回路1520、及びゲイン復号回路1530について詳細に説明する。
【0074】
ACB復号回路1510は、符号分離回路1010から出力される第1のACB符号を、入力端子51を介して入力し、励振信号記憶回路1570から出力される過去の励振信号を入力する。次に、ACB復号回路1510は、上述したACB符号変換回路1200と同様にして、図3に示す方式AにおけるACB 符号とACB遅延の対応関係を用いて、第1のACB 符号に対応する第1のACB遅延
を得る。励振信号において、現サブフレームの始点より
サンプル過去の点から、サブフレーム長に相当する
サンプルの信号を切り出して、第1のACB信号を生成する。ここで、
が
よりも小さい場合には、
サンプル分のベクトルを切り出し、このベクトルを繰り返し接続して、長さ
サンプルの信号とする。そして、第1のACB信号を励振信号計算回路1540へ出力する。ここで、第1のACB信号を生成する方法の詳細については、「文献3」の第6.1節及び第5.6節の記載が参照される。
【0075】
FCB復号回路1520は、符号分離回路1010から出力される第1のFCB符号を、入力端子52を介して入力し、第1のFCB符号に対応する第1のFCB信号を、励振信号計算回路1540へ出力する。FCB信号は、パルス位置とパルス極性で規定されるマルチパルス信号により表現されており、第1のFCB符号はパルス位置に対応する符号(パルス位置符号)とパルス極性に対応する符号(パルス極性符号)とからなる。ここで、マルチパルス信号により表現されたFCB信号を生成する方法の詳細については、「文献3」の第6.1節及び第5.7節の記載が参照される。
【0076】
ゲイン復号回路1530は、符号分離回路1010から出力される第1のゲイン符号を、入力端子53を介して入力する。ゲイン復号回路1530は、複数のゲインが格納されたテーブルを内蔵しており、第1のゲイン符号に対応するゲインをテーブルから読み出す。そして、ゲイン復号回路1530は、読み出されたゲインのうち、ACBゲインに対応する第1のACBゲインと、FCBゲインに対応する第1のFCBゲインとを励振信号計算回路1540へ出力する。ここで、第1のACBゲインと第1のFCBゲインがまとめて符号化されている場合には、テーブルには第1のACBゲインと第1のFCBゲインとから成る2次元ベクトルが複数格納されている。また、第1のACBゲインと第1のFCBゲインが個別に符号化されている場合には、二つのテーブルが内蔵され、一方のテーブルに第1のACBゲインが複数格納されており、他方のテーブルに第1のFCBゲインが複数格納されている。
【0077】
励振信号計算回路1540は、ACB復号回路1510から出力される第1のACB信号を入力し、FCB復号回路1520から出力される第1のFCB信号を入力し、ゲイン復号回路1530から出力される第1のACBゲインと第1のFCBゲインとを入力する。励振信号計算回路1540は、第1のACB信号に第1のACBゲインを乗じて得た信号と、第1のFCB信号に第1のFCBゲインを乗じて得た信号とを加算して第1の励振信号を得る。そして、励振信号計算回路1540は、第1の励振信号を、合成フィルタ1580と励振信号記憶回路1570とへ出力する。
【0078】
励振信号記憶回路1570は、励振信号計算回路1540から出力される第1の励振信号を入力し、これを記憶保持する。そして、励振信号記憶回路1570は、過去に入力されて記憶保持されている過去の第1の励振信号をACB復号回路1510へ出力する。
【0079】
合成フィルタ1580は、励振信号計算回路1540から出力される第1の励振信号を入力し、LSP−LPC変換回路1110から出力される第1のLP係数を入力端子61を介して入力する。そして、合成フィルタ1580は、第1のLP係数をもつ線形予測フィルタを、第1の励振信号で駆動することにより音声信号を生成する。音声信号を目標信号計算回路1700へ出力端子63を介して出力する。
【0080】
以上で、図4による音声復号回路1500の説明を終え、再び図1の説明に戻る。
【0081】
目標信号計算回路1700は、LSP−LPC変換回路1110から第1のLSPと第2のLSPとを入力し、ACB符号変換回路1200から第2のACB符号に対応する第2のACB遅延を入力し、音声復号回路1500から復号音声を入力し、インパルス応答計算回路1120からインパルス応答信号を入力し、第2の励振信号記憶回路1620に記憶保持される過去の第2の励振信号を入力する。目標信号計算回路1700は、復号音声と第1のLP係数及び第2のLP係数とから第1の目標信号を計算する。次に、目標信号計算回路1700は、過去の第2の励振信号とインパルス応答信号と第1の目標信号と第2のACB遅延とから、第2のACB信号及び最適ACBゲインを求める。そして、目標信号計算回路1700は、第1の目標信号と最適ACBゲインとをゲイン符号生成回路1400へ出力し、第2のACB信号をゲイン符号生成回路1400と第2の励振信号計算回路1610とへ出力する。
【0082】
図5は、目標信号計算回路1700の構成を示す図である。図5を参照すると、目標信号計算回路1700は、重み付け信号計算回路1710と、ACB信号生成回路1720と、最適ACBゲイン計算回路1730とを備えている。図5を参照して、目標信号計算回路1700の各構成要素について説明する。
【0083】
重み付け信号計算回路1710は、音声復号回路1500の合成フィルタ1580から出力される復号音声s(n)を入力端子57を介して入力し、LSP−LPC変換回路1110から出力される第1のLP係数a1,iと第2のLP係数a2,iとを、各々入力端子36と入力端子35とを介して入力する。重み付け信号計算回路1710は、まず、第1のLP係数を用いて、聴感重み付けフィルタW(z)を構成する。
【0084】
そして、重み付け信号計算回路1710は、復号音声により聴感重み付けフィルタを駆動して聴感重み付け音声信号を生成する。次に、重み付け信号計算回路1710は、第1のLP係数と第2のLP係数とを用いて、聴感重み付け合成フィルタW(z)/A2(z)を構成する。
【0085】
そして、重み付け信号計算回路1710は、聴感重み付け合成フィルタの零入力応答を聴感重み付け音声信号から減算して得られる第1の目標信号x(n)を、ACB信号生成回路1720と最適ACBゲイン計算回路1730へ出力するとともに、第2の目標信号計算回路1430へ出力端子78を介して出力する。
【0086】
ACB信号生成回路1720は、重み付け信号計算回路1710から出力される第1の目標信号を入力し、ACB符号変換回路1200から出力される第2のACB遅延T(B) lagを入力端子37を介して入力し、インパルス応答計算回路1120から出力されるインパルス応答信号h(n)を入力端子74を介して入力し、第2の励振信号記憶回路1620から出力される過去の第2の励振信号u(n)を入力端子75を介して入力する。
【0087】
ACB信号生成回路1720は、過去の第2の励振信号から遅延kで切り出された信号とインパルス応答信号との畳み込みにより、フィルタ処理された遅延kの過去の励振信号
を計算する。
【0088】
ここで、遅延kは第2のACB遅延とする。過去の第2の励振信号から遅延kで切り出された信号を第2のACB信号v(n)とする。
【0089】
そして、ACB信号生成回路1720は、第2のACB信号を第2の目標信号計算回路1430と第2の励振信号計算回路1610とへ出力端子76を介して出力し、フィルタ処理された遅延kの過去の励振信号yk(n)を最適ACBゲイン計算回路1730へ出力する。
【0090】
最適ACBゲイン計算回路1730は、重み付け信号計算回路1710から出力される第1の目標信号x(n)を入力し、ACB信号生成回路1720から出力されるフィルタ処理された遅延kの過去の励振信号yk(n)を入力する。
【0091】
次に、最適ACBゲイン計算回路1730は、第1の目標信号x(n)と、フィルタ処理された遅延kの過去の励振信号yk(n)と、から最適ACBゲインgpを次式により計算する。最適ACBゲインgpは、第1の目標信号x(n)と、フィルタ処理された遅延kの過去の励振信号yk(n)との距離を最小とするゲインである。
【0092】
そして、最適ACBゲイン計算回路1730は、最適ACBゲインgpをACBゲイン符号化回路1410へ出力端子77を介して出力する。
【0093】
なお、第2のACB信号を計算する方法及び最適ACBゲインを計算する方法の詳細については、「文献3」の第6.1節及び第5.6節の記載が参照できる。以上で図5による目標信号計算回路1700の説明を終え、再び図1の説明に戻る。
【0094】
インパルス応答計算回路1120は、LSP−LPC変換回路1110から出力される第1のLP係数と第2のLP係数を入力し、第1のLP係数と第2のLP係数を用いて聴感重み付け合成フィルタを構成する。
【0095】
そして、インパルス応答計算回路1120は、聴感重み付け合成フィルタのインパルス応答信号を目標信号計算回路1700とゲイン符号生成回路1400とへ出力する。ここで、聴感重み付け合成フィルタの伝達関数は次式により表される。
【0096】
ただし、
【0097】
は、第2のLP係数
をもつ線形予測フィルタの伝達関数である。
【0098】
【0099】
は、第1のLP係数
をもつ聴感重み付けフィルタの伝達関数である。
【0100】
ここで、Pは、線形予測次数(例えば、10)であり、γ1とγ2は、重み付けを制御する係数(例えば、0.94と0.6)である。
【0101】
FCB符号生成回路1800は、符号分離回路1010から出力される第1のFCB符号を入力し、第1のFCB符号を方式Bにより復号可能な符号に変換する。FCB符号生成回路1800は、変換されたFCB符号を、第2のFCB符号として符号多重回路1020へ出力し、第2のFCB符号に対応する第2のFCB信号をゲイン符号生成回路1400と、第2の励振信号計算回路1610とへ出力する。ここで、FCB信号は、複数のパルスから成り、パルスの位置(パルス位置)と極性(パルス極性)で規定されるマルチパルス信号により表現される。FCB符号は、パルス位置に対応する符号(パルス位置符号)とパルス極性に対応する符号(パルス極性符号)とからなる。マルチパルス信号によるFCB信号の表現方法については、「文献3」の第5.7節の記載が参照される。
【0102】
図6は、図1のFCB符号生成回路1800の構成を示す図である。図6を参照すると、FCB符号生成回路1800は、FCB符号変換回路1300と、FCB信号生成回路1820を備えている。図6を参照して、FCB符号生成回路1800の各構成要素について説明する。
【0103】
FCB符号変換回路1300は、符号分離回路1010から入力端子85を介して入力した第1のFCB符号i(A) Pを、方式Aにおける符号と方式Bにおける符号との対応関係を用いて読み替えることにより、第2のFCB符号i( B ) Pを得る。そして、FCB符号変換回路1300は、これを方式BにおけるFCB復号方法により復号可能な符号として出力端子55を介して符号多重回路1020へ出力し、第2のFCB符号に対応するパルス位置
及び、パルス極性
をFCB信号生成回路1820へ出力する。
【0104】
図7を参照して、パルス位置符号の読み替えについて説明する。
【0105】
例えば、方式Aにおけるパルス位置符号
が6のとき、これに対応するパルス位置
が30であるとする。方式Bでは、パルス位置符号
が1のとき、これに対応するパルス位置
が30であるとすると、パルス位置の値が同一(この場合では30)となるように、方式Aから方式Bへとパルス位置符号を変換するには、方式Aにおけるパルス位置符号6を方式Bにおけるパルス位置符号1に対応付ければよい。
【0106】
パルス極性符号については、読み替え前の符号に対応する極性(正又は負)と、読み替え後の符号に対応する極性とが等しくなるように、符号を読み替えればよい。
【0107】
以上により、パルス位置符号及びパルス極性符号の読み替えについての説明を終え、再び図6の説明に戻る。
【0108】
FCB信号生成回路1820は、FCB符号変換回路1300から出力されるパルス位置及びパルス極性を入力する。FCB信号生成回路1820は、パルス位置及びパルス極性から規定されるFCB信号を第2のFCB信号c(n)とし、これを最適FCBゲイン計算回路1440と第2の励振信号計算回路1610とへ出力端子86を介して出力する。
【0109】
以上で図6によるFCB符号生成回路1800の説明を終え、再び図1の説明に戻る。
【0110】
ゲイン符号生成回路1400は、目標信号計算回路1700から出力される第1の目標信号と第2のACB信号と最適ACBゲインとを入力し、FCB符号生成回路1800から出力される第2のFCB信号を入力し、インパルス応答計算回路1120から出力されるインパルス応答信号を入力し、LP係数符号変換回路1100から出力される第1のLSPを入力する。
【0111】
ゲイン符号生成回路1400は、まず、第1の目標信号と第2のACB信号と最適ACBゲインとインパルス応答信号とから第2の目標信号を計算し、第2の目標信号と第2のFCB信号とインパルス応答信号とから最適FCBゲインを計算し、最適FCBゲインから修正FCBゲインを計算し、第1のLSPから音声判定値を決定する。
【0112】
次に、ゲイン符号生成回路1400は、ACBゲインコードブックから順次読み込まれるACBゲインと最適ACBゲインとから第1の自乗誤差を計算し、ACBゲインと修正ACBゲインとから第2の自乗誤差を計算する。
【0113】
そして、ゲイン符号生成回路1400は、音声判定値から計算される重み係数と第1の自乗誤差と第2の自乗誤差とから計算される評価関数が最小となるACBゲイン及び対応するACBゲイン符号を選択する。
【0114】
また、ゲイン符号生成回路1400は、FCBゲインコードブックから順次読み込まれるFCBゲインと最適FCBゲインとから第3の自乗誤差を計算し、FCBゲインと修正FCBゲインとから第4の自乗誤差を計算する。
【0115】
そして、ゲイン符号生成回路1400は、音声判定値から計算される重み係数と第3の自乗誤差と第4の自乗誤差とから計算される評価関数が最小となるFCBゲイン及び対応するFCBゲイン符号を選択する。
【0116】
最後に、ゲイン符号生成回路1400は、選択されたACBゲイン符号とFCBゲイン符号とからなる第2のゲイン符号を、方式Bにおけるゲイン復号方法により復号可能な符号として符号多重回路1020へ出力端子56を介して出力する。
【0117】
図8は、ゲイン符号生成回路1400の構成を示す図である。図8を参照すると、ゲイン符号生成回路1400は、ACBゲイン符号化回路1410と、ACBゲインコードブック1411と、FCBゲイン符号化回路1420と、FCBゲインコードブック1421と、第2の目標信号計算回路1430と、最適FCBゲイン計算回路1440と、最適FCBゲイン修正回路1450と、音声/非音声識別回路1460と、を備えている。図8を参照して、ゲイン符号生成回路1400の各構成要素について詳細に説明する。
【0118】
第2の目標信号計算回路1430は、ACB信号生成回路1720から出力される第2のACB信号v(n)を入力端子92を介して入力し、重み付け信号計算回路1710から出力される第1の目標信号x(n)を入力端子93を介して入力し、インパルス応答計算回路1120から出力されるインパルス応答信号h(n)を入力端子94を介して入力し、ACBゲイン符号化回路1410から出力される第2のACBゲインを入力する。
【0119】
第2の目標信号計算回路1430は、第2のACB信号とインパルス応答信号との畳み込みにより、フィルタ処理された第2のACB信号
を計算し、y(n)に第2のACBゲイン
を乗じて得られる信号を、第1の目標信号x(n)から減算して、第2の目標信号x2(n)を得る。
【0120】
そして、第2の目標信号計算回路1430は、第2の目標信号x2(n)を最適FCBゲイン計算回路1440へ出力する。
【0121】
最適FCBゲイン計算回路1440は、FCB信号生成回路1820から出力される第2のFCB信号c(n)を入力端子91を介して入力し、インパルス応答計算回路1120から出力されるインパルス応答信号h(n)を入力端子94を介して入力し、第2の目標信号計算回路1430から出力される第2の目標信号x2(n)を入力し、第2のFCB信号とインパルス応答信号との畳み込みによりフィルタ処理された第2のFCB信号
を計算し、第2の目標信号x2(n)とフィルタ処理された第2のFCB信号z(n)から、次の式により最適FCBゲインgcを計算する。最適FCBゲインgcは、第2の目標信号x2(n)とフィルタ処理された第2のFCB信号z(n)との距離を最小とするゲインである。
【0122】
そして、最適FCBゲイン計算回路1440は、最適FCBゲインを最適FCBゲイン修正回路1450とFCBゲイン符号化回路1420とへ出力する。
【0123】
音声/非音声識別回路1460は、LSP復号回路110から出力される第1のLSPを入力端子98を介して入力する。第1のLSPとその長時間平均とからLSP変動量を計算し、LSP変動量から音声判定値を決定する。
【0124】
LSP変動量を求める手順を以下に示す。第nフレームにおいて、LSPの長時間平均
を次式により計算する。
ここで、Npは線形予測次数であり、βは例えば0.9である。
【0125】
第nフレームにおけるLSPの変動量dq(n)を次式により定義する。
ここで、
は、
と
との誤差として、例えば、
又は、
などが定義できるが、ここでは、後者を用いる。変動量dq(n)が大きい区間を音声区間に、小さい区間を非音声区間に対応させることができる。変動量dq(n)に対する閾値処理により、音声判定値
を決定する。
【0126】
(Vs=1 dq(n)がCVS以上の場合
Vs=0 dq(n)がCVSより小の場合)
【0127】
ここで、Cvsはある定数(例えば、2.2)であり、Vs=1は音声区間に、Vs=0は非音声区間に対応する。音声判定値を最適ACBゲイン修正回路1480とACBゲイン符号化回路1410と最適FCBゲイン修正回路1450とFCBゲイン符号化回路1420とへ出力する。
【0128】
最適ACBゲイン修正回路1480は、ACB信号生成回路1720から出力される最適ACBゲインを入力端子97を介して入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。最適ACBゲイン修正回路1480では、音声判定値Vsが0(非音声区間)のとき、最適ACBゲインの長時間平均を修正ACBゲインとする。非音声区間において、次式により最適ACBゲインの長時間平均を計算する。
【0129】
ここで、
は第nサブフレームにおける最適ACBゲイン、
は第nサブフレームにおける最適ACBゲインの長時間平均であり、αは例えば0.9である。なお、長時間平均には平均値、中央値、最頻値なども適用できる。
【0130】
一方、最適ACBゲイン修正回路1480では、音声判定値Vsが1(音声区間)のとき、最適ACBゲインそのものを修正ACBゲインとする。
【0131】
最適ACBゲイン修正回路1480は、修正ACBゲインを、ACBゲイン符号化回路1410へ出力する。
【0132】
ACBゲイン符号化回路1410は、ACB信号生成回路1720から出力される最適ACBゲインgpを入力端子97を介して入力し、最適ACBゲイン修正回路1480から出力される修正ACBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。
【0133】
ACBゲイン符号化回路1410は、ACBゲインコードブック1411から順次読み込まれるACBゲインと入力端子97からの最適ACBゲインとから第1の自乗誤差を計算し、ACBゲインと修正ACBゲインとから第2の自乗誤差を計算し、音声判定値から計算される重み係数と、第1の自乗誤差と、第2の自乗誤差とから次式で定義される評価関数を計算する。
【0134】
ここで、
は最適ACBゲイン、
は修正ACBゲイン、
はACBゲインコードブックから順次読み込まれるACBゲインであり、μは重み係数である。例えば、音声判定値Vsが1(音声区間)のとき、重み係数μは1.0とし、Vsが0(非音声区間)のときはμは0.2とする。
【0135】
そして、ACBゲイン符号化回路1410は、評価関数が最小となるACBゲインを選択し、選択されたACBゲインを第2のACBゲインとして第2の目標信号計算回路1430へ出力するとともに、第2の励振信号計算回路1610へ出力端子95を介して出力し、第2のACBゲインに対応する符号をACBゲイン符号としてゲイン符号多重化回路1470へ出力する。
【0136】
最適FCBゲイン修正回路1450は、最適FCBゲイン計算回路1440から出力される最適FCBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値Vsを入力する。
【0137】
最適FCBゲイン修正回路1450において、音声判定値Vsが0(非音声区間)のとき、最適FCBゲインの長時間平均を修正FCBゲインとする。非音声区間において、次式により最適FCBゲインの長時間平均を計算する。
【0138】
ここで、
は第nサブフレームにおける最適FCBゲイン、
は第nサブフレームにおける最適FCBゲインの長時間平均であり、αは例えば0.9である。なお、長時間平均には、平均値、中央値、最頻値なども適用できる。
【0139】
一方、最適FCBゲイン修正回路1450において、音声判定値Vsが1(音声区間)のとき、最適FCBゲインそのものを修正FCBゲインとする。
【0140】
最適FCBゲイン修正回路1450は、修正FCBゲインをFCBゲイン符号化回路1420へ出力する。
【0141】
FCBゲイン符号化回路1420は、最適FCBゲイン計算回路1440から出力される最適FCBゲインを入力し、最適FCBゲイン修正回路1450から出力される修正FCBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。FCBゲイン符号化回路1420は、FCBゲインコードブック1421から順次読み込まれるFCBゲインと、最適FCBゲインとから第1の自乗誤差を計算し、FCBゲインと修正FCBゲインとから第2の自乗誤差を計算し、音声判定値から計算される重み係数と第1の自乗誤差と第2の自乗誤差とから次式で定義される評価関数を計算する。
【0142】
ここで、
は最適FCBゲイン、
は修正FCBゲイン、
はFCBゲインコードブックから順次読み込まれるFCBゲインであり、μは重み係数である。例えば、音声判定値Vsが1(音声区間)のとき、重み係数μは1.0とし、音声判定値Vsが0(非音声区間)のときはμは0.2とする。
【0143】
そして、FCBゲイン符号化回路1420は、評価関数が最小となるFCBゲインを選択し、選択されたFCBゲインを第2のFCBゲインとして第2の励振信号計算回路1610へ出力端子96を介して出力し、第2のFCBゲインに対応する符号をFCBゲイン符号としてゲイン符号多重化回路1470へ出力する。
【0144】
ゲイン符号多重回路1470は、ACBゲイン符号化回路1410から出力されるACBゲイン符号を入力し、FCBゲイン符号化回路1420から出力されるFCBゲイン符号を入力し、ACBゲイン符号とFCBゲイン符号とを多重化して得られる第2のゲイン符号を、方式Bにおけるゲイン復号方法により復号可能な符号として符号多重回路1020へ出力端子56を介して出力する。
【0145】
以上で図8によるゲイン符号生成回路1400の説明を終え、再び図1の説明に戻る。
【0146】
第2の励振信号計算回路1610は、目標信号計算回路1700から出力される第2のACB信号を入力し、FCB符号生成回路1800から出力される第2のFCB信号を入力し、ゲイン符号生成回路1400から出力される第2のACBゲインと第2のFCBゲインとを入力する。第2の励振信号計算回路1610は、第2のACB信号に第2のACBゲインを乗じて得た信号と、第2のFCB信号に第2のFCBゲインを乗じて得た信号と、を加算して第2の励振信号を得る。そして第2の励振信号を第2の励振信号記憶回路1620へ出力する。
【0147】
第2の励振信号記憶回路1620は、第2の励振信号計算回路1610から出力される第2の励振信号を入力し、これを記憶保持する。そして、過去に入力されて記憶保持されている第2の励振信号を目標信号計算回路1700へ出力する。以上により、本発明の第1の実施例の説明を終える。
【0148】
次に、本発明の第2の実施例について説明する。図9は、本発明による符号変換装置の第2の実施例の構成を示す図である。図9においては、図12におけるLP係数符号変換回路100と、ゲイン符号変換回路400とを、それぞれLP係数符号変換回路1100とゲイン符号変換回路2400とで置き換え、LP係数符号変換回路1100とゲイン符号変換回路2400との間に結線が付加されている。以下では、図12に示す要素と同一又は同等の要素の説明は省略し、相違点について説明する。
【0149】
LP係数符号変換回路1100は、図1を用いて説明した第1の実施例におけるそれと同様である。ただし、他回路との結線の仕方が異なっており、第1のLSPをゲイン符号変換回路400へ出力する。
【0150】
ゲイン符号変換回路2400は、符号分離回路1010から出力される第1のゲイン符号を入力し、LP係数符号変換回路1100から出力される第1のLSPを入力する。
【0151】
ゲイン符号変換回路2400は、まず、第1のゲイン符号を、方式Aにおけるゲイン復号方法により復号して得られる第1のゲイン(第1のACBゲイン及び第1のFCBゲイン)から、修正ACBゲイン及び修正FCBゲインを計算し、第1のLSPから音声判定値を決定する。
【0152】
次に、ゲイン符号変換回路2400は、ACBゲインコードブックから順次読み込まれるACBゲインと第1のACBゲインとから第1の自乗誤差を計算し、ACBゲインと修正ACBゲインとから第2の自乗誤差を計算する。
【0153】
そして、ゲイン符号変換回路2400は、音声判定値から計算される重み係数と、第1の自乗誤差と、第2の自乗誤差とから計算される評価関数が最小となるACBゲイン及び対応するACBゲイン符号を選択する。
【0154】
また、ゲイン符号変換回路2400は、FCBゲインコードブックから順次読み込まれるFCBゲインと第1のFCBゲインとから第3の自乗誤差を計算し、FCBゲインと修正FCBゲインとから第4の自乗誤差を計算する。そして、ゲイン符号変換回路2400は、音声判定値から計算される重み係数と第3の自乗誤差と第4の自乗誤差とから計算される評価関数が最小となるFCBゲイン及び対応するFCBゲイン符号を選択する。
【0155】
最後に、ゲイン符号変換回路2400は、選択されたACBゲイン符号とFCBゲイン符号とからなる第2のゲイン符号を、方式Bにおけるゲイン復号方法により復号可能な符号として符号多重回路1020へ出力する。
【0156】
図10は、図9のゲイン符号変換回路2400の構成を示す図である。図10を参照すると、ゲイン符号変換回路2400は、音声/非音声識別回路1460と、ゲイン符号分離回路2490と、ACBゲイン復号回路2470と、ACBゲインコードブック2471と、ACBゲイン修正回路2440と、ACBゲイン符号化回路2410と、ACBゲインコードブック1411と、FCBゲイン復号回路2480と、FCBゲインコードブック2481と、FCBゲイン修正回路2450と、FCBゲイン符号化回路2420と、FCBゲインコードブック1421と、ゲイン符号多重回路1470と、を備えている。図10を参照して、この実施例のゲイン符号変換回路2400の各構成要素について説明する。なお、図10において、音声/非音声識別回路1460及びゲイン符号多重回路1470は、図8に示した要素と基本的に同じであり、以下では、これらの説明は省略する。
【0157】
ゲイン符号分離回路2490は、符号分離回路1010から出力される第1のゲイン符号を入力端子45を介して入力し、第1のゲイン符号からACBゲイン及びFCBゲインに対応する符号、すなわち第1のACBゲイン符号及び第1のFCBゲイン符号を分離し、第1のACBゲイン符号をACBゲイン復号回路2470へ出力し、第1のFCBゲイン符号をFCBゲイン復号回路2480へ出力する。
【0158】
ACBゲイン復号回路2470は、複数セットのACBゲインが格納されたACBゲインコードブック2471を備えており、ゲイン符号分離回路2490から出力される第1のACBゲイン符号を入力し、第1のACBゲイン符号に対応するACBゲインを第1のACBゲインコードブック2471より読み出し、読み出されたACBゲインを第1のACBゲインとしてACBゲイン修正回路2440へ出力するとともに、ACBゲイン符号化回路2410へ出力する。ここで、ACBゲイン符号からのACBゲインの復号は、方式AにおけるACBゲインの復号方法に従い、方式AのACBゲインコードブックを用いる。
【0159】
FCBゲイン復号回路2480は、複数セットのFCBゲインが格納されたFCBゲインコードブック2481を備えており、ゲイン符号分離回路2490から出力される第1のFCBゲイン符号を入力し、第1のFCBゲイン符号に対応するFCBゲインを第1のFCBゲインコードブック2481より読み出し、読み出されたFCBゲインを第1のFCBゲインとしてFCBゲイン修正回路2450へ出力するとともに、FCBゲイン符号化回路2420へ出力する。ここで、FCBゲイン符号からのFCBゲインの復号は、方式AにおけるFCBゲインの復号方法に従い、方式AのFCBゲインコードブックを用いる。
【0160】
ACBゲイン修正回路2440は、ACBゲイン復号回路2470から出力される第1のACBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。音声判定値Vsが0(非音声区間)のとき、第1のACBゲインの長時間平均を修正ACBゲインとする。
【0161】
ACBゲイン修正回路2440は、非音声区間において、次式により第1のACBゲインの長時間平均を計算する。
【0162】
ここで、
は第nサブフレームにおける第1のACBゲイン、
は第nサブフレームにおける第1のACBゲインの長時間平均であり、αは例えば0.9である。なお、長時間平均には、平均値、中央値、最頻値なども適用できる。
【0163】
一方、音声判定値Vsが1(音声区間)のとき、ACBゲイン修正回路2440は、第1のACBゲインそのものを修正ACBゲインとする。
【0164】
ACBゲイン修正回路2440は、修正ACBゲインをACBゲイン符号化回路2410へ出力する。
【0165】
FCBゲイン修正回路2450は、FCBゲイン復号回路2480から出力される第1のFCBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。
【0166】
FCBゲイン修正回路2450において、音声判定値Vsが0(非音声区間)のとき、第1のFCBゲインの長時間平均を修正FCBゲインとする。非音声区間において、次式により第1のFCBゲインの長時間平均を計算する。
【0167】
ここで、
は第nサブフレームにおける第1のFCBゲイン、
は第nサブフレームにおける第1のFCBゲインの長時間平均であり、αは例えば0.9である。なお、長時間平均には、平均値、中央値、最頻値なども適用できる。
【0168】
一方、音声判定値Vsが1(音声区間)のとき、FCBゲイン修正回路2450は、第1のFCBゲインそのものを修正FCBゲインとする。
【0169】
FCBゲイン修正回路2450は、修正FCBゲインをFCBゲイン符号化回路2420へ出力する。
【0170】
ACBゲイン符号化回路2410は、ACBゲイン復号回路2470から出力される第1のACBゲインを入力し、ACBゲイン修正回路2440から出力される修正ACBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。
【0171】
ACBゲイン符号化回路2410は、ACBゲインコードブック1411から順次読み込まれるACBゲインと第1のACBゲインとから第1の自乗誤差を計算し、ACBゲインと修正ACBゲインとから第2の自乗誤差を計算し、音声判定値から計算される重み係数と第1の自乗誤差と第2の自乗誤差とから次式で定義される評価関数を計算する。
【0172】
【0173】
ここで、
は第1のACBゲイン、
は修正ACBゲイン、
はACBゲインコードブック1411から順次読み込まれるACBゲインであり、μは重み係数である。例えば、音声判定値Vsが1(音声区間)のとき、重み係数μは1.0とし、Vsが0(非音声区間)のときはμは0.2とする。
【0174】
そして、ACBゲイン符号化回路2410は、評価関数が最小となるACBゲインを選択し、選択されたACBゲインを第2のACBゲインとし、第2のACBゲインに対応する符号を第2のACBゲイン符号としてゲイン符号多重化回路1470へ出力する。
【0175】
FCBゲイン符号化回路2420は、FCBゲイン復号回路2480から出力される第1のFCBゲインを入力し、FCBゲイン修正回路2450から出力される修正FCBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。
【0176】
FCBゲイン符号化回路2420は、FCBゲインコードブック1421から順次読み込まれるFCBゲインと第1のFCBゲインとから第3の自乗誤差を計算し、FCBゲインと修正FCBゲインとから第4の自乗誤差を計算し、音声判定値から計算される重み係数と第3の自乗誤差と第4の自乗誤差とから次式で定義される評価関数を計算する。
【0177】
ここで、
は第1のFCBゲイン、
は修正FCBゲイン、
はFCBゲインコードブック1421から順次読み込まれるFCBゲインであり、μは重み係数である。例えば、音声判定値Vsが1(音声区間)のとき、重み係数μは1.0とし、音声判定値Vsが0(非音声区間)のときはμは0.2とする。
【0178】
そして、FCBゲイン符号化回路2420は、評価関数が最小となるFCBゲインを選択し、選択されたFCBゲインを第2のFCBゲインとし、第2のFCBゲインに対応する符号を第2のFCBゲイン符号としてゲイン符号多重化回路1470へ出力する。
【0179】
上述した本発明の各実施例の符号変換装置は、ディジタル信号処理プロセッサ等のコンピュータ制御で実現するようにしてもよい。図11は本発明の第3の実施例として、上記各実施例の符号変換処理をコンピュータで実現する場合の装置構成を模式的に示す図である。記録媒体6から読み出されたプログラムを実行するコンピュータ1において、第1の符号化復号装置により音声を符号化して得た第1の符号を第2の符号化復号装置により復号可能な第2の符号へ変換する符号変換処理を実行するにあたり、記録媒体6には、
(a) 第1の符号列から第1の線形予測係数を得る処理と、
(b) 第1の符号列から励振信号の情報を得る処理と、
(c) 励振信号の情報から励振信号を得る処理と、
(d) 第1の線形予測係数をもつフィルタを励振信号により駆動することによって音声信号を生成する処理と、
(e) 第2の符号列から得られる情報により生成される第2の音声信号と、第1の音声信号との距離が最小となるゲイン(最適ゲイン)を計算する処理と、
(f) 最適ゲインを修正する処理と、
(g) 修正された最適ゲイン(修正最適ゲイン)と、第2の方式におけるゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、最適ゲインと、ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、第1の自乗誤差と第2の自乗誤差に基づく評価関数が最小となるゲインをゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める処理、
を実行させるためのプログラムが記録されている。記録媒体6から該プログラムを記録媒体読出装置5、インタフェース4を介してメモリ3に読み出して実行する。上記プログラムは、マスクROM等、フラッシュメモリ等の不揮発性メモリに格納してもよく、記録媒体は不揮発性メモリを含むほか、CD−ROM、FD、Digital Versatile Disk (DVD)、磁気テープ(MT)、可搬型HDD等の媒体の他、例えばサーバ装置からコンピュータで該プログラムを通信媒体伝送する場合等、プログラムを担持する有線、無線で通信される通信媒体等も含む。
【0180】
本発明の第4の実施例では、記録媒体6から読み出されたプログラムを実行するコンピュータ1において、第1の符号化復号装置により音声を符号化して得た第1の符号を第2の符号化復号装置により復号可能な第2の符号へ変換する符号変換処理を実行するにあたり、記録媒体6には、
(a) 第1の符号列からゲイン情報を復号する処理と、
(b) 復号されたゲイン(復号ゲイン)を修正する処理と、
(c) 修正された復号ゲイン(修正復号ゲイン)と、第2の方式におけるゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、復号ゲインと、ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、第1の自乗誤差と第2の自乗誤差に基づく評価関数が最小となるゲインをゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める処理、
を実行させるためのプログラムが記録されている。
【0181】
以上本発明を上記実施例に即して説明したが、本発明は、上記実施例の構成にのみ限定されるものでなく、特許請求の範囲の各請求項の発明の範囲内で当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
【0182】
【発明の効果】
以上説明したように、本発明によれば、非音声区間における背景雑音音質の劣化を低減することができる、という効果を奏する。
【0183】
その理由は、本発明においては、第1の符号列から第1の線形予測係数をもつ合成フィルタを励振信号で駆動して得た第1の音声信号と第2の符号列から得られる情報により生成される第2の音声信号とから最適ゲインを導出し、さらに最適ゲインを修正し、修正した最適ゲインと、最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求め、その際、非音声区間において、第2のゲインの時間変動が小さくなるような評価関数を用いて、第2のゲインを求めるように構成したためである。上記効果は、第1の符号列からゲイン情報を復号し、復号されたゲインを修正し、修正された復号ゲインと、前記復号ゲインと第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求め、非音声区間において、第2のゲインの時間変動が小さくなるような評価関数を用いて、第2のゲインを求めるように構成してなる本発明によっても奏することができる。
【図面の簡単な説明】
【図1】本発明による符号変換装置の第1の実施例の構成を示す図である。
【図2】本発明による符号変換装置におけるLP係数符号変換回路の構成を示す図である。
【図3】ACB符号とACB遅延との対応関係とACB符号の読み替え方法を説明する図である。
【図4】本発明による符号変換装置の音声復号回路の構成を示す図である。
【図5】本発明による符号変換装置における目標信号計算回路の構成を示す図である。
【図6】本発明による符号変換装置におけるFCB符号生成回路の構成を示す図である。
【図7】パルス位置符号とパルス位置との対応関係とACB符号の読み替え方法を説明する図である。
【図8】本発明による符号変換装置におけるゲイン符号生成回路の構成を示す図である。
【図9】本発明による符号変換装置の第2の実施例の構成を示す図である。
【図10】本発明による符号変換装置におけるゲイン符号生成回路の構成を示す図である。
【図11】本発明による符号変換装置の第3から第4の実施例の構成を示す図である。
【図12】従来の符号変換装置の構成を示す図である。
【符号の説明】
1 コンピュータ
2 CPU
3 メモリ
4 記録媒体読出装置インタフェース
5 記録媒体読出装置
6 記録媒体
10,31,35,36,37,51,52,53,57,61,74,75,81,82,83,84,85,91,92,93,94 入力端子
20,32,33,34,55,56,62,63,76,77,78,86,95,96 出力端子
100,1100 LP係数符号変換回路
110 LP係数復号回路
130 LP係数符号化回路
111 第1のLSPコードブック
131 第2のLSPコードブック
200,1200 ACB 符号変換回路
300,1300 FCB 符号変換回路
400,2400 ゲイン符号変換回路
1010 符号分離回路
1020 符号多重回路
1110 LSP−LPC変換回路
1120 インパルス応答計算回路
1400 ゲイン符号生成回路
1410,2410 ACBゲイン符号化回路
1411,2471 ACBゲインコードブック
1420,2420 FCBゲイン符号化回路
1421,2481 FCBゲインコードブック
1430 第2の目標信号計算回路
1440 最適FCBゲイン計算回路
1450 最適FCBゲイン修正回路
1460 音声/非音声識別回路
1470 ゲイン符号多重回路
1480 最適ACBゲイン修正回路
1500 音声復号回路
1510 ACB復号回路
1520 FCB復号回路
1530 ゲイン復号回路
1540 励振信号計算回路
1570 励振信号記憶回路
1580 合成フィルタ
1600 励振信号情報復号回路
1610 第2の励振信号計算回路
1620 第2の励振信号記憶回路
1700 目標信号計算回路
1710 重み付け信号計算回路
1720 ACB信号生成回路
1800 FCB符号生成回路
1820 FCB信号生成回路
2480 FCBゲイン復号回路
2450 FCBゲイン修正回路
2490 ゲイン符号分離回路[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an encoding and decoding method for transmitting or storing an audio signal at a low bit rate, and in particular, when performing audio communication using different encoding and decoding methods, obtained by encoding audio by a certain method. The present invention relates to a code conversion method and apparatus for converting a code into a code that can be decoded by another method with high sound quality and a low operation amount, and a recording medium thereof.
[0002]
[Prior art]
2. Description of the Related Art As a method for encoding a speech signal at a medium to low bit rate with high efficiency, a method of separating and encoding the speech signal into a linear prediction (Linear Prediction: LP) filter and an excitation signal for driving the filter is widely used. . One of the typical methods is Code \ Excited \ Linear \ Prediction (code-excited linear prediction: referred to as "CELP"). In CELP, an LP filter in which LP coefficients representing the frequency characteristics of an input voice are set includes an adaptive codebook (Adaptive Codebook: \ "ACB") representing a pitch period of the input voice, and a fixed codebook (Random Number and Pulse) composed of random numbers and pulses. By driving with an excitation signal represented by the sum of “Fixed Codebook:“ FCB ”), a synthesized speech signal is obtained. At this time, the ACB component and the FCB component are multiplied by gains (“ACB gain” and “FCB gain”). For CELP, M.P. Schroeder and B.S. S. "Code \ excited \ linear \ prediction: \ High \ quality \ speech \ at \ very \ low \ bit \ rates" by Atal (Proc. \ Of \ IEEE \ Int. \ Conf.on \ Acost., @Spence. Is referred to.
[0003]
By the way, for example, when an interconnection between a 3G mobile network and a wired packet network is assumed, there is a problem that a direct connection cannot be made because the standard voice coding method used in each network is different. The simplest solution to this is a tandem connection. However, in the tandem connection, the audio signal is temporarily decoded using the standard system from a code string obtained by encoding the audio using one standard system, and the decoded audio signal is decoded using the other standard system. The encoding is performed again. For this reason, there is a problem that the sound quality is generally lowered, the delay is increased, and the calculation amount is increased as compared with the case where encoding and decoding are performed only once in each audio encoding / decoding method.
[0004]
On the other hand, a code obtained by encoding speech using one standard method is converted into a code that can be decoded by the other standard method in a code domain or a coding parameter domain. Is effective for The method of converting the code is described in "Improving, Transcoding, Capability, of Speech, Coders, in Clean, and Frame, Erased, Channel, Environmental, Environmental, Environmental Engineering, Hong Kong, Kong et al." Reference 2)).
[0005]
FIG. 12 converts a code obtained by encoding speech using the first speech coding method (referred to as “method A”) into a code that can be decoded using the second method (referred to as “method B”). FIG. 3 is a diagram illustrating an example of a configuration of a transcoder. Referring to FIG. 12, the code conversion device includes an
[0006]
From the
[0007]
The
[0008]
The LP coefficient
[0009]
The ACB
[0010]
The FCB
[0011]
The gain
[0012]
A more specific operation of each conversion circuit will be described below.
[0013]
The LP coefficient
[0014]
The ACB
[0015]
The FCB
[0016]
The gain
[0017]
The
[0018]
[Problems to be solved by the invention]
However, the conventional transcoder described with reference to FIG. 12 has a problem that the sound quality of background noise in a non-speech section deteriorates.
[0019]
The reason is that the background noise energy has a large time variation in the non-voice section. This is due to the fact that the second gain obtained by requantizing the first gain fluctuates greatly in a non-voice section.
[0020]
Accordingly, the present invention has been made in view of the above problems, and a main object of the present invention is to provide an apparatus and a method capable of reducing deterioration of background noise sound quality in a non-speech section, and a recording medium recording the program thereof. It is in. Other objects, features, advantages and the like of the present invention will be immediately apparent to those skilled in the art from the following description.
[0021]
[Means for Solving the Problems]
To achieve the above object, a method according to a first aspect of the present invention is a code conversion method for converting a first code string conforming to a first method into a second code string conforming to a second method. , By obtaining information of a first linear prediction coefficient and an excitation signal from the first code string, and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal. Generating a first audio signal, calculating an optimal gain based on a second audio signal generated based on information obtained from a second code sequence, and the first audio signal; Correcting the gain in the second code string based on the step of correcting the gain, the corrected optimum gain (corrected optimum gain), the optimum gain, and the gain read from the gain codebook in the second method. Comprising a step of obtaining information, the. In the method according to the present invention, the optimum gain is preferably obtained as a gain that minimizes a distance between a second audio signal generated based on information obtained from a second code string and the first audio signal. Can be
[0022]
A method according to a second aspect of the present invention is a code conversion method for converting a first code string conforming to a first method into a second code string conforming to a second method, A step of decoding gain information from a code string, a step of correcting a decoded gain (decoding gain), a corrected decoding gain (corrected decoding gain), the decoding gain, and a gain codebook in a second method. And obtaining gain information in the second code string based on the gain read from.
[0023]
In the invention according to the first aspect, preferably, a first squared error is calculated from the corrected optimal gain and a gain read from the gain codebook, and the first squared error is read from the optimal gain and the gain codebook. A second square error is calculated from the gain and the gain that minimizes the evaluation function based on the first square error and the second square error is selected from the gain codebook. Find gain information.
[0024]
In the invention according to the second aspect, preferably, a first squared error is calculated from the corrected decoding gain and a gain read from the gain codebook, and the first squared error is read from the decoding gain and the gain codebook. A second square error is calculated from the gain and the gain that minimizes the evaluation function based on the first square error and the second square error is selected from the gain codebook. Find gain information.
[0025]
In the invention according to the first aspect, preferably, the corrected optimum gain is based on a long-term average of the optimum gain.
[0026]
In the invention according to the second aspect, preferably, the modified decoding gain is based on a long-term average of the decoding gain.
[0027]
An apparatus according to a third aspect of the present invention is directed to a code conversion apparatus for converting a first code string conforming to a first method into a second code string conforming to a second method, A first audio signal is obtained by obtaining information of a first linear prediction coefficient and an excitation signal from a code string, and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal. An audio decoding circuit for generating, an optimal gain calculation circuit for calculating an optimal gain based on a second audio signal generated based on information obtained from a second code string, and the first audio signal; An optimum gain correction circuit for correcting the gain, a corrected optimum gain (corrected optimum gain), the optimum gain, and a gain read out from a gain codebook in the second method; Gain encoding circuit for finding the gain information, including. In the apparatus according to the present invention, the optimum gain calculation circuit preferably includes a gain that minimizes a distance between a second audio signal generated by information obtained from a second code string and the first audio signal. Is determined as the optimum gain.
[0028]
An apparatus according to a fourth aspect of the present invention is the code conversion apparatus for converting a first code string conforming to a first method into a second code string conforming to a second method, A gain decoding circuit for decoding gain information from the code string, a decoding gain correction circuit for correcting the decoded gain (decoding gain), a corrected decoding gain (corrected decoding gain), the decoding gain, A gain coding circuit for obtaining gain information in the second code sequence based on the gain read from the gain codebook in the method.
[0029]
In the invention according to the third aspect, the gain encoding circuit preferably calculates a first squared error from the corrected optimal gain and a gain read from the gain codebook, and calculates the optimal gain, Calculating a second squared error from the gain read out from the gain codebook, and selecting from the gain codebook a gain that minimizes the evaluation function based on the first squared error and the second squared error. Gain information in the second code string is obtained.
[0030]
In the invention according to the fourth aspect, the gain encoding circuit preferably calculates a first square error from the corrected decoding gain and a gain read from the gain codebook, and calculates the decoding gain, Calculating a second squared error from the gain read out from the gain codebook, and selecting from the gain codebook a gain that minimizes the evaluation function based on the first squared error and the second squared error. Gain information in the second code string is obtained.
[0031]
In the above-described optimal gain correction circuit according to the third aspect, preferably, the corrected optimal gain is based on a long-term average of the optimal gain.
[0032]
In the decoding gain correction circuit according to the fourth aspect, preferably, the correction decoding gain is based on a long-term average of the decoding gain.
[0033]
According to a fifth aspect of the present invention, there is provided a program configured to convert a first code string conforming to the first method into a second code string conforming to the second method.
(A) Obtaining information of a first linear prediction coefficient and an excitation signal from the first code string, and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal. Generating a first audio signal by
(B) a process of calculating a gain (optimum gain) based on a second audio signal generated based on information obtained from a second code sequence and the first audio signal;
(C) processing for correcting the optimum gain;
(D) executing a process of obtaining gain information in the second code sequence based on the corrected optimum gain (corrected optimum gain), the optimum gain, and a gain read from a gain codebook in the second method. Provide a program to make In the present invention, the gain at which the distance between the second audio signal generated from the information obtained from the second code string and the first audio signal is minimized is determined as the optimum gain.
[0034]
A program according to a sixth aspect of the present invention provides a computer that constitutes a code conversion device that converts a first code string conforming to the first method into a second code string conforming to the second method.
(A) decoding gain information from the first code string;
(B) processing for correcting the decoded gain (decoding gain);
(C) performing a process of obtaining gain information in a second code string based on a corrected decoding gain (corrected decoding gain), the decoding gain, and a gain read from a gain codebook in the second method. Provide a program to make
[0035]
In the program according to the fifth aspect, preferably, a first squared error is calculated from the corrected optimum gain and a gain read from the gain codebook, and the first squared error is calculated from the optimum gain and the gain codebook. The second code is calculated by calculating a second square error from the read gain and selecting a gain from the gain codebook that minimizes an evaluation function based on the first square error and the second square error. Find the gain information in a column.
[0036]
In the program of the invention according to the sixth aspect, preferably, a first square error is calculated from the corrected decoding gain and a gain read from the gain codebook, and the first squared error is calculated from the decoding gain and the gain codebook. The second code is calculated by calculating a second square error from the read gain and selecting a gain from the gain codebook that minimizes an evaluation function based on the first square error and the second square error. Find the gain information in a column.
[0037]
In the program according to the fifth aspect, preferably, the corrected optimal gain is based on a long-term average of the optimal gain.
[0038]
In the program according to the sixth aspect, preferably, the modified decoding gain is based on a long-term average of the decoding gain.
[0039]
The invention according to a seventh aspect of the present invention provides a recording medium on which the program according to the fifth and sixth aspects is recorded.
[0040]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described. First, the outline and principle of the apparatus and method of the present invention will be described, and then embodiments will be described in detail below.
[0041]
In the code conversion device according to the present invention, the speech decoding circuit (1500) obtains information of a first linear prediction coefficient and an excitation signal from a first code string conforming to a first method, and A first audio signal is generated by driving a filter having a prediction coefficient with an excitation signal obtained from the information of the excitation signal, and a gain code generation circuit (1400) generates a second code conforming to a second method. Calculating a gain (optimum gain) that minimizes the distance between the second audio signal generated from the information obtained from the column and the first audio signal, modifying the optimal gain, and modifying the optimal gain Based on the (corrected optimum gain), the optimum gain, and the gain read from the gain codebook in the second method, gain information in the second code string is obtained.
[0042]
The method according to the present invention has the following steps.
[0043]
Step a: Obtain a first linear prediction coefficient from a first code string.
[0044]
Step b: Obtain information of the excitation signal from the first code string.
[0045]
Step c: An excitation signal is obtained from the information of the excitation signal.
[0046]
Step d: generating a first audio signal by driving a filter having a first linear prediction coefficient with the excitation signal.
[0047]
Step e: Calculate a gain (optimum gain) that minimizes the distance between the second audio signal generated based on the information obtained from the second code sequence and the first audio signal.
[0048]
Step f: Modify the optimum gain.
[0049]
Step g: Determine gain information in the second code sequence based on the corrected optimal gain (modified optimal gain), the optimal gain, and the gain read from the gain codebook in the second method.
[0050]
In the present invention, the second gain is obtained by using an evaluation function that reduces the time variation of the second gain in a non-voice section.
[0051]
For this reason, in the non-speech section, the time variation of the obtained second gain is small, and the time variation of the background noise energy in the section is small.
[0052]
As a result, it is possible to reduce the deterioration of the background noise sound quality in the non-voice section.
[0053]
【Example】
Next, embodiments of the present invention will be described in detail with reference to the drawings.
[0054]
FIG. 1 is a diagram showing a configuration of a first embodiment of a transcoder according to the present invention. 1, the same or equivalent elements as those in FIG. 12 are denoted by the same reference numerals. Referring to FIG. 1,
[0055]
Also, in scheme A, the encoding of the LP coefficient is
It is performed every msec cycle (frame), and encoding of components of the excitation signal such as ACB, FCB and gain is performed by:
It is performed every msec cycle (subframe).
[0056]
On the other hand, in scheme B, the encoding of the LP coefficient is
It is performed every msec cycle (frame), and the components of the excitation signal are encoded as follows:
It is performed every msec cycle (subframe).
[0057]
Further, the frame length, the number of subframes, and the subframe length of the method A are respectively
,
as well as
And
[0058]
The frame length, the number of subframes, and the subframe length of method B are
,
as well as,
And
[0059]
In the following description, for simplicity,
And
[0060]
Here, for example, the sampling frequency is 8000 Hz,
as well as
Is 10 msec,
as well as
Is 160 samples,
as well as
Is 80 samples.
[0061]
LP coefficient
[0062]
Next, the LP coefficient
[0063]
FIG. 2 is a diagram showing a configuration of the LP coefficient
[0064]
The
[0065]
The LSP encoding circuit 130 receives the first LSP output from the
[0066]
Thus, the description of the LP coefficient
[0067]
The LSP-
[0068]
The ACB code conversion circuit 1200 obtains a second ACB code by reading the first ACB code input from the
[0069]
Here, with reference to FIG. For example, ACB code in scheme A
Is 56, the corresponding ACB delay
Is 76. In scheme B, the ACB code
Is 53, the corresponding ACB delay
Is 76, in order to convert the ACB code from the method A to the method B so that the value of the ACB delay becomes the same (76 in this case), the
[0070]
The
[0071]
FIG. 4 is a diagram showing a configuration of the
[0072]
The excitation signal information decoding circuit 1600 decodes the information of the excitation signal from the code corresponding to the information of the excitation signal. The first ACB code, the first FCB code, and the first gain code output from the
[0073]
Next, the
[0074]
The
Get. In the excitation signal, from the start of the current subframe
Equivalent to subframe length, from a point in the sample past
A sample signal is cut out to generate a first ACB signal. here,
But
If smaller than
Cut out a vector for the sample, connect this vector repeatedly, and
Let it be a sample signal. Then, the first ACB signal is output to excitation
[0075]
The
[0076]
The
[0077]
Excitation
[0078]
The excitation
[0079]
The
[0080]
This is the end of the description of the
[0081]
The target signal calculation circuit 1700 receives the first LSP and the second LSP from the LSP-
[0082]
FIG. 5 is a diagram showing a configuration of the target signal calculation circuit 1700. Referring to FIG. 5, the target signal calculation circuit 1700 includes a weighting
[0083]
The weighting
[0084]
Then, the weighting
[0085]
The weighting
[0086]
The ACB
[0087]
The ACB
Is calculated.
[0088]
Here, the delay k is a second ACB delay. A signal cut out from the past second excitation signal with a delay k is defined as a second ACB signal v (n).
[0089]
Then, the ACB
[0090]
The optimum ACB
[0091]
Next, the optimum ACB
[0092]
Then, the optimum ACB
[0093]
The details of the method of calculating the second ACB signal and the method of calculating the optimum ACB gain can be referred to the descriptions in Sections 6.1 and 5.6 of “
[0094]
The impulse
[0095]
Then, impulse
[0096]
However,
[0097]
Is the second LP coefficient
Is the transfer function of the linear prediction filter with.
[0098]
[0099]
Is the first LP coefficient
Is a transfer function of an auditory weighting filter having
[0100]
Here, P is a linear prediction order (for example, 10), and γ1 and γ2 are coefficients (for example, 0.94 and 0.6) for controlling weighting.
[0101]
The FCB
[0102]
FIG. 6 is a diagram showing a configuration of the FCB
[0103]
The FCB
And pulse polarity
To the FCB
[0104]
With reference to FIG. 7, the reading of the pulse position code will be described.
[0105]
For example, the pulse position code in scheme A
Is 6, the corresponding pulse position
Is 30. In method B, the pulse position code
Is 1, the corresponding pulse position
Is 30. In order to convert the pulse position code from scheme A to scheme B so that the pulse position value is the same (30 in this case), the pulse position code 6 in scheme A is converted to scheme B May be associated with the pulse position code 1 in.
[0106]
Regarding the pulse polarity code, the code may be read so that the polarity (positive or negative) corresponding to the code before reading and the polarity corresponding to the code after reading are equal.
[0107]
As described above, the description of the replacement of the pulse position code and the pulse polarity code is completed, and the description returns to FIG.
[0108]
The FCB
[0109]
This is the end of the description of the FCB
[0110]
The gain
[0111]
The gain
[0112]
Next, the gain
[0113]
Then, the gain
[0114]
Further, the gain
[0115]
Then, the gain
[0116]
Finally, the gain
[0117]
FIG. 8 is a diagram showing a configuration of the gain
[0118]
The second target
[0119]
The second target
And calculate the second ACB gain in y (n).
Is subtracted from the first target signal x (n) to obtain a second target signal x (n).2(N) is obtained.
[0120]
Then, the second target
[0121]
The optimal FCB
Is calculated from the second target signal x2 (n) and the filtered second FCB signal z (n) by the following equation. The optimal FCB gain gc is a gain that minimizes the distance between the second target signal x2 (n) and the filtered second FCB signal z (n).
[0122]
Then, the optimal FCB
[0123]
The voice /
[0124]
The procedure for obtaining the LSP fluctuation amount will be described below. In the n-th frame, the long-term average of the LSP
Is calculated by the following equation.
Here, Np is a linear prediction order, and β is, for example, 0.9.
[0125]
The variation dq (n) of the LSP in the n-th frame is defined by the following equation.
here,
Is
When
As an error with, for example,
Or
Can be defined, but the latter is used here. A section with a large variation dq (n) can correspond to a voice section, and a section with a small variation dq (n) can correspond to a non-voice section. By the threshold processing for the fluctuation amount dq (n), the sound determination value
To determine.
[0126]
(When Vs = 1 dq (n) is not less than CVS
Vs = 0 dq (n) is smaller than CVS)
[0127]
Here, Cvs is a certain constant (for example, 2.2), Vs = 1 corresponds to a voice section, and Vs = 0 corresponds to a non-voice section. The voice determination value is output to the optimum ACB
[0128]
The optimum ACB
[0129]
here,
Is the optimal ACB gain in the n-th subframe,
Is the long-term average of the optimum ACB gain in the n-th subframe, and α is, for example, 0.9. Note that an average value, a median value, a mode value, and the like can be applied to the long-term average.
[0130]
On the other hand, the optimum ACB
[0131]
Optimal ACB
[0132]
The ACB
[0133]
The ACB
[0134]
here,
Is the optimal ACB gain,
Is the modified ACB gain,
Is an ACB gain sequentially read from the ACB gain codebook, and μ is a weight coefficient. For example, when the voice determination value Vs is 1 (voice section), the weight coefficient μ is 1.0, and when Vs is 0 (non-voice section), μ is 0.2.
[0135]
Then, the ACB
[0136]
The optimal FCB
[0137]
When the voice determination value Vs is 0 (non-voice section) in the optimum FCB
[0138]
here,
Is the optimal FCB gain in the n-th subframe,
Is the long-term average of the optimal FCB gain in the n-th subframe, and α is, for example, 0.9. Note that an average value, a median value, a mode value, and the like can be applied to the long-term average.
[0139]
On the other hand, in the optimum FCB
[0140]
Optimal FCB
[0141]
The FCB
[0142]
here,
Is the optimal FCB gain,
Is the modified FCB gain,
Is an FCB gain sequentially read from the FCB gain codebook, and μ is a weight coefficient. For example, when the voice determination value Vs is 1 (voice section), the weight coefficient μ is 1.0, and when the voice determination value Vs is 0 (non-voice section), μ is 0.2.
[0143]
Then, the FCB
[0144]
The gain
[0145]
This is the end of the description of the gain
[0146]
The second excitation signal calculation circuit 1610 receives the second ACB signal output from the target signal calculation circuit 1700, receives the second FCB signal output from the FCB
[0147]
The second excitation signal storage circuit 1620 receives the second excitation signal output from the second excitation signal calculation circuit 1610, and stores and holds the second excitation signal. Then, the second excitation signal input and stored in the past is output to the target signal calculation circuit 1700. This concludes the description of the first embodiment of the present invention.
[0148]
Next, a second embodiment of the present invention will be described. FIG. 9 is a diagram showing the configuration of a second embodiment of the transcoder according to the present invention. In FIG. 9, the LP coefficient
[0149]
The LP coefficient
[0150]
Gain
[0151]
First, the gain
[0152]
Next, the gain
[0153]
The gain
[0154]
The gain
[0155]
Finally, the gain
[0156]
FIG. 10 is a diagram showing a configuration of the gain
[0157]
The gain
[0158]
The ACB
[0159]
The FCB
[0160]
The ACB
[0161]
The ACB
[0162]
here,
Is the first ACB gain in the nth subframe,
Is the long-term average of the first ACB gain in the n-th subframe, and α is, for example, 0.9. Note that an average value, a median value, a mode value, and the like can be applied to the long-term average.
[0163]
On the other hand, when the voice determination value Vs is 1 (voice section), the ACB
[0164]
ACB
[0165]
The FCB
[0166]
When the voice determination value Vs is 0 (non-voice section) in the FCB
[0167]
here,
Is the first FCB gain in the nth subframe,
Is the long-term average of the first FCB gain in the n-th subframe, and α is, for example, 0.9. Note that an average value, a median value, a mode value, and the like can be applied to the long-term average.
[0168]
On the other hand, when the voice determination value Vs is 1 (voice section), the FCB
[0169]
FCB
[0170]
The ACB
[0171]
The ACB
[0172]
[0173]
here,
Is the first ACB gain,
Is the modified ACB gain,
Is an ACB gain sequentially read from the
[0174]
Then, the ACB
[0175]
The FCB
[0176]
The FCB
[0177]
here,
Is the first FCB gain,
Is the modified FCB gain,
Is an FCB gain sequentially read from the
[0178]
Then, the FCB
[0179]
The transcoder of each embodiment of the present invention described above may be realized by computer control such as a digital signal processor. FIG. 11 is a diagram schematically showing an apparatus configuration in a case where the code conversion processing of each of the above embodiments is implemented by a computer as a third embodiment of the present invention. In the computer 1 that executes the program read from the recording medium 6, the first code obtained by encoding the audio by the first encoding / decoding device can be decoded by the second encoding / decoding device. In performing the code conversion process of converting to a code, the recording medium 6 includes:
(A) a process of obtaining a first linear prediction coefficient from a first code string;
(B) a process of obtaining information on an excitation signal from the first code sequence;
(C) a process of obtaining an excitation signal from information of the excitation signal;
(D) a process of generating an audio signal by driving a filter having a first linear prediction coefficient with an excitation signal;
(E) a process of calculating a gain (optimum gain) that minimizes the distance between the second audio signal generated from the information obtained from the second code sequence and the first audio signal;
(F) a process for correcting the optimal gain;
(G) First square error is calculated from the corrected optimum gain (corrected optimum gain) and the gain read from the gain codebook in the second method, and the optimum gain and the gain read from the gain codebook are calculated. From the gain codebook by calculating the second squared error from the gain codebook, and selecting the gain that minimizes the evaluation function based on the first squared error and the second squared error from the gain codebook. ,
Is recorded. The program is read from the recording medium 6 to the
[0180]
In the fourth embodiment of the present invention, in the computer 1 executing the program read from the recording medium 6, the first code obtained by encoding the audio by the first encoding / decoding device is converted into the second code. In performing the code conversion process of converting into the second code decodable by the encoding / decoding device, the recording medium 6 includes:
(A) decoding the gain information from the first code string;
(B) a process for correcting the decoded gain (decoding gain);
(C) First square error is calculated from the corrected decoding gain (corrected decoding gain) and the gain read from the gain codebook in the second method, and the decoding gain and the gain read from the gain codebook are calculated. From the gain codebook by calculating the second squared error from the gain codebook, and selecting the gain that minimizes the evaluation function based on the first squared error and the second squared error from the gain codebook. ,
Is recorded.
[0181]
Although the present invention has been described with reference to the above embodiment, the present invention is not limited to the configuration of the above embodiment, and a person skilled in the art within the scope of the claims set forth in the claims. Needless to say, various changes and modifications that could be made are included.
[0182]
【The invention's effect】
As described above, according to the present invention, there is an effect that deterioration of background noise sound quality in a non-speech section can be reduced.
[0183]
The reason is that, in the present invention, the information obtained from the first audio signal and the second code string obtained by driving the synthesis filter having the first linear prediction coefficient from the first code string with the excitation signal is used. An optimum gain is derived from the generated second audio signal, and the optimum gain is further corrected. Based on the corrected optimum gain, the optimum gain, and the gain read from the gain codebook in the second scheme, This is because the gain information in the code string of No. 2 is obtained, and in this case, the second gain is obtained using an evaluation function that reduces the time variation of the second gain in the non-voice section. The above effect is obtained by decoding gain information from the first code string, correcting the decoded gain, and based on the corrected decoding gain, and the decoding gain and the gain read from the gain codebook in the second scheme. , The gain information in the second code string is obtained, and the second gain is obtained by using an evaluation function that reduces the time variation of the second gain in the non-voice section. Can also be played.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration of a first embodiment of a code conversion apparatus according to the present invention.
FIG. 2 is a diagram showing a configuration of an LP coefficient code conversion circuit in the code conversion device according to the present invention.
FIG. 3 is a diagram illustrating a correspondence relationship between an ACB code and an ACB delay and a method of reading the ACB code.
FIG. 4 is a diagram showing a configuration of a speech decoding circuit of the transcoder according to the present invention.
FIG. 5 is a diagram showing a configuration of a target signal calculation circuit in the transcoder according to the present invention.
FIG. 6 is a diagram showing a configuration of an FCB code generation circuit in the code conversion device according to the present invention.
FIG. 7 is a diagram for explaining a correspondence relationship between a pulse position code and a pulse position and a method of reading an ACB code.
FIG. 8 is a diagram showing a configuration of a gain code generation circuit in the code conversion device according to the present invention.
FIG. 9 is a diagram showing a configuration of a second embodiment of the code conversion apparatus according to the present invention.
FIG. 10 is a diagram showing a configuration of a gain code generation circuit in the code conversion device according to the present invention.
FIG. 11 is a diagram showing a configuration of a third to a fourth embodiment of the transcoder according to the present invention.
FIG. 12 is a diagram illustrating a configuration of a conventional transcoder.
[Explanation of symbols]
1 Computer
2 CPU
3 memory
4 Recording medium reading device interface
5 Recording medium reading device
6 Recording media
10, 31, 35, 36, 37, 51, 52, 53, 57, 61, 74, 75, 81, 82, 83, 84, 85, 91, 92, 93, 94 input terminals
20, 32, 33, 34, 55, 56, 62, 63, 76, 77, 78, 86, 95, 96 output terminals
100,1100 @ LP coefficient sign conversion circuit
110 LP coefficient decoding circuit
130 LP coefficient coding circuit
111 @ First LSP Codebook
131 @ 2nd LSP Codebook
200,1200 ACB code conversion circuit
300, 1300 {FCB} code conversion circuit
400, 2400 gain code conversion circuit
1010 code separation circuit
1020 code multiplexing circuit
1110 LSP-LPC conversion circuit
1120 ° impulse response calculation circuit
1400 gain code generation circuit
1410, 2410 ACB gain encoding circuit
1411,247 @ ACB Gain Codebook
1420, 2420 FCB gain coding circuit
1421,481 @ FCB Gain Codebook
1430 second target signal calculation circuit
1440 Optimal FCB gain calculation circuit
1450 ° optimal FCB gain correction circuit
1460 voice / non-voice discrimination circuit
1470 gain code multiplexing circuit
1480 Optimal ACB gain correction circuit
1500 audio decoding circuit
1510 @ ACB decoding circuit
1520 FCB decoding circuit
1530 gain decoding circuit
1540 excitation signal calculation circuit
1570 ° excitation signal storage circuit
1580 synthesis filter
1600 ° excitation signal information decoding circuit
1610 second excitation signal calculation circuit
1620 second excitation signal storage circuit
1700 target signal calculation circuit
1710 weighted signal calculation circuit
1720 ACB signal generation circuit
1800 FCB code generation circuit
1820 FCB signal generation circuit
2480 FCB gain decoding circuit
2450 FCB gain correction circuit
2490 gain code separation circuit
Claims (30)
前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成するステップと、
第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づき最適ゲインを導出するステップと、
前記最適ゲインを修正するステップと、
修正された最適ゲイン(「修正最適ゲイン」という)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるステップと、
を含む、ことを特徴とする符号変換方法。In a code conversion method for converting a first code string conforming to the first method into a second code string conforming to the second method,
By obtaining information of a first linear prediction coefficient and an excitation signal from the first code string and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal, the first Generating an audio signal of
Deriving an optimal gain based on a second audio signal generated by information obtained from a second code sequence and the first audio signal;
Modifying the optimal gain;
Obtaining gain information in a second code sequence based on the corrected optimal gain (referred to as “modified optimal gain”), the optimal gain, and a gain read from a gain codebook in the second method;
A code conversion method comprising:
前記第1の符号列からゲイン情報を復号するステップと、
復号されたゲイン(「復号ゲイン」という)を修正するステップと、
修正された復号ゲイン(「修正復号ゲイン」という)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるステップと、
を含む、ことを特徴とする符号変換方法。In a code conversion method for converting a first code string conforming to the first method into a second code string conforming to the second method,
Decoding gain information from the first code sequence;
Modifying the decoded gain (referred to as "decoding gain");
Obtaining gain information in a second code sequence based on a corrected decoding gain (referred to as “corrected decoding gain”), the decoding gain, and a gain read from a gain codebook in a second method;
A code conversion method comprising:
前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算するステップと、
前記第1の自乗誤差と前記第2の自乗誤差とに基づく評価関数を最小とするゲインを、前記ゲインコードブックから選択することによって、第2の符号列におけるゲイン情報を求めるステップと、
を含む、ことを特徴とする請求項1に記載の符号変換方法。Calculating a first squared error from the corrected optimal gain and a gain read from the gain codebook;
Calculating a second squared error from the optimal gain and a gain read from the gain codebook;
Obtaining gain information in a second code sequence by selecting a gain that minimizes an evaluation function based on the first square error and the second square error from the gain codebook;
The code conversion method according to claim 1, comprising:
前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算するステップと、
前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数を最小とするゲインを、前記ゲインコードブックから選択することによって、第2の符号列におけるゲイン情報を求めるステップと、
を含む、ことを特徴とする請求項2に記載の符号変換方法。Calculating a first squared error from the modified decoding gain and a gain read from the gain codebook;
Calculating a second squared error from the decoding gain and a gain read from the gain codebook;
Obtaining gain information in a second code string by selecting a gain that minimizes an evaluation function based on the first square error and the second square error from the gain codebook;
The code conversion method according to claim 2, comprising:
前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成する音声復号回路と、
第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づき、最適ゲインを計算する最適ゲイン計算回路と、
前記最適ゲインを修正する最適ゲイン修正回路と、
修正された最適ゲイン(「修正最適ゲイン」という)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるゲイン符号化回路と、
を含む、ことを特徴とする符号変換装置。In a code conversion device that converts a first code string compliant with the first method into a second code string compliant with the second method,
By obtaining information of a first linear prediction coefficient and an excitation signal from the first code string and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal, the first An audio decoding circuit that generates an audio signal of
An optimum gain calculation circuit that calculates an optimum gain based on a second audio signal generated based on information obtained from a second code string and the first audio signal;
An optimum gain correction circuit for correcting the optimum gain,
A gain coding circuit for obtaining gain information in a second code sequence based on a corrected optimum gain (referred to as “corrected optimum gain”), the optimum gain, and a gain read from a gain codebook in the second method. When,
A transcoding device comprising:
前記第1の符号列からゲイン情報を復号するゲイン復号回路と、
復号されたゲイン(「復号ゲイン」という)を修正する復号ゲイン修正回路と、
修正された復号ゲイン(「修正復号ゲイン」という)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるゲイン符号化回路、
を含む、ことを特徴とする符号変換装置。In a code conversion device that converts a first code string compliant with the first method into a second code string compliant with the second method,
A gain decoding circuit for decoding gain information from the first code string;
A decoding gain correction circuit for correcting the decoded gain (referred to as “decoding gain”);
Gain coding circuit for obtaining gain information in a second code sequence based on a corrected decoding gain (referred to as “corrected decoding gain”), the decoding gain, and a gain read from a gain codebook in the second method. ,
A transcoding device comprising:
前記修正最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める手段を備えている、
ことを特徴とする請求項9に記載の符号変換装置。The gain encoding circuit,
Calculating a first squared error from the corrected optimal gain and the gain read from the gain codebook; calculating a second squared error from the optimal gain and the gain read from the gain codebook; Means for obtaining gain information in the second code sequence by selecting a gain that minimizes an evaluation function based on the first squared error and the second squared error from the gain codebook,
The transcoder according to claim 9, wherein:
前記修正復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める手段を備えている、ことを特徴とする請求項10に記載の符号変換装置。The gain encoding circuit,
Calculating a first squared error from the corrected decoding gain and the gain read from the gain codebook; calculating a second squared error from the decoded gain and the gain read from the gain codebook; Means for obtaining gain information in a second code sequence by selecting a gain that minimizes an evaluation function based on the first square error and the second square error from the gain codebook. The transcoder according to claim 10, wherein:
(a)前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成する処理と、
(b)第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づき最適ゲインを計算する処理と、
(c)前記最適ゲインを修正する処理と、
(d)修正された最適ゲイン(「修正最適ゲイン」という)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める処理、
を実行させるためのプログラム。A computer that constitutes a code conversion device that converts a first code string compliant with the first method into a second code string compliant with the second method,
(A) Obtaining information of a first linear prediction coefficient and an excitation signal from the first code string, and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal. Generating a first audio signal by
(B) a process of calculating an optimal gain based on a second audio signal generated based on information obtained from a second code sequence and the first audio signal;
(C) processing for correcting the optimum gain;
(D) a process of obtaining gain information in a second code string based on a corrected optimum gain (referred to as “corrected optimum gain”), the optimum gain, and a gain read from a gain codebook in the second method. ,
The program to execute.
(a)前記第1の符号列からゲイン情報を復号する処理と、
(b)復号されたゲイン(「復号ゲイン」という)を修正する処理と、
(c)修正された復号ゲイン(「修正復号ゲイン」という)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める処理、
を実行させるためのプログラム。A computer that constitutes a code conversion device that converts a first code string compliant with the first method into a second code string compliant with the second method,
(A) decoding gain information from the first code string;
(B) processing for correcting the decoded gain (referred to as “decoding gain”);
(C) a process of obtaining gain information in a second code string based on a corrected decoding gain (referred to as “corrected decoding gain”), the decoding gain, and a gain read from a gain codebook in the second method. ,
The program to execute.
前記修正最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める処理、を前記コンピュータに実行させるためのプログラム。The program according to claim 17,
Calculating a first squared error from the corrected optimal gain and the gain read from the gain codebook; calculating a second squared error from the optimal gain and the gain read from the gain codebook; Causing the computer to execute a process of obtaining gain information in a second code string by selecting a gain that minimizes an evaluation function based on the first square error and the second square error from the gain codebook. Program.
前記修正復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める処理、を前記コンピュータに実行させるためのプログラム。The program according to claim 18,
Calculating a first squared error from the corrected decoding gain and the gain read from the gain codebook; calculating a second squared error from the decoded gain and the gain read from the gain codebook; Causing the computer to execute a process of obtaining gain information in a second code string by selecting a gain that minimizes an evaluation function based on the first square error and the second square error from the gain codebook. Program.
前記修正最適ゲインが、前記最適ゲインの長時間平均に基づくものである、ことを特徴とするプログラム。The program according to claim 17 or 19,
The program wherein the corrected optimal gain is based on a long-term average of the optimal gain.
前記修正復号ゲインが、前記復号ゲインの長時間平均に基づくものである、ことを特徴とするプログラム。The program according to claim 18, wherein
The program wherein the modified decoding gain is based on a long-term average of the decoding gain.
前記第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離を最小とするゲインを前記最適ゲインとして求める処理、を前記コンピュータに実行させるためのプログラム。The program according to any one of claims 18 to 22,
Causing the computer to execute, as the optimum gain, a process of obtaining a gain that minimizes a distance between a second audio signal generated based on information obtained from the second code string and the first audio signal. Program.
前記評価関数が、前記第1の自乗誤差と前記第2の自乗誤差と重み係数とからなる、ことを特徴とするプログラム。The program according to any one of claims 17 to 22,
A program, wherein the evaluation function comprises the first square error, the second square error, and a weight coefficient.
前記符号分離回路で分離された線形予測係数符号に基づき、第1の方式と第2の方式で復号してなる第1、第2の線形予測係数を生成する回路と、
前記符号分離回路から入力した第1の方式の適応コードブック(ACB)符号を、第1の方式における符号と第2の方式における符号との対応関係を用いて読み替えることにより第2の方式のACB符号を得、前記符号多重回路へ出力し、前記第2のACB符号に対応するACB遅延を第2のACB遅延として目標信号計算回路へ出力する手段を含む適応コードブック符号変換回路(「ACB符号変換回路」という)と、
前記符号分離回路で分離された第1の方式におけるACB符号、固定コードブック(FCB)符号及びゲイン符号を含む励振信号情報を入力として受け取ってそれぞれを復号し、前記符号分離回路で分離された線形予測係数符号に基づき第1の方式で復号してなる第1の線形予測係数をもつ合成フィルタを、前記励振信号情報から得られる励振信号で駆動することで、復号音声信号を合成して出力する音声復号回路と、
前記符号分離回路から出力される第1の方式のFCB符号を入力し、前記FCB符号を第2の方式により復号可能な符号に変換し、前記変換したFCB符号を、第2のFCB符号として前記符号多重回路へ出力し、前記第2のFCB符号に対応する第2のFCB信号を出力する固定コードブック符号生成回路(「FCB符号生成回路」という)と、
前記第1の線形予測係数と前記第2の線形予測係数から構成される聴感重み付け合成フィルタのインパルス応答信号を出力するインパルス応答計算回路と、
前記目標信号計算回路と、
ゲイン符号生成回路と、
を備え、
前記目標信号計算回路は、
前記音声復号回路の合成フィルタから出力される復号音声を入力し、前記第1の線形予測係数を用いて構成される聴感重み付けフィルタを前記復号音声で駆動して聴感重み付け音声信号を生成するとともに、前記第1及び第2の線形予測係数を用いて構成される聴感重み付け合成フィルタの零入力応答を、前記聴感重み付け音声信号から減算して得られる第1の目標信号を生成する重み付け信号計算回路と、
前記重み付け信号計算回路から出力される前記第1の目標信号と、前記ACB符号変換回路から出力される前記第2のACB遅延と、前記インパルス応答計算回路から出力される前記インパルス応答信号と、過去の第2の励振信号を記憶保持する第2の励振信号記憶回路から出力される過去の第2の励振信号とを入力し、前記過去の第2の励振信号から、遅延k(ただし、kは前記第2のACB遅延)で切り出された信号と前記インパルス応答信号との畳み込みにより、フィルタ処理された遅延kの過去の励振信号を計算して第2のACB信号として出力するACB信号生成回路と、
前記重み付け信号計算回路から出力される前記第1の目標信号と、前記ACB信号生成回路から出力される、前記フィルタ処理された遅延kの過去の励振信号とを入力し、前記第1の目標信号と、前記フィルタ処理された遅延kの過去の励振信号とから、最適ACBゲインを導出して出力する最適ACBゲイン計算回路と、
を備え、
前記ゲイン符号生成回路は、
前記目標信号計算回路から出力される、前記第1の目標信号と、前記第2のACB信号と、前記最適ACBゲインと、前記FCB符号生成回路から出力される前記第2のFCB信号と、前記インパルス応答計算回路から出力される前記インパルス応答信号と、前記第1の線形予測係数とを入力し、
前記第1の目標信号と前記第2のACB信号と前記最適ACBゲインと前記インパルス応答信号とから第2の目標信号を計算し、前記第2の目標信号と、前記第2のFCB信号と前記インパルス応答信号とから最適FCBゲインを計算する手段と、
前記最適ACBゲインから修正ACBゲインを求める手段と、
前記計算された最適FCBゲインを入力し、前記最適FCBゲインから修正FCBゲインを計算する手段と、
前記第1の線形予測係数から音声判定値を決定する手段と、
ACBゲインコードブックから順次読み込まれるACBゲインと、前記最適ACBゲインとから第1の自乗誤差を計算し、前記ACBゲインと前記修正ACBゲインとから第2の自乗誤差を計算する手段と、
前記音声判定値から計算される重み係数と、前記第1の自乗誤差と前記第2の自乗誤差とから計算される第1の評価関数を最小とするACBゲイン及び対応するACBゲイン符号を選択する手段と、
FCBゲインコードブックから順次読み込まれるFCBゲインと前記最適FCBゲインとから第3の自乗誤差を計算し、前記FCBゲインと前記修正FCBゲインとから第4の自乗誤差を計算する手段と、
前記音声判定値から計算される重み係数と第3の自乗誤差と第4の自乗誤差とから計算される第2の評価関数を最小とするFCBゲイン及び対応するFCBゲイン符号を選択する手段と、
選択されたACBゲイン符号とFCBゲイン符号とからなる第2のゲイン符号を、第2の方式におけるゲイン復号方法により復号可能な符号として前記符号多重回路出力する手段と、
を備えている、ことを特徴とする符号変換装置。Code string data obtained by multiplexing a code obtained by encoding an audio signal by the first method is input to a code separation circuit, and based on the code separated by the code separation circuit, a different code string from the first method is used. A code conversion device that converts the converted code into a code conforming to the second system, supplies the converted code to a code multiplexing circuit, and outputs code string data obtained by multiplexing the converted code from the code multiplexing circuit. ,
A circuit that generates first and second linear prediction coefficients obtained by decoding in a first method and a second method based on the linear prediction coefficient code separated by the code separation circuit;
The adaptive codebook (ACB) code of the first system input from the code separation circuit is read by using the correspondence between the code of the first system and the code of the second system, thereby obtaining the ACB of the second system. An adaptive codebook code conversion circuit (“ACB code”) including means for obtaining a code, outputting the code to the code multiplexing circuit, and outputting an ACB delay corresponding to the second ACB code to the target signal calculation circuit as a second ACB delay. Conversion circuit))
Excitation signal information including an ACB code, a fixed codebook (FCB) code, and a gain code in the first scheme separated by the code separation circuit is received as an input, and each is decoded, and the linear signal separated by the code separation circuit is decoded. By driving a synthesis filter having a first linear prediction coefficient obtained by decoding in a first method based on the prediction coefficient code with an excitation signal obtained from the excitation signal information, a decoded speech signal is synthesized and output. An audio decoding circuit;
A FCB code of a first system output from the code separation circuit is input, the FCB code is converted into a code that can be decoded by a second system, and the converted FCB code is used as a second FCB code. A fixed codebook code generation circuit (referred to as “FCB code generation circuit”) that outputs to the code multiplexing circuit and outputs a second FCB signal corresponding to the second FCB code;
An impulse response calculation circuit that outputs an impulse response signal of an auditory weighting synthesis filter composed of the first linear prediction coefficient and the second linear prediction coefficient;
The target signal calculation circuit;
A gain code generation circuit;
With
The target signal calculation circuit,
A decoded speech output from the synthesis filter of the speech decoding circuit is input, and an auditory weighting filter configured using the first linear prediction coefficient is driven by the decoded speech to generate an auditory weighted speech signal, A weighting signal calculation circuit for generating a first target signal obtained by subtracting the quiescent response of the audibility weighting synthesis filter configured using the first and second linear prediction coefficients from the audibility weighted speech signal; ,
The first target signal output from the weighting signal calculation circuit, the second ACB delay output from the ACB code conversion circuit, the impulse response signal output from the impulse response calculation circuit, And a past second excitation signal output from a second excitation signal storage circuit that stores and holds the second excitation signal of the above, and a delay k (where k is An ACB signal generation circuit that calculates a past excitation signal of a filtered delay k by convolution of the signal cut out by the second ACB delay) and the impulse response signal, and outputs the same as a second ACB signal; ,
Inputting the first target signal output from the weighting signal calculation circuit and the past excitation signal of the filtered delay k output from the ACB signal generation circuit, the first target signal An optimal ACB gain calculating circuit for deriving and outputting an optimal ACB gain from the past excitation signal of the filtered delay k,
With
The gain code generation circuit includes:
The first target signal, the second ACB signal, the optimum ACB gain, the second FCB signal output from the FCB code generation circuit, and the first target signal output from the target signal calculation circuit; Inputting the impulse response signal output from the impulse response calculation circuit and the first linear prediction coefficient,
Calculating a second target signal from the first target signal, the second ACB signal, the optimum ACB gain, and the impulse response signal, and calculating the second target signal, the second FCB signal, Means for calculating an optimal FCB gain from the impulse response signal;
Means for obtaining a corrected ACB gain from the optimum ACB gain;
Means for inputting the calculated optimal FCB gain and calculating a corrected FCB gain from the optimal FCB gain;
Means for determining a speech determination value from the first linear prediction coefficient;
Means for calculating a first squared error from an ACB gain sequentially read from an ACB gain codebook and the optimum ACB gain, and calculating a second squared error from the ACB gain and the corrected ACB gain;
An ACB gain and a corresponding ACB gain code that minimize a first evaluation function calculated from the weight coefficient calculated from the speech determination value, the first square error, and the second square error are selected. Means,
Means for calculating a third squared error from the FCB gain sequentially read from the FCB gain codebook and the optimum FCB gain, and calculating a fourth squared error from the FCB gain and the corrected FCB gain;
Means for selecting an FCB gain and a corresponding FCB gain code that minimize the second evaluation function calculated from the weight coefficient, the third square error, and the fourth square error calculated from the voice determination value;
Means for outputting a second gain code composed of the selected ACB gain code and FCB gain code as a code decodable by the gain decoding method in the second method, to the code multiplexing circuit;
A transcoder comprising:
前記第2の励振信号記憶回路は、前記第2の励振信号計算回路から出力される第2の励振信号を入力し、これを記憶保持し、過去に入力されて記憶保持されている第2の励振信号を前記目標信号計算回路へ出力する、ことを特徴とする請求項26記載の符号変換装置。A second ACB signal output from the target signal calculation circuit; a second FCB signal output from the FCB code generation circuit; a second ACB gain output from the gain code generation circuit; An FCB gain is input, a signal obtained by multiplying the second ACB signal by a second ACB gain, and a signal obtained by multiplying the second FCB signal by a second FCB gain are added. A second excitation signal calculation circuit that obtains a second excitation signal through the second excitation signal and outputs the second excitation signal to the second excitation signal storage circuit.
The second excitation signal storage circuit inputs the second excitation signal output from the second excitation signal calculation circuit, stores and holds the second excitation signal, and stores the second excitation signal that has been input and stored in the past. 27. The transcoder according to claim 26, wherein an excitation signal is output to the target signal calculation circuit.
前記ACB信号生成回路から出力される前記第2のACB信号と、前記重み付け信号計算回路から出力される前記第1の目標信号と、前記インパルス応答計算回路から出力される前記インパルス応答信号と、前記ACBゲイン符号化回路から出力される前記第2のACBゲインとを入力し、前記第2のACB信号と前記インパルス応答信号との畳み込みにより、フィルタ処理された第2のACB信号を計算し、前記フィルタ処理された第2のACB信号に前記第2のACBゲインを乗じて得られる信号を、前記第1の目標信号から減算して第2の目標信号を導出し前記第2の目標信号を出力する第2の目標信号計算回路と、
前記FCB信号生成回路から出力される前記第2のFCB信号と、前記インパルス応答計算回路から出力される前記インパルス応答信号と、前記第2の目標信号計算回路から出力される前記第2の目標信号とを入力し、前記第2のFCB信号とインパルス応答信号との畳み込みにより、フィルタ処理された第2のFCB信号を計算し、前記第2の目標信号と前記第2のFCB信号との距離を最小とする最適FCBゲインを計算する最適FCBゲイン計算回路と、
前記第1の線形予測係数とその長時間平均とから線形予測係数の変動量を計算し音声判定値を決定する音声/非音声識別回路と、
前記ACB信号生成回路から出力される前記最適ACBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、前記音声判定値が非音声区間のとき、前記最適ACBゲインの長時間平均を修正ACBゲインとして非音声区間において前記最適ACBゲインの長時間平均を計算し、音声区間のとき、前記最適ACBゲインそのものを修正ACBゲインとして出力する、最適ACBゲイン修正回路と、
前記ACB信号生成回路から出力される前記最適ACBゲインと、前記最適ACBゲイン修正回路から出力される前記修正ACBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、前記ACBゲインコードブックから順次読み込まれるACBゲインと、前記最適ACBゲインとから第1の自乗誤差を計算し、前記ACBゲインと前記修正ACBゲインとから第2の自乗誤差を計算し、前記音声判定値から計算される重み係数と、前記第1の自乗誤差と、前記第2の自乗誤差とから評価関数を求め、前記評価関数が最小となるACBゲインを選択し、選択された前記ACBゲインを第2のACBゲインとして前記第2の目標信号計算回路へ出力するとともに、前記第2の励振信号計算回路へ出力し、前記第2のACBゲインに対応する符号をACBゲイン符号としてゲイン符号多重化回路へ出力するACB符号ゲイン符号化回路と、
前記最適FCBゲイン計算回路から出力される前記最適FCBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、前記音声判定値が非音声区間のとき、前記最適FCBゲインの長時間平均を修正FCBゲインとし、前記音声判定値が音声区間のとき、最適FCBゲインそのものを修正FCBゲインとし、前記修正FCBゲインをFCBゲイン符号化回路へ出力する最適FCBゲイン修正回路と、
前記最適FCBゲイン計算回路から出力される前記最適FCBゲインと、前記最適FCBゲイン修正回路から出力される前記修正FCBゲインと、前記音声/非音声識別回路から出力される前記音声判定値を入力し、前記FCBゲインコードブックから順次読み込まれるFCBゲインと、前記最適FCBゲインとから第3の自乗誤差を計算し、前記FCBゲインと前記修正FCBゲインとから第4の自乗誤差を計算し、前記音声判定値から計算される重み係数と前記第3の自乗誤差と前記第4の自乗誤差とから評価関数を計算し、前記評価関数が最小となるFCBゲインを選択し、選択された前記FCBゲインを第2のFCBゲインとして前記第2の励振信号計算回路へ出力し、第2のFCBゲインに対応する符号をFCBゲイン符号としてゲイン符号多重化回路へ出力するFCBゲイン符号化回路と、
前記ACBゲイン符号化回路から出力されるACBゲイン符号と、前記FCBゲイン符号化回路から出力されるFCBゲイン符号とを入力し、ACBゲイン符号とFCBゲイン符号とを多重化して得られる第2のゲイン符号を、第2の方式におけるゲイン復号方法により復号可能な符号として前記符号多重回路へ出力するゲイン符号多重回路と、
を備えている、ことを特徴とする請求項26記載の符号変換装置。The gain code generation circuit includes:
The second ACB signal output from the ACB signal generation circuit, the first target signal output from the weighting signal calculation circuit, the impulse response signal output from the impulse response calculation circuit, Receiving the second ACB gain output from the ACB gain encoding circuit, calculating a filtered second ACB signal by convolution of the second ACB signal and the impulse response signal, A signal obtained by multiplying the filtered second ACB signal by the second ACB gain is subtracted from the first target signal to derive a second target signal and output the second target signal. A second target signal calculation circuit,
The second FCB signal output from the FCB signal generation circuit, the impulse response signal output from the impulse response calculation circuit, and the second target signal output from the second target signal calculation circuit And calculates the filtered second FCB signal by convolution of the second FCB signal and the impulse response signal, and calculates the distance between the second target signal and the second FCB signal. An optimum FCB gain calculation circuit for calculating an optimum FCB gain to be minimized,
A speech / non-speech discrimination circuit that calculates a variation amount of the linear prediction coefficient from the first linear prediction coefficient and its long-term average to determine a speech determination value;
The optimum ACB gain output from the ACB signal generation circuit and the voice determination value output from the voice / non-voice discrimination circuit are input, and when the voice determination value is in a non-voice section, the optimum ACB gain is An optimal ACB gain correction circuit that calculates a long-term average of the optimum ACB gain in a non-voice section as a corrected ACB gain in a non-voice section, and outputs the optimum ACB gain itself as a corrected ACB gain in a voice section;
The optimum ACB gain output from the ACB signal generation circuit, the corrected ACB gain output from the optimum ACB gain correction circuit, and the voice determination value output from the voice / non-voice identification circuit are input. Calculating a first squared error from the ACB gain sequentially read from the ACB gain codebook and the optimum ACB gain, calculating a second squared error from the ACB gain and the corrected ACB gain, An evaluation function is obtained from a weight coefficient calculated from a determination value, the first square error, and the second square error, and an ACB gain that minimizes the evaluation function is selected, and the selected ACB gain is selected. As a second ACB gain to the second target signal calculation circuit, and to the second excitation signal calculation circuit to output the second ACB gain. And ACB code gain encoding circuit for outputting a code corresponding to the B gain to the gain code multiplexing circuit as ACB gain code,
The optimum FCB gain output from the optimum FCB gain calculation circuit and the voice determination value output from the voice / non-voice discrimination circuit are input. When the voice determination value is in a non-voice section, the optimum FCB gain is output. An optimal FCB gain correction circuit that outputs a corrected FCB gain to an FCB gain encoding circuit when the long-term average of the gain is a corrected FCB gain, and when the voice determination value is a voice section, the optimum FCB gain itself is a corrected FCB gain; ,
The optimum FCB gain output from the optimum FCB gain calculation circuit, the corrected FCB gain output from the optimum FCB gain correction circuit, and the voice determination value output from the voice / non-voice identification circuit are input. Calculating a third squared error from the FCB gain sequentially read from the FCB gain codebook and the optimal FCB gain, calculating a fourth squared error from the FCB gain and the corrected FCB gain, An evaluation function is calculated from the weight coefficient calculated from the determination value, the third square error, and the fourth square error, an FCB gain that minimizes the evaluation function is selected, and the selected FCB gain is calculated. The signal is output to the second excitation signal calculation circuit as a second FCB gain, and a code corresponding to the second FCB gain is used as an FCB gain code. And FCB gain encoding circuit to output to the in code multiplexing circuit,
A second ACB gain code obtained by inputting an ACB gain code output from the ACB gain coding circuit and an FCB gain code output from the FCB gain coding circuit, and multiplexing the ACB gain code and the FCB gain code. A gain code multiplexing circuit that outputs a gain code to the code multiplexing circuit as a code that can be decoded by the gain decoding method in the second method;
The transcoder according to claim 26, comprising:
前記符号分離回路で分離された線形予測係数符号に基づき、第1の方式と第2の方式で復号してなる第1、第2の線形予測係数を生成する回路と、
前記符号分離回路から出力される第1のACB符号を入力し、前記第1のACB符号を第2の方式により復号可能な符号に変換し、変換されたACB符号を、第2のACB符号として前記符号多重回路へ出力するACB符号変換回路と、
前記符号分離回路から出力される第1のFCB符号を入力し、前記第1のFCB符号を第2の方式により復号可能な符号に変換し、変換されたFCB符号を、第2のFCB符号として前記符号多重回路へ出力するFCB符号変換回路と、
前記符号分離回路から出力される第1のゲイン符号を入力し、前記第1のゲイン符号を第2の方式により復号可能な符号に変換し、変換されたゲイン符号を、第2のゲイン符号として前記符号多重回路へ出力するゲイン符号変換回路と、
を備え、
前記ゲイン符号変換回路が、
前記符号分離回路から出力される第1のゲイン符号と、前記第1の線形予測係数とを入力し、前記第1のゲイン符号を、第1の方式におけるゲイン復号方法により復号して得られる第1の適応コードブック(ACB)ゲイン及び第1の固定コードブック(FCB)ゲインから、修正ACBゲイン及び修正FCBゲインを計算する手段と、
前記第1の線形予測係数から音声判定値を決定する手段と、
ACBゲインコードブックから順次読み込まれるACBゲインと、前記第1のACBゲインとから第1の自乗誤差を計算し、前記ACBゲインと前記修正ACBゲインとから第2の自乗誤差を計算し、前記音声判定値から計算される重み係数と、前記第1の自乗誤差と、前記第2の自乗誤差とから計算される第1の評価関数が最小となるACBゲイン及び対応するACBゲイン符号を選択する手段と、
FCBゲインコードブックから順次読み込まれるFCBゲインと前記第1のFCBゲインとから第3の自乗誤差を計算し、FCBゲインと前記修正FCBゲインとから第4の自乗誤差を計算し、前記音声判定値から計算される重み係数と、前記第3の自乗誤差と、前記第4の自乗誤差とから計算される第2の評価関数を最小とするFCBゲイン及び対応するFCBゲイン符号を選択する手段と、
選択された前記ACBゲイン符号と前記FCBゲイン符号とからなる第2のゲイン符号を、第2の方式におけるゲイン復号方法により復号可能な符号として符号多重回路へ出力する手段と、
を備えている、ことを特徴とする符号変換装置。Code string data obtained by multiplexing a code obtained by encoding an audio signal by the first method is input to a code separation circuit, and based on the code separated by the code separation circuit, a different code string from the first method is used. A code conversion device that converts the converted code into a code conforming to the second system, supplies the converted code to a code multiplexing circuit, and outputs code string data obtained by multiplexing the converted code from the code multiplexing circuit. ,
A circuit that generates first and second linear prediction coefficients obtained by decoding in a first method and a second method based on the linear prediction coefficient code separated by the code separation circuit;
A first ACB code output from the code separation circuit is input, the first ACB code is converted into a code decodable by a second method, and the converted ACB code is used as a second ACB code. An ACB code conversion circuit for outputting to the code multiplexing circuit;
A first FCB code output from the code separation circuit is input, the first FCB code is converted into a code that can be decoded by a second method, and the converted FCB code is used as a second FCB code. An FCB code conversion circuit for outputting to the code multiplexing circuit;
A first gain code output from the code separation circuit is input, the first gain code is converted into a code that can be decoded by a second method, and the converted gain code is used as a second gain code. A gain code conversion circuit that outputs to the code multiplexing circuit;
With
The gain code conversion circuit,
A first gain code output from the code separation circuit and the first linear prediction coefficient are input, and a first gain code obtained by decoding the first gain code by a gain decoding method in a first scheme is obtained. Means for calculating a modified ACB gain and a modified FCB gain from the one adaptive codebook (ACB) gain and the first fixed codebook (FCB) gain;
Means for determining a speech determination value from the first linear prediction coefficient;
Calculating a first squared error from the ACB gain sequentially read from the ACB gain codebook and the first ACB gain; calculating a second squared error from the ACB gain and the corrected ACB gain; Means for selecting an ACB gain and a corresponding ACB gain code that minimize a first evaluation function calculated from a weight coefficient calculated from a determination value, the first square error, and the second square error When,
Calculating a third squared error from the FCB gain sequentially read from the FCB gain codebook and the first FCB gain; calculating a fourth squared error from the FCB gain and the corrected FCB gain; Means for selecting an FCB gain and a corresponding FCB gain code that minimize a second evaluation function calculated from the weighting factor calculated from the third squared error and the fourth squared error, and
Means for outputting to the code multiplexing circuit a second gain code composed of the selected ACB gain code and the FCB gain code as a code decodable by a gain decoding method in a second method;
A transcoder comprising:
前記第1の線形予測係数とその長時間平均とから線形予測係数の変動量を計算し音声判定値を決定する音声/非音声識別回路と、
前記符号分離回路から出力される第1のゲイン符号を入力し、第1のゲイン符号からACBゲイン及びFCBゲインに対応する第1のACBゲイン符号及び第1のFCBゲイン符号を分離し、第1のACBゲイン符号をACBゲイン復号回路へ出力し、第1のFCBゲイン符号をFCBゲイン復号回路へ出力するゲイン符号分離回路と、
複数セットのACBゲインが格納されたACBゲインコードブックを備えており、前記ゲイン符号分離回路から出力される第1のACBゲイン符号を入力し、前記第1のACBゲイン符号に対応するACBゲインを第1のACBゲインコードブックより読み出し、読み出されたACBゲインを第1のACBゲインとしてACBゲイン修正回路へ出力するとともに、ACBゲイン符号化回路へ出力し、ACBゲイン符号からのACBゲインの復号は、第1の方式におけるACBゲインの復号方法に従い、第1の方式のACBゲインコードブックを用いるACBゲイン復号回路と、
複数セットのFCBゲインが格納されたFCBゲインコードブックを備えており、前記ゲイン符号分離回路から出力される第1のFCBゲイン符号を入力し、前記第1のFCBゲイン符号に対応するFCBゲインを第1のFCBゲインコードブックより読み出し、読み出されたFCBゲインを第1のFCBゲインとしてFCBゲイン修正回路へ出力するとともに、FCBゲイン符号化回路へ出力し、FCBゲイン符号からのFCBゲインの復号は、第1の方式におけるFCBゲインの復号方法に従い、第1の方式のFCBゲインコードブックを用いるFCBゲイン復号回路と、
前記ACBゲイン復号回路から出力される前記第1のACBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、前記音声判定値が非音声区間のとき、前記第1のACBゲインの長時間平均を修正ACBゲインとし、音声区間のとき、前記第1のACBゲインそのものを修正ACBゲインとし、前記修正ACBゲインをACBゲイン符号化回路へ出力するACBゲイン修正回路と、
前記FCBゲイン復号回路から出力される前記第1のFCBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、前記音声判定値が非音声区間のとき、前記第1のFCBゲインの長時間平均を修正FCBゲインとし、前記音声判定値が音声区間のとき、前記第1のFCBゲインそのものを修正FCBゲインとし、前記修正FCBゲインをFCBゲイン符号化回路へ出力するFCBゲイン修正回路と、
前記ACBゲイン復号回路から出力される前記第1のACBゲインと、前記ACBゲイン修正回路から出力される前記修正ACBゲインと、前記音声/非音声識別回路から出力される音声判定値とを入力し、前記ACBゲインコードブックから順次読み込まれるACBゲインと第1のACBゲインとから第1の自乗誤差を計算し、前記ACBゲインと前記修正ACBゲインとから第2の自乗誤差を計算し、前記音声判定値から計算される重み係数と、前記第1の自乗誤差と、前記第2の自乗誤差とから第1の評価関数を計算し、前記第1の評価関数が最小となるACBゲインを選択し、選択された前記ACBゲインを第2のACBゲインとし、前記第2のACBゲインに対応する符号を第2のACBゲイン符号としてゲイン符号多重化回路へ出力するACBゲイン符号化回路と、
前記FCBゲイン復号回路から出力される前記第1のFCBゲインと、前記FCBゲイン修正回路から出力される前記修正FCBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、FCBゲインコードブックから順次読み込まれるFCBゲインと前記第1のFCBゲインとから第3の自乗誤差を計算し、前記FCBゲインと前記修正FCBゲインとから第4の自乗誤差を計算し、前記音声判定値から計算される重み係数と、前記第3の自乗誤差と、前記第4の自乗誤差とから第2の評価関数を計算し、前記第2の評価関数が最小となるFCBゲインを選択し、選択された前記FCBゲインを第2のFCBゲインとし、第2のFCBゲインに対応する符号を第2のFCBゲイン符号としてゲイン符号多重化回路へ出力するFCBゲイン符号化回路と、
前記ACBゲイン符号化回路から出力されるACBゲイン符号と、前記FCBゲイン符号化回路から出力されるFCBゲイン符号とを入力し、ACBゲイン符号とFCBゲイン符号とを多重化して得られる第2のゲイン符号を、第2の方式におけるゲイン復号方法により復号可能な符号として前記符号多重回路へ出力するゲイン符号多重回路と、
を備えている、ことを特徴とする請求項29記載の符号変換装置。The gain code conversion circuit,
A speech / non-speech discrimination circuit that calculates a variation amount of the linear prediction coefficient from the first linear prediction coefficient and its long-term average to determine a speech determination value;
A first gain code output from the code separation circuit is input, and a first ACB gain code and a first FCB gain code corresponding to an ACB gain and an FCB gain are separated from the first gain code, and the first gain code is separated from the first gain code. A gain code separating circuit that outputs the ACB gain code to the ACB gain decoding circuit and outputs the first FCB gain code to the FCB gain decoding circuit;
An ACB gain codebook in which a plurality of sets of ACB gains are stored, a first ACB gain code output from the gain code separation circuit is input, and an ACB gain corresponding to the first ACB gain code is input. The ACB gain is read from the first ACB gain codebook, and the read ACB gain is output to the ACB gain correction circuit as the first ACB gain, and is also output to the ACB gain encoding circuit to decode the ACB gain from the ACB gain code. An ACB gain decoding circuit that uses the ACB gain codebook of the first scheme according to the ACB gain decoding method of the first scheme;
An FCB gain codebook storing a plurality of sets of FCB gains is provided, a first FCB gain code output from the gain code separation circuit is input, and an FCB gain corresponding to the first FCB gain code is input. Reading from the first FCB gain codebook, outputting the read FCB gain to the FCB gain correction circuit as the first FCB gain, and outputting the FCB gain to the FCB gain encoding circuit, and decoding the FCB gain from the FCB gain code Is an FCB gain decoding circuit that uses the FCB gain codebook of the first method according to the FCB gain decoding method of the first method;
The first ACB gain output from the ACB gain decoding circuit and the voice determination value output from the voice / non-voice identification circuit are input, and when the voice determination value is in a non-voice section, An ACB gain correction circuit that outputs the corrected ACB gain to an ACB gain encoding circuit while using the first ACB gain itself as a corrected ACB gain during a voice period; ,
The first FCB gain output from the FCB gain decoding circuit and the voice determination value output from the voice / non-voice identification circuit are input, and when the voice determination value is in a non-voice section, A long-term average of the FCB gains of 1 is a modified FCB gain, and when the voice judgment value is in a voice section, the first FCB gain itself is a modified FCB gain, and the modified FCB gain is output to an FCB gain encoding circuit. FCB gain correction circuit,
The first ACB gain output from the ACB gain decoding circuit, the corrected ACB gain output from the ACB gain correction circuit, and a voice determination value output from the voice / non-voice identification circuit are input. Calculating a first squared error from the ACB gain sequentially read from the ACB gain codebook and the first ACB gain, calculating a second squared error from the ACB gain and the corrected ACB gain, A first evaluation function is calculated from the weight coefficient calculated from the determination value, the first square error, and the second square error, and an ACB gain that minimizes the first evaluation function is selected. The selected ACB gain as a second ACB gain, and a code corresponding to the second ACB gain as a second ACB gain code to a gain code multiplexing circuit. And ACB gain encoding circuit for force,
The first FCB gain output from the FCB gain decoding circuit, the corrected FCB gain output from the FCB gain correction circuit, and the voice determination value output from the voice / non-voice identification circuit are input. Calculating a third squared error from the FCB gain sequentially read from the FCB gain codebook and the first FCB gain; calculating a fourth squared error from the FCB gain and the corrected FCB gain; A second evaluation function is calculated from the weight coefficient calculated from the voice determination value, the third squared error, and the fourth squared error, and an FCB gain that minimizes the second evaluation function is selected. Then, the selected FCB gain is set as a second FCB gain, and a code corresponding to the second FCB gain is set as a second FCB gain code to the gain code multiplexing circuit. And FCB gain encoding circuit to force,
A second ACB gain code obtained by inputting an ACB gain code output from the ACB gain coding circuit and an FCB gain code output from the FCB gain coding circuit, and multiplexing the ACB gain code and the FCB gain code. A gain code multiplexing circuit that outputs a gain code to the code multiplexing circuit as a code that can be decoded by the gain decoding method in the second method;
30. The transcoder according to claim 29, comprising:
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002215766A JP4238535B2 (en) | 2002-07-24 | 2002-07-24 | Code conversion method and apparatus between speech coding and decoding systems and storage medium thereof |
PCT/JP2003/008701 WO2004010416A1 (en) | 2002-07-24 | 2003-07-09 | Method and device for code conversion between voice encoding and decoding methods and storage medium thereof |
CNB038176750A CN1327410C (en) | 2002-07-24 | 2003-07-09 | Method and apparatus for transcoding between different speech encoding/decoding systems and recording medium |
US11/039,969 US7231345B2 (en) | 2002-07-24 | 2005-01-24 | Method and apparatus for transcoding between different speech encoding/decoding systems |
US11/171,387 US7319953B2 (en) | 2002-07-24 | 2005-07-01 | Method and apparatus for transcoding between different speech encoding/decoding systems using gain calculations |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002215766A JP4238535B2 (en) | 2002-07-24 | 2002-07-24 | Code conversion method and apparatus between speech coding and decoding systems and storage medium thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004061558A true JP2004061558A (en) | 2004-02-26 |
JP4238535B2 JP4238535B2 (en) | 2009-03-18 |
Family
ID=30767940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002215766A Expired - Fee Related JP4238535B2 (en) | 2002-07-24 | 2002-07-24 | Code conversion method and apparatus between speech coding and decoding systems and storage medium thereof |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP4238535B2 (en) |
CN (1) | CN1327410C (en) |
WO (1) | WO2004010416A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007515676A (en) * | 2003-12-10 | 2007-06-14 | フランス テレコム | Transcoding between indexes of multipulse dictionaries used for coding for digital signal compression |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102006051673A1 (en) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for reworking spectral values and encoders and decoders for audio signals |
EP2980797A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08146997A (en) * | 1994-11-21 | 1996-06-07 | Hitachi Ltd | Device and system for code conversion |
JP3331297B2 (en) * | 1997-01-23 | 2002-10-07 | 株式会社東芝 | Background sound / speech classification method and apparatus, and speech coding method and apparatus |
JP2002198870A (en) * | 2000-12-27 | 2002-07-12 | Mitsubishi Electric Corp | Echo processing device |
-
2002
- 2002-07-24 JP JP2002215766A patent/JP4238535B2/en not_active Expired - Fee Related
-
2003
- 2003-07-09 WO PCT/JP2003/008701 patent/WO2004010416A1/en active Application Filing
- 2003-07-09 CN CNB038176750A patent/CN1327410C/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007515676A (en) * | 2003-12-10 | 2007-06-14 | フランス テレコム | Transcoding between indexes of multipulse dictionaries used for coding for digital signal compression |
Also Published As
Publication number | Publication date |
---|---|
JP4238535B2 (en) | 2009-03-18 |
CN1327410C (en) | 2007-07-18 |
CN1672192A (en) | 2005-09-21 |
WO2004010416A1 (en) | 2004-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4550289B2 (en) | CELP code conversion | |
JP3180762B2 (en) | Audio encoding device and audio decoding device | |
JPH0353300A (en) | Sound encoding and decoding system | |
JP4304360B2 (en) | Code conversion method and apparatus between speech coding and decoding methods and storage medium thereof | |
JP3628268B2 (en) | Acoustic signal encoding method, decoding method and apparatus, program, and recording medium | |
JP3582589B2 (en) | Speech coding apparatus and speech decoding apparatus | |
JP4108317B2 (en) | Code conversion method and apparatus, program, and storage medium | |
JP4231987B2 (en) | Code conversion method between speech coding / decoding systems, apparatus, program, and storage medium | |
JP3063668B2 (en) | Voice encoding device and decoding device | |
JP4793539B2 (en) | Code conversion method and apparatus, program, and storage medium therefor | |
WO2014034697A1 (en) | Decoding method, decoding device, program, and recording method thereof | |
JP3531780B2 (en) | Voice encoding method and decoding method | |
US7319953B2 (en) | Method and apparatus for transcoding between different speech encoding/decoding systems using gain calculations | |
JP4238535B2 (en) | Code conversion method and apparatus between speech coding and decoding systems and storage medium thereof | |
JP4396524B2 (en) | Code conversion method and apparatus | |
JP3583945B2 (en) | Audio coding method | |
JPS6238500A (en) | Highly efficient voice coding system and apparatus | |
EP1536413B1 (en) | Method and device for voice code conversion | |
JP2001142499A (en) | Speech encoding device and speech decoding device | |
JP2004151123A (en) | Method and device for code conversion, and program and storage medium for the program | |
JP2000029499A (en) | Voice coder and voice encoding and decoding apparatus | |
JP2003195899A (en) | Encoding method for speech/sound signal and electronic device | |
JPH034300A (en) | Voice encoding and decoding system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081125 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081208 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120109 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130109 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130109 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |