JP2004061558A - Method and device for code conversion between speed encoding and decoding systems and storage medium therefor - Google Patents

Method and device for code conversion between speed encoding and decoding systems and storage medium therefor Download PDF

Info

Publication number
JP2004061558A
JP2004061558A JP2002215766A JP2002215766A JP2004061558A JP 2004061558 A JP2004061558 A JP 2004061558A JP 2002215766 A JP2002215766 A JP 2002215766A JP 2002215766 A JP2002215766 A JP 2002215766A JP 2004061558 A JP2004061558 A JP 2004061558A
Authority
JP
Japan
Prior art keywords
gain
code
acb
fcb
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002215766A
Other languages
Japanese (ja)
Other versions
JP4238535B2 (en
Inventor
Atsushi Murashima
村島 淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002215766A priority Critical patent/JP4238535B2/en
Priority to PCT/JP2003/008701 priority patent/WO2004010416A1/en
Priority to CNB038176750A priority patent/CN1327410C/en
Publication of JP2004061558A publication Critical patent/JP2004061558A/en
Priority to US11/039,969 priority patent/US7231345B2/en
Priority to US11/171,387 priority patent/US7319953B2/en
Application granted granted Critical
Publication of JP4238535B2 publication Critical patent/JP4238535B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a device and a method that convert codes obtained by encoding a speech by a certain system into codes that another system can decode with high tone quality and a small computation quantity. <P>SOLUTION: In a code converting device which converts a 1st code sequence based upon a 1st system into a 2nd code sequence based upon a 2nd system, a speech decoding circuit (1500) obtains information on a 1st linear prediction coefficient and an exciting signal from the 1st code sequence and drives a filter having the 1st linear prediction coefficient with an exciting signal obtained from the information of the exciting signal to generate a 1st speech signal, and a gain code generating circuit (1400) computes such a gain (optimum gain) that the distance between a 1st speech signal generated with the information obtained from the 2nd code sequence and the 1st speech signal becomes minimum, corrects the optimum gain, and finds gain information on the 2nd code sequence according to the corrected optimum gain, the optimum gain, and a gain read out of a gain code book of the 2nd system. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号を低ビットレートで伝送あるいは蓄積するための符号化及び復号方法に関し、特に、異なる符号化復号方式を用いて音声通信を行うに際し、音声をある方式により符号化して得た符号を、他の方式により復号可能な符号に高音質かつ低演算量で変換する、符号変換方法及び装置ならびにその記録媒体に関する。
【0002】
【従来の技術】
音声信号を中低ビットレートで高能率に符号化する方法として、音声信号を線形予測(Linear Prediction: LP)フィルタとそれを駆動する励振信号に分離して符号化する方法が広く用いられている。その代表的な方法の一つにCode Excited Linear Prediction(符号励振線形予測:「CELP」という)がある。CELPでは、入力音声の周波数特性を表すLP係数が設定されたLPフィルタを、入力音声のピッチ周期を表す適応コードブック(Adaptive Codebook: 「ACB」という)と、乱数やパルスから成る固定コードブック(Fixed Codebook: 「FCB」という)との和で表される励振信号により駆動することで、合成音声信号が得られる。このとき、前記ACB成分と前記FCB成分には各々ゲイン(「ACBゲイン」と「FCBゲイン」)を乗ずる。なお、CELPに関してはM. SchroederとB.S.Atalによる「Code excited linear prediction: High quality speech at very low bit rates」(Proc. of IEEE Int. Conf.on Acoust., Speech and Signal Processing, pp.937−940, 1985)(「文献1」という)が参照される。
【0003】
ところで、例えば3G移動体網と有線パケット網間の相互接続を想定した場合、各網で用いられる標準音声符号化方式が異なるため、直接接続できないという問題がある。これに対する最も簡単な解法はタンデム接続である。しかしながら、タンデム接続では、一方の標準方式を用いて音声を符号化して得た符号列からその標準方式を用いて音声信号を一旦復号し、この復号された音声信号を他方の標準方式を用いて再度符号化を行う。このため、各音声符号化復号方式で符号化と復号を一度だけ行う場合に比べて、一般に音質の低下、遅延の増加、計算量の増加を招くという問題がある。
【0004】
これに対して、一方の標準方式を用いて音声を符号化して得た符号を他方の標準方式により復号可能な符号に、符号領域又は符号化パラメータ領域で変換する、符号変換方式は前述の問題に対し有効である。符号を変換する方法については、Hong−Goo Kangらによる「Improving Transcoding Capability of Speech Coders in Clean and Frame Erasured Channel Environments」 (Proc. of IEEE Workshop on Speech Coding 2000, pp.78−80, 2000)(「文献2」という)が参照される。
【0005】
図12は、第1の音声符号化方式(「方式A」という)を用いて音声を符号化して得た符号を、第2の方式(「方式B」という)により復号可能な符号に変換する、符号変換装置の構成の一例を示す図である。図12を参照すると、符号変換装置は、入力端子10と、符号分離回路1010と、LP係数符号変換回路100と、ACB符号変換回路200と、FCB符号変換回路300と、ゲイン符号変換回路400と、符号多重回路1020と、出力端子20とを備えている。図12を参照して、従来の符号変換装置の各構成要素について説明する。
【0006】
入力端子10から、方式Aにより音声を符号化して得た第1の符号列を入力する。
【0007】
符号分離回路1010は、入力端子10から入力した第1の符号列から、LP係数、ACB、FCB、ACBゲイン及びFCBゲインに対応する符号、すなわちLP係数符号、ACB符号、FCB符号、ゲイン符号を分離する。ここで、ACBゲインとFCBゲインはまとめて符号化復号されるものとし、簡単のため、これをゲイン、その符号をゲイン符号と呼ぶことにする。また、LP係数符号、ACB符号、FCB符号、ゲイン符号を各々第1のLP係数符号、第1のACB符号、第1のFCB符号、第1のゲイン符号と呼ぶことにする。そして、第1のLP係数符号をLP係数符号変換回路100へ出力し、第1のACB符号をACB符号変換回路200へ出力し、第1のFCB符号をFCB符号変換回路300へ出力し、第1のゲイン符号をゲイン符号変換回路400へ出力する。
【0008】
LP係数符号変換回路100は、符号分離回路1010から出力される第1のLP係数符号を入力し、第1のLP係数符号を方式Bにより復号可能な符号に変換する。この変換されたLP係数符号を、第2のLP係数符号として符号多重回路1020へ出力する。
【0009】
ACB符号変換回路200は、符号分離回路1010から出力される第1のACB符号を入力し、第1のACB符号を方式Bにより復号可能な符号に変換する。この変換されたACB符号を、第2のACB符号として符号多重回路1020へ出力する。
【0010】
FCB符号変換回路300は、符号分離回路1010から出力される第1のFCB符号を入力し、第1のFCB符号を方式Bにより復号可能な符号に変換する。この変換されたFCB符号を、第2のFCB符号として符号多重回路1020へ出力する。
【0011】
ゲイン符号変換回路400は、符号分離回路1010から出力される第1のゲイン符号を入力し、第1のゲイン符号を方式Bにより復号可能な符号に変換する。この変換されたゲイン符号を、第2のゲイン符号として符号多重回路1020へ出力する。
【0012】
各変換回路のより具体的な動作を以下に説明する。
【0013】
LP係数符号変換回路100は、符号分離回路1010から入力した第1のLP係数符号を、方式AにおけるLP係数復号方法により復号して、第1のLP係数を得る。次に、LP係数符号変換回路100は、第1のLP係数を、方式BにおけるLP係数の量子化方法及び符号化方法により量子化及び符号化して第2のLP係数符号を得る。そして、LP係数符号変換回路100は、第2のLP係数符号を方式BにおけるLP係数復号方法により復号可能な符号として符号多重回路1020へ出力する。
【0014】
ACB符号変換回路200は、符号分離回路1010から入力した第1のACB符号を、方式Aにおける符号と方式Bにおける符号との対応関係を用いて読み替えることにより、第2のACB符号を得る。そして、ACB符号変換回路200は、第2のACB符号を方式BにおけるACB復号方法により復号可能な符号として符号多重回路1020へ出力する。
【0015】
FCB符号変換回路300は、符号分離回路1010から入力した第1のFCB符号を、方式Aにおける符号と方式Bにおける符号との対応関係を用いて読み替えることにより、第2のFCB符号を得る。そして、FCB符号変換回路300は、第2のFCB符号を方式BにおけるFCB復号方法により復号可能な符号として符号多重回路1020へ出力する。
【0016】
ゲイン符号変換回路400は、符号分離回路1010から入力した第1のゲイン符号を、方式Aにおけるゲイン復号方法により復号して、第1のゲインを得る。次に、ゲイン符号変換回路400は、第1のゲインを、方式Bにおけるゲインの量子化方法及び符号化方法により量子化及び符号化して、第2のゲインとその符号(第2のゲイン符号)を得る。そして、ゲイン符号変換回路400は、第2のゲイン符号を方式Bにおけるゲイン復号方法により復号可能な符号として符号多重回路1020へ出力する。
【0017】
符号多重回路1020は、LP係数符号変換回路100から出力される第2のLP係数符号と、ACB符号変換回路200から出力される第2のACB符号と、FCB符号変換回路300から出力される第2のFCB符号と、ゲイン符号変換回路400から出力される第2のゲイン符号を入力し、これらを多重化して得られる符号列を第2の符号列として出力端子20を介して出力する。以上により図12の説明を終える。
【0018】
【発明が解決しようとする課題】
しかしながら、図12を参照して説明した従来の符号変換装置は、非音声区間における背景雑音の音質が劣化する、という問題点を有している。
【0019】
その理由は、非音声区間において背景雑音エネルギーの時間変動が大きいためである。これは、第1のゲインを再量子化することによって得られる第2のゲインが、非音声区間において時間的に大きく変動することに起因する。
【0020】
したがって、本発明は、上記問題点に鑑みてなされたものであって、その主たる目的は、非音声区間における背景雑音音質の劣化を低減できる装置及び方法ならびにそのプログラムを記録した記録媒体を提供することにある。これ以外の本発明の目的、特徴、利点等は以下の説明から、当業者には直ちに明らかとされるであろう。
【0021】
【課題を解決するための手段】
前記目的を達成する、本発明の第1のアスペクトに係る方法は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法において、前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成するステップと、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づき最適ゲインを計算するステップと、前記最適ゲインを修正するステップと、修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるステップと、を含む。本発明に係る方法において、最適ゲインは、好ましくは、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲインとして求められる。
【0022】
本発明の第2のアスペクトに係る方法は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法において、前記第1の符号列からゲイン情報を復号するステップと、復号されたゲイン(復号ゲイン)を修正するステップと、修正された復号ゲイン(修正復号ゲイン)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるステップ、を含む。
【0023】
上記第1のアスペクトに係る発明において、好ましくは、前記修正最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0024】
上記第2のアスペクトに係る発明において、好ましくは、前記修正復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0025】
上記第1のアスペクトに係る発明において、好ましくは、前記修正最適ゲインが、前記最適ゲインの長時間平均に基づく。
【0026】
上記第2のアスペクトに係る発明において、好ましくは、前記修正復号ゲインが、前記復号ゲインの長時間平均に基づく。
【0027】
本発明の第3のアスペクトに係る装置は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置において、前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成する音声復号回路と、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づき、最適ゲインを計算する最適ゲイン計算回路と、前記最適ゲインを修正する最適ゲイン修正回路と、修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるゲイン符号化回路、を含む。本発明に係る装置において、最適ゲイン計算回路は、好ましくは、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲインを最適ゲインとして求める。
【0028】
本発明の第4のアスペクトに係る装置は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置において、前記第1の符号列からゲイン情報を復号するゲイン復号回路と、復号されたゲイン(復号ゲイン)を修正する復号ゲイン修正回路と、修正された復号ゲイン(修正復号ゲイン)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるゲイン符号化回路、を含む。
【0029】
上記第3のアスペクトに係る発明において、ゲイン符号化回路は、好ましくは、前記修正最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0030】
上記第4のアスペクトに係る発明において、ゲイン符号化回路は、好ましくは、前記修正復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0031】
上記第3のアスペクトに係る発明の最適ゲイン修正回路において、好ましくは、前記修正最適ゲインが、前記最適ゲインの長時間平均に基づく。
【0032】
上記第4のアスペクトに係る発明の復号ゲイン修正回路において、好ましくは、前記修正復号ゲインが、前記復号ゲインの長時間平均に基づく。
【0033】
本発明の第5のアスペクトに係るプログラムは、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置を構成するコンピュータに、
(a)前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成する処理と、
(b)第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づきゲイン(最適ゲイン)を計算する処理と、
(c)前記最適ゲインを修正する処理と、
(d)修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める処理、を実行させるためのプログラムを提供する。本発明において、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲインを最適ゲインとして求める。
【0034】
本発明の第6のアスペクトに係るプログラムは、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置を構成するコンピュータに、
(a)前記第1の符号列からゲイン情報を復号する処理と、
(b)復号されたゲイン(復号ゲイン)を修正する処理と、
(c)修正された復号ゲイン(修正復号ゲイン)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める処理、を実行させるためのプログラムを提供する。
【0035】
上記第5のアスペクトに係る発明のプログラムにおいて、好ましくは、前記修正最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0036】
上記第6のアスペクトに係る発明のプログラムにおいて、好ましくは、前記修正復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める。
【0037】
上記第5のアスペクトに係る発明のプログラムにおいて、好ましくは、前記修正最適ゲインが、前記最適ゲインの長時間平均に基づく。
【0038】
上記第6のアスペクトに係る発明のプログラムにおいて、好ましくは、前記修正復号ゲインが、前記復号ゲインの長時間平均に基づく。
【0039】
本願の第7のアスペクトに係る発明は、前記第5及び第6のアスペクトに係る発明の前記プログラムを記録した記録媒体を提供する。
【0040】
【発明の実施の形態】
以下本発明の実施の形態について説明する。まず本発明の装置と方法の概要と原理を説明したあと、実施例について以下に詳細に説明する。
【0041】
本発明に係る符号変換装置において、音声復号回路(1500)は、第1の方式に準拠する第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成し、ゲイン符号生成回路(1400)は、第2の方式に準拠する第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲイン(最適ゲイン)を計算し、前記最適ゲインを修正し、修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める。
【0042】
本発明に係る方法は以下のステップを有する。
【0043】
ステップa:第1の符号列から第1の線形予測係数を得る。
【0044】
ステップb:第1の符号列から励振信号の情報を得る。
【0045】
ステップc:励振信号の情報から励振信号を得る。
【0046】
ステップd:第1の線形予測係数をもつフィルタを前記励振信号によって駆動することで第1の音声信号を生成する。
【0047】
ステップe:第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲイン(最適ゲイン)を計算する。
【0048】
ステップf:前記最適ゲインを修正する。
【0049】
ステップg:修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める。
【0050】
本発明では、非音声区間において、第2のゲインの時間変動が小さくなるような評価関数を用いて、前記第2のゲインを求める。
【0051】
このため、前記非音声区間において、得られた第2のゲインの時間変動は小さくなり、同区間での背景雑音エネルギーの時間変動が小さくなる。
【0052】
その結果、前記非音声区間における背景雑音音質の劣化を低減できる。
【0053】
【実施例】
次に、本発明の実施例について図面を参照して詳細に説明する。
【0054】
図1は、本発明による符号変換装置の第1の実施例の構成を示す図である。図1において、図12と同一又は同等の要素には、同一の参照符号が付されている。図1を参照すると、入力端子10と、符号分離回路1010と、LP係数符号変換回路1100と、LSP−LPC変換回路1110と、インパルス応答計算回路1120と、ACB符号変換回路1200と、目標信号計算回路1700と、FCB符号生成回路1800と、ゲイン符号生成回路1400と、音声復号回路1500と、第2の励振信号計算回路1610と、第2の励振信号記憶回路1620と、符号多重回路1020と、出力端子20とを備えている。入力端子10、出力端子20、符号分離回路1010、符号多重回路1020は、結線の一部が分岐する以外は、基本的に、図12に示した要素と同じである。以下では、上述した同一又は同等の要素の説明は省略し、主に、図12に示した構成との相違点について説明する。
【0055】
また、方式Aにおいて、LP係数の符号化は、

Figure 2004061558
msec周期(フレーム)毎に行われ、ACB、FCB及びゲインなど励振信号の構成要素の符号化は、
Figure 2004061558
msec周期(サブフレーム)毎に行われるものとする。
【0056】
一方、方式Bにおいては、LP係数の符号化は、
Figure 2004061558
msec周期(フレーム)毎に行われ、励振信号の構成要素の符号化は、
Figure 2004061558
msec周期(サブフレーム)毎に行われるものとする。
【0057】
また、方式Aのフレーム長、サブフレーム数、及びサブフレーム長を、それぞれ、
Figure 2004061558

Figure 2004061558
及び
Figure 2004061558
とする。
【0058】
方式Bのフレーム長、サブフレーム数、及び、サブフレーム長を、それぞれ、
Figure 2004061558

Figure 2004061558
及び、
Figure 2004061558
とする。
【0059】
以下の説明では、簡単のため、
Figure 2004061558
とする。
【0060】
ここで、例えば、サンプリング周波数を、8000Hzとし、
Figure 2004061558
及び
Figure 2004061558
を10 msecとすれば、
Figure 2004061558
及び
Figure 2004061558
は160サンプル、
Figure 2004061558
及び
Figure 2004061558
は80サンプルとなる。
【0061】
LP係数符号変換回路1100は、符号分離回路1010から第1のLP係数符号を入力する。ここで、「3GPP AMR Speech Codec」(文献3)や、ITU−T勧告G.729など多くの標準方式では、LP係数を線スペクトル対(Line Spectral Pair: LSP)で表現し、LSPを符号化及び復号することが多いため、LP係数の符号化及び復号は、LSP領域で行われるとする。LP係数からLSPへの変換、及びLSPからLP係数への変換については、周知の方法、例えば「文献3」の第5.2.3節及び第5.2.4節の記載が参照される。LP係数符号変換回路1100は、前記第1のLP係数符号を方式AにおけるLSP復号方法により復号して、第1のLSPを得る。
【0062】
次に、LP係数符号変換回路1100は、前記第1のLSPを、方式BにおけるLSP量子化方法及び符号化方法により量子化及び符号化して、第2のLSPとこれに対応する符号(第2のLP係数符号)を得る。そして、LP係数符号変換回路1100は、前記第2のLP係数符号を方式BにおけるLSP復号方法により復号可能な符号として符号多重回路1020へ出力し、前記第1のLSPと第2のLSPをLSP−LPC変換回路1110へ出力する。
【0063】
図2は、LP係数符号変換回路1100の構成を示す図である。図2を参照すると、LP係数符号変換回路1100は、LSP復号回路110と、第1のLSPコードブック111と、LSP係数符号化回路130と、第2のLSPコードブック131とを備えている。図2を参照して、LP係数符号変換回路1100の各構成要素について説明する。
【0064】
LSP復号回路110は、LP係数符号から対応するLSPを復号する。LSP復号回路110は、複数セットのLSPが格納された第1のLSPコードブック111を備えており、符号分離回路1010から出力される第1のLP係数符号を、入力端子31を介して入力し、第1のLP係数符号に対応するLSPを第1のLSPコードブック111より読み出し、読み出されたLSPを第1のLSPとしてLSP符号化回路130へ出力するとともに、出力端子33を介してLSP−LPC変換回路1110へ出力する。ここで、LP係数符号からのLSPの復号は、方式AにおけるLSPの復号方法に従い、方式AのLSPコードブックを用いる。
【0065】
LSP符号化回路130は、LSP復号回路110から出力される第1のLSPを入力し、複数セットのLSPが格納された第2のLSPコードブック131から第2のLSPとそれに対応するLP係数符号の各々を順次読み込み、第1のLSPとの誤差が最小となる第2のLSPを選択し、それに対応するLP係数符号を、第2のLP係数符号として出力端子32を介して符号多重回路1020へ出力し、第2のLSPを出力端子34を介してLSP−LPC変換回路1110へ出力する。ここで、第2のLSPの選択方法、すなわちLSPの量子化及び符号化方法は、方式BにおけるLSPの量子化方法及び符号化方法に従い、方式BのLSPコードブックを用いる。ここで、LSPの量子化及び符号化については、例えば「文献3」の第5.2.5節の記載が参照される。
【0066】
以上により、図2によるLP係数符号変換回路1100の説明を終え、再び図1の説明に戻る。
【0067】
LSP−LPC変換回路1110は、LP係数符号変換回路1100から出力される第1のLSPと第2のLSPとを入力し、第1のLSPを第1のLP係数a1,iに変換し、第2のLSPを第2のLP係数a2,iに変換し、第1のLP係数a1,iを目標信号計算回路1700と、音声復号回路1500と、インパルス応答計算回路1120へ出力し、第2のLP係数a2,iを目標信号計算回路1700とインパルス応答計算回路1120へ出力する。ここで、LSPからLP係数への変換については、「文献3」の第5.2.4節の記載が参照される。
【0068】
ACB符号変換回路1200は、符号分離回路1010から入力した第1のACB符号を、方式Aにおける符号と方式Bにおける符号との対応関係を用いて読み替えることにより、第2のACB符号を得る。そして、ACB符号変換回路1200は、第2のACB符号を方式BにおけるACB復号方法により復号可能な符号として符号多重回路1020へ出力する。また、ACB符号変換回路1200は、第2のACB符号に対応するACB遅延を第2のACB遅延として目標信号計算回路1700へ出力する。
【0069】
ここで、図3を参照して、符号の読み替えについて説明する。例えば、方式AにおけるACB符号
Figure 2004061558
が56のとき、これに対応するACB遅延
Figure 2004061558
が76であるとする。方式Bでは、ACB符号
Figure 2004061558
が53のとき、これに対応するACB遅延
Figure 2004061558
が76であるとすると、ACB遅延の値が同一(この場合では76)となるように、方式Aから方式BへとACB符号を変換するには、方式AにおけるACB符号56を方式BにおけるACB符号53に対応付ければよい。以上により、符号の読み替えについての説明を終え、再び図1の説明に戻る。
【0070】
音声復号回路1500は、符号分離回路1010から出力される第1のACB符号、第1のFCB符号、第1のゲイン符号を入力し、LSP−LPC変換回路1110から第1のLP係数を入力する。次に、音声復号回路1500は、方式Aにおける、ACB信号復号方法、FCB信号復号方法及びゲイン復号方法の各々を用いて、第1のACB符号、第1のFCB符号及び第1のゲイン符号の各々から、ACB遅延、FCB信号及びゲインの各々を復号し、各々を第1のACB遅延、第1のFCB信号及び第1のゲインとする。音声復号回路1500は、第1のACB遅延を用いてACB信号を生成し、これを第1のACB信号とする。そして、音声復号回路1500は、第1のACB信号、第1のFCB信号及び第1のゲインと、第1のLP係数とから、音声を生成し、音声を目標信号計算回路1700へ出力する。
【0071】
図4は、音声復号回路1500の構成を示す図である。図4を参照すると、音声復号回路1500は、ACB復号回路1510と、FCB復号回路1520と、ゲイン復号回路1530とを有する励振信号情報復号回路1600と、励振信号計算回路1540と、励振信号記憶回路1570と、合成フィルタ1580を備えている。図4を参照して、音声復号回路1500の各構成要素について説明する。
【0072】
励振信号情報復号回路1600は、励振信号の情報に対応する符号から励振信号の情報を復号する。符号分離回路1010から出力される第1のACB符号、第1のFCB符号及び第1のゲイン符号を各々入力端子51、52及び53を介して入力し、第1のACB符号、第1のFCB符号及び第1のゲイン符号の各々から、ACB遅延、FCB信号及びゲインの各々を復号し、各々を第1のACB遅延、第1のFCB信号及び第1のゲインとする。ここで、第1のゲインは、ACBゲインとFCBゲインとからなり、各々を第1のACBゲインと第1のFCBゲインとする。また、励振信号情報復号回路1600は、励振信号記憶回路1570から出力される過去の励振信号を入力する。励振信号情報復号回路1600は、過去の励振信号と第1のACB遅延とを用いてACB信号を生成し、これを第1のACB信号とする。そして、励振信号情報復号回路1600は、第1のACB信号、第1のFCB信号、第1のACBゲイン及び第1のFCBゲインを、励振信号計算回路1540へ出力する。
【0073】
次に、励振信号情報復号回路1600の構成要素であるACB復号回路1510、FCB復号回路1520、及びゲイン復号回路1530について詳細に説明する。
【0074】
ACB復号回路1510は、符号分離回路1010から出力される第1のACB符号を、入力端子51を介して入力し、励振信号記憶回路1570から出力される過去の励振信号を入力する。次に、ACB復号回路1510は、上述したACB符号変換回路1200と同様にして、図3に示す方式AにおけるACB 符号とACB遅延の対応関係を用いて、第1のACB 符号に対応する第1のACB遅延
Figure 2004061558
を得る。励振信号において、現サブフレームの始点より
Figure 2004061558
サンプル過去の点から、サブフレーム長に相当する
Figure 2004061558
サンプルの信号を切り出して、第1のACB信号を生成する。ここで、
Figure 2004061558

Figure 2004061558
よりも小さい場合には、
Figure 2004061558
サンプル分のベクトルを切り出し、このベクトルを繰り返し接続して、長さ
Figure 2004061558
サンプルの信号とする。そして、第1のACB信号を励振信号計算回路1540へ出力する。ここで、第1のACB信号を生成する方法の詳細については、「文献3」の第6.1節及び第5.6節の記載が参照される。
【0075】
FCB復号回路1520は、符号分離回路1010から出力される第1のFCB符号を、入力端子52を介して入力し、第1のFCB符号に対応する第1のFCB信号を、励振信号計算回路1540へ出力する。FCB信号は、パルス位置とパルス極性で規定されるマルチパルス信号により表現されており、第1のFCB符号はパルス位置に対応する符号(パルス位置符号)とパルス極性に対応する符号(パルス極性符号)とからなる。ここで、マルチパルス信号により表現されたFCB信号を生成する方法の詳細については、「文献3」の第6.1節及び第5.7節の記載が参照される。
【0076】
ゲイン復号回路1530は、符号分離回路1010から出力される第1のゲイン符号を、入力端子53を介して入力する。ゲイン復号回路1530は、複数のゲインが格納されたテーブルを内蔵しており、第1のゲイン符号に対応するゲインをテーブルから読み出す。そして、ゲイン復号回路1530は、読み出されたゲインのうち、ACBゲインに対応する第1のACBゲインと、FCBゲインに対応する第1のFCBゲインとを励振信号計算回路1540へ出力する。ここで、第1のACBゲインと第1のFCBゲインがまとめて符号化されている場合には、テーブルには第1のACBゲインと第1のFCBゲインとから成る2次元ベクトルが複数格納されている。また、第1のACBゲインと第1のFCBゲインが個別に符号化されている場合には、二つのテーブルが内蔵され、一方のテーブルに第1のACBゲインが複数格納されており、他方のテーブルに第1のFCBゲインが複数格納されている。
【0077】
励振信号計算回路1540は、ACB復号回路1510から出力される第1のACB信号を入力し、FCB復号回路1520から出力される第1のFCB信号を入力し、ゲイン復号回路1530から出力される第1のACBゲインと第1のFCBゲインとを入力する。励振信号計算回路1540は、第1のACB信号に第1のACBゲインを乗じて得た信号と、第1のFCB信号に第1のFCBゲインを乗じて得た信号とを加算して第1の励振信号を得る。そして、励振信号計算回路1540は、第1の励振信号を、合成フィルタ1580と励振信号記憶回路1570とへ出力する。
【0078】
励振信号記憶回路1570は、励振信号計算回路1540から出力される第1の励振信号を入力し、これを記憶保持する。そして、励振信号記憶回路1570は、過去に入力されて記憶保持されている過去の第1の励振信号をACB復号回路1510へ出力する。
【0079】
合成フィルタ1580は、励振信号計算回路1540から出力される第1の励振信号を入力し、LSP−LPC変換回路1110から出力される第1のLP係数を入力端子61を介して入力する。そして、合成フィルタ1580は、第1のLP係数をもつ線形予測フィルタを、第1の励振信号で駆動することにより音声信号を生成する。音声信号を目標信号計算回路1700へ出力端子63を介して出力する。
【0080】
以上で、図4による音声復号回路1500の説明を終え、再び図1の説明に戻る。
【0081】
目標信号計算回路1700は、LSP−LPC変換回路1110から第1のLSPと第2のLSPとを入力し、ACB符号変換回路1200から第2のACB符号に対応する第2のACB遅延を入力し、音声復号回路1500から復号音声を入力し、インパルス応答計算回路1120からインパルス応答信号を入力し、第2の励振信号記憶回路1620に記憶保持される過去の第2の励振信号を入力する。目標信号計算回路1700は、復号音声と第1のLP係数及び第2のLP係数とから第1の目標信号を計算する。次に、目標信号計算回路1700は、過去の第2の励振信号とインパルス応答信号と第1の目標信号と第2のACB遅延とから、第2のACB信号及び最適ACBゲインを求める。そして、目標信号計算回路1700は、第1の目標信号と最適ACBゲインとをゲイン符号生成回路1400へ出力し、第2のACB信号をゲイン符号生成回路1400と第2の励振信号計算回路1610とへ出力する。
【0082】
図5は、目標信号計算回路1700の構成を示す図である。図5を参照すると、目標信号計算回路1700は、重み付け信号計算回路1710と、ACB信号生成回路1720と、最適ACBゲイン計算回路1730とを備えている。図5を参照して、目標信号計算回路1700の各構成要素について説明する。
【0083】
重み付け信号計算回路1710は、音声復号回路1500の合成フィルタ1580から出力される復号音声s(n)を入力端子57を介して入力し、LSP−LPC変換回路1110から出力される第1のLP係数a1,iと第2のLP係数a2,iとを、各々入力端子36と入力端子35とを介して入力する。重み付け信号計算回路1710は、まず、第1のLP係数を用いて、聴感重み付けフィルタW(z)を構成する。
【0084】
そして、重み付け信号計算回路1710は、復号音声により聴感重み付けフィルタを駆動して聴感重み付け音声信号を生成する。次に、重み付け信号計算回路1710は、第1のLP係数と第2のLP係数とを用いて、聴感重み付け合成フィルタW(z)/A2(z)を構成する。
【0085】
そして、重み付け信号計算回路1710は、聴感重み付け合成フィルタの零入力応答を聴感重み付け音声信号から減算して得られる第1の目標信号x(n)を、ACB信号生成回路1720と最適ACBゲイン計算回路1730へ出力するとともに、第2の目標信号計算回路1430へ出力端子78を介して出力する。
【0086】
ACB信号生成回路1720は、重み付け信号計算回路1710から出力される第1の目標信号を入力し、ACB符号変換回路1200から出力される第2のACB遅延T(B) lagを入力端子37を介して入力し、インパルス応答計算回路1120から出力されるインパルス応答信号h(n)を入力端子74を介して入力し、第2の励振信号記憶回路1620から出力される過去の第2の励振信号u(n)を入力端子75を介して入力する。
【0087】
ACB信号生成回路1720は、過去の第2の励振信号から遅延kで切り出された信号とインパルス応答信号との畳み込みにより、フィルタ処理された遅延kの過去の励振信号
Figure 2004061558
を計算する。
【0088】
ここで、遅延kは第2のACB遅延とする。過去の第2の励振信号から遅延kで切り出された信号を第2のACB信号v(n)とする。
【0089】
そして、ACB信号生成回路1720は、第2のACB信号を第2の目標信号計算回路1430と第2の励振信号計算回路1610とへ出力端子76を介して出力し、フィルタ処理された遅延kの過去の励振信号yk(n)を最適ACBゲイン計算回路1730へ出力する。
【0090】
最適ACBゲイン計算回路1730は、重み付け信号計算回路1710から出力される第1の目標信号x(n)を入力し、ACB信号生成回路1720から出力されるフィルタ処理された遅延kの過去の励振信号yk(n)を入力する。
【0091】
次に、最適ACBゲイン計算回路1730は、第1の目標信号x(n)と、フィルタ処理された遅延kの過去の励振信号yk(n)と、から最適ACBゲインgpを次式により計算する。最適ACBゲインgpは、第1の目標信号x(n)と、フィルタ処理された遅延kの過去の励振信号yk(n)との距離を最小とするゲインである。
Figure 2004061558
【0092】
そして、最適ACBゲイン計算回路1730は、最適ACBゲインgpをACBゲイン符号化回路1410へ出力端子77を介して出力する。
【0093】
なお、第2のACB信号を計算する方法及び最適ACBゲインを計算する方法の詳細については、「文献3」の第6.1節及び第5.6節の記載が参照できる。以上で図5による目標信号計算回路1700の説明を終え、再び図1の説明に戻る。
【0094】
インパルス応答計算回路1120は、LSP−LPC変換回路1110から出力される第1のLP係数と第2のLP係数を入力し、第1のLP係数と第2のLP係数を用いて聴感重み付け合成フィルタを構成する。
【0095】
そして、インパルス応答計算回路1120は、聴感重み付け合成フィルタのインパルス応答信号を目標信号計算回路1700とゲイン符号生成回路1400とへ出力する。ここで、聴感重み付け合成フィルタの伝達関数は次式により表される。
Figure 2004061558
【0096】
ただし、
Figure 2004061558
【0097】
は、第2のLP係数
Figure 2004061558
をもつ線形予測フィルタの伝達関数である。
【0098】
Figure 2004061558
【0099】
は、第1のLP係数
Figure 2004061558
をもつ聴感重み付けフィルタの伝達関数である。
【0100】
ここで、Pは、線形予測次数(例えば、10)であり、γ1とγ2は、重み付けを制御する係数(例えば、0.94と0.6)である。
【0101】
FCB符号生成回路1800は、符号分離回路1010から出力される第1のFCB符号を入力し、第1のFCB符号を方式Bにより復号可能な符号に変換する。FCB符号生成回路1800は、変換されたFCB符号を、第2のFCB符号として符号多重回路1020へ出力し、第2のFCB符号に対応する第2のFCB信号をゲイン符号生成回路1400と、第2の励振信号計算回路1610とへ出力する。ここで、FCB信号は、複数のパルスから成り、パルスの位置(パルス位置)と極性(パルス極性)で規定されるマルチパルス信号により表現される。FCB符号は、パルス位置に対応する符号(パルス位置符号)とパルス極性に対応する符号(パルス極性符号)とからなる。マルチパルス信号によるFCB信号の表現方法については、「文献3」の第5.7節の記載が参照される。
【0102】
図6は、図1のFCB符号生成回路1800の構成を示す図である。図6を参照すると、FCB符号生成回路1800は、FCB符号変換回路1300と、FCB信号生成回路1820を備えている。図6を参照して、FCB符号生成回路1800の各構成要素について説明する。
【0103】
FCB符号変換回路1300は、符号分離回路1010から入力端子85を介して入力した第1のFCB符号i(A) を、方式Aにおける符号と方式Bにおける符号との対応関係を用いて読み替えることにより、第2のFCB符号i を得る。そして、FCB符号変換回路1300は、これを方式BにおけるFCB復号方法により復号可能な符号として出力端子55を介して符号多重回路1020へ出力し、第2のFCB符号に対応するパルス位置
Figure 2004061558
及び、パルス極性
Figure 2004061558
をFCB信号生成回路1820へ出力する。
【0104】
図7を参照して、パルス位置符号の読み替えについて説明する。
【0105】
例えば、方式Aにおけるパルス位置符号
Figure 2004061558
が6のとき、これに対応するパルス位置
Figure 2004061558
が30であるとする。方式Bでは、パルス位置符号
Figure 2004061558
が1のとき、これに対応するパルス位置
Figure 2004061558
が30であるとすると、パルス位置の値が同一(この場合では30)となるように、方式Aから方式Bへとパルス位置符号を変換するには、方式Aにおけるパルス位置符号6を方式Bにおけるパルス位置符号1に対応付ければよい。
【0106】
パルス極性符号については、読み替え前の符号に対応する極性(正又は負)と、読み替え後の符号に対応する極性とが等しくなるように、符号を読み替えればよい。
【0107】
以上により、パルス位置符号及びパルス極性符号の読み替えについての説明を終え、再び図6の説明に戻る。
【0108】
FCB信号生成回路1820は、FCB符号変換回路1300から出力されるパルス位置及びパルス極性を入力する。FCB信号生成回路1820は、パルス位置及びパルス極性から規定されるFCB信号を第2のFCB信号c(n)とし、これを最適FCBゲイン計算回路1440と第2の励振信号計算回路1610とへ出力端子86を介して出力する。
【0109】
以上で図6によるFCB符号生成回路1800の説明を終え、再び図1の説明に戻る。
【0110】
ゲイン符号生成回路1400は、目標信号計算回路1700から出力される第1の目標信号と第2のACB信号と最適ACBゲインとを入力し、FCB符号生成回路1800から出力される第2のFCB信号を入力し、インパルス応答計算回路1120から出力されるインパルス応答信号を入力し、LP係数符号変換回路1100から出力される第1のLSPを入力する。
【0111】
ゲイン符号生成回路1400は、まず、第1の目標信号と第2のACB信号と最適ACBゲインとインパルス応答信号とから第2の目標信号を計算し、第2の目標信号と第2のFCB信号とインパルス応答信号とから最適FCBゲインを計算し、最適FCBゲインから修正FCBゲインを計算し、第1のLSPから音声判定値を決定する。
【0112】
次に、ゲイン符号生成回路1400は、ACBゲインコードブックから順次読み込まれるACBゲインと最適ACBゲインとから第1の自乗誤差を計算し、ACBゲインと修正ACBゲインとから第2の自乗誤差を計算する。
【0113】
そして、ゲイン符号生成回路1400は、音声判定値から計算される重み係数と第1の自乗誤差と第2の自乗誤差とから計算される評価関数が最小となるACBゲイン及び対応するACBゲイン符号を選択する。
【0114】
また、ゲイン符号生成回路1400は、FCBゲインコードブックから順次読み込まれるFCBゲインと最適FCBゲインとから第3の自乗誤差を計算し、FCBゲインと修正FCBゲインとから第4の自乗誤差を計算する。
【0115】
そして、ゲイン符号生成回路1400は、音声判定値から計算される重み係数と第3の自乗誤差と第4の自乗誤差とから計算される評価関数が最小となるFCBゲイン及び対応するFCBゲイン符号を選択する。
【0116】
最後に、ゲイン符号生成回路1400は、選択されたACBゲイン符号とFCBゲイン符号とからなる第2のゲイン符号を、方式Bにおけるゲイン復号方法により復号可能な符号として符号多重回路1020へ出力端子56を介して出力する。
【0117】
図8は、ゲイン符号生成回路1400の構成を示す図である。図8を参照すると、ゲイン符号生成回路1400は、ACBゲイン符号化回路1410と、ACBゲインコードブック1411と、FCBゲイン符号化回路1420と、FCBゲインコードブック1421と、第2の目標信号計算回路1430と、最適FCBゲイン計算回路1440と、最適FCBゲイン修正回路1450と、音声/非音声識別回路1460と、を備えている。図8を参照して、ゲイン符号生成回路1400の各構成要素について詳細に説明する。
【0118】
第2の目標信号計算回路1430は、ACB信号生成回路1720から出力される第2のACB信号v(n)を入力端子92を介して入力し、重み付け信号計算回路1710から出力される第1の目標信号x(n)を入力端子93を介して入力し、インパルス応答計算回路1120から出力されるインパルス応答信号h(n)を入力端子94を介して入力し、ACBゲイン符号化回路1410から出力される第2のACBゲインを入力する。
【0119】
第2の目標信号計算回路1430は、第2のACB信号とインパルス応答信号との畳み込みにより、フィルタ処理された第2のACB信号
Figure 2004061558
を計算し、y(n)に第2のACBゲイン
Figure 2004061558
を乗じて得られる信号を、第1の目標信号x(n)から減算して、第2の目標信号x(n)を得る。
Figure 2004061558
Figure 2004061558
【0120】
そして、第2の目標信号計算回路1430は、第2の目標信号x(n)を最適FCBゲイン計算回路1440へ出力する。
【0121】
最適FCBゲイン計算回路1440は、FCB信号生成回路1820から出力される第2のFCB信号c(n)を入力端子91を介して入力し、インパルス応答計算回路1120から出力されるインパルス応答信号h(n)を入力端子94を介して入力し、第2の目標信号計算回路1430から出力される第2の目標信号x(n)を入力し、第2のFCB信号とインパルス応答信号との畳み込みによりフィルタ処理された第2のFCB信号
Figure 2004061558
を計算し、第2の目標信号x2(n)とフィルタ処理された第2のFCB信号z(n)から、次の式により最適FCBゲインgcを計算する。最適FCBゲインgcは、第2の目標信号x2(n)とフィルタ処理された第2のFCB信号z(n)との距離を最小とするゲインである。
Figure 2004061558
【0122】
そして、最適FCBゲイン計算回路1440は、最適FCBゲインを最適FCBゲイン修正回路1450とFCBゲイン符号化回路1420とへ出力する。
【0123】
音声/非音声識別回路1460は、LSP復号回路110から出力される第1のLSPを入力端子98を介して入力する。第1のLSPとその長時間平均とからLSP変動量を計算し、LSP変動量から音声判定値を決定する。
【0124】
LSP変動量を求める手順を以下に示す。第nフレームにおいて、LSPの長時間平均
Figure 2004061558
を次式により計算する。
Figure 2004061558
ここで、Npは線形予測次数であり、βは例えば0.9である。
【0125】
第nフレームにおけるLSPの変動量dq(n)を次式により定義する。
Figure 2004061558
ここで、
Figure 2004061558
は、
Figure 2004061558

Figure 2004061558
との誤差として、例えば、
Figure 2004061558
又は、
Figure 2004061558
などが定義できるが、ここでは、後者を用いる。変動量dq(n)が大きい区間を音声区間に、小さい区間を非音声区間に対応させることができる。変動量dq(n)に対する閾値処理により、音声判定値
Figure 2004061558
を決定する。
【0126】
Figure 2004061558
(Vs=1 dq(n)がCVS以上の場合
Vs=0 dq(n)がCVSより小の場合)
【0127】
ここで、Cvsはある定数(例えば、2.2)であり、Vs=1は音声区間に、Vs=0は非音声区間に対応する。音声判定値を最適ACBゲイン修正回路1480とACBゲイン符号化回路1410と最適FCBゲイン修正回路1450とFCBゲイン符号化回路1420とへ出力する。
【0128】
最適ACBゲイン修正回路1480は、ACB信号生成回路1720から出力される最適ACBゲインを入力端子97を介して入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。最適ACBゲイン修正回路1480では、音声判定値Vsが0(非音声区間)のとき、最適ACBゲインの長時間平均を修正ACBゲインとする。非音声区間において、次式により最適ACBゲインの長時間平均を計算する。
Figure 2004061558
【0129】
ここで、
Figure 2004061558
は第nサブフレームにおける最適ACBゲイン、
Figure 2004061558
は第nサブフレームにおける最適ACBゲインの長時間平均であり、αは例えば0.9である。なお、長時間平均には平均値、中央値、最頻値なども適用できる。
【0130】
一方、最適ACBゲイン修正回路1480では、音声判定値Vsが1(音声区間)のとき、最適ACBゲインそのものを修正ACBゲインとする。
【0131】
最適ACBゲイン修正回路1480は、修正ACBゲインを、ACBゲイン符号化回路1410へ出力する。
【0132】
ACBゲイン符号化回路1410は、ACB信号生成回路1720から出力される最適ACBゲインgpを入力端子97を介して入力し、最適ACBゲイン修正回路1480から出力される修正ACBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。
【0133】
ACBゲイン符号化回路1410は、ACBゲインコードブック1411から順次読み込まれるACBゲインと入力端子97からの最適ACBゲインとから第1の自乗誤差を計算し、ACBゲインと修正ACBゲインとから第2の自乗誤差を計算し、音声判定値から計算される重み係数と、第1の自乗誤差と、第2の自乗誤差とから次式で定義される評価関数を計算する。
Figure 2004061558
【0134】
ここで、
Figure 2004061558
は最適ACBゲイン、
Figure 2004061558
は修正ACBゲイン、
Figure 2004061558
はACBゲインコードブックから順次読み込まれるACBゲインであり、μは重み係数である。例えば、音声判定値Vsが1(音声区間)のとき、重み係数μは1.0とし、Vsが0(非音声区間)のときはμは0.2とする。
【0135】
そして、ACBゲイン符号化回路1410は、評価関数が最小となるACBゲインを選択し、選択されたACBゲインを第2のACBゲインとして第2の目標信号計算回路1430へ出力するとともに、第2の励振信号計算回路1610へ出力端子95を介して出力し、第2のACBゲインに対応する符号をACBゲイン符号としてゲイン符号多重化回路1470へ出力する。
【0136】
最適FCBゲイン修正回路1450は、最適FCBゲイン計算回路1440から出力される最適FCBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値Vsを入力する。
【0137】
最適FCBゲイン修正回路1450において、音声判定値Vsが0(非音声区間)のとき、最適FCBゲインの長時間平均を修正FCBゲインとする。非音声区間において、次式により最適FCBゲインの長時間平均を計算する。
Figure 2004061558
【0138】
ここで、
Figure 2004061558
は第nサブフレームにおける最適FCBゲイン、
Figure 2004061558
は第nサブフレームにおける最適FCBゲインの長時間平均であり、αは例えば0.9である。なお、長時間平均には、平均値、中央値、最頻値なども適用できる。
【0139】
一方、最適FCBゲイン修正回路1450において、音声判定値Vsが1(音声区間)のとき、最適FCBゲインそのものを修正FCBゲインとする。
【0140】
最適FCBゲイン修正回路1450は、修正FCBゲインをFCBゲイン符号化回路1420へ出力する。
【0141】
FCBゲイン符号化回路1420は、最適FCBゲイン計算回路1440から出力される最適FCBゲインを入力し、最適FCBゲイン修正回路1450から出力される修正FCBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。FCBゲイン符号化回路1420は、FCBゲインコードブック1421から順次読み込まれるFCBゲインと、最適FCBゲインとから第1の自乗誤差を計算し、FCBゲインと修正FCBゲインとから第2の自乗誤差を計算し、音声判定値から計算される重み係数と第1の自乗誤差と第2の自乗誤差とから次式で定義される評価関数を計算する。
Figure 2004061558
【0142】
ここで、
Figure 2004061558
は最適FCBゲイン、
Figure 2004061558
は修正FCBゲイン、
Figure 2004061558
はFCBゲインコードブックから順次読み込まれるFCBゲインであり、μは重み係数である。例えば、音声判定値Vsが1(音声区間)のとき、重み係数μは1.0とし、音声判定値Vsが0(非音声区間)のときはμは0.2とする。
【0143】
そして、FCBゲイン符号化回路1420は、評価関数が最小となるFCBゲインを選択し、選択されたFCBゲインを第2のFCBゲインとして第2の励振信号計算回路1610へ出力端子96を介して出力し、第2のFCBゲインに対応する符号をFCBゲイン符号としてゲイン符号多重化回路1470へ出力する。
【0144】
ゲイン符号多重回路1470は、ACBゲイン符号化回路1410から出力されるACBゲイン符号を入力し、FCBゲイン符号化回路1420から出力されるFCBゲイン符号を入力し、ACBゲイン符号とFCBゲイン符号とを多重化して得られる第2のゲイン符号を、方式Bにおけるゲイン復号方法により復号可能な符号として符号多重回路1020へ出力端子56を介して出力する。
【0145】
以上で図8によるゲイン符号生成回路1400の説明を終え、再び図1の説明に戻る。
【0146】
第2の励振信号計算回路1610は、目標信号計算回路1700から出力される第2のACB信号を入力し、FCB符号生成回路1800から出力される第2のFCB信号を入力し、ゲイン符号生成回路1400から出力される第2のACBゲインと第2のFCBゲインとを入力する。第2の励振信号計算回路1610は、第2のACB信号に第2のACBゲインを乗じて得た信号と、第2のFCB信号に第2のFCBゲインを乗じて得た信号と、を加算して第2の励振信号を得る。そして第2の励振信号を第2の励振信号記憶回路1620へ出力する。
【0147】
第2の励振信号記憶回路1620は、第2の励振信号計算回路1610から出力される第2の励振信号を入力し、これを記憶保持する。そして、過去に入力されて記憶保持されている第2の励振信号を目標信号計算回路1700へ出力する。以上により、本発明の第1の実施例の説明を終える。
【0148】
次に、本発明の第2の実施例について説明する。図9は、本発明による符号変換装置の第2の実施例の構成を示す図である。図9においては、図12におけるLP係数符号変換回路100と、ゲイン符号変換回路400とを、それぞれLP係数符号変換回路1100とゲイン符号変換回路2400とで置き換え、LP係数符号変換回路1100とゲイン符号変換回路2400との間に結線が付加されている。以下では、図12に示す要素と同一又は同等の要素の説明は省略し、相違点について説明する。
【0149】
LP係数符号変換回路1100は、図1を用いて説明した第1の実施例におけるそれと同様である。ただし、他回路との結線の仕方が異なっており、第1のLSPをゲイン符号変換回路400へ出力する。
【0150】
ゲイン符号変換回路2400は、符号分離回路1010から出力される第1のゲイン符号を入力し、LP係数符号変換回路1100から出力される第1のLSPを入力する。
【0151】
ゲイン符号変換回路2400は、まず、第1のゲイン符号を、方式Aにおけるゲイン復号方法により復号して得られる第1のゲイン(第1のACBゲイン及び第1のFCBゲイン)から、修正ACBゲイン及び修正FCBゲインを計算し、第1のLSPから音声判定値を決定する。
【0152】
次に、ゲイン符号変換回路2400は、ACBゲインコードブックから順次読み込まれるACBゲインと第1のACBゲインとから第1の自乗誤差を計算し、ACBゲインと修正ACBゲインとから第2の自乗誤差を計算する。
【0153】
そして、ゲイン符号変換回路2400は、音声判定値から計算される重み係数と、第1の自乗誤差と、第2の自乗誤差とから計算される評価関数が最小となるACBゲイン及び対応するACBゲイン符号を選択する。
【0154】
また、ゲイン符号変換回路2400は、FCBゲインコードブックから順次読み込まれるFCBゲインと第1のFCBゲインとから第3の自乗誤差を計算し、FCBゲインと修正FCBゲインとから第4の自乗誤差を計算する。そして、ゲイン符号変換回路2400は、音声判定値から計算される重み係数と第3の自乗誤差と第4の自乗誤差とから計算される評価関数が最小となるFCBゲイン及び対応するFCBゲイン符号を選択する。
【0155】
最後に、ゲイン符号変換回路2400は、選択されたACBゲイン符号とFCBゲイン符号とからなる第2のゲイン符号を、方式Bにおけるゲイン復号方法により復号可能な符号として符号多重回路1020へ出力する。
【0156】
図10は、図9のゲイン符号変換回路2400の構成を示す図である。図10を参照すると、ゲイン符号変換回路2400は、音声/非音声識別回路1460と、ゲイン符号分離回路2490と、ACBゲイン復号回路2470と、ACBゲインコードブック2471と、ACBゲイン修正回路2440と、ACBゲイン符号化回路2410と、ACBゲインコードブック1411と、FCBゲイン復号回路2480と、FCBゲインコードブック2481と、FCBゲイン修正回路2450と、FCBゲイン符号化回路2420と、FCBゲインコードブック1421と、ゲイン符号多重回路1470と、を備えている。図10を参照して、この実施例のゲイン符号変換回路2400の各構成要素について説明する。なお、図10において、音声/非音声識別回路1460及びゲイン符号多重回路1470は、図8に示した要素と基本的に同じであり、以下では、これらの説明は省略する。
【0157】
ゲイン符号分離回路2490は、符号分離回路1010から出力される第1のゲイン符号を入力端子45を介して入力し、第1のゲイン符号からACBゲイン及びFCBゲインに対応する符号、すなわち第1のACBゲイン符号及び第1のFCBゲイン符号を分離し、第1のACBゲイン符号をACBゲイン復号回路2470へ出力し、第1のFCBゲイン符号をFCBゲイン復号回路2480へ出力する。
【0158】
ACBゲイン復号回路2470は、複数セットのACBゲインが格納されたACBゲインコードブック2471を備えており、ゲイン符号分離回路2490から出力される第1のACBゲイン符号を入力し、第1のACBゲイン符号に対応するACBゲインを第1のACBゲインコードブック2471より読み出し、読み出されたACBゲインを第1のACBゲインとしてACBゲイン修正回路2440へ出力するとともに、ACBゲイン符号化回路2410へ出力する。ここで、ACBゲイン符号からのACBゲインの復号は、方式AにおけるACBゲインの復号方法に従い、方式AのACBゲインコードブックを用いる。
【0159】
FCBゲイン復号回路2480は、複数セットのFCBゲインが格納されたFCBゲインコードブック2481を備えており、ゲイン符号分離回路2490から出力される第1のFCBゲイン符号を入力し、第1のFCBゲイン符号に対応するFCBゲインを第1のFCBゲインコードブック2481より読み出し、読み出されたFCBゲインを第1のFCBゲインとしてFCBゲイン修正回路2450へ出力するとともに、FCBゲイン符号化回路2420へ出力する。ここで、FCBゲイン符号からのFCBゲインの復号は、方式AにおけるFCBゲインの復号方法に従い、方式AのFCBゲインコードブックを用いる。
【0160】
ACBゲイン修正回路2440は、ACBゲイン復号回路2470から出力される第1のACBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。音声判定値Vsが0(非音声区間)のとき、第1のACBゲインの長時間平均を修正ACBゲインとする。
【0161】
ACBゲイン修正回路2440は、非音声区間において、次式により第1のACBゲインの長時間平均を計算する。
Figure 2004061558
【0162】
ここで、
Figure 2004061558
は第nサブフレームにおける第1のACBゲイン、
Figure 2004061558
は第nサブフレームにおける第1のACBゲインの長時間平均であり、αは例えば0.9である。なお、長時間平均には、平均値、中央値、最頻値なども適用できる。
【0163】
一方、音声判定値Vsが1(音声区間)のとき、ACBゲイン修正回路2440は、第1のACBゲインそのものを修正ACBゲインとする。
【0164】
ACBゲイン修正回路2440は、修正ACBゲインをACBゲイン符号化回路2410へ出力する。
【0165】
FCBゲイン修正回路2450は、FCBゲイン復号回路2480から出力される第1のFCBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。
【0166】
FCBゲイン修正回路2450において、音声判定値Vsが0(非音声区間)のとき、第1のFCBゲインの長時間平均を修正FCBゲインとする。非音声区間において、次式により第1のFCBゲインの長時間平均を計算する。
Figure 2004061558
【0167】
ここで、
Figure 2004061558
は第nサブフレームにおける第1のFCBゲイン、
Figure 2004061558
は第nサブフレームにおける第1のFCBゲインの長時間平均であり、αは例えば0.9である。なお、長時間平均には、平均値、中央値、最頻値なども適用できる。
【0168】
一方、音声判定値Vsが1(音声区間)のとき、FCBゲイン修正回路2450は、第1のFCBゲインそのものを修正FCBゲインとする。
【0169】
FCBゲイン修正回路2450は、修正FCBゲインをFCBゲイン符号化回路2420へ出力する。
【0170】
ACBゲイン符号化回路2410は、ACBゲイン復号回路2470から出力される第1のACBゲインを入力し、ACBゲイン修正回路2440から出力される修正ACBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。
【0171】
ACBゲイン符号化回路2410は、ACBゲインコードブック1411から順次読み込まれるACBゲインと第1のACBゲインとから第1の自乗誤差を計算し、ACBゲインと修正ACBゲインとから第2の自乗誤差を計算し、音声判定値から計算される重み係数と第1の自乗誤差と第2の自乗誤差とから次式で定義される評価関数を計算する。
【0172】
Figure 2004061558
【0173】
ここで、
Figure 2004061558
は第1のACBゲイン、
Figure 2004061558
は修正ACBゲイン、
Figure 2004061558
はACBゲインコードブック1411から順次読み込まれるACBゲインであり、μは重み係数である。例えば、音声判定値Vsが1(音声区間)のとき、重み係数μは1.0とし、Vsが0(非音声区間)のときはμは0.2とする。
【0174】
そして、ACBゲイン符号化回路2410は、評価関数が最小となるACBゲインを選択し、選択されたACBゲインを第2のACBゲインとし、第2のACBゲインに対応する符号を第2のACBゲイン符号としてゲイン符号多重化回路1470へ出力する。
【0175】
FCBゲイン符号化回路2420は、FCBゲイン復号回路2480から出力される第1のFCBゲインを入力し、FCBゲイン修正回路2450から出力される修正FCBゲインを入力し、音声/非音声識別回路1460から出力される音声判定値を入力する。
【0176】
FCBゲイン符号化回路2420は、FCBゲインコードブック1421から順次読み込まれるFCBゲインと第1のFCBゲインとから第3の自乗誤差を計算し、FCBゲインと修正FCBゲインとから第4の自乗誤差を計算し、音声判定値から計算される重み係数と第3の自乗誤差と第4の自乗誤差とから次式で定義される評価関数を計算する。
Figure 2004061558
【0177】
ここで、
Figure 2004061558
は第1のFCBゲイン、
Figure 2004061558
は修正FCBゲイン、
Figure 2004061558
はFCBゲインコードブック1421から順次読み込まれるFCBゲインであり、μは重み係数である。例えば、音声判定値Vsが1(音声区間)のとき、重み係数μは1.0とし、音声判定値Vsが0(非音声区間)のときはμは0.2とする。
【0178】
そして、FCBゲイン符号化回路2420は、評価関数が最小となるFCBゲインを選択し、選択されたFCBゲインを第2のFCBゲインとし、第2のFCBゲインに対応する符号を第2のFCBゲイン符号としてゲイン符号多重化回路1470へ出力する。
【0179】
上述した本発明の各実施例の符号変換装置は、ディジタル信号処理プロセッサ等のコンピュータ制御で実現するようにしてもよい。図11は本発明の第3の実施例として、上記各実施例の符号変換処理をコンピュータで実現する場合の装置構成を模式的に示す図である。記録媒体6から読み出されたプログラムを実行するコンピュータ1において、第1の符号化復号装置により音声を符号化して得た第1の符号を第2の符号化復号装置により復号可能な第2の符号へ変換する符号変換処理を実行するにあたり、記録媒体6には、
(a) 第1の符号列から第1の線形予測係数を得る処理と、
(b) 第1の符号列から励振信号の情報を得る処理と、
(c) 励振信号の情報から励振信号を得る処理と、
(d) 第1の線形予測係数をもつフィルタを励振信号により駆動することによって音声信号を生成する処理と、
(e) 第2の符号列から得られる情報により生成される第2の音声信号と、第1の音声信号との距離が最小となるゲイン(最適ゲイン)を計算する処理と、
(f) 最適ゲインを修正する処理と、
(g) 修正された最適ゲイン(修正最適ゲイン)と、第2の方式におけるゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、最適ゲインと、ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、第1の自乗誤差と第2の自乗誤差に基づく評価関数が最小となるゲインをゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める処理、
を実行させるためのプログラムが記録されている。記録媒体6から該プログラムを記録媒体読出装置5、インタフェース4を介してメモリ3に読み出して実行する。上記プログラムは、マスクROM等、フラッシュメモリ等の不揮発性メモリに格納してもよく、記録媒体は不揮発性メモリを含むほか、CD−ROM、FD、Digital Versatile Disk (DVD)、磁気テープ(MT)、可搬型HDD等の媒体の他、例えばサーバ装置からコンピュータで該プログラムを通信媒体伝送する場合等、プログラムを担持する有線、無線で通信される通信媒体等も含む。
【0180】
本発明の第4の実施例では、記録媒体6から読み出されたプログラムを実行するコンピュータ1において、第1の符号化復号装置により音声を符号化して得た第1の符号を第2の符号化復号装置により復号可能な第2の符号へ変換する符号変換処理を実行するにあたり、記録媒体6には、
(a) 第1の符号列からゲイン情報を復号する処理と、
(b) 復号されたゲイン(復号ゲイン)を修正する処理と、
(c) 修正された復号ゲイン(修正復号ゲイン)と、第2の方式におけるゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、復号ゲインと、ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、第1の自乗誤差と第2の自乗誤差に基づく評価関数が最小となるゲインをゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める処理、
を実行させるためのプログラムが記録されている。
【0181】
以上本発明を上記実施例に即して説明したが、本発明は、上記実施例の構成にのみ限定されるものでなく、特許請求の範囲の各請求項の発明の範囲内で当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
【0182】
【発明の効果】
以上説明したように、本発明によれば、非音声区間における背景雑音音質の劣化を低減することができる、という効果を奏する。
【0183】
その理由は、本発明においては、第1の符号列から第1の線形予測係数をもつ合成フィルタを励振信号で駆動して得た第1の音声信号と第2の符号列から得られる情報により生成される第2の音声信号とから最適ゲインを導出し、さらに最適ゲインを修正し、修正した最適ゲインと、最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求め、その際、非音声区間において、第2のゲインの時間変動が小さくなるような評価関数を用いて、第2のゲインを求めるように構成したためである。上記効果は、第1の符号列からゲイン情報を復号し、復号されたゲインを修正し、修正された復号ゲインと、前記復号ゲインと第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求め、非音声区間において、第2のゲインの時間変動が小さくなるような評価関数を用いて、第2のゲインを求めるように構成してなる本発明によっても奏することができる。
【図面の簡単な説明】
【図1】本発明による符号変換装置の第1の実施例の構成を示す図である。
【図2】本発明による符号変換装置におけるLP係数符号変換回路の構成を示す図である。
【図3】ACB符号とACB遅延との対応関係とACB符号の読み替え方法を説明する図である。
【図4】本発明による符号変換装置の音声復号回路の構成を示す図である。
【図5】本発明による符号変換装置における目標信号計算回路の構成を示す図である。
【図6】本発明による符号変換装置におけるFCB符号生成回路の構成を示す図である。
【図7】パルス位置符号とパルス位置との対応関係とACB符号の読み替え方法を説明する図である。
【図8】本発明による符号変換装置におけるゲイン符号生成回路の構成を示す図である。
【図9】本発明による符号変換装置の第2の実施例の構成を示す図である。
【図10】本発明による符号変換装置におけるゲイン符号生成回路の構成を示す図である。
【図11】本発明による符号変換装置の第3から第4の実施例の構成を示す図である。
【図12】従来の符号変換装置の構成を示す図である。
【符号の説明】
1 コンピュータ
2 CPU
3 メモリ
4 記録媒体読出装置インタフェース
5 記録媒体読出装置
6 記録媒体
10,31,35,36,37,51,52,53,57,61,74,75,81,82,83,84,85,91,92,93,94 入力端子
20,32,33,34,55,56,62,63,76,77,78,86,95,96 出力端子
100,1100 LP係数符号変換回路
110 LP係数復号回路
130 LP係数符号化回路
111 第1のLSPコードブック
131 第2のLSPコードブック
200,1200 ACB 符号変換回路
300,1300 FCB 符号変換回路
400,2400 ゲイン符号変換回路
1010 符号分離回路
1020 符号多重回路
1110 LSP−LPC変換回路
1120 インパルス応答計算回路
1400 ゲイン符号生成回路
1410,2410 ACBゲイン符号化回路
1411,2471 ACBゲインコードブック
1420,2420 FCBゲイン符号化回路
1421,2481 FCBゲインコードブック
1430 第2の目標信号計算回路
1440 最適FCBゲイン計算回路
1450 最適FCBゲイン修正回路
1460 音声/非音声識別回路
1470 ゲイン符号多重回路
1480 最適ACBゲイン修正回路
1500 音声復号回路
1510 ACB復号回路
1520 FCB復号回路
1530 ゲイン復号回路
1540 励振信号計算回路
1570 励振信号記憶回路
1580 合成フィルタ
1600 励振信号情報復号回路
1610 第2の励振信号計算回路
1620 第2の励振信号記憶回路
1700 目標信号計算回路
1710 重み付け信号計算回路
1720 ACB信号生成回路
1800 FCB符号生成回路
1820 FCB信号生成回路
2480 FCBゲイン復号回路
2450 FCBゲイン修正回路
2490 ゲイン符号分離回路[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an encoding and decoding method for transmitting or storing an audio signal at a low bit rate, and in particular, when performing audio communication using different encoding and decoding methods, obtained by encoding audio by a certain method. The present invention relates to a code conversion method and apparatus for converting a code into a code that can be decoded by another method with high sound quality and a low operation amount, and a recording medium thereof.
[0002]
[Prior art]
2. Description of the Related Art As a method for encoding a speech signal at a medium to low bit rate with high efficiency, a method of separating and encoding the speech signal into a linear prediction (Linear Prediction: LP) filter and an excitation signal for driving the filter is widely used. . One of the typical methods is Code \ Excited \ Linear \ Prediction (code-excited linear prediction: referred to as "CELP"). In CELP, an LP filter in which LP coefficients representing the frequency characteristics of an input voice are set includes an adaptive codebook (Adaptive Codebook: \ "ACB") representing a pitch period of the input voice, and a fixed codebook (Random Number and Pulse) composed of random numbers and pulses. By driving with an excitation signal represented by the sum of “Fixed Codebook:“ FCB ”), a synthesized speech signal is obtained. At this time, the ACB component and the FCB component are multiplied by gains (“ACB gain” and “FCB gain”). For CELP, M.P. Schroeder and B.S. S. "Code \ excited \ linear \ prediction: \ High \ quality \ speech \ at \ very \ low \ bit \ rates" by Atal (Proc. \ Of \ IEEE \ Int. \ Conf.on \ Acost., @Spence. Is referred to.
[0003]
By the way, for example, when an interconnection between a 3G mobile network and a wired packet network is assumed, there is a problem that a direct connection cannot be made because the standard voice coding method used in each network is different. The simplest solution to this is a tandem connection. However, in the tandem connection, the audio signal is temporarily decoded using the standard system from a code string obtained by encoding the audio using one standard system, and the decoded audio signal is decoded using the other standard system. The encoding is performed again. For this reason, there is a problem that the sound quality is generally lowered, the delay is increased, and the calculation amount is increased as compared with the case where encoding and decoding are performed only once in each audio encoding / decoding method.
[0004]
On the other hand, a code obtained by encoding speech using one standard method is converted into a code that can be decoded by the other standard method in a code domain or a coding parameter domain. Is effective for The method of converting the code is described in "Improving, Transcoding, Capability, of Speech, Coders, in Clean, and Frame, Erased, Channel, Environmental, Environmental, Environmental Engineering, Hong Kong, Kong et al." Reference 2)).
[0005]
FIG. 12 converts a code obtained by encoding speech using the first speech coding method (referred to as “method A”) into a code that can be decoded using the second method (referred to as “method B”). FIG. 3 is a diagram illustrating an example of a configuration of a transcoder. Referring to FIG. 12, the code conversion device includes an input terminal 10, a code separation circuit 1010, an LP coefficient code conversion circuit 100, an ACB code conversion circuit 200, an FCB code conversion circuit 300, and a gain code conversion circuit 400. , A code multiplexing circuit 1020, and an output terminal 20. With reference to FIG. 12, each component of the conventional transcoder will be described.
[0006]
From the input terminal 10, a first code string obtained by encoding a sound by the method A is input.
[0007]
The code separation circuit 1010 converts, from the first code string input from the input terminal 10, codes corresponding to the LP coefficient, ACB, FCB, ACB gain, and FCB gain, that is, the LP coefficient code, ACB code, FCB code, and gain code. To separate. Here, the ACB gain and the FCB gain are collectively encoded and decoded, and for simplicity, this is referred to as a gain and its code is referred to as a gain code. Further, the LP coefficient code, the ACB code, the FCB code, and the gain code are referred to as a first LP coefficient code, a first ACB code, a first FCB code, and a first gain code, respectively. Then, the first LP coefficient code is output to the LP coefficient code conversion circuit 100, the first ACB code is output to the ACB code conversion circuit 200, and the first FCB code is output to the FCB code conversion circuit 300. The gain code of 1 is output to the gain code conversion circuit 400.
[0008]
The LP coefficient code conversion circuit 100 receives the first LP coefficient code output from the code separation circuit 1010, and converts the first LP coefficient code into a code that can be decoded by the method B. The converted LP coefficient code is output to code multiplexing circuit 1020 as a second LP coefficient code.
[0009]
The ACB code conversion circuit 200 receives the first ACB code output from the code separation circuit 1010 and converts the first ACB code into a code that can be decoded by the method B. The converted ACB code is output to code multiplexing circuit 1020 as a second ACB code.
[0010]
The FCB code conversion circuit 300 receives the first FCB code output from the code separation circuit 1010, and converts the first FCB code into a code that can be decoded by the method B. The converted FCB code is output to code multiplexing circuit 1020 as a second FCB code.
[0011]
The gain code conversion circuit 400 receives the first gain code output from the code separation circuit 1010 and converts the first gain code into a code that can be decoded by the method B. The converted gain code is output to code multiplexing circuit 1020 as a second gain code.
[0012]
A more specific operation of each conversion circuit will be described below.
[0013]
The LP coefficient code conversion circuit 100 decodes the first LP coefficient code input from the code separation circuit 1010 by the LP coefficient decoding method in the system A to obtain a first LP coefficient. Next, the LP coefficient code conversion circuit 100 quantizes and encodes the first LP coefficient according to the method for quantizing and encoding the LP coefficient in the method B to obtain a second LP coefficient code. Then, LP coefficient code conversion circuit 100 outputs the second LP coefficient code to code multiplexing circuit 1020 as a code that can be decoded by the LP coefficient decoding method in scheme B.
[0014]
The ACB code conversion circuit 200 obtains a second ACB code by reading the first ACB code input from the code separation circuit 1010 using the correspondence between the code in the method A and the code in the method B. Then, ACB code conversion circuit 200 outputs the second ACB code to code multiplexing circuit 1020 as a code that can be decoded by the ACB decoding method in scheme B.
[0015]
The FCB code conversion circuit 300 obtains a second FCB code by reading the first FCB code input from the code separation circuit 1010 using the correspondence between the code in the method A and the code in the method B. Then, FCB code conversion circuit 300 outputs the second FCB code to code multiplexing circuit 1020 as a code that can be decoded by the FCB decoding method in scheme B.
[0016]
The gain code conversion circuit 400 obtains a first gain by decoding the first gain code input from the code separation circuit 1010 by the gain decoding method in the scheme A. Next, the gain code conversion circuit 400 quantizes and codes the first gain by the gain quantization method and the coding method in the method B, and obtains a second gain and its sign (second gain code). Get. Then, gain code conversion circuit 400 outputs the second gain code to code multiplexing circuit 1020 as a code that can be decoded by the gain decoding method in scheme B.
[0017]
The code multiplexing circuit 1020 includes a second LP coefficient code output from the LP coefficient code conversion circuit 100, a second ACB code output from the ACB code conversion circuit 200, and a second LP coefficient code output from the FCB code conversion circuit 300. The second FCB code and the second gain code output from the gain code conversion circuit 400 are input, and a code string obtained by multiplexing them is output as a second code string via the output terminal 20. Thus, the description of FIG. 12 is completed.
[0018]
[Problems to be solved by the invention]
However, the conventional transcoder described with reference to FIG. 12 has a problem that the sound quality of background noise in a non-speech section deteriorates.
[0019]
The reason is that the background noise energy has a large time variation in the non-voice section. This is due to the fact that the second gain obtained by requantizing the first gain fluctuates greatly in a non-voice section.
[0020]
Accordingly, the present invention has been made in view of the above problems, and a main object of the present invention is to provide an apparatus and a method capable of reducing deterioration of background noise sound quality in a non-speech section, and a recording medium recording the program thereof. It is in. Other objects, features, advantages and the like of the present invention will be immediately apparent to those skilled in the art from the following description.
[0021]
[Means for Solving the Problems]
To achieve the above object, a method according to a first aspect of the present invention is a code conversion method for converting a first code string conforming to a first method into a second code string conforming to a second method. , By obtaining information of a first linear prediction coefficient and an excitation signal from the first code string, and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal. Generating a first audio signal, calculating an optimal gain based on a second audio signal generated based on information obtained from a second code sequence, and the first audio signal; Correcting the gain in the second code string based on the step of correcting the gain, the corrected optimum gain (corrected optimum gain), the optimum gain, and the gain read from the gain codebook in the second method. Comprising a step of obtaining information, the. In the method according to the present invention, the optimum gain is preferably obtained as a gain that minimizes a distance between a second audio signal generated based on information obtained from a second code string and the first audio signal. Can be
[0022]
A method according to a second aspect of the present invention is a code conversion method for converting a first code string conforming to a first method into a second code string conforming to a second method, A step of decoding gain information from a code string, a step of correcting a decoded gain (decoding gain), a corrected decoding gain (corrected decoding gain), the decoding gain, and a gain codebook in a second method. And obtaining gain information in the second code string based on the gain read from.
[0023]
In the invention according to the first aspect, preferably, a first squared error is calculated from the corrected optimal gain and a gain read from the gain codebook, and the first squared error is read from the optimal gain and the gain codebook. A second square error is calculated from the gain and the gain that minimizes the evaluation function based on the first square error and the second square error is selected from the gain codebook. Find gain information.
[0024]
In the invention according to the second aspect, preferably, a first squared error is calculated from the corrected decoding gain and a gain read from the gain codebook, and the first squared error is read from the decoding gain and the gain codebook. A second square error is calculated from the gain and the gain that minimizes the evaluation function based on the first square error and the second square error is selected from the gain codebook. Find gain information.
[0025]
In the invention according to the first aspect, preferably, the corrected optimum gain is based on a long-term average of the optimum gain.
[0026]
In the invention according to the second aspect, preferably, the modified decoding gain is based on a long-term average of the decoding gain.
[0027]
An apparatus according to a third aspect of the present invention is directed to a code conversion apparatus for converting a first code string conforming to a first method into a second code string conforming to a second method, A first audio signal is obtained by obtaining information of a first linear prediction coefficient and an excitation signal from a code string, and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal. An audio decoding circuit for generating, an optimal gain calculation circuit for calculating an optimal gain based on a second audio signal generated based on information obtained from a second code string, and the first audio signal; An optimum gain correction circuit for correcting the gain, a corrected optimum gain (corrected optimum gain), the optimum gain, and a gain read out from a gain codebook in the second method; Gain encoding circuit for finding the gain information, including. In the apparatus according to the present invention, the optimum gain calculation circuit preferably includes a gain that minimizes a distance between a second audio signal generated by information obtained from a second code string and the first audio signal. Is determined as the optimum gain.
[0028]
An apparatus according to a fourth aspect of the present invention is the code conversion apparatus for converting a first code string conforming to a first method into a second code string conforming to a second method, A gain decoding circuit for decoding gain information from the code string, a decoding gain correction circuit for correcting the decoded gain (decoding gain), a corrected decoding gain (corrected decoding gain), the decoding gain, A gain coding circuit for obtaining gain information in the second code sequence based on the gain read from the gain codebook in the method.
[0029]
In the invention according to the third aspect, the gain encoding circuit preferably calculates a first squared error from the corrected optimal gain and a gain read from the gain codebook, and calculates the optimal gain, Calculating a second squared error from the gain read out from the gain codebook, and selecting from the gain codebook a gain that minimizes the evaluation function based on the first squared error and the second squared error. Gain information in the second code string is obtained.
[0030]
In the invention according to the fourth aspect, the gain encoding circuit preferably calculates a first square error from the corrected decoding gain and a gain read from the gain codebook, and calculates the decoding gain, Calculating a second squared error from the gain read out from the gain codebook, and selecting from the gain codebook a gain that minimizes the evaluation function based on the first squared error and the second squared error. Gain information in the second code string is obtained.
[0031]
In the above-described optimal gain correction circuit according to the third aspect, preferably, the corrected optimal gain is based on a long-term average of the optimal gain.
[0032]
In the decoding gain correction circuit according to the fourth aspect, preferably, the correction decoding gain is based on a long-term average of the decoding gain.
[0033]
According to a fifth aspect of the present invention, there is provided a program configured to convert a first code string conforming to the first method into a second code string conforming to the second method.
(A) Obtaining information of a first linear prediction coefficient and an excitation signal from the first code string, and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal. Generating a first audio signal by
(B) a process of calculating a gain (optimum gain) based on a second audio signal generated based on information obtained from a second code sequence and the first audio signal;
(C) processing for correcting the optimum gain;
(D) executing a process of obtaining gain information in the second code sequence based on the corrected optimum gain (corrected optimum gain), the optimum gain, and a gain read from a gain codebook in the second method. Provide a program to make In the present invention, the gain at which the distance between the second audio signal generated from the information obtained from the second code string and the first audio signal is minimized is determined as the optimum gain.
[0034]
A program according to a sixth aspect of the present invention provides a computer that constitutes a code conversion device that converts a first code string conforming to the first method into a second code string conforming to the second method.
(A) decoding gain information from the first code string;
(B) processing for correcting the decoded gain (decoding gain);
(C) performing a process of obtaining gain information in a second code string based on a corrected decoding gain (corrected decoding gain), the decoding gain, and a gain read from a gain codebook in the second method. Provide a program to make
[0035]
In the program according to the fifth aspect, preferably, a first squared error is calculated from the corrected optimum gain and a gain read from the gain codebook, and the first squared error is calculated from the optimum gain and the gain codebook. The second code is calculated by calculating a second square error from the read gain and selecting a gain from the gain codebook that minimizes an evaluation function based on the first square error and the second square error. Find the gain information in a column.
[0036]
In the program of the invention according to the sixth aspect, preferably, a first square error is calculated from the corrected decoding gain and a gain read from the gain codebook, and the first squared error is calculated from the decoding gain and the gain codebook. The second code is calculated by calculating a second square error from the read gain and selecting a gain from the gain codebook that minimizes an evaluation function based on the first square error and the second square error. Find the gain information in a column.
[0037]
In the program according to the fifth aspect, preferably, the corrected optimal gain is based on a long-term average of the optimal gain.
[0038]
In the program according to the sixth aspect, preferably, the modified decoding gain is based on a long-term average of the decoding gain.
[0039]
The invention according to a seventh aspect of the present invention provides a recording medium on which the program according to the fifth and sixth aspects is recorded.
[0040]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described. First, the outline and principle of the apparatus and method of the present invention will be described, and then embodiments will be described in detail below.
[0041]
In the code conversion device according to the present invention, the speech decoding circuit (1500) obtains information of a first linear prediction coefficient and an excitation signal from a first code string conforming to a first method, and A first audio signal is generated by driving a filter having a prediction coefficient with an excitation signal obtained from the information of the excitation signal, and a gain code generation circuit (1400) generates a second code conforming to a second method. Calculating a gain (optimum gain) that minimizes the distance between the second audio signal generated from the information obtained from the column and the first audio signal, modifying the optimal gain, and modifying the optimal gain Based on the (corrected optimum gain), the optimum gain, and the gain read from the gain codebook in the second method, gain information in the second code string is obtained.
[0042]
The method according to the present invention has the following steps.
[0043]
Step a: Obtain a first linear prediction coefficient from a first code string.
[0044]
Step b: Obtain information of the excitation signal from the first code string.
[0045]
Step c: An excitation signal is obtained from the information of the excitation signal.
[0046]
Step d: generating a first audio signal by driving a filter having a first linear prediction coefficient with the excitation signal.
[0047]
Step e: Calculate a gain (optimum gain) that minimizes the distance between the second audio signal generated based on the information obtained from the second code sequence and the first audio signal.
[0048]
Step f: Modify the optimum gain.
[0049]
Step g: Determine gain information in the second code sequence based on the corrected optimal gain (modified optimal gain), the optimal gain, and the gain read from the gain codebook in the second method.
[0050]
In the present invention, the second gain is obtained by using an evaluation function that reduces the time variation of the second gain in a non-voice section.
[0051]
For this reason, in the non-speech section, the time variation of the obtained second gain is small, and the time variation of the background noise energy in the section is small.
[0052]
As a result, it is possible to reduce the deterioration of the background noise sound quality in the non-voice section.
[0053]
【Example】
Next, embodiments of the present invention will be described in detail with reference to the drawings.
[0054]
FIG. 1 is a diagram showing a configuration of a first embodiment of a transcoder according to the present invention. 1, the same or equivalent elements as those in FIG. 12 are denoted by the same reference numerals. Referring to FIG. 1, input terminal 10, code separation circuit 1010, LP coefficient code conversion circuit 1100, LSP-LPC conversion circuit 1110, impulse response calculation circuit 1120, ACB code conversion circuit 1200, target signal calculation A circuit 1700, an FCB code generation circuit 1800, a gain code generation circuit 1400, a speech decoding circuit 1500, a second excitation signal calculation circuit 1610, a second excitation signal storage circuit 1620, a code multiplexing circuit 1020, And an output terminal 20. The input terminal 10, the output terminal 20, the code separation circuit 1010, and the code multiplexing circuit 1020 are basically the same as the elements shown in FIG. 12 except that a part of the connection is branched. In the following, description of the same or equivalent elements described above will be omitted, and differences from the configuration illustrated in FIG. 12 will be mainly described.
[0055]
Also, in scheme A, the encoding of the LP coefficient is
Figure 2004061558
It is performed every msec cycle (frame), and encoding of components of the excitation signal such as ACB, FCB and gain is performed by:
Figure 2004061558
It is performed every msec cycle (subframe).
[0056]
On the other hand, in scheme B, the encoding of the LP coefficient is
Figure 2004061558
It is performed every msec cycle (frame), and the components of the excitation signal are encoded as follows:
Figure 2004061558
It is performed every msec cycle (subframe).
[0057]
Further, the frame length, the number of subframes, and the subframe length of the method A are respectively
Figure 2004061558
,
Figure 2004061558
as well as
Figure 2004061558
And
[0058]
The frame length, the number of subframes, and the subframe length of method B are
Figure 2004061558
,
Figure 2004061558
as well as,
Figure 2004061558
And
[0059]
In the following description, for simplicity,
Figure 2004061558
And
[0060]
Here, for example, the sampling frequency is 8000 Hz,
Figure 2004061558
as well as
Figure 2004061558
Is 10 msec,
Figure 2004061558
as well as
Figure 2004061558
Is 160 samples,
Figure 2004061558
as well as
Figure 2004061558
Is 80 samples.
[0061]
LP coefficient code conversion circuit 1100 receives the first LP coefficient code from code separation circuit 1010. Here, "3GPP \ AMR \ Speech \ Codec" (Reference 3) and ITU-T Recommendation G.264. In many standard schemes such as G.729, the LP coefficient is often represented by a line spectrum pair (Line Spectral Pair: LSP), and the LSP is often encoded and decoded. Therefore, the encoding and decoding of the LP coefficient are performed in the LSP domain. Suppose Regarding the conversion from the LP coefficient to the LSP, and the conversion from the LSP to the LP coefficient, reference is made to a well-known method, for example, the description in Section 5.2.3 and Section 5.2.4 of “Document 3”. . The LP coefficient code conversion circuit 1100 decodes the first LP coefficient code by the LSP decoding method in the scheme A to obtain a first LSP.
[0062]
Next, the LP coefficient code conversion circuit 1100 quantizes and encodes the first LSP according to the LSP quantization method and the encoding method in the method B, and generates a second LSP and a code corresponding thereto (the second LSP). LP coefficient sign). Then, the LP coefficient code conversion circuit 1100 outputs the second LP coefficient code to the code multiplexing circuit 1020 as a code that can be decoded by the LSP decoding method in the method B, and outputs the first LSP and the second LSP to the LSP. -Output to LPC conversion circuit 1110.
[0063]
FIG. 2 is a diagram showing a configuration of the LP coefficient code conversion circuit 1100. Referring to FIG. 2, the LP coefficient code conversion circuit 1100 includes an LSP decoding circuit 110, a first LSP codebook 111, an LSP coefficient coding circuit 130, and a second LSP codebook 131. Each component of LP coefficient code conversion circuit 1100 will be described with reference to FIG.
[0064]
The LSP decoding circuit 110 decodes the corresponding LSP from the LP coefficient code. The LSP decoding circuit 110 includes a first LSP codebook 111 in which a plurality of sets of LSPs are stored, and inputs the first LP coefficient code output from the code separation circuit 1010 via the input terminal 31. , The LSP corresponding to the first LP coefficient code is read from the first LSP codebook 111, the read LSP is output to the LSP encoding circuit 130 as the first LSP, and the LSP is output via the output terminal 33. -Output to LPC conversion circuit 1110. Here, decoding of the LSP from the LP coefficient code uses the LSP codebook of the system A according to the LSP decoding method of the system A.
[0065]
The LSP encoding circuit 130 receives the first LSP output from the LSP decoding circuit 110, and outputs a second LSP and a corresponding LP coefficient code from a second LSP codebook 131 storing a plurality of sets of LSPs. Are sequentially read, a second LSP that minimizes an error from the first LSP is selected, and a corresponding LP coefficient code is set as a second LP coefficient code via an output terminal 32 through a code multiplexing circuit 1020. And outputs the second LSP to the LSP-LPC conversion circuit 1110 via the output terminal 34. Here, the second LSP selection method, that is, the LSP quantization and encoding method uses the LSP codebook of the method B according to the LSP quantization method and the encoding method of the method B. Here, for the quantization and encoding of the LSP, for example, the description in Section 5.2.5 of “Document 3” is referred to.
[0066]
Thus, the description of the LP coefficient code conversion circuit 1100 shown in FIG. 2 is completed, and the description returns to FIG.
[0067]
The LSP-LPC conversion circuit 1110 receives the first LSP and the second LSP output from the LP coefficient code conversion circuit 1100, and converts the first LSP into a first LP coefficient a.1, iAnd convert the second LSP to a second LP coefficient a2, iAnd the first LP coefficient a1, iTo the target signal calculation circuit 1700, the speech decoding circuit 1500, and the impulse response calculation circuit 1120, and the second LP coefficient a2, iIs output to the target signal calculation circuit 1700 and the impulse response calculation circuit 1120. Here, regarding the conversion from the LSP to the LP coefficient, the description in Section 5.2.4 of “Document 3” is referred to.
[0068]
The ACB code conversion circuit 1200 obtains a second ACB code by reading the first ACB code input from the code separation circuit 1010 using the correspondence between the code in the method A and the code in the method B. Then, ACB code conversion circuit 1200 outputs the second ACB code to code multiplexing circuit 1020 as a code that can be decoded by the ACB decoding method in scheme B. Further, ACB code conversion circuit 1200 outputs an ACB delay corresponding to the second ACB code to target signal calculation circuit 1700 as a second ACB delay.
[0069]
Here, with reference to FIG. For example, ACB code in scheme A
Figure 2004061558
Is 56, the corresponding ACB delay
Figure 2004061558
Is 76. In scheme B, the ACB code
Figure 2004061558
Is 53, the corresponding ACB delay
Figure 2004061558
Is 76, in order to convert the ACB code from the method A to the method B so that the value of the ACB delay becomes the same (76 in this case), the ACB code 56 in the method A is converted into the ACB code in the method B. What is necessary is just to correspond to code | symbol 53. Thus, the description of the code replacement is completed, and the description returns to FIG.
[0070]
The audio decoding circuit 1500 receives the first ACB code, the first FCB code, and the first gain code output from the code separation circuit 1010, and receives the first LP coefficient from the LSP-LPC conversion circuit 1110. . Next, the audio decoding circuit 1500 uses the ACB signal decoding method, the FCB signal decoding method, and the gain decoding method in the method A to convert the first ACB code, the first FCB code, and the first gain code. From each of them, the ACB delay, the FCB signal and the gain are decoded, and each is set as a first ACB delay, a first FCB signal and a first gain. The audio decoding circuit 1500 generates an ACB signal using the first ACB delay, and sets this as the first ACB signal. Then, the audio decoding circuit 1500 generates audio from the first ACB signal, the first FCB signal, the first gain, and the first LP coefficient, and outputs the audio to the target signal calculation circuit 1700.
[0071]
FIG. 4 is a diagram showing a configuration of the audio decoding circuit 1500. Referring to FIG. 4, audio decoding circuit 1500 includes excitation signal information decoding circuit 1600 having ACB decoding circuit 1510, FCB decoding circuit 1520, gain decoding circuit 1530, excitation signal calculation circuit 1540, and excitation signal storage circuit. 1570 and a synthesis filter 1580. Referring to FIG. 4, each component of speech decoding circuit 1500 will be described.
[0072]
The excitation signal information decoding circuit 1600 decodes the information of the excitation signal from the code corresponding to the information of the excitation signal. The first ACB code, the first FCB code, and the first gain code output from the code separation circuit 1010 are input via input terminals 51, 52, and 53, respectively, and the first ACB code, the first FCB code, The ACB delay, the FCB signal, and the gain are decoded from the code and the first gain code, respectively, and are respectively defined as a first ACB delay, a first FCB signal, and a first gain. Here, the first gain is composed of an ACB gain and an FCB gain, and they are respectively referred to as a first ACB gain and a first FCB gain. Further, the excitation signal information decoding circuit 1600 receives the past excitation signal output from the excitation signal storage circuit 1570. The excitation signal information decoding circuit 1600 generates an ACB signal using the past excitation signal and the first ACB delay, and sets this as the first ACB signal. Then, the excitation signal information decoding circuit 1600 outputs the first ACB signal, the first FCB signal, the first ACB gain, and the first FCB gain to the excitation signal calculation circuit 1540.
[0073]
Next, the ACB decoding circuit 1510, FCB decoding circuit 1520, and gain decoding circuit 1530, which are components of the excitation signal information decoding circuit 1600, will be described in detail.
[0074]
The ACB decoding circuit 1510 inputs the first ACB code output from the code separation circuit 1010 via the input terminal 51, and inputs a past excitation signal output from the excitation signal storage circuit 1570. Next, similarly to ACB code conversion circuit 1200 described above, ACB decoding circuit 1510 uses the correspondence between the ACB code and ACB delay in method A shown in FIG. 3 to generate a first ACB code corresponding to the first ACB code. ACB delay
Figure 2004061558
Get. In the excitation signal, from the start of the current subframe
Figure 2004061558
Equivalent to subframe length, from a point in the sample past
Figure 2004061558
A sample signal is cut out to generate a first ACB signal. here,
Figure 2004061558
But
Figure 2004061558
If smaller than
Figure 2004061558
Cut out a vector for the sample, connect this vector repeatedly, and
Figure 2004061558
Let it be a sample signal. Then, the first ACB signal is output to excitation signal calculation circuit 1540. Here, for details of the method of generating the first ACB signal, refer to the descriptions in Sections 6.1 and 5.6 of “Document 3”.
[0075]
The FCB decoding circuit 1520 receives the first FCB code output from the code separation circuit 1010 via the input terminal 52, and converts the first FCB signal corresponding to the first FCB code into an excitation signal calculation circuit 1540. Output to The FCB signal is represented by a multi-pulse signal defined by a pulse position and a pulse polarity, and the first FCB code is a code (pulse position code) corresponding to the pulse position and a code (pulse polarity code) corresponding to the pulse polarity. ). Here, for details of the method of generating the FCB signal represented by the multi-pulse signal, refer to the descriptions in Sections 6.1 and 5.7 of “Document 3”.
[0076]
The gain decoding circuit 1530 inputs the first gain code output from the code separation circuit 1010 via the input terminal 53. The gain decoding circuit 1530 incorporates a table in which a plurality of gains are stored, and reads a gain corresponding to the first gain code from the table. Then, the gain decoding circuit 1530 outputs the first ACB gain corresponding to the ACB gain and the first FCB gain corresponding to the FCB gain among the read gains to the excitation signal calculation circuit 1540. Here, when the first ACB gain and the first FCB gain are collectively encoded, the table stores a plurality of two-dimensional vectors including the first ACB gain and the first FCB gain. ing. When the first ACB gain and the first FCB gain are individually encoded, two tables are built in, and one table stores a plurality of first ACB gains and the other table stores the first ACB gain. A plurality of first FCB gains are stored in the table.
[0077]
Excitation signal calculation circuit 1540 receives the first ACB signal output from ACB decoding circuit 1510, receives the first FCB signal output from FCB decoding circuit 1520, and outputs the first FCB signal output from gain decoding circuit 1530. The first ACB gain and the first FCB gain are input. Excitation signal calculation circuit 1540 adds a signal obtained by multiplying the first ACB signal by the first ACB gain and a signal obtained by multiplying the first FCB signal by the first FCB gain to obtain a first signal. To obtain the excitation signal. Then, the excitation signal calculation circuit 1540 outputs the first excitation signal to the synthesis filter 1580 and the excitation signal storage circuit 1570.
[0078]
The excitation signal storage circuit 1570 receives the first excitation signal output from the excitation signal calculation circuit 1540, and stores and holds the first excitation signal. Then, the excitation signal storage circuit 1570 outputs the past first excitation signal that has been input and stored in the past to the ACB decoding circuit 1510.
[0079]
The synthesis filter 1580 inputs the first excitation signal output from the excitation signal calculation circuit 1540, and inputs the first LP coefficient output from the LSP-LPC conversion circuit 1110 via the input terminal 61. Then, the synthesis filter 1580 generates an audio signal by driving the linear prediction filter having the first LP coefficient with the first excitation signal. The audio signal is output to the target signal calculation circuit 1700 via the output terminal 63.
[0080]
This is the end of the description of the speech decoding circuit 1500 shown in FIG. 4, and returns to the description of FIG.
[0081]
The target signal calculation circuit 1700 receives the first LSP and the second LSP from the LSP-LPC conversion circuit 1110, and receives the second ACB delay corresponding to the second ACB code from the ACB code conversion circuit 1200. , A decoded speech from the speech decoding circuit 1500, an impulse response signal from the impulse response calculation circuit 1120, and a past second excitation signal stored and held in the second excitation signal storage circuit 1620. The target signal calculation circuit 1700 calculates a first target signal from the decoded speech, the first LP coefficient, and the second LP coefficient. Next, the target signal calculation circuit 1700 obtains a second ACB signal and an optimum ACB gain from the past second excitation signal, impulse response signal, first target signal, and second ACB delay. Then, the target signal calculation circuit 1700 outputs the first target signal and the optimum ACB gain to the gain code generation circuit 1400, and outputs the second ACB signal to the gain code generation circuit 1400 and the second excitation signal calculation circuit 1610. Output to
[0082]
FIG. 5 is a diagram showing a configuration of the target signal calculation circuit 1700. Referring to FIG. 5, the target signal calculation circuit 1700 includes a weighting signal calculation circuit 1710, an ACB signal generation circuit 1720, and an optimum ACB gain calculation circuit 1730. With reference to FIG. 5, each component of the target signal calculation circuit 1700 will be described.
[0083]
The weighting signal calculation circuit 1710 inputs the decoded speech s (n) output from the synthesis filter 1580 of the speech decoding circuit 1500 via the input terminal 57, and outputs the first LP coefficient output from the LSP-LPC conversion circuit 1110. a1, iAnd the second LP coefficient a2, iAre input via the input terminal 36 and the input terminal 35, respectively. The weighting signal calculation circuit 1710 first configures the audibility weighting filter W (z) using the first LP coefficient.
[0084]
Then, the weighting signal calculation circuit 1710 drives the audibility weighting filter with the decoded voice to generate the audibility weighted voice signal. Next, the weighting signal calculation circuit 1710 configures an auditory weighting synthesis filter W (z) / A2 (z) using the first LP coefficient and the second LP coefficient.
[0085]
The weighting signal calculation circuit 1710 subtracts the zero input response of the perceptual weighting synthesis filter from the perceptual weighting audio signal, and outputs the first target signal x (n) to the ACB signal generating circuit 1720 and the optimum ACB gain calculating circuit. The signal is output to the second target signal calculation circuit 1430 via the output terminal 78.
[0086]
The ACB signal generation circuit 1720 receives the first target signal output from the weighting signal calculation circuit 1710, and receives a second ACB delay T output from the ACB code conversion circuit 1200.(B) lagIs input via an input terminal 37, the impulse response signal h (n) output from the impulse response calculation circuit 1120 is input via an input terminal 74, and the past output from the second excitation signal storage circuit 1620 is input. The second excitation signal u (n) is input via the input terminal 75.
[0087]
The ACB signal generation circuit 1720 convolves the impulse response signal with a signal cut out from the past second excitation signal with a delay k, thereby filtering the past excitation signal with a delay k.
Figure 2004061558
Is calculated.
[0088]
Here, the delay k is a second ACB delay. A signal cut out from the past second excitation signal with a delay k is defined as a second ACB signal v (n).
[0089]
Then, the ACB signal generation circuit 1720 outputs the second ACB signal to the second target signal calculation circuit 1430 and the second excitation signal calculation circuit 1610 via the output terminal 76, and outputs the filtered delay k The past excitation signal yk (n) is output to the optimum ACB gain calculation circuit 1730.
[0090]
The optimum ACB gain calculation circuit 1730 receives the first target signal x (n) output from the weighting signal calculation circuit 1710, and outputs the past excitation signal of the filtered delay k output from the ACB signal generation circuit 1720. Enter yk (n).
[0091]
Next, the optimum ACB gain calculation circuit 1730 calculates the optimum ACB gain gp from the first target signal x (n) and the past excitation signal yk (n) of the filtered delay k by the following equation. . The optimum ACB gain gp is a gain that minimizes the distance between the first target signal x (n) and the past excitation signal yk (n) with the filtered delay k.
Figure 2004061558
[0092]
Then, the optimum ACB gain calculation circuit 1730 outputs the optimum ACB gain gp to the ACB gain encoding circuit 1410 via the output terminal 77.
[0093]
The details of the method of calculating the second ACB signal and the method of calculating the optimum ACB gain can be referred to the descriptions in Sections 6.1 and 5.6 of “Document 3”. This is the end of the description of the target signal calculation circuit 1700 in FIG. 5, and returns to the description of FIG.
[0094]
The impulse response calculation circuit 1120 receives the first LP coefficient and the second LP coefficient output from the LSP-LPC conversion circuit 1110, and uses the first LP coefficient and the second LP coefficient to perform an auditory weighting synthesis filter. Is composed.
[0095]
Then, impulse response calculation circuit 1120 outputs the impulse response signal of the perceptual weighting synthesis filter to target signal calculation circuit 1700 and gain code generation circuit 1400. Here, the transfer function of the perceptual weighting synthesis filter is represented by the following equation.
Figure 2004061558
[0096]
However,
Figure 2004061558
[0097]
Is the second LP coefficient
Figure 2004061558
Is the transfer function of the linear prediction filter with.
[0098]
Figure 2004061558
[0099]
Is the first LP coefficient
Figure 2004061558
Is a transfer function of an auditory weighting filter having
[0100]
Here, P is a linear prediction order (for example, 10), and γ1 and γ2 are coefficients (for example, 0.94 and 0.6) for controlling weighting.
[0101]
The FCB code generation circuit 1800 receives the first FCB code output from the code separation circuit 1010, and converts the first FCB code into a code that can be decoded by the method B. The FCB code generation circuit 1800 outputs the converted FCB code as a second FCB code to the code multiplexing circuit 1020, and outputs a second FCB signal corresponding to the second FCB code to the gain code generation circuit 1400, 2 to the excitation signal calculation circuit 1610. Here, the FCB signal is composed of a plurality of pulses, and is represented by a multi-pulse signal defined by a pulse position (pulse position) and a polarity (pulse polarity). The FCB code includes a code corresponding to the pulse position (pulse position code) and a code corresponding to the pulse polarity (pulse polarity code). For the expression method of the FCB signal by the multi-pulse signal, refer to the description in Section 5.7 of “Document 3”.
[0102]
FIG. 6 is a diagram showing a configuration of the FCB code generation circuit 1800 in FIG. Referring to FIG. 6, the FCB code generation circuit 1800 includes an FCB code conversion circuit 1300 and an FCB signal generation circuit 1820. With reference to FIG. 6, each component of FCB code generation circuit 1800 will be described.
[0103]
The FCB code conversion circuit 1300 outputs the first FCB code i input from the code separation circuit 1010 via the input terminal 85.(A) PIs read using the correspondence between the code in the method A and the code in the method B to obtain the second FCB code i.( B ) PGet. Then, the FCB code conversion circuit 1300 outputs this to the code multiplexing circuit 1020 via the output terminal 55 as a code decodable by the FCB decoding method in the system B, and outputs the pulse position corresponding to the second FCB code.
Figure 2004061558
And pulse polarity
Figure 2004061558
To the FCB signal generation circuit 1820.
[0104]
With reference to FIG. 7, the reading of the pulse position code will be described.
[0105]
For example, the pulse position code in scheme A
Figure 2004061558
Is 6, the corresponding pulse position
Figure 2004061558
Is 30. In method B, the pulse position code
Figure 2004061558
Is 1, the corresponding pulse position
Figure 2004061558
Is 30. In order to convert the pulse position code from scheme A to scheme B so that the pulse position value is the same (30 in this case), the pulse position code 6 in scheme A is converted to scheme B May be associated with the pulse position code 1 in.
[0106]
Regarding the pulse polarity code, the code may be read so that the polarity (positive or negative) corresponding to the code before reading and the polarity corresponding to the code after reading are equal.
[0107]
As described above, the description of the replacement of the pulse position code and the pulse polarity code is completed, and the description returns to FIG.
[0108]
The FCB signal generation circuit 1820 inputs the pulse position and the pulse polarity output from the FCB code conversion circuit 1300. The FCB signal generation circuit 1820 sets the FCB signal defined by the pulse position and the pulse polarity as the second FCB signal c (n), and outputs this to the optimum FCB gain calculation circuit 1440 and the second excitation signal calculation circuit 1610. Output via terminal 86.
[0109]
This is the end of the description of the FCB code generation circuit 1800 in FIG. 6, and returns to the description of FIG.
[0110]
The gain code generation circuit 1400 receives the first target signal, the second ACB signal, and the optimum ACB gain output from the target signal calculation circuit 1700, and receives the second FCB signal output from the FCB code generation circuit 1800. , The impulse response signal output from the impulse response calculation circuit 1120 is input, and the first LSP output from the LP coefficient code conversion circuit 1100 is input.
[0111]
The gain code generation circuit 1400 first calculates a second target signal from the first target signal, the second ACB signal, the optimum ACB gain, and the impulse response signal, and calculates the second target signal and the second FCB signal. And an impulse response signal, calculate a corrected FCB gain from the optimum FCB gain, and determine a voice determination value from the first LSP.
[0112]
Next, the gain code generation circuit 1400 calculates a first square error from the ACB gain sequentially read from the ACB gain codebook and the optimum ACB gain, and calculates a second square error from the ACB gain and the corrected ACB gain. I do.
[0113]
Then, the gain code generation circuit 1400 calculates the ACB gain and the corresponding ACB gain code that minimize the evaluation function calculated from the weight coefficient calculated from the speech determination value, the first square error, and the second square error. select.
[0114]
Further, the gain code generation circuit 1400 calculates a third square error from the FCB gain sequentially read from the FCB gain codebook and the optimal FCB gain, and calculates a fourth square error from the FCB gain and the corrected FCB gain. .
[0115]
Then, the gain code generation circuit 1400 calculates the FCB gain and the corresponding FCB gain code that minimize the evaluation function calculated from the weight coefficient calculated from the voice determination value, the third square error, and the fourth square error. select.
[0116]
Finally, the gain code generation circuit 1400 outputs the second gain code composed of the selected ACB gain code and FCB gain code to the code multiplexing circuit 1020 as a code that can be decoded by the gain decoding method in the scheme B. Output via.
[0117]
FIG. 8 is a diagram showing a configuration of the gain code generation circuit 1400. Referring to FIG. 8, a gain code generation circuit 1400 includes an ACB gain coding circuit 1410, an ACB gain codebook 1411, an FCB gain coding circuit 1420, an FCB gain codebook 1421, and a second target signal calculation circuit. 1430, an optimum FCB gain calculation circuit 1440, an optimum FCB gain correction circuit 1450, and a voice / non-voice discrimination circuit 1460. With reference to FIG. 8, each component of gain code generation circuit 1400 will be described in detail.
[0118]
The second target signal calculation circuit 1430 receives the second ACB signal v (n) output from the ACB signal generation circuit 1720 via the input terminal 92, and outputs the first ACB signal v (n) output from the weighting signal calculation circuit 1710. The target signal x (n) is input through the input terminal 93, the impulse response signal h (n) output from the impulse response calculation circuit 1120 is input through the input terminal 94, and the output from the ACB gain encoding circuit 1410 is output. Input second ACB gain.
[0119]
The second target signal calculation circuit 1430 generates a filtered second ACB signal by convolution of the second ACB signal and the impulse response signal.
Figure 2004061558
And calculate the second ACB gain in y (n).
Figure 2004061558
Is subtracted from the first target signal x (n) to obtain a second target signal x (n).2(N) is obtained.
Figure 2004061558
Figure 2004061558
[0120]
Then, the second target signal calculation circuit 1430 calculates the second target signal x2(N) is output to the optimal FCB gain calculation circuit 1440.
[0121]
The optimal FCB gain calculation circuit 1440 inputs the second FCB signal c (n) output from the FCB signal generation circuit 1820 through the input terminal 91, and outputs the impulse response signal h () output from the impulse response calculation circuit 1120. n) is input via the input terminal 94, and the second target signal x output from the second target signal calculation circuit 14302(N), the second FCB signal filtered by convolution of the second FCB signal and the impulse response signal
Figure 2004061558
Is calculated from the second target signal x2 (n) and the filtered second FCB signal z (n) by the following equation. The optimal FCB gain gc is a gain that minimizes the distance between the second target signal x2 (n) and the filtered second FCB signal z (n).
Figure 2004061558
[0122]
Then, the optimal FCB gain calculation circuit 1440 outputs the optimal FCB gain to the optimal FCB gain correction circuit 1450 and the FCB gain encoding circuit 1420.
[0123]
The voice / non-voice discriminating circuit 1460 inputs the first LSP output from the LSP decoding circuit 110 via the input terminal 98. An LSP fluctuation amount is calculated from the first LSP and its long-term average, and a voice determination value is determined from the LSP fluctuation amount.
[0124]
The procedure for obtaining the LSP fluctuation amount will be described below. In the n-th frame, the long-term average of the LSP
Figure 2004061558
Is calculated by the following equation.
Figure 2004061558
Here, Np is a linear prediction order, and β is, for example, 0.9.
[0125]
The variation dq (n) of the LSP in the n-th frame is defined by the following equation.
Figure 2004061558
here,
Figure 2004061558
Is
Figure 2004061558
When
Figure 2004061558
As an error with, for example,
Figure 2004061558
Or
Figure 2004061558
Can be defined, but the latter is used here. A section with a large variation dq (n) can correspond to a voice section, and a section with a small variation dq (n) can correspond to a non-voice section. By the threshold processing for the fluctuation amount dq (n), the sound determination value
Figure 2004061558
To determine.
[0126]
Figure 2004061558
(When Vs = 1 dq (n) is not less than CVS
Vs = 0 dq (n) is smaller than CVS)
[0127]
Here, Cvs is a certain constant (for example, 2.2), Vs = 1 corresponds to a voice section, and Vs = 0 corresponds to a non-voice section. The voice determination value is output to the optimum ACB gain correction circuit 1480, the ACB gain coding circuit 1410, the optimum FCB gain correction circuit 1450, and the FCB gain coding circuit 1420.
[0128]
The optimum ACB gain correction circuit 1480 inputs the optimum ACB gain output from the ACB signal generation circuit 1720 via the input terminal 97, and inputs the voice determination value output from the voice / non-voice recognition circuit 1460. When the voice determination value Vs is 0 (non-voice section), the optimum ACB gain correction circuit 1480 sets the long-term average of the optimum ACB gain as the corrected ACB gain. In a non-voice section, a long-term average of the optimum ACB gain is calculated by the following equation.
Figure 2004061558
[0129]
here,
Figure 2004061558
Is the optimal ACB gain in the n-th subframe,
Figure 2004061558
Is the long-term average of the optimum ACB gain in the n-th subframe, and α is, for example, 0.9. Note that an average value, a median value, a mode value, and the like can be applied to the long-term average.
[0130]
On the other hand, the optimum ACB gain correction circuit 1480 sets the optimum ACB gain itself as the corrected ACB gain when the voice determination value Vs is 1 (voice section).
[0131]
Optimal ACB gain correction circuit 1480 outputs the corrected ACB gain to ACB gain encoding circuit 1410.
[0132]
The ACB gain encoding circuit 1410 inputs the optimum ACB gain gp output from the ACB signal generation circuit 1720 via the input terminal 97, inputs the corrected ACB gain output from the optimum ACB gain correction circuit 1480, and The voice judgment value output from the non-voice discriminating circuit 1460 is input.
[0133]
The ACB gain encoding circuit 1410 calculates a first squared error from the ACB gain sequentially read from the ACB gain codebook 1411 and the optimum ACB gain from the input terminal 97, and calculates a second square error from the ACB gain and the corrected ACB gain. The square error is calculated, and an evaluation function defined by the following equation is calculated from the weight coefficient calculated from the voice determination value, the first square error, and the second square error.
Figure 2004061558
[0134]
here,
Figure 2004061558
Is the optimal ACB gain,
Figure 2004061558
Is the modified ACB gain,
Figure 2004061558
Is an ACB gain sequentially read from the ACB gain codebook, and μ is a weight coefficient. For example, when the voice determination value Vs is 1 (voice section), the weight coefficient μ is 1.0, and when Vs is 0 (non-voice section), μ is 0.2.
[0135]
Then, the ACB gain encoding circuit 1410 selects an ACB gain that minimizes the evaluation function, outputs the selected ACB gain as a second ACB gain to the second target signal calculation circuit 1430, and The signal is output to the excitation signal calculation circuit 1610 via the output terminal 95, and the code corresponding to the second ACB gain is output to the gain code multiplexing circuit 1470 as the ACB gain code.
[0136]
The optimal FCB gain correction circuit 1450 receives the optimal FCB gain output from the optimal FCB gain calculation circuit 1440 and receives the audio determination value Vs output from the audio / non-voice discrimination circuit 1460.
[0137]
When the voice determination value Vs is 0 (non-voice section) in the optimum FCB gain correction circuit 1450, the long-term average of the optimum FCB gain is set as the corrected FCB gain. In a non-voice section, a long-term average of the optimal FCB gain is calculated by the following equation.
Figure 2004061558
[0138]
here,
Figure 2004061558
Is the optimal FCB gain in the n-th subframe,
Figure 2004061558
Is the long-term average of the optimal FCB gain in the n-th subframe, and α is, for example, 0.9. Note that an average value, a median value, a mode value, and the like can be applied to the long-term average.
[0139]
On the other hand, in the optimum FCB gain correction circuit 1450, when the voice determination value Vs is 1 (voice section), the optimum FCB gain itself is set as a corrected FCB gain.
[0140]
Optimal FCB gain correction circuit 1450 outputs the corrected FCB gain to FCB gain encoding circuit 1420.
[0141]
The FCB gain encoding circuit 1420 receives the optimum FCB gain output from the optimum FCB gain calculation circuit 1440, the corrected FCB gain output from the optimum FCB gain correction circuit 1450, and receives the voice / non-voice discrimination circuit 1460. Enter the output voice judgment value. The FCB gain encoding circuit 1420 calculates a first square error from the FCB gain sequentially read from the FCB gain codebook 1421 and the optimal FCB gain, and calculates a second square error from the FCB gain and the corrected FCB gain. Then, an evaluation function defined by the following equation is calculated from the weight coefficient calculated from the voice determination value, the first square error, and the second square error.
Figure 2004061558
[0142]
here,
Figure 2004061558
Is the optimal FCB gain,
Figure 2004061558
Is the modified FCB gain,
Figure 2004061558
Is an FCB gain sequentially read from the FCB gain codebook, and μ is a weight coefficient. For example, when the voice determination value Vs is 1 (voice section), the weight coefficient μ is 1.0, and when the voice determination value Vs is 0 (non-voice section), μ is 0.2.
[0143]
Then, the FCB gain encoding circuit 1420 selects the FCB gain with the smallest evaluation function, and outputs the selected FCB gain as the second FCB gain to the second excitation signal calculation circuit 1610 via the output terminal 96. Then, a code corresponding to the second FCB gain is output to gain code multiplexing circuit 1470 as an FCB gain code.
[0144]
The gain code multiplexing circuit 1470 receives the ACB gain code output from the ACB gain coding circuit 1410, inputs the FCB gain code output from the FCB gain coding circuit 1420, and divides the ACB gain code and the FCB gain code. The second gain code obtained by multiplexing is output to the code multiplexing circuit 1020 via the output terminal 56 as a code that can be decoded by the gain decoding method in the scheme B.
[0145]
This is the end of the description of the gain code generation circuit 1400 in FIG. 8, and returns to the description of FIG.
[0146]
The second excitation signal calculation circuit 1610 receives the second ACB signal output from the target signal calculation circuit 1700, receives the second FCB signal output from the FCB code generation circuit 1800, and receives a gain code generation circuit. The second ACB gain and the second FCB gain output from 1400 are input. The second excitation signal calculation circuit 1610 adds a signal obtained by multiplying the second ACB signal by the second ACB gain and a signal obtained by multiplying the second FCB signal by the second FCB gain. To obtain a second excitation signal. Then, the second excitation signal is output to the second excitation signal storage circuit 1620.
[0147]
The second excitation signal storage circuit 1620 receives the second excitation signal output from the second excitation signal calculation circuit 1610, and stores and holds the second excitation signal. Then, the second excitation signal input and stored in the past is output to the target signal calculation circuit 1700. This concludes the description of the first embodiment of the present invention.
[0148]
Next, a second embodiment of the present invention will be described. FIG. 9 is a diagram showing the configuration of a second embodiment of the transcoder according to the present invention. In FIG. 9, the LP coefficient code conversion circuit 100 and the gain code conversion circuit 400 in FIG. 12 are replaced by an LP coefficient code conversion circuit 1100 and a gain code conversion circuit 2400, respectively. A connection is added to the conversion circuit 2400. In the following, description of elements that are the same as or equivalent to the elements shown in FIG. 12 will be omitted, and differences will be described.
[0149]
The LP coefficient code conversion circuit 1100 is the same as that in the first embodiment described with reference to FIG. However, the way of connection with other circuits is different, and the first LSP is output to the gain code conversion circuit 400.
[0150]
Gain code conversion circuit 2400 receives the first gain code output from code separation circuit 1010, and receives the first LSP output from LP coefficient code conversion circuit 1100.
[0151]
First, the gain code conversion circuit 2400 converts the first gain code from the first gain (the first ACB gain and the first FCB gain) obtained by decoding the first gain code by the gain decoding method in the scheme A, to the modified ACB gain. And a corrected FCB gain, and a voice determination value is determined from the first LSP.
[0152]
Next, the gain code conversion circuit 2400 calculates a first square error from the ACB gain sequentially read from the ACB gain codebook and the first ACB gain, and calculates a second square error from the ACB gain and the corrected ACB gain. Is calculated.
[0153]
The gain code conversion circuit 2400 calculates the ACB gain and the corresponding ACB gain that minimize the evaluation function calculated from the weight coefficient calculated from the speech determination value, the first square error, and the second square error. Select a sign.
[0154]
The gain code conversion circuit 2400 calculates a third square error from the FCB gain sequentially read from the FCB gain codebook and the first FCB gain, and calculates a fourth square error from the FCB gain and the corrected FCB gain. calculate. Then, the gain code conversion circuit 2400 calculates the FCB gain and the corresponding FCB gain code that minimize the evaluation function calculated from the weight coefficient calculated from the voice determination value, the third square error, and the fourth square error. select.
[0155]
Finally, the gain code conversion circuit 2400 outputs the second gain code including the selected ACB gain code and FCB gain code to the code multiplexing circuit 1020 as a code that can be decoded by the gain decoding method in the scheme B.
[0156]
FIG. 10 is a diagram showing a configuration of the gain code conversion circuit 2400 in FIG. Referring to FIG. 10, gain code conversion circuit 2400 includes a speech / non-speech identification circuit 1460, a gain code separation circuit 2490, an ACB gain decoding circuit 2470, an ACB gain codebook 2471, an ACB gain correction circuit 2440, ACB gain encoding circuit 2410, ACB gain codebook 1411, FCB gain decoding circuit 2480, FCB gain codebook 2481, FCB gain correction circuit 2450, FCB gain encoding circuit 2420, FCB gain codebook 1421 , A gain code multiplexing circuit 1470. With reference to FIG. 10, each component of the gain code conversion circuit 2400 of this embodiment will be described. In FIG. 10, a speech / non-speech discriminating circuit 1460 and a gain code multiplexing circuit 1470 are basically the same as the elements shown in FIG. 8, and a description thereof will be omitted below.
[0157]
The gain code separation circuit 2490 inputs the first gain code output from the code separation circuit 1010 via the input terminal 45, and codes corresponding to the ACB gain and the FCB gain from the first gain code, that is, the first gain code. The ACB gain code and the first FCB gain code are separated, the first ACB gain code is output to the ACB gain decoding circuit 2470, and the first FCB gain code is output to the FCB gain decoding circuit 2480.
[0158]
The ACB gain decoding circuit 2470 includes an ACB gain codebook 2471 in which a plurality of sets of ACB gains are stored. The ACB gain decoding circuit 2470 receives the first ACB gain code output from the gain code separation circuit 2490, and receives the first ACB gain code. The ACB gain corresponding to the code is read from the first ACB gain codebook 2471, and the read ACB gain is output to the ACB gain correction circuit 2440 as the first ACB gain and output to the ACB gain encoding circuit 2410. . Here, the decoding of the ACB gain from the ACB gain code uses the ACB gain codebook of the system A according to the ACB gain decoding method in the system A.
[0159]
The FCB gain decoding circuit 2480 includes an FCB gain codebook 2481 in which a plurality of sets of FCB gains are stored, receives the first FCB gain code output from the gain code separation circuit 2490, and The FCB gain corresponding to the code is read from the first FCB gain codebook 2481, and the read FCB gain is output to the FCB gain correction circuit 2450 as the first FCB gain and to the FCB gain encoding circuit 2420. . Here, the decoding of the FCB gain from the FCB gain code uses the FCB gain codebook of the system A according to the decoding method of the FCB gain in the system A.
[0160]
The ACB gain correction circuit 2440 receives the first ACB gain output from the ACB gain decoding circuit 2470, and receives the voice determination value output from the voice / non-voice discrimination circuit 1460. When the voice determination value Vs is 0 (non-voice section), the long-term average of the first ACB gain is set as the corrected ACB gain.
[0161]
The ACB gain correction circuit 2440 calculates the long-term average of the first ACB gain in the non-voice section by the following equation.
Figure 2004061558
[0162]
here,
Figure 2004061558
Is the first ACB gain in the nth subframe,
Figure 2004061558
Is the long-term average of the first ACB gain in the n-th subframe, and α is, for example, 0.9. Note that an average value, a median value, a mode value, and the like can be applied to the long-term average.
[0163]
On the other hand, when the voice determination value Vs is 1 (voice section), the ACB gain correction circuit 2440 sets the first ACB gain itself as the corrected ACB gain.
[0164]
ACB gain correction circuit 2440 outputs the corrected ACB gain to ACB gain encoding circuit 2410.
[0165]
The FCB gain correction circuit 2450 receives the first FCB gain output from the FCB gain decoding circuit 2480, and receives the voice determination value output from the voice / non-voice discrimination circuit 1460.
[0166]
When the voice determination value Vs is 0 (non-voice section) in the FCB gain correction circuit 2450, the long-term average of the first FCB gain is set as the corrected FCB gain. In the non-voice section, the long term average of the first FCB gain is calculated by the following equation.
Figure 2004061558
[0167]
here,
Figure 2004061558
Is the first FCB gain in the nth subframe,
Figure 2004061558
Is the long-term average of the first FCB gain in the n-th subframe, and α is, for example, 0.9. Note that an average value, a median value, a mode value, and the like can be applied to the long-term average.
[0168]
On the other hand, when the voice determination value Vs is 1 (voice section), the FCB gain correction circuit 2450 sets the first FCB gain itself as the corrected FCB gain.
[0169]
FCB gain correction circuit 2450 outputs the corrected FCB gain to FCB gain encoding circuit 2420.
[0170]
The ACB gain encoding circuit 2410 receives the first ACB gain output from the ACB gain decoding circuit 2470, receives the corrected ACB gain output from the ACB gain correction circuit 2440, and Enter the output voice judgment value.
[0171]
The ACB gain encoding circuit 2410 calculates a first square error from the ACB gain sequentially read from the ACB gain codebook 1411 and the first ACB gain, and calculates a second square error from the ACB gain and the corrected ACB gain. Then, an evaluation function defined by the following equation is calculated from the weight coefficient calculated from the voice determination value, the first square error, and the second square error.
[0172]
Figure 2004061558
[0173]
here,
Figure 2004061558
Is the first ACB gain,
Figure 2004061558
Is the modified ACB gain,
Figure 2004061558
Is an ACB gain sequentially read from the ACB gain codebook 1411, and μ is a weight coefficient. For example, when the voice determination value Vs is 1 (voice section), the weight coefficient μ is 1.0, and when Vs is 0 (non-voice section), μ is 0.2.
[0174]
Then, the ACB gain encoding circuit 2410 selects the ACB gain that minimizes the evaluation function, sets the selected ACB gain as the second ACB gain, and sets the code corresponding to the second ACB gain to the second ACB gain. Output to the gain code multiplexing circuit 1470 as a code.
[0175]
The FCB gain encoding circuit 2420 receives the first FCB gain output from the FCB gain decoding circuit 2480, inputs the corrected FCB gain output from the FCB gain correction circuit 2450, and receives the voice / non-voice discrimination circuit 1460. Enter the output voice judgment value.
[0176]
The FCB gain encoding circuit 2420 calculates a third square error from the FCB gain sequentially read from the FCB gain codebook 1421 and the first FCB gain, and calculates a fourth square error from the FCB gain and the corrected FCB gain. Then, an evaluation function defined by the following equation is calculated from the weight coefficient calculated from the voice determination value, the third square error, and the fourth square error.
Figure 2004061558
[0177]
here,
Figure 2004061558
Is the first FCB gain,
Figure 2004061558
Is the modified FCB gain,
Figure 2004061558
Is an FCB gain sequentially read from the FCB gain codebook 1421, and μ is a weight coefficient. For example, when the voice determination value Vs is 1 (voice section), the weight coefficient μ is 1.0, and when the voice determination value Vs is 0 (non-voice section), μ is 0.2.
[0178]
Then, the FCB gain encoding circuit 2420 selects the FCB gain that minimizes the evaluation function, sets the selected FCB gain as the second FCB gain, and sets the code corresponding to the second FCB gain to the second FCB gain. Output to the gain code multiplexing circuit 1470 as a code.
[0179]
The transcoder of each embodiment of the present invention described above may be realized by computer control such as a digital signal processor. FIG. 11 is a diagram schematically showing an apparatus configuration in a case where the code conversion processing of each of the above embodiments is implemented by a computer as a third embodiment of the present invention. In the computer 1 that executes the program read from the recording medium 6, the first code obtained by encoding the audio by the first encoding / decoding device can be decoded by the second encoding / decoding device. In performing the code conversion process of converting to a code, the recording medium 6 includes:
(A) a process of obtaining a first linear prediction coefficient from a first code string;
(B) a process of obtaining information on an excitation signal from the first code sequence;
(C) a process of obtaining an excitation signal from information of the excitation signal;
(D) a process of generating an audio signal by driving a filter having a first linear prediction coefficient with an excitation signal;
(E) a process of calculating a gain (optimum gain) that minimizes the distance between the second audio signal generated from the information obtained from the second code sequence and the first audio signal;
(F) a process for correcting the optimal gain;
(G) First square error is calculated from the corrected optimum gain (corrected optimum gain) and the gain read from the gain codebook in the second method, and the optimum gain and the gain read from the gain codebook are calculated. From the gain codebook by calculating the second squared error from the gain codebook, and selecting the gain that minimizes the evaluation function based on the first squared error and the second squared error from the gain codebook. ,
Is recorded. The program is read from the recording medium 6 to the memory 3 via the recording medium reading device 5 and the interface 4 and executed. The above-described program may be stored in a nonvolatile memory such as a flash memory such as a mask ROM, and the recording medium includes the nonvolatile memory, as well as a CD-ROM, an FD, a digital versatile disk (DVD), and a magnetic tape (MT). In addition to a medium such as a portable HDD, for example, when the program is transmitted from a server device to a computer by a communication medium, a wired or wireless communication medium carrying the program is also included.
[0180]
In the fourth embodiment of the present invention, in the computer 1 executing the program read from the recording medium 6, the first code obtained by encoding the audio by the first encoding / decoding device is converted into the second code. In performing the code conversion process of converting into the second code decodable by the encoding / decoding device, the recording medium 6 includes:
(A) decoding the gain information from the first code string;
(B) a process for correcting the decoded gain (decoding gain);
(C) First square error is calculated from the corrected decoding gain (corrected decoding gain) and the gain read from the gain codebook in the second method, and the decoding gain and the gain read from the gain codebook are calculated. From the gain codebook by calculating the second squared error from the gain codebook, and selecting the gain that minimizes the evaluation function based on the first squared error and the second squared error from the gain codebook. ,
Is recorded.
[0181]
Although the present invention has been described with reference to the above embodiment, the present invention is not limited to the configuration of the above embodiment, and a person skilled in the art within the scope of the claims set forth in the claims. Needless to say, various changes and modifications that could be made are included.
[0182]
【The invention's effect】
As described above, according to the present invention, there is an effect that deterioration of background noise sound quality in a non-speech section can be reduced.
[0183]
The reason is that, in the present invention, the information obtained from the first audio signal and the second code string obtained by driving the synthesis filter having the first linear prediction coefficient from the first code string with the excitation signal is used. An optimum gain is derived from the generated second audio signal, and the optimum gain is further corrected. Based on the corrected optimum gain, the optimum gain, and the gain read from the gain codebook in the second scheme, This is because the gain information in the code string of No. 2 is obtained, and in this case, the second gain is obtained using an evaluation function that reduces the time variation of the second gain in the non-voice section. The above effect is obtained by decoding gain information from the first code string, correcting the decoded gain, and based on the corrected decoding gain, and the decoding gain and the gain read from the gain codebook in the second scheme. , The gain information in the second code string is obtained, and the second gain is obtained by using an evaluation function that reduces the time variation of the second gain in the non-voice section. Can also be played.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration of a first embodiment of a code conversion apparatus according to the present invention.
FIG. 2 is a diagram showing a configuration of an LP coefficient code conversion circuit in the code conversion device according to the present invention.
FIG. 3 is a diagram illustrating a correspondence relationship between an ACB code and an ACB delay and a method of reading the ACB code.
FIG. 4 is a diagram showing a configuration of a speech decoding circuit of the transcoder according to the present invention.
FIG. 5 is a diagram showing a configuration of a target signal calculation circuit in the transcoder according to the present invention.
FIG. 6 is a diagram showing a configuration of an FCB code generation circuit in the code conversion device according to the present invention.
FIG. 7 is a diagram for explaining a correspondence relationship between a pulse position code and a pulse position and a method of reading an ACB code.
FIG. 8 is a diagram showing a configuration of a gain code generation circuit in the code conversion device according to the present invention.
FIG. 9 is a diagram showing a configuration of a second embodiment of the code conversion apparatus according to the present invention.
FIG. 10 is a diagram showing a configuration of a gain code generation circuit in the code conversion device according to the present invention.
FIG. 11 is a diagram showing a configuration of a third to a fourth embodiment of the transcoder according to the present invention.
FIG. 12 is a diagram illustrating a configuration of a conventional transcoder.
[Explanation of symbols]
1 Computer
2 CPU
3 memory
4 Recording medium reading device interface
5 Recording medium reading device
6 Recording media
10, 31, 35, 36, 37, 51, 52, 53, 57, 61, 74, 75, 81, 82, 83, 84, 85, 91, 92, 93, 94 input terminals
20, 32, 33, 34, 55, 56, 62, 63, 76, 77, 78, 86, 95, 96 output terminals
100,1100 @ LP coefficient sign conversion circuit
110 LP coefficient decoding circuit
130 LP coefficient coding circuit
111 @ First LSP Codebook
131 @ 2nd LSP Codebook
200,1200 ACB code conversion circuit
300, 1300 {FCB} code conversion circuit
400, 2400 gain code conversion circuit
1010 code separation circuit
1020 code multiplexing circuit
1110 LSP-LPC conversion circuit
1120 ° impulse response calculation circuit
1400 gain code generation circuit
1410, 2410 ACB gain encoding circuit
1411,247 @ ACB Gain Codebook
1420, 2420 FCB gain coding circuit
1421,481 @ FCB Gain Codebook
1430 second target signal calculation circuit
1440 Optimal FCB gain calculation circuit
1450 ° optimal FCB gain correction circuit
1460 voice / non-voice discrimination circuit
1470 gain code multiplexing circuit
1480 Optimal ACB gain correction circuit
1500 audio decoding circuit
1510 @ ACB decoding circuit
1520 FCB decoding circuit
1530 gain decoding circuit
1540 excitation signal calculation circuit
1570 ° excitation signal storage circuit
1580 synthesis filter
1600 ° excitation signal information decoding circuit
1610 second excitation signal calculation circuit
1620 second excitation signal storage circuit
1700 target signal calculation circuit
1710 weighted signal calculation circuit
1720 ACB signal generation circuit
1800 FCB code generation circuit
1820 FCB signal generation circuit
2480 FCB gain decoding circuit
2450 FCB gain correction circuit
2490 gain code separation circuit

Claims (30)

第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法において、
前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成するステップと、
第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づき最適ゲインを導出するステップと、
前記最適ゲインを修正するステップと、
修正された最適ゲイン(「修正最適ゲイン」という)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるステップと、
を含む、ことを特徴とする符号変換方法。
In a code conversion method for converting a first code string conforming to the first method into a second code string conforming to the second method,
By obtaining information of a first linear prediction coefficient and an excitation signal from the first code string and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal, the first Generating an audio signal of
Deriving an optimal gain based on a second audio signal generated by information obtained from a second code sequence and the first audio signal;
Modifying the optimal gain;
Obtaining gain information in a second code sequence based on the corrected optimal gain (referred to as “modified optimal gain”), the optimal gain, and a gain read from a gain codebook in the second method;
A code conversion method comprising:
第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法において、
前記第1の符号列からゲイン情報を復号するステップと、
復号されたゲイン(「復号ゲイン」という)を修正するステップと、
修正された復号ゲイン(「修正復号ゲイン」という)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるステップと、
を含む、ことを特徴とする符号変換方法。
In a code conversion method for converting a first code string conforming to the first method into a second code string conforming to the second method,
Decoding gain information from the first code sequence;
Modifying the decoded gain (referred to as "decoding gain");
Obtaining gain information in a second code sequence based on a corrected decoding gain (referred to as “corrected decoding gain”), the decoding gain, and a gain read from a gain codebook in a second method;
A code conversion method comprising:
前記修正最適ゲインと、前記ゲインコードブックから読み出されるゲインとから、第1の自乗誤差を計算するステップと、
前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算するステップと、
前記第1の自乗誤差と前記第2の自乗誤差とに基づく評価関数を最小とするゲインを、前記ゲインコードブックから選択することによって、第2の符号列におけるゲイン情報を求めるステップと、
を含む、ことを特徴とする請求項1に記載の符号変換方法。
Calculating a first squared error from the corrected optimal gain and a gain read from the gain codebook;
Calculating a second squared error from the optimal gain and a gain read from the gain codebook;
Obtaining gain information in a second code sequence by selecting a gain that minimizes an evaluation function based on the first square error and the second square error from the gain codebook;
The code conversion method according to claim 1, comprising:
前記修正復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算するステップと、
前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算するステップと、
前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数を最小とするゲインを、前記ゲインコードブックから選択することによって、第2の符号列におけるゲイン情報を求めるステップと、
を含む、ことを特徴とする請求項2に記載の符号変換方法。
Calculating a first squared error from the modified decoding gain and a gain read from the gain codebook;
Calculating a second squared error from the decoding gain and a gain read from the gain codebook;
Obtaining gain information in a second code string by selecting a gain that minimizes an evaluation function based on the first square error and the second square error from the gain codebook;
The code conversion method according to claim 2, comprising:
前記修正最適ゲインが、前記最適ゲインの長時間平均に基づくものである、ことを特徴とする請求項1又は3に記載の符号変換方法。The code conversion method according to claim 1, wherein the corrected optimal gain is based on a long-term average of the optimal gain. 前記修正復号ゲインが、前記復号ゲインの長時間平均に基づくものである、ことを特徴とする請求項2又は4に記載の符号変換方法。The code conversion method according to claim 2, wherein the modified decoding gain is based on a long-term average of the decoding gain. 前記第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離を最小とするゲインを、前記最適ゲインとして求める、ことを特徴とする請求項1に記載の符号変換方法。The gain that minimizes a distance between a second audio signal generated based on information obtained from the second code sequence and the first audio signal is obtained as the optimum gain. 2. The code conversion method according to 1. 前記評価関数が、前記第1の自乗誤差と前記第2の自乗誤差と重み係数とからなる、ことを特徴とする請求項3乃至7のいずれか一に記載の符号変換方法。The code conversion method according to any one of claims 3 to 7, wherein the evaluation function includes the first square error, the second square error, and a weight coefficient. 第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置において、
前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成する音声復号回路と、
第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づき、最適ゲインを計算する最適ゲイン計算回路と、
前記最適ゲインを修正する最適ゲイン修正回路と、
修正された最適ゲイン(「修正最適ゲイン」という)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるゲイン符号化回路と、
を含む、ことを特徴とする符号変換装置。
In a code conversion device that converts a first code string compliant with the first method into a second code string compliant with the second method,
By obtaining information of a first linear prediction coefficient and an excitation signal from the first code string and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal, the first An audio decoding circuit that generates an audio signal of
An optimum gain calculation circuit that calculates an optimum gain based on a second audio signal generated based on information obtained from a second code string and the first audio signal;
An optimum gain correction circuit for correcting the optimum gain,
A gain coding circuit for obtaining gain information in a second code sequence based on a corrected optimum gain (referred to as “corrected optimum gain”), the optimum gain, and a gain read from a gain codebook in the second method. When,
A transcoding device comprising:
第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置において、
前記第1の符号列からゲイン情報を復号するゲイン復号回路と、
復号されたゲイン(「復号ゲイン」という)を修正する復号ゲイン修正回路と、
修正された復号ゲイン(「修正復号ゲイン」という)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求めるゲイン符号化回路、
を含む、ことを特徴とする符号変換装置。
In a code conversion device that converts a first code string compliant with the first method into a second code string compliant with the second method,
A gain decoding circuit for decoding gain information from the first code string;
A decoding gain correction circuit for correcting the decoded gain (referred to as “decoding gain”);
Gain coding circuit for obtaining gain information in a second code sequence based on a corrected decoding gain (referred to as “corrected decoding gain”), the decoding gain, and a gain read from a gain codebook in the second method. ,
A transcoding device comprising:
前記ゲイン符号化回路が、
前記修正最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める手段を備えている、
ことを特徴とする請求項9に記載の符号変換装置。
The gain encoding circuit,
Calculating a first squared error from the corrected optimal gain and the gain read from the gain codebook; calculating a second squared error from the optimal gain and the gain read from the gain codebook; Means for obtaining gain information in the second code sequence by selecting a gain that minimizes an evaluation function based on the first squared error and the second squared error from the gain codebook,
The transcoder according to claim 9, wherein:
前記ゲイン符号化回路が、
前記修正復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める手段を備えている、ことを特徴とする請求項10に記載の符号変換装置。
The gain encoding circuit,
Calculating a first squared error from the corrected decoding gain and the gain read from the gain codebook; calculating a second squared error from the decoded gain and the gain read from the gain codebook; Means for obtaining gain information in a second code sequence by selecting a gain that minimizes an evaluation function based on the first square error and the second square error from the gain codebook. The transcoder according to claim 10, wherein:
前記修正最適ゲインが、前記最適ゲインの長時間平均に基づくものである、ことを特徴とする請求項9又は11に記載の符号変換装置。The transcoder according to claim 9, wherein the corrected optimal gain is based on a long-term average of the optimal gain. 前記修正復号ゲインが、前記復号ゲインの長時間平均に基づくものである、ことを特徴とする請求項10又は12に記載の符号変換装置。13. The transcoder according to claim 10, wherein the modified decoding gain is based on a long-term average of the decoding gain. 前記最適ゲイン計算回路が、前記第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離を最小とするゲインを前記最適ゲインとして出力する、ことを特徴とする請求項9に記載の符号変換装置。The optimal gain calculation circuit outputs a gain that minimizes a distance between a second audio signal generated based on information obtained from the second code string and the first audio signal as the optimal gain, The transcoder according to claim 9, wherein: 前記評価関数が、前記第1の自乗誤差と前記第2の自乗誤差と重み係数とからなる、ことを特徴とする請求項10乃至14のいずれか一に記載の符号変換装置。The code conversion device according to claim 10, wherein the evaluation function includes the first square error, the second square error, and a weight coefficient. 第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置を構成するコンピュータに、
(a)前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成する処理と、
(b)第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号とに基づき最適ゲインを計算する処理と、
(c)前記最適ゲインを修正する処理と、
(d)修正された最適ゲイン(「修正最適ゲイン」という)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める処理、
を実行させるためのプログラム。
A computer that constitutes a code conversion device that converts a first code string compliant with the first method into a second code string compliant with the second method,
(A) Obtaining information of a first linear prediction coefficient and an excitation signal from the first code string, and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal. Generating a first audio signal by
(B) a process of calculating an optimal gain based on a second audio signal generated based on information obtained from a second code sequence and the first audio signal;
(C) processing for correcting the optimum gain;
(D) a process of obtaining gain information in a second code string based on a corrected optimum gain (referred to as “corrected optimum gain”), the optimum gain, and a gain read from a gain codebook in the second method. ,
The program to execute.
第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置を構成するコンピュータに、
(a)前記第1の符号列からゲイン情報を復号する処理と、
(b)復号されたゲイン(「復号ゲイン」という)を修正する処理と、
(c)修正された復号ゲイン(「修正復号ゲイン」という)と、前記復号ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める処理、
を実行させるためのプログラム。
A computer that constitutes a code conversion device that converts a first code string compliant with the first method into a second code string compliant with the second method,
(A) decoding gain information from the first code string;
(B) processing for correcting the decoded gain (referred to as “decoding gain”);
(C) a process of obtaining gain information in a second code string based on a corrected decoding gain (referred to as “corrected decoding gain”), the decoding gain, and a gain read from a gain codebook in the second method. ,
The program to execute.
請求項17に記載のプログラムにおいて、
前記修正最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記最適ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める処理、を前記コンピュータに実行させるためのプログラム。
The program according to claim 17,
Calculating a first squared error from the corrected optimal gain and the gain read from the gain codebook; calculating a second squared error from the optimal gain and the gain read from the gain codebook; Causing the computer to execute a process of obtaining gain information in a second code string by selecting a gain that minimizes an evaluation function based on the first square error and the second square error from the gain codebook. Program.
請求項18に記載のプログラムにおいて、
前記修正復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第1の自乗誤差を計算し、前記復号ゲインと、前記ゲインコードブックから読み出されるゲインとから第2の自乗誤差を計算し、前記第1の自乗誤差と前記第2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択することによって第2の符号列におけるゲイン情報を求める処理、を前記コンピュータに実行させるためのプログラム。
The program according to claim 18,
Calculating a first squared error from the corrected decoding gain and the gain read from the gain codebook; calculating a second squared error from the decoded gain and the gain read from the gain codebook; Causing the computer to execute a process of obtaining gain information in a second code string by selecting a gain that minimizes an evaluation function based on the first square error and the second square error from the gain codebook. Program.
請求項17又は19に記載のプログラムにおいて、
前記修正最適ゲインが、前記最適ゲインの長時間平均に基づくものである、ことを特徴とするプログラム。
The program according to claim 17 or 19,
The program wherein the corrected optimal gain is based on a long-term average of the optimal gain.
請求項18又は20に記載のプログラムにおいて、
前記修正復号ゲインが、前記復号ゲインの長時間平均に基づくものである、ことを特徴とするプログラム。
The program according to claim 18, wherein
The program wherein the modified decoding gain is based on a long-term average of the decoding gain.
請求項18乃至22のいずれか一に記載のプログラムにおいて、
前記第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離を最小とするゲインを前記最適ゲインとして求める処理、を前記コンピュータに実行させるためのプログラム。
The program according to any one of claims 18 to 22,
Causing the computer to execute, as the optimum gain, a process of obtaining a gain that minimizes a distance between a second audio signal generated based on information obtained from the second code string and the first audio signal. Program.
請求項17乃至22のいずれか一に記載のプログラムにおいて、
前記評価関数が、前記第1の自乗誤差と前記第2の自乗誤差と重み係数とからなる、ことを特徴とするプログラム。
The program according to any one of claims 17 to 22,
A program, wherein the evaluation function comprises the first square error, the second square error, and a weight coefficient.
請求項17乃至請求項23のいずれか一に記載の前記プログラムを記録した記録媒体。A recording medium recording the program according to any one of claims 17 to 23. 第1の方式で音声信号を符号化した符号を多重してなる符号列データを符号分離回路に入力し、前記符号分離回路にて分離された符号に基づき、前記第1の方式とは別の第2の方式に準拠する符号に変換し、該変換された符号を符号多重回路に供給し、前記符号多重回路から前記変換された符号を多重してなる符号列データを出力する符号変換装置において、
前記符号分離回路で分離された線形予測係数符号に基づき、第1の方式と第2の方式で復号してなる第1、第2の線形予測係数を生成する回路と、
前記符号分離回路から入力した第1の方式の適応コードブック(ACB)符号を、第1の方式における符号と第2の方式における符号との対応関係を用いて読み替えることにより第2の方式のACB符号を得、前記符号多重回路へ出力し、前記第2のACB符号に対応するACB遅延を第2のACB遅延として目標信号計算回路へ出力する手段を含む適応コードブック符号変換回路(「ACB符号変換回路」という)と、
前記符号分離回路で分離された第1の方式におけるACB符号、固定コードブック(FCB)符号及びゲイン符号を含む励振信号情報を入力として受け取ってそれぞれを復号し、前記符号分離回路で分離された線形予測係数符号に基づき第1の方式で復号してなる第1の線形予測係数をもつ合成フィルタを、前記励振信号情報から得られる励振信号で駆動することで、復号音声信号を合成して出力する音声復号回路と、
前記符号分離回路から出力される第1の方式のFCB符号を入力し、前記FCB符号を第2の方式により復号可能な符号に変換し、前記変換したFCB符号を、第2のFCB符号として前記符号多重回路へ出力し、前記第2のFCB符号に対応する第2のFCB信号を出力する固定コードブック符号生成回路(「FCB符号生成回路」という)と、
前記第1の線形予測係数と前記第2の線形予測係数から構成される聴感重み付け合成フィルタのインパルス応答信号を出力するインパルス応答計算回路と、
前記目標信号計算回路と、
ゲイン符号生成回路と、
を備え、
前記目標信号計算回路は、
前記音声復号回路の合成フィルタから出力される復号音声を入力し、前記第1の線形予測係数を用いて構成される聴感重み付けフィルタを前記復号音声で駆動して聴感重み付け音声信号を生成するとともに、前記第1及び第2の線形予測係数を用いて構成される聴感重み付け合成フィルタの零入力応答を、前記聴感重み付け音声信号から減算して得られる第1の目標信号を生成する重み付け信号計算回路と、
前記重み付け信号計算回路から出力される前記第1の目標信号と、前記ACB符号変換回路から出力される前記第2のACB遅延と、前記インパルス応答計算回路から出力される前記インパルス応答信号と、過去の第2の励振信号を記憶保持する第2の励振信号記憶回路から出力される過去の第2の励振信号とを入力し、前記過去の第2の励振信号から、遅延k(ただし、kは前記第2のACB遅延)で切り出された信号と前記インパルス応答信号との畳み込みにより、フィルタ処理された遅延kの過去の励振信号を計算して第2のACB信号として出力するACB信号生成回路と、
前記重み付け信号計算回路から出力される前記第1の目標信号と、前記ACB信号生成回路から出力される、前記フィルタ処理された遅延kの過去の励振信号とを入力し、前記第1の目標信号と、前記フィルタ処理された遅延kの過去の励振信号とから、最適ACBゲインを導出して出力する最適ACBゲイン計算回路と、
を備え、
前記ゲイン符号生成回路は、
前記目標信号計算回路から出力される、前記第1の目標信号と、前記第2のACB信号と、前記最適ACBゲインと、前記FCB符号生成回路から出力される前記第2のFCB信号と、前記インパルス応答計算回路から出力される前記インパルス応答信号と、前記第1の線形予測係数とを入力し、
前記第1の目標信号と前記第2のACB信号と前記最適ACBゲインと前記インパルス応答信号とから第2の目標信号を計算し、前記第2の目標信号と、前記第2のFCB信号と前記インパルス応答信号とから最適FCBゲインを計算する手段と、
前記最適ACBゲインから修正ACBゲインを求める手段と、
前記計算された最適FCBゲインを入力し、前記最適FCBゲインから修正FCBゲインを計算する手段と、
前記第1の線形予測係数から音声判定値を決定する手段と、
ACBゲインコードブックから順次読み込まれるACBゲインと、前記最適ACBゲインとから第1の自乗誤差を計算し、前記ACBゲインと前記修正ACBゲインとから第2の自乗誤差を計算する手段と、
前記音声判定値から計算される重み係数と、前記第1の自乗誤差と前記第2の自乗誤差とから計算される第1の評価関数を最小とするACBゲイン及び対応するACBゲイン符号を選択する手段と、
FCBゲインコードブックから順次読み込まれるFCBゲインと前記最適FCBゲインとから第3の自乗誤差を計算し、前記FCBゲインと前記修正FCBゲインとから第4の自乗誤差を計算する手段と、
前記音声判定値から計算される重み係数と第3の自乗誤差と第4の自乗誤差とから計算される第2の評価関数を最小とするFCBゲイン及び対応するFCBゲイン符号を選択する手段と、
選択されたACBゲイン符号とFCBゲイン符号とからなる第2のゲイン符号を、第2の方式におけるゲイン復号方法により復号可能な符号として前記符号多重回路出力する手段と、
を備えている、ことを特徴とする符号変換装置。
Code string data obtained by multiplexing a code obtained by encoding an audio signal by the first method is input to a code separation circuit, and based on the code separated by the code separation circuit, a different code string from the first method is used. A code conversion device that converts the converted code into a code conforming to the second system, supplies the converted code to a code multiplexing circuit, and outputs code string data obtained by multiplexing the converted code from the code multiplexing circuit. ,
A circuit that generates first and second linear prediction coefficients obtained by decoding in a first method and a second method based on the linear prediction coefficient code separated by the code separation circuit;
The adaptive codebook (ACB) code of the first system input from the code separation circuit is read by using the correspondence between the code of the first system and the code of the second system, thereby obtaining the ACB of the second system. An adaptive codebook code conversion circuit (“ACB code”) including means for obtaining a code, outputting the code to the code multiplexing circuit, and outputting an ACB delay corresponding to the second ACB code to the target signal calculation circuit as a second ACB delay. Conversion circuit))
Excitation signal information including an ACB code, a fixed codebook (FCB) code, and a gain code in the first scheme separated by the code separation circuit is received as an input, and each is decoded, and the linear signal separated by the code separation circuit is decoded. By driving a synthesis filter having a first linear prediction coefficient obtained by decoding in a first method based on the prediction coefficient code with an excitation signal obtained from the excitation signal information, a decoded speech signal is synthesized and output. An audio decoding circuit;
A FCB code of a first system output from the code separation circuit is input, the FCB code is converted into a code that can be decoded by a second system, and the converted FCB code is used as a second FCB code. A fixed codebook code generation circuit (referred to as “FCB code generation circuit”) that outputs to the code multiplexing circuit and outputs a second FCB signal corresponding to the second FCB code;
An impulse response calculation circuit that outputs an impulse response signal of an auditory weighting synthesis filter composed of the first linear prediction coefficient and the second linear prediction coefficient;
The target signal calculation circuit;
A gain code generation circuit;
With
The target signal calculation circuit,
A decoded speech output from the synthesis filter of the speech decoding circuit is input, and an auditory weighting filter configured using the first linear prediction coefficient is driven by the decoded speech to generate an auditory weighted speech signal, A weighting signal calculation circuit for generating a first target signal obtained by subtracting the quiescent response of the audibility weighting synthesis filter configured using the first and second linear prediction coefficients from the audibility weighted speech signal; ,
The first target signal output from the weighting signal calculation circuit, the second ACB delay output from the ACB code conversion circuit, the impulse response signal output from the impulse response calculation circuit, And a past second excitation signal output from a second excitation signal storage circuit that stores and holds the second excitation signal of the above, and a delay k (where k is An ACB signal generation circuit that calculates a past excitation signal of a filtered delay k by convolution of the signal cut out by the second ACB delay) and the impulse response signal, and outputs the same as a second ACB signal; ,
Inputting the first target signal output from the weighting signal calculation circuit and the past excitation signal of the filtered delay k output from the ACB signal generation circuit, the first target signal An optimal ACB gain calculating circuit for deriving and outputting an optimal ACB gain from the past excitation signal of the filtered delay k,
With
The gain code generation circuit includes:
The first target signal, the second ACB signal, the optimum ACB gain, the second FCB signal output from the FCB code generation circuit, and the first target signal output from the target signal calculation circuit; Inputting the impulse response signal output from the impulse response calculation circuit and the first linear prediction coefficient,
Calculating a second target signal from the first target signal, the second ACB signal, the optimum ACB gain, and the impulse response signal, and calculating the second target signal, the second FCB signal, Means for calculating an optimal FCB gain from the impulse response signal;
Means for obtaining a corrected ACB gain from the optimum ACB gain;
Means for inputting the calculated optimal FCB gain and calculating a corrected FCB gain from the optimal FCB gain;
Means for determining a speech determination value from the first linear prediction coefficient;
Means for calculating a first squared error from an ACB gain sequentially read from an ACB gain codebook and the optimum ACB gain, and calculating a second squared error from the ACB gain and the corrected ACB gain;
An ACB gain and a corresponding ACB gain code that minimize a first evaluation function calculated from the weight coefficient calculated from the speech determination value, the first square error, and the second square error are selected. Means,
Means for calculating a third squared error from the FCB gain sequentially read from the FCB gain codebook and the optimum FCB gain, and calculating a fourth squared error from the FCB gain and the corrected FCB gain;
Means for selecting an FCB gain and a corresponding FCB gain code that minimize the second evaluation function calculated from the weight coefficient, the third square error, and the fourth square error calculated from the voice determination value;
Means for outputting a second gain code composed of the selected ACB gain code and FCB gain code as a code decodable by the gain decoding method in the second method, to the code multiplexing circuit;
A transcoder comprising:
前記目標信号計算回路から出力される第2のACB信号と、前記FCB符号生成回路から出力される第2のFCB信号と、前記ゲイン符号生成回路から出力される第2のACBゲインと第2のFCBゲインとを入力し、前記第2のACB信号に第2のACBゲインを乗じて得た信号と、前記第2のFCB信号に第2のFCBゲインを乗じて得た信号と、を加算して第2の励振信号を得、前記第2の励振信号を前記第2の励振信号記憶回路へ出力する第2の励振信号計算回路を備え、
前記第2の励振信号記憶回路は、前記第2の励振信号計算回路から出力される第2の励振信号を入力し、これを記憶保持し、過去に入力されて記憶保持されている第2の励振信号を前記目標信号計算回路へ出力する、ことを特徴とする請求項26記載の符号変換装置。
A second ACB signal output from the target signal calculation circuit; a second FCB signal output from the FCB code generation circuit; a second ACB gain output from the gain code generation circuit; An FCB gain is input, a signal obtained by multiplying the second ACB signal by a second ACB gain, and a signal obtained by multiplying the second FCB signal by a second FCB gain are added. A second excitation signal calculation circuit that obtains a second excitation signal through the second excitation signal and outputs the second excitation signal to the second excitation signal storage circuit.
The second excitation signal storage circuit inputs the second excitation signal output from the second excitation signal calculation circuit, stores and holds the second excitation signal, and stores the second excitation signal that has been input and stored in the past. 27. The transcoder according to claim 26, wherein an excitation signal is output to the target signal calculation circuit.
前記ゲイン符号生成回路は、
前記ACB信号生成回路から出力される前記第2のACB信号と、前記重み付け信号計算回路から出力される前記第1の目標信号と、前記インパルス応答計算回路から出力される前記インパルス応答信号と、前記ACBゲイン符号化回路から出力される前記第2のACBゲインとを入力し、前記第2のACB信号と前記インパルス応答信号との畳み込みにより、フィルタ処理された第2のACB信号を計算し、前記フィルタ処理された第2のACB信号に前記第2のACBゲインを乗じて得られる信号を、前記第1の目標信号から減算して第2の目標信号を導出し前記第2の目標信号を出力する第2の目標信号計算回路と、
前記FCB信号生成回路から出力される前記第2のFCB信号と、前記インパルス応答計算回路から出力される前記インパルス応答信号と、前記第2の目標信号計算回路から出力される前記第2の目標信号とを入力し、前記第2のFCB信号とインパルス応答信号との畳み込みにより、フィルタ処理された第2のFCB信号を計算し、前記第2の目標信号と前記第2のFCB信号との距離を最小とする最適FCBゲインを計算する最適FCBゲイン計算回路と、
前記第1の線形予測係数とその長時間平均とから線形予測係数の変動量を計算し音声判定値を決定する音声/非音声識別回路と、
前記ACB信号生成回路から出力される前記最適ACBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、前記音声判定値が非音声区間のとき、前記最適ACBゲインの長時間平均を修正ACBゲインとして非音声区間において前記最適ACBゲインの長時間平均を計算し、音声区間のとき、前記最適ACBゲインそのものを修正ACBゲインとして出力する、最適ACBゲイン修正回路と、
前記ACB信号生成回路から出力される前記最適ACBゲインと、前記最適ACBゲイン修正回路から出力される前記修正ACBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、前記ACBゲインコードブックから順次読み込まれるACBゲインと、前記最適ACBゲインとから第1の自乗誤差を計算し、前記ACBゲインと前記修正ACBゲインとから第2の自乗誤差を計算し、前記音声判定値から計算される重み係数と、前記第1の自乗誤差と、前記第2の自乗誤差とから評価関数を求め、前記評価関数が最小となるACBゲインを選択し、選択された前記ACBゲインを第2のACBゲインとして前記第2の目標信号計算回路へ出力するとともに、前記第2の励振信号計算回路へ出力し、前記第2のACBゲインに対応する符号をACBゲイン符号としてゲイン符号多重化回路へ出力するACB符号ゲイン符号化回路と、
前記最適FCBゲイン計算回路から出力される前記最適FCBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、前記音声判定値が非音声区間のとき、前記最適FCBゲインの長時間平均を修正FCBゲインとし、前記音声判定値が音声区間のとき、最適FCBゲインそのものを修正FCBゲインとし、前記修正FCBゲインをFCBゲイン符号化回路へ出力する最適FCBゲイン修正回路と、
前記最適FCBゲイン計算回路から出力される前記最適FCBゲインと、前記最適FCBゲイン修正回路から出力される前記修正FCBゲインと、前記音声/非音声識別回路から出力される前記音声判定値を入力し、前記FCBゲインコードブックから順次読み込まれるFCBゲインと、前記最適FCBゲインとから第3の自乗誤差を計算し、前記FCBゲインと前記修正FCBゲインとから第4の自乗誤差を計算し、前記音声判定値から計算される重み係数と前記第3の自乗誤差と前記第4の自乗誤差とから評価関数を計算し、前記評価関数が最小となるFCBゲインを選択し、選択された前記FCBゲインを第2のFCBゲインとして前記第2の励振信号計算回路へ出力し、第2のFCBゲインに対応する符号をFCBゲイン符号としてゲイン符号多重化回路へ出力するFCBゲイン符号化回路と、
前記ACBゲイン符号化回路から出力されるACBゲイン符号と、前記FCBゲイン符号化回路から出力されるFCBゲイン符号とを入力し、ACBゲイン符号とFCBゲイン符号とを多重化して得られる第2のゲイン符号を、第2の方式におけるゲイン復号方法により復号可能な符号として前記符号多重回路へ出力するゲイン符号多重回路と、
を備えている、ことを特徴とする請求項26記載の符号変換装置。
The gain code generation circuit includes:
The second ACB signal output from the ACB signal generation circuit, the first target signal output from the weighting signal calculation circuit, the impulse response signal output from the impulse response calculation circuit, Receiving the second ACB gain output from the ACB gain encoding circuit, calculating a filtered second ACB signal by convolution of the second ACB signal and the impulse response signal, A signal obtained by multiplying the filtered second ACB signal by the second ACB gain is subtracted from the first target signal to derive a second target signal and output the second target signal. A second target signal calculation circuit,
The second FCB signal output from the FCB signal generation circuit, the impulse response signal output from the impulse response calculation circuit, and the second target signal output from the second target signal calculation circuit And calculates the filtered second FCB signal by convolution of the second FCB signal and the impulse response signal, and calculates the distance between the second target signal and the second FCB signal. An optimum FCB gain calculation circuit for calculating an optimum FCB gain to be minimized,
A speech / non-speech discrimination circuit that calculates a variation amount of the linear prediction coefficient from the first linear prediction coefficient and its long-term average to determine a speech determination value;
The optimum ACB gain output from the ACB signal generation circuit and the voice determination value output from the voice / non-voice discrimination circuit are input, and when the voice determination value is in a non-voice section, the optimum ACB gain is An optimal ACB gain correction circuit that calculates a long-term average of the optimum ACB gain in a non-voice section as a corrected ACB gain in a non-voice section, and outputs the optimum ACB gain itself as a corrected ACB gain in a voice section;
The optimum ACB gain output from the ACB signal generation circuit, the corrected ACB gain output from the optimum ACB gain correction circuit, and the voice determination value output from the voice / non-voice identification circuit are input. Calculating a first squared error from the ACB gain sequentially read from the ACB gain codebook and the optimum ACB gain, calculating a second squared error from the ACB gain and the corrected ACB gain, An evaluation function is obtained from a weight coefficient calculated from a determination value, the first square error, and the second square error, and an ACB gain that minimizes the evaluation function is selected, and the selected ACB gain is selected. As a second ACB gain to the second target signal calculation circuit, and to the second excitation signal calculation circuit to output the second ACB gain. And ACB code gain encoding circuit for outputting a code corresponding to the B gain to the gain code multiplexing circuit as ACB gain code,
The optimum FCB gain output from the optimum FCB gain calculation circuit and the voice determination value output from the voice / non-voice discrimination circuit are input. When the voice determination value is in a non-voice section, the optimum FCB gain is output. An optimal FCB gain correction circuit that outputs a corrected FCB gain to an FCB gain encoding circuit when the long-term average of the gain is a corrected FCB gain, and when the voice determination value is a voice section, the optimum FCB gain itself is a corrected FCB gain; ,
The optimum FCB gain output from the optimum FCB gain calculation circuit, the corrected FCB gain output from the optimum FCB gain correction circuit, and the voice determination value output from the voice / non-voice identification circuit are input. Calculating a third squared error from the FCB gain sequentially read from the FCB gain codebook and the optimal FCB gain, calculating a fourth squared error from the FCB gain and the corrected FCB gain, An evaluation function is calculated from the weight coefficient calculated from the determination value, the third square error, and the fourth square error, an FCB gain that minimizes the evaluation function is selected, and the selected FCB gain is calculated. The signal is output to the second excitation signal calculation circuit as a second FCB gain, and a code corresponding to the second FCB gain is used as an FCB gain code. And FCB gain encoding circuit to output to the in code multiplexing circuit,
A second ACB gain code obtained by inputting an ACB gain code output from the ACB gain coding circuit and an FCB gain code output from the FCB gain coding circuit, and multiplexing the ACB gain code and the FCB gain code. A gain code multiplexing circuit that outputs a gain code to the code multiplexing circuit as a code that can be decoded by the gain decoding method in the second method;
The transcoder according to claim 26, comprising:
第1の方式で音声信号を符号化した符号を多重してなる符号列データを符号分離回路に入力し、前記符号分離回路にて分離された符号に基づき、前記第1の方式とは別の第2の方式に準拠する符号に変換し、該変換された符号を符号多重回路に供給し、前記符号多重回路から前記変換された符号を多重してなる符号列データを出力する符号変換装置において、
前記符号分離回路で分離された線形予測係数符号に基づき、第1の方式と第2の方式で復号してなる第1、第2の線形予測係数を生成する回路と、
前記符号分離回路から出力される第1のACB符号を入力し、前記第1のACB符号を第2の方式により復号可能な符号に変換し、変換されたACB符号を、第2のACB符号として前記符号多重回路へ出力するACB符号変換回路と、
前記符号分離回路から出力される第1のFCB符号を入力し、前記第1のFCB符号を第2の方式により復号可能な符号に変換し、変換されたFCB符号を、第2のFCB符号として前記符号多重回路へ出力するFCB符号変換回路と、
前記符号分離回路から出力される第1のゲイン符号を入力し、前記第1のゲイン符号を第2の方式により復号可能な符号に変換し、変換されたゲイン符号を、第2のゲイン符号として前記符号多重回路へ出力するゲイン符号変換回路と、
を備え、
前記ゲイン符号変換回路が、
前記符号分離回路から出力される第1のゲイン符号と、前記第1の線形予測係数とを入力し、前記第1のゲイン符号を、第1の方式におけるゲイン復号方法により復号して得られる第1の適応コードブック(ACB)ゲイン及び第1の固定コードブック(FCB)ゲインから、修正ACBゲイン及び修正FCBゲインを計算する手段と、
前記第1の線形予測係数から音声判定値を決定する手段と、
ACBゲインコードブックから順次読み込まれるACBゲインと、前記第1のACBゲインとから第1の自乗誤差を計算し、前記ACBゲインと前記修正ACBゲインとから第2の自乗誤差を計算し、前記音声判定値から計算される重み係数と、前記第1の自乗誤差と、前記第2の自乗誤差とから計算される第1の評価関数が最小となるACBゲイン及び対応するACBゲイン符号を選択する手段と、
FCBゲインコードブックから順次読み込まれるFCBゲインと前記第1のFCBゲインとから第3の自乗誤差を計算し、FCBゲインと前記修正FCBゲインとから第4の自乗誤差を計算し、前記音声判定値から計算される重み係数と、前記第3の自乗誤差と、前記第4の自乗誤差とから計算される第2の評価関数を最小とするFCBゲイン及び対応するFCBゲイン符号を選択する手段と、
選択された前記ACBゲイン符号と前記FCBゲイン符号とからなる第2のゲイン符号を、第2の方式におけるゲイン復号方法により復号可能な符号として符号多重回路へ出力する手段と、
を備えている、ことを特徴とする符号変換装置。
Code string data obtained by multiplexing a code obtained by encoding an audio signal by the first method is input to a code separation circuit, and based on the code separated by the code separation circuit, a different code string from the first method is used. A code conversion device that converts the converted code into a code conforming to the second system, supplies the converted code to a code multiplexing circuit, and outputs code string data obtained by multiplexing the converted code from the code multiplexing circuit. ,
A circuit that generates first and second linear prediction coefficients obtained by decoding in a first method and a second method based on the linear prediction coefficient code separated by the code separation circuit;
A first ACB code output from the code separation circuit is input, the first ACB code is converted into a code decodable by a second method, and the converted ACB code is used as a second ACB code. An ACB code conversion circuit for outputting to the code multiplexing circuit;
A first FCB code output from the code separation circuit is input, the first FCB code is converted into a code that can be decoded by a second method, and the converted FCB code is used as a second FCB code. An FCB code conversion circuit for outputting to the code multiplexing circuit;
A first gain code output from the code separation circuit is input, the first gain code is converted into a code that can be decoded by a second method, and the converted gain code is used as a second gain code. A gain code conversion circuit that outputs to the code multiplexing circuit;
With
The gain code conversion circuit,
A first gain code output from the code separation circuit and the first linear prediction coefficient are input, and a first gain code obtained by decoding the first gain code by a gain decoding method in a first scheme is obtained. Means for calculating a modified ACB gain and a modified FCB gain from the one adaptive codebook (ACB) gain and the first fixed codebook (FCB) gain;
Means for determining a speech determination value from the first linear prediction coefficient;
Calculating a first squared error from the ACB gain sequentially read from the ACB gain codebook and the first ACB gain; calculating a second squared error from the ACB gain and the corrected ACB gain; Means for selecting an ACB gain and a corresponding ACB gain code that minimize a first evaluation function calculated from a weight coefficient calculated from a determination value, the first square error, and the second square error When,
Calculating a third squared error from the FCB gain sequentially read from the FCB gain codebook and the first FCB gain; calculating a fourth squared error from the FCB gain and the corrected FCB gain; Means for selecting an FCB gain and a corresponding FCB gain code that minimize a second evaluation function calculated from the weighting factor calculated from the third squared error and the fourth squared error, and
Means for outputting to the code multiplexing circuit a second gain code composed of the selected ACB gain code and the FCB gain code as a code decodable by a gain decoding method in a second method;
A transcoder comprising:
前記ゲイン符号変換回路が、
前記第1の線形予測係数とその長時間平均とから線形予測係数の変動量を計算し音声判定値を決定する音声/非音声識別回路と、
前記符号分離回路から出力される第1のゲイン符号を入力し、第1のゲイン符号からACBゲイン及びFCBゲインに対応する第1のACBゲイン符号及び第1のFCBゲイン符号を分離し、第1のACBゲイン符号をACBゲイン復号回路へ出力し、第1のFCBゲイン符号をFCBゲイン復号回路へ出力するゲイン符号分離回路と、
複数セットのACBゲインが格納されたACBゲインコードブックを備えており、前記ゲイン符号分離回路から出力される第1のACBゲイン符号を入力し、前記第1のACBゲイン符号に対応するACBゲインを第1のACBゲインコードブックより読み出し、読み出されたACBゲインを第1のACBゲインとしてACBゲイン修正回路へ出力するとともに、ACBゲイン符号化回路へ出力し、ACBゲイン符号からのACBゲインの復号は、第1の方式におけるACBゲインの復号方法に従い、第1の方式のACBゲインコードブックを用いるACBゲイン復号回路と、
複数セットのFCBゲインが格納されたFCBゲインコードブックを備えており、前記ゲイン符号分離回路から出力される第1のFCBゲイン符号を入力し、前記第1のFCBゲイン符号に対応するFCBゲインを第1のFCBゲインコードブックより読み出し、読み出されたFCBゲインを第1のFCBゲインとしてFCBゲイン修正回路へ出力するとともに、FCBゲイン符号化回路へ出力し、FCBゲイン符号からのFCBゲインの復号は、第1の方式におけるFCBゲインの復号方法に従い、第1の方式のFCBゲインコードブックを用いるFCBゲイン復号回路と、
前記ACBゲイン復号回路から出力される前記第1のACBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、前記音声判定値が非音声区間のとき、前記第1のACBゲインの長時間平均を修正ACBゲインとし、音声区間のとき、前記第1のACBゲインそのものを修正ACBゲインとし、前記修正ACBゲインをACBゲイン符号化回路へ出力するACBゲイン修正回路と、
前記FCBゲイン復号回路から出力される前記第1のFCBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、前記音声判定値が非音声区間のとき、前記第1のFCBゲインの長時間平均を修正FCBゲインとし、前記音声判定値が音声区間のとき、前記第1のFCBゲインそのものを修正FCBゲインとし、前記修正FCBゲインをFCBゲイン符号化回路へ出力するFCBゲイン修正回路と、
前記ACBゲイン復号回路から出力される前記第1のACBゲインと、前記ACBゲイン修正回路から出力される前記修正ACBゲインと、前記音声/非音声識別回路から出力される音声判定値とを入力し、前記ACBゲインコードブックから順次読み込まれるACBゲインと第1のACBゲインとから第1の自乗誤差を計算し、前記ACBゲインと前記修正ACBゲインとから第2の自乗誤差を計算し、前記音声判定値から計算される重み係数と、前記第1の自乗誤差と、前記第2の自乗誤差とから第1の評価関数を計算し、前記第1の評価関数が最小となるACBゲインを選択し、選択された前記ACBゲインを第2のACBゲインとし、前記第2のACBゲインに対応する符号を第2のACBゲイン符号としてゲイン符号多重化回路へ出力するACBゲイン符号化回路と、
前記FCBゲイン復号回路から出力される前記第1のFCBゲインと、前記FCBゲイン修正回路から出力される前記修正FCBゲインと、前記音声/非音声識別回路から出力される前記音声判定値とを入力し、FCBゲインコードブックから順次読み込まれるFCBゲインと前記第1のFCBゲインとから第3の自乗誤差を計算し、前記FCBゲインと前記修正FCBゲインとから第4の自乗誤差を計算し、前記音声判定値から計算される重み係数と、前記第3の自乗誤差と、前記第4の自乗誤差とから第2の評価関数を計算し、前記第2の評価関数が最小となるFCBゲインを選択し、選択された前記FCBゲインを第2のFCBゲインとし、第2のFCBゲインに対応する符号を第2のFCBゲイン符号としてゲイン符号多重化回路へ出力するFCBゲイン符号化回路と、
前記ACBゲイン符号化回路から出力されるACBゲイン符号と、前記FCBゲイン符号化回路から出力されるFCBゲイン符号とを入力し、ACBゲイン符号とFCBゲイン符号とを多重化して得られる第2のゲイン符号を、第2の方式におけるゲイン復号方法により復号可能な符号として前記符号多重回路へ出力するゲイン符号多重回路と、
を備えている、ことを特徴とする請求項29記載の符号変換装置。
The gain code conversion circuit,
A speech / non-speech discrimination circuit that calculates a variation amount of the linear prediction coefficient from the first linear prediction coefficient and its long-term average to determine a speech determination value;
A first gain code output from the code separation circuit is input, and a first ACB gain code and a first FCB gain code corresponding to an ACB gain and an FCB gain are separated from the first gain code, and the first gain code is separated from the first gain code. A gain code separating circuit that outputs the ACB gain code to the ACB gain decoding circuit and outputs the first FCB gain code to the FCB gain decoding circuit;
An ACB gain codebook in which a plurality of sets of ACB gains are stored, a first ACB gain code output from the gain code separation circuit is input, and an ACB gain corresponding to the first ACB gain code is input. The ACB gain is read from the first ACB gain codebook, and the read ACB gain is output to the ACB gain correction circuit as the first ACB gain, and is also output to the ACB gain encoding circuit to decode the ACB gain from the ACB gain code. An ACB gain decoding circuit that uses the ACB gain codebook of the first scheme according to the ACB gain decoding method of the first scheme;
An FCB gain codebook storing a plurality of sets of FCB gains is provided, a first FCB gain code output from the gain code separation circuit is input, and an FCB gain corresponding to the first FCB gain code is input. Reading from the first FCB gain codebook, outputting the read FCB gain to the FCB gain correction circuit as the first FCB gain, and outputting the FCB gain to the FCB gain encoding circuit, and decoding the FCB gain from the FCB gain code Is an FCB gain decoding circuit that uses the FCB gain codebook of the first method according to the FCB gain decoding method of the first method;
The first ACB gain output from the ACB gain decoding circuit and the voice determination value output from the voice / non-voice identification circuit are input, and when the voice determination value is in a non-voice section, An ACB gain correction circuit that outputs the corrected ACB gain to an ACB gain encoding circuit while using the first ACB gain itself as a corrected ACB gain during a voice period; ,
The first FCB gain output from the FCB gain decoding circuit and the voice determination value output from the voice / non-voice identification circuit are input, and when the voice determination value is in a non-voice section, A long-term average of the FCB gains of 1 is a modified FCB gain, and when the voice judgment value is in a voice section, the first FCB gain itself is a modified FCB gain, and the modified FCB gain is output to an FCB gain encoding circuit. FCB gain correction circuit,
The first ACB gain output from the ACB gain decoding circuit, the corrected ACB gain output from the ACB gain correction circuit, and a voice determination value output from the voice / non-voice identification circuit are input. Calculating a first squared error from the ACB gain sequentially read from the ACB gain codebook and the first ACB gain, calculating a second squared error from the ACB gain and the corrected ACB gain, A first evaluation function is calculated from the weight coefficient calculated from the determination value, the first square error, and the second square error, and an ACB gain that minimizes the first evaluation function is selected. The selected ACB gain as a second ACB gain, and a code corresponding to the second ACB gain as a second ACB gain code to a gain code multiplexing circuit. And ACB gain encoding circuit for force,
The first FCB gain output from the FCB gain decoding circuit, the corrected FCB gain output from the FCB gain correction circuit, and the voice determination value output from the voice / non-voice identification circuit are input. Calculating a third squared error from the FCB gain sequentially read from the FCB gain codebook and the first FCB gain; calculating a fourth squared error from the FCB gain and the corrected FCB gain; A second evaluation function is calculated from the weight coefficient calculated from the voice determination value, the third squared error, and the fourth squared error, and an FCB gain that minimizes the second evaluation function is selected. Then, the selected FCB gain is set as a second FCB gain, and a code corresponding to the second FCB gain is set as a second FCB gain code to the gain code multiplexing circuit. And FCB gain encoding circuit to force,
A second ACB gain code obtained by inputting an ACB gain code output from the ACB gain coding circuit and an FCB gain code output from the FCB gain coding circuit, and multiplexing the ACB gain code and the FCB gain code. A gain code multiplexing circuit that outputs a gain code to the code multiplexing circuit as a code that can be decoded by the gain decoding method in the second method;
30. The transcoder according to claim 29, comprising:
JP2002215766A 2002-07-24 2002-07-24 Code conversion method and apparatus between speech coding and decoding systems and storage medium thereof Expired - Fee Related JP4238535B2 (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2002215766A JP4238535B2 (en) 2002-07-24 2002-07-24 Code conversion method and apparatus between speech coding and decoding systems and storage medium thereof
PCT/JP2003/008701 WO2004010416A1 (en) 2002-07-24 2003-07-09 Method and device for code conversion between voice encoding and decoding methods and storage medium thereof
CNB038176750A CN1327410C (en) 2002-07-24 2003-07-09 Method and apparatus for transcoding between different speech encoding/decoding systems and recording medium
US11/039,969 US7231345B2 (en) 2002-07-24 2005-01-24 Method and apparatus for transcoding between different speech encoding/decoding systems
US11/171,387 US7319953B2 (en) 2002-07-24 2005-07-01 Method and apparatus for transcoding between different speech encoding/decoding systems using gain calculations

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002215766A JP4238535B2 (en) 2002-07-24 2002-07-24 Code conversion method and apparatus between speech coding and decoding systems and storage medium thereof

Publications (2)

Publication Number Publication Date
JP2004061558A true JP2004061558A (en) 2004-02-26
JP4238535B2 JP4238535B2 (en) 2009-03-18

Family

ID=30767940

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002215766A Expired - Fee Related JP4238535B2 (en) 2002-07-24 2002-07-24 Code conversion method and apparatus between speech coding and decoding systems and storage medium thereof

Country Status (3)

Country Link
JP (1) JP4238535B2 (en)
CN (1) CN1327410C (en)
WO (1) WO2004010416A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007515676A (en) * 2003-12-10 2007-06-14 フランス テレコム Transcoding between indexes of multipulse dictionaries used for coding for digital signal compression

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006051673A1 (en) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reworking spectral values and encoders and decoders for audio signals
EP2980797A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146997A (en) * 1994-11-21 1996-06-07 Hitachi Ltd Device and system for code conversion
JP3331297B2 (en) * 1997-01-23 2002-10-07 株式会社東芝 Background sound / speech classification method and apparatus, and speech coding method and apparatus
JP2002198870A (en) * 2000-12-27 2002-07-12 Mitsubishi Electric Corp Echo processing device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007515676A (en) * 2003-12-10 2007-06-14 フランス テレコム Transcoding between indexes of multipulse dictionaries used for coding for digital signal compression

Also Published As

Publication number Publication date
JP4238535B2 (en) 2009-03-18
CN1327410C (en) 2007-07-18
CN1672192A (en) 2005-09-21
WO2004010416A1 (en) 2004-01-29

Similar Documents

Publication Publication Date Title
JP4550289B2 (en) CELP code conversion
JP3180762B2 (en) Audio encoding device and audio decoding device
JPH0353300A (en) Sound encoding and decoding system
JP4304360B2 (en) Code conversion method and apparatus between speech coding and decoding methods and storage medium thereof
JP3628268B2 (en) Acoustic signal encoding method, decoding method and apparatus, program, and recording medium
JP3582589B2 (en) Speech coding apparatus and speech decoding apparatus
JP4108317B2 (en) Code conversion method and apparatus, program, and storage medium
JP4231987B2 (en) Code conversion method between speech coding / decoding systems, apparatus, program, and storage medium
JP3063668B2 (en) Voice encoding device and decoding device
JP4793539B2 (en) Code conversion method and apparatus, program, and storage medium therefor
WO2014034697A1 (en) Decoding method, decoding device, program, and recording method thereof
JP3531780B2 (en) Voice encoding method and decoding method
US7319953B2 (en) Method and apparatus for transcoding between different speech encoding/decoding systems using gain calculations
JP4238535B2 (en) Code conversion method and apparatus between speech coding and decoding systems and storage medium thereof
JP4396524B2 (en) Code conversion method and apparatus
JP3583945B2 (en) Audio coding method
JPS6238500A (en) Highly efficient voice coding system and apparatus
EP1536413B1 (en) Method and device for voice code conversion
JP2001142499A (en) Speech encoding device and speech decoding device
JP2004151123A (en) Method and device for code conversion, and program and storage medium for the program
JP2000029499A (en) Voice coder and voice encoding and decoding apparatus
JP2003195899A (en) Encoding method for speech/sound signal and electronic device
JPH034300A (en) Voice encoding and decoding system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081125

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081208

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130109

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130109

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees