WO2007105587A1 - 固定符号帳探索装置および固定符号帳探索方法 - Google Patents

固定符号帳探索装置および固定符号帳探索方法 Download PDF

Info

Publication number
WO2007105587A1
WO2007105587A1 PCT/JP2007/054529 JP2007054529W WO2007105587A1 WO 2007105587 A1 WO2007105587 A1 WO 2007105587A1 JP 2007054529 W JP2007054529 W JP 2007054529W WO 2007105587 A1 WO2007105587 A1 WO 2007105587A1
Authority
WO
WIPO (PCT)
Prior art keywords
vector
impulse response
matrix
fixed codebook
convolution
Prior art date
Application number
PCT/JP2007/054529
Other languages
English (en)
French (fr)
Inventor
Hiroyuki Ehara
Koji Yoshida
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to KR1020127004264A priority Critical patent/KR101359147B1/ko
Priority to CN2007800028772A priority patent/CN101371299B/zh
Priority to KR1020087017192A priority patent/KR101359203B1/ko
Priority to CA2642804A priority patent/CA2642804C/en
Priority to KR1020127004260A priority patent/KR101359167B1/ko
Priority to MX2008011338A priority patent/MX2008011338A/es
Priority to AU2007225879A priority patent/AU2007225879B2/en
Priority to BRPI0708742-0A priority patent/BRPI0708742A2/pt
Publication of WO2007105587A1 publication Critical patent/WO2007105587A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Definitions

  • the present invention relates to a fixed codebook search device and a fixed codebook search method used when a speech signal is encoded by a code-excited linear prediction (CEL P) type speech encoding device. .
  • CEL P code-excited linear prediction
  • the fixed codebook search processing in the CELP speech coding apparatus generally occupies the largest amount of processing in the speech codec processing. Search methods have been developed.
  • Non-Patent Documents 1 to 3 As a fixed codebook that can relatively reduce the amount of processing for searching, it is widely adopted in international standard codecs such as ITU-T recommendation G.729, G.723.1, or 3GPP standard AMR Examples include a fixed code book using an algebraic code book (see, for example, Non-Patent Documents 1 to 3). In these fixed codebooks, the amount of processing required for fixed codebook search can be reduced by making the number of pulses generated from the algebraic codebook sparse. On the other hand, there is a limit to the signal characteristics that can be expressed with a sparse noise source, which may cause problems with the quality of the code. In order to deal with such a problem, a technique for applying a filter to give a characteristic to a pulsed sound source generated by an algebraic codebook has been proposed (for example, see Non-Patent Document 4).
  • Non-Patent Document 1 ITU— T Recommendation G. 729, “Coding of Speech at 8 kbit / s using Conjugate— structure Algebraic— Code— Excited Line are -Prediction (CS—ACELP), 3 March 1996
  • Non-Patent Document 2 ITU—T Recommendation G. 723.1, “Dual Rate Speech
  • Non-Patent Document 3 3GPP TS 26.090, "AMR speech codec; Transcoding fun ctions” V4. 0. 0, March 2001
  • Non-Patent Document 4 R. Hagen et al., "Removal of sparse-excitation artifacts in CELP", IEEE ICASSP '98, pp. 145-148, 1998
  • An object of the present invention is to provide a speech that can realize a quasi-optimal fixed codebook search by suppressing a slight increase in the amount of computation even if it is a characteristic, because the filter applied to the sound source pulse cannot be represented by a lower triangular matrix. It is to provide a sign key device or the like.
  • a fixed codebook search device convolves an impulse response of a perceptual weighting synthesis filter with a pulse excitation vector generator that generates a pulse excitation vector and an impulse response vector having a value at a negative time.
  • a first convolution operation unit that generates a second impulse response vector having a value at a negative time, and a Toeplitz-type convolution using the second impulse response vector generated by the first convolution operation unit.
  • a matrix generation unit that generates a matrix
  • a second convolution operation unit that performs a convolution process using the matrix generated by the matrix generation unit on the pulse source vector generated by the pulse source vector generation unit.
  • the present invention provides a fixed codebook search method in which a pulse sound source vector generation step for generating a pulse excitation vector and an impulse response vector having a value at a negative time and an innors response of an auditory weighting synthesis filter. And a second impulse response vector generated in the first convolution operation step to generate a second impulse response vector having a value at a negative time.
  • the invention's effect for generating a Toeplitz-type convolution matrix by using a second convolution operation step for performing a convolution process using the Teplet-type convolution matrix for the pulse source vector.
  • a transfer function that is not represented by a Toeplitz matrix is approximated by a matrix in which a part of the row elements of the lower triangular Toeplitz matrix is cut out, so that the causal represented by the lower triangular Toeplitz matrix is used.
  • the sign signal processing of the audio signal can be performed with almost the same memory amount and calculation amount as in the case of a simple filter.
  • FIG. 1 is a block diagram showing a fixed codebook vector generation device of a speech encoding device according to an embodiment of the present invention.
  • FIG. 2 is a block diagram showing an example of a fixed codebook search device of a speech encoding device according to an embodiment of the present invention.
  • FIG. 3 is a block diagram showing an example of a speech coding apparatus according to an embodiment of the present invention.
  • the present invention is characterized in that a fixed codebook search is performed using a matrix obtained by truncating row elements of a lower triangular Toeplitz matrix.
  • FIG. 1 is a block diagram showing a configuration of fixed codebook title generating apparatus 100 in the speech encoding apparatus according to one embodiment of the present invention.
  • fixed codebook vector generation apparatus 100 is used as a fixed codebook of a CELP speech coding apparatus that is mounted and used in a communication terminal device such as a mobile phone.
  • Fixed codebook vector generation apparatus 100 includes algebraic codebook 101 and convolution operation unit 102.
  • the algebraic codebook 101 generates a pulsed sound source vector c that algebraically arranges sound source pulses at positions specified by the input codebook index k, and generates the generated pulsed sound source vector.
  • Is output to the convolution operation unit 102 Any structure of the algebraic codebook is acceptable.
  • the structure described in ITU-T recommendation G.729 may be used.
  • the convolution operation unit 102 separates the pulse excitation vector input from the algebraic codebook 101 into The impulse response vector having a value at the input negative time is convolved, and the resultant vector is output as a fixed codebook vector.
  • the impulse response vector having a value at the negative time may have any shape, but the shape vector in which the point at time 0 occupies most of the energy of the vector with the largest amplitude of the element at the point at time 0 Is preferred. Also, the non-causal part (ie, the negative time vector element) should have a shorter vector length than the causal part containing the time 0 point (ie, the non-negative time vector element). .
  • the impulse response vector having a value at the negative time may be stored in advance as a fixed vector in the memory, or may be a variable vector obtained by sequential calculation.
  • an impulse response having a value at a negative time has a value from time “m” (that is, all before time “m ⁇ 1” are 0) will be specifically described. To do.
  • the nors excitation vector c generated from the fixed codebook with reference to the input fixed codebook index k is converted into a convolution filter F (convolution operation unit 1 in FIG. 1).
  • the fixed codebook search is performed by finding k that maximizes the following equation (2).
  • C is the Norse source vector (fixed code) specified by index k.
  • E is the inner product (or cross-correlation) of the perceptual weighted synthesized signal S and the target vector X described later.
  • Is the energy of the perceptually weighted composite signal s (ie, I s I 2 ).
  • x is a target vector in the CELP speech code, and is a vector obtained by removing the zero input response of the auditory weighted input speech signal force auditory weighting synthesis filter.
  • the perceptual weighting input speech signal is a signal obtained by applying a perceptual weighting filter to the input speech signal to be coded.
  • An auditory weighting filter is an all-pole or pole-zero filter that is generally constructed using linear prediction coefficients obtained by performing linear prediction analysis of an input speech signal. In a CELP speech coding apparatus, It is widely used.
  • the perceptual weighting synthesis filter is a filter in which a linear prediction filter (that is, a synthesis filter) configured by using a linear prediction coefficient quantized by a CELP speech coding apparatus and the perceptual weighting filter are connected in series. .
  • a linear prediction filter that is, a synthesis filter
  • these components are not shown in the present embodiment, they are common in CELP-type voice codec devices.
  • ITU-T Recommendation G. 729 also states “target vector”. "Weighted synthesis filter” and "zero-input response of the weighted synthesis filter”.
  • the subscript t indicates a transposed matrix.
  • the matrix H "that convolves the impulse response of the perceptual weighting synthesis filter that convolves the impulse response having a value at a negative time is not a matrix. Since the first to mth columns are calculated using some or all of the non-causal components of the impulse response to be convoluted, the calculations are made using all the non-causal components of the convolutional impulse response. This is different from the column components after the (m + 1) th column, so the matrix H "does not become Toeplitz type. For this reason, m types of impulse responses from h (1 ) to h ( m ) must be separately calculated and held, resulting in an increase in the amount of computation and memory required for calculating d and ⁇ .
  • the target vector is generally used in CELP codes, and is a vector obtained by removing the zero input response of the perceptual weighting synthesis filter from the perceptual weighting input speech signal.
  • each element ⁇ ′ (i, j) of the matrix ⁇ ′ is expressed by the following equation (8).
  • Matrix H ' is a Toeplitz-type matrix obtained by truncating the lower triangular Toeplitz-type matrix elements, and even if such an approximation is performed, of the impulse response vectors having values at negative times, the non-causal Due to the energy of the element (negative time component) If the energy is small enough compared to the energy of the effective element (not negative !, that is, a positive time component including 0), the effect of approximation is small.
  • the approximation is performed because the first column force of the matrix H "is also limited to the mth column element (where m is the length of the non-causal element), and the effect of the approximation is smaller as m is shorter. It can be ignored.
  • ⁇ ', j is an element (e.g., ⁇ ' ( ⁇ - 2, ⁇ -1) ), ⁇ , ( ⁇ —3, ⁇ —2),... ⁇ '(0, 1)) can be obtained recursively. This feature allows efficient computation of the matrix ⁇ ', so matrix element computations do not always add m product-sum operations.
  • FIG. 2 is a block diagram showing an example of fixed codebook search apparatus 150 that implements the above-described fixed codebook search method.
  • An impulse response vector having a value at a negative time and an impulse response vector of the perceptual weighting synthesis filter are input to the convolution operation unit 151.
  • Convolution calculator 151 , (6) is used to calculate h W (n) and output to matrix generation section 152.
  • the matrix generation unit 152 generates a matrix H ′ using h to) (n) input from the convolution operation unit 151, and outputs the matrix H ′ to the convolution operation unit 153.
  • the convolution operation unit 153 performs the operation on the pulse excitation vector c input from the algebraic codebook 101.
  • the element h W (n) of the matrix H ′ input from the k column generation unit 152 is convolved and output to the adder 154.
  • Adder 154 calculates a difference signal between the perceptually weighted synthesized signal input from convolution operation unit 153 and the target signal input separately, and outputs the difference signal to error minimizing unit 155.
  • Error minimizing section 155 identifies codebook index k that generates pulsed excitation vector c that minimizes the energy of the differential signal input from adder 154.
  • FIG. 3 is a block diagram illustrating an example of a CELP speech codec device 200 that includes fixed codebook vector generation device 100 shown in FIG. 1 as fixed codebook vector generation unit 100a.
  • the input audio signal is input to the preprocessing unit 201.
  • the preprocessing unit 201 performs preprocessing such as removal of the DC component! And outputs the processed signal to the linear prediction analysis unit 202 and the adder 203.
  • the linear prediction analysis unit 202 performs linear prediction analysis of the signal input from the preprocessing unit 201, and outputs a linear prediction coefficient as an analysis result to the LPC quantization unit 204 and the auditory weighting filter 205.
  • Adder 203 calculates a difference signal between the preprocessed input audio signal input from preprocessing unit 201 and the synthesized audio signal input from synthesis filter 206, and outputs the difference signal to perceptual weighting filter 205.
  • the LPC quantization unit 204 quantizes and encodes the linear prediction coefficient input from the linear prediction analysis unit 202, and converts the quantized LPC to the synthesis filter 206, and the code result to the bit stream generation unit. Output to 212 respectively.
  • the perceptual weighting filter 205 is a pole-zero type filter configured using the linear prediction coefficient input from the linear prediction analysis unit 202, and is synthesized with the pre-processed input audio signal input from the adder 203. Filter the difference signal from the audio signal and output to the error minimizing unit 207 To do.
  • the synthesis filter 206 is a linear prediction filter constructed by the quantized linear prediction coefficient input from the LPC quantization unit 204.
  • the synthesis filter 206 receives the drive signal from the adder 211, performs linear prediction synthesis processing, and performs synthesized speech. The signal is output to the adder 203.
  • the error minimizing unit 207 has an adaptive codebook vector generation unit 208, a fixed codebook vector generation unit 1OOa, an adaptive codebook vector and an adaptive codebook vector so that the energy of the signal input from the perceptual weighting filter 205 is minimized.
  • the parameter relating to the gain for the fixed codebook vector is determined, and the result of the sign signal is output to the bitstream generation unit 212.
  • the gain-related parameters are quantized in the error minimizing unit 207 to obtain one sign-y result, but the gain quantizing unit is the error minimizing unit 207. May be outside.
  • Adaptive codebook vector generation section 208 has an adaptive codebook that buffers the drive signal previously input from adder 211, generates an adaptive codebook vector, and outputs it to amplifier 209.
  • the adaptive codebook vector is specified by an instruction from error minimizing section 207.
  • Amplifier 209 multiplies the adaptive codebook vector input from adaptive codebook vector generation unit 208 by the adaptive codebook gain input from error minimizing section 207, and outputs the result to adder 211.
  • Fixed codebook vector generation section 100a has the same configuration as fixed codebook vector generation apparatus 100 shown in FIG. 1, and relates to a codebook index and impulse response of a non-causal filter from error minimization section 207. Information is input, a fixed codebook vector is generated and output to amplifier 210.
  • Amplifier 210 multiplies the fixed codebook gain input from error minimizing section 207 by the fixed codebook vector input from fixed codebook vector generating section 100a, and outputs the result to adder 211.
  • Adder 211 performs addition with the adaptive codebook vector and fixed codebook vector after gain multiplication input from amplifiers 209 and 210, and outputs the result to synthesis filter 206 as a filter drive signal.
  • the bitstream generation unit 212 receives the linear prediction coefficient input from the LPC quantization unit 204.
  • (LPC) encoding result and the adaptive codebook vector and fixed codebook vector input from the error minimizing unit 207 and the encoding result of gain information for them are input and converted into a bit stream. Output.
  • a filter having an impulse response characteristic having a value at a negative time (generally called a non-causal filter)
  • a filter having an impulse response characteristic having a value at a negative time (generally called a non-causal filter)
  • This approximation can suppress an increase in the amount of computation required for searching the algebraic codebook.
  • the number of non-causal elements is less than the number of causal elements and the energy of Z or non-causal elements is less than the energy of the causal elements, the encoding quality by the above approximation The impact on is suppressed.
  • the number of causal components of the impulse response of the non-causal filter may be limited to a specific number within a range larger than the number of non-causal components.
  • a non-causal part that is, a vector element of a negative time
  • the length of the non-causal part is less than NZ2 (N Is set to (pulse source vector length).
  • the fixed codebook search apparatus, speech coding apparatus, and the like according to the present invention are not limited to the above-described embodiment, and can be implemented with various modifications.
  • the fixed codebook search apparatus, speech coding apparatus, and the like according to the present invention can be installed in a communication terminal apparatus and a base station apparatus in a mobile communication system, and thereby the same operational effects as described above.
  • a communication terminal device, a base station device, and a mobile communication system can be provided.
  • the power described with reference to the case where the present invention is configured by nodeware can be realized by software.
  • an algorithm such as a fixed codebook search method and a speech code input method according to the present invention is described in a programming language, and the program is stored in a memory and executed by an information processing means.
  • fixed codebook and “adaptive codebook” used in the above embodiments may be referred to as “fixed source codebook” and “adaptive excitation codebook”.
  • Each functional block used in the description of the above embodiment is typically realized as an LSI which is an integrated circuit. These may be individually made into one chip, or may be made into one chip to include some or all of them.
  • the method of circuit integration is not limited to LSI's, and implementation using dedicated circuitry or general purpose processors is also possible. It is also possible to use a field programmable gate array (FPGA) that can be programmed after LSI manufacture and a reconfigurable processor that can reconfigure the connection and settings of circuit cells inside the LSI.
  • FPGA field programmable gate array
  • the fixed codebook search device and the like according to the present invention is more causal than a CELP speech codec device that uses an algebraic codebook as a fixed codebook, without a large amount of computation and an increase in memory. Filter characteristics generated by the algebraic codebook can be added, the amount of available memory is limited, and wireless communication at low speed is strong. This is useful for searching a fixed codebook of a speech encoding device in a communication terminal device such as a mobile phone.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

 音源パルスにかけるフィルタが下三角行列で表せない特性であっても演算量の増加をわずかに抑え、準最適な固定符号帳探索を実現する固定符号帳探索装置。  この固定符号帳探索装置では、パルス音源ベクトルを生成する代数符号帳(101)と、負の時間に値を有するインパルス応答ベクトルに聴覚重み付け合成フィルタのインパルス応答を畳み込んで負の時間に値を有する第2のインパルス応答ベクトルを生成する畳み込み演算部(151)と、第2のインパルス応答ベクトルを用いてテプリッツ型の畳み込み行列を生成する行列生成部(152)と、代数符号帳(101)によって生成されたパルス音源ベクトルに行列生成部(152)によって生成された行列を畳み込む畳み込み演算部(153)と、を備える。

Description

明 細 書
固定符号帳探索装置および固定符号帳探索方法
技術分野
[0001] 本発明は、音声信号を符号励振線形予測(Code Excited Linear Prediction: CEL P)型の音声符号化装置によって符号化する際に用いられる、固定符号帳探索装置 および固定符号帳探索方法に関する。
背景技術
[0002] CELP型音声符号化装置における固定符号帳の探索処理は、一般に音声符号ィ匕 処理の中で最も多くの処理量を占めるため、従来力 さまざまな固定符号帳の構成 や固定符号帳の探索方法が開発されてきた。
[0003] 探索のための処理量を比較的少なくすることができる固定符号帳として、 ITU— T 勧告 G. 729や G. 723. 1あるいは 3GPP標準 AMR等の国際標準コーデックに広く 採用されている代数符号帳 (Algebraic Codebook)を用いた固定符号帳 (Fixed Code book)が挙げられる(例えば非特許文献 1〜3参照)。これらの固定符号帳では、代数 符号帳から生成されるノ ルス数をスパースにすることによって、固定符号帳探索に要 する処理量を少なくすることができる。その一方で、スパースなノ ルス音源で表現で きる信号特性に限界があるため、符号ィ匕品質に問題を生じる場合がある。このような 問題に対応するため、代数符号帳カゝら生成されるパルス音源に特性を持たせるため のフィルタをかける手法が提案されて 、る(例えば非特許文献 4参照)。
非特許文献 1 :ITU— T Recommendation G. 729、 "Coding of Speech at 8 kbit/ s using Conjugate― structure Algebraic― Code― Excited Line are -Prediction (CS—ACELP),,ゝ 1996年 3月
非特許文献 2 :ITU— T Recommendation G. 723. 1、 "Dual Rate Speech
Coder for Multimedia Communications Transmitting at 5. 3 and 6. 3 kbitZs,,、 1996年 3月
非特許文献 3 : 3GPP TS 26. 090、 "AMR speech codec ; Transcoding fun ctions"V4. 0. 0、 2001年 3月 非特許文献 4 : R. Hagen他、 "Removal of sparse― excitation artifacts in CELP", IEEE ICASSP ' 98, pp. 145〜148、 1998
発明の開示
発明が解決しょうとする課題
[0004] しかしながら、音源パルスにかけるフィルタが下三角のテプリッツ (Toeplitz)行列で 表現できなヽ場合 (例えば、非特許文献 4にあるような巡回畳み込み処理である場合 等負の時間に値を有するフィルタの場合)、行列演算に余計なメモリや演算量が必要 となる。
[0005] 本発明の目的は、音源パルスにかけるフィルタが下三角行列で表せな 、特性であ つても演算量の増加をわずかに抑え、準最適な固定符号帳探索を実現することので きる音声符号ィ匕装置等を提供することである。
課題を解決するための手段
[0006] 本発明は、固定符号帳探索装置が、パルス音源ベクトルを生成するパルス音源べ タトル生成部と、負の時間に値を有するインパルス応答ベクトルに聴覚重み付け合成 フィルタのインパルス応答を畳み込んで、負の時間に値を有する第 2のインパルス応 答ベクトルを生成する第 1の畳み込み演算部と、前記第 1の畳み込み演算部によって 生成された第 2のインパルス応答ベクトルを用いてテプリッツ型の畳み込み行列を生 成する行列生成部と、前記パルス音源ベクトル生成部によって生成されたパルス音 源ベクトルに前記行列生成部によって生成された行列を用いて畳み込み処理を行う 第 2の畳み込み演算部と、を具備することにより、上記目的を達成するものである。
[0007] また、本発明は、固定符号帳探索方法が、パルス音源ベクトルを生成するパルス音 源ベクトル生成ステップと、負の時間に値を有するインパルス応答ベクトルに聴覚重 み付け合成フィルタのインノルス応答を畳み込んで、負の時間に値を有する第 2のィ ンパルス応答べクトルを生成する第 1の畳み込み演算ステップと、前記第 1の畳み込 み演算ステップで生成された第 2のインパルス応答ベクトルを用いてテプリッツ型の 畳み込み行列を生成する行列生成ステップと、前記パルス音源ベクトルに前記テプリ ッッ型の畳み込み行列を用いて畳み込み処理を行う第 2の畳み込み演算ステップと 、を有することにより、上記目的を達成するものである。 発明の効果
[0008] 本発明によれば、テプリッツ行列で表現されな 、伝達関数を下三角テプリッツ行列 の行要素の一部を切り取った形の行列で近似するため、下三角テプリッツ行列で表 される因果的なフィルタの場合とほとんど同じメモリ量と演算量で音声信号の符号ィ匕 処理を行うことができる。
図面の簡単な説明
[0009] [図 1]本発明の一実施の形態に係る音声符号化装置の固定符号帳ベクトル生成装 置を示すブロック図
[図 2]本発明の一実施の形態に係る音声符号化装置の固定符号帳探索装置の一例 を示すブロック図
[図 3]本発明の一実施の形態に係る音声符号ィ匕装置の一例を示すブロック図 発明を実施するための最良の形態
[0010] 本発明は、下三角テプリッツ (Toeplitz)型行列の行要素を切り詰めた (truncate) 行列を用いて固定符号帳の探索を行う構成に特徴を有する。
[0011] 以下、本発明に係る実施の形態について、図を適宜参照しながら詳細に説明する
[0012] (実施の形態)
図 1は、本発明の一実施の形態に係る音声符号化装置における固定符号帳べタト ル生成装置 100の構成を示すブロック図である。なお、本実施の形態では、固定符 号帳ベクトル生成装置 100は、携帯電話等の通信端末装置に搭載されて使用される CELP型音声符号化装置の固定符号帳として使用されるものとする。
[0013] 固定符号帳ベクトル生成装置 100は、代数符号帳 101、畳み込み演算部 102を具 備する。
[0014] 代数符号帳 101は、入力した符号帳インデックス kで指定される位置に音源パルス を代数的に配置して成るパルス音源ベクトル cを生成し、生成したパルス音源べタト
k
ルを畳み込み演算部 102へ出力する。代数符号帳の構造はどのようなものでも良ぐ 例えば ITU— T勧告 G. 729に記載されているものでも良い。
[0015] 畳み込み演算部 102は、代数符号帳 101から入力したパルス音源ベクトルに、別 途入力した負の時間に値を有するインパルス応答ベクトルを畳み込み、畳み込んだ 結果のベクトルを固定符号帳ベクトルとして出力する。負の時間に値を有するインパ ルス応答ベクトルはどのような形状でも良いが、時間 0の点における要素の振幅が最 も大きぐベクトル全体のエネルギの大半を時間 0の点が占めている形状ベクトルが 好適である。また、非因果的な部分 (すなわち、負の時間のベクトル要素)は、時間 0 の点を含む因果的な部分 (すなわち、非負の時間のベクトル要素)よりもベクトル長が 短いものが好適である。負の時間に値を有するインパルス応答ベクトルは、固定のベ タトルとしてメモリに予め記憶されていても良いし、逐次計算によって求められる可変 のベクトルであっても良い。以下、本実施の形態では、負の時間に値を有するインパ ルス応答が時間 " m"から値を有する(すなわち、時間" m— 1"以前は全て 0であ る)例について具体的に説明する。
図 1において、入力された固定符号帳インデックス kを参照して固定符号帳から生 成されたノルス音源ベクトル cを畳み込みフィルタ F (図 1における畳み込み演算部 1
k
02に相当)と図示しない聴覚重み付け合成フィルタ Hに通して得られる聴覚重み付 け合成信号 sは、次の(1)式のように表される。
[数 1]
l)
Figure imgf000006_0001
( 1 ) [0017] ここで、 h (n)、 n=0, · ··, N— 1は聴覚重み付け合成フィルタのインパルス応答、 f ( n)、n=—m, · ··, N— 1は非因果的なフィルタのインパルス応答(すなわち負の時間 に値を有するインパルス応答)、 c (n)、n=0, · ··, N— 1はインデックス kで指定され
k
るパルス音源ベクトル、をそれぞれ示している。
[0018] 固定符号帳の探索は、次の(2)式を最大化する kを見つけることによって行われる。
なお、(2)式において、 Cはインデックス kで指定されるノ ルス音源ベクトル(固定符
k
号帳ベクトル) cを畳み込みフィルタ Fと聴覚重み付け合成フィルタ Hに通して得られ
k
る聴覚重み付け合成信号 Sと後述するターゲットベクトル Xとの内積 (あるいは相互相 関)であり、 Eは cを畳み込みフィルタ Fと聴覚重み付け合成フィルタ Hに通して得ら
k k
れる聴覚重み付け合成信号 sのエネルギ (すなわち I s I 2)である。
[数 2] . . . ( 2 )
Figure imgf000007_0001
[0019] xは、 CELP音声符号ィ匕におけるターゲットベクトルと呼ばれるもので、聴覚重み付 け入力音声信号力 聴覚重み付け合成フィルタのゼロ入力応答を除去して得られる ベクトルである。聴覚重み付け入力音声信号とは、符号ィ匕対象としている入力音声 信号に聴覚重み付けフィルタをかけて得られる信号である。聴覚重み付けフィルタと は、一般に入力音声信号の線形予測分析を行って得られる線形予測係数を用いて 構成される全極型または極零型のフィルタであり、 CELP型音声符号ィ匕装置におい ては広く利用されているものである。聴覚重み付け合成フィルタとは、 CELP型音声 符号化装置によって量子化された線形予測係数を用いて構成される線形予測フィル タ(すなわち合成フィルタ)と前述の聴覚重み付けフィルタとを直列接続したフィルタ である。これらの構成要素は本実施の形態では図示していないが、 CELP型音声符 号ィ匕装置においては一般的であり、例えば ITU—T勧告 G. 729にも、「ターゲットべ クトノレ (target vector)」、「重み付け合成フイノレタ (weighted synthesis filter) 」、「聴覚重み付け合成フィルタのゼロ入力応答(zero— input response of the weighted synthesis filter)」について記載されている。なお、添え字 tは転置行 列であることを示す。 [0020] しかしながら、(1)式からも分力るように、負の時間に値を有するインパルス応答を 畳み込んだ聴覚重み付け合成フィルタのインパルス応答を畳み込む行列 H"はテプ リッツ行列でな 、。第 1列〜第 m列が畳み込むインパルス応答の一部または全ての 非因果的な成分を切り詰めたものを用いて計算されるため、畳み込むインパルス応 答の全ての非因果的な成分を用いて計算される第 (m+ 1)列以降の列成分と異なつ てしまう。したがって行列 H"はテプリッツ型にならないのである。このため、 h(1)〜h(m) の m種類のインパルス応答を別々に計算して保持しておかなければならず、 dおよび Φの計算に要する演算量およびメモリ量の増大を招く。
[0021] そこで、(2)式を次の(3)式で近似する。
[数 3]
Figure imgf000008_0001
[0022] ここで、 d"は次の(4)式で表される。
[数 4] d " = χ'Η'
Figure imgf000008_0002
[0023] すなわち d' (i)は、次の(5)式で表される c
[数 5]
Figure imgf000008_0003
ここで、 x (n)はターゲットベクトルの第 n要素(n=0, 1,…, N— 1、Nは音源信号 の符号化の処理単位時間であるフレームもしくはサブフレーム長)、 h(G) (n)は聴覚重 み付けフィルタのインパルス応答に負の時間に値を有するインパルス応答を畳み込 んだベクトルの第 n要素(n=— m, 0, ···, N— 1)をそれぞれ示す。ターゲットべタト ルは CELP符号ィ匕で一般的に使用されるもので、聴覚重み付け入力音声信号から 聴覚重み付け合成フィルタのゼロ入力応答を除去して得られるベクトルである。 h(0) ( n)は、聴覚重み付け合成フィルタのインパルス応答 h(n) (n=0, 1, ···, N— 1)に、 非因果的なフィルタ (インパルス応答 f(n), n=-m, ···, 0, ···, N— 1)をかけて得ら れるベクトルで、次の(6)式で表される。 h(G) (n)も非因果的なフィルタのインパルス応 答となる(n=— m, ···, 0, ···, N— 1)。
[数 6] 。) ('·)=ヌ /(" (,·-"), / = -»v..,N一 1 ( 6)
[0025] また、行列 Φ 'は次の(7)式で表される。
[数 7]
Φ' = Η"Η'
Figure imgf000009_0001
( 7)
[0026] すなわち、行列 Φ'の各要素 φ ' (i, j)は次の(8)式で表される。
[数 8]
Figure imgf000009_0002
(0) すなわち、行列 H"の第 p列要素 h(p) (n)、 p = l〜m、を他の列の要素 h (n)で近 似したものが行列 H'である。この行列 H'は、下三角テプリッツ型行列の行要素を切 り詰めたテプリッツ型行列である。このような近似を行っても、負の時間に値を有する インパルス応答ベクトルのうち、非因果的な要素(負の時間の成分)のエネルギが因 果的な要素 (負でな!、、つまり 0を含む正の時間の成分)のエネルギに比べて十分小 さい場合は近似による影響は小さい。また、近似が行われるのは、行列 H"の第 1列 力も第 m列要素に限定されるので (ここで mは非因果的な要素の長さ)、 mが短いほ ど近似の影響は無視できるようになる。
[0028] 一方、行列 Φ 'と Φの計算に必要な演算量は大きく異なる。つまり、(3)式の近似を 用いる場合と用いない場合とでは大きな差が出る。例えば、負の時間に値を有さない インパルス応答を畳み込む通常の代数符号帳における行列 Φ =ί^Η (Ηは(1)式
0
における聴覚重み付けフィルタのインパルス応答を畳み込む下三角テプリッツ型行 列)を求める場合と比較して考えた場合、(8)式力も明らかなように、(3)式の近似を 用いた場合の行列 Φ 'の計算は基本的に m回の積和演算が増えるだけである。また 、ITU— T勧告 G. 729の Cコードでも行われているように、 φ ' , j)は、(j— i)が等し い要素(例えば、 φ ' (Ν— 2, Ν—1)、 φ,(Ν— 3, Ν— 2)、…ゝ ' (0, 1) )は再帰 的に求めることができる。この特徴により行列 Φ 'の効率的な計算が実現されるので、 行列要素の計算は常に m回の積和演算が追加されるわけではない。
[0029] これに対して、(3)式の近似を用いない行列 Φの計算では、 φ (p, k) = φ (k、 p)、 p = 0, · ··, m、 k=0, · ··, N— 1、の要素について、特有のインパルス応答ベクトルの 相関計算を行う必要がある。つまりこれらの計算に使われるインパルス応答ベクトル はその他の行列要素の計算に使われるインパルス応答ベクトルとは異なる(つまり、 h (G)と h(G)の相関ではなぐ h(G)と h(P)、 p = l〜m、の相関を求める)。これらの要素は、 再帰的に求めたときの最後のほうで計算結果が得られる要素である。つまり、前述し た、「再帰的に求めることができるので、行列 Φの要素を効率的に計算することができ る」という利点が失われてしまう。このことは、負の時間に値を有するインパルス応答 ベクトルの非因果的な要素の数にほぼ比例する形で演算量が増加することを意味す る(例えば、 m= lの場合でも、 2倍近くの演算量となる)。
[0030] 図 2は、上述した固定符号帳探索方法を実現する固定符号帳探索装置 150の一 例を示すブロック図である。
[0031] 負の時間に値を有するインパルス応答ベクトルと聴覚重み付け合成フィルタのイン パルス応答ベクトルとが畳み込み演算部 151に入力される。畳み込み演算部 151は 、(6)式により hW (n)を算出し、行列生成部 152へ出力する。
[0032] 行列生成部 152は、畳み込み演算部 151より入力された hto) (n)を用いて行列 H' を生成し、畳み込み演算部 153へ出力する。
[0033] 畳み込み演算部 153は、代数符号帳 101より入力されるパルス音源ベクトル cに行
k 列生成部 152より入力される行列 H'の要素 hW (n)を畳み込んで加算器 154へ出力 する。
[0034] 加算器 154は、畳み込み演算部 153から入力される聴覚重み付け合成信号と別途 入力されるターゲットべ外ルとの差分信号を算出し、誤差最小化部 155へ出力する
[0035] 誤差最小化部 155は、加算器 154から入力される差分信号のエネルギが最小とな るパルス音源ベクトル cを生成する符号帳インデックス kを特定する。
k
[0036] 図 3は図 1に示した固定符号帳ベクトル生成装置 100を固定符号帳ベクトル生成部 100aとして備えた CELP型音声符号ィ匕装置 200の一例を表すブロック図である。
[0037] 入力音声信号は、前処理部 201へ入力される。前処理部 201は、直流成分の除去 などの前処理を行!、、処理後の信号を線形予測分析部 202および加算器 203へ出 力する。
[0038] 線形予測分析部 202は、前処理部 201より入力した信号の線形予測分析を行い、 分析結果である線形予測係数を LPC量子化部 204および聴覚重み付けフィルタ 20 5へ出力する。
[0039] 加算器 203は、前処理部 201より入力した前処理後の入力音声信号と、合成フィル タ 206より入力した合成音声信号との差信号を算出し、聴覚重み付けフィルタ 205へ 出力する。
[0040] LPC量子化部 204は、線形予測分析部 202から入力した線形予測係数の量子化 および符号ィ匕処理を行い、量子化 LPCを合成フィルタ 206へ、符号ィ匕結果をビットス トリーム生成部 212へ、それぞれ出力する。
[0041] 聴覚重み付けフィルタ 205は、線形予測分析部 202より入力した線形予測係数を 用いて構成される極零型のフィルタで、加算器 203より入力した、前処理後の入力音 声信号と合成音声信号との差信号にフィルタ処理を施し、誤差最小化部 207へ出力 する。
[0042] 合成フィルタ 206は LPC量子化部 204より入力した量子化線形予測係数によって 構築される線形予測フィルタであり、加算器 211より駆動信号を入力し、線形予測合 成処理を行って合成音声信号を加算器 203へ出力する。
[0043] 誤差最小化部 207は、聴覚重み付けフィルタ 205より入力される信号のエネルギが 最も小さくなるように、適応符号帳ベクトル生成部 208、固定符号帳ベクトル生成部 1 OOa、適応符号帳ベクトルと固定符号帳ベクトルに対する利得に関するパラメータを 決定し、それらの符号ィ匕結果をビットストリーム生成部 212に出力する。なお、本図で は利得に関するパラメータは誤差最小化部 207内で量子化されて一つの符号ィ匕結 果が得られることを想定しているが、利得量子化部は誤差最小化部 207の外にあつ ても良い。
[0044] 適応符号帳ベクトル生成部 208は、過去に加算器 211から入力した駆動信号をバ ッファリングする適応符号帳を有し、適応符号帳ベクトルを生成して増幅器 209へ出 力する。適応符号帳ベクトルは誤差最小化部 207からの指示によって特定される。
[0045] 増幅器 209は、誤差最小化部 207から入力される適応符号帳利得を適応符号帳 ベクトル生成部 208から入力した適応符号帳ベクトルに乗じて加算器 211へ出力す る。
[0046] 固定符号帳ベクトル生成部 100aは、図 1に示した固定符号帳ベクトル生成装置 10 0と同じ構成であり、誤差最小化部 207より符号帳インデックスや非因果的なフィルタ のインパルス応答に関する情報を入力し、固定符号帳ベクトルを生成して増幅器 21 0へ出力する。
[0047] 増幅器 210は、誤差最小化部 207から入力される固定符号帳利得を固定符号帳 ベクトル生成部 100aから入力した固定符号帳ベクトルに乗じて加算器 211へ出力す る。
[0048] 加算器 211は、増幅器 209および 210から入力した利得乗算後の適応符号帳べク トルおよび固定符号帳ベクトルとの加算を行 、、結果をフィルタ駆動信号として合成 フィルタ 206へ出力する。
[0049] ビットストリーム生成部 212は、 LPC量子化部 204より入力した線形予測係数 (すな わち LPC)の符号化結果と、誤差最小化部 207より入力した適応符号帳ベクトルおよ び固定符号帳ベクトルおよびそれらに対する利得情報の符号化結果と、を入力し、 ビットストリームに変換して出力する。
[0050] なお、誤差最小化部 207における固定符号帳ベクトルのパラメータを決定する際に 、前述した固定符号帳探索方法が用いられ、実際の固定符号帳探索装置は図 2に 示したようなものが用いられる。
[0051] このように、本実施の形態では、負の時間に値を有するインパルス応答特性を持つ フィルタ (一般に非因果的なフィルタと呼ばれる)を代数符号帳から生成された音源 ベクトルにかける場合に、非因果的なフィルタと聴覚重み付け合成フィルタとを直列 接続した処理ブロックの伝達関数を非因果的な部分の長さの行数だけ行列要素を 切り詰めた (truncateした)下三角テプリッツ型行列によって近似する。この近似によ つて代数符号帳の探索に要する演算量の増加を抑えることができる。また、非因果的 な要素の数が因果的な要素の数よりも少なぐかつ Zまたは、非因果的な要素のェ ネルギが因果的な要素のエネルギよりも小さい場合、前記近似による符号化品質へ の影響は抑えられる。
[0052] なお、本実施の形態について、以下のように変形したり応用したりしても良い。
[0053] 非因果的なフィルタのインパルス応答の因果的な成分の数を非因果的な成分の数 よりも大きい範囲内で特定の数に限定しても良い。
[0054] なお、本実施の形態では固定符号帳探索時の処理についてのみ説明した。 CEL P型音声符号化装置では、固定符号帳探索の後、利得量子化が行われるのが普通 である。その際、聴覚重み付け合成フィルタを通した固定音源符号帳ベクトル (すな わち、選択された固定音源符号帳ベクトルを聴覚重み付け合成フィルタに通して得ら れる合成信号)が必要とされるので、固定符号帳探索終了後に、この「聴覚重み付け 合成フィルタを通した固定音源符号帳ベクトル」を算出するのが普通である。このとき 使用するインパルス応答畳み込み行列は、探索時に用いた近似のインノ ルス応答 畳み込み行列 HWではなぐ第 l〜m列(=非因果的要素の数が mの場合)の要素 のみが他の要素と異なって!/、る行列 H"を用いたほうがよ!/、。
[0055] また、本実施の形態では、非因果的な部分 (すなわち、負の時間のベクトル要素) は、時間 0の点を含む因果的な部分 (すなわち、非負の時間のベクトル要素)よりもべ タトル長が短いものが好適であるとした力 非因果的な部分の長さは NZ2未満 (Nは パルス音源ベクトルの長さ)に設定する。
[0056] 以上、本発明の実施の形態について説明した。
[0057] 本発明に係る固定符号帳探索装置や音声符号化装置等は、上記実施の形態に限 定されず、種々変更して実施することが可能である。
[0058] 本発明に係る固定符号帳探索装置や音声符号化装置等は、移動体通信システム における通信端末装置及び基地局装置に搭載することが可能であり、これにより上 記と同様の作用効果を有する通信端末装置、基地局装置及び移動体通信システム を提供することができる。
[0059] また、ここでは、本発明をノヽードウエアで構成する場合を例にとって説明した力 本 発明をソフトウェアで実現することも可能である。例えば、本発明に係る固定符号帳 探索方法や音声符号ィ匕方法等のアルゴリズムをプログラミング言語によって記述し、 このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより
、本発明の固定符号帳探索装置や音声符号化装置等と同様の機能を実現すること ができる。
[0060] なお、上記実施の形態において用いた「固定符号帳」「適応符号帳」は、「固定音 源符号帳」「適応音源符号帳」と称しても良い。
[0061] また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路で ある LSIとして実現される。これらは個別に 1チップ化されても良いし、一部又は全て を含むように 1チップィ匕されても良 、。
[0062] ここでは、 LSIとした力 集積度の違いにより、 IC、システム LSI、スーパー LSI、ゥ ノレ卜ラ LSIと呼称されることちある。
[0063] また、集積回路化の手法は LSIに限るものではなぐ専用回路又は汎用プロセッサ で実現しても良い。 LSI製造後に、プログラムすることが可能な FPGA (Field Program mable Gate Array)や、 LSI内部の回路セルの接続や設定を再構成可能なリコンフィ ギュラブノレ ·プロセッサーを利用しても良 、。
[0064] さらには、半導体技術の進歩又は派生する別技術により LSIに置き換わる集積回 路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行って も良い。バイオ技術の適用等が可能性としてありえる。
[0065] 2006年 3月 10日出願の特願 2006— 065399および 2007年 2月 6日出願の特願 2007— 027408の日本出願に含まれる明細書、図面および要約書の開示内容は、 すべて本願に援用される。
産業上の利用可能性
[0066] 本発明に係る固定符号帳探索装置等は、代数符号帳を固定符号帳として利用す る CELP型音声符号ィ匕装置にぉ 、て、大きな演算量およびメモリ量の増加なしに非 因果的なフィルタ特性を代数符号帳カゝら生成されたパルス音源べ外ル付加すること ができるという効果を有し、利用可能なメモリ量に制限があり、かつ、低速での無線通 信を強いられる携帯電話等の通信端末装置等における音声符号化装置の固定符号 帳探索に有用である。

Claims

請求の範囲
[1] ノ ルス音源ベクトルを生成するパルス音源ベクトル生成部と、
負の時間に値を有するインパルス応答ベクトルに聴覚重み付け合成フィルタのイン パルス応答を畳み込んで、負の時間に値を有する第 2のインノ ルス応答ベクトルを生 成する第 1の畳み込み演算部と、
前記第 1の畳み込み演算部によって生成された第 2のインパルス応答ベクトルを用 いてテプリッツ型の畳み込み行列を生成する行列生成部と、
前記パルス音源ベクトル生成部によって生成されたパルス音源ベクトルに前記行列 生成部によって生成された行列を用いて畳み込み処理を行う第 2の畳み込み演算部 と、を具備する、固定符号帳探索装置。
[2] 前記テプリッツ型の畳み込み行列は、以下の(1)式の行列 H'で表される、請求項 1 記載の固定符号帳探索装置。
[数 1]
d" = x'H
Figure imgf000016_0001
( 1 ) ここで、 h(G) (n)は、負の時間に値を有する第 2のインパルス応答ベクトル (n=— m , · ··, 0, · ··, N—1)である。
[3] 前記第 2のインパルス応答ベクトルの負の時間成分のエネルギが非負の時間成分 のエネルギより小さい、請求項 1記載の固定符号帳探索装置。
[4] 前記第 2のインパルス応答ベクトルの負の時間成分の時間長が非負の時間成分の 時間長より短い、請求項 1記載の固定符号帳探索装置。
[5] 前記第 2の負の時間に値を有するインパルス応答べクトルの負の時間成分が 1つで ある、請求項 1記載の固定符号帳探索装置。
[6] パルス音源ベクトルを生成するパルス音源ベクトル生成ステップと、 負の時間に値を有するインパルス応答ベクトルに聴覚重み付け合成フィルタのイン パルス応答を畳み込んで、負の時間に値を有する第 2のインノ ルス応答ベクトルを生 成する第 1の畳み込み演算ステップと、
前記第 1の畳み込み演算ステップで生成された第 2のインパルス応答ベクトルを用 いてテプリッツ型の畳み込み行列を生成する行列生成ステップと、
前記パルス音源ベクトルに前記テプリッツ型の畳み込み行列を用いて畳み込み処 理を行う第 2の畳み込み演算ステップと、を有する、固定符号帳探索方法。
[7] 前記テプリッツ型の畳み込み行列は、以下の(2)式の行列 H'で表される、請求項 6 記載の固定符号帳探索方法。
[数 2] d" = χ'Η'
Figure imgf000017_0001
(。)(N - 1) … 。) (N 1— w) … 。) (0)
( 2 ) こで、 h(G) (n)は、負の時間に値を有する第 2のインパルス応答ベクトル (n=— m ·, 0, · ··, Ν—l)である。
PCT/JP2007/054529 2006-02-10 2007-03-08 固定符号帳探索装置および固定符号帳探索方法 WO2007105587A1 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
KR1020127004264A KR101359147B1 (ko) 2006-03-10 2007-03-08 고정 코드북 탐색 장치 및 고정 코드북 탐색 방법
CN2007800028772A CN101371299B (zh) 2006-03-10 2007-03-08 固定码本搜索装置以及固定码本搜索方法
KR1020087017192A KR101359203B1 (ko) 2006-03-10 2007-03-08 고정 코드북 탐색 장치
CA2642804A CA2642804C (en) 2006-03-10 2007-03-08 Fixed codebook searching device and fixed codebook searching method
KR1020127004260A KR101359167B1 (ko) 2006-03-10 2007-03-08 고정 코드북 탐색 장치
MX2008011338A MX2008011338A (es) 2006-03-10 2007-03-08 Aparato de busqueda de libro de codigos fijo y metodo de busqueda de libro de codigos fijo.
AU2007225879A AU2007225879B2 (en) 2006-03-10 2007-03-08 Fixed codebook searching device and fixed codebook searching method
BRPI0708742-0A BRPI0708742A2 (pt) 2006-02-10 2007-03-08 aparelho de pesquisa de tabela de consulta fixa e método de pesquisa de tabela de consulta fixa

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006-065399 2006-03-10
JP2006065399 2006-03-10
JP2007027408A JP3981399B1 (ja) 2006-03-10 2007-02-06 固定符号帳探索装置および固定符号帳探索方法
JP2007-027408 2007-02-06

Publications (1)

Publication Number Publication Date
WO2007105587A1 true WO2007105587A1 (ja) 2007-09-20

Family

ID=37891857

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2007/054529 WO2007105587A1 (ja) 2006-02-10 2007-03-08 固定符号帳探索装置および固定符号帳探索方法

Country Status (15)

Country Link
US (4) US7519533B2 (ja)
EP (4) EP1942488B1 (ja)
JP (1) JP3981399B1 (ja)
KR (4) KR101359167B1 (ja)
CN (4) CN102194462B (ja)
AT (1) ATE400048T1 (ja)
AU (1) AU2007225879B2 (ja)
BR (1) BRPI0708742A2 (ja)
CA (1) CA2642804C (ja)
DE (3) DE602007001862D1 (ja)
ES (3) ES2329198T3 (ja)
MX (1) MX2008011338A (ja)
RU (2) RU2425428C2 (ja)
WO (1) WO2007105587A1 (ja)
ZA (1) ZA200807703B (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5159318B2 (ja) * 2005-12-09 2013-03-06 パナソニック株式会社 固定符号帳探索装置および固定符号帳探索方法
JPWO2007129726A1 (ja) * 2006-05-10 2009-09-17 パナソニック株式会社 音声符号化装置及び音声符号化方法
EP2293292B1 (en) 2008-06-19 2013-06-05 Panasonic Corporation Quantizing apparatus, quantizing method and encoding apparatus
CN105225669B (zh) * 2011-03-04 2018-12-21 瑞典爱立信有限公司 音频编码中的后量化增益校正
GB201115048D0 (en) * 2011-08-31 2011-10-19 Univ Bristol Channel signature modulation
CN103456309B (zh) * 2012-05-31 2016-04-20 展讯通信(上海)有限公司 语音编码器及其代数码表搜索方法和装置
ES2701402T3 (es) 2012-10-05 2019-02-22 Fraunhofer Ges Forschung Aparato para codificar una señal de voz empleando ACELP en el dominio de autocorrelación
WO2019053835A1 (ja) * 2017-09-14 2019-03-21 三菱電機株式会社 演算回路、演算方法、およびプログラム
CN109446413B (zh) * 2018-09-25 2021-06-01 上海交通大学 基于物品关联关系的序列化推荐方法
CN117476022A (zh) * 2022-07-29 2024-01-30 荣耀终端有限公司 声音编解码方法以及相关装置、系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10502191A (ja) * 1995-01-06 1998-02-24 フランス テレコム 代数的符号励振線形予測音声符号化方法
JPH10513571A (ja) * 1995-02-06 1998-12-22 ユニバーシティ ド シャーブルック スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳
JPH11501131A (ja) * 1995-03-10 1999-01-26 ユニバーシテ デ シャーブルク 会話の急速符号化のためのデプス第1代数コードブック
JP2006504123A (ja) * 2002-10-25 2006-02-02 ディリティアム ネットワークス ピーティーワイ リミテッド Celpパラメータの高速マッピング方法および装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
IT1264766B1 (it) * 1993-04-09 1996-10-04 Sip Codificatore della voce utilizzante tecniche di analisi con un'eccitazione a impulsi.
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6055496A (en) * 1997-03-19 2000-04-25 Nokia Mobile Phones, Ltd. Vector quantization in celp speech coder
JP3276356B2 (ja) 1998-03-31 2002-04-22 松下電器産業株式会社 Celp型音声符号化装置及びcelp型音声符号化方法
CN1296888C (zh) * 1999-08-23 2007-01-24 松下电器产业株式会社 音频编码装置以及音频编码方法
US6826527B1 (en) * 1999-11-23 2004-11-30 Texas Instruments Incorporated Concealment of frame erasures and method
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
SE521693C3 (sv) * 2001-03-30 2004-02-04 Ericsson Telefon Ab L M En metod och anordning för brusundertryckning
US6766289B2 (en) * 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
JP4108317B2 (ja) * 2001-11-13 2008-06-25 日本電気株式会社 符号変換方法及び装置とプログラム並びに記憶媒体
US6829579B2 (en) 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
KR100463559B1 (ko) 2002-11-11 2004-12-29 한국전자통신연구원 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
WO2004084182A1 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Decomposition of voiced speech for celp speech coding
KR100556831B1 (ko) * 2003-03-25 2006-03-10 한국전자통신연구원 전역 펄스 교체를 통한 고정 코드북 검색 방법
CN1240050C (zh) * 2003-12-03 2006-02-01 北京首信股份有限公司 一种用于语音编码的固定码本快速搜索方法
JP4605445B2 (ja) 2004-08-24 2011-01-05 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
SG123639A1 (en) * 2004-12-31 2006-07-26 St Microelectronics Asia A system and method for supporting dual speech codecs
JP2007027408A (ja) 2005-07-15 2007-02-01 Sony Corp 電子部品の吸着ノズル機構

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10502191A (ja) * 1995-01-06 1998-02-24 フランス テレコム 代数的符号励振線形予測音声符号化方法
JPH10513571A (ja) * 1995-02-06 1998-12-22 ユニバーシティ ド シャーブルック スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳
JPH11501131A (ja) * 1995-03-10 1999-01-26 ユニバーシテ デ シャーブルク 会話の急速符号化のためのデプス第1代数コードブック
JP2006504123A (ja) * 2002-10-25 2006-02-02 ディリティアム ネットワークス ピーティーワイ リミテッド Celpパラメータの高速マッピング方法および装置

Also Published As

Publication number Publication date
CN101371299A (zh) 2009-02-18
EP2113912B1 (en) 2018-08-01
EP1942489A1 (en) 2008-07-09
KR100806470B1 (ko) 2008-02-21
CN102201239A (zh) 2011-09-28
DE602007001861D1 (de) 2009-09-17
CN102201239B (zh) 2014-01-01
CN102194462A (zh) 2011-09-21
AU2007225879B2 (en) 2011-03-24
RU2008136401A (ru) 2010-03-20
EP2113912A1 (en) 2009-11-04
EP1833047B1 (en) 2008-07-02
EP1833047A1 (en) 2007-09-12
US8452590B2 (en) 2013-05-28
KR101359167B1 (ko) 2014-02-06
RU2458412C1 (ru) 2012-08-10
DE602007001862D1 (de) 2009-09-17
EP1942488A3 (en) 2008-07-23
EP1942489B1 (en) 2009-08-05
US7519533B2 (en) 2009-04-14
US20110202336A1 (en) 2011-08-18
CN102194461B (zh) 2013-01-23
CN102194461A (zh) 2011-09-21
CN101371299B (zh) 2011-08-17
CA2642804C (en) 2015-06-09
ZA200807703B (en) 2009-07-29
AU2007225879A1 (en) 2007-09-20
CN102194462B (zh) 2013-02-27
DE602007000030D1 (de) 2008-08-14
ATE400048T1 (de) 2008-07-15
ES2329199T3 (es) 2009-11-23
ES2329198T3 (es) 2009-11-23
KR20070092678A (ko) 2007-09-13
JP2007272196A (ja) 2007-10-18
KR20120032037A (ko) 2012-04-04
US20090228266A1 (en) 2009-09-10
ES2308765T3 (es) 2008-12-01
EP1942488B1 (en) 2009-08-05
US20090228267A1 (en) 2009-09-10
MX2008011338A (es) 2008-09-12
BRPI0708742A2 (pt) 2011-06-28
KR101359203B1 (ko) 2014-02-05
KR101359147B1 (ko) 2014-02-05
JP3981399B1 (ja) 2007-09-26
CA2642804A1 (en) 2007-09-20
KR20080101875A (ko) 2008-11-21
US7957962B2 (en) 2011-06-07
KR20120032036A (ko) 2012-04-04
US20070213977A1 (en) 2007-09-13
US7949521B2 (en) 2011-05-24
EP1942488A2 (en) 2008-07-09
RU2425428C2 (ru) 2011-07-27

Similar Documents

Publication Publication Date Title
WO2007105587A1 (ja) 固定符号帳探索装置および固定符号帳探索方法
US8352254B2 (en) Fixed code book search device and fixed code book search method
JP6400801B2 (ja) ベクトル量子化装置及びベクトル量子化方法
EP2099025A1 (en) Audio encoding device and audio encoding method
AU2011202622B2 (en) Fixed codebook searching apparatus and fixed codebook searching method
AU2011247874A1 (en) Fixed codebook searching apparatus and fixed codebook searching method

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 07738020

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 1020087017192

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 200780002877.2

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2007225879

Country of ref document: AU

WWE Wipo information: entry into national phase

Ref document number: 2642804

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: MX/a/2008/011338

Country of ref document: MX

ENP Entry into the national phase

Ref document number: 2008136401

Country of ref document: RU

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 1950/MUMNP/2008

Country of ref document: IN

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 07738020

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: PI0708742

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20080910

WWE Wipo information: entry into national phase

Ref document number: 1020127004264

Country of ref document: KR

Ref document number: 1020127004260

Country of ref document: KR