JP3981399B1 - 固定符号帳探索装置および固定符号帳探索方法 - Google Patents

固定符号帳探索装置および固定符号帳探索方法 Download PDF

Info

Publication number
JP3981399B1
JP3981399B1 JP2007027408A JP2007027408A JP3981399B1 JP 3981399 B1 JP3981399 B1 JP 3981399B1 JP 2007027408 A JP2007027408 A JP 2007027408A JP 2007027408 A JP2007027408 A JP 2007027408A JP 3981399 B1 JP3981399 B1 JP 3981399B1
Authority
JP
Japan
Prior art keywords
vector
impulse response
matrix
fixed codebook
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007027408A
Other languages
English (en)
Other versions
JP2007272196A (ja
Inventor
宏幸 江原
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2007027408A priority Critical patent/JP3981399B1/ja
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to CN201110188743.2A priority patent/CN102201239B/zh
Priority to KR1020127004264A priority patent/KR101359147B1/ko
Priority to RU2008136401/09A priority patent/RU2425428C2/ru
Priority to CA2642804A priority patent/CA2642804C/en
Priority to CN2011101877341A priority patent/CN102194462B/zh
Priority to CN2011101875793A priority patent/CN102194461B/zh
Priority to KR1020127004260A priority patent/KR101359167B1/ko
Priority to KR1020087017192A priority patent/KR101359203B1/ko
Priority to US11/683,830 priority patent/US7519533B2/en
Priority to MX2008011338A priority patent/MX2008011338A/es
Priority to CN2007800028772A priority patent/CN101371299B/zh
Priority to PCT/JP2007/054529 priority patent/WO2007105587A1/ja
Priority to BRPI0708742-0A priority patent/BRPI0708742A2/pt
Priority to AU2007225879A priority patent/AU2007225879B2/en
Priority to KR1020070023587A priority patent/KR100806470B1/ko
Priority to EP09007849.4A priority patent/EP2113912B1/en
Priority to DE602007000030T priority patent/DE602007000030D1/de
Priority to ES08005995T priority patent/ES2329198T3/es
Priority to DE602007001861T priority patent/DE602007001861D1/de
Priority to ES07103936T priority patent/ES2308765T3/es
Priority to EP08005995A priority patent/EP1942488B1/en
Priority to EP08005996A priority patent/EP1942489B1/en
Priority to EP07103936A priority patent/EP1833047B1/en
Priority to ES08005996T priority patent/ES2329199T3/es
Priority to DE602007001862T priority patent/DE602007001862D1/de
Priority to AT07103936T priority patent/ATE400048T1/de
Application granted granted Critical
Publication of JP3981399B1 publication Critical patent/JP3981399B1/ja
Publication of JP2007272196A publication Critical patent/JP2007272196A/ja
Priority to ZA200807703A priority patent/ZA200807703B/xx
Priority to US12/392,880 priority patent/US7957962B2/en
Priority to US12/392,858 priority patent/US7949521B2/en
Priority to RU2011111943/08A priority patent/RU2458412C1/ru
Priority to US13/093,294 priority patent/US8452590B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Abstract

【課題】音源パルスにかけるフィルタが下三角行列で表せない特性であっても演算量の増加をわずかに抑え、準最適な固定符号帳探索を実現すること。
【解決手段】パルス音源ベクトルを生成する代数符号帳101と、負の時間に値を有するインパルス応答ベクトルに聴覚重み付け合成フィルタのインパルス応答を畳み込んで負の時間に値を有する第2のインパルス応答ベクトルを生成する畳み込み演算部151と、第2のインパルス応答ベクトルを用いてテプリッツ型の畳み込み行列を生成する行列生成部152と、代数符号帳101によって生成されたパルス音源ベクトルに行列生成部152によって生成された行列を畳み込む畳み込み演算部153と、を備える。
【選択図】図2

Description

本発明は、音声信号を符号励振線形予測(Code Excited Linear Prediction:CELP)型の音声符号化装置によって符号化する際に用いられる、固定符号帳探索装置および固定符号帳探索方法に関する。
CELP型音声符号化装置における固定符号帳の探索処理は、一般に音声符号化処理の中で最も多くの処理量を占めるため、従来からさまざまな固定符号帳の構成や固定符号帳の探索方法が開発されてきた。
探索のための処理量を比較的少なくすることができる固定符号帳として、ITU−T勧告G.729やG.723.1あるいは3GPP標準AMR等の国際標準コーデックに広く採用されている代数符号帳(Algebraic Codebook)を用いた固定符号帳(Fixed Codebook)が挙げられる(例えば非特許文献1〜3参照)。これらの固定符号帳では、代数符号帳から生成されるパルス数をスパースにすることによって、固定符号帳探索に要する処理量を少なくすることができる。その一方で、スパースなパルス音源で表現できる信号特性に限界があるため、符号化品質に問題を生じる場合がある。このような問題に対応するため、代数符号帳から生成されるパルス音源に特性を持たせるためのフィルタをかける手法が提案されている(例えば非特許文献4参照)。
ITU−T Recommendation G.729、"Coding of Speech at 8 kbit/s using Conjugate−structure Algebraic−Code−Excited Lineare−Prediction (CS−ACELP)"、1996年3月 ITU−T Recommendation G.723.1、"Dual Rate Speech Coder for Multimedia Communications Transmitting at 5.3 and 6.3 kbit/s"、1996年3月 3GPP TS 26.090、"AMR speech codec;Transcoding functions"V4.0.0、2001年3月 R.Hagen他、"Removal of sparse−excitation artifacts in CELP"、IEEE ICASSP‘98、pp.145〜148、1998
しかしながら、音源パルスにかけるフィルタが下三角のテプリッツ(Toeplitz)行列で表現できない場合(例えば、非特許文献4にあるような巡回畳み込み処理である場合等負の時間に値を有するフィルタの場合)、行列演算に余計なメモリや演算量が必要となる。
本発明の目的は、音源パルスにかけるフィルタが下三角行列で表せない特性であっても演算量の増加をわずかに抑え、準最適な固定符号帳探索を実現することのできる音声符号化装置等を提供することである。
本発明は、固定符号帳探索装置が、パルス音源ベクトルを生成するパルス音源ベクトル生成部と、負の時間に値を有するインパルス応答ベクトルに聴覚重み付け合成フィルタのインパルス応答を畳み込んで、負の時間に値を有する第2のインパルス応答ベクトルを生成する第1の畳み込み演算部と、前記第1の畳み込み演算部によって生成された第2のインパルス応答ベクトルを用いてテプリッツ型の畳み込み行列を生成する行列生成部と、前記パルス音源ベクトル生成部によって生成されたパルス音源ベクトルに前記行列生成部によって生成された行列を用いて畳み込み処理を行う第2の畳み込み演算部と、を具備することにより、上記目的を達成するものである。
また、本発明は、固定符号帳探索方法が、パルス音源ベクトルを生成するパルス音源ベクトル生成ステップと、負の時間に値を有するインパルス応答ベクトルに聴覚重み付け合成フィルタのインパルス応答を畳み込んで、負の時間に値を有する第2のインパルス応答ベクトルを生成する第1の畳み込み演算ステップと、前記第1の畳み込み演算ステップで生成された第2のインパルス応答ベクトルを用いてテプリッツ型の畳み込み行列を生成する行列生成ステップと、前記パルス音源ベクトルに前記テプリッツ型の畳み込み行列を用いて畳み込み処理を行う第2の畳み込み演算ステップと、を有することにより、上記目的を達成するものである。
本発明によれば、テプリッツ行列で表現されない伝達関数を下三角テプリッツ行列の行要素の一部を切り取った形の行列で近似するため、下三角テプリッツ行列で表される因果的なフィルタの場合とほとんど同じメモリ量と演算量で音声信号の符号化処理を行うことができる。
本発明は、下三角テプリッツ(Toeplitz)型行列の行要素を切り詰めた(truncate)行列を用いて固定符号帳の探索を行う構成に特徴を有する。
以下、本発明に係る実施の形態について、図を適宜参照しながら詳細に説明する。
(実施の形態)
図1は、本発明の一実施の形態に係る音声符号化装置における固定符号帳ベクトル生成装置100の構成を示すブロック図である。なお、本実施の形態では、固定符号帳ベクトル生成装置100は、携帯電話等の通信端末装置に搭載されて使用されるCELP型音声符号化装置の固定符号帳として使用されるものとする。
固定符号帳ベクトル生成装置100は、代数符号帳101、畳み込み演算部102を具備する。
代数符号帳101は、入力した符号帳インデックスkで指定される位置に音源パルスを代数的に配置して成るパルス音源ベクトルcを生成し、生成したパルス音源ベクトルを畳み込み演算部102へ出力する。代数符号帳の構造はどのようなものでも良く、例えばITU−T勧告G.729に記載されているものでも良い。
畳み込み演算部102は、代数符号帳101から入力したパルス音源ベクトルに、別途入力した負の時間に値を有するインパルス応答ベクトルを畳み込み、畳み込んだ結果のベクトルを固定符号帳ベクトルとして出力する。負の時間に値を有するインパルス応答ベクトルはどのようなものでも良いが、時間0の点における要素の振幅が最も大きく、ベクトル全体のエネルギの大半を時間0の点が占めているようなベクトルが好適である。また、非因果的な部分(すなわち、負の時間のベクトル要素)は、時間0の点を含む因果的な部分(すなわち、非負の時間のベクトル要素)よりもベクトル長が短いものが好適である。負の時間に値を有するインパルス応答ベクトルは、固定のベクトルとしてメモリに予め記憶されていても良いし、逐次計算によって求められる可変のベクトルであっても良い。以下、本実施の形態では、負の時間に値を有するインパルス応答が時間“−m”から値を有する(すなわち、時間“−m−1”以前は全て0である)例について具体的に説明する。
図1において、入力された固定符号帳インデックスkによって固定符号帳から生成されたパルス音源ベクトルcを畳み込みフィルタF(図1における畳み込み演算部102に相当)と図示しない聴覚重み付け合成フィルタHに通して得られる聴覚重み付け合成信号sは、次の(1)式のように表される。
Figure 0003981399
ここで、h(n)、n=0,…,N−1は聴覚重み付け合成フィルタのインパルス応答、f(n)、n=−m,…,N−1は非因果的なフィルタのインパルス応答(すなわち負の時間に値を有するインパルス応答)、c(n)、n=0,…,N−1はインデックスkで指定されるパルス音源ベクトル、をそれぞれ示している。
固定符号帳の探索は、次の(2)式を最大化するkを見つけることによって行われる。なお、(2)式において、Cはインデックスkで指定されるパルス音源ベクトル(固定符号帳ベクトル)cを畳み込みフィルタFと聴覚重み付け合成フィルタHに通して得られる聴覚重み付け合成信号sと後述するターゲットベクトルxとの内積(あるいは相互相関)であり、Eはcを畳み込みフィルタFと聴覚重み付け合成フィルタHに通して得られる聴覚重み付け合成信号sのエネルギ(すなわち|s|)である。
Figure 0003981399
xは、CELP音声符号化におけるターゲットベクトルと呼ばれるもので、聴覚重み付け入力音声信号から聴覚重み付け合成フィルタのゼロ入力応答を除去して得られるベクトルである。聴覚重み付け入力音声信号とは、符号化対象としている入力音声信号に聴覚重み付けフィルタをかけて得られる信号である。聴覚重み付けフィルタとは、一般に入力音声信号の線形予測分析を行って得られる線形予測係数を用いて構成される全極型または極零型のフィルタであり、CELP型音声符号化装置においては広く利用されているものである。聴覚重み付け合成フィルタとは、CELP型音声符号化装置によって量子化された線形予測係数を用いて構成される線形予測フィルタ(すなわち合成フィルタ)と前述の聴覚重み付けフィルタとを従属接続したフィルタである。これらの構成要素は本実施の形態では図示していないが、CELP型音声符号化装置においては一般的であり、例えばITU−T勧告G.729にも、「ターゲットベクトル(target vector)」、「重み付け合成フィルタ(weighted synthesis filter) 」、「聴覚重み付け合成フィルタのゼロ入力応答(zero−input response of the weighted synthesis filter)」について記載されている。なお、添え字tは転置であることを示す。
しかしながら、(1)式からも分かるように、負の時間に値を有するインパルス応答を畳み込んだ聴覚重み付け合成フィルタのインパルス応答を畳み込む行列H”は、第1列〜第m列が畳み込むインパルス応答の一部または全ての非因果的な成分を切り詰めたものを用いて計算されるため、畳み込むインパルス応答の全ての非因果的な成分を用いて計算される第(m+1)列以降の列成分と異なってしまい、テプリッツ型にならない。このため、h(1)〜h(m)のm種類のインパルス応答を別々に計算して保持しておかなければならず、dおよびΦの計算に要する演算量およびメモリ量の増大を招く。
そこで、(2)式を次の(3)式で近似する。
Figure 0003981399
ここで、d'は次の(4)式で表される。
Figure 0003981399
すなわちd'(i)は、次の(5)式で表される。
Figure 0003981399
ここで、x(n)はターゲットベクトルの第n要素(n=0,1,…,N−1、Nは音源信号の符号化の処理単位時間であるフレームもしくはサブフレーム長)、h(0)(n)は聴覚重み付けフィルタのインパルス応答に負の時間に値を有するインパルス応答を畳み込んだベクトルの第n要素(n=−m,0,…,N−1)をそれぞれ示す。ターゲットベクトルはCELP符号化で一般的に使用されるもので、聴覚重み付け入力音声信号から聴覚重み付け合成フィルタのゼロ入力応答を除去して得られるベクトルである。h(0)(n)は、聴覚重み付け合成フィルタのインパルス応答h(n)(n=0,1,…,N−1)に、非因果的なフィルタ(インパルス応答f(n),n=−m,…,0,…,N−1)をかけて得られるベクトルで、次の(6)式で表される。h(0)(n)も非因果的なフィルタのインパルス応答となる(n=−m,…,0,…,N−1)。
Figure 0003981399
また、行列Φ’は次の(7)式で表される。
Figure 0003981399
すなわち、行列Φ’の各要素φ’(i,j)は次の(8)式で表される。
Figure 0003981399
すなわち、行列H”の第p列要素h(p)(n)、p=1〜m、を他の列の要素h(0)(n)で近似したものが行列H’である。この行列H’は、下三角テプリッツ型行列の行要素を切り詰めたテプリッツ型行列である。このような近似を行っても、負の時間に値を有するインパルス応答ベクトルのうち、非因果的な要素(負の時間の成分)のエネルギが因果的な要素(負でない、つまり0を含む正の時間の成分)のエネルギに比べて十分小さい場合は近似による影響は小さい。また、近似が行われるのは、行列H”の第1列から第m列要素に限定されるので(ここでmは非因果的な要素の長さ)、mが短いほど近似の影響は無視できるようになる。
一方、(3)式の近似を用いる場合と用いない場合とでは、行列Φ’とΦの演算量に大きな差が出る。例えば、負の時間に値を有するインパルス応答を畳み込まない通常の代数符号帳における行列Φ=HH(Hは(1)式における聴覚重み付けフィルタのインパルス応答を畳み込む下三角テプリッツ型行列)を求める場合と比較して考えた場合、(8)式から明らかなように、(3)式の近似を用いた場合の行列Φ’は基本的にm回の積和演算が増えるだけである。また、ITU−T勧告G.729のCコードでも行われているように、φ’(i,j)は、(j−i)が等しい要素(例えば、φ’(N−2,N−1)、φ’(N−3,N−2)、…、φ’(0,1))は再帰的に求めることができ、効率的に計算ができるという特徴があるので、全ての行列要素の計算にm回の積和演算が追加されるわけではない。
これに対して、(3)式の近似を用いない場合の行列Φは、φ(p,k)=φ(k、p)、p=0,…,m、k=0,…,N−1、の要素が、その他の行列要素と異なるインパルス応答ベクトルの相関計算を行う(つまり、h(0)とh(0)の相関ではなく、h(0)とh(p)、p=1〜m、の相関を求める)必要がある。これらの要素は、再帰的に求めたときの最後のほうで計算結果が得られる要素である。つまり、前述した、「再帰的に求めることができるので、行列Φの要素を効率的に計算することができる」という利点が失われてしまう。このことは、負の時間に値を有するインパルス応答ベクトルの非因果的な要素の数にほぼ比例する形で演算量が増加することを意味する(例えば、m=1の場合でも、2倍近くの演算量となる)。
図2は、上述した固定符号帳探索方法を実現する固定符号帳探索装置150の一例を示すブロック図である。
負の時間に値を有するインパルス応答ベクトルと聴覚重み付け合成フィルタのインパルス応答ベクトルとが畳み込み演算部151に入力される。畳み込み演算部151は、(6)式によりh(0)(n)を算出し、行列生成部152へ出力する。
行列生成部152は、畳み込み演算部151より入力されたh(0)(n)を用いて行列H’を生成し、畳み込み演算部153へ出力する。
畳み込み演算部153は、代数符号帳101より入力されるパルス音源ベクトルcに行列生成部152より入力される行列H’の要素h(0)(n)を畳み込んで加算器154へ出力する。
加算器154は、畳み込み演算部153から入力される聴覚重み付け合成信号と別途入力されるターゲットベクトルとの差分信号を算出し、誤差最小化部155へ出力する。
誤差最小化部155は、加算器154から入力される差分信号のエネルギが最小となるパルス音源ベクトルcを生成する符号帳インデックスkを特定する。
図3は図1に示した固定符号帳ベクトル生成装置100を固定符号帳ベクトル生成部100aとして備えたCELP型音声符号化装置200の一例を表すブロック図である。
入力音声信号は、前処理部201へ入力される。前処理部201は、直流成分の除去などの前処理を行い、処理後の信号を線形予測分析部202および加算器203へ出力する。
線形予測分析部202は、前処理部201より入力した信号の線形予測分析を行い、分析結果である線形予測係数をLPC量子化部204および聴覚重み付けフィルタ205へ出力する。
加算器203は、前処理部201より入力した前処理後の入力音声信号と、合成フィルタ206より入力した合成音声信号との差信号を算出し、聴覚重み付けフィルタ205へ出力する。
LPC量子化部204は、線形予測分析部202から入力した線形予測係数の量子化および符号化処理を行い、量子化LPCを合成フィルタ206へ、符号化結果をビットストリーム生成部212へ、それぞれ出力する。
聴覚重み付けフィルタ205は、線形予測分析部202より入力した線形予測係数を用いて構成される極零型のフィルタで、加算器203より入力した、前処理後の入力音声信号と合成音声信号との差信号にフィルタ処理を施し、誤差最小化部207へ出力する。
合成フィルタ206はLPC量子化部204より入力した量子化線形予測係数によって構築される線形予測フィルタであり、加算器211より駆動信号を入力し、線形予測合成処理を行って合成音声信号を加算器203へ出力する。
誤差最小化部207は、聴覚重み付けフィルタ205より入力される信号のエネルギが最も小さくなるように、適応符号帳ベクトル生成部208、固定符号帳ベクトル生成部100a、適応符号帳ベクトルと固定符号帳ベクトルに対する利得に関するパラメータを決定し、それらの符号化結果をビットストリーム生成部212に出力する。
適応符号帳ベクトル生成部208は、過去に加算器211から入力した駆動信号をバッファリングする適応符号帳を有し、適応符号帳ベクトルを生成して増幅器209へ出力する。適応符号帳ベクトルは誤差最小化部207からの指示によって特定される。
増幅器209は、誤差最小化部207から入力される適応符号帳利得を適応符号帳ベクトル生成部208から入力した適応符号帳ベクトルに乗じて加算器211へ出力する。
固定符号帳ベクトル生成部100aは、図1に示した固定符号帳ベクトル生成装置100と同じ構成であり、誤差最小化部207より符号帳インデックスや非因果的なフィルタのインパルス応答に関する情報を入力し、固定符号帳ベクトルを生成して増幅器210へ出力する。
増幅器210は、誤差最小化部207から入力される固定符号帳利得を固定符号帳ベクトル生成部100aから入力した固定符号帳ベクトルに乗じて加算器211へ出力する。
加算器211は、増幅器209および210から入力した利得乗算後の適応符号帳ベクトルおよび固定符号帳ベクトルとの加算を行い、結果をフィルタ駆動信号として合成フィルタ206へ出力する。
ビットストリーム生成部212は、LPC量子化部204より入力した線形予測係数(すなわちLPC)の符号化結果と、誤差最小化部207より入力した適応符号帳ベクトルおよび固定符号帳ベクトルおよびそれらに対する利得情報の符号化結果と、を入力し、ビットストリームに変換して出力する。
なお、誤差最小化部207における固定符号帳ベクトルのパラメータを決定する際に、前述した固定符号帳探索方法が用いられ、実際の固定符号帳探索装置は図2に示したようなものが用いられる。
このように、本実施の形態では、負の時間に値を有するインパルス応答特性を持つフィルタ(一般に非因果的なフィルタと呼ばれる)を代数符号帳から生成された音源ベクトルにかける場合に、非因果的なフィルタと聴覚重み付け合成フィルタとを従属接続した処理ブロックの伝達関数を非因果的な部分の長さの行数だけ行列要素を切り詰めた(truncateした)下三角テプリッツ型行列によって近似する。この近似によって代数符号帳の探索に要する演算量の増加を抑えることができる。また、非因果的な要素の数が因果的な要素の数よりも少なく、かつ/または、非因果的な要素のエネルギが因果的な要素のエネルギよりも小さい場合、前記近似による符号化品質への影響は抑えられる。
なお、本実施の形態について、以下のように変形したり応用したりしても良い。
非因果的なフィルタのインパルス応答の因果的な成分の数を非因果的な成分の数よりも大きい範囲内で特定の数に限定しても良い。
なお、本実施の形態では固定符号帳探索時の処理についてのみ説明した。CELP型音声符号化装置では、固定符号帳探索の後、利得量子化が行われるのが普通である。その際、聴覚重み付け合成フィルタを通した固定音源符号帳ベクトル(すなわち、選択された固定音源符号帳ベクトルを聴覚重み付け合成フィルタに通して得られる合成信号)が必要とされるので、固定符号帳探索終了後に、この「聴覚重み付け合成フィルタを通した固定音源符号帳ベクトル」を算出するのが普通である。このとき使用するインパルス応答畳み込み行列は、探索時に用いた近似のインパルス応答畳み込み行列H(0)ではなく、第1〜m列(=非因果的要素の数がmの場合)の要素のみが他の要素と異なっている行列H”を用いたほうがよい。
また、本実施の形態では、非因果的な部分(すなわち、負の時間のベクトル要素)は、時間0の点を含む因果的な部分(すなわち、非負の時間のベクトル要素)よりもベクトル長が短いものが好適であるとしたが、非因果的な部分の長さはN/2未満(Nはパルス音源ベクトルの長さ)に設定する。
以上、本発明の実施の形態について説明した。
本発明に係る固定符号帳探索装置や音声符号化装置等は、上記実施の形態に限定されず、種々変更して実施することが可能である。
本発明に係る固定符号帳探索装置や音声符号化装置等は、移動体通信システムにおける通信端末装置及び基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置及び移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係る固定符号帳探索方法や音声符号化方法等のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明の固定符号帳探索装置や音声符号化装置等と同様の機能を実現することができる。
なお、上記実施の形態において用いた「固定符号帳」「適応符号帳」は、「固定音源符号帳」「適応音源符号帳」と称しても良い。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてありえる。
本発明に係る固定符号帳探索装置等は、代数符号帳を固定符号帳として利用するCELP型音声符号化装置において、大きな演算量およびメモリ量の増加なしに非因果的なフィルタ特性を代数符号帳から生成されたパルス音源ベクトル付加することができるという効果を有し、利用可能なメモリ量に制限があり、かつ、低速での無線通信を強いられる携帯電話等の通信端末装置等における音声符号化装置の固定符号帳探索に有用である。
本発明の一実施の形態に係る音声符号化装置の固定符号帳ベクトル生成装置を示すブロック図 本発明の一実施の形態に係る音声符号化装置の固定符号帳探索装置の一例を示すブロック図 本発明の一実施の形態に係る音声符号化装置の一例を示すブロック図
符号の説明
100 固定符号帳ベクトル生成装置
101 代数符号帳
102 畳み込み演算部
150 固定符号帳探索装置
151 畳み込み演算部
152 行列生成部
153 畳み込み演算部
154 加算器
155 誤差最小化部
200 CELP型音声符号化装置
201 前処理部
202 線形予測分析部
203 加算器
204 LPC量子化部
205 聴覚重み付けフィルタ
206 合成フィルタ
207 誤差最小化部
208 適応符号帳ベクトル生成部
209 増幅器
210 増幅器
211 加算器
212 ビットストリーム生成部

Claims (7)

  1. パルス音源ベクトルを生成するパルス音源ベクトル生成部と、
    負の時間に値を有するインパルス応答ベクトルに聴覚重み付け合成フィルタのインパルス応答を畳み込んで、負の時間に値を有する第2のインパルス応答ベクトルを生成する第1の畳み込み演算部と、
    前記第1の畳み込み演算部によって生成された第2のインパルス応答ベクトルを用いてテプリッツ型の畳み込み行列を生成する行列生成部と、
    前記パルス音源ベクトル生成部によって生成されたパルス音源ベクトルに前記行列生成部によって生成された行列を用いて畳み込み処理を行う第2の畳み込み演算部と、を具備する、固定符号帳探索装置。
  2. 前記テプリッツ型の畳み込み行列は、以下の(1)式の行列H’で表される、請求項1記載の固定符号帳探索装置。
    Figure 0003981399
    ここで、h(0)(n)は、負の時間に値を有する第2のインパルス応答ベクトル(n=−m,…,0,…,N−1)である。
  3. 前記第2のインパルス応答ベクトルの負の時間成分のエネルギが非負の時間成分のエネルギに比べて小さい、請求項1記載の固定符号帳探索装置。
  4. 前記第2のインパルス応答ベクトルの負の時間成分の時間長が非負の時間成分の時間長に比べて短い、請求項1記載の固定符号帳探索装置。
  5. 前記第2の負の時間に値を有するインパルス応答ベクトルの負の時間成分が1つである、請求項1記載の固定符号帳探索装置。
  6. パルス音源ベクトルを生成するパルス音源ベクトル生成ステップと、
    負の時間に値を有するインパルス応答ベクトルに聴覚重み付け合成フィルタのインパルス応答を畳み込んで、負の時間に値を有する第2のインパルス応答ベクトルを生成する第1の畳み込み演算ステップと、
    前記第1の畳み込み演算ステップで生成された第2のインパルス応答ベクトルを用いてテプリッツ型の畳み込み行列を生成する行列生成ステップと、
    前記パルス音源ベクトルに前記テプリッツ型の畳み込み行列を用いて畳み込み処理を行う第2の畳み込み演算ステップと、を有する、固定符号帳探索方法。
  7. 前記テプリッツ型の畳み込み行列は、以下の(2)式の行列H’で表される、請求項6記載の固定符号帳探索方法。
    Figure 0003981399
    ここで、h(0)(n)は、負の時間に値を有する第2のインパルス応答ベクトル(n=−m,…,0,…,N−1)である。
JP2007027408A 2006-02-10 2007-02-06 固定符号帳探索装置および固定符号帳探索方法 Expired - Fee Related JP3981399B1 (ja)

Priority Applications (32)

Application Number Priority Date Filing Date Title
JP2007027408A JP3981399B1 (ja) 2006-03-10 2007-02-06 固定符号帳探索装置および固定符号帳探索方法
KR1020087017192A KR101359203B1 (ko) 2006-03-10 2007-03-08 고정 코드북 탐색 장치
RU2008136401/09A RU2425428C2 (ru) 2006-03-10 2007-03-08 Устройство поиска в фиксированных таблицах кодирования и способ поиска в фиксированных таблицах кодирования
CA2642804A CA2642804C (en) 2006-03-10 2007-03-08 Fixed codebook searching device and fixed codebook searching method
CN2011101877341A CN102194462B (zh) 2006-03-10 2007-03-08 固定码本搜索装置
CN2011101875793A CN102194461B (zh) 2006-03-10 2007-03-08 固定码本搜索装置
CN201110188743.2A CN102201239B (zh) 2006-03-10 2007-03-08 固定码本搜索装置以及固定码本搜索方法
KR1020127004264A KR101359147B1 (ko) 2006-03-10 2007-03-08 고정 코드북 탐색 장치 및 고정 코드북 탐색 방법
US11/683,830 US7519533B2 (en) 2006-03-10 2007-03-08 Fixed codebook searching apparatus and fixed codebook searching method
MX2008011338A MX2008011338A (es) 2006-03-10 2007-03-08 Aparato de busqueda de libro de codigos fijo y metodo de busqueda de libro de codigos fijo.
CN2007800028772A CN101371299B (zh) 2006-03-10 2007-03-08 固定码本搜索装置以及固定码本搜索方法
PCT/JP2007/054529 WO2007105587A1 (ja) 2006-03-10 2007-03-08 固定符号帳探索装置および固定符号帳探索方法
BRPI0708742-0A BRPI0708742A2 (pt) 2006-02-10 2007-03-08 aparelho de pesquisa de tabela de consulta fixa e método de pesquisa de tabela de consulta fixa
AU2007225879A AU2007225879B2 (en) 2006-03-10 2007-03-08 Fixed codebook searching device and fixed codebook searching method
KR1020127004260A KR101359167B1 (ko) 2006-03-10 2007-03-08 고정 코드북 탐색 장치
KR1020070023587A KR100806470B1 (ko) 2006-03-10 2007-03-09 고정 코드북 탐색 장치 및 고정 코드북 탐색 방법
EP09007849.4A EP2113912B1 (en) 2006-03-10 2007-03-12 Fixed codebook searching apparatus and method
ES08005995T ES2329198T3 (es) 2006-03-10 2007-03-12 Aparato para busqueda en el libro de codificacion fijo.
DE602007001861T DE602007001861D1 (de) 2006-03-10 2007-03-12 Vorrichtung zur Suche in einem festen Codebuch
ES07103936T ES2308765T3 (es) 2006-03-10 2007-03-12 Aparato y metodo para busqueda en un libro de codificacion fijo.
EP08005995A EP1942488B1 (en) 2006-03-10 2007-03-12 Fixed codebook searching apparatus
EP08005996A EP1942489B1 (en) 2006-03-10 2007-03-12 Fixed codebook searching apparatus
EP07103936A EP1833047B1 (en) 2006-03-10 2007-03-12 Fixed codebook searching apparatus and fixed codebook searching method
ES08005996T ES2329199T3 (es) 2006-03-10 2007-03-12 Aparato para busqueda en el libro de codificacion fijo.
DE602007001862T DE602007001862D1 (de) 2006-03-10 2007-03-12 Vorrichtung zur Suche in einem festen Codebuch
AT07103936T ATE400048T1 (de) 2006-03-10 2007-03-12 Vorrichtung und verfahren zur suche in einem festen codebuch
DE602007000030T DE602007000030D1 (de) 2006-03-10 2007-03-12 Vorrichtung und Verfahren zur Suche in einem festen Codebuch
ZA200807703A ZA200807703B (en) 2006-03-10 2008-09-08 Fixed codebook searching device and fixed codebook searching method
US12/392,880 US7957962B2 (en) 2006-03-10 2009-02-25 Fixed codebook searching apparatus and fixed codebook searching method
US12/392,858 US7949521B2 (en) 2006-03-10 2009-02-25 Fixed codebook searching apparatus and fixed codebook searching method
RU2011111943/08A RU2458412C1 (ru) 2006-03-10 2011-03-29 Устройство поиска фиксированных таблиц кодирования и способ поиска фиксированных таблиц кодирования
US13/093,294 US8452590B2 (en) 2006-03-10 2011-04-25 Fixed codebook searching apparatus and fixed codebook searching method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006065399 2006-03-10
JP2007027408A JP3981399B1 (ja) 2006-03-10 2007-02-06 固定符号帳探索装置および固定符号帳探索方法

Publications (2)

Publication Number Publication Date
JP3981399B1 true JP3981399B1 (ja) 2007-09-26
JP2007272196A JP2007272196A (ja) 2007-10-18

Family

ID=37891857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007027408A Expired - Fee Related JP3981399B1 (ja) 2006-02-10 2007-02-06 固定符号帳探索装置および固定符号帳探索方法

Country Status (15)

Country Link
US (4) US7519533B2 (ja)
EP (4) EP1942488B1 (ja)
JP (1) JP3981399B1 (ja)
KR (4) KR101359147B1 (ja)
CN (4) CN102194462B (ja)
AT (1) ATE400048T1 (ja)
AU (1) AU2007225879B2 (ja)
BR (1) BRPI0708742A2 (ja)
CA (1) CA2642804C (ja)
DE (3) DE602007001862D1 (ja)
ES (3) ES2308765T3 (ja)
MX (1) MX2008011338A (ja)
RU (2) RU2425428C2 (ja)
WO (1) WO2007105587A1 (ja)
ZA (1) ZA200807703B (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5159318B2 (ja) * 2005-12-09 2013-03-06 パナソニック株式会社 固定符号帳探索装置および固定符号帳探索方法
JPWO2007129726A1 (ja) * 2006-05-10 2009-09-17 パナソニック株式会社 音声符号化装置及び音声符号化方法
WO2009153995A1 (ja) 2008-06-19 2009-12-23 パナソニック株式会社 量子化装置、符号化装置およびこれらの方法
CN105225669B (zh) * 2011-03-04 2018-12-21 瑞典爱立信有限公司 音频编码中的后量化增益校正
GB201115048D0 (en) 2011-08-31 2011-10-19 Univ Bristol Channel signature modulation
CN103456309B (zh) * 2012-05-31 2016-04-20 展讯通信(上海)有限公司 语音编码器及其代数码表搜索方法和装置
SG11201502613XA (en) * 2012-10-05 2015-05-28 Fraunhofer Ges Forschung An apparatus for encoding a speech signal employing acelp in the autocorrelation domain
US11281746B2 (en) * 2017-09-14 2022-03-22 Mitsubishi Electric Corporation Arithmetic operation circuit, arithmetic operation method, and program
CN109446413B (zh) * 2018-09-25 2021-06-01 上海交通大学 基于物品关联关系的序列化推荐方法
CN116052700B (zh) * 2022-07-29 2023-09-29 荣耀终端有限公司 声音编解码方法以及相关装置、系统

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
IT1264766B1 (it) * 1993-04-09 1996-10-04 Sip Codificatore della voce utilizzante tecniche di analisi con un'eccitazione a impulsi.
FR2729245B1 (fr) 1995-01-06 1997-04-11 Lamblin Claude Procede de codage de parole a prediction lineaire et excitation par codes algebriques
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6055496A (en) * 1997-03-19 2000-04-25 Nokia Mobile Phones, Ltd. Vector quantization in celp speech coder
JP3276356B2 (ja) 1998-03-31 2002-04-22 松下電器産業株式会社 Celp型音声符号化装置及びcelp型音声符号化方法
DE60043601D1 (de) * 1999-08-23 2010-02-04 Panasonic Corp Sprachenkodierer
US6826527B1 (en) * 1999-11-23 2004-11-30 Texas Instruments Incorporated Concealment of frame erasures and method
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
SE521693C3 (sv) * 2001-03-30 2004-02-04 Ericsson Telefon Ab L M En metod och anordning för brusundertryckning
US6766289B2 (en) * 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
JP4108317B2 (ja) * 2001-11-13 2008-06-25 日本電気株式会社 符号変換方法及び装置とプログラム並びに記憶媒体
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463559B1 (ko) 2002-11-11 2004-12-29 한국전자통신연구원 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
WO2004084467A2 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Recovering an erased voice frame with time warping
KR100556831B1 (ko) * 2003-03-25 2006-03-10 한국전자통신연구원 전역 펄스 교체를 통한 고정 코드북 검색 방법
CN1240050C (zh) * 2003-12-03 2006-02-01 北京首信股份有限公司 一种用于语音编码的固定码本快速搜索方法
JP4605445B2 (ja) 2004-08-24 2011-01-05 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
SG123639A1 (en) * 2004-12-31 2006-07-26 St Microelectronics Asia A system and method for supporting dual speech codecs
JP2007027408A (ja) 2005-07-15 2007-02-01 Sony Corp 電子部品の吸着ノズル機構

Also Published As

Publication number Publication date
US7949521B2 (en) 2011-05-24
KR20120032037A (ko) 2012-04-04
KR20120032036A (ko) 2012-04-04
EP1942489A1 (en) 2008-07-09
EP1942488A2 (en) 2008-07-09
CN102194462B (zh) 2013-02-27
ES2308765T3 (es) 2008-12-01
AU2007225879A1 (en) 2007-09-20
CN102194461A (zh) 2011-09-21
AU2007225879B2 (en) 2011-03-24
EP1942489B1 (en) 2009-08-05
RU2008136401A (ru) 2010-03-20
US7519533B2 (en) 2009-04-14
EP1942488A3 (en) 2008-07-23
CN102201239B (zh) 2014-01-01
EP2113912B1 (en) 2018-08-01
DE602007001862D1 (de) 2009-09-17
RU2458412C1 (ru) 2012-08-10
CN101371299A (zh) 2009-02-18
KR101359147B1 (ko) 2014-02-05
US8452590B2 (en) 2013-05-28
CA2642804A1 (en) 2007-09-20
EP1833047B1 (en) 2008-07-02
JP2007272196A (ja) 2007-10-18
ES2329198T3 (es) 2009-11-23
US20110202336A1 (en) 2011-08-18
CN102194461B (zh) 2013-01-23
KR20070092678A (ko) 2007-09-13
DE602007000030D1 (de) 2008-08-14
US20070213977A1 (en) 2007-09-13
ES2329199T3 (es) 2009-11-23
US7957962B2 (en) 2011-06-07
CN101371299B (zh) 2011-08-17
KR101359203B1 (ko) 2014-02-05
KR20080101875A (ko) 2008-11-21
BRPI0708742A2 (pt) 2011-06-28
KR100806470B1 (ko) 2008-02-21
CA2642804C (en) 2015-06-09
US20090228266A1 (en) 2009-09-10
DE602007001861D1 (de) 2009-09-17
EP1942488B1 (en) 2009-08-05
EP2113912A1 (en) 2009-11-04
KR101359167B1 (ko) 2014-02-06
RU2425428C2 (ru) 2011-07-27
CN102194462A (zh) 2011-09-21
CN102201239A (zh) 2011-09-28
ATE400048T1 (de) 2008-07-15
EP1833047A1 (en) 2007-09-12
MX2008011338A (es) 2008-09-12
WO2007105587A1 (ja) 2007-09-20
ZA200807703B (en) 2009-07-29
US20090228267A1 (en) 2009-09-10

Similar Documents

Publication Publication Date Title
JP3981399B1 (ja) 固定符号帳探索装置および固定符号帳探索方法
JP5159318B2 (ja) 固定符号帳探索装置および固定符号帳探索方法
US20100049508A1 (en) Audio encoding device and audio encoding method
JP2019012278A (ja) ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法
AU2011247874B2 (en) Fixed codebook searching apparatus and fixed codebook searching method
AU2011202622B2 (en) Fixed codebook searching apparatus and fixed codebook searching method
ZA200903293B (en) Fixed codebook searching device and fixed codebook searching method

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070626

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070629

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100706

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110706

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110706

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120706

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120706

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130706

Year of fee payment: 6

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees