JP3137176B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3137176B2
JP3137176B2 JP07318071A JP31807195A JP3137176B2 JP 3137176 B2 JP3137176 B2 JP 3137176B2 JP 07318071 A JP07318071 A JP 07318071A JP 31807195 A JP31807195 A JP 31807195A JP 3137176 B2 JP3137176 B2 JP 3137176B2
Authority
JP
Japan
Prior art keywords
pulse
circuit
signal
search
search circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07318071A
Other languages
English (en)
Other versions
JPH09160596A (ja
Inventor
俊之 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP07318071A priority Critical patent/JP3137176B2/ja
Priority to US08/760,219 priority patent/US6094630A/en
Priority to EP96119541A priority patent/EP0778561B1/en
Priority to CA002192143A priority patent/CA2192143C/en
Priority to DE69624449T priority patent/DE69624449T2/de
Publication of JPH09160596A publication Critical patent/JPH09160596A/ja
Application granted granted Critical
Publication of JP3137176B2 publication Critical patent/JP3137176B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、再生音声信号と入
力音声信号との間の歪みを最小化するように励信号を
決定する音声符号化装置に関し、特に、音声信号を低演
算量で高品質に符号化するための音声符号化装置に関す
る。
【0002】
【従来の技術】従来、音声信号を4.8kbps以下の
低いビットレートで符号化する方式としては、例えば、
M.Schroeder氏とB.Atal氏による“C
ode−excited linear predic
tion:High quality speech
at very low bit rate”(Proc,I
CASSP,pp.937-940,1988 )と題した論文(文献1)や、
Kleijn氏らによる“Improved spee
ch quality and efficient
vector quantization in CE
LP”(Proc.ICASSP,pp.155-158,1988 年)と題した論
文(文献2)等に記載されているCELP(Code Excit
ed LPC Coding )型符号化方式が知られている。
【0003】このCELP型符号化方式は、送信側の符
号化では、まず、音声信号が形成する例えば20msの
フレーム毎に線形予測(LPC:Linear Predictive Co
ding)分析を用いて、音声信号のスペクトル特性を表す
スペクトルパラメータを音声信号から抽出し、更に、フ
レームを例えば5msのサブフレームに分割し、サブフ
レーム毎に過去の励振信号に基づいて適応コードブック
におけるパラメータ(ピッチ周期に対応する遅延パラメ
ータとゲインパラメータ)を抽出している。
【0004】次いで、CELP型符号化方式は、適応コ
ードブックにより前記サブフレームの音声信号をピッチ
予測し、予め定められた種類の雑音信号からなる雑音コ
ードブック(ベクトル量子化コードブック)から最適雑
音コードベクトルを選択して最適なゲインを計算するこ
とにより、励振信号を量子化している。
【0005】この際の、雑音コードベクトルの選択の仕
方は、選択した雑音コードベクトルを励振信号とみなし
て合成した再生音声信号と入力音声信号との誤差電力を
最小化するように行う。そして、選択された雑音コード
ベクトルの種類を表すインデクスおよびゲイン、並び
に、前記スペクトルパラメータおよび適応コードブック
のパラメータをマルチプレクサにより組み合わせて出力
し、伝送している。
【0006】受信側の復号手順については、従来同様で
よいので、この説明は省略する。
【0007】また、CELP型符号化方式のメモリ量と
演算量とを低減化する従来の方法として、J−P.Ad
oul氏らによる“Fast CELP coding
based on algebraic code
s”(Proc.ICASSP,pp.1957-1960,1987 )と題した論文
(文献3)に記載の代数的にパルス列を生成する方法が
ある。
【0008】次に、CELP型符号化方式において、従
来の代数的に生成されたパルス列を励振信号とした場合
の励振信号探索方法を説明する。
【0009】この探索方法による励振信号は、複数のチ
ャンネルから選択されたパルス列の和として表現され
る。ここで、パルス列は各チャンネル毎に予め定められ
たパルス位置候補から選択される。各パルスの振幅は極
性のみである。例えば、8kHzサンプリングでサブフ
レーム長が5msの場合(サンプル数N=8k×5m=
40になる)、サブフレームあたりの励振信号は、例え
ばP=5個のチャンネルから選択されたP=5個の単一
パルスの和として表される。この例では、P=5個のチ
ャンネルは、それぞれ予め定められたM(=N/P=4
0/5)=8個のパルス候補位置を有していることにな
る。
【0010】最適な励振信号の探索は、励振信号により
合成フィルタを励振して得られる再生音声信号と入力音
声信号との間の歪みを最小化するように行なわれる。こ
こで、励振信号がパルス列であることを利用すると再生
音声信号と入力音声信号との間の歪みの最小化は次の数
式1の最大化と等価になる。
【0011】
【数1】 ここで、符号a(i),[i=0,…,P−1]は、数
値“1”または数値“−1”であり、符号φ(i,
j),[i,j=0,…,N−1]は、合成フィルタに
おけるインパルス応答の自己相関関数であり、符号d
(i),[i=0,…,N−1]は、入力音声信号とイ
ンパルス応答信号から得られるターゲット信号である。
符号kは、励起信号を表す“m(i)”[i=0,…,
P−1]から得られ、“(1+log2 M)×P”ビ
ットで伝送できる。
【0012】数式1の評価関数による探索はP重のルー
プによって1本ずつ逐次的に行なうことができる。
【0013】
【発明が解決しようとする課題】上述した従来の音声符
号化方式では、励振信号の探索方法において、励振信号
を極性のみのパルス列として表しており、このパルス位
置の探索には全候補に対して1本ずつ逐次的に探索して
いるので、探索時の演算量が非常に多いという問題点が
ある。
【0014】一方、探索時の演算量を低減化するため
に、探索すべきパルス位置の予備選択を行なう場合に
は、量子化効率が劣化し、再生音声信号の品質が劣化す
るという問題点があった。
【0015】本発明の課題は、上述の問題点を解決し、
励振信号を表す最適なパルス列を低演算量で探索し、高
品質な再生音声を得ることができる音声符号化装置を提
供することである。
【0016】
【課題を解決するための手段】本発明による音声符号化
装置は、音声信号の励振信号を複数のパルス列の和とし
て表現し、前記パルス列それぞれの位置を予め定められ
たパルス位置候補から選択し、前記励振信号により合成
フィルタを励振して得られる再生音声信号と入力音声信
号との間の歪みを最小化するように前記励振信号を決定
する際、前記パルス列毎に逐次的にビタビアルゴリズム
を用いて探索し、前記励振信号を構成する複数のパルス
列の位置を決定している。
【0017】
【0018】
【0019】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0020】図1は本発明の音声符号化装置の実施の一
形態を示すブロック図である。
【0021】図1において、音声符号化装置は、フレー
ム分割回路51、サブフレーム分割回路52、スペクト
ルパラメータ計算回路53、スペクトルパラメータ量子
化回路54、聴感重み付け合成フィルタ係数算出回路5
5、聴感重み付け回路56、適応コードブック探索回路
57、パルス探索回路58、ゲインコードブック探索回
路59、およびマルチプレクサ50を備えている。
【0022】まず入力端子から入力された音声信号は、
フレーム分割回路51で、例えば20msのフレーム毎
に分割され、更に、サブフレーム分割回路52で、フレ
ームよりも短い、例えば5msのサブフレームに分割さ
れるものとする。
【0023】スペクトルパラメータ計算回路53は、少
なくとも一つのサブフレームの音声信号に対して、サブ
フレーム長(この例では、5ms、8kHzサンプリン
グの場合、サンプル数N=40)よりも長い例えば10
msの窓をかけて音声を切り出し、スペクトルパラメー
タをあらかじめ定められた、例えば10次の次数L(=
10)により計算するものとする。
【0024】ここでスペクトルパラメータの計算には、
周知のLPC分析を用いることができる。
【0025】更に、スペクトルパラメータ計算回路53
は、LPC分析により計算された線形予測係数a
(i),[i=1,…,L]を量子化や補間に適したL
SP(LineSpectrum Pair)パラメータに変換する。こ
こで、線形予測係数からLSPへ変換する技術には、菅
村他による“線スペクトル対(LSP)音声分析合成方
式による音声情報圧縮”と題した論文(電子通信学会論
文誌、J64−A、pp.599−606、1981
年)(文献5)が参照できる。前記線形予測係数は聴感
重み付け合成フィルタ係数算出回路55に出力され、前
記LSPパラメータはスペクトルパラメータ量子化回路
54に出力される。
【0026】スペクトルパラメータ量子化回路54は、
前記LSPパラメータを効率的に量子化する。LSPパ
ラメータのベクトル量子化の手法は周知の手法を用いる
ことができる。具体的な方法は、例えば、特開平4−1
71500号公報(文献6)等を参照できるのでここで
の説明は省略する。また、スペクトルパラメータ量子化
回路54は、量子化したLSPパラメータを線形予測係
数a(i),[i=1,…,L]に変換して聴感重み付
け合成フィルタ係数算出回路55に出力すると共に、量
子化LSPパラメータのコードベクトルを表す符号をマ
ルチプレクサ50に出力する。
【0027】聴感重み付け合成フィルタ係数算出回路
(以後、フィルタ係数算出回路と呼ぶ)55は、スペク
トルパラメータ計算回路53から量子化前の線形予測係
数を入力し、且つスペクトルパラメータ量子化回路54
から量子化後の線形予測係数を入力して、下記の数式2
で表される聴感重み付けフィルタの係数を算出し、聴感
重み付け回路56に出力する。更に、フィルタ係数算出
回路55は、線形予測合成フィルタと聴感重み付けフィ
ルタからなる聴感重み付け合成フィルタの係数を適応コ
ードブック探索回路57、パルス探索回路58、および
ゲインコードブック探索回路59に出力する。
【0028】
【数2】 ここで、R1,R2は聴感重み付け量を制御する重み係
数であり、例えば、それぞれ、R1=0.9、R2=
1.0が適用されるものとする。
【0029】聴感重み付け回路56は、フィルタ係数算
出回路55から入力された聴感重み付けフィルタの係数
より聴感重み付けフィルタを構成して入力信号を聴感重
み付けし、聴感重み付け入力信号X(n)を適応コード
ブック探索回路57、パルス探索回路58およびゲイン
コードブック探索回路59に出力する。
【0030】適応コードブック回路57は、過去の励振
信号を用いて、遅れ(ピッチ周期)dに対応する適応コ
ードベクトルAd(n)を、過去の励振信号から遅れd
のセグメントを切り出しサブフレーム長Nになるまで繰
り返し接続して作成し、作成した適応コードベクトルに
よる聴感重み付け合成信号と聴感重み付け入力信号との
誤差電力を最小化するようにピッチ周期d及び適応コー
ドベクトルAd(n)を選択する。
【0031】更に、適応コードブック回路57は、選択
されたピッチ周期dを表す符号をマルチプレクサ50に
出力し、選択された適応コードベクトルAd(n)をゲ
インコードブック探索回路59に出力すると共に、選択
された適応コードベクトルを聴感重み付け合成した信号
SAd(n)をパルス探索回路58に出力する。
【0032】パルス探索回路58は、聴感重み付け合成
フィルタの係数と聴感重み付け信号と適応コードベクト
ルを聴感重み付け合成した信号との3つを用いて最適な
パルス列Cj(n)を算出し、算出されたパルス列Cj
(n)をゲインコードブック探索回路59に出力すると
共に、パルス列Cj(n)を表す符号をマルチプレクサ
50に出力する。
【0033】パルス探索回路58は本発明の実施の複数
の形態を有するので、詳細については、後で図面を参照
して逐次説明する。
【0034】ゲインコードブック探索回路59は、適応
コードブック探索回路57から適応コードベクトルAd
(n)を入力し、パルス探索回路58からパルス列Cj
(n)を入力し、聴感重み付け回路56から聴感重み付
け入力信号を入力し、且つ聴感重み付け合成フィルタ係
数算出回路55から聴感重み付け合成フィルタの係数を
入力して聴感重み付け合成フィルタを形成する。
【0035】次いで、ゲインコードブック探索回路59
は、入力された適応コードベクトルAd(n)とパルス
列Cj(n)との線形和として下記の数式3に表される
励起信号Ek(n)を計算し、この計算された励起信号
Ek(n)により聴感重み付け合成フィルタを駆動して
得られる聴感重み付け合成信号と聴感重み付け入力信号
との誤差電力を最小化するようにゲインコードベクトル
を選択し、この選択されたゲインコードベクトルの符号
をマルチプレクサ50に出力する。
【0036】
【数3】 ここで、Gk(1),Gk(2)は、k番目の2次元ゲ
インコードベクトルである。
【0037】マルチプレクサ50は、量子化LSPパラ
メータのコードベクトルを表す符号をスペクトルパラメ
ータ量子化回路54から入力し、ピッチ周期を表す符号
を適応コードベクトル探索回路57から入力し、パルス
列を表す符号をパルス探索回路58から入力し、且つゲ
インコードベクトルを表す符号をゲインコードベクトル
探索回路59から入力してこれらを組み合わせ、送信端
子に出力する。
【0038】次に、図2から図4まで、それぞれを参照
して本発明の第1から第3までの発明の形態について順
次説明する。発明の形態の相違は、図1に示される音声
符号化装置におけるパルス探索回路58の構成にあり、
図2から図4までそれぞれは、パルス探索回路58の第
1から第3までの一形態を示すブロック図である。
【0039】まず、図2に図1を併せ参照して第1の形
態のパルス探索回路58について説明する。
【0040】図示されるように第1の形態のパルス探索
回路58は、ターゲット信号作成回路10、第1パルス
発生回路11から第5パルス発生回路15、パルス列符
号化回路20、および第1ビタビ探索回路21から第4
ビタビ探索回路24を備えている。
【0041】この構成により生成される励振信号は、複
数のチャンネルから選択されたパルス列の和として表現
される。ここで、パルス列は各チャンネル毎に予め定め
られたパルス位置候補から選択される。各パルスの振幅
は、極性のみである。例えば、8kHzサンプリングで
5msのサブフレーム長の場合(サンプル数N=40に
なる)、サブフレームあたりの励振信号を、例えばP
(=5)チャンネルから選択されたP(=5)個の単一
パルスの和として表すものとする。この例では、P(=
5)個のチャンネルは、それぞれ予め定められたM(=
N/P=40/5=8)個のパルス位置候補を有してい
る。
【0042】図2に示されるターゲット信号作成回路1
0は、フィルタ係数算出回路55から聴感重み付け合成
フィルタの係数を受け取って、聴感重み付け合成フィル
タを構成し、聴感重み付け回路56から受けた聴感重み
付け入力信号X(n)と、適応コードブック探索回路5
7から受けた適応コードベクトルを聴感重み付け合成し
た信号SAd(n)とにより、下記の数式4(数式内の
符号Gは数式5で表されている)による誤差信号z
(n)を算出する。
【0043】
【数4】
【0044】
【数5】 更に、ターゲット信号作成回路10は、この誤差信号z
(n)を聴感重み付け合成フィルタによりバックワード
フィルタリングしてターゲット信号d(n)を作成する
と共に、聴感重み付け合成フィルタにおけるインパルス
応答の自己相関関数φ(i,j)を作成し、ターゲット
信号d(n)および自己相関関数φ(i,j)を、第1
ビタビ探索回路21から第4ビタビ探索回路24までそ
れぞれに出力する。
【0045】第1パルス発生回路11は、予め定められ
た8個のパルス位置候補(例えば、N=0,5,10,
15,20,25,30,35)に対して単一パルスを
配置し、第1ビタビ探索回路21に出力するものとす
る。
【0046】第2パルス発生回路12は、予め定められ
た8個のパルス位置候補(例えば、N=1,6,11,
16,21,26,31,36)に対して単一パルスを
配置し、第1パルス発生回路11と同様、第1ビタビ探
索回路21に出力するものとする。
【0047】第3パルス発生回路13では、予め定めら
れた8個のパルス位置候補(例えば、N=2,7,1
2,17,22,27,32,37)に対して単一パル
スを配置し、第2ビタビ探索回路22に出力するものと
する。
【0048】第4パルス発生回路14では、予め定めら
れた8個のパルス位置候補(例えば、N=3,8,1
3,18,23,28,33,38)に対して単一パル
スを配置し、第3ビタビ探索回路23に出力するものと
する。
【0049】第5パルス発生回路15では、予め定めら
れた8個のパルス位置候補(例えば、N=4,9,1
4,19,24,29,34,39)に対して単一パル
スを配置し、第4ビタビ探索回路24に出力するものと
する。
【0050】尚、ここで挙げた第1パルス発生回路11
から第5パルス発生回路15までにおけるパルス位置候
補は、一例であり他のパルス位置候補の振り分けであっ
てもよい。
【0051】第1ビタビ探索回路21から第4ビタビ探
索回路24によるパルス列の探索は、2つのパルス発生
回路から受けた信号の最適な組み合わせをビタビ(Vite
rbi)アルゴリズムに基づいて選択することによって行
なわれている。
【0052】第1ビタビ探索回路21では、第2パルス
発生回路12から得られる8通りのパルス信号(パルス
位置m(1)=1,6,11,16,21,26,3
1,36)それぞれを配置する場合に、第1パルス発生
回路14から得られる8通りのパルス信号(パルス位置
m(0)=0,5,10,15,20,25,30,3
5)との最適な組合せが以下に示すビタビアルゴリズム
に基づいて選択される。
【0053】つまり、第1ビタビ探索回路21は、第2
パルス発生回路12の8通りのパルス信号毎に、第1パ
ルス発生回路11から得られる8通りのパルス信号を加
算し、得られた8通りのパルス信号のうち上記の数式1
で表される評価値P(この場合、P=2)を最大にする
パルス信号を選択することになる。結果として、第2パ
ルス発生回路12の各パルス位置候補を含むパルス信号
が候補として得られるので、これらが第2ビタビ探索回
路22に出力される。
【0054】第2ビタビ探索回路22では、第3パルス
発生回路13から得られる8通りのパルス信号(パルス
位置m(2)=2,7,12,17,22,27,3
2,37)それぞれを配置する場合に、第1ビタビ探索
回路21で選択されたパルス信号の中から最適な組合せ
が上記と同様にして選択されることにより、第3パルス
発生回路13の各パルス位置候補を含むパルス信号が候
補として得られるので、これらが第3ビタビ探索回路2
3に出力される。
【0055】同様にして、第3ビタビ探索回路23にお
いて探索が行なわれ、第4パルス発生回路14の各パル
ス位置候補(パルス位置m(3)=3,8,13,1
8,23,28,33,38)を含むパルス信号が候補
として得られるので、これらが第4ビタビ探索回路24
に出力される。
【0056】第4ビタビ探索回路24においても同様に
探索が行なわれ、第5パルス発生回路15の各パルス位
置候補(パルス位置m(4)=4,9,14,19,2
4,29,34,39)を含むパルス信号を得た後、最
後段である第4ビタビ探索回路24において、これらの
パルス信号の中でさらに、上記の数式1の評価値P(こ
の場合、P=5)を最大にするパルス信号が、最終的に
選択されてパルス列符号化回路23に出力される。
【0057】ここで、各パルス発生回路11〜15と各
ビタビ探索回路21〜24との接続方法は任意であり、
上述した接続以外、各パルス発生回路の優先度を上記の
数式1の評価値P(この場合、P=1)により決定し、
その優先度順に各パルス発生回路11〜15をビタビ探
索回路に接続する方法であってもよい。
【0058】パルス列符号化回路20では、第4ビタビ
探索回路24から入力されたパルス信号を構成するP
(=5)個のパルス位置から、符号が生成されてマルチ
プレクサ50に出力されると共に、パルス信号がゲイン
コードブック探索回路59に出力される。
【0059】次に、図3に図1および図2を併せ参照し
て第2の形態のパルス探索回路58について説明する。
【0060】図示される第2の形態のパルス探索回路5
8は、ターゲット信号作成回路10、第1パルス発生回
路11から第5パルス発生回路15、パルス列符号化回
路20、および第1予備探索回路31から第4予備探索
回路34を備えている。
【0061】図3では、図2に示された第1ビタビ探索
回路21から第4ビタビ探索回路24までの構成に対応
して、第1予備探索回路31から第4予備探索回路34
まで備えられている点が相違しており、その他の構成要
素には上記と機能が同一なので、同一の番号符号が付与
されている。
【0062】したがって、図3におけるターゲット信号
作成回路10、第1パルス発生回路11から第5パルス
発生回路15まで、およびパルス列符号化回路20それ
ぞれの接続先は、図2に示された第1ビタビ探索回路2
1〜第4ビタビ探索回路24それぞれに対応して、第1
予備探索回路31〜第4予備探索回路34に変更され
る。
【0063】この構成により生成される励振信号は上記
の第1の形態のパルス探索回路58と同様で、複数のチ
ャンネルから選択されたパルス列の和として表現され
る。ここで、パルス列は各チャンネル毎に予め定められ
たパルス位置候補から選択される。各パルスの振幅は、
極性のみである。例えば、8kHzサンプリングで5m
sのサブフレーム長の場合(サンプル数N=40にな
る)、サブフレームあたりの励振信号は、例えばP(=
5)チャンネルから選択されたP(=5)個の単一パル
スの和として表されるものとする。この例では、P(=
5)個のチャンネルは、それぞれ予め定められたM(=
N/P=40/5=8)個のパルス位置候補を有してい
る。
【0064】図3に示されるターゲット信号作成回路1
0は、上述同様フィルタ係数算出回路55から聴感重み
付け合成フィルタの係数を受け取って、聴感重み付け合
成フィルタを構成し、聴感重み付け回路56から受けた
聴感重み付け入力信号X(n)と、適応コードブック探
索回路57から受けた適応コードベクトルを聴感重み付
け合成した信号SAd(n)とにより、上記数式4で表
される誤差信号z(n)を算出する。
【0065】更に、ターゲット信号作成回路10は、こ
の誤差信号z(n)を聴感重み付け合成フィルタにより
バックワードフィルタリングしてターゲット信号d
(n)を作成すると共に、聴感重み付け合成フィルタの
インパルス応答の自己相関関数φ(i,j)を作成し、
ターゲット信号d(n)および自己相関関数φ(i,
j)を、図2とは相違して第1予備探索回路31から第
4予備探索回路34までそれぞれに出力する。
【0066】第1パルス発生回路11は、上記同様に、
予め定められた8個のパルス位置候補(例えば、N=
0,5,10,15,20,25,30,35)に対し
て単一パルスを配置し、第1予備探索回路31に出力す
るものとする。
【0067】以下同様に、第2パルス発生回路12は、
予め定められた8個のパルス位置候補(例えば、N=
1,6,11,16,21,26,31,36)に対し
て単一パルスを配置し、第1パルス発生回路11と同
様、第1予備探索回路31に出力するものとする。
【0068】第3パルス発生回路13は、予め定められ
た8個のパルス位置候補(例えば、N=2,7,12,
17,22,27,32,37)に対して単一パルスを
配置し、第2予備探索回路32に出力するものとする。
【0069】第4パルス発生回路14は、予め定められ
た8個のパルス位置候補(例えば、N=3,8,13,
18,23,28,33,38)に対して単一パルスを
配置し、第3予備探索回路33に出力するものとする。
【0070】第5パルス発生回路15は、予め定められ
た8個のパルス位置候補(例えば、N=4,9,14,
19,24,29,34,39)に対して単一パルスを
配置し、第4予備探索回路34に出力するものとする。
【0071】尚、ここで挙げたパルス発生回路11〜1
5におけるパルス位置候補も、上述したように、一例で
あり他のパルス位置候補を設定して振り分けてもよい。
【0072】本発明によるパルス列の探索は、パルスを
一本ずつチャンネル毎に増やして得られるパルス列をツ
リー(Tree)状構造に配置し、パルスを一本増やしてい
く毎に候補を予備選択することによって行なっている。
【0073】第1予備探索回路31は、第1パルス発生
回路11から得られるM(=8)通りのパルス信号(パ
ルス位置m(0)=0,5,10,15,20,25,
30,35)と第2パルス発生回路12から得られるM
(=8)通りのパルス信号(パルス位置m(1)=1,
6,11,16,21,26,31,36)とを組み合
わせたM2 (=82 =64)通りのパルス信号のうち、
上記数式1で表される評価値P(この場合、P=2)を
最大にする例えばQ(=8)個のパルス信号を予備選択
し、これらを第2予備探索回路32に出力するものとす
る。
【0074】第2予備探索回路32は、第3パルス発生
回路13から得られるM(=8)通りのパルス信号(パ
ルス位置m(2)=2,7,12,17,22,27,
32,37)と第1予備探索回路31で予備選択された
Q(=8)個のパルス信号とを組み合わせたQ×M(=
8×8=64)通りのパルス信号のうち、上記数式1で
表される評価値P(この場合、P=3)を最大にするQ
(=8)個のパルス信号を予備選択し、これらを第3予
備探索回路33に出力する。
【0075】同様にして、第3予備探索回路33におい
て、Q×M(=64)通りのパルス信号のうち、数式1
で表される評価値P(この場合、P=4)を最大にする
Q(=8)個のパルス信号が予備選択され、これらが第
4予備探索回路34に出力される。
【0076】第4予備探索回路34においても同様にし
て、第5パルス発生回路15から得られるM(=8)通
りのパルス信号(パルス位置m(4)=4,9,14,
19,24,29,34,39)と第3予備探索回路4
1で予備選択されたQ(=8)個のパルス信号とを組み
合わせたQ×M(=64)通りのパルス信号のうち、数
式1で表される評価値P(この場合、P=5)を最大に
するパルス信号が、最終的に選択され、パルス列符号化
回路43に出力される。
【0077】ここで、各パルス発生回路11〜15と各
予備探索回路31〜34との接続方法は、任意であり、
上述した接続方法以外、各パルス発生回路の優先度を数
式1の評価値P(この場合、P=1)により決定し、そ
の優先度順に各パルス発生回路を予備探索回路に接続し
ても良い。
【0078】パルス列符号化回路20も、上述の説明同
様、第4予備探索回路34から入力されたパルス信号を
構成するP(=5)個のパルスの位置から、符号を生成
し、マルチプレクサ50に出力すると共に、パルス信号
をゲインコードブック探索回路59に出力する。
【0079】次に、図4に図1および図2を併せ参照し
て第3の形態のパルス探索回路58について説明する。
【0080】図示される第3の形態のパルス探索回路5
8は、ターゲット信号作成回路10、第1パルス発生回
路11から第5パルス発生回路15、パルス列符号化回
路20、および第1探索回路41および第2探索回路4
2を備えている。
【0081】図4では、図2に示された第1ビタビ探索
回路21から第4ビタビ探索回路24までの4つの構成
に対応して、第1探索回路41および第2探索回路42
の2つの構成である点が相違しており、その他の構成要
素には上記と機能が同一なので、同一の番号符号が付与
されている。
【0082】したがって、図4におけるターゲット信号
作成回路10、第1パルス発生回路11から第5パルス
発生回路15まで、およびパルス列符号化回路20それ
ぞれの接続先は、図2に示された第1ビタビ探索回路2
1〜第4ビタビ探索回路24それぞれに対応した接続先
が変更されている。
【0083】この構成により生成される励振信号は上記
の第1の形態のパルス探索回路58と同様で、複数のチ
ャンネルから選択されたパルス列の和として表現され
る。ここで、パルス列は各チャンネル毎に予め定められ
たパルス位置候補から選択される。各パルスの振幅は、
極性のみである。例えば、8kHzサンプリングで5m
sのサブフレーム長の場合(サンプル数N=40にな
る)、サブフレームあたりの励振信号は、例えばP(=
5)チャンネルから選択されたP(=5)個の単一パル
スの和として表されるものとする。この例では、P(=
5)個のチャンネルは、それぞれ予め定められたM(=
N/P=40/5=8)個のパルス位置候補を有してい
る。また、P(=5)個のチャンネルは2個のグループ
に分けられるものとする。
【0084】図4に示されるターゲット信号作成回路1
0は、上述同様フィルタ係数算出回路55から聴感重み
付け合成フィルタの係数を受け取って、聴感重み付け合
成フィルタを構成し、聴感重み付け回路56から受けた
聴感重み付け入力信号X(n)と、適応コードブック探
索回路57から受けた適応コードベクトルを聴感重み付
け合成した信号SAd(n)とにより、上記数式4に表
される誤差信号z(n)を算出する。
【0085】更に、ターゲット信号作成回路10は、こ
の誤差信号z(n)を聴感重み付け合成フィルタにより
バックワードフィルタリングしてターゲット信号d
(n)を作成すると共に、聴感重み付け合成フィルタの
インパルス応答の自己相関関数φ(i,j)を作成し、
ターゲット信号d(n)および自己相関関数φ(i,
j)を、図2とは相違して第1探索回路41および第2
探索回路42それぞれに出力する。
【0086】第1パルス発生回路11は、予め定められ
た8個のパルス位置候補(例えば、N=0,5,10,
15,20,25,30,35)に対して単一パルスを
配置し、第1探索回路41に出力する。
【0087】第2パルス発生回路12は、予め定められ
た8個のパルス位置候補(例えば、N=1,6,11,
16,21,26,31,36)に対して単一パルスを
配置し、第1パルス発生回路11同様、第1探索回路4
1に出力する。
【0088】第3パルス発生回路13は、予め定められ
た8個のパルス位置候補(例えば、N=2,7,12,
17,22,27,32,37)に対して単一パルスを
配置し、これも第1パルス発生回路11同様、第1探索
回路41に出力する。
【0089】第4パルス発生回路14は、予め定められ
た8個のパルス位置候補(例えば、N=3,8,13,
18,23,28,33,38)に対して単一パルスを
配置し、第2探索回路42に出力する。
【0090】第5パルス発生回路15は、予め定められ
た8個のパルス位置候補(例えば、N=4,9,14,
19,24,29,34,39)に対して単一パルスを
配置し、第4パルス発生回路14同様、第2探索回路4
2に出力する。
【0091】尚、上述したように、ここで挙げたパルス
発生回路11〜14における位置候補は、一例であり他
のパルス位置候補により振り分けられてもよい。
【0092】次に、第1探索回路41は、第1パルス発
生回路54から得られるM(=8)通りのパルス信号
(パルス位置m(0)=0,5,10,15,20,2
5,30,35)と第2パルス発生回路55から得られ
るM(=8)通りのパルス信号(パルス位置m(1)=
1,6,11,16,21,26,31,36)と第3
パルス発生回路13から得られるM(=8)通りのパル
ス信号(パルス位置m(2)=2,7,12,17,2
2,27,32,37)とを組み合わせたM3 (=83
=512)通りのパルス信号のうち、上記数式1で表さ
れる評価値P(この場合、P=3)を最大にする例えば
Q(=8)個のパルス信号を予備選択し、これらを第2
探索回路42に出力する。
【0093】第2探索回路42は、第4パルス発生回路
14から得られるM(=8)通りのパルス信号(パルス
位置m(3)=3,8,13,18,23,28,3
3,38)と第5パルス発生回路15から得られるM
(=8)通りのパルス信号(パルス位置m(4)=4,
9,14,19,24,29,34,39)と第1探索
回路59で予備選択されたQ(=8)個のパルス信号と
を組み合わせたQ×M2 (=8×82 =512)通りの
パルス信号のうち、上記数式1で表される評価値P(こ
の場合、P=5)を最大にするパルス信号を最終的に選
択し、パルス列符号化回路20に出力する。
【0094】ここで、各パルス発生回路11〜15と各
探索回路41・42との接続方法は、上述同様、任意で
ある。
【0095】パルス列符号化回路20は、第2探索回路
42から入力されたパルス信号を構成するP(=5)個
のパルスの位置から、符号を生成してマルチプレクサ5
0に出力すると共に、パルス信号をゲインコードブック
探索回路59に出力する。
【0096】また、複数のパルス発生回路に対して設け
られ接続されるこの第3の実施の形態による探索回路に
は、第1の実施の形態によるビタビ探索回路を複数用い
てもよいし、第2の実施の形態による予備探索回路を複
数用いてもよい。
【0097】
【発明の効果】以上説明したように本発明によれば、音
声信号を符号化する際、励起信号を構成する複数のパル
ス列それぞれの位置候補をグループ分けし、各グループ
毎に探索を行なって励起信号を構成する複数のパルス列
の位置を決定するパルス探索回路を有する音声符号化装
置が得られる。この構成により、再生音声信号の品質を
劣化させることなく励起信号を構成するパルス列の探索
時の演算量を低減化することができるので、低演算量で
高品質な再生音声を得ることができる。
【図面の簡単な説明】
【図1】本発明による音声符号化装置の実施例を示すブ
ロック構成図である。
【図2】図1に示されるパルス探索回路の第1の実施の
形態を示すブロック構成図である。
【図3】図1に示されるパルス探索回路の第2の実施の
形態を示すブロック構成図である。
【図4】図1に示されるパルス探索回路の第3の実施の
形態を示すブロック構成図である。
【符号の説明】
10 ターゲット信号作成回路 11〜15 第1〜第5パルス発生回路 20 パルス列符号化回路 21〜24 第1〜第4ビタビ探索回路 31〜34 第1〜第4予備探索回路 41、42 第1・第2探索回路 50 マルチプレクサ 51 フレーム分割回路 52 サブフレーム分割回路 53 スペクトルパラメータ計算回路 54 スペクトルパラメータ量子化回路 55 (聴感重み付け合成)フィルタ係数算出回路 56 聴感重み付け回路 57 適応コードブック探索回路 58 パルス探索回路 59 ゲインコードブック探索回路
フロントページの続き (56)参考文献 特開 平4−271400(JP,A) Ikedo,J et.al.”Lo w Complexity speec h coder for person al multimedia comm unication”,Univers al Personal Commun ications 1995,1995 Fou rth IEEE Internati onal Conference o n,pp808−812 (58)調査した分野(Int.Cl.7,DB名) G10L 19/08

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声信号の励振信号を複数のパルス列の
    和として表現し、前記パルス列それぞれの位置を予め定
    められたパルス位置候補から選択し、前記励振信号によ
    り合成フィルタを励振して得られる再生音声信号と入力
    音声信号との間の歪みを最小化するように前記励振信号
    を決定する音声符号化装置において、前記パルス列毎に
    逐次的にビタビ(Viterbi )アルゴリズムを用いて探索
    し、前記励振信号を構成する複数のパルス列の位置を決
    定することを特徴とする音声符号化装置。
JP07318071A 1995-12-06 1995-12-06 音声符号化装置 Expired - Fee Related JP3137176B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP07318071A JP3137176B2 (ja) 1995-12-06 1995-12-06 音声符号化装置
US08/760,219 US6094630A (en) 1995-12-06 1996-12-04 Sequential searching speech coding device
EP96119541A EP0778561B1 (en) 1995-12-06 1996-12-05 Speech coding device
CA002192143A CA2192143C (en) 1995-12-06 1996-12-05 Speech coding device
DE69624449T DE69624449T2 (de) 1995-12-06 1996-12-05 Vorrichtung zur Sprachkodierung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07318071A JP3137176B2 (ja) 1995-12-06 1995-12-06 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH09160596A JPH09160596A (ja) 1997-06-20
JP3137176B2 true JP3137176B2 (ja) 2001-02-19

Family

ID=18095159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07318071A Expired - Fee Related JP3137176B2 (ja) 1995-12-06 1995-12-06 音声符号化装置

Country Status (5)

Country Link
US (1) US6094630A (ja)
EP (1) EP0778561B1 (ja)
JP (1) JP3137176B2 (ja)
CA (1) CA2192143C (ja)
DE (1) DE69624449T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6420090B1 (en) 1998-12-04 2002-07-16 Kansai Paint Co., Ltd. Liquid photocurable composition, water-based photocurable composition and resist pattern-forming method by use of the same

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6393391B1 (en) * 1998-04-15 2002-05-21 Nec Corporation Speech coder for high quality at low bit rates
CN1169117C (zh) * 1996-11-07 2004-09-29 松下电器产业株式会社 声源矢量生成装置以及声音编码装置和声音解码装置
JP3134817B2 (ja) 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
EP1752968B1 (en) * 1997-10-22 2008-09-10 Matsushita Electric Industrial Co., Ltd. Method and apparatus for generating dispersed vectors
KR100955126B1 (ko) * 1997-10-22 2010-04-28 파나소닉 주식회사 벡터 양자화 장치
JP3235543B2 (ja) * 1997-10-22 2001-12-04 松下電器産業株式会社 音声符号化/復号化装置
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
JP3268750B2 (ja) * 1998-01-30 2002-03-25 株式会社東芝 音声合成方法及びシステム
JP4173940B2 (ja) * 1999-03-05 2008-10-29 松下電器産業株式会社 音声符号化装置及び音声符号化方法
US20070150266A1 (en) * 2005-12-22 2007-06-28 Quanta Computer Inc. Search system and method thereof for searching code-vector of speech signal in speech encoder
CN100530357C (zh) * 2007-07-11 2009-08-19 华为技术有限公司 固定码书搜索方法及搜索器
CN101615395B (zh) 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
CN102687199B (zh) * 2010-01-08 2015-11-25 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置
US10592649B2 (en) 2017-08-09 2020-03-17 Nice Ltd. Authentication via a dynamic passphrase

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4038495A (en) * 1975-11-14 1977-07-26 Rockwell International Corporation Speech analyzer/synthesizer using recursive filters
US4220819A (en) * 1979-03-30 1980-09-02 Bell Telephone Laboratories, Incorporated Residual excited predictive speech coding system
GB2102254B (en) * 1981-05-11 1985-08-07 Kokusai Denshin Denwa Co Ltd A speech analysis-synthesis system
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
JPS61134000A (ja) * 1984-12-05 1986-06-21 株式会社日立製作所 音声分析合成方式
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
GB8527913D0 (en) * 1985-11-12 1985-12-18 Pa Consulting Services Analysing transitions in finite state machines
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5144671A (en) * 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
BR9106932A (pt) * 1990-09-28 1993-08-03 Philips Nv Sistema e processo para codificacao de sinais analogicos,sistema de decodificacao para obter um sinal analogico e processo de re-sintetizacao de sinais analogicos
JP3114197B2 (ja) 1990-11-02 2000-12-04 日本電気株式会社 音声パラメータ符号化方法
FI98104C (fi) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi
FI90477C (fi) * 1992-03-23 1994-02-10 Nokia Mobile Phones Ltd Puhesignaalin laadun parannusmenetelmä lineaarista ennustusta käyttävään koodausjärjestelmään
US5432883A (en) * 1992-04-24 1995-07-11 Olympus Optical Co., Ltd. Voice coding apparatus with synthesized speech LPC code book

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ikedo,J et.al."Low Complexity speech coder for personal multimedia communication",Universal Personal Communications 1995,1995 Fourth IEEE International Conference on,pp808−812

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6420090B1 (en) 1998-12-04 2002-07-16 Kansai Paint Co., Ltd. Liquid photocurable composition, water-based photocurable composition and resist pattern-forming method by use of the same

Also Published As

Publication number Publication date
EP0778561B1 (en) 2002-10-23
EP0778561A2 (en) 1997-06-11
DE69624449D1 (de) 2002-11-28
DE69624449T2 (de) 2003-06-18
CA2192143C (en) 2001-10-02
EP0778561A3 (en) 1998-09-02
US6094630A (en) 2000-07-25
JPH09160596A (ja) 1997-06-20
CA2192143A1 (en) 1997-06-07

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP3134817B2 (ja) 音声符号化復号装置
JP3196595B2 (ja) 音声符号化装置
JP3094908B2 (ja) 音声符号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP3137176B2 (ja) 音声符号化装置
US6581031B1 (en) Speech encoding method and speech encoding system
JP3266178B2 (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
US6192334B1 (en) Audio encoding apparatus and audio decoding apparatus for encoding in multiple stages a multi-pulse signal
JP3335841B2 (ja) 信号符号化装置
JP2970407B2 (ja) 音声の励振信号符号化装置
JP3308764B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
EP1154407A2 (en) Position information encoding in a multipulse speech coder
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3299099B2 (ja) 音声符号化装置
JP3144284B2 (ja) 音声符号化装置
JPH08234795A (ja) 音声符号化装置
JP3552201B2 (ja) 音声符号化方法および装置
JP3471542B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置
JP3144244B2 (ja) 音声符号化装置
JPH0844397A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071208

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081208

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091208

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091208

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101208

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101208

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111208

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111208

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121208

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121208

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131208

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees