JPH10207495A - 音声情報処理装置 - Google Patents

音声情報処理装置

Info

Publication number
JPH10207495A
JPH10207495A JP9008356A JP835697A JPH10207495A JP H10207495 A JPH10207495 A JP H10207495A JP 9008356 A JP9008356 A JP 9008356A JP 835697 A JP835697 A JP 835697A JP H10207495 A JPH10207495 A JP H10207495A
Authority
JP
Japan
Prior art keywords
vector
excitation
sound source
speech
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9008356A
Other languages
English (en)
Inventor
Akiko Susa
明子 須佐
Toru Okamoto
亨 岡本
Masahiro Tsujikawa
真寛 辻川
Yoshiaki Asakawa
吉章 浅川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9008356A priority Critical patent/JPH10207495A/ja
Publication of JPH10207495A publication Critical patent/JPH10207495A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 CELP符号化方式における、最適音源ベク
トルの検索を高速化し、同処理に使用するメモリ量を削
減する。 【解決手段】 複数の音源ベクトルからなる音源符号帳
を格納した音源ベクトルメモリ10と、しきい値比較部
20と、音声合成部30と、入力音声信号のベクトル要
素と前記メモリから読み出したベクトル要素を検索処理
する評価関数算出部40と、評価関数の最大値を検出す
る最大値比較部50とからなるCELP符号化器におい
て、音源符号帳をベクトルの要素を数要素ずつずらして
重ねあわせた形(オーバーラップ)に構成し、比較部2
0において読み出した音源ベクトル要素を予め設定した
しきい値Eとの比較し、値がしきい値以上の要素のみ、
評価関数演算を行うようにした。また、この比較による
削減処理量を大きくするため、評価関数算出部内の音声
合成にインパルス応答を使用した。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、無線通信などに用
いられる符号励振線形予測(CELP:code excited l
inear prediction)符号化方式、および該符号化方式の
符号器および/または復号器を備えて構成される音声情
報処理装置に関するものである。
【0002】
【従来の技術】本発明における符号励振線形予測(CE
LP)符号化方式は、アナログの音声信号をディジタル
データに変換する符号化とその符号化データを音声信号
に戻す復号化の方式の一種で、予め用意した数十の振幅
データの組合せからなる音声ベクトルを組み合わせて伝
送速度10Kb/s程度に符号化する方式である。この
CELP方式は、入力音声が有声音か無声音か判別し、
有声音にはパルス音源を、無声音には雑音源を使用して
符号化または復号化している。この符号化方式は、無声
音時の処理量が有声音時の処理量に比較して多いことか
ら、DSP(Digital signal processor)による符号化
/復号化処理上の隘路となっていた。CELP方式自体
は、同業者にとって公知なので、本明細書では詳細な説
明は割愛する。
【0003】図7および図8を用いて、従来のCELP
方式に用いる、符号器および復号器の全体構成を説明す
る。図7に示すように、CELP符号器は、線形予測分
析部501と、聴覚重み付フィルタ部502と、重み付
合成フィルタ部503と、有声音用の適応コードブック
を有した適応コードブック検索部504と、無声音用の
統計コードブック(音源符号帳)を有した統計コードブ
ック検索部505と、2乗和演算部506と、2乗誤差
最小化部507と、伝送ビット多重化部508とから構
成される。CELP符号器は、有声音に対しては、適応
コードブックを用いて、無声音に対しては統計コードブ
ックを用いて、入力音声に最適の音源ベクトルを検索
し、線形予測係数α、適応コードブックに対する利得
β、統計コードブックに対する利得γ、最適適応コード
ベクトルインデックスL、最適統計ベクトルインデック
スIを多重して送出する。
【0004】図8に示すように、CELP復号器は、伝
送ビット多重分離部511と、適応コードブックを有し
た適応コードベクトル検索部512と、統計コードブッ
クを備えた統計コードベクトル検索部513と、復号化
合成フィルタ部514と、ポストフィルタ部515とか
ら構成される。CELP復号器は、受信したベクトルイ
ンデックスに基づいて、適応コードブックから最適な音
源ベクトルを取り出して有声音の、統計コードブックか
ら最適な音源ベクトルを取り出して無声音の音声出力に
復号する。
【0005】CELP方式においては、符号化器に備え
られる適応コードブックおよび統計コードブックと、復
号化器に備えられる適応コードブックおよび統計コード
ブックは、それぞれ同一のコードブックが用いられる。
【0006】上記した通常のCELP符号化方式におい
て、統計コードブックは、図1(A)に示すように、ベ
クトル次元長の音源ベクトルデータ列を、伝送するビッ
ト数に対応する数(音源ベクトル数)だけ、音源ベクト
ルとして音源符号帳(統計コードブック)に格納してい
る。例えば、サンプリング周波数が8kHz、フレーム
長が40ms、サブフレーム長が10ms、線形予測次数が
10次、伝送ビット数が6ビットのシステムにおいて、
音源ベクトル次元数は80となり、音源ベクトル数は6
4となる。以下、この条件下において説明する。
【0007】CELP符号器において、最適な音源ベク
トルを検索する際には、統計コードブックから検索対象
のベクトルインデックスに対応する音源ベクトルを読み
出し、評価関数へ入力している。重み付合成フィルタ部
で読み出した音源ベクトルデータCjに、重み付合成フ
ィルタをかける。重み付合成フィルタ関数H(z)は、
現フレームの重み付合成フィルタ係数α[k]を用いる
と、下記(1)式のように表わされる。
【0008】
【数1】 ここで、Npは線形予測次数を示し、一般的な例として
Np=10としている。この重み付けフィルタ部503
は、検索対象となる入力音源ベクトルCjに線形予測係
数αを乗じて、合成音声ベクトルSjを出力する。
【0009】合成音声ベクトルSjの要素Sj[i]を、
下記の(2)式,(3)式に入力し、評価値Ci,Giを
演算する。
【0010】
【数2】 ここでp[i]は、重み付入力音声から過去の重み付合
成フィルタの影響であるゼロ入力応答などを減算したデ
ータ列である。また、jは音源ベクトルインデックス
(0〜63)を示し、iは音源ベクトルの要素番号(0
〜79)を示す。これらの値から、次の(4)式で示さ
れる評価関数を演算する。
【0011】
【数3】 この値が最大となる音源ベクトルを、現フレームの最適
音源ベクトルとして最適コードベクトルインデックスを
得る。
【0012】
【発明が解決しようとする課題】上述の従来技術のCE
LP符号化方式においては、音源ベクトルメモリの要素
数が、各音源ベクトルを構成する要素数すなわちベクト
ル次元数iと音源ベクトル数jとの積と同じになっている
が、符号化音声品質を維持するためには、音源ベクトル
数jを極端に削減することはできない。そのため、メモ
リ量が膨大なものとなっている。また、全ての音源ベク
トルに対して評価関数を計算するため、演算量も膨大と
なっている。
【0013】例えば、前記従来技術で述べた条件下で
は、(1)式の合成フィルタ演算を行うだけでも、サブ
フレーム毎に51,200回の積和演算を必要とする。
この演算量は、汎用の浮動小数点DSPを用いた場合、
1秒間の演算量を示すMIPS(Million Instruction
Per Second)値は、5.12MIPSとなる。また、そ
の他の演算も含めると、積和演算だけでも、全部で6
2,240回、6.22MIPSとなり、DSPの演算
能力が20MIPSとすると、その30%以上に達す
る。さらに、同条件下でのメモリ量は、5,120word
必要である。
【0014】符号化装置全体のDSP数やメモリ量は、
実用上制限されることが多い。よって、従来技術におい
ては、装置を実現する上で、処理量とメモリ量を削減す
ることが重要である。CELP方式の処理量、コードブ
ックメモリ量を大幅に削減する方法として、VSELP
(Vector-Sum Excited Linear Prediction)方式が知られ
ている。この方式は、メモリに少数(m個)の基底ベクト
ルのみ格納しておき、基底ベクトルの加算もしくは減算
によって、2のm乗個の音源ベクトルを構成するもので
ある。しかしながら、音源ベクトルのこのような構造上
の制約によって、従来型のCELPと同等の符号化音声
品質を達成するためには、より多くのビットが必要であ
ることが知られている。
【0015】本発明の目的は、従来型のCELP方式に
おいて、無声音時の処理量とメモリ量の削減を達成する
ことである。
【0016】
【課題を解決するための手段】CELP方式における音
源符号帳に格納される音源ベクトルは、雑音源から構成
されることから、上記課題を解決するために、本発明
は、音源符号帳の構成を、次のように変更する。すなわ
ち、本発明は、例えば雑音源から得られた一連の音源ベ
クトル列をメモリに格納して音源符号帳を構成する。こ
の音源ベクトル列は、各ベクトルを数要素ずつずらして
重ね合わせ(オーバラップ)て格納したものとして扱
い、ベクトル次元数iと音源ベクトル数(音源ベクトル
数)jとの積よりも少ない要素数にすることによって、
メモリへの格納量を大幅に減少させる。音源ベクトルを
読み出すに当たっては、読み出す音源ベクトルの先頭ア
ドレスを制御して、対象とする音源ベクトルをその先頭
アドレスからベクトル次元数で切り出し、音源ベクトル
として使用する。この方法(オーバーラップ)によっ
て、メモリ量を削減することができる。統計コードブッ
ク(音源符号帳)のオーバーラップの概念を図1(B)
に示す。但し、ここでも、サンプリング周波数、フレー
ム長、サブフレーム長、線形予測次数、伝送ビット数、
音源ベクトル次元数、音源ベクトル数などの条件は前述
した従来技術の条件と同様とする。
【0017】既に述べたように、従来のCELP方式の
音源符号帳は、図1(A)に示すように、雑音から得ら
れた例えば音源ベクトル次元数80の一連の音源ベクト
ルを、それぞれの音源ベクトルごとに対応したアドレス
(コードベクトルインデックス)に格納していた。した
がって、この方法では、音源ベクトル数jと音源ベクト
ル次元数iの積に相当するメモリ容量が必要であった。
図1(B)に示すように、本発明にかかるオーバラップ
型の音源符号帳は、連続した雑音を一連の音源ベクトル
要素列として格納し、この音源ベクトル要素列に順次コ
ードベクトルインデックスCjを付与して音源ベクトル
としている。音源符号帳から音源ベクトルを読み出すに
当たっては、コードインデックスCjを先頭に音源ベク
トル次元数i分の音源ベクトル要素Cj[i]を切り出し
て音源ベクトルとする。このような音源符号帳とするこ
とによって、音源符号帳を格納するメモリ容量を大幅に
少なくすることができる。
【0018】次に、処理量を削減する方法として、ベク
トル要素の間引き(スパース化)を行う。重み付合成フィ
ルタでの演算は、前述の(1)式の形ではスパース化の
効果があらわれない。復号化音声を作成する音源ベクト
ル中の要素数iを減らしていくと、元のベクトルの要素
数から10%程度まで削減しても、復号化した音声は、
主観的な品質が劣化しないことがわかっている。これ
は、1986年IEEE. ICASSP.において発表された論
文、”ComplexityReduction Methods for Vector Excita
tion Coding”(Grant Davidson,Allen Gersho共著)
に示されている。これに基づき、本発明は、音源ベクト
ルメモリから読み出した音源ベクトル要素の値Ciをし
きい値Eと比較し、しきい値以上のベクトル要素につい
てのみ、合成フィルタの演算を行うようにする。この方
法によれば、フィルタの初期内容を0にセットすること
ができるので、合成フィルタのインパルス応答hを使用
して演算すると、スパース化により大幅に処理を削減す
ることができる。
【0019】スパース化の例を図2に示す。すなわち、
統計コードブックに格納された音源ベクトルCjを構成
する音源ベクトル要素Cj[i]のデータ列が図2(A)
に示される内容だとする。図2(B)に示すように統計
コードブックから読み出された音源ベクトルデータをし
きい値Eと比較し、図2(C)に示すようにしきい値を
越えた音源ベクトル要素Cj[i]データのみを評価関数
算出部へ送るようにする。このことによって、データの
間引きによる処理量の減少に加えて、データがオーバラ
ップしていることから、各音源ベクトルにおける演算処
理は、相違する部分のみを対象とすればよくその処理量
を大幅に減少することができる。
【0020】
【発明の実施の形態】本発明にかかる符号励振線形予測
(CELP)符号化器の構成を、図7および図3を用い
て説明する。図7において、本発明に特徴的な部分を破
線で囲んで示し、破線で囲まれた部分の詳細な構成を図
3に示す。以後、簡単化のため、該当部分についてのみ
述べ、他の部分の説明は省略する。以下、図面を参照し
て、本発明の実施例について説明する。なお、これらの
実施例では、従来技術と同様に、音声のサンプリング周
波数を8KHz、フレーム長を40ms、サブフレーム長
を10ms、線形予測次数を10次、音源ベクトル数を6
4としたCELP方式に適用した場合を想定して説明す
る。この時、音源ベクトル次元数は80である。
【0021】図3に、本発明による音源ベクトルの構成
と検索方法の一実施例を示す。本実施例は、複数の音源
ベクトルCjからなる音源符号帳が格納された音源ベク
トルメモリ10と、音源ベクトルCjのベクトル要素Cj
[i]としきい値Eとを比較し、しきい値以上のベクト
ル要素Cj[i]のみからなるスパース化音源ベクトルC
´jを出力するしきい値比較部20と、スパース化音源
ベクトルC´jとインパルス応答hから合成音声ベクト
ルSjを作成する音声合成部30と、合成音声ベクトル
Sjと重み付入力音声のゼロ入力応答減算後の重み付入
力音声pとから前記(4)式で示される評価関数Ci2
Giを算出する評価関数算出部40と、順次入力される
評価値Ci2/Giの最大値joptをとる最大値比較部50
と、最大値比較部の最大値jopt出力に基づいて音源ベク
トルメモリ10から評価値が最大の音源ベクトルを取り
出して最適な音源ベクトルを作成する出力作成部60と
を有して構成される。
【0022】ここで、各構成要素について説明する。音
源ベクトルメモリ10は、図1(B)に示した音源ベク
トルの先頭アドレスを少なくとも1要素(音源ベクトル
次元)ずつずらしたオーバーラップ形の音源ベクトル要
素列からなる音源符号帳が格納されている。しきい値比
較部20は、音源ベクトルメモリから読み出した音源ベ
クトルCjのベクトル要素Cj[i]がしきい値E以上か
どうか判定し、しきい値E以上のベクトル要素Cj[i]
のみからなるスパース化音源ベクトルC´jを、音声合
成部30に入力する。
【0023】音声合成部30は、図7に示した重み付合
成フィルタ部503と同等であり、重み付合成フィルタ
部のインパルス応答hを入力し、合成音声ベクトルSj
を算出する。評価関数算出部40は、音声合成部30の
出力である合成音声ベクトルSjと、重み付入力音声か
ら重み付合成フィルタのゼロ入力応答を減算したデータ
pとから、評価関数Ci2/Giを算出する。比較部50
は、評価関数算出部40から入力される評価関数の評価
値Ci2/Giをそれまで演算した評価関数の最大評価値
Mと比較して、算出した評価値Ci2/Giが最大値かど
うかを判定し、すべての音源ベクトル検索が終了した時
点で、最大評価値に対応する音源ベクトルのインデック
スjoptを出力する。出力作成部60は、最適な音源ベク
トルインデックスjoptを用いて、音源ベクトルメモリ1
0の内容から、最適な音源ベクトルCjを作成し、出力
する。
【0024】次に、本実施例の動作を説明する。音源ベ
クトルメモリ10から切り出された音源ベクトルCjの
要素Cj[i]は、比較部20でしきい値Eと比較され、
しきい値を越えたスパース化音源ベクトルC´jを音声
合成部30へ出力する。ここで、jは音源ベクトルイン
デックス(この場合は0〜63)、iは音源ベクトルの
要素番号(同じく0〜79)を示す。音声合成部30で
は、図示を省略した図7に示される線形予測分析部50
1で入力音声の線形予測分析によって求められた、重み
付合成フィルタのインパルス応答hを入力し、合成音声
Sjを演算する。合成フィルタ係数の計算は、公知公用
の方法を使用している。合成音声の演算は前述の(1)
式のように表わされるが、このフィルタの初期内容が、
0で置き換えられるため、次の(5)式のように表わす
ことも可能である。
【0025】
【数4】 ここで、hは重み付合成フィルタのインパルス応答を示
す。*は畳込み演算を示すので、次元数80の音源ベク
トルCjを入力した時の出力sjは、次の(6)式ように
計算される。
【0026】
【数5】 但しこの式において、Cj[i]の値がしきい値E以上で
なければ、Cj[i]を含む項の計算は行わない。
【0027】上式で演算した合成音声Sjは、重み付入
力音声から重み付合成フィルタのゼロ入力応答を減算し
たデータpと一緒に、評価関数算出部40に入力され
る。評価関数算出部40では、前記(2),(3),
(4)式と同じ処理を行う。評価関数算出部40で演算
された評価値Ci2/Giは、最大値比較部50に入力さ
れる。最大値比較部50では、これまでの最大評価値M
と比較するが、最初に検索したベクトルの場合、Mに現
在の評価値を置き換える。
【0028】その後、次の音源ベクトルの読み出しへと
戻るが、本発明では、図1に示すように、音源ベクトル
の内容が重なっている。特に本実施例では、ベクトル間
のずれを1要素としているので、合成音声の演算である
(6)式は、次の(7)式のように簡単化できる。ここ
で、Cj-1が1つ前の検索ベクトルで、Sj-1はCj-1か
ら求めた合成音声である。
【0029】
【数6】 また、音源符号帳の最後から音源ベクトルを検索する
と、(7)式はさらに次の(8)式のように簡単化でき
る。ここでは、Cj+1が前の検索ベクトルになるので、
Sj+1が1つ前の合成音声となる。
【0030】
【数7】 よって、2番目以降の音源ベクトルの検索処理におい
て、音源ベクトルから合成音声を演算するには、重なっ
ていないベクトル要素についてのみ、計算すればよい。
(8)式においては、Cj[0]を含む項のみを計算する。
ここでも、このCj[0]の値がしきい値以上でなければ、
この計算は行わない。
【0031】その後、前記の処理と同様に各音源ベクト
ルに対する評価値Ci2/Giを演算し、最小評価値を検
索する。そして、全ベクトルに対して、以上の処理が終
了した時の最大評価値Mの値に対応する音源ベクトルイ
ンデックスjoptを出力作成部60に入力する。
【0032】出力作成部60では、音源ベクトルメモリ
10内の音源符号帳の要素と音源ベクトルインデックス
joptから、入力音声に対する最適な音源ベクトルを作成
し、出力する。
【0033】本実施例において、2番目以降の音源ベク
トルの検索処理では、合成音声の演算が1要素分の積和
演算で可能であり、またこの演算も、ベクトル要素がし
きい値以下ならば必要ない。これにより、本実施例の条
件下において、(1)式に示される評価関数演算を行う
と、積和演算は、従来51,200回必要であるのに対
し、スパース化音源ベクトルC´jの要素数を元の音源
ベクトル要素数の40%となるようにしきい値Eを設定
したところ、7,104回にまで削減することができ、
約86%の処理削減が可能となった。また、音源ベクト
ルメモリのワード数は、5,120個必要であったのに
対し、143個にまで削減された。
【0034】図4を用いて、本発明かかる符号化器の第
2実施例を説明する。本実施例の符号化器は、音源符号
帳を格納した音源ベクトルメモリ11と、ベクトル要素
と0とを比較する0比較部21と、音声合成部30と、
評価関数算出部40と、評価値の最大値との比較部50
と、最適なコードベクトルを作成する出力作成部60と
を有して構成される。
【0035】ここで、各構成要素について説明する。音
源ベクトルメモリ11に格納される音源符号帳は、前記
実施例の音源ベクトルメモリ10に格納された音源ベク
トルCjの音源ベクトル要素Cj[i]を、予めしきい値
Eと比較し、スパース化した音源ベクトルC´jを格納
して構成されている。すなわち、本実施例の音源符号帳
は、音源ベクトル要素Cj[i]の絶対値がしきい値E以
下の要素は、その値を0に設定した音源ベクトルC´j
を格納しておく。0比較部21は、読み出した音源ベク
トル要素C´j[i]の値が0かどうかを判定し、0以外
のベクトル要素のみを音声合成部30に入力する。その
他の本実施例の構成要素において、前記第1実施例と同
じ符号を付けたものは同じ内容を有し、同じ働きを行う
ものであるため、ここでの説明は割愛する。本実施例に
よれば、音源符号帳から読み出したベクトル要素C´j
[i]について0か否かを判定すればよく、ベクトル要
素Cj[i]をしきい値Eと比較する方法に比べて構成を
簡単にすることができる。
【0036】次に、本実施例の動作を説明する。スパー
ス化した音源ベクトルメモリ11から切り出された音源
ベクトルC´jの要素C´j[i]は、0比較部21で0
と比較され、0以外の場合、音声合成部30へと入力さ
れる。これ以降の動作は、前記第1実施例と同じである
ため省略する。ただし、最後の出力作成部60では、ス
パース化した音源ベクトルからなる音源符号帳11を用
いて、最適コードベクトルを作成する。
【0037】本実施例において、最適コードベクトル作
成に使用する音源符号帳に格納される音源ベクトルをス
パース化しているので、復号化音声の客観評価値が多少
劣化することは否めない。しかし、この劣化は、主観的
な音質に大きな差のある劣化ではない。また、本実施例
により、第1実施例のしきい値比較部20において必要
であった、絶対値演算と比較毎の減算が削減された。こ
れにより、更なる処理削減が達成できた。
【0038】図5を用いて、本発明の第3実施例を説明
する。本実施例は、音源ベクトルメモリ10と、音源ベ
クトル要素Cj[i]としきい値Eとの比較部20と、合
成音声を作成する音声合成部30と、評価関数算出部4
0と、評価値の最大から最大に近い複数個を音源ベクト
ルインデックスと対応して保存する最大評価値(最大
値)メモリ70と、評価値と最大値メモリの内容とを比
較する最大評価値(最大値)メモリ比較部51と、合成
フィルタ部80と、評価値を最大値と比較する比較部5
0と、最適なコードベクトルを作成する出力作成部60
とを有して構成される。
【0039】ここで、各構成要素について説明する。前
記第2実施例と同様に、他の実施例と同一の符号を付け
たものについては、説明を省略する。最大評価値メモリ
70は、演算された評価関数Ci2/Giの値のうち、評
価値の最大から最大に近い複数個を音源ベクトルインデ
ックスと対応して記憶する。最大評価値メモリ比較部5
1は、演算された評価関数の値と、最大評価値メモリ7
0に記憶された値とを順次比較する。合成フィルタ部8
0は、最大評価値メモリ70に記憶された音源ベクトル
インデックスから、複数個の音源ベクトルを切り出し、
合成音声を作成する。この合成フィルタは、前記(1)
式で示す重み付合成フィルタの形をとっており、入力音
声の線形予測分析によって求められた、重み付合成フィ
ルタ係数αを入力している。(本図において、線形予測
分析部は省略している)
【0040】次に、本実施例の動作を説明する。図5に
みるとおり、最初に評価関数を算出するまでは、第1実
施例と同じ動作であるため、説明を省略する。算出され
た評価関数は、最大評価値メモリ比較部51において、
最大評価値メモリ70の内容と比較される。そして、そ
の結果により、最大評価値メモリ70の内容を書き換え
ていく。これを、全ての音源ベクトルに対して行うが、
その際の合成音声作成の演算は、第1実施例と同様に音
源ベクトル要素をスパース化して行う。このように、複
数個の音源ベクトルを選択する手段を予備選択といい、
選択された音源ベクトルを音源ベクトル候補という。選
択された音源ベクトル候補を合成フィルタ部80に入力
する。合成フィルタ部80では、予備選択の結果である
最大評価値メモリ70に格納された複数の評価値と、音
源ベクトルメモリ10に格納された符号化帳から、音源
ベクトル候補の合成音声を作成する。この音源ベクトル
候補の合成音声の作成ではしきい値判定は行わず、スパ
ース化されない音源ベクトル候補の合成音声を得る。こ
こで、音声合成に重み付合成フィルタを使用する。これ
は、音源ベクトル候補が、隣り合ったものであるとは限
らず、また、スパース化も行っていないためである。こ
のような時、音声合成部30を使用すると、合成フィル
タ部80よりも処理量が多くなることがわかっている。
【0041】合成された音声は、再度、評価関数算出部
40に入力され、最大値比較部50で最大値Mと比較さ
れる。この処理を音源ベクトル候補の数の分だけ行い、
最大評価値に対応する音源ベクトルのインデックスjopt
を出力する。このように予備選択結果の候補から、さら
に最適なベクトルを検索することを本選択という。出力
作成部60において、本選択結果のインデックスとスパ
ース化していない音源ベクトルCjによって、入力音声
に最適な音源ベクトルを作成し、出力する。
【0042】本実施例は、従来の技術に比べれば、処理
量・メモリ量、共に削減されているが、前記の第1実施
例、または第2実施例に比べ、処理量が増加する。しか
し、スパース化による音質の劣化を防ぐことが可能であ
る。また、本選択において、評価する音源ベクトルが、
実際に使用するベクトルの値であることから、第1実施
例よりも検索に信頼性があり、より最適な音源ベクトル
を選択することができる。
【0043】本発明にかかる音声情報処理装置の第4の
実施例を図6を用いて説明する。本実施例にかかる符号
励振線形予測符号化器を備えた音声情報処理装置は、有
声条件測定部100と、有声判定部200と、パルス音
源検索部300と、雑音源検索部400と、音源ベクト
ル作成部500とを有して構成される。
【0044】ここで、各構成要素について説明する。有
声条件測定部100は、入力音声の各種分析結果から、
有声条件を示す値を演算し、有声判定部200へ入力す
る。有声判定部200は、前記条件の測定結果から入力
音声が有声音であるか無声音であるか判定し、有声音の
場合にはパルス音源検索部300を、無声音の場合には
雑音源検索部400を、それぞれ選択する。パルス音源
検索部300は、音源情報としてパルスの立つ位置を記
憶したメモリを持ち、このパルス位置に合せて前出の
(5)式と同様にインパルス応答との畳込み演算を行
い、音声を合成する。この結果から評価関数を演算し、
音源ベクトルに最適なパルス音源を検索する。雑音源検
索部400は、上述のそれぞれの実施例に従って処理を
行う。その詳細は割愛する。
【0045】次に、本実施例の動作を説明する。有声条
件測定部100では、入力音声から有声/無声を示す値
を演算する。この演算は、既存の方式に添ったものであ
る。有声判定時には、パルス音源を選択し、パルス音源
検索部300の処理を行う。ここでの処理内容は、特開
平6−130994号公報に詳しいので省略する。一
方、無声判定時には、雑音源を選択し、前記の3つの実
施例に示した検索処理を行う。その後、パルス音源/雑
音源のどちらかから選択された最適な音源ベクトルをそ
の他の処理へと出力する。
【0046】本実施例において、有声条件の測定部およ
び判定部や、2つの検索処理部があるため、その他の実
施例からみて、プログラムやメモリ量が増え、処理も多
少増加する。しかし、従来の方式と比べると、処理量・
メモリ量共に削減されている。これは、2つの検索部の
処理量がほぼ同じであるが、必ずどちらか一方の処理だ
けを行っており、実質的な処理量は変わっていないため
である。また、有声条件の測定部および判定部の処理
は、その他の処理の出力を用いており、新たな演算は3
回の積算と比較のみであるため、処理の増加は微小であ
る。メモリ量は、従来技術の5120個から、音源ベク
トルメモリを2つ合せても271個と、約95%の削減
ができた。さらに、有声音声の復号化音声はピッチ成分
がより明確になり、無声音声はパルス的な雑音がなくな
るため、雑音源のみやパルス音源のみの場合よりも、主
観的および客観的な音質が向上した。
【0047】
【発明の効果】本発明により、メモリ量を大幅に削減す
ることができた。さらに、DSPにおける符号化/復号
化処理の量も、実施方法によって多少の差はあるが、従
来技術から見て大幅に削減することができた。よって、
従来、CELP方式を実用化する上で問題であったDS
Pの数やメモリ量を、縮小できる可能性が高くなった。
また、従来技術から削減された処理量を、他の処理に使
用することができ、いっそうの音質改善が期待される。
尚、本発明による主観的な音質の劣化が無いことが、非
公式な聴取実験の結果で確認された。
【図面の簡単な説明】
【図1】音源ベクトルメモリの従来方法とオーバラップ
方法による格納態様を説明する概念図。
【図2】本発明におけるスパース化の概念を説明する概
念図。
【図3】本発明の符号化器の第1の実施例の構成を示す
ブロック図。
【図4】本発明の符号化器の第2の実施例の構成を示す
ブロック図。
【図5】本発明の符号化器の第3の実施例の構成を示す
ブロック図。
【図6】本発明にかかる符号化器の第4の実施例の構成
を示すブロック図。
【図7】CELP符号化器の構成の概念を説明するブロ
ック図。
【図8】CELP復号化器の構成の概念を説明するブロ
ック図。
【符号の説明】
10 スパース化しない音源ベクトルメモリ 11 スパース化した音源ベクトルメモリ 20 しきい値との比較部 21 0比較部 30 音声合成部 40 評価関数算出部 50 最大評価値との比較部 51 最大評価値メモリとの比較部 60 出力作成部 70 最大評価値メモリ 80 合成フィルタ部 100 有声条件測定部 200 有声/無声判定部 300 パルス音源検索部 400 雑音源検索部 501 線形予測分析部 502 聴覚重み付フィルタ部 503 重み付合成フィルタ部 504 適応コードブック検索部 505 統計コードブック検索部 506 2乗和演算部 507 2乗誤差最小化 508 伝送ビット多重化装置 511 伝送ビット多重分離装置 512 適応音源ベクトル復号化部 513 統計音源ベクトル復号化部 514 復号化合成フィルタ部 515 ポストフィルタ部 1a 線形予測係数α 1b 適応コードブックに対する利得β 1c 統計コードブックに対する利得γ 1d 最適適応音源ベクトルインデックスL 1e 最適統計音源ベクトルインデックスI 1f 多重化後の伝送ビット 2a 復号化線形予測係数 2b 適応コードブックに対する復号化利得 2c 統計コードブックに対する復号化利得 2d 復号化適応音源ベクトルインデックス 2e 復号化統計音源ベクトルインデックス 2f 復号化入力伝送ビット Cj 音源ベクトル Cj[i] 音源ベクトル要素 C´j スパース化後の音源ベクトル h 重み付合成フィルタのインパルス応答 p 重み付合成フィルタのゼロ入力応答を減算した重み
付入力音声 Sj スパース化後の音源ベクトルからの合成音声 S´j スパース化しない音源ベクトルからの合成音声 jopt 最適音源ベクトルインデックス α 重み付合成フィルタ係数
───────────────────────────────────────────────────── フロントページの続き (72)発明者 浅川 吉章 神奈川県横浜市戸塚区戸塚町216番地 株 式会社日立製作所情報通信事業部内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 一定時間間隔(フレーム)毎の入力音声
    信号を分析し、予め複数個の音源ベクトルが格納された
    音源符号帳から、前記入力音声信号に最適な音源ベクト
    ルを検索する手段を具備する符号励振線形予測(CEL
    P)符号化器からなる音声情報処理装置において、 前記音源符号帳は、音源ベクトルの次元数と音源ベクト
    ル数との積よりも要素数の少ない要素からなる一連の音
    源ベクトル列からなり、 該音源符号帳の読出先頭アドレスから順次ベクトル次元
    数分の音源ベクトル要素を読み出す手段と、 音源ベクトル検索時に、音源ベクトル要素のしきい値判
    定を行う手段と、 該しきい値判定結果に基づき、入力音声信号との評価関
    数を演算する評価関数演算手段とを具備することを特徴
    とする符号励振線形予測符号化器からなる音声情報処理
    装置。
  2. 【請求項2】 音源ベクトル検索時に、複数の最適音源
    ベクトル候補を選択し、該最適音源ベクトル候補にの
    み、前記音源ベクトル要素のしきい値判定を行わずに評
    価関数演算を行う評価関数演算手段を備えたことを特徴
    とする請求項1記載の符号励振線形予測符号化器からな
    る音声情報処理装置。
  3. 【請求項3】 一定時間間隔(フレーム)毎の入力音声
    信号を分析し、入力音声が有声であるか無声であるかを
    判定する有声/無声判定手段手段を具備し、無声判定時
    に、請求項1または請求項2記載の符号励振線形予測符
    号化器を用いるようにしたことを特徴とする符号励振線
    形予測符号化器からなる音声情報処理装置。
  4. 【請求項4】 受信した最適コードベクトルに基づい
    て、音源符号帳から音源ベクトル要素を読み出し、音声
    を合成して合成音声を出力するようにした符号励振線形
    予測復号化器からなる音声情報処理装置において、音源
    符号帳は、音源ベクトルの次元数と音源ベクトル数との
    積よりも要素数の少ない要素からなる一連の音源ベクト
    ル列からなり、 該音源符号帳の読出先頭アドレスから順次ベクトル次元
    数分の音源ベクトル要素を読み出す手段を具備すること
    を特徴とする符号励振線形予測復号化器からなる音声情
    報処理装置。
  5. 【請求項5】 それぞれ複数の音源ベクトル要素から構
    成された複数個の音源ベクトルからなる音源符号帳が予
    め格納された音源ベクトルメモリと、該音源ベクトルメ
    モリから読み出した音源ベクトルの各要素の値としきい
    値とを比較してしきい値以上の要素を送出するしきい値
    比較部と、音源ベクトル要素に基づいて音声を合成する
    音声合成部と、重み付け入力音声から重み付け合成フィ
    ルタのゼロ入力応答を減算したデータと前記音声合成部
    の出力である合成音声とから評価関数を算出する評価関
    数算出部と、評価関数の最大値を検出する最大値比較部
    とを有する入力音声の符号励振線形予測符号化器からな
    る音声情報処理装置において、 前記音源符号帳を、各音源ベクトルの要素数すなわち音
    源ベクトルの次元数と音源ベクトル数との積よりも少な
    い要素数からなる一連の音源ベクトル要素の列から構成
    するとともに、少なくとも1要素以上ずつずらして各音
    源ベクトルの読出先頭アドレスすなわちコードベクトル
    インデックスを付与して構成し、 該音源符号帳の一連の音源ベクトル要素列の、読出先頭
    アドレスから音源ベクトル次元数分の音源ベクトル要素
    を切り出して音源ベクトルとし、 音声合成部は、しきい値比較部からの音源ベクトル要素
    と入力音声の線形予測分析によって得た重み付合成フィ
    ルタのインパルス応答都から合成音声を演算して評価関
    数算出部へ送出し、 全ての音源ベクトルの内の最大評価関数を有する音源ベ
    クトルのコードベクトルインデックスと音源符号帳の音
    源ベクトル要素とから入力音声に対する最適コードベク
    トルを作成して送出することを特徴とする符号励振線形
    予測符号化器からなる音声情報処理装置。
JP9008356A 1997-01-21 1997-01-21 音声情報処理装置 Pending JPH10207495A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9008356A JPH10207495A (ja) 1997-01-21 1997-01-21 音声情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9008356A JPH10207495A (ja) 1997-01-21 1997-01-21 音声情報処理装置

Publications (1)

Publication Number Publication Date
JPH10207495A true JPH10207495A (ja) 1998-08-07

Family

ID=11690962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9008356A Pending JPH10207495A (ja) 1997-01-21 1997-01-21 音声情報処理装置

Country Status (1)

Country Link
JP (1) JPH10207495A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001265396A (ja) * 2000-01-11 2001-09-28 Matsushita Electric Ind Co Ltd マルチモード音声符号化装置及び復号化装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001265396A (ja) * 2000-01-11 2001-09-28 Matsushita Electric Ind Co Ltd マルチモード音声符号化装置及び復号化装置
JP4619549B2 (ja) * 2000-01-11 2011-01-26 パナソニック株式会社 マルチモード音声復号化装置及びマルチモード音声復号化方法

Similar Documents

Publication Publication Date Title
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP2626223B2 (ja) 音声符号化装置
JPH0990995A (ja) 音声符号化装置
US6611797B1 (en) Speech coding/decoding method and apparatus
JP2000163096A (ja) 音声符号化方法及び音声符号化装置
JP3558031B2 (ja) 音声復号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JPH1097294A (ja) 音声符号化装置
JPH04344699A (ja) 音声符号化・復号化方法
JP3174733B2 (ja) Celp型音声復号化装置、およびcelp型音声復号化方法
JPH08292797A (ja) 音声符号化装置
JPH10207495A (ja) 音声情報処理装置
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
JP3552201B2 (ja) 音声符号化方法および装置
JP3232701B2 (ja) 音声符号化方法
JPH08185199A (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP2700974B2 (ja) 音声符号化法
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3230380B2 (ja) 音声符号化装置
JP3071800B2 (ja) 適応ポストフィルタ
Kim et al. On a Reduction of Pitch Searching Time by Preprocessing in the CELP Vocoder
JP3174779B2 (ja) 拡散音源ベクトル生成装置及び拡散音源ベクトル生成方法