JP2007179071A - 音声符号化装置及び音声符号化方法 - Google Patents

音声符号化装置及び音声符号化方法 Download PDF

Info

Publication number
JP2007179071A
JP2007179071A JP2007044048A JP2007044048A JP2007179071A JP 2007179071 A JP2007179071 A JP 2007179071A JP 2007044048 A JP2007044048 A JP 2007044048A JP 2007044048 A JP2007044048 A JP 2007044048A JP 2007179071 A JP2007179071 A JP 2007179071A
Authority
JP
Japan
Prior art keywords
sound source
adaptive
sound
excitation
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007044048A
Other languages
English (en)
Other versions
JP4660496B2 (ja
JP2007179071A5 (ja
Inventor
Hirohisa Tazaki
裕久 田崎
Tadashi Yamaura
正 山浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2007044048A priority Critical patent/JP4660496B2/ja
Publication of JP2007179071A publication Critical patent/JP2007179071A/ja
Publication of JP2007179071A5 publication Critical patent/JP2007179071A5/ja
Application granted granted Critical
Publication of JP4660496B2 publication Critical patent/JP4660496B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】ピッチ周期と繰り返し周期が異なっている場合の品質劣化を防ぐ。
【解決手段】周期予備選択手段23は、適応音源の繰り返し周期に複数の定数を乗じて複数の駆動音源の繰り返し周期候補を求め、所定個の駆動音源の繰り返し周期候補を選択する。駆動音源符号化手段27は、所定個の駆動音源の繰り返し周期候補毎に、符号化歪を最も小さくする音源位置と極性及びその時の符号化歪みの評価値を出力する。周期符号化手段28は、各繰り返し周期ごとの符号化歪みの評価値を比較し、その比較結果に基づき駆動音源の繰り返し周期候補を選択して、選択情報と音源位置符号と極性を出力する。
【選択図】図1

Description

この発明は、ディジタル音声信号を少ない情報量に圧縮する音声符号化装置及び音声符号化方法に関するものである。
従来の多くの音声符号化装置及び音声復号化装置では、入力音声をスペクトル包絡情報と音源に分けて、所定長区間のフレーム単位で各々を符号化して音声符号を生成し、この音声符号を復号化して、合成フィルタによってスペクトル包絡情報と音源を合わせることで復号音声を得る構成をとっている。最も代表的な音声符号化装置及び音声復号化装置としては、符号駆動線形予測符号化(Code−Excited Linear Prediction:CELP)方式を用いたものがある。
図14は従来のCELP系音声符号化装置の構成を示すブロック図であり、図15は従来のCELP系音声復号化装置の構成を示すブロック図である。
図14及び図15において、1は入力音声、2は線形予測分析手段、3は線形予測係数符号化手段、4は適応音源符号化手段、5は駆動音源符号化手段、6はゲイン符号化手段、7は多重化手段、8は音声符号、9は分離手段、10は線形予測係数復号化手段、11は適応音源復号化手段、12は駆動音源復号化手段、13はゲイン復号化手段、14は合成フィルタ、15は出力音声である。
次に動作について説明する。
この従来の音声符号化装置及び音声復号化装置では、5〜50ms程度を1フレームとして、フレーム単位で処理を行う。まず、図14に示す音声符号化装置において、入力音声1が線形予測分析手段2と適応音源符号化手段4とゲイン符号化手段6に入力される。線形予測分析手段2は、入力音声1を分析し、音声のスペクトル包絡情報である線形予測係数を抽出する。線形予測係数符号化手段3は、この線形予測係数を符号化し、その符号を多重化手段7に出力すると共に、音源の符号化のために量子化された線形予測係数を出力する。
適応音源符号化手段4は、過去の所定長の音源(信号)を適応音源符号帳として記憶しており、内部で発生させた数ビットの2進数値で示した各適応音源符号に対応して、過去の音源を周期的に繰り返した時系列ベクトルを生成する。次に各時系列ベクトルに適切なゲインを乗じ、線形予測係数符号化手段3から出力された量子化された線形予測係数を用いた合成フィルタに通すことにより、仮の合成音を得る。この仮の合成音と入力音声1との距離を調べ、この距離を最小とする適応音源符号を選択して多重化手段7に出力すると共に、選択された適応音源符号に対応する時系列ベクトルを適応音源として、駆動音源符号化手段5とゲイン符号化手段6に出力する。また、入力音声1,又は入力音声1から適応音源による合成音を差し引いた信号を、符号化対象信号として駆動音源符号化手段5に出力する。
駆動音源符号化手段5は、まず、内部で発生させた数ビットの2進数値で示した各駆動音源符号に対応して、内部に格納してある駆動音源符号帳から時系列ベクトルを順次読み出す。次に、読み出した各時系列ベクトルと適応音源符号化手段4から出力された適応音源に適切なゲインを乗じて加算し、線形予測係数符号化手段3から出力された量子化された線形予測係数を用いた合成フィルタに通すことにより、仮の合成音を得る。この仮の合成音と、適応音源符号化手段4から出力された入力音声1又は入力音声1から適応音源に
よる合成音を差し引いた信号である符号化対象信号との距離を調べ、この距離を最小とする駆動音源符号を選択して多重化手段7に出力すると共に、選択された駆動音源符号に対応する時系列ベクトルを駆動音源として、ゲイン符号化手段6に出力する。
ゲイン符号化手段6は、まず、内部で発生させた数ビットの2進数値で示した各ゲイン符号に対応して、内部に格納してあるゲイン符号帳からのゲインベクトルを順次読み出す。そして各ゲインベクトルの各要素を、適応音源符号化手段4から出力された適応音源と駆動音源符号化手段5から出力された駆動音源に乗じて加算して音源を生成し、生成したこの音源を線形予測係数符号化手段3から出力された量子化された線形予測係数を用いた合成フィルタに通すことにより、仮の合成音を得る。この仮の合成音と入力音声1との距離を調べ、この距離を最小とするゲイン符号を選択して多重化手段7に出力する。また、このゲイン符号に対応する上記生成された音源を適応音源符号化手段4に出力する。
最後に、適応音源符号化手段4は、ゲイン符号化手段6により生成されたゲイン符号に対応する音源を用いて、内部の適応音源符号帳の更新を行う。
多重化手段7は、線形予測係数符号化手段3から出力された線形予測係数の符号と、適応音源符号化手段4から出力された適応音源符号と、駆動音源符号化手段5から出力された駆動音源符号と、ゲイン符号化手段6から出力されたゲイン符号を多重化し、得られた音声符号8を出力する。
次に、図15に示す音声復号化装置において、分離手段9は、音声符号化装置から出力された音声符号8を分離して、線形予測係数の符号を線形予測係数復号化手段10に出力し、適応音源符号を適応音源復号化手段11に出力し、駆動音源符号を駆動音源復号化手段12に出力し、ゲイン符号をゲイン復号化手段13に出力する。線形予測係数復号化手段10は、分離手段9が分離した線形予測係数の符号から線形予測係数を復号化し、合成フィルタ14のフィルタ係数として設定し出力する。
次に、適応音源復号化手段11は、内部に過去の音源を適応音源符号帳として記憶しており、分離手段9が分離した適応音源符号に対応して過去の音源を周期的に繰り返した時系列ベクトルを適応音源として出力する。また、駆動音源復号化手段12は、分離手段9が分離した駆動音源符号に対応した時系列ベクトルを駆動音源として出力する。ゲイン復号化手段13は、分離手段9が分離したゲイン符号に対応したゲインベクトルを出力する。そして、上記2つの時系列ベクトルに上記ゲインベクトルの各要素を乗じて加算することで音源を生成し、この音源を合成フィルタ14に通すことで出力音声15を生成する。最後に、適応音源復号化手段11は、上記生成された音源を用いて内部の適応音源符号帳の更新を行う。
次に、このCELP系音声符号化装置及び音声復号化装置の改良を図った従来の技術について説明する。
非特許文献1には、演算量とメモリ量の削減を主な目的として、駆動音源の符号化にパルス音源を導入したCELP系音声符号化装置及び音声復号化装置が開示されている。この従来の構成では、駆動音源を数本のパルスの各位置情報と極性情報のみで表現している。このような音源は代数的音源と呼ばれ、構造が簡単な割に符号化特性が良く、最近の多くの標準方式に採用されている。
図16は、非特許文献1で用いられているパルス音源の位置候補を示した表であり、上記図14の音声符号化装置では駆動音源符号化装置5,上記図15の音声復号化装置では駆動音源復号化装置12に搭載される。非特許文献1では、音源符号化フレーム長が40サンプルであり、駆動音源は4つのパルスで構成されている。音源番号1から音源番号3のパルス音源の位置候補は、図16に示したように各々8つの位置に制約されており、パルス位置は各々3ビットで符号化できる。音源番号4のパルスは16の位置に制約されており、パルス位置は4ビットで符号化できる。パルス音源の位置候補に制約を与えることにより、符号化特性の劣化を抑えつつ、符号化ビット数の削減、組合せ数の削減による演算量の削減を実現している。
なお、非特許文献1では、パルス位置探索の演算量を削減するために、インパルス応答(単一のパルス音源による合成音)と符号化対象信号の相関関数とインパルス応答(単一のパルス音源による合成音)の相互相関関数を予め計算して、プリテーブルとして記憶しておき、それらの値の簡単な加算によって距離(符号化歪)計算を実行する。そして、この距離を最小にするパルス位置と極性を探索する。この処理は、上記図14の音声符号化装置の駆動音源符号化装置5より実施される。
以下、非特許文献1で用いられている探索方法を具体的に説明する。
まず、距離の最小化は次の(1)式で示される評価値Dを最大化することと等価であり、この評価値Dの計算をパルス位置の全組合せに対して実行することで探索が実行できる。
D=C2 /E (1)
但し、
Figure 2007179071
ここで、
k はk番目のパルスのパルス位置、
g(k)はk番目のパルスのパルス振幅、
d(x)はパルス位置xにインパルスを立てた時のインパルス応答と符号化対象信号の相関値、
φ(x,y)はパルス位置xにインパルスを立てた時のインパルス応答とパルス位置yにインパルスを立てた時のインパルス応答との相関値
である。
さらに、非特許文献1では、g(k)をd(mk )と同符号で絶対値を1として、上記(2)式と(3)式を、次の(4)式、(5)式のように単純化して計算を行う。
Figure 2007179071
但し、
d’(mk )=|d(mk )| (6)
φ’(mk ,mi
=sign[d(mk )]sign[d(mi )]φ(mk ,mi ) (7)
となり、パルス位置の全組合せに対する評価値Dの計算を始める前に、d’とφ’の計算を行っておけば、後は(4)式と(5)式の単純加算という少ない演算量で評価値Dが算出できる。
この代数的音源の品質を改善する構成が、特許文献1、特許文献2に開示されていると共に、非特許文献2に開示されている。
特許文献1では、複数の固定波形を用意しておいて、代数的に符号化された音源位置に、この固定波形を配置することで、駆動音源を生成するようにしている。この構成によって、品質の高い出力音声が得られるとされている。
非特許文献2では、駆動音源(非特許文献2中ではACELP音源)の生成部に、ピッチフィルタを内包させる構成について検討が行われている。これらの固定波形の導入とピッチフィルタ処理については、非特許文献1におけるインパルス応答の算出部分で同時に行うことで、探索処理量を大きく増やさずに品質改善効果を得ることができる。
特許文献2では、ピッチ利得が予め決めた値以上のときに、駆動音源を適応音源に直交化させながらパルス位置を探索する構成が開示されている。
図17は、上記の特許文献1及び非特許文献2の改良構成を導入した、従来のCELP系音声符号化装置における駆動音源符号化手段5の詳細構成を示すブロック図である。図において、16は聴覚重み付けフィルタ係数算出手段、17,19は聴覚重み付けフィルタ、18は基礎応答生成手段、20はプリテーブル算出手段、21は探索手段、22は音源位置テーブルである。
次に駆動音源符号化手段5の動作について説明する。
まず、図14に示す音声符号化装置内の線形予測係数符号化手段3から、量子化された線形予測係数が聴覚重み付けフィルタ係数算出手段16と基礎応答生成手段18に入力され、適応音源符号化手段4から、入力音声1又は入力音声1から適応音源による合成音を差し引いた信号である符号化対象信号が聴覚重み付けフィルタ17に入力され、適応音源符号化手段4から、適応音源符号を変換して得られる適応音源の繰り返し周期が基礎応答生成手段18に入力される。
聴覚重み付けフィルタ係数算出手段16は、上記量子化された線形予測係数を用いて聴覚重み付けフィルタ係数を算出し、算出した聴覚重み付けフィルタ係数を聴覚重み付けフィルタ17と聴覚重み付けフィルタ19のフィルタ係数として設定する。聴覚重み付けフィルタ17は、聴覚重み付けフィルタ係数算出手段16によって設定されたフィルタ係数により、入力された上記符号化対象信号に対してフィルタ処理を行う。
基礎応答生成手段18は、単位インパルス又は固定波形に対して、入力された上記適応音源の繰り返し周期を用いた周期化処理を行い、得られた信号を音源として、上記量子化された線形予測係数を用いて構成した合成フィルタによる合成音を生成し、これを基礎応答として出力する。聴覚重み付けフィルタ19は、聴覚重み付けフィルタ係数算出手段16により設定されたフィルタ係数により、上記基礎応答に対してフィルタ処理を行う。
プリテーブル算出手段20は、上記聴覚重み付けされた符号化対象信号と聴覚重み付けされた基礎応答の相関値を計算してd(x)とし、聴覚重み付けされた基礎応答の相互相関値を計算してφ(x,y)とする。そして、上記(6)式と(7)式によりd’(x)とφ’(x,y)を求めて、これらをプリテーブルとして記憶する。
音源位置テーブル22には、図16と同様な音源位置候補が格納されている。探索手段21は、音源位置テーブル22から音源の位置候補を順次読み出して、各音源位置の組み合わせに対する評価値Dを、上記(1)式、(4)式、(5)式に基づいて、プリテーブル算出手段20により算出されたプリテーブルを使用して計算する。そして、探索手段21は、評価値Dを最大にする音源位置の組み合わせを探索し、得られた複数の音源位置を表す音源位置符号(音源位置テーブルにおけるインデックス)と極性を、駆動音源符号として図14に示す多重化手段7に出力すると共に、この駆動音源符号に対応する時系列ベクトルを、駆動音源としてゲイン符号化手段6に出力する。
特許文献2に開示されている直交化の導入は、プリテーブル算出手段20に入力される聴覚重み付けされた符号化対象信号を適応音源に対して直交化させることと、探索手段21内で上記(5)式で表されるEの値から適応音源と各駆動音源の相関に関する寄与分を減算することにより実現されている。
特開平10−232696号公報 特開平10−312198号公報 片岡章俊、林伸二、守谷健弘、栗原祥子、間野一則「CS−ACELPの基本アルゴリズム」NTT R&D,Vol.45,pp.325−330,1996年4月 土屋、天田、三関「適応パルス位置ACELP音声符号化の改善」日本音響学会、1999年春季研究発表会講演論文集I、213〜214頁
従来の音声符号化装置及び音声復号化装置は以上のように構成されているので、駆動音源のピッチ周期化処理は、探索演算処理量を大きく増加することなく符号化特性を改善することができるが、周期化に用いる繰り返し周期に適応音源の繰り返し周期を使っているため、本来のピッチ周期とこの繰り返し周期が異なっている場合等に、品質劣化を起こすという課題があった。
図18及び図19は、従来の音声符号化装置及び音声復号化装置における符号化対象信号と周期化された駆動音源の音源位置の関係を説明する図である。図18は適応音源の繰り返し周期が本来のピッチ周期の約2倍になった場合で、図19は適応音源の繰り返し周期が本来のピッチ周期の約1/2倍になった場合である。
適応音源の繰り返し周期は、符号化対象信号に対する符号化歪を最小にするように決定されるので、声帯の振動周期であるピッチ周期とは異なる値となることが頻繁である。異なる場合は、概ね本来のピッチ周期の整数分の1又は整数倍の値をとり、特に多いのは1/2倍と2倍である。
図18では、声帯の振動が1ピッチ置きに周期的に変動したために、適応音源の繰り返し周期が本来のピッチ周期の約2倍になってしまっている。このため、この繰り返し周期を用いて駆動音源の符号化を行うと、先頭の1繰り返し周期に音源位置が集まり、これをフレーム内で該繰り返し周期で繰り返した結果が図のようになる。本来のピッチ周期とは異なる周期で繰り返された音源を用いると、そのフレームの音色が変わり、合成音に不安定な印象を生じてしまう。この課題は、低ビットレート化して駆動音源の音源情報量が少なくなる程、無視できなくなり、適応音源の振幅が駆動音源の振幅に比べて小さい区間で顕著になる。
図19では、低域成分が支配的で、本来のピッチ周期内の前半と後半の波形が類似した形状となったため、適応音源の繰り返し周期が本来のピッチ周期の約1/2倍になってしまっている。この場合にも、図18と同様に、本来のピッチ周期とは異なる周期で繰り返された音源を用いたために、そのフレームの音色が変わり、合成音に不安定な印象を生じてしまう。
また、低ビットレート化して駆動音源の情報量が少ない場合には、波形歪(符号化歪)を最小化するように決定した駆動音源では、低振幅の帯域の誤差が大きくなって合成音のスペクトル歪みが大きくなる傾向があり、このスペクトル歪が音質的な劣化として検知されてしまうことがある。このスペクトル歪による音質劣化を抑制するために、聴覚重み付け処理が導入されているが、聴覚重み付けを強くしていくと波形歪が増大して、これがザラザラした感じの音質劣化を引き起こすため、通常波形歪とスペクトル歪による音質劣化の影響が同程度になるように調整を行っている。しかしながら、前者のスペクトル歪の増大は特に女声で大きくなり、男声と女声で両者に最適になるようには聴覚重み付けが調整できないという課題があった。
また、従来の構成では、複数の音源位置に配置する音源(パルス含む)に対してフレーム内で一定の振幅を与えている。各音源位置の候補数を比べたときに、その数が異なっているにもかかわらず、振幅が一定というのには無駄がある。例えば、図16に示した音源位置テーブルの場合、音源番号1から音源番号3の音源位置に対しては各々3ビットが使用され、音源番号4の音源位置に対しては4ビットが使用される。各音源番号毎に、各位置候補での音源と符号化対象信号の相関の最大値を調べると、候補数が最も多い音源番号4が確率的に最も大きい値が得られることが容易に予測される。極端な場合を考えると、ある音源番号に0ビットしか与えない場合を考える。0ビット、つまり固定位置に音源を配置する場合、極性を別途与えるとしてもその相関値は小さく、つまり他の音源番号のものに比べてあまり大きな振幅を与えることが最適でないことが分かる。よって、従来の構成では振幅に関して最適に設計されていないという課題があった。
なお、この音源番号毎の振幅については、別途ゲイン量子化時に独立の値をベクトル量子化によって与える構成も別途開示されているが、これはゲイン量子化情報量が増える、処理が複雑になる等の課題があった。
さらに、駆動音源の適応音源に対する直交化の導入においては、探索処理の増加を伴う構成となっており、代数的音源の組み合わせ数が増加した場合には、大きな負担となるという課題があった。特に固定波形やピッチ周期化を導入した構成において直交化を行う場合には、その演算量の増加は一層大きくなるという課題があった。
この発明は上記のような課題を解決するためになされたもので、高品質の音声符号化装置及び音声符号化方法を得ることを目的としている。また、演算量の増加を最小限に抑えつつ、高品質の音声符号化装置及び音声符号化方法を得ることを目的としている。
この発明に係る音声符号化装置は、過去の音源より生成した適応音源と、入力音声と上記適応音源により生成され、複数の音源位置と極性で表現した駆動音源とを用いて、上記入力音声をフレーム単位に符号化して音声符号を出力するものにおいて、1つの音源位置に所定の音源を配置した信号を仮駆動音源とし、上記入力音声等の符号化対象信号と全ての音源位置候補に対応する上記仮駆動音源に基づく合成音との間の相関値を計算すると共に、全ての候補の組み合わせに対応した上記仮駆動音源に基づく合成音間の相互相関値を計算してプリテーブルとして記憶するプリテーブル算出手段と、上記符号化対象信号と上記適応音源に基づく合成音との間の相関値を計算すると共に、上記全ての音源位置候補に対応する仮駆動音源に基づく合成音と上記適応音源に基づく合成音との間の相関値を計算して、計算したこれらの相関値を用いて上記プリテーブルを補正するプリテーブル補正手段と、上記補正されたプリテーブルを用いて複数の音源位置と極性を決定して、音源位置を表す音声位置符号と極性を出力する探索手段とを備えたものである。
この発明に係る音声符号化方法は、過去の音源より生成した適応音源と、入力音声と上記適応音源により生成され、複数の音源位置と極性で表現した駆動音源とを用いて、上記入力音声をフレーム単位に符号化して音声符号を出力するものにおいて、1つの音源位置に所定の音源を配置した信号を仮駆動音源とし、上記入力音声等の符号化対象信号と全ての音源位置候補に対応する上記仮駆動音源に基づく合成音との間の相関値を計算すると共に、全ての候補の組み合わせに対応した上記仮駆動音源に基づく合成音間の相互相関値を計算してプリテーブルとして記憶するステップと、上記符号化対象信号と上記適応音源に基づく合成音との間の相関値を計算すると共に、上記全ての音源位置候補に対応する仮駆動音源に基づく合成音と上記適応音源に基づく合成音との間の相関値を計算して、計算したこれらの相関値を用いて上記プリテーブルを補正するステップと、上記補正されたプリテーブルを用いて複数の音源位置と極性を決定して、音源位置を表す音声位置符号と極性を出力する探索ステップとを備えたものである。
この発明によれば、1つの音源位置に所定の音源を配置した信号を仮駆動音源とし、入力音声等の符号化対象信号と全ての音源位置候補に対応する仮駆動音源に基づく合成音との間の相関値を計算すると共に、全ての候補の組み合わせに対応した仮駆動音源に基づく合成音間の相互相関値を計算してプリテーブルとして記憶するプリテーブル算出手段と、符号化対象信号と適応音源に基づく合成音との間の相関値を計算すると共に、全ての音源位置候補に対応する仮駆動音源に基づく合成音と適応音源に基づく合成音との間の相関値を計算して、計算したこれらの相関値を用いてプリテーブルを補正するプリテーブル補正手段と、補正されたプリテーブルを用いて複数の音源位置と極性を決定して、音源位置を表す音声位置符号と極性を出力する探索手段とを備えたことにより、探索手段における処理量を増やさずに、符号化対象信号を適応音源に対して直交化することができ、これにより符号化特性を改善でき、高品質の音声符号化装置を提供できるという効果がある。
この発明によれば、1つの音源位置に所定の音源を配置した信号を仮駆動音源とし、入力音声等の符号化対象信号と全ての音源位置候補に対応する仮駆動音源に基づく合成音との間の相関値を計算すると共に、全ての候補の組み合わせに対応した仮駆動音源に基づく合成音間の相互相関値を計算してプリテーブルとして記憶するステップと、符号化対象信号と適応音源に基づく合成音との間の相関値を計算すると共に、全ての音源位置候補に対応する仮駆動音源に基づく合成音と適応音源に基づく合成音との間の相関値を計算して、計算したこれらの相関値を用いてプリテーブルを補正するステップと、補正されたプリテーブルを用いて複数の音源位置と極性を決定して、音源位置を表す音声位置符号と極性を出力する探索ステップとを備えたことにより、探索ステップにおける処理量を増やさずに、符号化対象信号を適応音源に対して直交化することができ、これにより符号化特性を改善でき、高品質の音声符号化方法を提供できるという効果がある。
以下、この発明の実施の一形態について説明する。
実施の形態1.
図1はこの発明の実施の形態1による音声符号化装置における駆動音源符号化手段5の構成を示すブロック図である。音声符号化装置の全体構成は図14と同様である。図において、23は周期予備選択手段、27は駆動音源符号化手段、28は周期符号化手段であり、周期予備選択手段23は、定数テーブル24,比較手段25,予備選択手段26により構成されている。
なお、駆動音源符号化手段27が、従来の駆動音源符号化手段5と同様の動作をする手段であるが、駆動音源符号化手段27の前後に、周期予備選択手段23と周期符号化手段28が新規に追加されたものを、図14における駆動音源符号化手段5の部分としたものが、この実施の形態1による音声符号化装置である。
図2はこの発明の実施の形態1による音声復号化装置における駆動音源復号化手段12の構成を示すブロック図である。音声復号化装置の全体構成は図15と同様である。図2において、29は周期復号化手段、30は駆動音源復号化手段である。
なお、駆動音源復号化手段30が、従来の駆動音源復号化手段12と同様の動作をする手段であるが、駆動音源復号化手段30の前に周期予備選択手段23と周期復号化手段29が新規に挿入されたものを、図15における駆動音源復号化手段12の部分としたものが、この実施の形態1による音声復号化装置である。
次に動作について説明する。
まず、音声符号化装置の動作について図1を用いて説明する。図14に示す適応音源符号化手段4から、適応音源符号を変換して得られた適応音源の繰り返し周期が周期予備選択手段23に入力される。また、適応音源符号化手段4からの符号化対象信号と、線形予測係数符号化手段3からの量子化された線形予測係数とが、駆動音源符号化手段27に入力される。
周期予備選択手段23内の定数テーブル24には、1/2,1,2という3つの定数が格納されており、各定数が入力された適応音源の繰り返し周期に乗じられ、得られた3つの繰り返し周期が、駆動音源の繰り返し周期候補として予備選択手段26に出力される。比較手段25は、入力された適応音源の繰り返し周期を予め与えておいた所定の閾値と比較して、その比較結果を予備選択手段26に出力する。なお、この所定の閾値としては、平均的なピッチ周期に相当する40程度を用いる。
予備選択手段26は、比較手段25からの比較結果が、所定の閾値を上回る結果であった時には、入力された適応音源の繰り返し周期に1/2,1を乗じた2つの駆動音源の繰り返し周期候補を予備選択し、比較結果が所定の閾値以下の結果であった時には、入力された適応音源の繰り返し周期に1,2を乗じた2つの駆動音源の繰り返し周期候補を予備選択し、得られた2つの駆動音源の繰り返し周期候補を駆動音源符号化手段27に順次出力する。
駆動音源符号化手段27は、図17に示した従来の駆動音源符号化手段5と同様に、入力された2つの駆動音源の繰り返し周期候補(図17と異なるのは、この繰り返し周期が適応音源の定数倍となっている点である)、量子化された線形予測係数、符号化対象信号を用いて、代数的音源の符号化処理を行い、2つの駆動音源の繰り返し周期候補毎に、符号化歪を最も小さくする音源位置、極性及びその時の符号化歪に関する上記(1)式における評価値Dを出力する。
周期符号化手段28は、駆動音源符号化手段27が出力した各駆動音源の繰り返し周期候補に対する評価値Dを比較して、1つの評価値と残りの評価値の間の差が所定の閾値以上である(つまり1つのものだけが符号化歪みが小さい)場合には、その評価値を与えた駆動音源の繰り返し周期候補を選択し、評価値間の差異が所定の閾値未満の場合には、別途分析しておいたピッチ周期(本来のピッチ周期の推定結果)に最も近い駆動音源の繰り返し周期候補を選択して、この選択結果を1ビットで符号化した選択情報と、その時の音源位置を表す音源位置符号と極性とを、駆動音源符号として図14に示す多重化手段7に出力すると共に、この駆動音源符号に対応する時系列ベクトルを、駆動音源として図14に示すゲイン符号化手段6に出力する。
次に、音声復号化装置の動作について図2を用いて説明する。図15に示す音声復号化装置において、従来と同様に、分離手段9は、音声符号化装置から出力された音声符号8を分離して、線形予測係数の符号を線形予測係数復号化手段10に出力し、適応音源符号を適応音源復号化手段11に出力し、駆動音源符号を駆動音源復号化手段12に出力し、ゲイン符号をゲイン復号化手段13に出力するが、この実施の形態では、図15に示す適応音源復号化手段11から、適応音源符号を変換して得られる適応音源の繰り返し周期が、駆動音源復号化手段12に入力される。すなわち、図2において、適応音源復号化手段11から適応音源の繰り返し周期が周期予備選択手段23に入力される。また、分離手段9が分離した駆動音源符号内の選択情報が周期復号化手段29に入力され、駆動音源符号内の音源位置符号と極性が駆動音源復号化手段30に入力される。
周期予備選択手段23は、音声符号化装置内の図1に示す周期予備選択手段23と同じ構成を持ち、予備選択手段26は、入力した適応音源の繰り返し周期を定数倍した複数の駆動音源の繰り返し周期候補の中から、比較手段25の比較結果に基づき、2つの予備選択された駆動音源の繰り返し周期候補を選択して周期復号化手段29に出力する。
周期復号化手段29は、入力した選択情報に従って、予備選択手段26から出力された2つの予備選択された駆動音源の繰り返し周期候補の一方を選択して、これを駆動音源の繰り返し周期として駆動音源復号化手段30に出力する。駆動音源復号化手段30は、従来の駆動音源復号化手段12と同様にして、音源位置符号に対応した各位置に固定波形を配置し、繰り返し周期に基づくピッチ周期化を行い、駆動音源符号に対応した時系列ベクトルを駆動音源として出力する。
図3及び図4は、実施の形態1による音声符号化装置及び音声復号化装置における符号化対象信号と周期化された駆動音源の音源位置の関係を説明する図である。なお、符号化対象信号は図18及び図19と同じものであり、図3が適応音源の繰り返し周期が本来のピッチ周期の約2倍になった場合で、図4が約1/2倍になった場合である。
図3の場合、本来のピッチ周期が20以上であれば、適応音源の繰り返し周期は40以上となるので、予備選択手段26では、ほとんどの場合に適応音源の繰り返し周期の1/2倍と1倍の値が予備選択される。この2つの繰り返し周期を用いた時の符号化時の評価値Dの差異が小さければ、別途求めてある本来のピッチ周期の推定値(適応音源の繰り返し周期よりは正解率は高い)に近い1/2倍が選択されて、図のように理想的に周期化された音源位置が得られる。
図4の場合、本来のピッチ周期が80未満であれば、適応音源の繰り返し周期は40未満となるので、予備選択手段26では、高い確率で適応音源の1倍と2倍の値が予備選択される。この2つの繰り返し周期を用いた時の符号化時の評価値Dの差異が小さければ、別途求めてある本来のピッチ周期に近い2倍が選択されて、図のように理想的に周期化された音源位置が得られる。
なお、上記実施の形態では、駆動音源の符号化と復号化に、数本のパルスの各位置と極性のみで表現した代数的音源を使用しているが、この発明は代数的音源構成に限定されるものではなく、その他の学習音源符号帳やランダム音源符号帳等を用いるCELP系音声符号化装置及び音声復号化装置においても適用可能である。
また、上記実施の形態では、別途ピッチ周期を求めて周期符号化手段28での選択に用いているが、これを用いずに符号化歪を最小にする、すなわち、評価値Dを最大にする繰り返し周期を選択する構成も可能である。また、ピッチ周期ではなくて、過去の数フレームの適応音源の繰り返し周期を平均した値を参照値として用いても構わない。
さらに、上記実施の形態では、スペクトルパラメータとして線形予測係数を用いて説明したが、一般に多く使用されるLSP(Line Spectrum Pair:線スペクトル対)等、他のスペクトルパラメータを用いる構成でも構わない。
さらに、上記実施の形態では、定数テーブル24内の全ての定数を適応音源の繰り返し周期に乗じているが、予備選択手段26で定数テーブル24内から2つの定数を選択して、その後に適応音源の繰り返し周期に乗じるようにしても同様である。
さらに、定数テーブル内から1を削除し、代わりに適応音源の繰り返し周期を直接予備選択手段26に入力するようにしても同じ結果が得られる。
さらに、特性改善効果は減少するが、定数テーブル中の値を1/2と1のみとして、比較手段25と予備選択手段26をなくした構成も可能である。
以上のように、この実施の形態1によれば、適応音源の繰り返し周期に複数の定数を乗じて複数の駆動音源の繰り返し周期候補を求め、この複数の駆動音源の繰り返し周期候補の中から所定個を予備選択し、予備選択された駆動音源の各繰り返し周期候補毎に符号化歪を最も小さくする駆動音源符号を探索し、駆動音源の各繰り返し周期毎の符号化歪を比較した結果に基づいて、駆動音源の繰り返し周期候補を選択するようにしたので、本来のピッチ周期と適応音源の繰り返し周期が異なる場合でも、高い確率で本来のピッチ周期に近い繰り返し周期を用いた駆動音源の周期化が選択されることにより、合成音の不安定な印象の発生を抑制でき、高品質の音声符号化装置を提供できるという効果が得られる。
また、周期予備選択における予備選択個数を2とし、駆動音源の繰り返し周期の選択情報を1ビットで符号化するようにしたので、最小限の情報量の追加で高品質の音声符号化装置を提供できるという効果が得られる。
さらに、周期予備選択において、適応音源の繰り返し周期と所定の閾値を比較して、この比較結果に基づいて所定個の駆動音源の繰り返し周期候補を選択するようにしたので、本来のピッチ周期である確率が低い駆動音源の繰り返し周期候補を排除でき、評価の必要のない駆動音源の繰り返し周期候補に対する駆動音源符号化処理と選択情報の配分が不要になり、最小限の演算量と情報量の追加で高品質の音声符号化装置を提供できるという効果が得られる。
さらに、周期予備選択における適応音源の繰り返し周期に乗じる定数として、少なくとも1/2,1を含むようにしたので、少ない選択肢ながら高い確率で、本来のピッチ周期を含む駆動音源の繰り返し周期候補を選択することができ、最小限の演算量と情報量の追加で高品質の音声符号化装置を提供できるという効果が得られる。
さらに、この実施の形態1によれば、適応音源の繰り返し周期に複数の定数を乗じて複数の駆動音源の繰り返し周期候補を求め、この複数の駆動音源の繰り返し周期候補の中から所定個を予備選択し、音声符号中の駆動音源の繰り返し周期の選択情報に基づいて、予備選択された駆動音源の繰り返し周期候補の中から1つを駆動音源の繰り返し周期として選択し、この駆動音源の繰り返し周期を用いて駆動音源を復号化するようにしたので、本来のピッチ周期と適応音源の繰り返し周期が異なる場合でも、高い確率で本来のピッチ周期に近い繰り返し周期を用いた駆動音源の周期化がなされ、合成音の不安定な印象の発生を抑制でき、高品質の音声復号化装置を提供できるという効果が得られる。
さらに、周期予備選択における予備選択個数を2とし、1ビットで符号化された駆動音源の繰り返し周期の選択情報を復号化するようにしたので、最小限の情報量の追加で高品質の音声復号化装置を提供できるという効果が得られる。
さらに、周期予備選択において、適応音源の繰り返し周期と所定の閾値を比較して、この比較結果に基づいて所定個の駆動音源の繰り返し周期候補を選択するようにしたので、本来のピッチ周期である確率が低い駆動音源の繰り返し周期候補を排除でき、必要のない駆動音源の繰り返し周期候補に対する選択情報の配分が不要になり、最小限の情報量の追加で高品質の音声復号化装置を提供できるという効果が得られる。
さらに、周期予備選択における適応音源の繰り返し周期に乗じる定数として、少なくとも1/2,1を含むようにしたので、少ない選択肢ながら高い確率で、本来のピッチ周期を含む駆動音源の繰り返し周期候補を選択することができ、最小限の情報量の追加で高品質の音声復号化装置を提供できるという効果が得られる。
実施の形態2.
図5はこの発明の実施の形態2による音声符号化装置における駆動音源符号化手段5の構成を示すブロック図である。音声符号化装置の全体構成は、実施の形態1,すなわち図14と同様である。図5において、31は周期予備選択手段、33は適応音源符号化手段4内に格納されている適応音源符号帳であり、周期予備選択手段31は、定数テーブル32、適応音源生成手段34、距離計算手段35、予備選択手段36によって構成されている。
なお、駆動音源符号化手段27が、従来の駆動音源符号化手段5と同様の動作をする手段であるが、駆動音源符号化手段27の前後に周期予備選択手段31と周期符号化手段28が新規に挿入されたものを、図14における駆動音源符号化手段5の部分としたものが、この実施の形態2による音声符号化装置である。
図6はこの発明の実施の形態2による音声復号化装置における駆動音源復号化手段12の構成を示すブロック図である。音声復号化装置の全体構成は、実施の形態1,すなわち図15と同様である。図6において、33は適応音源復号化手段11内に格納されている適応音源符号帳である。
なお、駆動音源復号化手段30が、従来の駆動音源復号化手段12と同様の動作をする手段であるが、駆動音源復号化手段30の前に周期予備選択手段31と周期復号化手段29が新規に挿入されたものを、図15における駆動音源復号化手段12の部分としたものが、この実施の形態2による音声復号化装置である。
次に動作について説明する。
まず、音声符号化装置の動作について図5を用いて説明する。実施の形態1と同様に、適応音源符号化手段4が出力した適応音源の繰り返し周期が周期予備選択手段31に入力され、適応音源符号化手段4からの符号化対象信号、及び線形予測係数符号化手段3からの量子化された線形予測係数が駆動音源符号化手段27に入力される。
周期予備選択手段31内の定数テーブル32には、1/3,1/2,1,2という4つの定数が格納されており、各定数が入力された適応音源の繰り返し周期に乗じられ、得られた4つの駆動音源の繰り返し周期候補が、適応音源生成手段34と予備選択手段36に出力される。
適応音源生成手段34は、適応音源符号帳33内に格納されている過去の音源を用いて、上記4つの駆動音源の繰り返し周期候補の各々を繰り返し周期とした時の適応音源を生成して、生成した4つの適応音源を距離計算手段35に出力する。なお、適応音源の繰り返し周期の1倍の値に対しては、適応音源符号化手段4が既に同一の適応音源を生成しているので、適応音源生成手段34での生成を省略することができる。
また、4つの駆動音源の繰り返し周期候補の一部が、大きすぎたり又は小さすぎたりして、ピッチ周期として不適切な値となっている場合には、適応音源符号帳33が対応できないことも起こり得るので、適応音源生成手段34は、その駆動音源繰り返し周期候補に対する適応音源として、0信号を出力する等して、その後の予備選択時に選択されないようにする。
距離計算手段35は、適応音源の繰り返し周期の1倍の値を繰り返し周期とした時の適応音源(つまり適応音源符号化手段4が出力した適応音源)と、他の1/3倍、1/2倍、2倍の値を繰り返し周期とした時の適応音源との間の距離を計算して、得られた各距離を予備選択手段36に出力する。
予備選択手段36は、まず1/3倍の時と1/2倍の時の距離を比較して、小さい方を選択する。そして、この選択された距離を適応音源の平均振幅に所定の定数を乗じた値を比較し、前者が小さいときには、その距離を与えた繰り返し周期(適応音源の繰り返し周期の1/3倍又は1/2倍)と適応音源の繰り返し周期の1倍の値を、予備選択された駆動音源の繰り返し周期候補として出力する。前者が後者以上の時には、次にその距離と適応音源の繰り返し周期の2倍の時の距離を比較し、小さい方の距離を与えた繰り返し周期と適応音源の繰り返し周期の1倍の値を、予備選択された駆動音源の繰り返し周期候補として出力する。なお、所定の定数としては、1未満の正の値で0.1程度の小さい値を用いると良い。
駆動音源符号化手段27は、図17に示した従来の駆動音源符号化手段5と同様に、入力された各予備選択された駆動音源の繰り返し周期候補(図17と異なるのは、この予備選択された駆動音源の繰り返し周期候補が適応音源の定数倍となっている点である)、量子化された線形予測係数、符号化対象信号を用いて、代数的音源の符号化処理を行い、各繰り返し候補毎に符号化歪を最も小さくする駆動音源符号を探索し、得られた複数の音源位置と極性と、その時の符号化歪みに関する上記(1)式の評価値Dを出力する。
周期符号化手段28は、駆動音源符号化手段27が出力した駆動音源の各繰り返し周期候補に対する評価値を比較して、1つの評価値と残りの評価値の間の差が閾値以上である(つまり1つのものだけが符号化歪が小さい)場合には、その評価値を与えた駆動音源の繰り返し周期候補を選択し、評価値間の差異が閾値未満の場合には、別途分析しておいたピッチ周期(本来のピッチ周期の推定結果)に最も近い駆動音源の繰り返し周期候補を選択し、この選択結果を1ビットで符号化した選択情報と、その時の音源位置を表す音源位置符号と極性とを駆動音源符号として出力する。
次に音声復号化装置の動作について図6を用いて説明する。実施の形態1と同様に、適応音源復号化手段11が出力した適応音源の繰り返し周期が周期予備選択手段31に入力され、分離手段9が分離した駆動音源符号内の選択情報が周期復号化手段29に入力され、駆動音源符号内の音源位置符号と極性が駆動音源復号化手段30に入力される。
周期予備選択手段31は音声符号化装置内の図5に示す周期予備選択手段31と同じ構成を持ち、入力した適応音源の繰り返し周期を定数倍した駆動音源の繰り返し周期候補の中から2つの予備選択された駆動音源の繰り返し周期候補を選択し、周期復号化手段29に出力する。周期復号化手段29は、入力した駆動音源の選択情報に従って、上記2つの駆動音源の繰り返し周期候補の一方を選択して、これを駆動音源の繰り返し周期として駆動音源復号化手段30に出力する。駆動音源復号化手段30は、従来の駆動音源復号化手段12と同様に、音源位置符号に対応した各位置に固定波形を配置し、繰り返し周期に基づくピッチ周期化を行って、駆動音源符号に対する時系列ベクトルを駆動音源として出力する。
図7,図8,図9は、実施の形態2による音声符号化装置及び音声復号化装置における適応音源生成手段34で生成される適応音源を説明する図であり、図7は適応音源の繰り返し周期が本来のピッチ周期と一致している場合を示し、図8は適応音源の繰り返し周期が本来のピッチ周期の2倍である場合を示し、図9は適応音源の繰り返し周期が本来のピッチ周期の3倍である場合を示している。
図7を見ると、適応音源の繰り返し周期が本来のピッチ周期と一致している場合には、適応音源の繰り返し周期の1/3倍及び1/2倍を繰り返し周期として生成した適応音源と本来の適応音源(図中の最も上のもの)との距離が大きく、2倍と1倍が予備選択されやすいことが分かる。
図8を見ると、適応音源の繰り返し周期が本来のピッチ周期の2倍である場合には、適応音源の繰り返し周期の1/2倍を繰返し周期として生成した適応音源と本来の適応音源(図中の最も上のもの)との距離が小さく、1/2倍と1倍が予備選択されやすいことが分かる。
図9を見ると、適応音源の繰り返し周期が本来のピッチ周期の3倍である場合には、適応音源の繰り返し周期の1/3倍を繰り返し周期として生成した適応音源と本来の適応音源(図中の最も上のもの)との距離が小さく、1/3倍と1倍が予備選択されやすいことが分かる。
なお、上記実施の形態では、駆動音源の符号化と復号化に代数的音源を使用しているが、この発明は代数的音源構成に限定されるものではなく、その他の学習音源符号帳やランダム音源符号帳等を用いるCELP系音声符号化装置及び音声復号化装置においても適用可能である。
また、上記実施の形態では、別途ピッチ周期を求めて周期符号化手段28での選択に用いているが、これを用いずに符号化歪を最小にする、すなわち評価値Dを最大にする駆動音源の繰り返し周期候補を選択する構成も可能である。またピッチ周期ではなくて、過去の数フレームの適応音源の繰り返し周期を平均した値を参照値として用いても構わない。
さらに、上記実施の形態では、スペクトルパラメータとして線形予測係数を用いて説明したが、一般に多く使用されるLSP等、他のスペクトルパラメータを用いる構成でも構わない。
さらに、定数テーブル内から1を削除し、代わりに適応音源の繰り返し周期を直接予備選択手段36に入力するようにしても同じ結果が得られる。
さらに、特性改善効果は減少するが、定数テーブル中の値を1/2,1,2のみとする構成も可能である。
以上のように、この実施の形態2によれば、適応音源の繰り返し周期に複数の定数を乗じて複数の駆動音源の繰り返し周期候補を求め、この複数の駆動音源の繰り返し周期候補を、そのまま適応音源の繰り返し周期とした時の適応音源を各々生成し、生成された適応音源間の距離値に基づいて、所定個の駆動音源の繰り返し周期候補を選択するようにしたので、本来のピッチ周期と適応音源の繰り返し周期が異なる場合でも、高い確率で本来のピッチ周期に近い繰り返し周期を用いた駆動音源の周期化が選択され、合成音の不安定な印象の発生を抑制でき、高品質の音声符号化装置を提供できるという効果が得られる。
さらに、周期予備選択における予備選択個数を2とし、駆動音源の繰り返し周期の選択情報を1ビットで符号化するようにしたので、最小限の情報量の追加で高品質の音声符号化装置を提供できるという効果が得られる。
さらに、複数の駆動音源の繰り返し周期候補を、そのまま適応音源の繰り返し周期とした時の適応音源を各々生成し、生成された適応音源間の距離値に基づいて、所定個の駆動音源の繰り返し周期候補を選択するようにしたので、本来のピッチ周期である確率が低い駆動音源の繰り返し周期候補を排除でき、評価の必要のない駆動音源の繰り返し周期候補に対する駆動音源符号化処理と選択情報の配分が不要になり、最小限の演算量と情報量の追加で高品質の音声符号化装置を提供できるという効果が得られる。
さらに、周期予備選択における適応音源の繰り返し周期に乗じる定数として、少なくとも1/2,1を含むようにしたので、少ない選択肢ながら高い確率で、本来のピッチ周期を含む駆動音源の繰り返し周期候補を生成することができ、最小限の演算量と情報量の追加で高品質の音声符号化装置を提供できるという効果が得られる。
さらに、この実施の形態2によれば、適応音源の繰り返し周期に複数の定数を乗じて複数の駆動音源の繰り返し周期候補を求め、この複数の駆動音源の繰り返し周期候補の中から所定個の予備選択された駆動音源の繰り返し周期候補を選択し、音声符号中の駆動音源の繰り返し周期の選択情報に基づいて、予備選択された駆動音源の繰り返し周期候補の中から1つを駆動音源の繰り返し周期として選択し、この繰り返し周期を用いて駆動音源を復号化するようにしたので、本来のピッチ周期と適応音源の繰り返し周期が異なる場合でも、高い確率で本来のピッチ周期に近い繰り返し周期を用いた駆動音源の周期化がなされ、合成音の不安定な印象の発生を抑制でき、高品質の音声復号化装置を提供できるという効果が得られる。
さらに、周期予備選択における予備選択個数を2とし、1ビットで符号化された駆動音源の繰り返し周期の選択情報を復号化するようにしたので、最小限の情報量の追加で高品質の音声復号化装置を提供できるという効果が得られる。
さらに、周期予備選択において、複数の駆動音源の繰り返し周期候補を、そのまま適応音源の繰り返し周期とした時の適応音源を各々生成し、生成された適応音源間の距離値に基づいて、所定個の駆動音源の繰り返し周期候補を選択するようにしたので、本来のピッチ周期である確率が低い駆動音源の繰り返し周期候補を排除でき、必要のない繰り返し駆動音源の繰り返し周期候補に対する選択情報の配分が不要になり、最小限の情報量の追加で高品質の音声復号化装置を提供できるという効果が得られる。
さらに、周期予備選択における適応音源の繰り返し周期に乗じる定数として、少なくとも1/2,1を含むようにしたので、少ない選択肢ながら高い確率で、本来のピッチ周期を含む駆動音源の繰り返し周期候補を選択することができ、最小限の情報量の追加で高品質の音声復号化装置を提供できるという効果が得られる。
実施の形態3.
図10はこの発明の実施の形態3による音声符号化装置における駆動音源符号化手段5と新たに追加した聴覚重み付け制御手段37の構成を示すブロック図である。音声符号化装置の全体構成は、図14において、聴覚重み付け制御手段37が駆動音源符号化手段5に付随して追加されたものとなる。聴覚重み付け制御手段37は、比較手段38,強度制御手段39によって構成される。駆動音源符号化手段5内の構成は、図17で説明した従来のものと同様であり、唯一、聴覚重み付けフィルタ係数算出手段16が聴覚重み付け制御手段37により制御されている点のみが変更されている。
次に動作について説明する。
まず、音声符号化装置内の図14に示す線形予測係数符号化手段3から、駆動音源符号化手段5内の聴覚重み付けフィルタ係数算出手段16と基礎応答生成手段18に、量子化された線形予測係数が入力される。また、適応音源符号化手段4から、駆動音源符号化手段5内の基礎応答生成手段18と聴覚重み付け制御手段37内の比較手段38に、適応音源符号を変換して得られる適応音源の繰り返し周期が入力される。さらに、適応音源符号化手段4から、駆動音源符号化手段5内の聴覚重み付けフィルタ17に、入力音声1又は入力音声1から適応音源による合成音を差し引いた信号が、符号化対象信号として入力される。
聴覚重み付け制御手段37内の比較手段38は、入力された繰り返し周期を所定の閾値と比較して、比較結果を強度制御手段39に出力する。所定の閾値としては、男声と女声のピッチ周期の分布をほぼ分離する40程度の値とする。
強度制御手段39は、上記比較結果に基づいて、聴覚重み付けフィルタにおける強調強度を制御する強度係数を決定して、決定した強度係数を駆動音源符号化手段5内の聴覚重み付けフィルタ係数算出手段16に出力する。比較手段38の比較結果において、適応音源の繰り返し周期が所定の閾値以上である場合は、男声である可能性が高いので、聴覚重み付けの強度が弱めになるように強度係数を決定する。逆の比較結果において、適応音源の繰り返し周期が所定の閾値未満である場合には、女声である可能性が高いので、聴覚重み付けの強度が強めになるように強度係数を決定する。強度係数としては、聴覚重み付けフィルタ係数の算出に用いる線形予測係数への乗算値等である。
聴覚重み付けフィルタ係数算出手段16は、上記量子化された線形予測係数と上記強度係数を用いて聴覚重み付けフィルタ係数を算出し、算出した聴覚重み付けフィルタ係数を、聴覚重み付けフィルタ17と聴覚重み付けフィルタ19のフィルタ係数として設定する。
以降の聴覚重み付けフィルタ17,基礎応答生成手段18,聴覚重み付けフィルタ19,プリテーブル算出手段20,探索手段21,音源位置テーブル22の構成と動作は、従来と同じであるので説明を省略する。
なお、上記実施の形態では、聴覚重み付け制御手段37が所定の閾値以上か未満かに基づいて強度係数を決定したが、2つ以上の所定の閾値を使用してより細かく制御したり、閾値との差の大きさ等に基づいて連続的に制御することも可能である。
また、上記実施の形態では、駆動音源の符号化に代数的音源を使用しているが、この発明は代数的音源構成に限定されるものではなく、その他の学習音源符号帳やランダム音源符号帳等を用いるCELP系音声符号化装置においても適用可能である。
さらに、上記実施の形態では、スペクトルパラメータとして線形予測係数を用いて説明したが、一般に多く使用されるLSP等、他のスペクトルパラメータを用いる構成でも構わない。
以上のように、この実施の形態3によれば、適応音源の繰り返し周期の値に基づいて、聴覚重み付けの強度係数を制御し、この強度係数を用いて聴覚重み付けのためのフィルタ係数を算出し、このフィルタ係数を用いて、駆動音源の符号化を行う符号化対象信号に対する聴覚重み付けを行うようにしたので、男声と女声の両方に最適に調整した聴覚重み付けが可能となり、高品質の音声符号化装置を提供できるという効果が得られる。
実施の形態4.
図11はこの発明の実施の形態4による音声符号化装置における駆動音源符号化手段5と新たに追加した聴覚重み付け制御手段40の構成を示すブロック図である。音声符号化装置の全体構成は、図14において、聴覚重み付け制御手段40が駆動音源符号化手段5に付随して追加されたものとなる。聴覚重み付け制御手段40は、比較手段38,強度制御手段39,平均値更新手段41によって構成される。駆動音源符号化手段5内の構成は、図17で説明した従来のものと同様であり、唯一、聴覚重み付けフィルタ係数算出手段16が聴覚重み付け制御手段40によって制御されている点のみが変更されている。
次に動作について説明する。
この実施の形態4は、上期実施の形態3の聴覚重み付け制御手段37内に平均値更新手段41を追加した構成となっているので、この新しい部分の動作を中心に説明する。適応音源符号化手段4から、駆動音源符号化手段5内の基礎応答生成手段18と聴覚重み付け制御手段40内の平均値更新手段41に、適応音源符号を変換して得られる適応音源の繰り返し周期が入力される。
聴覚重み付け制御手段40内の平均値更新手段41は、入力された適応音源の繰り返し周期を用いて、内部に格納してある適応音源の繰り返し周期の平均値を更新し、更新した平均値を比較手段38に対して出力する。最も簡単に平均値を更新する方法としては、そのフレームの繰り返し周期に1より小さい定数αを乗じたものと、それまでの平均値に1−αを乗じたものを加算する方法がある。平均値を求める目的は、男声であるか女声であるかを安定に判定することにあるので、適応音源ゲインが大きいフレームに更新を限定する等した上で、更新することが望ましい。
そして、比較手段38は、上記更新された平均値を所定の閾値と比較して、比較結果を強度制御手段39に出力する。強度制御手段39は、上記比較結果に基づいて、聴覚重み付けフィルタにおける強調強度を制御する強度係数を決定し、決定した強度係数を駆動音源符号化手段5内の聴覚重み付けフィルタ係数算出手段16に出力する。比較手段38の比較結果において、平均値が所定の閾値以上である場合は、男声である可能性が高いので、聴覚重み付けの強度が弱めになるように強度係数を決定する。逆の比較結果において、平均値が所定の閾値未満である場合には、女声である可能性が高いので、聴覚重み付けの強度が強めになるように強度係数を決定する。
以降の聴覚重み付けフィルタ係数算出手段16,聴覚重み付けフィルタ17,基礎応答生成手段18,聴覚重み付けフィルタ19,プリテーブル算出手段20,探索手段21,音源位置テーブル22の構成と動作は、従来と同じであるので説明を省略する。
なお、上記実施の形態では、聴覚重み付け制御手段40が所定の閾値以上か未満かに基づいて強度係数を決定したが、2つ以上の所定の閾値を使用してより細かく制御したり、所定の閾値との差の大きさ等に基づいて連続的に制御することも可能である。
また、上記実施の形態では、駆動音源の符号化に代数的音源を使用しているが、この発明は代数的音源構成に限定されるものではなく、その他の学習音源符号帳やランダム音源符号帳等を用いるCELP系音声符号化装置においても適用可能である。
さらに、上記実施の形態では、スペクトルパラメータとして線形予測係数を用いて説明したが、一般に多く使用されるLSP等、他のスペクトルパラメータを用いる構成でも構わない。
以上のように、この実施の形態4によれば、適応音源の繰り返し周期の過去の平均値に基づいて、聴覚重み付けの強度係数を制御し、この強度係数を用いて聴覚重み付けのためのフィルタ係数を算出し、このフィルタ係数を用いて、駆動音源の符号化を行う符号化対象信号に対する聴覚重み付けを行うようにしたので、男声と女声の両方に最適に調整した聴覚重み付けが可能となり、高品質の音声符号化装置を提供できるという効果が得られる。
また、特に適応音源の繰り返し周期の過去の平均値を使用することで、聴覚重み付けの強度が頻繁に変更されて不安定な印象を発生することを抑制できるという効果が得られる。
実施の形態5.
図12はこの発明の実施の形態5による音声符号化装置における駆動音源符号化手段5及び音声復号化装置における駆動音源復号化手段12で使用する音源位置テーブル22を示す図である。図16に示した従来の音源位置テーブルに対して、音源番号毎に固定振幅が追加されたものとなっている。
この固定振幅の振幅値は、同一テーブル内であれば、各音源番号毎の音源位置候補数に応じて与えられる。図12の場合には、音源番号1から音源番号3は音源位置候補数が8であり、同一の振幅値1.0が与えられている。音源番号4は音源位置候補数が16と多いので、他のものより大きい振幅値1.2が与えられている。このように音源位置候補数が多いほど大きい振幅値が与えられる。
この振幅を付与した音源位置テーブルを用いた音源位置探索は、やはり上記(1)式に基づいて行うことができる。但し、
Figure 2007179071
d”(mk )=ak d’(mk ) (10)
φ”(mk ,mi )=aki φ’(mk ,mi ) (11)
とする。ここで、ak はk番目のパルスの振幅(図12の振幅)である。パルス位置の全組合せに対する評価値Dの計算を始める前に、d”とφ”の計算を行っておくことにより、後は(8)式と(9)式の単純加算という少ない演算量で評価値Dが算出できる。
駆動音源の復号化は、音源位置符号に基づいて、図12の音源位置テーブル中の各音源番号毎に1つずつの音源位置を選択して、その音源位置に各音源番号毎に与えられた固定振幅を乗じた音源を配置することで行う。音源がパルスでなかったり周期化を行う場合には、配置される音源の成分が重複するので、重複する部分は全て加算すれば良い。つまり、従来の代数的音源の復号化処理において、音源番号毎に与えられた固定振幅を乗じる処理を追加したものとなっている。
なお、従来の技術で、音源番号毎に固定波形を用意するものがあったが、その場合には、基礎応答を音源番号毎に算出しなければならなかった。この実施の形態では、上記の通りプリテーブルの補正が追加されるだけである。また従来の技術では、音源番号による位置情報量(候補数)の違いに対応させて振幅値を与えることはしていない。
以上のように、この実施の形態5によれば、各音源位置の選択可能な候補数に基づいて予め固定振幅を与えておき、駆動音源符号化手段5が、該音源位置に配置される音源にこの固定振幅を乗じつつ、全音源の加算を行って駆動音源を生成した時に、入力音声との符号化歪が最も小さい駆動音源を与える音源位置を表す符号と極性を探索して出力するようにしたので、簡単な構成で、処理量の増加もほとんどなしに、音源毎の振幅に関する無駄が減少し、高品質の音声符号化装置を提供できるという効果が得られる。
また、音声符号中の各音源位置に対し、各音源位置の選択可能な候補数に基づいて予め固定振幅を与えておき、該音源位置に配置される音源にこの固定振幅を乗じつつ、全音源の加算を行って駆動音源を生成するようにしたので、簡単な構成で、音源毎の振幅に関する無駄が減少し、高品質の音声復号化装置を提供できるという効果が得られる。
実施の形態6.
図13はこの発明の実施の形態5による音声符号化装置における駆動音源符号化手段5の構成を示すブロック図である。音声符号化装置の全体構成は図14と同様である。図13において、42はプリテーブル補正手段である。この実施の形態では、このプリテーブル補正手段42のみの追加によって、聴覚重み付けされた符号化対象信号を適応音源に対して直交化する。
次に動作について説明する。
まず、音声符号化装置内の線形予測係数符号化手段3から、駆動音源符号化手段5内の聴覚重み付けフィルタ係数算出手段16と基礎応答生成手段18に、量子化された線形予測係数が入力される。また、適応音源符号化手段4から、駆動音源符号化手段5内の基礎応答生成手段18に、適応音源符号を変換して得られる適応音源の繰り返し周期が入力される。また、適応音源符号化手段4から、駆動音源符号化手段5内の聴覚重み付けフィルタ17に、入力音声1又は入力音声1から適応音源による合成音を差し引いた信号が符号化対象信号として入力される。そして、適応音源符号化手段4から、駆動音源符号化手段5内のプリテーブル補正手段42に、適応音源が入力される。
聴覚重み付けフィルタ係数算出手段16は、上記量子化された線形予測係数を用いて聴覚重み付けフィルタ係数を算出し、算出した聴覚重み付けフィルタ係数を聴覚重み付けフィルタ17と聴覚重み付けフィルタ19のフィルタ係数として設定する。聴覚重み付けフィルタ17は、聴覚重み付けフィルタ係数算出手段16によって設定されたフィルタ係数により、入力された符号化対象信号に対してフィルタ処理を行う。
基礎応答生成手段18は、単位インパルス又は固定波形に対して、入力された適応音源の繰返し周期を用いた周期化処理を行い、得られた信号を音源として、上記量子化された線形予測係数を用いて構成した合成フィルタによる合成音を生成し、これを基礎応答として出力する。聴覚重み付けフィルタ19は、聴覚重み付けフィルタ係数算出手段16によって設定されたフィルタ係数により、入力された基礎応答に対してフィルタ処理を行う。
プリテーブル算出手段20は、1つの音源位置に所定の音源を配置した信号を仮駆動音源とし、上記聴覚重み付けされた符号化対象信号と聴覚重み付けされた基礎応答の相関値、すなわち、聴覚重み付けされた符号化対象信号と聴覚重み付けされた全ての音源位置候補に対応する仮駆動音源に基づく合成音の相関値を計算してd(x)とし、聴覚重み付けされた基礎応答の相互相関値、すなわち、全ての候補の組み合わせに対応した仮駆動音源に基づく合成音間の相互相関値を計算してφ(x,y)とする。そして、これらのd(x)とφ(x,y)をプリテーブルとして記憶する。
プリテーブル補正手段42は、適応音源とプリテーブル算出手段20が記憶しているプリテーブルを入力し、以下の(12)式及び(13)式に基づく補正処理を行い、得られた結果に対して、(14)式と(15)式により、音源位置毎のd’(x)とφ’(x,y)を求めて、これらを新たにプリテーブルとして記憶する。
Figure 2007179071
但し、
tgt は聴覚重み付けされた符号化対象信号と聴覚重み付けされた適応音源応答(合成音)の相関値、すなわち、聴覚重み付けされた符号化対象信号と聴覚重み付けされた適応音源に基づく合成音との間の相関値であり、
x は聴覚重み付けされた基礎応答を音源位置xに配置した信号と聴覚重み付けされた適応音源応答(合成音)の相関値、すなわち、全ての音源位置候補に対応する仮駆動音源に基づく合成音と適応音源に基づく合成音との間の相関値であり、
acb は聴覚重み付けされた適応音源応答(合成音)のパワーである。
最後に、探索手段21は、音源位置テーブル22から音源位置候補を順次読み出して、各音源位置の組み合わせに対する評価値Dを、(1)式、(4)式、(5)式に基づいて、プリテーブル補正手段42が記憶しているプリテーブル、すなわち、音源位置毎のd’(x)とφ’(x,y)を使用して計算する。そして、評価値Dを最大にする音源位置の組み合わせを探索し、得られた複数の音源位置を表す音源位置符号(音源位置テーブルにおけるインデックス)と極性を、駆動音源符号として出力すると共に、この駆動音源符号に対応する時系列ベクトルを駆動音源として出力する。
以上のように、この実施の形態6によれば、符号化対象信号と適応音源に基づく合成音との間の相関値ctgt 、全ての音源位置候補に対応する仮駆動音源に基づく合成音と適応音源に基づく合成音との間の相関値cx を求めて、これらの値を用いてプリテーブルを補正するようにしたので、探索手段21における処理量を増やさずに、聴覚重み付けされた符号化対象信号を適応音源に対して直交化することができ、これにより符号化特性を改善でき、高品質の音声符号化装置を提供できるという効果が得られる。
この発明の実施の形態1による音声符号化装置における駆動音源符号化手段の構成を示すブロック図である。 この発明の実施の形態1による音声復号化装置における駆動音源復号化手段の構成を示すブロック図である。 この発明の実施の形態1による符号化対象信号と周期化された駆動音源の音源位置の関係を説明する図である。 この発明の実施の形態1による符号化対象信号と周期化された駆動音源の音源位置の関係を説明する図である。 この発明の実施の形態2による音声符号化装置における駆動音源符号化手段の構成を示すブロック図である。 この発明の実施の形態2による音声復号化装置における駆動音源復号化手段の構成を示すブロック図である。 この発明の実施の形態2による適応音源生成手段で生成される適応音源を説明する図である。 この発明の実施の形態2による適応音源生成手段で生成される適応音源を説明する図である。 この発明の実施の形態2による適応音源生成手段で生成される適応音源を説明する図である。 この発明の実施の形態3による音声符号化装置における駆動音源符号化手段と聴覚重み付け制御手段の構成を示すブロック図である。 この発明の実施の形態4による音声符号化装置における駆動音源符号化手段と聴覚重み付け制御手段の構成を示すブロック図である。 この発明の実施の形態5による音源位置テーブルを示す図である。 この発明の実施の形態6による音声符号化装置における駆動音源符号化手段の構成を示すブロック図である。 従来のCELP系音声符号化装置の構成を示すブロック図である。 従来のCELP系音声復号化装置の構成を示すブロック図である。 従来のパルス音源の位置候補を示す図である。 従来のCELP系音声符号化装置における駆動音源符号化手段の構成を示すブロック図である。 従来の符号化対象信号と周期化された駆動音源の音源位置の関係を説明する図である。 従来の符号化対象信号と周期化された駆動音源の音源位置の関係を説明する図である。
符号の説明
1 入力音声、2 線形予測分析手段、3 線形予測係数符号化手段、4 適応音源符号化手段、5 駆動音源符号化手段、6 ゲイン符号化手段、7 多重化手段、8 音声符号、9 分離手段、10 線形予測係数復号化手段、11 適応音源復号化手段、12 駆動音源復号化手段、13 ゲイン復号化手段、14 合成フィルタ、15 出力音声、16 聴覚重み付けフィルタ係数算出手段、17,19 聴覚重み付けフィルタ、18 基礎応答生成手段、20 プリテーブル算出手段、21 探索手段、22 音源位置テーブル、23 周期予備選択手段、24 定数テーブル、25 比較手段、26 予備選択手段、27 駆動音源符号化手段、28 周期符号化手段、29 周期復号化手段、30 駆動音源復号化手段、31 周期予備選択手段、32 定数テーブル、33 適応音源符号帳、34 適応音源生成手段、35 距離計算手段、36 予備選択手段、37 聴覚重み付け制御手段、38 比較手段、39 強度制御手段、40 聴覚重み付け制御手段、41 平均値更新手段、42 プリテーブル補正手段。

Claims (2)

  1. 過去の音源より生成した適応音源と、入力音声と上記適応音源により生成され、複数の音源位置と極性で表現した駆動音源とを用いて、上記入力音声をフレーム単位に符号化して音声符号を出力する音声符号化装置において、
    1つの音源位置に所定の音源を配置した信号を仮駆動音源とし、上記入力音声等の符号化対象信号と全ての音源位置候補に対応する上記仮駆動音源に基づく合成音との間の相関値を計算すると共に、全ての候補の組み合わせに対応した上記仮駆動音源に基づく合成音間の相互相関値を計算してプリテーブルとして記憶するプリテーブル算出手段と、
    上記符号化対象信号と上記適応音源に基づく合成音との間の相関値を計算すると共に、上記全ての音源位置候補に対応する仮駆動音源に基づく合成音と上記適応音源に基づく合成音との間の相関値を計算して、計算したこれらの相関値を用いて上記プリテーブルを補正するプリテーブル補正手段と、
    上記補正されたプリテーブルを用いて複数の音源位置と極性を決定して、音源位置を表す音声位置符号と極性を出力する探索手段とを
    備えたことを特徴とする音声符号化装置。
  2. 過去の音源より生成した適応音源と、入力音声と上記適応音源により生成され、複数の音源位置と極性で表現した駆動音源とを用いて、上記入力音声をフレーム単位に符号化して音声符号を出力する音声符号化方法において、
    1つの音源位置に所定の音源を配置した信号を仮駆動音源とし、上記入力音声等の符号化対象信号と全ての音源位置候補に対応する上記仮駆動音源に基づく合成音との間の相関値を計算すると共に、全ての候補の組み合わせに対応した上記仮駆動音源に基づく合成音間の相互相関値を計算してプリテーブルとして記憶するステップと、
    上記符号化対象信号と上記適応音源に基づく合成音との間の相関値を計算すると共に、上記全ての音源位置候補に対応する仮駆動音源に基づく合成音と上記適応音源に基づく合成音との間の相関値を計算して、計算したこれらの相関値を用いて上記プリテーブルを補正するステップと、
    上記補正されたプリテーブルを用いて複数の音源位置と極性を決定して、音源位置を表す音声位置符号と極性を出力する探索ステップとを
    備えたことを特徴とする音声符号化方法。
JP2007044048A 2007-02-23 2007-02-23 音声符号化装置及び音声符号化方法 Expired - Lifetime JP4660496B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007044048A JP4660496B2 (ja) 2007-02-23 2007-02-23 音声符号化装置及び音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007044048A JP4660496B2 (ja) 2007-02-23 2007-02-23 音声符号化装置及び音声符号化方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004203597A Division JP3954050B2 (ja) 2004-07-09 2004-07-09 音声符号化装置及び音声符号化方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2009018494A Division JP4907677B2 (ja) 2009-01-29 2009-01-29 音声符号化装置及び音声符号化方法

Publications (3)

Publication Number Publication Date
JP2007179071A true JP2007179071A (ja) 2007-07-12
JP2007179071A5 JP2007179071A5 (ja) 2009-02-12
JP4660496B2 JP4660496B2 (ja) 2011-03-30

Family

ID=38304242

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007044048A Expired - Lifetime JP4660496B2 (ja) 2007-02-23 2007-02-23 音声符号化装置及び音声符号化方法

Country Status (1)

Country Link
JP (1) JP4660496B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH028900A (ja) * 1988-06-28 1990-01-12 Nec Corp 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置
JPH02310600A (ja) * 1989-05-26 1990-12-26 Nec Corp マルチパルス音声符号化方法
JPH1069297A (ja) * 1996-08-26 1998-03-10 Nec Corp 音声符号化装置
JPH1097294A (ja) * 1996-02-21 1998-04-14 Matsushita Electric Ind Co Ltd 音声符号化装置
JPH10232696A (ja) * 1997-02-19 1998-09-02 Matsushita Electric Ind Co Ltd 音源ベクトル生成装置及び音声符号化/復号化装置
WO1998040877A1 (fr) * 1997-03-12 1998-09-17 Mitsubishi Denki Kabushiki Kaisha Codeur vocal, decodeur vocal, codeur/decodeur vocal, procede de codage vocal, procede de decodage vocal et procede de codage/decodage vocal

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH028900A (ja) * 1988-06-28 1990-01-12 Nec Corp 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置
JPH02310600A (ja) * 1989-05-26 1990-12-26 Nec Corp マルチパルス音声符号化方法
JPH1097294A (ja) * 1996-02-21 1998-04-14 Matsushita Electric Ind Co Ltd 音声符号化装置
JPH1069297A (ja) * 1996-08-26 1998-03-10 Nec Corp 音声符号化装置
JPH10232696A (ja) * 1997-02-19 1998-09-02 Matsushita Electric Ind Co Ltd 音源ベクトル生成装置及び音声符号化/復号化装置
WO1998040877A1 (fr) * 1997-03-12 1998-09-17 Mitsubishi Denki Kabushiki Kaisha Codeur vocal, decodeur vocal, codeur/decodeur vocal, procede de codage vocal, procede de decodage vocal et procede de codage/decodage vocal

Also Published As

Publication number Publication date
JP4660496B2 (ja) 2011-03-30

Similar Documents

Publication Publication Date Title
USRE43190E1 (en) Speech coding apparatus and speech decoding apparatus
JP3566220B2 (ja) 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US6385576B2 (en) Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
KR100350340B1 (ko) 음성 부호화 장치, 음성 복호 장치 및 음성 부호화 복호 장치 및 음성 부호화 방법, 음성 복호 방법 및 음성 부호화 복호 방법
JP3404024B2 (ja) 音声符号化方法および音声符号化装置
JP2002202799A (ja) 音声符号変換装置
WO1998006091A1 (fr) Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
JP3426207B2 (ja) 音声符号化方法および装置
JPH1097294A (ja) 音声符号化装置
WO2002054386A1 (fr) Systeme de codage vocal et procede de codage vocal
JP2001075600A (ja) 音声符号化装置および音声復号化装置
JP3954050B2 (ja) 音声符号化装置及び音声符号化方法
JP4660496B2 (ja) 音声符号化装置及び音声符号化方法
JP4907677B2 (ja) 音声符号化装置及び音声符号化方法
JP4087429B2 (ja) 音声符号化装置及び音声符号化方法
KR100736504B1 (ko) 확률적 코드북의 음원 부호화 방법
JP3579276B2 (ja) 音声符号化/復号化方法
JP3578933B2 (ja) 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体
JP3552201B2 (ja) 音声符号化方法および装置
USRE43209E1 (en) Speech coding apparatus and speech decoding apparatus
JPH06130994A (ja) 音声符号化方法
JP4373667B2 (ja) 適応符号帳の更新方法、適応符号帳更新装置、音声符号化装置及び音声復号化装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070704

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070913

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101228

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4660496

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term