JP2002132299A - 音声符号化方法および装置 - Google Patents

音声符号化方法および装置

Info

Publication number
JP2002132299A
JP2002132299A JP2000327322A JP2000327322A JP2002132299A JP 2002132299 A JP2002132299 A JP 2002132299A JP 2000327322 A JP2000327322 A JP 2000327322A JP 2000327322 A JP2000327322 A JP 2000327322A JP 2002132299 A JP2002132299 A JP 2002132299A
Authority
JP
Japan
Prior art keywords
distortion
vector
evaluation value
drive
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000327322A
Other languages
English (en)
Other versions
JP3426207B2 (ja
Inventor
Hirohisa Tazaki
裕久 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2000327322A priority Critical patent/JP3426207B2/ja
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to CN01821214.XA priority patent/CN1222926C/zh
Priority to IL15524301A priority patent/IL155243A0/xx
Priority to EP01919951A priority patent/EP1339042B1/en
Priority to DE60141646T priority patent/DE60141646D1/de
Priority to PCT/JP2001/003240 priority patent/WO2002035522A1/ja
Priority to US10/398,808 priority patent/US7203641B2/en
Priority to TW090109564A priority patent/TW517223B/zh
Publication of JP2002132299A publication Critical patent/JP2002132299A/ja
Application granted granted Critical
Publication of JP3426207B2 publication Critical patent/JP3426207B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 復号音の局所的な異音発生の少ない高品質な
音声符号化方法および装置を提供する。 【解決手段】 複数の駆動ベクトルを生成する駆動ベク
トル生成手段13と、各駆動ベクトル毎に、入力音声か
ら求まる符号化対象信号と駆動ベクトルから求まる合成
ベクトルの間に定義される波形に関する歪を第一の歪と
して算出する第一の歪算出部23と、各駆動ベクトル毎
に、前記符号化対象信号と駆動ベクトルから求まる合成
ベクトルの間に定義される第一の歪と異なる第二の歪を
算出する第二の歪算出部24と、各駆動ベクトル毎に、
前記第一の歪と第二の歪を用いて所定の探索用評価値を
算出する評価値算出部29と、探索用評価値を最小にす
る駆動ベクトルを選択し、選択した駆動ベクトルに予め
対応付けられている符号を出力する探索手段20とを備
える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ディジタル音声
信号を少ない情報量に圧縮する音声符号化方法および装
置に関するもので、特に、音声符号化方法および装置に
おける駆動ベクトルの探索に関する。
【0002】
【従来の技術】従来、多くの音声符号化方法および装置
では、入力音声をスペクトル包絡情報と音源に分けて、
フレーム単位で各々を符号化して音声符号を生成してい
る。最も代表的な音声符号化方法および装置としては、
文献1(ITU-T Recomendation G.729, “CODING OF SPE
ECH AT 8 kbit /s USING CONJUGATE -STURUCTURE ALGEB
RAIC-CODE-EXCITED LINEAR-PREDICTION (CS-ACEL
P)”, 1996年3月)等に開示されている、符号駆動線形
予測符号化(Code-Excited Linear Prediction:CEL
P)方式を用いたものがある。
【0003】図8は、文献1に開示されている従来のC
ELP系音声符号化装置の全体構成を示すブロック図で
ある。図において、1は入力音声、2は線形予測分析手
段、3は線形予測係数符号化手段、4は適応音源符号手
段、5は駆動音源符号化部、6はゲイン符号化手段、7
は多重化手段、8は音声符号である。
【0004】この従来の音声符号化装置では、10ms
を1フレームとして、フレーム単位で処理を行う。音源
の符号化については、1フレームを2分割したサブフレ
ーム毎に処理を行う。なお、説明を分かりやすくするた
めに、以降の説明では、フレームとサブフレームを特に
区別せず、単にフレームと記す。以下、この従来の音声
符号化装置の動作について説明する。
【0005】まず、入力音声1が線形予測分析手段2と
適応音源符号化手段4及びゲイン符号化手段6に入力さ
れる。線形予測分析手段2は、入力音声1を分析し、音
声のスペクトル包絡情報である線形予測係数を抽出す
る。線形予測係数符号化手段3は、この線形予測係数を
符号化し、その符号を多重化手段7に出力すると共に、
音源の符号化のために量子化された線形予測係数を出力
する。
【0006】適応音源符号化手段4は、過去の所定長の
音源(信号)を適応音源符号帳として記憶しており、内
部で発生させた数ビットの2進数値で示した各適応音源
符号に対応して、過去の音源を周期的に繰り返した時系
列ベクトル(適応ベクトル)を生成する。次に、線形予
測係数符号化手段3から出力された量子化された線形予
測係数を用いた合成フィルタに通すことにより、仮の合
成音を得る。この仮の合成音に適切なゲインを乗じた信
号と、入力音声1との間の歪を調べ、この歪を最小とす
る適応音源符号を選択して多重化手段7に出力すると共
に、選択された適応音源符号に対応する時系列ベクトル
を適応音源として、駆動音源符号化部5とゲイン符号化
手段6に出力する。また、入力音声1から適応音源によ
る合成音に適切なゲインを乗じた信号を差し引いた信号
を、符号化対象信号として駆動音源符号化部5に出力す
る。
【0007】駆動音源符号化部5は、まず、内部で発生
させた2進数値で示した各駆動音源符号に対応して、内
部に格納してある駆動音源符号帳から時系列ベクトル
(駆動ベクトル)を順次読み出す。次に、線形予測係数
符号化手段3から出力された量子化された線形予測係数
を用いた合成フィルタに通すことにより、仮の合成音を
得る。この仮の合成音に適切なゲインを乗じた信号と、
入力音声1から適応音源による合成音を差し引いた信号
である符号化対象信号との歪を調べ、この歪を最小とす
る駆動音源符号を選択して多重化手段7に出力すると共
に、選択された駆動音源符号に対応する時系列ベクトル
を駆動音源として、ゲイン符号化手段6に出力する。
【0008】ゲイン符号化手段6は、まず、内部で発生
させた2進数値で示した各ゲイン符号に対応して、内部
に格納してあるゲイン符号帳からゲインベクトルを順次
読み出す。そして、各ゲインベクトルの各要素を、適応
音源符号化手段4から出力された適応音源と駆動音源符
号化部5から出力された駆動音源に乗じて加算して音源
を生成し、生成したこの音源を線形予測係数符号化手段
3から出力された量子化された線形予測係数を用いた合
成フィルタに通すことで、仮の合成音を得る。この仮の
合成音と入力音声1との歪を調べ、この歪を最小とする
ゲイン符号を選択して多重化手段7に出力する。また、
このゲイン符号に対応する上記生成された音源を適応音
源符号化手段4に出力する。
【0009】最後に、適応音源符号化手段4は、ゲイン
符号化手段6により生成されたゲイン符号に対応する音
源を用いて、内部の適応音源符号帳の更新を行う。
【0010】多重化手段7は、線形予測係数符号化手段
3から出力された線形予測係数の符号と、適応音源符号
化手段4から出力された適応音源符号と、駆動音源符号
化部5から出力された駆動音源符号と、ゲイン符号化手
段6から出力されたゲイン符号を多重化し、得られた音
声符号8を出力する。
【0011】図9は、文献1などに開示されている従来
のCELP系音声符号化装置の駆動音源符号化部5の詳
細構成を示すブロック図である。図9において、9は適
応ベクトル生成手段、10と14は合成フィルタ、11
は減算手段、12は符号化対象信号、13は駆動ベクト
ル生成手段、15は歪算出部、20は探索手段、21は
駆動音源符号、22は駆動音源である。歪算出部15
は、聴覚重み付けフィルタ16、聴覚重み付けフィルタ
17、減算手段18、パワー算出手段19によって構成
されている。なお、適応ベクトル生成手段9、合成フィ
ルタ10、減算手段11は、適応音源符号化手段4内に
含まれているものであるが、内容を分かりやすくするた
めに合わせて記載している。
【0012】まず、適応音源符号化手段4内の適応ベク
トル生成手段9が、前記した適応音源符号に対応した時
系列ベクトルを、適応音源として合成フィルタ10に出
力する。適応音源符号化手段4内の合成フィルタ10
は、図8の線形予測係数符号化手段3から出力された量
子化された線形予測係数がフィルタ係数として設定され
ており、適応ベクトル生成手段9から出力された適応音
源に対する合成フィルタリングを行い、得られた合成音
を減算手段11に出力する。適応音源符号化手段4内の
減算手段11は、合成フィルタ10より出力された合成
音と入力音声1の差信号を求め、得られた差信号を駆動
音源符号化部5における符号化対象信号12として出力
する。
【0013】一方、探索手段20は、2進数値で示した
各駆動音源符号を順次発生させ、順番に駆動ベクトル生
成手段13に出力する。駆動ベクトル生成手段13は、
探索手段20から出力された駆動音源符号に応じて、内
部に格納してある駆動音源符号帳から時系列ベクトルを
読み出し、駆動ベクトルとして合成フィルタ14に出力
する。なお、駆動音源符号帳としては、予め用意した雑
音ベクトルを格納したものや、代数的にパルス位置と極
性の組み合わせによって記述した代数的音源符号帳など
がある。また、2つ以上の符号帳の加算形式や、適応音
源の繰返し周期も用いたピッチ周期化を内包したものも
ある。
【0014】合成フィルタ14は、線形予測係数符号化
手段3から出力された量子化された線形予測係数がフィ
ルタ係数として設定されており、駆動ベクトル生成手段
13から出力された駆動ベクトルに対して合成フィルタ
リングを行い、得られた合成音を、歪算出部15に対し
て出力する。
【0015】歪算出部15内の聴覚重み付けフィルタ1
6は、線形予測係数符号化手段3から出力された量子化
された線形予測係数に基づいて聴覚重み付けフィルタ係
数を算出し、これをフィルタ係数に設定して、適応音源
符号化手段4内の減算手段11から出力された符号化対
象信号12に対するフィルタリングを行い、得られた信
号を減算手段18に出力する。歪算出部15内の聴覚重
み付けフィルタ17は、聴覚重み付けフィルタ16と同
じフィルタ係数に設定して、合成フィルタ14から出力
された合成音に対するフィルタリングを行い、得られた
信号を減算手段18に出力する。
【0016】歪算出部15内の減算手段18は、聴覚重
み付けフィルタ16から出力した信号と、聴覚重み付け
フィルタ17から出力した信号に適切なゲインを乗じた
信号の差信号を求め、この差信号をパワー算出手段19
に出力する。歪算出部15内のパワー算出手段19は、
減算手段18から出力された差信号の総パワーを求め、
これを探索用評価値として探索手段20に出力する。
【0017】探索手段20は、歪算出部15内のパワー
算出手段19より出力された探索用評価値を最小にする
駆動音源符号を探索し、探索用評価値を最小にする駆動
音源符号を駆動音源符号21として出力する。また、駆
動ベクトル生成手段13は、この駆動音源符号21を入
力されたときに出力した駆動ベクトルを駆動音源22と
して出力する。
【0018】なお、減算手段18で乗じるゲインについ
ては、探索用評価値を最小にするように偏微分方程式を
解くことによって一意に決定される。実際の歪算出部1
5の内部構成に付いては、演算量を削減するために各種
変形方法が報告されている。
【0019】また、特開平7−271397号公報に
は、歪算出部の演算量を削減する幾つかの方法が開示さ
れている。以下、特開平7−271397号公報に開示
されている歪算出部の方法について説明する。駆動ベク
トルを合成フィルタ14に通して得られた合成音をY
i、入力音声をR(図9における符号化対象信号12に
相当)とした時、2つの信号の間の波形歪として定義さ
れる探索用評価値は、式(1)となる。
【0020】
【数1】
【0021】これは、図9で説明した探索用評価値算出
において、聴覚重み付けフィルタを導入しなかった場合
に一致する。αが減算手段18で乗じるゲインであり、
式(1)をαで偏微分した式をゼロとするαを求め、こ
れを式(1)に代入すると、式(2)となる。
【0022】
【数2】
【0023】式(2)の第一項は駆動ベクトルによらな
い定数なので、探索用評価値Eを最小化することは、式
(2)の第二項を最大化することに等しい。そこで、式
(2)の第二項をそのまま探索用評価値として用いる場
合が多い。
【0024】この式(2)の第二項の演算には多くの演
算量を要するため、特開平7−271397号公報で
は、簡略化した探索用評価値を用いた予備選択を行い、
予備選択された駆動ベクトルについてのみ式(2)の第
二項を計算して本選択することで演算量の削減を図って
いる。予備選択で用いる簡略化した探索用評価値として
は、式(3)〜(5)などを用いている。
【0025】
【数3】
【0026】ここで、Yiは駆動ベクトル、Cは符号帳
に格納された駆動ベクトル群であり、これらによって定
義される重み係数Wを式(3)に乗じた値を予備選択に
おける探索用評価値とすることで、式(3)を用いる場
合よりも式(4)または式(5)を用いる場合の方が予
備選択の精度が高くなると報告されている。
【0027】予備選択時の簡易化した探索用評価値であ
る式(3)、式(4)、式(5)と、本選択時の探索用
評価値である式(2)の第二項を比較すると、駆動ベク
トル群Cまたは駆動ベクトルyiに基づく重み係数の乗算
と、駆動ベクトルの合成音Yiのパワーによる除算部分
の違いだけである。式(3)、式(4)、式(5)は何
れも、式(2)の第二項を近似するものであり、式
(1)に示した2つの信号間の波形歪を評価しているこ
とにかわりがない。
【0028】
【発明が解決しようとする課題】しかしながら、上述し
た従来の音声符号化方法及び装置では、以下に述べる課
題がある。駆動音源符号に用いることができる情報量が
少ない場合、つまり駆動ベクトルの数が少なくなってく
ると、式(1)乃至式(5)で説明した波形歪を最小に
する駆動音源符号を選択しても、この駆動音源符号を含
む音声符号を復号して得られる復号音において、音質劣
化を招く場合がある。
【0029】図10は、音質劣化を引き起こす1つのケ
ースについて説明する説明図である。図10中、(a)
が符号化対象信号、(c)が駆動ベクトル、(b)が
(c)に示した駆動ベクトルを合成フィルタに通して得
られる合成音である。何れも符号化対象フレーム内の信
号を示している。この例では、駆動ベクトルとして、パ
ルス位置と極性を代数的に表現した代数的音源を用いて
いる。
【0030】図10の場合、フレームの後半では(a)
と(b)の類似度は高く、比較的良好に表現されている
が、フレームの前半では(b)の振幅が0となってい
て、全く(a)を表現できていない。音声の立ちあがり
部分など適応音源へのゲインが大きく取れない場合に
は、図10のようにフレームの一部の符号化特性が極端
に悪い部分が、復号音において局所的異音として聞こえ
てしまうことが多い。
【0031】つまり、フレーム全体での波形歪を最小に
する駆動音源符号を選択する従来法では、図10のよう
にフレーム内の一部に極端に符号化特性が悪い部分があ
っても選択してしまい、復号音の品質劣化を招いてしま
う課題がある。なお、この課題は、特開平7−2713
97号公報に開示されているような簡易化した探索用評
価値を用いても解消しない。
【0032】この発明は、かかる課題を解決するために
なされたものであり、復号音の局所的な異音発生の少な
い高品質な音声符号化方法および装置を提供することを
目的としている。また、演算量の増加を最小限に抑えつ
つ、高品質の音声符号化方法および装置を提供すること
を目的としている。
【0033】
【課題を解決するための手段】この発明に係る音声符号
化方法は、入力音声をフレームと呼ばれる所定長区間毎
に符号化する音声符号化方法において、複数の駆動ベク
トルを生成する駆動ベクトル生成工程と、各駆動ベクト
ル毎に、入力音声から求まる符号化対象信号と駆動ベク
トルから求まる合成ベクトルの間に定義される波形に関
する歪を第一の歪として算出する第一の歪算出工程と、
各駆動ベクトル毎に、前記符号化対象信号と駆動ベクト
ルから求まる合成ベクトルの間に定義される第一の歪と
異なる第二の歪を算出する第二の歪算出工程と、各駆動
ベクトル毎に、前記第一の歪と第二の歪を用いて所定の
探索用評価値を算出する評価値算出工程と、探索用評価
値を最小にする駆動ベクトルを選択し、選択した駆動ベ
クトルに予め対応付けられている符号を出力する探索工
程とを備えたものである。
【0034】また、前記第一の歪算出工程が算出した第
一の歪が小さい2つ以上の駆動ベクトルを選択する予備
選択工程を備え、前記第二の歪算出工程、評価値算出工
程、探索工程の対象を、予備選択工程が選択した駆動ベ
クトルに限定するようにしたことを特徴とするものであ
る。
【0035】また、互いに異なる駆動ベクトルを生成す
る駆動ベクトル生成工程を複数備えると共に、各駆動ベ
クトル生成工程毎に、前記第一の歪算出工程が算出した
第一の歪が小さい1つ以上の駆動ベクトルを選択する予
備選択工程を備え、前記第二の歪算出工程、評価値算出
工程、探索工程の対象を、予備選択工程が選択した駆動
ベクトルに限定するようにしたことを特徴とするもので
ある。
【0036】また、前記第一の歪算出工程は、入力音声
から求まる符号化対象信号を聴覚重み付けフィルタに通
した信号と、駆動ベクトルから求まる合成ベクトルを聴
覚重み付けフィルタに通した信号との、サンプル毎の誤
差パワーをフレーム内で加算した結果を第一の歪とする
ことを特徴とするものである。
【0037】また、前記第二の歪算出工程は、フレーム
内の時間方向の振幅またはパワーの偏りに関する歪を第
二の歪とすることを特徴とするものである。
【0038】また、前記第二の歪算出工程は、フレーム
内の符号化対象信号の振幅またはパワーの重心位置を求
めると共に、フレーム内の合成ベクトルの振幅またはパ
ワーの重心位置を求め、求まった2つの重心位置の差を
第二の歪とすることを特徴とするものである。
【0039】また、前記評価値算出工程は、第二の歪に
応じて第一の歪を補正することで探索用評価値を算出す
るようにしたことを特徴とするものである。
【0040】また、前記評価値算出工程は、第一の歪と
第二の歪の重み付き和によって探索用評価値を算出する
ようにしたことを特徴とするものである。
【0041】また、前記評価値算出工程は、入力音声か
ら算出した所定のパラメータに応じて探索用評価値を算
出する処理を変更するようにしたことを特徴とするもの
である。
【0042】また、駆動ベクトル以外の音源ベクトルか
ら求まる合成ベクトルのエネルギーと入力音声のエネル
ギーの比率を求め、これを他音源寄与度とする寄与度算
出工程を備え、算出した他音源寄与度を前記評価値算出
工程における所定パラメータとしたことを特徴とするも
のである。
【0043】また、前記評価値算出工程は、どの駆動ベ
クトル生成工程から出力された駆動ベクトルであるかに
よって、探索用評価値を算出する処理を変更するように
したことを特徴とするものである。
【0044】また、前記評価値算出工程は、探索用評価
値を算出する処理の1つとして、第一の歪をそのまま探
索用評価値とする処理を含むようにしたことを特徴とす
るものである。
【0045】また、この発明に係る音声符号化装置は、
入力音声をフレームと呼ばれる所定長区間毎に符号化す
る音声符号化装置において、複数の駆動ベクトルを生成
する駆動ベクトル生成手段と、各駆動ベクトル毎に、入
力音声から求まる符号化対象信号と駆動ベクトルから求
まる合成ベクトルの間に定義される波形に関する歪を第
一の歪として算出する第一の歪算出手段と、各駆動ベク
トル毎に、前記符号化対象信号と駆動ベクトルから求ま
る合成ベクトルの間に定義される第一の歪と異なる第二
の歪を算出する第二の歪算出手段と、各駆動ベクトル毎
に、前記第一の歪と第二の歪を用いて所定の探索用評価
値を算出する評価値算出手段と、探索用評価値を最小に
する駆動ベクトルを選択し、選択した駆動ベクトルに予
め対応付けられている符号を出力する探索手段とを備え
たことを特徴とするものである。
【0046】また、前記第一の歪算出手段は、入力音声
から求まる符号化対象信号を聴覚重み付けフィルタに通
した信号と、駆動ベクトルから求まる合成ベクトルを聴
覚重み付けフィルタに通した信号との、サンプル毎の誤
差パワーをフレーム内で加算した結果を第一の歪とする
ことを特徴とするものである。
【0047】また、前記第二の歪算出手段は、フレーム
内の時間方向の振幅またはパワーの偏りに関する歪を第
二の歪とすることを特徴とするものである。
【0048】また、前記評価値算出手段は、第二の歪に
応じて第一の歪を補正することで探索用評価値を算出す
るようにしたことを特徴とするものである。
【0049】さらに、前記評価値算出手段は、入力音声
から算出した所定のパラメータに応じて探索用評価値を
算出する処理を変更するようにしたことを特徴とするも
のである。
【0050】
【発明の実施の形態】以下、図面を参照しながら、この
発明の各実施の形態について説明する。 実施の形態1.図1は、この発明による音声符号化方法
を適用した音声符号化装置における実施の形態1に係る
駆動音源符号化部5の詳細構成を示すブロック図であ
る。この実施の形態1における音声符号化装置の全体構
成は図8に示す構成と同様であるが、駆動音源符号化部
5に入力音声1の入力を追加したものとなっている。
【0051】図1において、図9に示す従来例の駆動音
源符号化部5の構成と同一部分は同一符号を付してその
説明は省略する。新たな符号として、23は、聴覚重み
付けフィルタ16と17、減算手段18及びパワー算出
手段19によって構成される第一の歪算出部、24は、
重心算出手段25と26及び減算手段27によって構成
される第二の歪算出部、28は適応音源寄与度算出手
段、29は探索用評価値算出部である。なお、適応ベク
トル生成手段9、合成フィルタ10、減算手段11は、
図8に示す適応音源符号化手段4内に含まれているもの
であるが、内容を分かりやすくするために合わせて記載
している。
【0052】以下、本実施の形態1に係る駆動音源符号
化部5の動作を説明する。まず、適応音源符号化手段4
内の適応ベクトル生成手段9が、前記した適応音源符号
に対応した時系列ベクトルを、適応音源として合成フィ
ルタ10に出力する。適応音源符号化手段4内の合成フ
ィルタ10は、線形予測係数符号化手段3から出力され
た量子化された線形予測係数がフィルタ係数として設定
されており、適応ベクトル生成手段9から出力された適
応音源に対する合成フィルタリングを行い、得られた合
成音を減算手段11と適応音源寄与度算出手段28に出
力する。適応音源符号化手段4内の減算手段11は、合
成フィルタ10より出力された合成音と入力音声1の差
信号を求め、得られた差信号を駆動音源符号化部5にお
ける符号化対象信号12として、第一の歪算出部23と
第二の歪算出部24に出力する。
【0053】適応音源寄与度算出手段28は、入力音声
1と、合成フィルタ10より出力された合成音を用い
て、入力音声1の符号化における適応音源の寄与の大き
さを計算し、求まった適応音源寄与度を探索用評価値算
出部29に出力する。具体的な適応音源寄与度の計算は
以下のようにして行う。
【0054】まず、合成フィルタ10より出力された合
成音に適切なゲインを乗じた時に、入力音声1に対する
波形歪が最も小さくなるようにゲインを設定し、合成フ
ィルタ10より出力された合成音にこのゲインを乗じた
信号のパワーPaを求める。入力音声1のパワーPを求
め、Pに対するPaの比率、つまりPa/Pを計算して
適応音源寄与度とする。なお、適切なゲインについては
偏微分方程式に基づいて決定することができ、式(2)
と同様にゲインを計算式から取り除いた形で波形歪を直
接求めることができる。入力音声1をR、合成フィルタ
10より出力された合成音をXとすれば、適応音源寄与
度Gは、式(6)により計算することができる。
【0055】
【数4】
【0056】一方、探索手段20は、2進数値で示した
各駆動音源符号を順次発生させ、順番に駆動ベクトル生
成手段13に出力する。駆動ベクトル生成手段13は、
探索手段20から出力された駆動音源符号に応じて、内
部に格納してある駆動音源符号帳から時系列ベクトルを
読み出し、駆動ベクトルとして合成フィルタ14に出力
する。なお、駆動音源符号帳としては、予め用意した雑
音ベクトルを格納したものや、代数的にパルス位置と極
性の組み合わせによって記述した代数的音源符号帳など
がある。また2つ以上の符号帳の加算形式や、適応音源
の繰返し周期も用いたピッチ周期化を内包したものもあ
る。
【0057】合成フィルタ14は、線形予測係数符号化
手段3から出力された量子化された線形予測係数がフィ
ルタ係数として設定されており、駆動ベクトル生成手段
13から出力された駆動ベクトルに対して合成フィルタ
リングを行い、得られた合成音を、第一の歪算出部23
と第二の歪算出部24に対して出力する。
【0058】第一の歪算出部23内の聴覚重み付けフィ
ルタ16は、線形予測係数符号化手段3から出力された
量子化された線形予測係数に基づいて聴覚重み付けフィ
ルタ係数を算出し、これをフィルタ係数に設定して、適
応音源符号化手段4内の減算手段11から出力された符
号化対象信号12に対するフィルタリングを行い、得ら
れた信号を減算手段18に出力する。
【0059】第一の歪算出部23内の聴覚重み付けフィ
ルタ17は、聴覚重み付けフィルタ16と同じフィルタ
係数に設定して、合成フィルタ14から出力された合成
音に対するフィルタリングを行い、得られた信号を減算
手段18に出力する。
【0060】第一の歪算出部23内の減算手段18は、
聴覚重み付けフィルタ16から出力した信号と、聴覚重
み付けフィルタ17から出力した信号に適切なゲインを
乗じた信号の差信号を求め、この差信号をパワー算出手
段19に出力する。
【0061】第一の歪算出部23内のパワー算出手段1
9は、減算手段18から出力された差信号の総パワーを
求め、これを第一の歪として探索用評価値算出部29に
出力する。なお、減算手段18で乗じるゲインについて
は、第一の歪を最小にするように偏微分方程式を解くこ
とによって一意に決定される。実際の歪算出部23の内
部構成に付いては、演算量を削減するために従来の変形
方法を用いることができる。
【0062】第二の歪算出部24内の重心算出手段25
では、減算手段11から出力した符号化対象信号12の
フレーム内の振幅の重心位置を求め、求まった重心位置
を減算手段27に出力する。振幅の重心位置は、対象と
する信号の振幅(サンプル値の絶対値)のフレーム内合
計値を計算し、再び先頭位置から振幅の合計値を計算し
ていって、フレーム内合計値の半分に到達した位置とし
て求めることができる。
【0063】第二の歪算出部24内の重心算出手段26
では、合成フィルタ14から出力した合成音のフレーム
内の振幅の重心位置を求め、求まった重心位置を減算手
段27に出力する。重心位置の算出は重心算出手段25
と同様にして行う。
【0064】第二の歪算出部24内の減算手段27は、
重心算出手段25から出力した重心位置と、重心算出手
段26から出力した重心位置との差を求め、求まった重
心位置の差を第二の歪として探索用評価値算出部29に
出力する。
【0065】探索用評価値算出部29は、適応音源寄与
度算出手段28から出力された適応音源寄与度と、第一
の歪算出部23から出力された第一の歪と、第二の歪算
出部24から出力された第二の歪とを用いて、最終的な
探索に用いる探索用評価値を求め、この探索用評価値を
探索手段20に出力する。
【0066】探索手段20は、探索用評価値算出部29
より出力された探索用評価値を最小にする駆動音源符号
を探索し、探索用評価値を最小にする駆動音源符号を駆
動音源符号21として出力する。また、駆動ベクトル生
成手段13は、この駆動音源符号21を入力されたとき
に出力した駆動ベクトルを駆動音源22として出力す
る。
【0067】図2は、上記探索用評価値算出部29の構
成を示す構成図である。図2において、30と32が切
換手段、31が乗算手段である。乗算手段31は、第一
の歪算出部23から出力された第一の歪に予め用意した
定数βを乗じ、乗算結果を出力する。定数βは1.2〜
2.0程度の値が適切である。
【0068】切換手段32は、第二の歪算出部24から
出力された第二の歪が所定の閾値を上回る場合には、切
換スイッチを乗算手段31から出力された乗算結果へ接
続し、第二の歪算出部24から出力された第二の歪が所
定の閾値以下である場合には、切換スイッチを第一の歪
算出部23から出力された第一の歪に接続する。所定の
閾値としては、フレーム長の10分の1程度が適切であ
る。これにより、切換手段32は、第二の歪が大きい時
には第一の歪にβを乗算した結果を、第二の歪が小さい
時には第一の歪をそのまま出力する。
【0069】切換手段30は、適応音源寄与度算出手段
28から出力された適応音源寄与度が所定の閾値を上回
る場合には、切換スイッチを第一の歪算出部23から出
力された第一の歪に接続し、適応音源寄与度算出手段2
8から出力された適応音源寄与度が所定の閾値以下であ
る場合には、切換手段32の出力結果に接続する。所定
の閾値としては、0.3〜0.4程度が適切である。そ
して、この切換手段30の出力が探索用評価値として、
探索用評価値算出部29より出力される。
【0070】このように構成することで、通常は第一の
歪が探索用評価値として出力され、第二の歪が大きくか
つ適応音源寄与度が小さい場合にのみ第一の歪に定数β
を乗じた値が探索用評価値として出力される。つまり、
第二の歪が大きくかつ適応音源寄与度が小さい場合にの
み探索用評価値が大きい値に補正され、後続の探索手段
20において該当する駆動音源符号の選択が抑制され
る。
【0071】図3は、第二の歪算出部24の動作を説明
する説明図である。なお、符号化対象信号は図10と同
じものである。重心算出手段25は、図3(a)に示す
ように符号化対象信号の重心位置を求める。重心算出手
段26は、図3(b)に示すように合成フィルタ後の駆
動ベクトルの重心位置を求める。そして、減算手段27
が、この2つの重心位置の差を図3(b)に示したよう
に算出する。この図3のように、符号化対象信号と比較
して、合成フィルタ後の駆動ベクトルの振幅がフレーム
内で極端に偏っている場合には、重心位置の差として求
められる第二の歪の値が大きく評価される。
【0072】図3(d)は、図3(b)の場合と異なる
駆動ベクトルを合成フィルタに通したときの合成音であ
る。図3(b)と比較して、フレームの後半を中心に波
形歪は若干大きいが、重心位置の差は小さくなってい
る。この図3(d)を生成する駆動ベクトルを選択した
場合には、フレーム内に0振幅の部分も無く、復号音の
劣化は少ないが、従来の方法では、波形歪だけで選択を
行うため、図3(b)を生成する駆動ベクトルを選択し
てしまっていた。これに対し、この実施の形態では、重
心位置の差を第二の歪として探索用評価値に反映できる
ので、波形歪がそれ程大きくなく、重心位置の差も小さ
い図3(d)を生成する駆動ベクトルを選択することが
可能となる。
【0073】なお、上記実施の形態では、符号化対象信
号12と合成フィルタ14から出力した合成音の振幅重
心の位置の差によって第二の歪を算出しているが、これ
に限定されるものではなく、パワー重心の位置の差とし
てもよいし、聴覚重み付けフィルタ16から出力した信
号と、聴覚重み付けフィルタ17から出力した信号に対
して第二の歪を評価するようにしても良い。
【0074】また、フレームを時間方向に数個に分割
し、符号化対象信号12と合成フィルタ14から出力し
た合成音の各々について、各分割内の平均振幅または平
均パワーを算出し、符号化対象信号12の分割毎の算出
結果と、合成フィルタ14から出力した合成音の分割毎
の算出結果の2乗距離を求めて第二の歪としても良い。
また、これらの幾つかの種類の第二の歪を算出して、探
索用評価値算出手段29で複数の第二の歪を使用する構
成も可能である。
【0075】また、探索用評価値算出部29において、
切換手段32を削除し、乗算手段31の出力を切換手段
30に接続する構成に変更し、乗算手段31で使用する
βを第二の歪に応じて変更する構成することも可能であ
る。第一の歪算出部23についても、この構成に限定さ
れるものではなく、聴覚重み付けフィルタを除いた構成
や、減算手段18の出力に対して聴覚重み付けを一括し
て行う構成や、上述した演算量削減のための各種変形を
行うことも可能である。
【0076】適応音源寄与度算出手段28についても、
2つの入力信号に対して聴覚重み付けフィルタリングを
行ってから寄与度の計算を行う構成でも構わない。この
実施の形態1では、入力音声1から適応ベクトルを合成
フィルタ10に通した合成音を減算して符号化対象信号
としているが、入力音声1をそのまま符号化対象信号と
して用い、代わりに駆動ベクトルを合成フィルタ14に
通した合成音を、適応ベクトルを合成フィルタ10に通
した合成音に対して直交化する構成でも構わない。
【0077】また、この実施の形態1では、フレーム毎
に駆動ベクトル探索を行っているが、従来技術と同様、
フレームを複数に分割したサブフレーム毎に探索を行う
構成も当然可能である。
【0078】以上のように、この実施の形態1によれ
ば、符号化対象信号と駆動ベクトルから求まる合成ベク
トルの間に定義される波形に関する歪を第一の歪として
算出し、符号化対象信号と駆動ベクトルから求まる合成
ベクトルの間に定義される第一の歪と異なる第二の歪を
算出し、この第一の歪と第二の歪を用いて算出した探索
用評価値を最小にする駆動ベクトルを選択するようにし
たので、第一の歪だけでは分からない、復号音の劣化を
引き起こす可能性が高い駆動ベクトルを第二の歪によっ
て検知することが可能となり、復号音の局所的な異音発
生の少ない高品質な音声符号化が実現できる効果があ
る。
【0079】また、この実施の形態1によれば、入力音
声から求まる符号化対象信号を聴覚重み付けフィルタに
通した信号と、駆動ベクトルから求まる合成ベクトルを
聴覚重み付けフィルタに通した信号との、サンプル毎の
誤差パワーをフレーム内で加算した結果を第一の歪とし
たので、復号音の主観的な歪感の小さい駆動ベクトルが
選択でき、高品質な音声符号化が実現できる効果があ
る。
【0080】また、この実施の形態1によれば、フレー
ム内の時間方向の振幅またはパワーの偏りに関する歪を
第二の歪としたので、局所的に振幅が小さすぎるなどの
復号音の主観的な劣化を引き起こす可能性が高い駆動ベ
クトルを第二の歪によって検知することが可能となり、
復号音の局所的な異音発生の少ない高品質な音声符号化
が実現できる効果がある。
【0081】また、この実施の形態1によれば、フレー
ム内の符号化対象信号の振幅またはパワーの重心位置を
求め、フレーム内の合成ベクトルの振幅またはパワーの
重心位置を求め、求まった2つの重心位置の差を第二の
歪としたので、簡単な処理であるにもかかわらず、フレ
ーム内の振幅またはパワーの偏りを評価でき、局所的に
振幅が小さすぎるなどの復号音の主観的な劣化を引き起
こす可能性が高い駆動ベクトルを第二の歪によって検知
することが可能となり、復号音の局所的な異音発生の少
ない高品質な音声符号化が実現できる効果がある。
【0082】また、この実施の形態1によれば、第二の
歪に応じて第一の歪を補正することで探索用評価値を算
出するようにしたので、基本的には波形歪である第一の
歪を小さくする駆動ベクトルであって、第一の歪と異な
る第二の歪についても問題が少ない駆動ベクトルを選択
することができ、高品質な音声符号化が実現できる効果
がある。
【0083】また、この実施の形態1によれば、入力音
声から算出した適応音源寄与度などの所定のパラメータ
に応じて探索用評価値を算出するようにしたので、音声
の状態や符号化特性などに応じて第一の歪だけを使用し
たり、第二の歪による補正を行ったりすることで、復号
音の品質劣化を起こしにくい、そのフレームに適切な駆
動ベクトルが選択でき、高品質な音声符号化が実現でき
る効果がある。
【0084】また、この実施の形態1によれば、適応音
源(駆動ベクトル以外の音源ベクトル)から求まる合成
ベクトルのエネルギーと入力音声のエネルギーの比率を
求めて、これを適応音源寄与度(他音源寄与度)とし
て、探索用評価値の算出に使用したので、復号音におけ
る駆動ベクトルの寄与度が大きいフレームでのみ第二の
歪の使用を行うなど、フレーム毎に適切な探索用評価値
を求めることができ、復号音の品質劣化を起こしにく
い、そのフレームに適切な駆動ベクトルが選択でき、高
品質な音声符号化が実現できる効果がある。
【0085】また、この実施の形態1によれば、探索用
評価値を算出する処理の1つとして、第一の歪をそのま
ま探索用評価値とする処理、を含むようにしたので、復
号音における駆動ベクトルの寄与度が小さく、駆動ベク
トルの振幅偏りがあっても復号音劣化につながらない場
合などにおいて、波形歪である第一の歪を最小にする駆
動ベクトルを選択することができ、不必要に第二の歪を
利用してかえって音質劣化を招くことを回避できる効果
がある。
【0086】実施の形態2.図4は、この発明の実施の
形態2に係る探索用評価値算出部29の構成を示す構成
図である。図4において、30は切換手段、33と34
は乗算手段、37は加算手段である。
【0087】乗算手段33は、第一の歪算出部23から
出力された第一の歪に予め用意した定数β1を乗じ、乗
算結果を加算手段37に出力する。定数β1は1.0固
定で構わないので、乗算手段33自体は省略可能であ
る。また、乗算手段34は、第二の歪算出部24から出
力された第二の歪に予め用意した定数β2を乗じ、乗算
結果を加算手段37に出力する。定数β2は、乗算手段
33の出力に対して乗算手段34の出力が平均的に小さ
くなるように設定する。さらに、加算手段37は、乗算
手段33の出力と乗算手段34の出力を加算し、加算結
果を切換手段30に出力する。
【0088】切換手段30は、適応音源寄与度算出手段
28から出力された適応音源寄与度が所定の閾値を上回
る場合には、切換スイッチを第一の歪算出部23から出
力された第一の歪に接続し、適応音源寄与度算出手段2
8から出力された適応音源寄与度が所定の閾値以下であ
る場合には、加算手段37の出力結果に接続する。所定
の閾値としては、0.3〜0.4程度が適切である。そ
して、この切換手段30の出力が探索用評価値として、
探索用評価値算出部29より出力される。
【0089】このように構成することで、通常は第一の
歪が探索用評価値として出力され、適応音源寄与度が小
さい場合にのみ第二の歪が探索用評価値に含まれて出力
される。また、乗算手段33の出力に比べて乗算手段3
4の出力が平均的に小さくなるようにβ1とβ2を設定
しておくことによって、基本的には第一の歪が主で、第
二の歪によって補正を行う結果となる。従って、第二の
歪が比較的大きくかつ適応音源寄与度が小さい場合にの
み探索用評価値が大きい値に補正され、後続の探索手段
20において該当する駆動音源符号の選択が抑制され
る。
【0090】以上のように、この実施の形態2によれ
ば、第一の歪と第二の歪の重み付き和によって探索用評
価値を算出するようにしたので、基本的には波形歪であ
る第一の歪を小さくする駆動ベクトルであって、第一の
歪と異なる第二の歪についても問題が少ない駆動ベクト
ルを選択することができ、高品質な音声符号化が実現で
きる効果がある。
【0091】また、この実施の形態2によれば、駆動ベ
クトル以外の音源ベクトルから求まる合成ベクトルのエ
ネルギーと入力音声のエネルギーの比率を求めて、これ
を評価値算出工程における所定パラメータとしたので、
復号音における駆動ベクトルの寄与度が大きいフレーム
でのみ第二の歪の使用を行うなど、フレーム毎に適切な
探索用評価値を求めることができ、復号音の品質劣化を
起こしにくい、そのフレームに適切な駆動ベクトルが選
択でき、高品質な音声符号化が実現できる効果がある。
【0092】また、この実施の形態2によれば、探索用
評価値を算出する処理の1つとして、第一の歪をそのま
ま探索用評価値とする処理、を含むようにしたので、復
号音における駆動ベクトルの寄与度が小さく、駆動ベク
トルの振幅偏りがあっても復号音劣化につながらない場
合などにおいて、波形歪である第一の歪を最小にする駆
動ベクトルを選択することができ、不必要に第二の歪を
利用してかえって音質劣化を招くことを回避できる効果
がある。
【0093】実施の形態3.図5は、この発明による音
声符号化方法を適用した音声符号化装置における実施の
形態3に係る駆動音源符号化部5の詳細構成を示すブロ
ック図である。本実施の形態3においても音声符号化装
置の全体構成は図8と同様であるが、駆動音源符号化部
5に入力音声1の入力を追加したものとなっている。図
5において、図1に示す実施の形態1と同一部分は同一
符号を付してその説明は省略する。新たな符号として、
35は予備選択手段である。
【0094】以下、図に基づいて動作を説明する。第一
の歪算出部23は、線形予測係数符号化手段3から出力
された量子化された線形予測係数、減算手段11から出
力された符号化対象信号12と、各駆動ベクトル毎に合
成フィルタ14から出力された合成音から、聴覚重み付
けフィルタ後の差信号の総パワーを求めて、これを第一
の歪として予備選択手段35に出力する。
【0095】予備選択手段35は、第一の歪算出部23
から出力された各駆動ベクトル毎の第一の歪を互いに比
較し、この第一の歪が小さいM個の駆動ベクトルを予備
選択する。なお、Mは全駆動ベクトルの数より少ない数
である。そして予備選択した駆動ベクトルの番号を第二
の歪算出部24に出力すると共に、予備選択した各駆動
ベクトルに対する第一の歪を探索用評価値算出部29に
出力する。
【0096】第二の歪算出部24は、予備選択手段35
が予備選択して出力したM個の駆動ベクトルの番号が指
定する各駆動ベクトルについて、減算手段11から出力
した符号化対象信号12と、各駆動ベクトル毎に合成フ
ィルタ14から出力した合成音とのフレーム内の振幅の
重心位置の差を求め、求まった重心位置の差を第二の歪
として探索用評価値算出部29に出力する。
【0097】探索用評価値算出部29は、適応音源寄与
度算出手段28から出力された適応音源寄与度と、予備
選択手段35が予備選択して出力したM個の第一の歪
と、第二の歪算出部24から出力されたM個の第二の歪
とを用いて、最終的な探索に用いるM個の探索用評価値
を求め、この探索用評価値を探索手段20に出力する。
【0098】探索手段20は、探索用評価値算出部29
より出力された探索用評価値を最小にする駆動音源符号
を探索し、探索用評価値を最小にする駆動音源符号を駆
動音源符号21として出力する。また、駆動ベクトル生
成手段13は、この駆動音源符号21を入力されたとき
に出力した駆動ベクトルを駆動音源22として出力す
る。
【0099】なお、上記実施の形態3についても、実施
の形態1と同様に、符号化対象信号12と合成フィルタ
14から出力した合成音の振幅重心の位置の差によって
第二の歪を算出しているが、これに限定されるものでは
なく、パワー重心の位置の差としてもよいし、聴覚重み
付けフィルタ後の信号に対して第二の歪を評価するよう
にしても良い。フレームを時間方向に数個に分割し、符
号化対象信号12と合成フィルタ14から出力した合成
音の各々について、各分割内の平均振幅または平均パワ
ーを算出し、符号化対象信号12の分割毎の算出結果
と、合成フィルタ14から出力した合成音の分割毎の算
出結果の2乗距離を求めて第二の歪としても良い。ま
た、これらの幾つかの種類の第二の歪を算出して、探索
用評価値算出手段29で複数の第二の歪を使用する構成
も可能である。第一の歪算出部23についても、聴覚重
み付けフィルタを除いた構成や、聴覚重み付けを一括し
て行う構成や、演算量削減のための各種変形を行うこと
も可能である。
【0100】また、この実施の形態3では、入力音声1
から適応ベクトルを合成フィルタ10に通した合成音を
減算して符号化対象信号としているが、実施の形態1と
同様に、入力音声1をそのまま符号化対象信号として用
い、代わりに駆動ベクトルを合成フィルタ14に通した
合成音を、適応ベクトルを合成フィルタ10に通した合
成音に対して直交化する構成でも構わない。
【0101】また、この実施の形態3では、フレーム毎
に駆動ベクトル探索を行っているが、従来技術と同様、
フレームを複数に分割したサブフレーム毎に探索を行う
構成も当然可能である。
【0102】以上のように、この実施の形態3によれ
ば、第一の歪が小さい2つ以上の駆動ベクトルを予備選
択し、第二の歪の算出、探索用評価値の算出、探索の対
象を、予備選択した駆動ベクトルに限定するようにした
ので、実施の形態1が持つ効果に加えて、第二の歪の算
出と探索用評価値の算出の演算量を少なく抑制すること
ができ、第一の歪だけで探索を行っていた従来構成に対
して少ない演算量の増加で、復号音の劣化を引き起こす
可能性が高い駆動ベクトルを第二の歪によって検知する
ことが可能となり、復号音の局所的な異音発生の少ない
高品質な音声符号化が実現できる効果がある。
【0103】実施の形態4.図6は、この発明による音
声符号化方法を適用した音声符号化装置における実施の
形態4に係る駆動音源符号化部5の詳細構成を示すブロ
ック図である。この実施の形態4においても音声符号化
装置の全体構成は図8と同様であるが、駆動音源符号化
部5に入力音声1の入力を追加したものとなっている。
図5に示す実施の形態3と同一部分は同一符号を付して
その説明は省略する。この実施の形態4においては、駆
動ベクトル生成手段13として、第一の駆動ベクトル生
成手段から第Nの駆動ベクトル生成手段までのN個の駆
動ベクトル生成手段と切換手段を備えている。
【0104】以下、図に基づいて動作を説明する。駆動
ベクトル生成手段13は、第一の駆動ベクトル生成手段
から第Nの駆動ベクトル生成手段までのN個の駆動ベク
トル生成手段と切換手段を備えており、外部から駆動ベ
クトル生成手段番号と駆動ベクトル番号が入力される
と、これらに応じて1つの駆動ベクトルを出力する。切
換手段が入力された駆動ベクトル生成手段番号に応じて
1つの駆動ベクトル生成手段に切換スイッチを接続し、
接続された第一から第Nの駆動ベクトル生成手段が、入
力された駆動ベクトル番号によって指定された駆動ベク
トルを出力するようになっている。
【0105】なお、複数の駆動ベクトル生成手段は互い
に異なるものであり、フレーム内の前半にエネルギーが
集まっている駆動ベクトル生成手段や、フレーム内の後
半にエネルギーが集まっている駆動ベクトル生成手段
や、フレーム内に比較的分散してエネルギーが分布して
いる駆動ベクトル生成手段や、少ないパルスだけで構成
されている駆動ベクトル生成手段と多くのパルスで構成
されている駆動ベクトル生成手段など、様々な様態を持
つ音声信号を安定に符号化するために様々な様態の駆動
ベクトル生成手段を備えるようにしておくのがよい。
【0106】探索手段20は、2進数値で示した各駆動
音源符号を順次発生させ、この駆動音源符号を駆動ベク
トル生成手段番号と駆動ベクトル番号に分解し、駆動ベ
クトル生成手段番号を駆動ベクトル生成手段13内の切
換手段と、探索用評価値算出部29に出力する。また駆
動ベクトル番号を駆動ベクトル生成手段13内の第一か
ら第Nの駆動ベクトル生成手段に出力する。駆動ベクト
ル生成手段13は、探索手段20から出力された駆動ベ
クトル生成手段番号と駆動ベクトル番号に応じて、1つ
の駆動ベクトルを合成フィルタ14に出力する。
【0107】合成フィルタ14は、線形予測係数符号化
手段3から出力された量子化された線形予測係数がフィ
ルタ係数として設定されており、駆動ベクトル生成手段
13から出力された駆動ベクトルに対して合成フィルタ
リングを行い、得られた合成音を、第一の歪算出部23
と第二の歪算出部24に対して出力する。
【0108】第一の歪算出部23は、線形予測係数符号
化手段3から出力された量子化された線形予測係数、減
算手段11から出力された符号化対象信号12と、各駆
動ベクトル毎に合成フィルタ14から出力された合成音
から、聴覚重み付けフィルタ後の差信号の総パワーを求
めて、これを第一の歪として予備選択手段35に出力す
る。
【0109】予備選択手段35は、第一の歪算出部23
から出力された各駆動ベクトル毎の第一の歪を互いに比
較し、この第一の歪が小さいM個の駆動ベクトルを予備
選択する。なお、Mは全駆動ベクトルの数より少ない数
である。そして予備選択した駆動ベクトルの番号を第二
の歪算出部24に出力すると共に、予備選択した各駆動
ベクトルに対する第一の歪を探索用評価値算出部29に
出力する。なお、探索手段20より駆動ベクトル生成手
段番号を入力する構成として、同一の駆動ベクトル生成
手段番号毎にL個の駆動ベクトルを予備選択してもよ
い。Lを1とすれば、予備選択数MはNに一致する。
【0110】第二の歪算出部24は、予備選択手段35
が予備選択して出力したM個の駆動ベクトルの番号が指
定する各駆動ベクトルについて、減算手段11から出力
した符号化対象信号12と、各駆動ベクトル毎に合成フ
ィルタ14から出力した合成音とのフレーム内の振幅の
重心位置の差を求め、求まった重心位置の差を第二の歪
として探索用評価値算出部29に出力する。
【0111】探索用評価値算出部29は、適応音源寄与
度算出手段28から出力された適応音源寄与度と、探索
手段20から出力した駆動ベクトル生成手段番号と、予
備選択手段35が予備選択して出力したM個の第一の歪
と、第二の歪算出部24から出力されたM個の第二の歪
とを用いて、最終的な探索に用いるM個の探索用評価値
を求め、この探索用評価値を探索手段20に出力する。
【0112】探索手段20は、探索用評価値算出部29
より出力された探索用評価値を最小にする駆動音源符号
を探索し、探索用評価値を最小にする駆動音源符号を駆
動音源符号21として出力する。また、駆動ベクトル生
成手段13は、この駆動音源符号21を入力されたとき
に出力した駆動ベクトルを駆動音源22として出力す
る。
【0113】図7は、探索用評価値算出部29の構成を
示す構成図である。図7において、30、32、36は
切換手段、31は乗算手段である。探索用評価値算出部
29内には、予め駆動ベクトル生成手段番号に対応して
N個の定数β1乃至βNが設定してある。
【0114】切換手段36は、探索手段20より出力し
た駆動ベクトル生成手段番号に応じて切換スイッチを切
換え、駆動ベクトル生成手段番号が1の時にはβ1、駆
動ベクトル生成手段番号がNの時にはβNという具合に
1つの定数を選択して出力する。乗算手段31は、第一
の歪算出部23から出力された第一の歪に、切換手段3
6より出力した定数を乗じ、乗算結果を出力する。
【0115】切換手段32は、第二の歪算出部24から
出力された第二の歪が所定の閾値を上回る場合には、切
換スイッチを乗算手段31から出力された乗算結果へ接
続し、第二の歪算出部24から出力された第二の歪が所
定の閾値以下である場合には、切換スイッチを第一の歪
算出部23から出力された第一の歪に接続する。所定の
閾値としては、フレーム長の10分の1程度が適切であ
る。これにより、切換手段32は、第二の歪が大きい時
には第一の歪に駆動ベクトル生成手段番号に応じた定数
を乗算した結果を、第二の歪が小さい時には第一の歪を
そのまま出力する。
【0116】切換手段30は、適応音源寄与度算出手段
28から出力された適応音源寄与度が所定の閾値を上回
る場合には、切換スイッチを第一の歪算出部23から出
力された第一の歪に接続し、適応音源寄与度算出手段2
8から出力された適応音源寄与度が所定の閾値以下であ
る場合には、切換手段32の出力結果に接続する。所定
の閾値としては、0.3〜0.4程度が適切である。そ
して、この切換手段30の出力が探索用評価値として、
探索用評価値算出部29より出力される。
【0117】このように構成することで、通常は第一の
歪が探索用評価値として出力され、第二の歪が大きくか
つ適応音源寄与度が小さい場合にのみ第一の歪に駆動ベ
クトル生成手段番号に応じた定数を乗じた値が探索用評
価値として出力される。つまり第二の歪が大きくかつ適
応音源寄与度が小さい場合にのみ探索用評価値が大きい
値に補正され、かつその補正の大きさが駆動ベクトル生
成手段番号に応じて制御され、後続の探索手段20にお
いて該当する駆動音源符号の選択が抑制される。
【0118】なお、上記実施の形態4についても、実施
の形態2と同様に、切換スイッチ32を図4に示した乗
算手段33と加算手段37に変更する構成が可能であ
る。また、実施の形態1と同様に、符号化対象信号12
と合成フィルタ14から出力した合成音の振幅重心の位
置の差によって第二の歪を算出しているが、これに限定
されるものではなく、パワー重心の位置の差としてもよ
いし、聴覚重み付けフィルタ後の信号に対して第二の歪
を評価するようにしても良い。フレームを時間方向に数
個に分割し、符号化対象信号12と合成フィルタ14か
ら出力した合成音の各々について、各分割内の平均振幅
または平均パワーを算出し、符号化対象信号12の分割
毎の算出結果と、合成フィルタ14から出力した合成音
の分割毎の算出結果の2乗距離を求めて第二の歪として
も良い。また、これらの幾つかの種類の第二の歪を算出
して、探索用評価値算出手段29で複数の第二の歪を使
用する構成も可能である。第一の歪算出部23について
も、聴覚重み付けフィルタを除いた構成や、聴覚重み付
けを一括して行う構成や、演算量削減のための各種変形
を行うことも可能である。
【0119】また、この実施の形態4では、入力音声1
から適応ベクトルを合成フィルタ10に通した合成音を
減算して符号化対象信号としているが、実施の形態1と
同様に、入力音声1をそのまま符号化対象信号として用
い、代わりに駆動ベクトルを合成フィルタ14に通した
合成音を、適応ベクトルを合成フィルタ10に通した合
成音に対して直交化する構成でも構わない。
【0120】また、この実施の形態4では、フレーム毎
に駆動ベクトル探索を行っているが、従来技術と同様、
フレームを複数に分割したサブフレーム毎に探索を行う
構成も当然可能である。
【0121】以上のように、この実施の形態4によれ
ば、互いに異なる駆動ベクトルを生成する駆動ベクトル
生成手段(工程)を複数備え、各駆動ベクトル生成手段
(工程)毎に、前記第一の歪算出手段(工程)が算出し
た第一の歪が小さい1つ以上の駆動ベクトルを予備選択
し、第二の歪の算出、探索用評価値の算出、探索の対象
を、予備選択した駆動ベクトルに限定するようにしたの
で、実施の形態3が持つ効果に加えて、音源位置限定や
パルス数などが様々に異なる駆動ベクトル生成手段(工
程)毎に1つ以上の駆動ベクトルの候補を残すことがで
き、音源位置限定やパルス数などが様々に異なる駆動ベ
クトルの候補中から復号音の劣化を引き起こす可能性が
高い駆動ベクトルを第二の歪によって検知して選択を抑
制することで、少ない演算量の増加であるにもかかわら
ず、復号音の局所的な異音発生の少ない高品質な音声符
号化が実現できる効果がある。
【0122】なお、実施の形態3においては、音源位置
限定やパルス数などが様々に異なる駆動ベクトルが予備
選択される補償がないので、例えばフレーム内の前半に
エネルギーが集まっている駆動ベクトルだけが予備選択
された場合、その予備選択された駆動ベクトルの中に重
心位置の差(第二の歪)が小さいものが含まれていない
ことも起こり得る。その場合、復号音の局所的な劣化を
解消できない。
【0123】この実施の形態4によれば、どの駆動ベク
トル生成手段(工程)から出力された駆動ベクトルであ
るかによって、探索用評価値の算出に用いる定数をβ1
からβNの間で変更する(探索用評価値を算出する処理
を変更する)ようにしたので、第二の歪が大きくなった
ときに復号音の劣化につながりやすい駆動ベクトル生成
手段(工程)について、選択的に探索用評価値における
第二の歪の重みを大きくして、その駆動ベクトル生成手
段(工程)から出力される駆動ベクトルの選択を抑制す
ることが可能となり、復号音の局所的な異音発生の少な
い高品質な音声符号化が実現できる効果がある。
【0124】実施の形態5.上記実施の形態1乃至4で
は、全て適応ベクトルと駆動ベクトルの加算によって構
成される音源における、駆動ベクトルの探索に関して本
発明を適用した構成であったが、音源の構成はこれに限
定されるものではなく、例えば音声の立ちあがり部分を
表現するための駆動ベクトルだけで構成される音源にお
いても、適用可能である。その場合には、適応音源符号
化手段4、適応ベクトル生成手段9、合成フィルタ10
が不要となり、適応音源寄与度算出手段28の出力が常
に0とすれば良い。
【0125】このように構成することで、駆動ベクトル
だけで音源を構成する場合においても、第一の歪だけで
は分からない、復号音の劣化を引き起こす可能性が高い
駆動ベクトルを第二の歪によって検知することが可能と
なり、復号音の局所的な異音発生の少ない高品質な音声
符号化が実現できる効果がある。
【0126】実施の形態6.上記実施の形態1乃至4で
は、駆動ベクトルの探索に関して本発明を適用した構成
であったが、適応ベクトルの探索においても本発明を適
用することが可能である。その場合には、実施の形態5
における駆動ベクトル生成手段13を適応ベクトル生成
手段9に変更すれば良い。
【0127】このように構成することで、第一の歪だけ
では分からない、復号音の劣化を引き起こす可能性が高
い適応ベクトルを第二の歪によって検知することが可能
となり、復号音の局所的な異音発生の少ない高品質な音
声符号化が実現できる効果がある。
【0128】実施の形態7.上記実施の形態1乃至4で
は、1つの駆動ベクトルだけを選択していたが、サブ駆
動ベクトル生成手段を2つ備え、これらの各々から出力
される2つのサブ駆動ベクトルの加算によって1つの駆
動ベクトルとする構成も当然可能である。その場合、他
の構成は実施の形態1乃至4と同様でも構わないが、1
つのサブ駆動ベクトル生成手段から出力されるサブ駆動
ベクトルの探索の際に、既に決定しているもう一方のサ
ブ駆動ベクトルと適応音源の寄与度を求めて探索用評価
値の算出に用いる構成も可能である。
【0129】このように構成することで、第一の歪だけ
では分からない、復号音の劣化を引き起こす可能性が高
いサブ駆動ベクトルを第二の歪によって検知することが
可能となり、復号音の局所的な異音発生の少ない高品質
な音声符号化が実現できる効果がある。
【0130】
【発明の効果】以上のように、この発明によれば、符号
化対象信号と駆動ベクトルから求まる合成ベクトルの間
に定義される波形に関する歪を第一の歪として算出し、
符号化対象信号と駆動ベクトルから求まる合成ベクトル
の間に定義される第一の歪と異なる第二の歪を算出し、
この第一の歪と第二の歪を用いて算出した探索用評価値
を最小にする駆動ベクトルを選択するようにしたので、
第一の歪だけでは分からない、復号音の劣化を引き起こ
す可能性が高い駆動ベクトルを第二の歪によって検知す
ることが可能となり、復号音の局所的な異音発生の少な
い高品質な音声符号化が実現できる効果がある。
【0131】また、第一の歪が小さい2つ以上の駆動ベ
クトルを予備選択し、第二の歪の算出、探索用評価値の
算出、探索の対象を、予備選択した駆動ベクトルに限定
するようにしたので、上述した効果に加えて、第二の歪
の算出と探索用評価値の算出の演算量を少なく抑制する
ことができ、第一の歪だけで探索を行っていた従来構成
に対して少ない演算量の増加で、復号音の劣化を引き起
こす可能性が高い駆動ベクトルを第二の歪によって検知
することが可能となり、復号音の局所的な異音発生の少
ない高品質な音声符号化が実現できる効果がある。
【0132】また、互いに異なる駆動ベクトルを生成す
る駆動ベクトル生成手段(工程)を複数備え、各駆動ベ
クトル生成手段(工程)毎に、前記第一の歪算出手段
(工程)が算出した第一の歪が小さい1つ以上の駆動ベ
クトルを予備選択し、第二の歪の算出、探索用評価値の
算出、探索の対象を、予備選択した駆動ベクトルに限定
するようにしたので、実施の形態3が持つ効果に加え
て、音源位置限定やパルス数などが様々に異なる駆動ベ
クトル生成手段(工程)毎に1つ以上の駆動ベクトルの
候補を残すことができ、音源位置限定やパルス数などが
様々に異なる駆動ベクトルの候補中から復号音の劣化を
引き起こす可能性が高い駆動ベクトルを第二の歪によっ
て検知して選択を抑制することで、少ない演算量の増加
であるにもかかわらず、復号音の局所的な異音発生の少
ない高品質な音声符号化が実現できる効果がある。
【0133】また、入力音声から求まる符号化対象信号
を聴覚重み付けフィルタに通した信号と、駆動ベクトル
から求まる合成ベクトルを聴覚重み付けフィルタに通し
た信号との、サンプル毎の誤差パワーをフレーム内で加
算した結果を第一の歪としたので、復号音の主観的な歪
感の小さい駆動ベクトルが選択でき、高品質な音声符号
化が実現できる効果がある。
【0134】また、フレーム内の時間方向の振幅または
パワーの偏りに関する歪を第二の歪としたので、局所的
に振幅が小さすぎるなどの復号音の主観的な劣化を引き
起こす可能性が高い駆動ベクトルを第二の歪によって検
知することが可能となり、復号音の局所的な異音発生の
少ない高品質な音声符号化が実現できる効果がある。
【0135】また、フレーム内の符号化対象信号の振幅
またはパワーの重心位置を求め、フレーム内の合成ベク
トルの振幅またはパワーの重心位置を求め、求まった2
つの重心位置の差を第二の歪としたので、簡単な処理で
あるにもかかわらず、フレーム内の振幅またはパワーの
偏りを評価でき、局所的に振幅が小さすぎるなどの復号
音の主観的な劣化を引き起こす可能性が高い駆動ベクト
ルを第二の歪によって検知することが可能となり、復号
音の局所的な異音発生の少ない高品質な音声符号化が実
現できる効果がある。
【0136】また、第二の歪に応じて第一の歪を補正す
ることで探索用評価値を算出するようにしたので、基本
的には波形歪である第一の歪を小さくする駆動ベクトル
であって、第一の歪と異なる第二の歪についても問題が
少ない駆動ベクトルを選択することができ、高品質な音
声符号化が実現できる効果がある。
【0137】また、第一の歪と第二の歪の重み付き和に
よって探索用評価値を算出するようにしたので、基本的
には波形歪である第一の歪を小さくする駆動ベクトルで
あって、第一の歪と異なる第二の歪についても問題が少
ない駆動ベクトルを選択することができ、高品質な音声
符号化が実現できる効果がある。
【0138】また、入力音声から算出した適応音源寄与
度などの所定のパラメータに応じて探索用評価値を算出
するようにしたので、音声の状態や符号化特性などに応
じて第一の歪だけを使用したり、第二の歪による補正を
行ったりすることで、復号音の品質劣化を起こしにく
い、そのフレームに適切な駆動ベクトルが選択でき、高
品質な音声符号化が実現できる効果がある。
【0139】また、駆動ベクトル以外の音源ベクトルか
ら求まる合成ベクトルのエネルギーと入力音声のエネル
ギーの比率を求めて、これを評価値算出工程における所
定パラメータとしたので、復号音における駆動ベクトル
の寄与度が大きいフレームでのみ第二の歪の使用を行う
など、フレーム毎に適切な探索用評価値を求めることが
でき、復号音の品質劣化を起こしにくい、そのフレーム
に適切な駆動ベクトルが選択でき、高品質な音声符号化
が実現できる効果がある。
【0140】また、どの駆動ベクトル生成手段(工程)
から出力された駆動ベクトルであるかによって、探索用
評価値の算出に用いる定数をβ1からβNの間で変更す
る(探索用評価値を算出する処理を変更する)ようにし
たので、第二の歪が大きくなったときに復号音の劣化に
つながりやすい駆動ベクトル生成手段(工程)につい
て、選択的に探索用評価値における第二の歪の重みを大
きくして、その駆動ベクトル生成手段(工程)から出力
される駆動ベクトルの選択を抑制することが可能とな
り、復号音の局所的な異音発生の少ない高品質な音声符
号化が実現できる効果がある。
【0141】また、探索用評価値を算出する処理の1つ
として、第一の歪をそのまま探索用評価値とする処理を
含むようにしたので、復号音における駆動ベクトルの寄
与度が小さく、駆動ベクトルの振幅偏りがあっても復号
音劣化につながらない場合などにおいて、波形歪である
第一の歪を最小にする駆動ベクトルを選択することがで
き、不必要に第二の歪を利用してかえって音質劣化を招
くことを回避できる効果がある。
【図面の簡単な説明】
【図1】 この発明による音声符号化方法を適用した音
声符号化装置における実施の形態1に係る駆動音源符号
化部5の詳細構成を示すブロック図である。
【図2】 この発明の実施の形態1に係る探索用評価値
算出部29の構成を示す構成図である。
【図3】 この発明の実施の形態1に係る第二の歪算出
部24の動作を説明する説明図である。
【図4】 この発明の実施の形態2に係る探索用評価値
算出部29の構成を示す構成図である。
【図5】 この発明による音声符号化方法を適用した音
声符号化装置における実施の形態3に係る駆動音源符号
化部5の詳細構成を示すブロック図である。
【図6】 この発明による音声符号化方法を適用した音
声符号化装置における実施の形態4に係る駆動音源符号
化部5の詳細構成を示すブロック図である。
【図7】 この発明の実施の形態4に係る探索用評価値
算出部29の構成を示す構成図である。
【図8】 文献(ITU-T Recomendation G.729, “CODIN
G OF SPEECH AT 8 kbit /s USING CONJUGATE -STURUCTU
RE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION (CS-A
CELP)”, 1996年3月)に開示されているCELP系音
声符号化装置の全体構成を示すブロック図である。
【図9】 上記文献1などに開示されているCELP系
音声符号化装置の駆動音源符号化部5の詳細構成を示す
ブロック図である。
【図10】 音質劣化を引き起こす1つのケースに係る
説明図である。
【符号の説明】
1 入力音声、9 適応ベクトル生成手段、10 合成
フィルタ、11 減算手段、12 符号化対象信号、1
3 駆動ベクトル生成手段、14 合成フィルタ、1
6,17 聴覚重み付けフィルタ、18 減算手段、1
9 パワー算出手段、20 探索手段、21 駆動音源
符号、22 駆動音源、23 第一の歪算出部、24
第二の歪算出部、25,26 重心算出手段、27 減
算手段、28 適応音源寄与度算出手段、29 探索用
評価値算出部、30 切換手段、31 乗算手段、32
切換手段、33,34 乗算手段、35 予備選択手
段、37 加算手段。

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 入力音声をフレームと呼ばれる所定長区
    間毎に符号化する音声符号化方法において、 複数の駆動ベクトルを生成する駆動ベクトル生成工程
    と、 各駆動ベクトル毎に、入力音声から求まる符号化対象信
    号と駆動ベクトルから求まる合成ベクトルの間に定義さ
    れる波形に関する歪を第一の歪として算出する第一の歪
    算出工程と、 各駆動ベクトル毎に、前記符号化対象信号と駆動ベクト
    ルから求まる合成ベクトルの間に定義される第一の歪と
    異なる第二の歪を算出する第二の歪算出工程と、 各駆動ベクトル毎に、前記第一の歪と第二の歪を用いて
    所定の探索用評価値を算出する評価値算出工程と、 探索用評価値を最小にする駆動ベクトルを選択し、選択
    した駆動ベクトルに予め対応付けられている符号を出力
    する探索工程とを備えた音声符号化方法。
  2. 【請求項2】 請求項1に記載の音声符号化方法におい
    て、 前記第一の歪算出工程が算出した第一の歪が小さい2つ
    以上の駆動ベクトルを選択する予備選択工程を備え、 前記第二の歪算出工程、評価値算出工程、探索工程の対
    象を、予備選択工程が選択した駆動ベクトルに限定する
    ようにしたことを特徴とする音声符号化方法。
  3. 【請求項3】 請求項1に記載の音声符号化方法におい
    て、 互いに異なる駆動ベクトルを生成する駆動ベクトル生成
    工程を複数備えると共に、各駆動ベクトル生成工程毎
    に、前記第一の歪算出工程が算出した第一の歪が小さい
    1つ以上の駆動ベクトルを選択する予備選択工程を備
    え、 前記第二の歪算出工程、評価値算出工程、探索工程の対
    象を、予備選択工程が選択した駆動ベクトルに限定する
    ようにしたことを特徴とする音声符号化方法。
  4. 【請求項4】 請求項1ないし3のいずれかに記載の音
    声符号化方法において、 前記第一の歪算出工程は、入力音声から求まる符号化対
    象信号を聴覚重み付けフィルタに通した信号と、駆動ベ
    クトルから求まる合成ベクトルを聴覚重み付けフィルタ
    に通した信号との、サンプル毎の誤差パワーをフレーム
    内で加算した結果を第一の歪とすることを特徴とする音
    声符号化方法。
  5. 【請求項5】 請求項1ないし3のいずれかに記載の音
    声符号化方法において、 前記第二の歪算出工程は、フレーム内の時間方向の振幅
    またはパワーの偏りに関する歪を第二の歪とすることを
    特徴とする音声符号化方法。
  6. 【請求項6】 請求項5に記載の音声符号化方法におい
    て、 前記第二の歪算出工程は、フレーム内の符号化対象信号
    の振幅またはパワーの重心位置を求めると共に、フレー
    ム内の合成ベクトルの振幅またはパワーの重心位置を求
    め、求まった2つの重心位置の差を第二の歪とすること
    を特徴とする音声符号化方法。
  7. 【請求項7】 請求項1ないし3のいずれかに記載の音
    声符号化方法において、 前記評価値算出工程は、第二の歪に応じて第一の歪を補
    正することで探索用評価値を算出するようにしたことを
    特徴とする音声符号化方法。
  8. 【請求項8】 請求項1ないし3のいずれかに記載の音
    声符号化方法において、 前記評価値算出工程は、第一の歪と第二の歪の重み付き
    和によって探索用評価値を算出するようにしたことを特
    徴とする音声符号化方法。
  9. 【請求項9】 請求項1ないし3のいずれかに記載の音
    声符号化方法において、 前記評価値算出工程は、入力音声から算出した所定のパ
    ラメータに応じて探索用評価値を算出する処理を変更す
    るようにしたことを特徴とする音声符号化方法。
  10. 【請求項10】 請求項9に記載の音声符号化方法にお
    いて、 駆動ベクトル以外の音源ベクトルから求まる合成ベクト
    ルのエネルギーと入力音声のエネルギーの比率を求め、
    これを他音源寄与度とする寄与度算出工程を備え、算出
    した他音源寄与度を前記評価値算出工程における所定パ
    ラメータとしたことを特徴とする音声符号化方法。
  11. 【請求項11】 請求項3に記載の音声符号化方法にお
    いて、 前記評価値算出工程は、どの駆動ベクトル生成工程から
    出力された駆動ベクトルであるかによって、探索用評価
    値を算出する処理を変更するようにしたことを特徴とす
    る音声符号化方法。
  12. 【請求項12】 請求項1ないし3のいずれかに記載の
    音声符号化方法において、 前記評価値算出工程は、探索用評価値を算出する処理の
    1つとして、第一の歪をそのまま探索用評価値とする処
    理を含むようにしたことを特徴とする音声符号化方法。
  13. 【請求項13】 入力音声をフレームと呼ばれる所定長
    区間毎に符号化する音声符号化装置において、 複数の駆動ベクトルを生成する駆動ベクトル生成手段
    と、 各駆動ベクトル毎に、入力音声から求まる符号化対象信
    号と駆動ベクトルから求まる合成ベクトルの間に定義さ
    れる波形に関する歪を第一の歪として算出する第一の歪
    算出手段と、 各駆動ベクトル毎に、前記符号化対象信号と駆動ベクト
    ルから求まる合成ベクトルの間に定義される第一の歪と
    異なる第二の歪を算出する第二の歪算出手段と、 各駆動ベクトル毎に、前記第一の歪と第二の歪を用いて
    所定の探索用評価値を算出する評価値算出手段と、 探索用評価値を最小にする駆動ベクトルを選択し、選択
    した駆動ベクトルに予め対応付けられている符号を出力
    する探索手段とを備えたことを特徴とする音声符号化装
    置。
  14. 【請求項14】 請求項13に記載の音声符号化装置に
    おいて、 前記第一の歪算出手段は、入力音声から求まる符号化対
    象信号を聴覚重み付けフィルタに通した信号と、駆動ベ
    クトルから求まる合成ベクトルを聴覚重み付けフィルタ
    に通した信号との、サンプル毎の誤差パワーをフレーム
    内で加算した結果を第一の歪とすることを特徴とする音
    声符号化装置。
  15. 【請求項15】 請求項13に記載の音声符号化装置に
    おいて、 前記第二の歪算出手段は、フレーム内の時間方向の振幅
    またはパワーの偏りに関する歪を第二の歪とすることを
    特徴とする音声符号化装置。
  16. 【請求項16】 請求項13に記載の音声符号化装置に
    おいて、 前記評価値算出手段は、第二の歪に応じて第一の歪を補
    正することで探索用評価値を算出するようにしたことを
    特徴とする音声符号化装置。
  17. 【請求項17】 請求項13に記載の音声符号化装置に
    おいて、 前記評価値算出手段は、入力音声から算出した所定のパ
    ラメータに応じて探索用評価値を算出する処理を変更す
    るようにしたことを特徴とする音声符号化装置。
JP2000327322A 2000-10-26 2000-10-26 音声符号化方法および装置 Expired - Lifetime JP3426207B2 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP2000327322A JP3426207B2 (ja) 2000-10-26 2000-10-26 音声符号化方法および装置
IL15524301A IL155243A0 (en) 2000-10-26 2001-04-16 Voice encoding method and apparatus
EP01919951A EP1339042B1 (en) 2000-10-26 2001-04-16 Voice encoding method and apparatus
DE60141646T DE60141646D1 (de) 2000-10-26 2001-04-16 Sprachcodierungsverfahren und -vorrichtung
CN01821214.XA CN1222926C (zh) 2000-10-26 2001-04-16 语音编码方法及其装置
PCT/JP2001/003240 WO2002035522A1 (fr) 2000-10-26 2001-04-16 Procede et appareil de codage vocal
US10/398,808 US7203641B2 (en) 2000-10-26 2001-04-16 Voice encoding method and apparatus
TW090109564A TW517223B (en) 2000-10-26 2001-04-20 Voice coding method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000327322A JP3426207B2 (ja) 2000-10-26 2000-10-26 音声符号化方法および装置

Publications (2)

Publication Number Publication Date
JP2002132299A true JP2002132299A (ja) 2002-05-09
JP3426207B2 JP3426207B2 (ja) 2003-07-14

Family

ID=18804359

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000327322A Expired - Lifetime JP3426207B2 (ja) 2000-10-26 2000-10-26 音声符号化方法および装置

Country Status (8)

Country Link
US (1) US7203641B2 (ja)
EP (1) EP1339042B1 (ja)
JP (1) JP3426207B2 (ja)
CN (1) CN1222926C (ja)
DE (1) DE60141646D1 (ja)
IL (1) IL155243A0 (ja)
TW (1) TW517223B (ja)
WO (1) WO2002035522A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015025454A1 (ja) * 2013-08-22 2015-02-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声符号化装置およびその方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
JP5017121B2 (ja) 2004-11-30 2012-09-05 アギア システムズ インコーポレーテッド 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
WO2006060279A1 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
DE102005002195A1 (de) * 2005-01-17 2006-07-27 Siemens Ag Verfahren und Anordnung zur Regeneration eines optischen Datensignals
JPWO2008018464A1 (ja) * 2006-08-08 2009-12-24 パナソニック株式会社 音声符号化装置および音声符号化方法
WO2008072732A1 (ja) * 2006-12-14 2008-06-19 Panasonic Corporation 音声符号化装置および音声符号化方法
CN101615395B (zh) 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
CN102687199B (zh) * 2010-01-08 2015-11-25 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置
WO2012150482A1 (en) * 2011-05-04 2012-11-08 Nokia Corporation Encoding of stereophonic signals
CN112992164A (zh) * 2014-07-28 2021-06-18 日本电信电话株式会社 编码方法、装置、程序以及记录介质
US10127918B1 (en) * 2017-05-03 2018-11-13 Amazon Technologies, Inc. Methods for reconstructing an audio signal

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6151200A (ja) 1984-08-20 1986-03-13 日本電信電話株式会社 音声信号符号化方式
JPS60217744A (ja) * 1984-04-13 1985-10-31 Nippon Telegr & Teleph Corp <Ntt> 情報割り当てを伴うブロツク符号化法
JPH0435527A (ja) 1990-05-31 1992-02-06 Fujitsu Ltd 多段符号化・復号化方式
JP3151874B2 (ja) * 1991-02-26 2001-04-03 日本電気株式会社 音声パラメータ符号化方式および装置
JP2936757B2 (ja) 1991-03-08 1999-08-23 三菱電機株式会社 量子化器
JP2953238B2 (ja) 1993-02-09 1999-09-27 日本電気株式会社 音質主観評価予測方式
JP3431655B2 (ja) 1993-03-10 2003-07-28 三菱電機株式会社 符号化装置及び復号化装置
JP2624130B2 (ja) * 1993-07-29 1997-06-25 日本電気株式会社 音声符号化方式
JP3471889B2 (ja) 1994-04-01 2003-12-02 株式会社東芝 音声符号化方法及び装置
JP3285185B2 (ja) 1995-06-16 2002-05-27 日本電信電話株式会社 音響信号符号化方法
US6393391B1 (en) * 1998-04-15 2002-05-21 Nec Corporation Speech coder for high quality at low bit rates
JP3238063B2 (ja) 1996-01-31 2001-12-10 株式会社東芝 ベクトル量子化方法および音声符号化方法
JP3094908B2 (ja) 1996-04-17 2000-10-03 日本電気株式会社 音声符号化装置
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JPH1020890A (ja) 1996-07-01 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化装置および情報記録媒体
EP1085504B1 (en) * 1996-11-07 2002-05-29 Matsushita Electric Industrial Co., Ltd. CELP-Codec
US6014618A (en) * 1998-08-06 2000-01-11 Dsp Software Engineering, Inc. LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor and optimized ternary source excitation codebook derivation
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6697430B1 (en) * 1999-05-19 2004-02-24 Matsushita Electric Industrial Co., Ltd. MPEG encoder

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015025454A1 (ja) * 2013-08-22 2015-02-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声符号化装置およびその方法

Also Published As

Publication number Publication date
DE60141646D1 (de) 2010-05-06
WO2002035522A1 (fr) 2002-05-02
EP1339042A4 (en) 2005-10-12
US20040111256A1 (en) 2004-06-10
IL155243A0 (en) 2003-11-23
CN1483188A (zh) 2004-03-17
EP1339042B1 (en) 2010-03-24
CN1222926C (zh) 2005-10-12
TW517223B (en) 2003-01-11
US7203641B2 (en) 2007-04-10
JP3426207B2 (ja) 2003-07-14
EP1339042A1 (en) 2003-08-27

Similar Documents

Publication Publication Date Title
US5864798A (en) Method and apparatus for adjusting a spectrum shape of a speech signal
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP2002132299A (ja) 音声符号化方法および装置
JP3404024B2 (ja) 音声符号化方法および音声符号化装置
EP0443548A2 (en) Speech coder
JP3196595B2 (ja) 音声符号化装置
JPH07261797A (ja) 信号符号化装置及び信号復号化装置
USRE43190E1 (en) Speech coding apparatus and speech decoding apparatus
JPH04171500A (ja) 音声パラメータ符号化方法
JP3590071B2 (ja) 音声の効率的な符号化のためのスペクトルパラメータの予測分割マトリックス量子化
JP2002505450A (ja) ハイブリッド被刺激線形予測スピーチ符号化装置及び方法
JP2002196799A (ja) 音声符号化装置及び音声符号化方法
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3003531B2 (ja) 音声符号化装置
JP4510977B2 (ja) 音声符号化方法および音声復号化方法とその装置
JP2956068B2 (ja) 音声符号化復号化方式
JP3089967B2 (ja) 音声符号化装置
JP3047761B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3954050B2 (ja) 音声符号化装置及び音声符号化方法
JP3024467B2 (ja) 音声符号化装置
JP4087429B2 (ja) 音声符号化装置及び音声符号化方法
JP4907677B2 (ja) 音声符号化装置及び音声符号化方法
JP4660496B2 (ja) 音声符号化装置及び音声符号化方法
JP2000242299A (ja) 重み符号帳とその作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
R150 Certificate of patent or registration of utility model

Ref document number: 3426207

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080509

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090509

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100509

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100509

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110509

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110509

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120509

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120509

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130509

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140509

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term