JP3553356B2 - 線形予測パラメータのコードブック設計方法及び線形予測パラメータ符号化装置並びにコードブック設計プログラムが記録された記録媒体 - Google Patents
線形予測パラメータのコードブック設計方法及び線形予測パラメータ符号化装置並びにコードブック設計プログラムが記録された記録媒体 Download PDFInfo
- Publication number
- JP3553356B2 JP3553356B2 JP04050998A JP4050998A JP3553356B2 JP 3553356 B2 JP3553356 B2 JP 3553356B2 JP 04050998 A JP04050998 A JP 04050998A JP 4050998 A JP4050998 A JP 4050998A JP 3553356 B2 JP3553356 B2 JP 3553356B2
- Authority
- JP
- Japan
- Prior art keywords
- linear prediction
- calculated
- quantization
- subframe
- prediction parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 45
- 238000013461 design Methods 0.000 title claims description 19
- 238000013139 quantization Methods 0.000 claims description 134
- 239000013598 vector Substances 0.000 claims description 100
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000011156 evaluation Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、音声信号の線形予測パラメータのベクトル量子化に用いるコードブックの設計方法、当該コードブックを備える線形予測パラメータ符号化装置及び当該コードブックの設計プログラムが記録された記録媒体の技術分野に属する。
【0002】
【従来の技術】
従来から、音声信号を複数個のパラメータごとにまとめて量子化を行なうベクトル量子化を用いた高能率符号化が一般的に行われている。そして、符号化すべき重要な伝送パラメータの1つとして、線形予測パラメータがある。この線形予測パラメータをベクトル量子化する場合に、フレーム単位に区切られた音声信号を、さらに複数のサブフレームに分割し、サブフレームの区間の代表的な線形予測パラメータを予め蓄えたコードブックを利用することが多い。そして、線形予測パラメータの符号化に際して、コードブック中の最も類似度の高い線形予測パラメータをコードベクトルとして選ぶことにより、ベクトル量子化が行われる。
【0003】
ところで、このようなコードブックを設計するにあたっては、入力信号から得られる線形予測パラメータとして想定される学習データベースに対し、繰り返し算法によるトレーニングを行なって適切なコードベクトルを決定し、コードブックを構成することが一般的である。ここで、実際の符号化処理においては、データ量と計算量の制約から、所定のサブフレーム間隔で、線形予測パラメータのベクトル量子化が行われる。そして、ベクトル量子化を行なうサブフレームの間に位置するサブフレームについては、線形予測パラメータを線形補間することで対応する。従って、これに整合させるため、上述のトレーニングにおいては、当該サブフレーム間隔に従い、線形予測パラメータの量子化による歪みを最小化するように最適なコードベクトルを決定し、その内容に基づくコードブックが設計される。
【0004】
【発明が解決しようとする課題】
しかしながら、コードブックの設計に際し、前述のように線形予測パラメータのベクトル量子化を所定のサブフレーム間隔でのみ行なうようにすると、ベクトル量子化を行なうサブフレームについては、量子化歪みが少ない適切なコードベクトルを選択することが可能であるが、間に位置するサブフレームの存在を考慮すると、選択されたコードベクトルが最適であるとは限らない。即ち、線形予測パラメータの補間値が、そのサブフレーム本来の線形予測パラメータの値と合致しない場合があり、歪みが大きくなることも考えられる。そうすると、前述の繰り返し算法によるトレーニングを行なったとしても、全てのサブフレームに対して最適化されたコードブックの設計は困難になる。
【0005】
一方、このような問題を回避するため、ベクトル量子化を行なうか否かにかかわらず、コードベクトルを決定した直近のサブフレームと新たにコードベクトルを決定するサブフレーム間の全てのサブフレームについて量子化歪みの評価を行ない、さらに、その評価結果を後続のサブフレームにおける量子化歪みの評価に用いるという処理を行なうことが考えられる。しかし、このような処理を行なった場合、特定のサブフレームに対し時間的に先行するサブフレームの補間を反映したベクトル量子化が可能となるが、その時点の後続のサブフレームの補間を反映することができないので、最適なコードベクトルの選択には十分ではない。
【0006】
そこで、本発明は、上記の問題点に鑑みなされたものであり、その課題は、線形予測パラメータの補間値を算出するサブフレームを含む全てのサブフレームについて歪みを最小化できる最適なコードベクトルを選択することにより、線形予測パラメータのベクトル量子化を行なう高性能なコードブックの設計方法、当該コードブックを備える線形予測パラメータ符号化装置及び当該コードブックの設計プログラムが記録された記録媒体を提供することにある。
【0007】
【課題を解決するための手段】
前記課題を解決するために、請求項1に記載の発明は、フレームに区切られ、当該フレームがさらにサブフレームに分割された入力音声について、線形予測パラメータをベクトル量子化する際選択すべきコードベクトルの集合であるコードブックの設計方法であって、サブフレームごとに前記入力音声の線形予測パラメータを算出する算出工程と、前記入力音声を構成する前記サブフレームのうちN−1個(Nは2以上の予め定められた自然数)おきに位置する特定サブフレームについて、前記入力音声の線形予測パラメータに対する前記コードベクトルの候補である複数の量子化候補を算出する量子化工程と、前記特定サブフレームを含んで連続するM個(Mは3以上の予め定められた自然数且つM>N)のサブフレームのうち当該特定サブフレーム以外の各サブフレームについて、前記算出した量子化候補に基づいて、線形予測パラメータの補間値を算出する補間工程と、前記M個の連続するサブフレームの範囲内において、前記算出した量子化候補及び前記算出した補間値並びに前記算出した線形予測パラメータに基づいて、前記算出した量子化候補の中から前記コードベクトルとすべきものを選択し、前記コードブックの内容を決定する決定工程と、を備えて構成される。
【0008】
請求項1に記載の発明によれば、入力音声はフレームに区切られ、さらにフレームが分割されたサブフレームごとに、算出工程において線形予測パラメータが算出される。そして、入力音声を構成するサブフレームのうちN−1個おきに位置する特定サブフレームについては、量子化工程においてコードブックのコードベクトルから複数の量子化候補が算出される一方、特定サブフレームを含んで連続するM個のサブフレームのうち当該特定サブフレーム以外の各サブフレームについては、補間工程において前記量子化候補に基づき、線形予測パラメータの補間値が算出される。その後、当該M個の連続するサブフレームの範囲内で、決定工程において、前記量子化候補、前記補間値と、さらに前記算出した線形予測パラメータとに基づく評価を行った上でコードベクトルの選択が行われ、コードベクトルの内容が決定される。
【0009】
よって、線形予測パラメータの符号化を所定間隔のサブフレームで行う方式に対応するコードブックを設計するに際し、連続するM個のサブフレームのうち量子化対象となる特定サブフレームに対する最適化に加え、当該M個のサブフレームのうち補間処理される各サブフレームに対しても最適化されたコードベクトルの選択が行われ、しかも時間的に前方、後方を問わず最適化されるので、性能の良好なコードブックを、演算量の大幅な増大を避けつつ作成することを可能とする。
【0010】
請求項2に記載の発明は、請求項1に記載の発明において、前記決定工程においては、前記算出した量子化候補及び前記算出した補間値と、前記算出した線形予測パラメータとの歪みを各サブフレームごとに算出し、当該歪みの平均を最小化するように前記コードベクトルの決定を行なうように構成される。
【0011】
請求項2に記載の発明によれば、決定工程において、所定間隔のサブフレームに対する量子化候補とそれ以外のサブフレームに対する補間値の、両方を用いて線形予測パラメータの歪みを各サブフレームごとに算出して平均を求め、それを最小化するようにしてコードベクトルが決定される。
【0012】
よって、量子化対象となるサブフレームで歪みが小さく、さらに補間処理されるサブフレームでも歪みが小さくなるようコードベクトルの選択が行われるので、入力音声に忠実で高音質な符号化のためのコードブック作成を可能とする。
【0013】
請求項3に記載の発明は、フレームに区切られ、当該フレームがさらにサブフレームに分割された入力音声について、線形予測パラメータをベクトル量子化する際選択すべきコードベクトルの集合であるコードブックを備える線形予測パラメータ符号化装置であって、サブフレームごとに前記入力音声の線形予測パラメータを算出する算出手段と、前記入力音声を構成する前記サブフレームのうちN−1個(Nは2以上の予め定められた自然数)おきに位置する特定サブフレームについて、前記入力音声の線形予測パラメータに対する前記コードベクトルの候補である複数の量子化候補を算出する量子化手段と、前記特定サブフレームを含んで連続するM個(Mは3以上の予め定められた自然数且つM>N)のサブフレームのうち当該特定サブフレーム以外の各サブフレームについて、前記算出した量子化候補に基づいて、線形予測パラメータの補間値を算出する補間手段と、前記M個の連続するサブフレームの範囲内において、前記算出した量子化候補及び前記算出した補間値並びに前記算出した線形予測パラメータに基づいて、前記算出した量子化候補の中から前記コードベクトルとすべきものを選択する選択手段と、を備えて構成される。
【0014】
請求項3に記載の発明によれば、入力音声はフレームに区切られ、さらにフレームが分割されたサブフレームごとに、算出手段により線形予測パラメータが算出される。そして、入力音声を構成するサブフレームのうちN−1個おきに位置する特定サブフレームについては、量子化手段によりコードブックのコードベクトルから複数の量子化候補が算出される一方、特定サブフレームを含んで連続するM個のサブフレームのうち当該特定サブレーム以外の各サブフレームについては、補間手段により前記量子化候補に基づき、線形予測パラメータの補間値が算出される。その後、当該M個の連続するサブフレームの範囲内で、選択手段により前記量子化候補、前記補間値と、さらに前記算出した線形予測パラメータとに基づく評価を行った上でコードベクトルの選択が行われる。
【0015】
よって、線形予測パラメータの符号化を所定間隔のサブフレームで行う方式に対応するコードブックを設計するに際し、連続するM個のサブフレームのうち量子化対象となる特定サブフレームに対する最適化に加え、当該M個のサブフレームのうち補間処理される各サブフレームに対しても最適化されたコードベクトルの選択が行われ、しかも時間的に前方、後方を問わず最適化されるので、演算量の大幅な増大を避けつつ、コードブックを用いた高性能な線形予測パラメータの符号化を可能とする。
【0016】
請求項4に記載の発明は、請求項3に記載の発明において、前記選択したコードベクトルにより前記コードブックの内容を適宜更新する更新手段を、さらに備えて構成される。
【0017】
請求項4に記載の発明によれば、選択手段によりベクトル量子化すべきコードベクトルが選択された後、更新手段によりコードベクトルの内容が、選択されたコードベクトルに基づいて更新される。
【0018】
よって、線形予測パラメータのコードブックの内容は、符号化処理の進行に伴い、その性能が高まっていくので、線形予測パラメータの符号化は処理に伴い自動的に最適化される。
【0019】
請求項5に記載の発明は、請求項3又は請求項4に記載の発明において、前記決定手段は、前記算出した量子化候補及び前記算出した補間値と、前記算出した線形予測パラメータとの歪みを各サブフレームごとに算出し、当該歪みの平均を最小化するように前記コードベクトルの決定を行なうように構成される。
【0020】
請求項5に記載の発明によれば、決定手段により、所定間隔のサブフレームに対する量子化候補とそれ以外のサブフレームに対する補間値の、両方を用いて線形予測パラメータの歪みを各サブフレームごとに算出して平均を求め、それを最小化するようにしてコードベクトルが決定される。
【0021】
よって、量子化対象となるサブフレームで歪みが小さく、さらに補間処理されるサブフレームでも歪みが小さくなるようコードベクトルの選択が行われるので、入力音声に忠実で高音質な線形予測パラメータのコードブックを用いた符号化を可能とする。
【0022】
請求項6に記載の発明は、コンピュータに、フレームに区切られ、当該フレームがさらにサブフレームに分割された入力音声について、線形予測パラメータをベクトル量子化する際選択すべきコードベクトルの集合であるコードブックの設計方法を実行させるためのプログラムを記録した記録媒体であって、サブフレームごとに前記入力音声の線形予測パラメータを算出する算出工程と、前記入力音声を構成する前記サブフレームのうちN−1個(Nは2以上の予め定められた自然数)おきに位置する特定サブフレームについて、前記入力音声の線形予測パラメータに対する前記コードベクトルの候補である複数の量子化候補を算出する量子化工程と、前記特定サブフレームを含んで連続するM個(Mは3以上の予め定められた自然数且つM>N)のサブフレームのうち当該特定サブフレーム以外の各サブフレームについて、前記算出した量子化候補に基づいて、線形予測パラメータの補間値を算出する補間工程と、前記M個の連続するサブフレームの範囲内において、前記算出した量子化候補及び前記算出した補間値並びに前記算出した線形予測パラメータに基づいて、前記算出した量子化候補の中から前記コードベクトルとすべきものを選択し、前記コードブックの内容を決定する決定工程とを備えて構成されるコードブック設計方法を実行させるためのプログラムが記録される。
【0023】
請求項6に記載の発明によれば、入力音声はフレームに区切られ、さらにフレームが分割されたサブフレームごとに、算出工程において線形予測パラメータが算出される。そして、入力音声を構成するサブフレームのうちN−1個おきに位置する特定サブフレームについては、量子化工程においてコードブックのコードベクトルから複数の量子化候補が算出される一方、特定サブフレームを含んで連続するM個のサブフレームのうち当該特定サブレーム以外の各サブフレームについては、補間工程において前記量子化候補に基づき、線形予測パラメータの補間値が算出される。その後、当該M個の連続するサブフレームの範囲内で、決定工程において、前記量子化候補、前記補間値と、さらに前記算出した線形予測パラメータとに基づく評価を行った上でコードベクトルの選択が行われ、コードベクトルの内容が決定される。
【0024】
よって、線形予測パラメータの符号化を所定間隔のサブフレームで行う方式に対応するコードブックを設計するに際し、連続するM個のサブフレームのうち量子化対象となる特定サブフレームに対する最適化に加え、当該M個のサブフレームのうち補間処理される各サブフレームに対しても最適化されたコードベクトルの選択が行われ、しかも時間的に前方、後方を問わず最適化されるので、性能の良好なコードブックを、演算量の大幅な増大を避けつつ作成することを可能とする。
【0025】
請求項7に記載の発明は、請求項6に記載の発明において、前記決定工程においては、前記算出した量子化候補及び前記算出した補間値と、前記算出した線形予測パラメータとの歪みを各サブフレームごとに算出し、当該歪みの平均を最小化するように前記コードベクトルの決定を行なうように構成されるコードブック設計方法を実行させるためのプログラムが記録される。
【0026】
請求項7に記載の発明によれば、決定工程において、所定間隔のサブフレームに対する量子化候補とそれ以外のサブフレームに対する補間値の、両方を用いて線形予測パラメータの歪みを各サブフレームごとに算出して平均を求め、それを最小化するようにしてコードベクトルが決定される。
【0027】
よって、量子化対象となるサブフレームで歪みが小さく、さらに補間処理されるサブフレームでも歪みが小さくなるようコードベクトルの選択が行われるので、入力音声に忠実で高音質な符号化のためのコードブック作成を可能とする。
【0028】
【発明の実施の形態】
以下、本発明の好適な実施形態について、図面に基づいて説明する。
【0029】
図1は、本発明に係る線形予測パラメータのベクトル量子化の一実施形態の全体構成を示すブロック図である。
【0030】
図1に示すブロック図は、入力信号バッファ1と、線形予測パラメータ算出部2と、線形予測パラメータ量子化部3と、量子化インデクス用バッファ4と、量子化インデクス組み合わせ決定部5とを含んでいる。
【0031】
図1の構成において、アナログ入力音声がサンプリングされてディジタル値に変換された後、複数のサンプリング値毎にフレーム単位に区切られる。その各フレームが、さらにフレームを複数のサブフレームに分割され、サブフレームごとに入力信号バッファ1に入力される。各サブフレームは、入力音声に対するサンプル値を所定数含んでいる。
【0032】
線形予測パラメータ算出部2は、各サブフレームについて、線形予測パラメータを算出する。
【0033】
線形予測パラメータ量子化部3は、予め定められた所定のサブフレーム間隔ごとに、後述する処理に従って、線形予測パラメータ算出部2で求めた線形予測パラメータをベクトル量子化する。この際、ベクトル量子化に適する複数の量子化パラメータが量子化候補として予備選択される。
【0034】
量子化インデクス用バッファ4は、コードブックを構成する複数のコードベクトルから、線形予測パラメータで予備選択されたコードベクトルのインデクスが保持される。
【0035】
量子化インデクス組み合わせ決定部5は、予め定められた一定数の連続するサブフレームの範囲内において、予備選択された量子化候補の組み合わせから、量子化歪みを最小化する量子化パラメータの組み合わせを決定し、設計すべきコードブックを構成するデータとする。この歪み評価の際、前記所定の間隔に位置するサブフレーム以外のサブフレームについては、量子化パラメータによる補間値に基づく歪みも考慮される。これらの処理の詳細については後述する。
【0036】
図2は、本発明に係る線形予測パラメータのベクトル量子化のためのコードブック設計方法の処理を示すフローチャートである。ここで、図2のフローチャートに示す処理においては、線形予測パラメータ量子化部3の前記所定のサブフレーム間隔がN、線形予測パラメータ量子化部3で予備選択される量子化候補の個数がH、量子化インデクス組み合わせ決定部5の前記一定数の連続するサブフレームの個数がMである場合について説明する。なお、このMは1フレーム又は数フレームの範囲内に対応させることができる。サブフレームはフレームを複数に分割したものであるが、本実施形態においては、サブフレームが処理の基本単位となる。
【0037】
まず、処理用のカウンタの初期設定として、前記M個のサブフレームの範囲内で順次サブフレームをカウントするためのカウンタcntをゼロクリアする(ステップS1)。
【0038】
次に、入力信号のサンプル値がサブフレームごとに入力信号バッファ1を介して、線形予測パラメータ算出部2に取り込まれる(ステップS2)。ここで、コードブック設計においては、入力信号として学習データベースを用いる。この学習データベースには、実際の入力信号として想定される種々の音声信号に対応するデータが含まれ、コードブックをトレーニングするのに適している。
【0039】
次に、各サブフレームについての線形予測パラメータの計算が行なわれる(ステップS3)。線形予測パラメータの代表的なものとして、PARCOR(Partial Autocorrelation Coefficient)係数、LSP(Line Spectrum Pair)などがある。特に、LSPは補間特性が良好であるため、補間を前提とする本実施形態に用いるには好適である。なお、ステップS3で求めた線形予測パラメータは、サブフレーム間隔Nごとに量子化の対象となるのに加え、量子化を行なわない間に位置するサブフレームをも含めて量子化歪みの評価の際に必要となる。
【0040】
次に、現サブフレームがサブフレーム間隔Nごとの線形予測パラメータの量子化処理を行なうべきサブフレームであるかどうかを判断する(ステップS4)。判断の結果、サブフレーム間隔Nごとに位置するサブフレームであって、量子化処理が必要な場合は(ステップS4;YES),線形予測パラメータの量子化を複数の量子化候補を選択することにより行ない(ステップS5)、ステップS6に移行する。一方、前記サブフレーム間隔Nの間に位置しないサブフレームであって、量子化処理が不要な場合は(ステップS4;NO)、直ちにステップS6に移る。
【0041】
ステップS5の線形予測パラメータの量子化にあたっては、予備選択が導入される。即ち、後に量子化インデクス組み合わせ決定部5において最適なコードベクトルを決定するの先立って、コードブックの中から一定数のコードベクトルを量子化候補として予め選択する。量子化候補の選択は、例えば重み付きユークリッド距離の2乗値を最小化する順に従って選ぶ方法がある。前述したように、予備選択されるコードベクトルの個数はH個であり、コードブック中の予備選択されたコードベクトルに付与されたインデクスにより量子化候補を特定することができる。よって、コードブックは、初期状態から予備選択可能な多数のコードベクトルを含むように構成しておく必要がある。
【0042】
また、ステップS6では、現サブフレームの次に位置するサブフレームに処理を進めるため、カウンタcntをインクリメントする。
【0043】
次に、前記M個の連続するサブフレームに対して処理を終えたかどうかをcntから判断する(ステップS7)。判断の結果、cntがMに達していなければ(ステップS7;NO)、まだ処理すべきサブフレームが残っているので、ステップS2に戻る。一方、cntがMに達していれば(ステップS7;YES)、ステップS8に移る。
【0044】
ステップS8では、前記M個の連続するサブフレームの範囲内で最適な量子化インデクスの組み合わせを決定する処理を行なう(ステップS8)。ここで、
【数1】
M=a・N
の関係が成り立つように各数値を設定しておけば、M個のサブフレーム中、予備選択が行われるサブフレームがa個含まれることとなる。従って、各々の量子化候補がH個あるので、M個のサブフレームの範囲内において考えられる量子化候補の組み合わせは、Ha通りあることになる。ステップS8では、この全ての組み合わせの中から、最適な組み合わせを決定する。なお、各数値の設定にあたっては、aやHを大きな値に設定しすぎると膨大な計算量が必要となるので、現実的な範囲に設定することが好ましい。
【0045】
前記最適な組み合わせを決定するにあたって、量子化歪みの評価が行われる。Ha通りの量子化候補の組み合わせの中から、M個のサブフレームの全てに対する量子化歪みを算出し、量子化歪みの平均を最小化する組み合わせを探索し、その組み合わせに含まれるコードベクトルのインデクスに基づいて、コードブックの学習を行なう。
【0046】
ここで、量子化候補の予備選択を行なうa個のサブフレームを除いた残りのサブフレームについては、量子化候補に対応するコードベクトルを用いて線形補間値を求める。具体的には、量子化を行なうべきサブフレームとその次に量子化を行なうべきサブフレームにおける特定の量子化候補を、それぞれY、Y’のベクトルで表すと、Yに対応するサブフレームからn番目に位置するサブフレームについて、
【数2】
Q = {(N−n)Y+nY’}/N
により算出されるベクトルQを用いて補間する。
【0047】
そして、M個の連続するサブフレームに対して、量子化候補又は線形補間値に基づいて、それぞれ線形予測パラメータの重み付け誤差を算出した後、M個のサブフレームにおける平均値が最小となる量子化候補のインデクスの組み合わせを最終的に求める。
【0048】
このように組み合わせが決定されると、対応するインデクスのコードベクトルは設計対象のコードブックの設計用データとなる(ステップS9)。
【0049】
次に、新たに入力信号があるか否かを判別し(ステップS10)、まだ処理すべき入力信号が残っていると(ステップS10;NO)、ステップS1に移行し、入力信号がなくなると(ステップS10;YES)、コードブックのデータ内容が確定し、コードブックの設計が終了する。
【0050】
なお、本発明を線形予測パラメータ符号化装置に適用する場合には、ステップS8の処理が終了すると、最終的に求めた量子化インデクスを線形予測パラメータの符号化データとして出力する。このとき、求めた量子化インデクスに基づき線形予測パラメータ符号化装置が備えるコードブックのデータ内容を更新するようにしてもよい。その後、ステップS10に移り、次の入力信号に対する処理を続けるか、符号化処理を終えるかの判断を行う。
【0051】
かくして、本実施形態に係るコードブック設計方法によれば、以上説明した処理に基づいてコードブック中のデータが定められる。このとき、N個おきに線形予測パラメータを量子化するサブフレームに加え、その間に位置する線形補間を行なうサブフレームについても、量子化による歪み評価の対象となるので、線形補間の影響を考慮してコードブックのデータ内容を決定することができる。また、この歪み評価は、M個の連続するサブフレームについて行われ、各々のサブフレームでH個の予備選択された量子化候補から最適な組み合わせを決定するように行うので、特定のサブフレームについて一定範囲内で時間的に前方及び後方の両方の線形補間の影響が考慮された上で、コードブックのデータ内容が決定される。
【0052】
また、本発明を線形予測パラメータ符号化装置に適用する場合にも、同様の処理を行い、線形補間の影響を考慮して線形予測パラメータの符号化を行うことができる。
【0053】
なお、上述した本発明に係る線形予測パラメータのコードブック設計方法は、コンピュータに読み取り可能なCD−ROM、フロッピーディスク等の記録媒体に記録させることが可能である。そして、当該CD−ROM等を用いてコンピュータにおいて線形予測パラメータのコードブック設計プログラムをインストールし、実行することにより、本発明の当該コードブック設計が実現される。
【0054】
【発明の効果】
以上説明したように、請求項1に記載の発明によれば、各サブフレームについて、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値とに基づく評価を行った上でコードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理される各サブフレームのどちらに対しても最適化されたコードベクトルの選択が行われ、しかも時間的に前方、後方を問わない。よって、性能の良好なコードブックが得られ、演算量を大幅に増大させることのないコードブック作成方法が提供される。
【0055】
請求項2に記載の発明によれば、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値の両方を用いて、歪みを最小化するように、コードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理される各サブフレームのどちらに対しても歪みを抑えるようコードベクトルの選択が行われる。よって、入力音声に忠実で高音質な符号化が行なわれるコードブック作成方法が提供される。
【0056】
請求項3に記載の発明によれば、各サブフレームについて、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値とに基づく評価を行った上でコードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理される各サブフレームのどちらに対しても最適化されたコードベクトルの選択が行なわれ、しかも時間的に前方、後方を問わない。よって、演算量を大幅に増大させることなく、コードブックを用いた高性能な線形予測パラメータの符号化を行なうことができる線形予測パラメータ符号化装置が提供される。
【0057】
請求項4に記載の発明によれば、ベクトル量子化すべきコードベクトルの選択結果に基づきコードベクトルの内容を更新するようにしたので、符号化処理の進行に伴い、コードブックの性能がより向上する。よって、符号化処理に伴い性能を自動的に最適化することができる線形予測パラメータ符号化装置が提供される。
【0058】
請求項5に記載の発明によれば、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値の両方を用いて、歪みを最小化するように、コードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理される各サブフレームのどちらに対しても歪みを抑えるようコードベクトルの選択が行われる。よって、入力音声に忠実で高音質な符号化を行うことができる線形予測パラメータ符号化装置が提供される。
【0059】
請求項6に記載の発明によれば、各サブフレームについて、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値とに基づく評価を行った上でコードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理される各サブフレームのどちらに対しても最適化されたコードベクトルの選択が行なわれ、しかも時間的に前方、後方を問わない。よって、性能の良好なコードブックが得られ、演算量を大幅に増大させることのないコードブック作成方法を機能させるソフトウェアが提供される。
【0060】
請求項7に記載の発明によれば、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値の両方を用いて、歪みを最小化するように、コードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理されるサブフレームのどちらに対しても歪みを抑えるようコードベクトルの選択が行われる。よって、入力音声に忠実で高音質な符号化が行なわれるコードブック作成方法を機能させるソフトウェアが提供される。
【図面の簡単な説明】
【図1】本発明の実施形態における線形予測パラメータのベクトル量子化の全体構成を示すブロック図である。
【図2】本発明に実施形態における線形予測パラメータのベクトル量子化のためのコードブック作成方法の処理を示すフローチャートである。
【符号の説明】
1…入力信号バッファ
2…線形予測パラメータ算出部
3…線形予測パラメータ量子化部
4…量子化インデクス用バッファ
5…量子化インデクス組み合わせ決定部
【発明の属する技術分野】
本発明は、音声信号の線形予測パラメータのベクトル量子化に用いるコードブックの設計方法、当該コードブックを備える線形予測パラメータ符号化装置及び当該コードブックの設計プログラムが記録された記録媒体の技術分野に属する。
【0002】
【従来の技術】
従来から、音声信号を複数個のパラメータごとにまとめて量子化を行なうベクトル量子化を用いた高能率符号化が一般的に行われている。そして、符号化すべき重要な伝送パラメータの1つとして、線形予測パラメータがある。この線形予測パラメータをベクトル量子化する場合に、フレーム単位に区切られた音声信号を、さらに複数のサブフレームに分割し、サブフレームの区間の代表的な線形予測パラメータを予め蓄えたコードブックを利用することが多い。そして、線形予測パラメータの符号化に際して、コードブック中の最も類似度の高い線形予測パラメータをコードベクトルとして選ぶことにより、ベクトル量子化が行われる。
【0003】
ところで、このようなコードブックを設計するにあたっては、入力信号から得られる線形予測パラメータとして想定される学習データベースに対し、繰り返し算法によるトレーニングを行なって適切なコードベクトルを決定し、コードブックを構成することが一般的である。ここで、実際の符号化処理においては、データ量と計算量の制約から、所定のサブフレーム間隔で、線形予測パラメータのベクトル量子化が行われる。そして、ベクトル量子化を行なうサブフレームの間に位置するサブフレームについては、線形予測パラメータを線形補間することで対応する。従って、これに整合させるため、上述のトレーニングにおいては、当該サブフレーム間隔に従い、線形予測パラメータの量子化による歪みを最小化するように最適なコードベクトルを決定し、その内容に基づくコードブックが設計される。
【0004】
【発明が解決しようとする課題】
しかしながら、コードブックの設計に際し、前述のように線形予測パラメータのベクトル量子化を所定のサブフレーム間隔でのみ行なうようにすると、ベクトル量子化を行なうサブフレームについては、量子化歪みが少ない適切なコードベクトルを選択することが可能であるが、間に位置するサブフレームの存在を考慮すると、選択されたコードベクトルが最適であるとは限らない。即ち、線形予測パラメータの補間値が、そのサブフレーム本来の線形予測パラメータの値と合致しない場合があり、歪みが大きくなることも考えられる。そうすると、前述の繰り返し算法によるトレーニングを行なったとしても、全てのサブフレームに対して最適化されたコードブックの設計は困難になる。
【0005】
一方、このような問題を回避するため、ベクトル量子化を行なうか否かにかかわらず、コードベクトルを決定した直近のサブフレームと新たにコードベクトルを決定するサブフレーム間の全てのサブフレームについて量子化歪みの評価を行ない、さらに、その評価結果を後続のサブフレームにおける量子化歪みの評価に用いるという処理を行なうことが考えられる。しかし、このような処理を行なった場合、特定のサブフレームに対し時間的に先行するサブフレームの補間を反映したベクトル量子化が可能となるが、その時点の後続のサブフレームの補間を反映することができないので、最適なコードベクトルの選択には十分ではない。
【0006】
そこで、本発明は、上記の問題点に鑑みなされたものであり、その課題は、線形予測パラメータの補間値を算出するサブフレームを含む全てのサブフレームについて歪みを最小化できる最適なコードベクトルを選択することにより、線形予測パラメータのベクトル量子化を行なう高性能なコードブックの設計方法、当該コードブックを備える線形予測パラメータ符号化装置及び当該コードブックの設計プログラムが記録された記録媒体を提供することにある。
【0007】
【課題を解決するための手段】
前記課題を解決するために、請求項1に記載の発明は、フレームに区切られ、当該フレームがさらにサブフレームに分割された入力音声について、線形予測パラメータをベクトル量子化する際選択すべきコードベクトルの集合であるコードブックの設計方法であって、サブフレームごとに前記入力音声の線形予測パラメータを算出する算出工程と、前記入力音声を構成する前記サブフレームのうちN−1個(Nは2以上の予め定められた自然数)おきに位置する特定サブフレームについて、前記入力音声の線形予測パラメータに対する前記コードベクトルの候補である複数の量子化候補を算出する量子化工程と、前記特定サブフレームを含んで連続するM個(Mは3以上の予め定められた自然数且つM>N)のサブフレームのうち当該特定サブフレーム以外の各サブフレームについて、前記算出した量子化候補に基づいて、線形予測パラメータの補間値を算出する補間工程と、前記M個の連続するサブフレームの範囲内において、前記算出した量子化候補及び前記算出した補間値並びに前記算出した線形予測パラメータに基づいて、前記算出した量子化候補の中から前記コードベクトルとすべきものを選択し、前記コードブックの内容を決定する決定工程と、を備えて構成される。
【0008】
請求項1に記載の発明によれば、入力音声はフレームに区切られ、さらにフレームが分割されたサブフレームごとに、算出工程において線形予測パラメータが算出される。そして、入力音声を構成するサブフレームのうちN−1個おきに位置する特定サブフレームについては、量子化工程においてコードブックのコードベクトルから複数の量子化候補が算出される一方、特定サブフレームを含んで連続するM個のサブフレームのうち当該特定サブフレーム以外の各サブフレームについては、補間工程において前記量子化候補に基づき、線形予測パラメータの補間値が算出される。その後、当該M個の連続するサブフレームの範囲内で、決定工程において、前記量子化候補、前記補間値と、さらに前記算出した線形予測パラメータとに基づく評価を行った上でコードベクトルの選択が行われ、コードベクトルの内容が決定される。
【0009】
よって、線形予測パラメータの符号化を所定間隔のサブフレームで行う方式に対応するコードブックを設計するに際し、連続するM個のサブフレームのうち量子化対象となる特定サブフレームに対する最適化に加え、当該M個のサブフレームのうち補間処理される各サブフレームに対しても最適化されたコードベクトルの選択が行われ、しかも時間的に前方、後方を問わず最適化されるので、性能の良好なコードブックを、演算量の大幅な増大を避けつつ作成することを可能とする。
【0010】
請求項2に記載の発明は、請求項1に記載の発明において、前記決定工程においては、前記算出した量子化候補及び前記算出した補間値と、前記算出した線形予測パラメータとの歪みを各サブフレームごとに算出し、当該歪みの平均を最小化するように前記コードベクトルの決定を行なうように構成される。
【0011】
請求項2に記載の発明によれば、決定工程において、所定間隔のサブフレームに対する量子化候補とそれ以外のサブフレームに対する補間値の、両方を用いて線形予測パラメータの歪みを各サブフレームごとに算出して平均を求め、それを最小化するようにしてコードベクトルが決定される。
【0012】
よって、量子化対象となるサブフレームで歪みが小さく、さらに補間処理されるサブフレームでも歪みが小さくなるようコードベクトルの選択が行われるので、入力音声に忠実で高音質な符号化のためのコードブック作成を可能とする。
【0013】
請求項3に記載の発明は、フレームに区切られ、当該フレームがさらにサブフレームに分割された入力音声について、線形予測パラメータをベクトル量子化する際選択すべきコードベクトルの集合であるコードブックを備える線形予測パラメータ符号化装置であって、サブフレームごとに前記入力音声の線形予測パラメータを算出する算出手段と、前記入力音声を構成する前記サブフレームのうちN−1個(Nは2以上の予め定められた自然数)おきに位置する特定サブフレームについて、前記入力音声の線形予測パラメータに対する前記コードベクトルの候補である複数の量子化候補を算出する量子化手段と、前記特定サブフレームを含んで連続するM個(Mは3以上の予め定められた自然数且つM>N)のサブフレームのうち当該特定サブフレーム以外の各サブフレームについて、前記算出した量子化候補に基づいて、線形予測パラメータの補間値を算出する補間手段と、前記M個の連続するサブフレームの範囲内において、前記算出した量子化候補及び前記算出した補間値並びに前記算出した線形予測パラメータに基づいて、前記算出した量子化候補の中から前記コードベクトルとすべきものを選択する選択手段と、を備えて構成される。
【0014】
請求項3に記載の発明によれば、入力音声はフレームに区切られ、さらにフレームが分割されたサブフレームごとに、算出手段により線形予測パラメータが算出される。そして、入力音声を構成するサブフレームのうちN−1個おきに位置する特定サブフレームについては、量子化手段によりコードブックのコードベクトルから複数の量子化候補が算出される一方、特定サブフレームを含んで連続するM個のサブフレームのうち当該特定サブレーム以外の各サブフレームについては、補間手段により前記量子化候補に基づき、線形予測パラメータの補間値が算出される。その後、当該M個の連続するサブフレームの範囲内で、選択手段により前記量子化候補、前記補間値と、さらに前記算出した線形予測パラメータとに基づく評価を行った上でコードベクトルの選択が行われる。
【0015】
よって、線形予測パラメータの符号化を所定間隔のサブフレームで行う方式に対応するコードブックを設計するに際し、連続するM個のサブフレームのうち量子化対象となる特定サブフレームに対する最適化に加え、当該M個のサブフレームのうち補間処理される各サブフレームに対しても最適化されたコードベクトルの選択が行われ、しかも時間的に前方、後方を問わず最適化されるので、演算量の大幅な増大を避けつつ、コードブックを用いた高性能な線形予測パラメータの符号化を可能とする。
【0016】
請求項4に記載の発明は、請求項3に記載の発明において、前記選択したコードベクトルにより前記コードブックの内容を適宜更新する更新手段を、さらに備えて構成される。
【0017】
請求項4に記載の発明によれば、選択手段によりベクトル量子化すべきコードベクトルが選択された後、更新手段によりコードベクトルの内容が、選択されたコードベクトルに基づいて更新される。
【0018】
よって、線形予測パラメータのコードブックの内容は、符号化処理の進行に伴い、その性能が高まっていくので、線形予測パラメータの符号化は処理に伴い自動的に最適化される。
【0019】
請求項5に記載の発明は、請求項3又は請求項4に記載の発明において、前記決定手段は、前記算出した量子化候補及び前記算出した補間値と、前記算出した線形予測パラメータとの歪みを各サブフレームごとに算出し、当該歪みの平均を最小化するように前記コードベクトルの決定を行なうように構成される。
【0020】
請求項5に記載の発明によれば、決定手段により、所定間隔のサブフレームに対する量子化候補とそれ以外のサブフレームに対する補間値の、両方を用いて線形予測パラメータの歪みを各サブフレームごとに算出して平均を求め、それを最小化するようにしてコードベクトルが決定される。
【0021】
よって、量子化対象となるサブフレームで歪みが小さく、さらに補間処理されるサブフレームでも歪みが小さくなるようコードベクトルの選択が行われるので、入力音声に忠実で高音質な線形予測パラメータのコードブックを用いた符号化を可能とする。
【0022】
請求項6に記載の発明は、コンピュータに、フレームに区切られ、当該フレームがさらにサブフレームに分割された入力音声について、線形予測パラメータをベクトル量子化する際選択すべきコードベクトルの集合であるコードブックの設計方法を実行させるためのプログラムを記録した記録媒体であって、サブフレームごとに前記入力音声の線形予測パラメータを算出する算出工程と、前記入力音声を構成する前記サブフレームのうちN−1個(Nは2以上の予め定められた自然数)おきに位置する特定サブフレームについて、前記入力音声の線形予測パラメータに対する前記コードベクトルの候補である複数の量子化候補を算出する量子化工程と、前記特定サブフレームを含んで連続するM個(Mは3以上の予め定められた自然数且つM>N)のサブフレームのうち当該特定サブフレーム以外の各サブフレームについて、前記算出した量子化候補に基づいて、線形予測パラメータの補間値を算出する補間工程と、前記M個の連続するサブフレームの範囲内において、前記算出した量子化候補及び前記算出した補間値並びに前記算出した線形予測パラメータに基づいて、前記算出した量子化候補の中から前記コードベクトルとすべきものを選択し、前記コードブックの内容を決定する決定工程とを備えて構成されるコードブック設計方法を実行させるためのプログラムが記録される。
【0023】
請求項6に記載の発明によれば、入力音声はフレームに区切られ、さらにフレームが分割されたサブフレームごとに、算出工程において線形予測パラメータが算出される。そして、入力音声を構成するサブフレームのうちN−1個おきに位置する特定サブフレームについては、量子化工程においてコードブックのコードベクトルから複数の量子化候補が算出される一方、特定サブフレームを含んで連続するM個のサブフレームのうち当該特定サブレーム以外の各サブフレームについては、補間工程において前記量子化候補に基づき、線形予測パラメータの補間値が算出される。その後、当該M個の連続するサブフレームの範囲内で、決定工程において、前記量子化候補、前記補間値と、さらに前記算出した線形予測パラメータとに基づく評価を行った上でコードベクトルの選択が行われ、コードベクトルの内容が決定される。
【0024】
よって、線形予測パラメータの符号化を所定間隔のサブフレームで行う方式に対応するコードブックを設計するに際し、連続するM個のサブフレームのうち量子化対象となる特定サブフレームに対する最適化に加え、当該M個のサブフレームのうち補間処理される各サブフレームに対しても最適化されたコードベクトルの選択が行われ、しかも時間的に前方、後方を問わず最適化されるので、性能の良好なコードブックを、演算量の大幅な増大を避けつつ作成することを可能とする。
【0025】
請求項7に記載の発明は、請求項6に記載の発明において、前記決定工程においては、前記算出した量子化候補及び前記算出した補間値と、前記算出した線形予測パラメータとの歪みを各サブフレームごとに算出し、当該歪みの平均を最小化するように前記コードベクトルの決定を行なうように構成されるコードブック設計方法を実行させるためのプログラムが記録される。
【0026】
請求項7に記載の発明によれば、決定工程において、所定間隔のサブフレームに対する量子化候補とそれ以外のサブフレームに対する補間値の、両方を用いて線形予測パラメータの歪みを各サブフレームごとに算出して平均を求め、それを最小化するようにしてコードベクトルが決定される。
【0027】
よって、量子化対象となるサブフレームで歪みが小さく、さらに補間処理されるサブフレームでも歪みが小さくなるようコードベクトルの選択が行われるので、入力音声に忠実で高音質な符号化のためのコードブック作成を可能とする。
【0028】
【発明の実施の形態】
以下、本発明の好適な実施形態について、図面に基づいて説明する。
【0029】
図1は、本発明に係る線形予測パラメータのベクトル量子化の一実施形態の全体構成を示すブロック図である。
【0030】
図1に示すブロック図は、入力信号バッファ1と、線形予測パラメータ算出部2と、線形予測パラメータ量子化部3と、量子化インデクス用バッファ4と、量子化インデクス組み合わせ決定部5とを含んでいる。
【0031】
図1の構成において、アナログ入力音声がサンプリングされてディジタル値に変換された後、複数のサンプリング値毎にフレーム単位に区切られる。その各フレームが、さらにフレームを複数のサブフレームに分割され、サブフレームごとに入力信号バッファ1に入力される。各サブフレームは、入力音声に対するサンプル値を所定数含んでいる。
【0032】
線形予測パラメータ算出部2は、各サブフレームについて、線形予測パラメータを算出する。
【0033】
線形予測パラメータ量子化部3は、予め定められた所定のサブフレーム間隔ごとに、後述する処理に従って、線形予測パラメータ算出部2で求めた線形予測パラメータをベクトル量子化する。この際、ベクトル量子化に適する複数の量子化パラメータが量子化候補として予備選択される。
【0034】
量子化インデクス用バッファ4は、コードブックを構成する複数のコードベクトルから、線形予測パラメータで予備選択されたコードベクトルのインデクスが保持される。
【0035】
量子化インデクス組み合わせ決定部5は、予め定められた一定数の連続するサブフレームの範囲内において、予備選択された量子化候補の組み合わせから、量子化歪みを最小化する量子化パラメータの組み合わせを決定し、設計すべきコードブックを構成するデータとする。この歪み評価の際、前記所定の間隔に位置するサブフレーム以外のサブフレームについては、量子化パラメータによる補間値に基づく歪みも考慮される。これらの処理の詳細については後述する。
【0036】
図2は、本発明に係る線形予測パラメータのベクトル量子化のためのコードブック設計方法の処理を示すフローチャートである。ここで、図2のフローチャートに示す処理においては、線形予測パラメータ量子化部3の前記所定のサブフレーム間隔がN、線形予測パラメータ量子化部3で予備選択される量子化候補の個数がH、量子化インデクス組み合わせ決定部5の前記一定数の連続するサブフレームの個数がMである場合について説明する。なお、このMは1フレーム又は数フレームの範囲内に対応させることができる。サブフレームはフレームを複数に分割したものであるが、本実施形態においては、サブフレームが処理の基本単位となる。
【0037】
まず、処理用のカウンタの初期設定として、前記M個のサブフレームの範囲内で順次サブフレームをカウントするためのカウンタcntをゼロクリアする(ステップS1)。
【0038】
次に、入力信号のサンプル値がサブフレームごとに入力信号バッファ1を介して、線形予測パラメータ算出部2に取り込まれる(ステップS2)。ここで、コードブック設計においては、入力信号として学習データベースを用いる。この学習データベースには、実際の入力信号として想定される種々の音声信号に対応するデータが含まれ、コードブックをトレーニングするのに適している。
【0039】
次に、各サブフレームについての線形予測パラメータの計算が行なわれる(ステップS3)。線形予測パラメータの代表的なものとして、PARCOR(Partial Autocorrelation Coefficient)係数、LSP(Line Spectrum Pair)などがある。特に、LSPは補間特性が良好であるため、補間を前提とする本実施形態に用いるには好適である。なお、ステップS3で求めた線形予測パラメータは、サブフレーム間隔Nごとに量子化の対象となるのに加え、量子化を行なわない間に位置するサブフレームをも含めて量子化歪みの評価の際に必要となる。
【0040】
次に、現サブフレームがサブフレーム間隔Nごとの線形予測パラメータの量子化処理を行なうべきサブフレームであるかどうかを判断する(ステップS4)。判断の結果、サブフレーム間隔Nごとに位置するサブフレームであって、量子化処理が必要な場合は(ステップS4;YES),線形予測パラメータの量子化を複数の量子化候補を選択することにより行ない(ステップS5)、ステップS6に移行する。一方、前記サブフレーム間隔Nの間に位置しないサブフレームであって、量子化処理が不要な場合は(ステップS4;NO)、直ちにステップS6に移る。
【0041】
ステップS5の線形予測パラメータの量子化にあたっては、予備選択が導入される。即ち、後に量子化インデクス組み合わせ決定部5において最適なコードベクトルを決定するの先立って、コードブックの中から一定数のコードベクトルを量子化候補として予め選択する。量子化候補の選択は、例えば重み付きユークリッド距離の2乗値を最小化する順に従って選ぶ方法がある。前述したように、予備選択されるコードベクトルの個数はH個であり、コードブック中の予備選択されたコードベクトルに付与されたインデクスにより量子化候補を特定することができる。よって、コードブックは、初期状態から予備選択可能な多数のコードベクトルを含むように構成しておく必要がある。
【0042】
また、ステップS6では、現サブフレームの次に位置するサブフレームに処理を進めるため、カウンタcntをインクリメントする。
【0043】
次に、前記M個の連続するサブフレームに対して処理を終えたかどうかをcntから判断する(ステップS7)。判断の結果、cntがMに達していなければ(ステップS7;NO)、まだ処理すべきサブフレームが残っているので、ステップS2に戻る。一方、cntがMに達していれば(ステップS7;YES)、ステップS8に移る。
【0044】
ステップS8では、前記M個の連続するサブフレームの範囲内で最適な量子化インデクスの組み合わせを決定する処理を行なう(ステップS8)。ここで、
【数1】
M=a・N
の関係が成り立つように各数値を設定しておけば、M個のサブフレーム中、予備選択が行われるサブフレームがa個含まれることとなる。従って、各々の量子化候補がH個あるので、M個のサブフレームの範囲内において考えられる量子化候補の組み合わせは、Ha通りあることになる。ステップS8では、この全ての組み合わせの中から、最適な組み合わせを決定する。なお、各数値の設定にあたっては、aやHを大きな値に設定しすぎると膨大な計算量が必要となるので、現実的な範囲に設定することが好ましい。
【0045】
前記最適な組み合わせを決定するにあたって、量子化歪みの評価が行われる。Ha通りの量子化候補の組み合わせの中から、M個のサブフレームの全てに対する量子化歪みを算出し、量子化歪みの平均を最小化する組み合わせを探索し、その組み合わせに含まれるコードベクトルのインデクスに基づいて、コードブックの学習を行なう。
【0046】
ここで、量子化候補の予備選択を行なうa個のサブフレームを除いた残りのサブフレームについては、量子化候補に対応するコードベクトルを用いて線形補間値を求める。具体的には、量子化を行なうべきサブフレームとその次に量子化を行なうべきサブフレームにおける特定の量子化候補を、それぞれY、Y’のベクトルで表すと、Yに対応するサブフレームからn番目に位置するサブフレームについて、
【数2】
Q = {(N−n)Y+nY’}/N
により算出されるベクトルQを用いて補間する。
【0047】
そして、M個の連続するサブフレームに対して、量子化候補又は線形補間値に基づいて、それぞれ線形予測パラメータの重み付け誤差を算出した後、M個のサブフレームにおける平均値が最小となる量子化候補のインデクスの組み合わせを最終的に求める。
【0048】
このように組み合わせが決定されると、対応するインデクスのコードベクトルは設計対象のコードブックの設計用データとなる(ステップS9)。
【0049】
次に、新たに入力信号があるか否かを判別し(ステップS10)、まだ処理すべき入力信号が残っていると(ステップS10;NO)、ステップS1に移行し、入力信号がなくなると(ステップS10;YES)、コードブックのデータ内容が確定し、コードブックの設計が終了する。
【0050】
なお、本発明を線形予測パラメータ符号化装置に適用する場合には、ステップS8の処理が終了すると、最終的に求めた量子化インデクスを線形予測パラメータの符号化データとして出力する。このとき、求めた量子化インデクスに基づき線形予測パラメータ符号化装置が備えるコードブックのデータ内容を更新するようにしてもよい。その後、ステップS10に移り、次の入力信号に対する処理を続けるか、符号化処理を終えるかの判断を行う。
【0051】
かくして、本実施形態に係るコードブック設計方法によれば、以上説明した処理に基づいてコードブック中のデータが定められる。このとき、N個おきに線形予測パラメータを量子化するサブフレームに加え、その間に位置する線形補間を行なうサブフレームについても、量子化による歪み評価の対象となるので、線形補間の影響を考慮してコードブックのデータ内容を決定することができる。また、この歪み評価は、M個の連続するサブフレームについて行われ、各々のサブフレームでH個の予備選択された量子化候補から最適な組み合わせを決定するように行うので、特定のサブフレームについて一定範囲内で時間的に前方及び後方の両方の線形補間の影響が考慮された上で、コードブックのデータ内容が決定される。
【0052】
また、本発明を線形予測パラメータ符号化装置に適用する場合にも、同様の処理を行い、線形補間の影響を考慮して線形予測パラメータの符号化を行うことができる。
【0053】
なお、上述した本発明に係る線形予測パラメータのコードブック設計方法は、コンピュータに読み取り可能なCD−ROM、フロッピーディスク等の記録媒体に記録させることが可能である。そして、当該CD−ROM等を用いてコンピュータにおいて線形予測パラメータのコードブック設計プログラムをインストールし、実行することにより、本発明の当該コードブック設計が実現される。
【0054】
【発明の効果】
以上説明したように、請求項1に記載の発明によれば、各サブフレームについて、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値とに基づく評価を行った上でコードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理される各サブフレームのどちらに対しても最適化されたコードベクトルの選択が行われ、しかも時間的に前方、後方を問わない。よって、性能の良好なコードブックが得られ、演算量を大幅に増大させることのないコードブック作成方法が提供される。
【0055】
請求項2に記載の発明によれば、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値の両方を用いて、歪みを最小化するように、コードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理される各サブフレームのどちらに対しても歪みを抑えるようコードベクトルの選択が行われる。よって、入力音声に忠実で高音質な符号化が行なわれるコードブック作成方法が提供される。
【0056】
請求項3に記載の発明によれば、各サブフレームについて、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値とに基づく評価を行った上でコードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理される各サブフレームのどちらに対しても最適化されたコードベクトルの選択が行なわれ、しかも時間的に前方、後方を問わない。よって、演算量を大幅に増大させることなく、コードブックを用いた高性能な線形予測パラメータの符号化を行なうことができる線形予測パラメータ符号化装置が提供される。
【0057】
請求項4に記載の発明によれば、ベクトル量子化すべきコードベクトルの選択結果に基づきコードベクトルの内容を更新するようにしたので、符号化処理の進行に伴い、コードブックの性能がより向上する。よって、符号化処理に伴い性能を自動的に最適化することができる線形予測パラメータ符号化装置が提供される。
【0058】
請求項5に記載の発明によれば、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値の両方を用いて、歪みを最小化するように、コードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理される各サブフレームのどちらに対しても歪みを抑えるようコードベクトルの選択が行われる。よって、入力音声に忠実で高音質な符号化を行うことができる線形予測パラメータ符号化装置が提供される。
【0059】
請求項6に記載の発明によれば、各サブフレームについて、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値とに基づく評価を行った上でコードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理される各サブフレームのどちらに対しても最適化されたコードベクトルの選択が行なわれ、しかも時間的に前方、後方を問わない。よって、性能の良好なコードブックが得られ、演算量を大幅に増大させることのないコードブック作成方法を機能させるソフトウェアが提供される。
【0060】
請求項7に記載の発明によれば、特定サブフレームを対象として求める線形予測パラメータの量子化候補と、当該特定サブフレーム以外の各サブフレームについて求めるその補間値の両方を用いて、歪みを最小化するように、コードブックの内容を決定するようにしたので、量子化対象となる特定サブフレームと、当該特定サブフレーム以外の補間処理されるサブフレームのどちらに対しても歪みを抑えるようコードベクトルの選択が行われる。よって、入力音声に忠実で高音質な符号化が行なわれるコードブック作成方法を機能させるソフトウェアが提供される。
【図面の簡単な説明】
【図1】本発明の実施形態における線形予測パラメータのベクトル量子化の全体構成を示すブロック図である。
【図2】本発明に実施形態における線形予測パラメータのベクトル量子化のためのコードブック作成方法の処理を示すフローチャートである。
【符号の説明】
1…入力信号バッファ
2…線形予測パラメータ算出部
3…線形予測パラメータ量子化部
4…量子化インデクス用バッファ
5…量子化インデクス組み合わせ決定部
Claims (7)
- フレームに区切られ、当該フレームがさらにサブフレームに分割された入力音声について、線形予測パラメータをベクトル量子化する際選択すべきコードベクトルの集合であるコードブックの設計方法であって、
サブフレームごとに前記入力音声の線形予測パラメータを算出する算出工程と、
前記入力音声を構成する前記サブフレームのうちN−1個(Nは2以上の予め定められた自然数)おきに位置する特定サブフレームについて、前記入力音声の線形予測パラメータに対する前記コードベクトルの候補である複数の量子化候補を算出する量子化工程と、
前記特定サブフレームを含んで連続するM個(Mは3以上の予め定められた自然数且つM>N)のサブフレームのうち当該特定サブフレーム以外の各サブフレームについて、前記算出した量子化候補に基づいて、線形予測パラメータの補間値を算出する補間工程と、
前記M個の連続するサブフレームの範囲内において、前記算出した量子化候補及び前記算出した補間値並びに前記算出した線形予測パラメータに基づいて、前記算出した量子化候補の中から前記コードベクトルとすべきものを選択し、前記コードブックの内容を決定する決定工程と、
を備えることを特徴とするコードブック設計方法。 - 前記決定工程においては、前記算出した量子化候補及び前記算出した補間値と、前記算出した線形予測パラメータとの歪みを各サブフレームごとに算出し、当該歪みの平均を最小化するように前記コードベクトルの決定を行なうことを特徴とする請求項1に記載のコードブック設計方法。
- フレームに区切られ、当該フレームがさらにサブフレームに分割された入力音声について、線形予測パラメータをベクトル量子化する際選択すべきコードベクトルの集合であるコードブックを備える線形予測パラメータ符号化装置であって、
サブフレームごとに前記入力音声の線形予測パラメータを算出する算出手段と、
前記入力音声を構成する前記サブフレームのうちN−1個(Nは2以上の予め定められた自然数)おきに位置する特定サブフレームについて、前記入力音声の線形予測パラメータに対する前記コードベクトルの候補である複数の量子化候補を算出する量子化手段と、
前記特定サブフレームを含んで連続するM個(Mは3以上の予め定められた自然数且つM>N)のサブフレームのうち当該特定サブフレーム以外の各サブフレームについて、前記算出した量子化候補に基づいて、線形予測パラメータの補間値を算出する補間手段と、
前記M個の連続するサブフレームの範囲内において、前記算出した量子化候補及び前記算出した補間値並びに前記算出した線形予測パラメータに基づいて、前記算出した量子化候補の中から前記コードベクトルとすべきものを選択する選択手段と、
を備えることを特徴とする線形予測パラメータ符号化装置。 - 前記選択したコードベクトルにより前記コードブックの内容を適宜更新する更新手段を、さらに備えることを特徴とする請求項3に記載の線形予測パラメータ符号化装置。
- 前記決定手段は、前記算出した量子化候補及び前記算出した補間値と、前記算出した線形予測パラメータとの歪みを各サブフレームごとに算出し、当該歪みの平均を最小化するように前記コードベクトルの決定を行なうことを特徴とする請求項3又は請求項4に記載の線形予測パラメータ符号化装置。
- コンピュータに、
フレームに区切られ、当該フレームがさらにサブフレームに分割された入力音声について、線形予測パラメータをベクトル量子化する際選択すべきコードベクトルの集合であるコードブックの設計方法を実行させるためのプログラムを記録した記録媒体であって、
サブフレームごとに前記入力音声の線形予測パラメータを算出する算出工程と、
前記入力音声を構成する前記サブフレームのうちN−1個(Nは2以上の予め定められた自然数)おきに位置する特定サブフレームについて、前記入力音声の線形予測パラメータに対する前記コードベクトルの候補である複数の量子化候補を算出する量子化工程と、
前記特定サブフレームを含んで連続するM個(Mは3以上の予め定められた自然数且つ M>N)のサブフレームのうち当該特定サブフレーム以外の各サブフレームについて、前記算出した量子化候補に基づいて、線形予測パラメータの補間値を算出する補間工程と、
前記M個の連続するサブフレームの範囲内において、前記算出した量子化候補及び前記算出した補間値並びに前記算出した線形予測パラメータに基づいて、前記算出した量子化候補の中から前記コードベクトルとすべきものを選択し、前記コードブックの内容を決定する決定工程と、
を備えることを特徴とするコードブック設計方法を実行させるためのプログラムを記録した記録媒体。 - 前記決定工程においては、前記算出した量子化候補及び前記算出した補間値と、前記算出した線形予測パラメータとの歪みを各サブフレームごとに算出し、当該歪みの平均を最小化するように前記コードベクトルの決定を行なうことを特徴とする請求項6に記載のコードブック設計方法を実行させるためのプログラムを記録した記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04050998A JP3553356B2 (ja) | 1998-02-23 | 1998-02-23 | 線形予測パラメータのコードブック設計方法及び線形予測パラメータ符号化装置並びにコードブック設計プログラムが記録された記録媒体 |
US09/253,722 US6463409B1 (en) | 1998-02-23 | 1999-02-22 | Method of and apparatus for designing code book of linear predictive parameters, method of and apparatus for coding linear predictive parameters, and program storage device readable by the designing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04050998A JP3553356B2 (ja) | 1998-02-23 | 1998-02-23 | 線形予測パラメータのコードブック設計方法及び線形予測パラメータ符号化装置並びにコードブック設計プログラムが記録された記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11237900A JPH11237900A (ja) | 1999-08-31 |
JP3553356B2 true JP3553356B2 (ja) | 2004-08-11 |
Family
ID=12582524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04050998A Expired - Fee Related JP3553356B2 (ja) | 1998-02-23 | 1998-02-23 | 線形予測パラメータのコードブック設計方法及び線形予測パラメータ符号化装置並びにコードブック設計プログラムが記録された記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6463409B1 (ja) |
JP (1) | JP3553356B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1959435B1 (en) * | 1999-08-23 | 2009-12-23 | Panasonic Corporation | Speech encoder |
US20040083097A1 (en) * | 2002-10-29 | 2004-04-29 | Chu Wai Chung | Optimized windows and interpolation factors, and methods for optimizing windows, interpolation factors and linear prediction analysis in the ITU-T G.729 speech coding standard |
CN105632503B (zh) * | 2014-10-28 | 2019-09-03 | 南宁富桂精密工业有限公司 | 信息隐藏方法及系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5384891A (en) * | 1988-09-28 | 1995-01-24 | Hitachi, Ltd. | Vector quantizing apparatus and speech analysis-synthesis system using the apparatus |
CA2027705C (en) * | 1989-10-17 | 1994-02-15 | Masami Akamine | Speech coding system utilizing a recursive computation technique for improvement in processing speed |
JP2776050B2 (ja) * | 1991-02-26 | 1998-07-16 | 日本電気株式会社 | 音声符号化方式 |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
US5659659A (en) * | 1993-07-26 | 1997-08-19 | Alaris, Inc. | Speech compressor using trellis encoding and linear prediction |
FI98163C (fi) * | 1994-02-08 | 1997-04-25 | Nokia Mobile Phones Ltd | Koodausjärjestelmä parametriseen puheenkoodaukseen |
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
US5890110A (en) * | 1995-03-27 | 1999-03-30 | The Regents Of The University Of California | Variable dimension vector quantization |
JP3707154B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | 音声符号化方法及び装置 |
-
1998
- 1998-02-23 JP JP04050998A patent/JP3553356B2/ja not_active Expired - Fee Related
-
1999
- 1999-02-22 US US09/253,722 patent/US6463409B1/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11237900A (ja) | 1999-08-31 |
US6463409B1 (en) | 2002-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3094908B2 (ja) | 音声符号化装置 | |
JPH056199A (ja) | 音声パラメータ符号化方式 | |
JP2655046B2 (ja) | ベクトル量子化装置 | |
JP3553356B2 (ja) | 線形予測パラメータのコードブック設計方法及び線形予測パラメータ符号化装置並びにコードブック設計プログラムが記録された記録媒体 | |
JPH0944195A (ja) | 音声符号化装置 | |
JP2970407B2 (ja) | 音声の励振信号符号化装置 | |
JP2002207499A (ja) | 非常に低いビット・レートで作動する音声符号器のための韻律を符号化する方法 | |
JP3618217B2 (ja) | 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体 | |
JP3285185B2 (ja) | 音響信号符号化方法 | |
JP2000509847A (ja) | 音声信号を伝送する伝送システム | |
JPH0854898A (ja) | 音声符号化装置 | |
JP3283152B2 (ja) | 音声パラメータ量子化装置およびベクトル量子化装置 | |
JPH113098A (ja) | 音声符号化方法および装置 | |
JP3194930B2 (ja) | 音声符号化装置 | |
JP3262652B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP3089967B2 (ja) | 音声符号化装置 | |
JPH06131000A (ja) | 基本周期符号化装置 | |
JP3754819B2 (ja) | 音声通信方法及び音声通信装置 | |
JP2734995B2 (ja) | スペクトルパラメータ抽出装置 | |
JP3256215B2 (ja) | 音声符号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP3002299B2 (ja) | 音声符号化装置 | |
JPH08185199A (ja) | 音声符号化装置 | |
JPH05232995A (ja) | 一般化された合成による分析音声符号化方法と装置 | |
JP3102017B2 (ja) | 音声符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040427 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040428 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080514 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |