JPH1195799A - 音声符号化装置及び音声符号化におけるピッチ予測方法 - Google Patents

音声符号化装置及び音声符号化におけるピッチ予測方法

Info

Publication number
JPH1195799A
JPH1195799A JP9273738A JP27373897A JPH1195799A JP H1195799 A JPH1195799 A JP H1195799A JP 9273738 A JP9273738 A JP 9273738A JP 27373897 A JP27373897 A JP 27373897A JP H1195799 A JPH1195799 A JP H1195799A
Authority
JP
Japan
Prior art keywords
pitch
convolution
data
memory
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9273738A
Other languages
English (en)
Other versions
JP3263347B2 (ja
Inventor
Motoyasu Ono
元康 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic System Solutions Japan Co Ltd
Original Assignee
Panasonic System Networks Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic System Networks Co Ltd filed Critical Panasonic System Networks Co Ltd
Priority to JP27373897A priority Critical patent/JP3263347B2/ja
Priority to US09/153,299 priority patent/US6243673B1/en
Priority to DE69822579T priority patent/DE69822579T2/de
Priority to EP98117652A priority patent/EP0903729B1/en
Publication of JPH1195799A publication Critical patent/JPH1195799A/ja
Application granted granted Critical
Publication of JP3263347B2 publication Critical patent/JP3263347B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】 【課題】 音声符号化のピッチ予測におけけるDS
P(CPU)における演算量を、kパラメータに依存す
ることなく、少なくすること。 【解決手段】 ピッチ再生処理部1で音源パルス列X
[n]から抽出したピッチ再生音源パルス列Y[n]と
線形予測合成フィルタ2の係数I[n]とのコンボリュ
ーション処理後のデータt'[n]を格納するメモリ9
を具備し、再度コンボリューション処理を繰り返す場合
に、メモリ9上の前コンボリューションデータの一部を
現コンボリューションデータ格納領域に書き込むメモリ
制御を実行し、前記現コンボリューションデータを使用
してピッチ予測処理を実行する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を少ない
情報量でディジタル符号化する音声符号化装置及び音声
符号化におけるピッチ予測方法に関し、特に、音声符号
化に使用する入力音源波形のピッチ情報を、できるだけ
少ない演算量で求めるピッチ予測方法を採用する音声符
号化装置及び音声符号化におけるピッチ予測方法に関す
る。
【0002】
【従来の技術】CELP(Code Excited Linear Pre
diction)方式に代表される音声符号化方法は、音声情
報を音声波形と音源波形とによりモデル化し、フレーム
分割した入力音声情報から抽出した、音声波形に対応す
るスペクトル包絡情報と音源波形に対応するピッチ情報
とを各々符号化することにより行う。
【0003】このような音声符号化を低ビットレートで
行う一方法として、近年、ITU−T/G.723.1
が、勧告化された。このG.723.1の符号化は、線
形予測分析/合成を基本に、聴感重み付けエラー信号を
最小化するようにして行われる。その際に行うピッチ情
報の探索は、音声波形は声帯の振動に応じ母音区間で周
期的になるという性質を利用して行うものであり、これ
をピッチ予測という。
【0004】以下、従来の音声符号化装置で採用される
ピッチ予測方法について、図4を参照しつつ説明する。
図4は、従来の音声符号化装置のピッチ予測部のブロッ
ク図である。
【0005】入力音声信号は、まずフレーム及びサブフ
レーム単位にフレーム分割処理される。直前のサブフレ
ームで生成された音源パルス列X[n]がピッチ再生処
理部1に入力され、現在の処理対象サブフレームでピッ
チ強調処理される。
【0006】線形予測合成フィルタ2は、乗算器3にお
いて、ピッチ再生処理部1の出力音声データY[n]に
対して、フォルマント処理、ハーモニックシェイピング
処理等のシステムのフィルタ処理を行う。
【0007】この線形予測合成フィルタ2の係数設定
は、音声入力信号y[n]を、線形予測(LPC)分析
して得た線形予測係数A(z)を線スペクトル対(LS
P)量子化により正規化した線形予測係数A'(z)
と、音声入力信号y[n]を、聴感重み付け処理する際
の聴感重み付け係数W[z]と、この聴感重み付け処理
後の信号を波形整形するハーモニックノイズフィルタの
係数P(z)信号と、により行われる。
【0008】ピッチ予測フィルタ4は、乗算器3の出力
データt'[n]に対して、設定された係数により、乗
算器5においてフィルタ処理を行う、5タップ構成のフ
ィルタである。この係数設定は、各ピッチ周期に対応す
る適応ベクトルのコードワードを格納する適応コードブ
ック6から、順次コードワードを読み出すことにより行
われる。さらに、このピッチ予測フィルタ4には、符号
化された音声データを復号化する際に、以前(過去)の
音源パルス列から現在の音源パルス列を生成する際に、
人の音声に近い自然なピッチ周期をつくる働きがある。
【0009】更に、加算器7では、ピッチ予測フィルタ
処理後の信号である乗算器5の出力データp[n]と、
現在のサブフレームのピッチ残差信号t[n](フォル
マント処理、ハーモニックシェイピング処理の残差信
号)との誤差を、エラー信号r[n]として出力する。
このエラー信号r[n]が最小となるよう、最小二乗法
により、適応コードブック6のインデックスとピッチ長
とが、最適ピッチ情報として求められる。
【0010】以上のようなピッチ予測方法における演算
処理は、具体的に、以下のように行われる。
【0011】まず、ピッチ再生処理部2により行われる
ピッチ再生の演算処理について、図5を用いて簡単に説
明する。
【0012】所定ピッチの音源パルス列X[n]は、1
45サンプル入力可能なバッファに順次入力され、次式
(1)(2)により、64サンプルのピッチ再生音源列
Y[n]が求められる。
【0013】
【数1】
【0014】
【数2】 但し、ここで、Lagは、ピッチ周期を示す。
【0015】つまり、(1)式(2)式は、現在のピッ
チ情報(声帯振動)を、以前の音源パルス列を用いて疑
似的に生成していることを示している。
【0016】さらに、このピッチ再生音源列Y[n]と
線形予測合成フィルタ2の出力とのコンボリュウション
により、次式(3)に従って、コンボリュウションデー
タ(フィルタ後のデータ)t'[n]が求まる。
【0017】
【数3】 そして、ピッチ予測処理は、5次のFIR(finitive
impulse response)型のピッチ予測フィルタを使用し
て行うため、現在のピッチ周期をLagとすると、次式
(4)で示すように、Lag−2からLag+2までの
5つのコンボリュウションデータt'[n]が必要にな
る。
【0018】この処理のため、図5に示すように、ピッ
チ再生音源データY[n]は、サブフレーム60サンプ
ルに対して、4サンプル分(Lag−2からLag+2
で計4サンプル)多い、64サンプル分必要になる。
【0019】
【数4】 ここで、lは、2次元配列の変数で、処理をが5回繰り
返されることを示す。
【0020】但し、DSP等で演算量を削減する手段と
して、l=4の場合には、上記の(3)式により、l=
0〜3から場合には、次式(5)により、t'(4)
(n)のコンボリュウションデータを各々求める。
【0021】
【数5】 この式(5)の処理により、1830回必要な積和演算
処理(コンボリュウション)を、60回の積和演算処理
で行うことができる。
【0022】さらに、エラー信号r(n)を最小にする
ように、ピッチ残差信号t(n)から、ピッチ予測フィ
ルタ4によるコボリュウションデータP(n)の最適値
を求める。つまり、コードブック6から5次のFIR型
ピッチ予測フィルタ4の5つのフィルタ係数に対応する
ピッチの適応コードブックデータを探索して、次式
(6)のエラー信号r(n)を最小化するようにする。
【0023】
【数6】 但し、エラーの評価は、最小2乗法を用いて、次式
(7)により求める。
【0024】
【数7】 従って、
【0025】
【数8】 であり、さらに、
【0026】
【数9】 となる。
【0027】上記の式(9)を式(8)に代入すること
により、ピッチの適応コードブックデータ、つまり、エ
ラーを最小にする時のピッチの適応コードブックデータ
のインデックスを求めることができる。
【0028】さらに、この時のピッチ周期情報を正確に
求めるために、Lag−1からLag+1に対して上記
の操作を繰り返して再探索を行い、クローズドループピ
ッチ情報であるピッチ周期とピッチの適応コードブック
データのインデックスを求める。この再探索の回数は、
kパラメータの設定により定められる。Lag−1、L
ag、Lag+1の順にピッチ予測を繰り返す場合は、
k=2(0,1,2)の設定となっている。(k=2の
場合、繰り返し回数は、3回となる。) さらに、各サブフレームに対して処理が施されて、ピッ
チ周期の再探索幅は、偶数サブフレームでLag−1か
らLag+1ではk=2(繰り返し回数は、3回とな
る。)として、奇数サブフレームでLag−1からLa
g+2ではk=3(繰り返し回数は、4回となる。)と
して、ピッチ探索処理が行われる。そして、1フレーム
は、4サブフレームから構成されているため、1フレー
ムにおいて、同様な処理が4回繰り返されることにな
る。
【0029】
【発明が解決しようとする課題】しかし、上述の従来技
術の構成では、ピッチ再生処理を行う度に式(4)で示
したコンボリュウション処理が必要になるため、1フレ
ームにおいては、kパラメータで示される総和分の14
(3+4+3+4)回のコンボリュウション処理が必要
になり、DSP(CPU)で処理を行う場合には、演算
量が増大するという問題がある。
【0030】また、ピッチ再生処理をkパタメータにお
ける繰り返し回数分行う必要があるため、DSP(CP
U)で処理を行う上で演算量が増大するという問題もあ
る。
【0031】本発明は、上述の課題に鑑みて為されたも
ので、DSP(CPU)における演算量を、kパラメー
タに依存することなく、少なくすることができるピッチ
予測方法を採用した音声符号化装置を提供することを目
的とする。
【0032】
【課題を解決するための手段】本発明は、上述の課題を
解決するため、以下の構成を採る。
【0033】請求項1記載の発明は、ピッチ再生処理手
段で音源パルス列から抽出したピッチ再生音源パルス列
と線形予測合成フィルタ係数とのコンボリューション処
理後のデータを格納するメモリを具備し、再度コンボリ
ューション処理を繰り返す場合に、前コンボリューショ
ンデータの一部を現コンボリューションデータ格納領域
に書き込むメモリ制御を実行し、前記現コンボリューシ
ョンデータを使用してピッチ予測処理を実行する構成と
した。
【0034】また、請求項4記載の発明は、方法の発明
であり、ピッチ再生処理手段で音源パルス列から抽出し
たピッチ再生音源パルス列と線形予測合成フィルタ係数
とのコンボリューション処理後のデータをメモリに一時
記憶し、再度コンボリューション処理を繰り返す場合
に、前記メモリに一時記憶された前コンボリューション
データの一部を現コンボリューションデータとして使用
することによりコンボリューション処理回数を削減する
ようにした。
【0035】これらの構成により、コンボリューション
データをメモリ上で操作することにより、kパラメータ
における繰り返し回数の都度複数回必要であった積和演
算処理(コンボリュウション)を、1回の処理のみで実
現可能になるので、CPUにおける演算量を削減するこ
とができる。
【0036】また、請求項2記載の発明は、請求項1記
載の音声符号化装置において、メモリは一回のコンボリ
ューション処理に必要な領域を有して成り、前コンボリ
ューションデータの一部を現コンボリューションデータ
格納領域に書き込むメモリ制御を、各コンボリューショ
ンデータを順次シフトすることにより実行する構成とし
た。
【0037】この構成により、最低限のメモリ容量でコ
ンボリューション処理を繰り返すことができる。
【0038】また、請求項3記載の発明は、請求項1又
は請求項2記載の音声符号化装置において、ピッチ再生
処理手段からのピッチ再生音源パルス列を一時記憶する
メモリを具備し、一時記憶されたピッチ再生音源パルス
列を用いてコンボリューション処理を連続的に実行する
構成とした。
【0039】また、請求項5記載の発明は、ピッチ再生
処理手段からの再生音源パルス列を第1メモリに一時記
憶し、一時記憶された再生音源パルス列を用いて線形予
測合成フィルタ係数とのコンボリューション処理を連続
的に実行し、前記コンボリューション処理後のデータを
第2メモリに一時記憶し、再度コンボリューション処理
を繰り返す場合に、前記第2メモリに一時記憶された前
コンボリューションデータの一部を現コンボリューショ
ンデータとして使用することによりコンボリューション
処理回数を削減するようにした。
【0040】この構成により、同一のピッチ再生処理を
繰り返す必要がなくなるため、演算量を更に削減するこ
とができる。
【0041】
【発明の実施の形態】
(実施の形態1)以下、本発明の実施の形態1につい
て、図面を参照して説明する。図1は、本発明の実施の
形態1に係る音声符号化装置のピッチ予測部の概略ブロ
ック図である。
【0042】基本的な符号化処理の流れは、従来と同様
であり、ピッチ再生処理部1は、直前のサブフレームで
生成された音源パルス列X[n]を入力し、入力音声波
形の自己相関によって求めたピッチ長情報を基準に、現
在の処理対象サブフレームのピッチ強調処理を行う。ま
た、線形予測合成フィルタ2は、乗算器3において、ピ
ッチ再生処理部1の出力のピッチ再生音源データY
[n]に対して、フォルマント処理、ハーモニックシェ
イピング処理等のシステムのフィルタ処理を行う。
【0043】線形予測合成フィルタ2の係数設定は、L
SP量子化により正規化された線形予測係数A'(z)
と、聴感重み付け係数W[z]と、ハーモニックノイズ
フィルタの係数P(z)信号と、により行われる。
【0044】ピッチ予測フィルタ4は、乗算器3の出力
データt'[n]に対して、設定された係数により、乗
算器5においてフィルタ処理を行う、5タップ構成のフ
ィルタである。この係数設定は、各ピッチ周期に対応す
る適応ベクトルのコードワードを格納する適応コードブ
ック6から、順次コードワードを読み出すことにより行
われる。
【0045】更に、加算器7では、ピッチ予測フィルタ
処理後の信号である乗算器5の出力データp[n]と、
現在のサブフレームのピッチ残差信号t[n](フォル
マント処理、ハーモニックシェイピング処理の残差信
号)との誤差を、エラー信号r[n]として出力する。
このエラー信号r[n]が最小となるよう、最小二乗法
により、適応コードブック6のインデックスとピッチ長
とが、最適ピッチ情報として求められる。
【0046】また、ピッチ判定処理部8は、入力される
ピッチ長情報からそのピッチ周期(Lag)を判定し、
その値が所定値を超えているか否かを判定する。実施の
形態1では、1サブフレームを60サンプル構成とし、
1周期が1サブフレーム以上であることが必要であり、
かつ、ピッチ予測フィルタを5タップ構成としたので、
Lag+2からサブフレームを1サンプルずつシフト
させて連続的に5サブフレーム分抽出する必要があるた
め、Lag+2>64となる。更に、ピッチ再生音源デ
ータY[n]の精度向上のため、同様の処理をkパラメ
ータで設定した回数繰り返すようにする(k=2の場合
は、3回の処理を繰り返す)。従って、ピッチ判定処理
部8は、Lag+2 >64+k (Lag>62+
k)の判定を行う。
【0047】また、メモリ9は、ピッチ再生音源データ
Y[n]と線形予測合成フィルタ2の係数I[n]との
コンボリュウションデータを格納するメモリであり、図
示するように、第1コンボリューションデータ乃至第5
コンボリューションデータを、kパラメータで設定され
るピッチ再生とコンボリューションとの繰り返し回数に
応じて、順次格納する。この繰り返し処理は、先回のコ
ンボリューションデータを用いてピッチ予測フィルタ4
の係数とのコンボリューションデータとピッチ残差信号
t[n]とのエラー信号から生成した音源パルス列X'
[n]を再度ピッチ再生処理部2に帰還させ、また、先
回の処理で取得したピッチ情報を使用して行う。
【0048】以上のように構成された音声符号化装置の
ピッチ予測処理について、更に具体的に説明する。
【0049】式(3)及び式(5)により、t'(4)
(n)のコンボリュウションデータを各々求める処理ま
では従来と同様であるが、実施の形態1では、ピッチ周
期の再生精度向上のために、線形予測合成フィルタ2に
よりコンボリューション処理を繰り返して再探索をk回
行うに際して、ピッチ周期Lagが所定値以上である場
合には、以前のピッチ再生処理結果をそのまま使用する
ことにより、演算量の削減を図るようにした。
【0050】具体的には、まず、ピッチ判定処理部8に
おいて、ピッチ周期Lagとkパラメータとが、Lag
>62+k を満たす場合には、2回目のピッチ再生
処理を、次式(10)(11)に従って、Lag+1、
Lag、Lag−1の順に行う。k=2の場合には、2
回目、3回目のピッチ再探索処理を、同様にして行うこ
ととなる。
【0051】
【数10】
【0052】
【数11】 一連のピッチ再生処理でこのコンボリューションは、式
(4)と式(5)により、5回行われるが、それらのコ
ンボリューションデータは、順次メモリ9に格納され
る。このメモリ9に格納された前回のコンボリューショ
ンデータを、今回のコンボリューション処理で利用す
る。
【0053】つまり、コンボリュウションデータはピッ
チ予測フィルタのタップ構成に合わせて、1サンプルづ
つシフトした形で切り出されるため、前回の第4コンボ
リュウションデータが今回の第5コンボリュウションで
あり、前回の第3コンボリュウションデータが今回の第
4コンボリュウションであり、前回の第2コンボリュウ
ションデータが今回の第3コンボリュウションであり、
前回の第1コンボリュウションデータが今回の第2コン
ボリュウションとなる。従って、今回の処理で新たに必
要なコンボリュウションデータは、式(5)のl=0の
場合の演算のみを行うことで実現できる。
【0054】図2(a)に示すように、メモリ9上で
は、第2回目の再探索処理において、第1コンボリュー
ションデータのみを新たに演算により算出し、第2コン
ボリューションデータ以降は、第1回目の探索処理で得
た第1コンボリューション乃至第4コンボリューション
データを第2回目の探索データ書込み領域にコピーする
ことにより、演算処理の削減が図られる。
【0055】このような処理により、1830回必要と
する(4)式の積和演算回数を、1サブフレームにおい
て、1回行うのみで実現することができ、精度の高いコ
ンボリューションデータを少ない演算量で迅速に取得で
きる。
【0056】また、データ格納領域を一回の探索処理に
必要な、第1コンボリューションデータ乃至第5コンボ
リューションデータ分の領域のみ用意し、図2(b)に
示すように、まず、不要になる第5コンボリュウション
データ格納エリアに、前回の第4コンボリュウションデ
ータを格納し、その後順次溯ってデータをリライトし、
最後に第1コンボリューションデータを演算により算出
することにより、メモリ領域の削減を図ることができ
る。
【0057】つまり、コンボリュウション格納エリアを
kパタメータにおける繰り返し回数分であるk個分保有
しなくとも、繰り返し処理の中で、常に、5次のFIR
で必要になる5個分の最低限のコンボリュウションデー
タ格納エリアのみで、ピッチ予測処理を実行することが
できる。
【0058】以上のようにして求めたコンボリューショ
ンデータをクローズドループピッチ情報としてピッチ再
生処理部に帰還してピッチ再生処理を行い、再度線形予
測合成フィルタ2に設定されたフィルタ係数でコンボリ
ューション処理する。このような処理をkパラメータで
設定された回数分繰り返して実行することにより、乗算
器5に入力するピッチ再生音源列t'[n]の精度は向
上する。
【0059】なお、以上は、Lag >62+k を満
たす場合について説明したが、Lag ≦62+k の
場合には、kパタメータにおける繰り返し回数分である
k+1回、1830回必要とする(4)式の積和演算処
理を毎回、演算する必要がある。
【0060】(実施の形態2)以下、本発明の実施の形
態2に係る音声符号化装置を、図3に沿って説明する。
【0061】実施の形態2は、ピッチ再生処理部2の後
段にピッチ再生音源列t'[n]を一時記憶するメモリ
10設けることにより、kパタメータの設定回数分の繰
り返しピッチ再生処理を行わないようにした。
【0062】実施の形態1と同様に、ピッチ判定処理に
より、Lag >62+k の条件を満たす場合に、次
式(12)(13)により、一度に、kパラメータにお
ける繰り返し回数分であるk+1個分のピッチ再生音源
列を取得することができる。
【0063】
【数12】
【0064】
【数13】 これにより、ピッチ再生処理部2のピッチ再生処理をk
パラメータにおける繰り返し回数分行う必要がなくなる
ため、乗算器3により、第1コンボリューションデータ
乃至第5コンボリューションデータを連続的に生成する
ことができ、演算処理の負担が軽減される。
【0065】
【発明の効果】以上の説明から明らかなように、本発明
は、ピッチ判定処理を行うとともに、コンボリューショ
ンデータをメモリ上で操作することにより、kパラメー
タにおける繰り返し回数の都度複数回必要であった積和
演算処理(コンボリュウション)を、1回の処理のみで
実現可能になるので、CPUにおける演算量を削減する
ことができるという効果を奏する。
【0066】また、k個分のピッチ再生音源列を格納す
るエリアを保有することにより、ピッチ再生処理をkパ
ラメータにおける繰り返し回数分行う必要がなくなるの
で、CPUにおける演算量を削減することができる。
【図面の簡単な説明】
【図1】本発明に係る実施の形態1の音声符号化装置の
ピッチ予測部のブロック図
【図2】実施の形態1の音声符号化装置のコンボリュー
ションデータを格納するメモリの模式図
【図3】本発明に係る実施の形態2の音声符号化装置の
ピッチ予測部のブロック図
【図4】従来の音声符号化装置のピッチ予測部のブロッ
ク図
【図5】ピッチ再生音源列生成の状態を示す模式図
【符号の説明】 1 ピッチ再生処理部 2 線形予測合成フィルタ(インパルス応答列) 3 乗算器 4 ピッチ予測フィルタ 5 乗算器 6 コードブック 7 加算器 8 ピッチ判定処理部 9,10 メモリ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 ピッチ再生処理手段で音源パルス列から
    抽出したピッチ再生音源パルス列と線形予測合成フィル
    タ係数とのコンボリューション処理後のデータを格納す
    るメモリを具備し、再度コンボリューション処理を繰り
    返す場合に、前コンボリューションデータの一部を現コ
    ンボリューションデータ格納領域に書き込むメモリ制御
    を実行し、前記現コンボリューションデータを使用して
    ピッチ予測処理を実行することを特徴とする音声符号化
    装置。
  2. 【請求項2】 メモリは一回のコンボリューション処理
    に必要な領域を有して成り、前コンボリューションデー
    タの一部を現コンボリューションデータ格納領域に書き
    込むメモリ制御を、各コンボリューションデータを順次
    シフトすることにより実行することを特徴とする請求項
    1記載の音声符号化装置。
  3. 【請求項3】 ピッチ再生処理手段からのピッチ再生音
    源パルス列を一時記憶するメモリを具備し、一時記憶さ
    れたピッチ再生音源パルス列を用いてコンボリューショ
    ン処理を連続的に実行することを特徴とする請求項1又
    は請求項2記載の音声符号化装置。
  4. 【請求項4】 ピッチ再生処理手段で音源パルス列から
    抽出したピッチ再生音源パルス列と線形予測合成フィル
    タ係数とのコンボリューション処理後のデータをメモリ
    に一時記憶し、再度コンボリューション処理を繰り返す
    場合に、前記メモリに一時記憶された前コンボリューシ
    ョンデータの一部を現コンボリューションデータとして
    使用することによりコンボリューション処理回数を削減
    することを特徴とする音声符号化におけるピッチ予測方
    法。
  5. 【請求項5】 ピッチ再生処理手段からの再生音源パル
    ス列を第1メモリに一時記憶し、一時記憶された再生音
    源パルス列を用いて線形予測合成フィルタ係数とのコン
    ボリューション処理を連続的に実行し、前記コンボリュ
    ーション処理後のデータを第2メモリに一時記憶し、再
    度コンボリューション処理を繰り返す場合に、前記第2
    メモリに一時記憶された前コンボリューションデータの
    一部を現コンボリューションデータとして使用すること
    によりコンボリューション処理回数を削減することを特
    徴とする音声符号化におけるピッチ予測方法。
JP27373897A 1997-09-20 1997-09-20 音声符号化装置及び音声符号化におけるピッチ予測方法 Expired - Fee Related JP3263347B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP27373897A JP3263347B2 (ja) 1997-09-20 1997-09-20 音声符号化装置及び音声符号化におけるピッチ予測方法
US09/153,299 US6243673B1 (en) 1997-09-20 1998-09-15 Speech coding apparatus and pitch prediction method of input speech signal
DE69822579T DE69822579T2 (de) 1997-09-20 1998-09-17 Vorrichtung zur Sprachcodierung und Langzeitprädiktion eines eingegebenen Sprachsignals
EP98117652A EP0903729B1 (en) 1997-09-20 1998-09-17 Speech coding apparatus and pitch prediction method of input speech signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27373897A JP3263347B2 (ja) 1997-09-20 1997-09-20 音声符号化装置及び音声符号化におけるピッチ予測方法

Publications (2)

Publication Number Publication Date
JPH1195799A true JPH1195799A (ja) 1999-04-09
JP3263347B2 JP3263347B2 (ja) 2002-03-04

Family

ID=17531887

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27373897A Expired - Fee Related JP3263347B2 (ja) 1997-09-20 1997-09-20 音声符号化装置及び音声符号化におけるピッチ予測方法

Country Status (4)

Country Link
US (1) US6243673B1 (ja)
EP (1) EP0903729B1 (ja)
JP (1) JP3263347B2 (ja)
DE (1) DE69822579T2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4857468B2 (ja) * 2001-01-25 2012-01-18 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
JP3582589B2 (ja) * 2001-03-07 2004-10-27 日本電気株式会社 音声符号化装置及び音声復号化装置
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US8352841B2 (en) * 2009-06-24 2013-01-08 Lsi Corporation Systems and methods for out of order Y-sample memory management

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5195168A (en) * 1991-03-15 1993-03-16 Codex Corporation Speech coder and method having spectral interpolation and fast codebook search
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5179594A (en) * 1991-06-12 1993-01-12 Motorola, Inc. Efficient calculation of autocorrelation coefficients for CELP vocoder adaptive codebook
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
FR2700632B1 (fr) * 1993-01-21 1995-03-24 France Telecom Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués.
JP3209248B2 (ja) 1993-07-05 2001-09-17 日本電信電話株式会社 音声の励振信号符号化法
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
WO1997014139A1 (fr) 1995-10-11 1997-04-17 Philips Electronics N.V. Methode et dispositif de prediction de signal pour un codeur de parole

Also Published As

Publication number Publication date
EP0903729A3 (en) 1999-12-29
JP3263347B2 (ja) 2002-03-04
EP0903729B1 (en) 2004-03-24
DE69822579T2 (de) 2004-08-05
EP0903729A2 (en) 1999-03-24
US6243673B1 (en) 2001-06-05
DE69822579D1 (de) 2004-04-29

Similar Documents

Publication Publication Date Title
KR101370017B1 (ko) Celp 기술에서의 디지털 오디오 신호의 개선된 코딩/디코딩
JP2657927B2 (ja) 音声を符号化するための方法及び装置
US8538747B2 (en) Method and apparatus for speech coding
WO1992016930A1 (en) Speech coder and method having spectral interpolation and fast codebook search
JP4008607B2 (ja) 音声符号化/復号化方法
JP3263347B2 (ja) 音声符号化装置及び音声符号化におけるピッチ予測方法
JPH1097294A (ja) 音声符号化装置
JP3095133B2 (ja) 音響信号符号化方法
JP3285185B2 (ja) 音響信号符号化方法
JPH0764600A (ja) 音声のピッチ符号化装置
JPH11119800A (ja) 音声符号化復号化方法及び音声符号化復号化装置
JP3002299B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3293709B2 (ja) 励振信号直交化音声符号化法
JPH11296195A (ja) 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JP4191502B2 (ja) 信号符号化方法、およびこれらの装置、並びに信号符号化プログラム
JP3095769B2 (ja) Vselp符号化器
JP3229784B2 (ja) 音声符号化復号化装置及び音声復号化装置
JPH11119799A (ja) 音声符号化方法および音声符号化装置
JPH08248995A (ja) 音声符号化方法
JP2844672B2 (ja) 声帯声道型音声分析装置
JPH1020889A (ja) 音声符号化装置および記録媒体
JPH1078799A (ja) コードブック
JPH06177776A (ja) 音声符号化制御方式
JPH06130997A (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071221

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081221

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081221

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081221

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091221

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091221

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees