JPH1124699A - 音声符号化方法及び装置 - Google Patents

音声符号化方法及び装置

Info

Publication number
JPH1124699A
JPH1124699A JP10113808A JP11380898A JPH1124699A JP H1124699 A JPH1124699 A JP H1124699A JP 10113808 A JP10113808 A JP 10113808A JP 11380898 A JP11380898 A JP 11380898A JP H1124699 A JPH1124699 A JP H1124699A
Authority
JP
Japan
Prior art keywords
frame
lag
pitch
autocorrelation function
weighting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10113808A
Other languages
English (en)
Inventor
Ari Lakaniemi
ラカニエミ アリ
Janne Vainio
バイニオ ジャン
Pasi Ojala
オジャラ パシー
Petri Haavisto
ハーヴィスト ペトリ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FI971976A external-priority patent/FI971976A/fi
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of JPH1124699A publication Critical patent/JPH1124699A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 サンプリングされた音声信号を長時間予測
(LTP)を使用して音声符号化する方法と装置とを提
供する。 【解決手段】 信号中のフレームについて所定の最大遅
延及び最小遅延の間の自己相関関数を始めに決定するこ
とによって、この音声信号の各フレームについてLTP
ピッチ−ラグ・パラメータを決定する。最も最近の有声
フレームについて決定されたピッチ−ラグ・パラメータ
の近辺の遅延について前記自己相関関数を強調するため
に、前記自己相関関数に重み付けをする。この重み付け
された自己相関関数の最大値を発見して、それをそのフ
レームについてのピッチ−ラグ・パラメータと認定す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声符号化に関
し、特に、長時間予測(long term prediction (LTP))
パラメータを使用する音声符号化方法及び装置に関す
る。
【0002】
【従来の技術】送信され、処理され、或いは記憶される
データの量を減らすために可聴音声信号を圧縮すること
が望ましい多くの通信アプリケーションで音声符号化が
行われる。特に、音声信号に対して符号化及び復号化を
実行するいわゆる音声符復号器が移動電話及び通信基地
コントローラ局に設けられるセルラー電話通信網におい
て音声符号化が広く行われている。セルラー電話通信網
においては通信網の通話容量をなるべく大きくする必要
があるために、音声符号化によるデータ圧縮が必要であ
る。
【0003】最新の音声符号器は、通常、フレームと呼
ばれる短いセグメントを成す音声信号を処理するように
なっている。GSMとして知られている欧州デジタルセ
ルラー電話システム(欧州通信規格協会(ETSI)仕様0
6.60により定義されている)の場合、各フレームの
長さは20msであり、これは8kHzのサンプリング
周波数で160音声サンプルに相当する。送信局で、受
信局に送信される符号化パラメータの集合を抽出するた
めに音声符号器により各音声フレームが分析される。受
信局では、受信したパラメータに基づいて復号器が合成
音声フレームを作る。抽出された符号化パラメータの典
型的集合は、信号の短時間予測に使われるスペクトル・
パラメータ(LPCパラメータとして知られている)、
信号の長時間予測に使われるパラメータ(LTPパラメ
ータとして知られている)、種々の利得パラメータ、励
起パラメータ、及びコードブック・ベクトルを含む。
【0004】図1はいわゆるCELP符復号器の符号器
の概略を示している(実質的に同一のCELP符復号器
が移動局と基地コントローラ局との両方に設けられ
る)。受信されサンプリングされた音声信号s(n)(nは
サンプルの番号を意味する)の各フレームは、始めにこ
のフレームについてLPCパラメータを決定するために
短時間予測ユニット1によって分析される。それらのパ
ラメータはマルチプレクサ2に供給され、このマルチプ
レクサは、符号化パラメータ同士をエアインターフェー
スを介して送信するために結合させる。短時間予測ユニ
ット1からの残差信号r(n)、即ち短時間冗長性が除去さ
れた後の音声フレームは、LTPパラメータを決定する
長時間予測ユニット3に供給される。それらのパラメー
タはマルチプレクサ2に供給される。
【0005】この符号器は、LTPパラメータ及びLP
Cパラメータをそれぞれ受け取るLTP合成フィルタ4
及びLPC合成フィルタ5を有する。これらのフイルタ
は、コードブック6を使って作られた信号c(n)に短時間
冗長性及び長時間冗長性を導入して合成音声信号ss(n)
を作る。この合成音声信号は、エラー信号e(n)を作るた
めに比較器7において現実の音声信号s(n)とフレーム毎
に比較される。重み付けフイルタ8(これは信号の‘フ
ォルマント’を公知のように強調する)でエラー信号が
重み付けされた後、この信号はコードブック検索ユニッ
ト9に入力される。検索ユニット9は、各フレームにつ
いてコードブック6を検索して、このコードブックの中
の、実際の音声フレームと最もよく一致する項目を特定
する、即ちエラー信号e(n)を最小にする信号c(n)を判定
する。最もよく一致する項目を特定するベクトルが、符
号化された音声信号t(n)の一部分としてエアインターフ
ェースを介して送信されるべくマルチプレクサ2に供給
される。
【0006】図2は、CELP符復号器の復号器を略図
示している。受信された符号化されている信号t(n)はデ
マルチプレクサ11により多重化解除されて別々の符号
化パラメータにされる。コードブック・ベクトルは、コ
ードブック項目c(n)の列を抽出するために、符号器のコ
ードブック6と同一のコードブック12に入力される。
直列に配置されているLTP合成フイルタ14及びLP
C合成フイルタ15に入力される前に、受信された利得
gが乗算器13においてその信号c(n)に乗じられる。L
TPフイルタ及びLPCフイルタは関連するパラメータ
を伝送チャネルから受け取って、この信号に短時間冗長
性及び長時間冗長性を再導入して出力に合成音声信号ss
(n) を作る。
【0007】LTPパラメータは、音声信号の基本周波
数を記述するいわゆるピッチ−ラグ・パラメータを含ん
でいる。残差信号の現在のフレームについてのピッチ−
ラグの決定は2段階で実行される。始めに、信号の、現
在のフレームと最もよく一致する部分について、所定の
最大遅延及び最小遅延を仮定して、残差信号の割合に粗
い検索を含む開ループ検索が行われる。次に、既に合成
された信号に対して閉ループ検索が行われる。この閉ル
ープ検索は、ピッチ−ラグの開ループ推定値の近辺で遅
延の小さな範囲にわたって行われる。開ループ検索で間
違いがあると、その間違いを閉ループ検索で訂正するこ
とはできないことに注意するべきである。
【0008】初期の符復号器では、開ループLTP分析
は、残差音声信号の中のフレームの自己相関関数:
【数4】 を決定することによって残差信号の与えられたフレーム
についてピッチ−ラグを決定する。ここでdは遅延であ
り、r(n)は残差信号であり、dL 及びdH は遅延検索限
界である。Nはフレームの長さである。自己相関関数R
^(d) の最大値に対応する遅延dmax としてピッチ−ラ
グdplを特定することができる。それが図3に示されて
いる。
【0009】
【発明が解決しようとする課題】しかし、この様な符復
号器では、自己相関関数の最大値がピッチ−ラグの整数
倍又は約数と一致し、従ってピッチ−ラグの推定値が正
しくなくなる可能性がある。ヨーロッパ特許出願EP0628
947 は、自己相関関数R^(d) に重み関数w(d)をかけ
る:
【数5】 ことによってこの問題に対処しており、この重み関数は
次の形:
【数6】 を持っており、ここでKはR^W (d) の最大値がピッチ
−ラグの倍数となる確率を減少させるのに充分な程度に
小さく且つ同時にピッチ−ラグの約数を除外するのに充
分な程度に大きい値に設定される調整パラメータであ
る。
【0010】EP0628947 は、現在のフレームについてピ
ッチ−ラグを決定するのに前のフレームについて決定さ
れたピッチ−ラグを考慮することも提案している。より
具体的には、フレームは‘有声’又は‘無声’に分類さ
れ、最も最近の有声フレームについて決定されたピッチ
−ラグの近辺で最大値を探す検索が実行される。もしR
W (d) の全体としての最大値がこの近辺の外側にあ
り、且つこの近辺での最大値を所定のファクタ(3/
2)より大きくは上回らなければ、その近辺での最大値
がピッチ−ラグに相当するものと認められる。この様に
してピッチ−ラグ推定の連続性が保たれて、ピッチ−ラ
グが擬似的に変化する可能性が減少する。
【0011】
【課題を解決するための手段】本発明は、一面において
は、サンプリングされた信号をこの信号のフレームの系
列の中の各フレームについてピッチ−ラグ・パラメータ
を使って音声符号化する方法を提供するものであり、こ
の方法は、各フレームについて:信号中のフレームにつ
いて所定の最大遅延と最小遅延との間の自己相関関数を
決定し;前のフレームについて決定されたピッチ−ラグ
・パラメータの近辺での遅延についてその自己相関関数
を強調するためにこの自己相関関数に重み付けをし;重
み付けされた自己相関関数の最大値に対応する遅延を前
記フレームのピッチ−ラグ・パラメータと認定するステ
ップを有する。
【0012】好ましくは、前記サンプリングされた信号
は、オーディオ信号から短時間冗長性を実質的に除去す
ることによってオーディオ信号から得られる残差信号で
ある。或いは、サンプリングされた信号はオーディオ信
号であってもよい。
【0013】好ましくは、前記重み付けは、自己相関関
数を下記の形:
【数7】 を有する重み付け関数と結合させることによって達成さ
れ、ここでTprevは1つ以上前のフレームに基づいて決
定されたピッチ−ラグ・パラメータであり、dLは前記
最小遅延であり、Knwは近辺の重み付けを画定する調整
パラメータである。また、重み付け関数は、長い遅延に
対して相対的に短い遅延について自己相関関数を強調し
てもよい。この場合、下記の修正された重み付け関数:
【数8】 が使用され、ここでKw は別の調整パラメータである。
【0014】本発明の或る実施例では、Tprevは、前の
1つのフレームTold のピッチ−ラグである。しかし、
他の実施例では、Tprevは、前の数個のフレームのピッ
チ−ラグから導出される。具体的には、Tprevは、所定
数の前のフレームのピッチ−ラグの中央値に相当するこ
とができる。前記中央値を決定するのに使われるn個の
ピッチ−ラグの標準偏差に反比例する別の重み付けを行
ってもよい。この方法を使用すれば、自己相関関数の重
み付けに対する間違っているピッチ−ラグ値の影響を減
少させることができる。
【0015】好ましくは、この方法は、前記フレームを
有声フレーム及び非有声フレームに分類するステップを
有し、前記前のフレームは最も最近の有声フレームであ
る。非有声フレームは無声フレームと、静寂又は暗騒音
を含むフレームとを含むことができる。より好ましく
は、もし前記前のフレームが最も新しいフレームでなけ
れば、重み付けは簡略化される。1実施例では、連続す
る非有声フレームの系列が受信されたときには、その系
列中の非有声フレームの個数に実質的に比例するように
重み付けを縮小する。前節で提示した重み付け関数Wn
(d) については、調整パラメータKnwを次のように修正
することができる:
【数9】 ここでAは連続する非有声フレームの系列の中の各フレ
ームが受信された後に大きくされる、もう一つの調整因
数である。重み付けは、次の有声フレームについては、
Aをその最小値に戻すことによって、その最大値に戻さ
れる。Aの値を同様に有声フレームの受信後に大きくす
ることができ、それは所定しきい利得より小さい開ルー
プ利得をもたらす。
【0016】本発明は、第2の面においては、サンプリ
ングされた信号を、この信号のフレーム列の各々につい
てピッチ−ラグ・パラメータを使って音声符号化するた
めの装置を提供するものであり、この装置は:各フレー
ムについて、信号中のフレームの、所定の最大遅延及び
最小遅延の間の自己相関関数を決定するための手段と;
前のフレームについて決定されたピッチ−ラグ・パラメ
ータの近辺の遅延について前記自己相関関数を強調する
ために前記自己相関関数に重み付けをするための重み付
け手段と;その重み付けされた自己相関関数の最大値に
対応する遅延を前記フレームについてのピッチ−ラグ・
パラメータと認定するための手段とを有する。
【0017】本発明は、第3の面においては、本発明の
上記第2面による装置を有する移動通信装置を提供する
ものである。
【0018】本発明は、第4の面においては、本発明の
上記第2面による装置を有する基地コントローラ局から
なるセルラー電話通信網を提供するものである。
【0019】本発明をよりよく理解してもらい、本発明
の実施方法を示すために、例として添付図面を参照す
る。
【0020】
【発明の実施の形態】サンプリングされた音声信号のフ
レームについてのピッチ−ラグ・パラメータの開ループ
予測に使用される方法及び装置について説明をする。こ
の方法の主なステップは、図4の流れ図に示されてい
る。ここで説明する方法及び装置は、図1を参照して既
に説明したCELP符復号器などの、その他の点では従
来通りに構成された音声符復号器に組み込まれ得るもの
である。
【0021】サンプリングされた、符号化されるべき音
声信号は、一定の長さのフレームに分割される。既に説
明したように、受信されたとき、フレームは始めにLP
C予測ユニット1に入力される。通常、元の音声信号
の、LPC予測が行われて該信号の短時間冗長性が抜き
取られた後に残っている部分である残差信号に対して開
ループLTP予測が行われる。この残差をr(n)で表わす
ことができ、このnはサンプル番号を示す。自己相関関
数はフレームについて:
【数10】 によって決定され、ここでw(d) は、下記の式:
【数11】 で与えられる重み付け関数であり、Told は、最も最近
に受信され、処理された有声フレームについて決定され
たピッチ−ラグであり、n、N、dL 、dH は上で定義
されている。Knw及びKは、通常は0.85の値を有す
る調整パラメータである。追加の調整パラメータAにつ
いては後で説明する。
【0022】フレームについて開ループLTPパラメー
タが決定された後、そのフレームは(パラメータTold
を式(2)で使用するためにフィードバックできるよう
に)有声又は無声に分類される。この分類は、いろいろ
な方法で行われ得るものである。1つの適当な方法は、
開ループLTP利得bを決定して、このbを何らかの所
定しきい利得と、或いはより好ましくは下記の式: bthr =(1−α) Kb b+αbthr-1 {3} で与えられる適応しきい利得bthr と比較するという方
法であり、ここでαは減衰定数(0.995)であり、
b はスケールファクター(0.15)である。項b
thr-1 は、直前のフレームについて決定されたしきい利
得である。フレームを有声又は無声に分類するためのも
う一つの基準、或いは追加の基準は、前記フレーム内で
の残差信号の‘ゼロ・クロッシング’率を決定すること
である。クロッシング率が割合に高いことは、フレーム
が無声であることを示し、クロッシング率が低いことは
そのフレームが有声であることを示す。適当なしきい値
は、フレームの長さNの3/4 である。
【0023】フレームを有声又は無声に分類するための
もう一つの或いは追加の基準は、ピッチ−ラグが変化す
る速度である。フレームについて決定されたピッチ−ラ
グが最近のフレームの集合について決定された’平均’
ピッチ−ラグから著ぢるしくずれているならば、そのフ
レームを無声フレームに分類することができる。ずれが
比較的に小さければ、そのフレームは有声フレームに分
類することができる。
【0024】{2}により与えられる重み付け関数wn
(d) は、重み付けされた自己相関関数R^W (d) を旧ピ
ッチ−ラグTold の近辺で強調させる第1項
【数12】 を有する。式{2}の左辺の第2項
【数13】 は、小さなピッチ−ラグ値を強調させる。これら2つの
項の組み合わせは、正しいピッチ−ラグの倍数又は約数
が重み付けされている自己相関関数の最大値を生じさせ
る可能性を著しく低下させるのに役立つ。
【0025】もし、現在のフレームi についてのピッチ
−ラグが決定された後に、そのフレームが有声に分類さ
れ、そのフレームについての開ループ利得が何らかのし
きい値(例えば0.4)より大きいと判定されたなら
ば、式{2}の中の調整因数Aは次のフレーム(i+1)に
ついては1にセットされる。しかし、現在のフレームが
無声に分類され、或いは開ループ利得がしきい値より小
さいと判定されたならば、調整因数は下記のように修正
される: Ai+1 = 1.01Ai {4}
【0026】連続する無声フレーム列中の各無声フレー
ム(或いは、開ループ利得がしきい値より小さい場合に
は、有声フレーム)について式{4}に従って調整因数
Aを修正することができる。しかし、所定数の連続する
無声フレームが受信された後に、例えばこの連続する無
声フレームの集合が受信される毎に、はじめて式{4}
を適用するのが好ましい。組み合わせ重み付け因数Knw
Aの上限が1.0である場合には近辺の重み付け因数K
nwは通常は0.85にセットされ、その限界値では重み
付けは全ての遅延d=dL 〜dH で均一である。
【0027】或いは、所定数(例えば3個)の重み付け
関数w(d)だけを使用してもよい。各関数にはしきいレベ
ルが割り当てられ、例えば{4}で定義されている項な
どの適応項がそのしきいレベルを超えたときにはそれら
の関数のうちの特定の1つが選択される。限られた数の
重み付け関数を定義することの利点は、定義された関数
をメモリーに記憶させることができることである。従っ
て、新しいフレームの各々について重み付け関数を計算
し直す必要はなくなる。
【0028】上記の方法を実行するための簡単なシステ
ムが図5に略図示されており、ここでシステムへの入力
16は、LPC予測ユニット1から供給される残差信号
である。残差信号16は、残差信号の各フレームについ
て相関関数を作成するフレーム相関器17に供給され
る。各フレームについての相関関数は第1重み付けユニ
ット18に入力され、このユニットは式 2 の第2項、
即ち
【数14】 に従ってその相関関数に重み付けをする。その重み付け
された関数は第2重み付けユニット19に入力され、こ
のユニット19は式{2}の第1項、即ち
【数15】 に従って前記相関関数に付加的な重み付けを行う。パラ
メータTold はバッファ20で保管され、このバッファ
は、分類ユニット21が現在のフレームを有声フレーム
に分類する場合に限って、システムの出力によって更新
される。重み付けされた相関関数は検索ユニット22に
入力され、このユニットは、重み付けされた関数の最大
値を特定し、その最大値から現在のフレームのピッチ−
ラグを決定する。
【0029】本発明の範囲から逸脱することなく上記の
実施例に様々な修正を加え得ることを専門家は認めるで
あろう。特に、最も最近の有声フレームについて得られ
た間違ったピッチ−ラグ推定が現在の推定をあまり大幅
に混乱させるのを防止するために、最も最近のn個の有
声フレームについて推定されたピッチ−ラグを記憶する
ように図5のバッファ20を構成することができる(n
は例えば4である)。重み付けユニット19が適用する
重み付け関数は、パラメータTold を、緩衝記憶されて
いるn個のピッチ−ラグの中央値であるパラメータT
med と置き換えることによって修正される。
【0030】別の修正では、ユニット19で適用される
重み付けは、バッファ20に記憶されているn個のピッ
チ−ラグ値の標準偏差に反比例する。これは、緩衝記憶
されているn個のピッチ−ラグ同士の差があまり大きく
ないときにはピッチ−ラグの中央値の近辺での重み付け
を強調し、n個のピッチ−ラグ同士の差が割合に大きい
ときには逆に重み付けの強調を解除するという効果を有
する。例えば、次のように3つの重み付け関数を使用す
ることができる:
【数16】 ここでKm1,Km2,Th1 ,及びTh2 は、例えばそれ
ぞれ0.75,0.95,2,及び6に等しい調整パラ
メータである。ピッチ−ラグが大きいときに生じる標準
偏差の大幅な変動に対処するために、式{5}の中のし
きい値Th1 及びTh2 をピッチ−ラグ中央値Tmed
比例させることができる。
【図面の簡単な説明】
【図1】CELP音声符号器を示す略図である。
【図2】CELP音声復号器を示す略図である。
【図3】符号化されるべき音声信号のフレームと、この
フレームについての自己相関関数を決定するのに使用さ
れる最大遅延及び最小遅延とを示す。
【図4】本発明の実施例の音声符号化方法の主なステッ
プを示す流れ図である。
【図5】図4の方法を実施するためのシステムを示す略
図である。
【符号の説明】
17 フレーム相関器 18、19 重み付けユニット 20 バッファ 21 分類ユニット 22 検索ユニット
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジャン バイニオ フィンランド国 サックスジャービ FI N−33880 ラウリンティエ 16C (72)発明者 パシー オジャラ フィンランド国 サックスジャービ FI N−33880 ラウリンティエ 4D (72)発明者 ペトリ ハーヴィスト フィンランド国 タンペレ FIN− 33580 ヘラカリオンカツ 47

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 サンプリングされた信号をこの信号のフ
    レームの系列の中の各フレームについてピッチ−ラグ・
    パラメータを使って音声符号化する方法であって、各フ
    レームについて:前記信号中のフレームについて所定の
    最大遅延と最小遅延との間の自己相関関数を決定し;前
    のフレームについて決定されたピッチ−ラグ・パラメー
    タの近辺での遅延についてその自己相関関数を強調する
    ためにこの自己相関関数に重み付けをし;重み付けされ
    た自己相関関数の最大値に対応する遅延を前記フレーム
    のピッチ−ラグ・パラメータと認定することを特徴とす
    る方法。
  2. 【請求項2】 前記重み付け関数は下記の形: 【数1】 を持っており、ここでTold は前記前のフレームのピッ
    チ−ラグであり、dL は前記最小遅延であり、Knwは前
    記近辺での重み付けを定義する調整パラメータであるこ
    とを特徴とする請求項1に記載の方法。
  3. 【請求項3】 それぞれの前のフレームについて決定さ
    れた複数のピッチ−ラグの中央値の近辺での遅延を強調
    するように前記自己相関関数に重み付けをすることを特
    徴とする請求項1に記載の方法。
  4. 【請求項4】 前記重み付け関数は下記の形: 【数2】 を持っており、ここでTmed はそれぞれの前のフレーム
    について決定された複数のピッチ−ラグの中央値であ
    り、dL は前記最小遅延であり、Knwは前記近辺での重
    み付けを定義する調整パラメータであることを特徴とす
    る請求項3に記載の方法。
  5. 【請求項5】 前記重み付け関数は、前記の複数のピッ
    チ−ラグの標準偏差に反比例する因数を包含させられる
    ことによって修正されることを特徴とする請求項4項に
    記載の方法。
  6. 【請求項6】 前記重み付けは、更に、長い遅延より短
    い遅延を強調するようになっていることを特徴とする請
    求項1乃至5のいずれかに記載の方法。
  7. 【請求項7】 前記強調は下記の因数: 【数3】 によってもたらされ、ここでKw はもう一つの重み付け
    パラメータであることを特徴とする請求項4項に記載の
    方法。
  8. 【請求項8】 前記フレームを有声フレーム及び非有声
    フレームに分類するステップを含み、前記前のフレーム
    は最も最近の有声フレームであることを特徴とする請求
    項1乃至7のいずれかに記載の方法。
  9. 【請求項9】 前記前のフレーム、又は最も最近の前の
    フレーム、が最も最近のフレームでなければ、重み付け
    は縮小されることを特徴とする請求項8に記載の方法。
  10. 【請求項10】 連続する非有声フレームの列が受信さ
    れた後、その列内のフレームの個数に実質的に比例させ
    て重み付けを縮小することを特徴とする請求項8又は9
    に記載の方法。
  11. 【請求項11】 調整パラメータは下記の形: log2 nwA に修正され、ここでAは、連続する非有声フレームの列
    の各フレームの受信後に、又はその列中の所定の複数の
    フレームの受信後に増大される調整因数であって、次の
    有声フレームについてはその最小値に戻されるようにな
    っていることを特徴とする、請求項2又は4に従属した
    ときの請求項8に記載の方法。
  12. 【請求項12】 サンプリングされた信号をこの信号の
    フレームの系列の中の各フレームについてピッチ−ラグ
    ・パラメータを使って音声符号化する装置であって、こ
    の装置は:各フレームについて該信号内のフレームの所
    定の最大遅延と最小遅延との間の自己相関関数を決定す
    るための手段と;前のフレームについて決定されたピッ
    チ−ラグ・パラメータの近辺での遅延について前記自己
    相関関数を強調するためにこの自己相関関数に重み付け
    をするための重み付け手段と;重み付けされた自己相関
    関数の最大値に対応する遅延を前記フレームのピッチ−
    ラグ・パラメータと認定するための手段とを有すること
    を特徴とする装置。
  13. 【請求項13】 請求項12の装置を有する移動通信装
    置。
  14. 【請求項14】 請求項12に記載の装置を有する基地
    コントローラ局を有するセルラー電話通信網。
JP10113808A 1997-05-07 1998-04-23 音声符号化方法及び装置 Withdrawn JPH1124699A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
FI971976A FI971976A (fi) 1997-05-07 1997-05-07 Puhekoodaus
FI971976 1997-05-07
FI980502A FI113903B (fi) 1997-05-07 1998-03-05 Puheen koodaus
FI980502 1998-03-05

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003350824A Division JP2004038211A (ja) 1997-05-07 2003-10-09 音声符号化方法及び装置

Publications (1)

Publication Number Publication Date
JPH1124699A true JPH1124699A (ja) 1999-01-29

Family

ID=26160386

Family Applications (3)

Application Number Title Priority Date Filing Date
JP10113808A Withdrawn JPH1124699A (ja) 1997-05-07 1998-04-23 音声符号化方法及び装置
JP2003350824A Pending JP2004038211A (ja) 1997-05-07 2003-10-09 音声符号化方法及び装置
JP2009101116A Expired - Lifetime JP4866438B2 (ja) 1997-05-07 2009-04-17 音声符号化方法及び装置

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2003350824A Pending JP2004038211A (ja) 1997-05-07 2003-10-09 音声符号化方法及び装置
JP2009101116A Expired - Lifetime JP4866438B2 (ja) 1997-05-07 2009-04-17 音声符号化方法及び装置

Country Status (10)

Country Link
US (1) US6199035B1 (ja)
EP (1) EP0877355B1 (ja)
JP (3) JPH1124699A (ja)
KR (2) KR100653926B1 (ja)
CN (1) CN1120471C (ja)
AU (1) AU739238B2 (ja)
DE (1) DE69814517T2 (ja)
ES (1) ES2198615T3 (ja)
FI (1) FI113903B (ja)
WO (1) WO1998050910A1 (ja)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415252B1 (en) * 1998-05-28 2002-07-02 Motorola, Inc. Method and apparatus for coding and decoding speech
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6507814B1 (en) * 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
JP3180786B2 (ja) 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
US7117149B1 (en) * 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US7124075B2 (en) * 2001-10-26 2006-10-17 Dmitry Edward Terez Methods and apparatus for pitch determination
KR100463417B1 (ko) * 2002-10-10 2004-12-23 한국전자통신연구원 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8073689B2 (en) 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US8271279B2 (en) * 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7725315B2 (en) * 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
TWI241557B (en) * 2003-07-21 2005-10-11 Ali Corp Method for estimating a pitch estimation of the speech signals
JP4490090B2 (ja) 2003-12-25 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
US7949520B2 (en) * 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US8543390B2 (en) * 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US7610196B2 (en) * 2004-10-26 2009-10-27 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US7716046B2 (en) * 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US7680652B2 (en) 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8284947B2 (en) * 2004-12-01 2012-10-09 Qnx Software Systems Limited Reverberation estimation and suppression system
US7933767B2 (en) * 2004-12-27 2011-04-26 Nokia Corporation Systems and methods for determining pitch lag for a current frame of information
US7386445B2 (en) * 2005-01-18 2008-06-10 Nokia Corporation Compensation of transient effects in transform coding
US8027833B2 (en) * 2005-05-09 2011-09-27 Qnx Software Systems Co. System for suppressing passing tire hiss
US8170875B2 (en) 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
US8311819B2 (en) * 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
US9058812B2 (en) * 2005-07-27 2015-06-16 Google Technology Holdings LLC Method and system for coding an information signal using pitch delay contour adjustment
US8386245B2 (en) * 2006-03-20 2013-02-26 Mindspeed Technologies, Inc. Open-loop pitch track smoothing
US7844453B2 (en) 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US8010350B2 (en) * 2006-08-03 2011-08-30 Broadcom Corporation Decimated bisectional pitch refinement
US7752038B2 (en) * 2006-10-13 2010-07-06 Nokia Corporation Pitch lag estimation
US8335685B2 (en) * 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8386246B2 (en) * 2007-06-27 2013-02-26 Broadcom Corporation Low-complexity frame erasure concealment
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8904400B2 (en) * 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
US8209514B2 (en) * 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466670B (en) 2009-01-06 2012-11-14 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
GB2466669B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466672B (en) 2009-01-06 2013-03-13 Skype Speech coding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
CN102016530B (zh) * 2009-02-13 2012-11-14 华为技术有限公司 一种基音周期检测方法和装置
US8452606B2 (en) 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
US9384759B2 (en) 2012-03-05 2016-07-05 Malaspina Labs (Barbados) Inc. Voice activity detection and pitch estimation
US9020818B2 (en) 2012-03-05 2015-04-28 Malaspina Labs (Barbados) Inc. Format based speech reconstruction from noisy signals
US9437213B2 (en) 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
US9123328B2 (en) * 2012-09-26 2015-09-01 Google Technology Holdings LLC Apparatus and method for audio frame loss recovery
CN110085243B (zh) * 2013-07-18 2022-12-02 日本电信电话株式会社 线性预测分析装置、线性预测分析方法以及记录介质
CN110265058B (zh) 2013-12-19 2023-01-17 瑞典爱立信有限公司 估计音频信号中的背景噪声

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4486900A (en) 1982-03-30 1984-12-04 At&T Bell Laboratories Real time pitch detection by stream processing
JP2585214B2 (ja) * 1986-02-21 1997-02-26 株式会社日立製作所 ピッチ抽出方法
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
JPH04264600A (ja) * 1991-02-20 1992-09-21 Fujitsu Ltd 音声符号化装置および音声復号装置
US5179594A (en) * 1991-06-12 1993-01-12 Motorola, Inc. Efficient calculation of autocorrelation coefficients for CELP vocoder adaptive codebook
US5339384A (en) * 1992-02-18 1994-08-16 At&T Bell Laboratories Code-excited linear predictive coding with low delay for speech or audio signals
FI95085C (fi) 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
FI91345C (fi) 1992-06-24 1994-06-10 Nokia Mobile Phones Ltd Menetelmä kanavanvaihdon tehostamiseksi
CA2102080C (en) * 1992-12-14 1998-07-28 Willem Bastiaan Kleijn Time shifting for generalized analysis-by-synthesis coding
IT1270438B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
JP3321933B2 (ja) * 1993-10-19 2002-09-09 ソニー株式会社 ピッチ検出方法
FI98163C (fi) 1994-02-08 1997-04-25 Nokia Mobile Phones Ltd Koodausjärjestelmä parametriseen puheenkoodaukseen
US5517595A (en) * 1994-02-08 1996-05-14 At&T Corp. Decomposition in noise and periodic signal waveforms in waveform interpolation
JP3418005B2 (ja) * 1994-08-04 2003-06-16 富士通株式会社 音声ピッチ検出装置
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
US5664053A (en) 1995-04-03 1997-09-02 Universite De Sherbrooke Predictive split-matrix quantization of spectral parameters for efficient coding of speech
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures

Also Published As

Publication number Publication date
CN1120471C (zh) 2003-09-03
WO1998050910A1 (en) 1998-11-12
JP4866438B2 (ja) 2012-02-01
ES2198615T3 (es) 2004-02-01
KR20010006394A (ko) 2001-01-26
AU6403298A (en) 1998-11-27
CN1255226A (zh) 2000-05-31
KR100653932B1 (ko) 2006-12-04
KR100653926B1 (ko) 2006-12-05
FI113903B (fi) 2004-06-30
EP0877355A2 (en) 1998-11-11
EP0877355A3 (en) 1999-06-16
DE69814517D1 (de) 2003-06-18
JP2004038211A (ja) 2004-02-05
FI980502A (fi) 1998-11-08
AU739238B2 (en) 2001-10-04
US6199035B1 (en) 2001-03-06
JP2009223326A (ja) 2009-10-01
DE69814517T2 (de) 2004-04-08
EP0877355B1 (en) 2003-05-14
FI980502A0 (fi) 1998-03-05
KR20040037265A (ko) 2004-05-04

Similar Documents

Publication Publication Date Title
JP4866438B2 (ja) 音声符号化方法及び装置
JP3197155B2 (ja) ディジタル音声コーダにおける音声信号ピッチ周期の推定および分類のための方法および装置
US6202046B1 (en) Background noise/speech classification method
US7680651B2 (en) Signal modification method for efficient coding of speech signals
RU2419891C2 (ru) Способ и устройство эффективной маскировки стирания кадров в речевых кодеках
EP1338003B1 (en) Gains quantization for a celp speech coder
EP1132892A1 (en) Voice encoder and voice encoding method
JPH0863200A (ja) 線形予測係数信号生成方法
EP1922718A2 (en) Method and apparatus for coding an information signal using pitch delay contour adjustment
KR20010090803A (ko) 과다-샘플된 합성 광대역 신호를 위한 고주파 내용 복구방법 및 디바이스
US6272459B1 (en) Voice signal coding apparatus
US6937979B2 (en) Coding based on spectral content of a speech signal
US5926785A (en) Speech encoding method and apparatus including a codebook storing a plurality of code vectors for encoding a speech signal
US7302385B2 (en) Speech restoration system and method for concealing packet losses
AU727706B2 (en) Repetitive sound compression system
JPH0830299A (ja) 音声符号化装置
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030610

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20040427