JPH064099A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH064099A
JPH064099A JP4184791A JP18479192A JPH064099A JP H064099 A JPH064099 A JP H064099A JP 4184791 A JP4184791 A JP 4184791A JP 18479192 A JP18479192 A JP 18479192A JP H064099 A JPH064099 A JP H064099A
Authority
JP
Japan
Prior art keywords
value
output
maximum value
maximum
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4184791A
Other languages
English (en)
Other versions
JP2772598B2 (ja
Inventor
Osamu Watanabe
治 渡辺
Seiji Sasaki
誠司 佐々木
Hiroki Goto
裕樹 後藤
Masayasu Miyake
正泰 三宅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kokusai Electric Corp
Original Assignee
Kokusai Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Electric Corp filed Critical Kokusai Electric Corp
Priority to JP4184791A priority Critical patent/JP2772598B2/ja
Publication of JPH064099A publication Critical patent/JPH064099A/ja
Application granted granted Critical
Publication of JP2772598B2 publication Critical patent/JP2772598B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】分析・合成方式の音声符号化装置のピッチ周期
抽出の誤判定による復元音声の聴感上の不快感を軽減す
る。 【構成】正規化された(N−1)個の相関関数を最大値
検出器20に入力してその最大値と最大値を与える指標
とを出力し、最大値が第1の比較器の第1の閾値より大
きいときピッチ周期を出力するとともに、第1の閾値よ
り小さいとき、第2の比較器25と第1の判定器26で
第1の閾値より小さい値に設定された第2の閾値より大
きい場合は前フレームとの指標の差の絶対値が第3の閾
値より小さく、かつ、前フレームがピッチ周期を有する
ときもピッチ周期を出力するように構成した。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、分析・合成形音声符号
化方式における音声符号化装置に関し、特に、音声符号
化装置に用いられ、音源パルスの周期情報を抽出するピ
ッチ周期抽出回路の改良に関するものである。
【0002】
【従来の技術】音声の分析・合成技術として従来良く利
用されている線形予測分析を用いた分析合成形音声符号
化方式について説明する。線形予測分析を使用する音声
分析・合成形音声符号化・復号装置は演算処理を主体に
その機能が実現されることより、DSP(ディジタル信
号処理素子)を主要演算処理のための素子として回路が
実現されている。その場合、取り扱われる量は標本化さ
れ量子化された標本値である。電話通信等の用途に使用
する周波数帯域幅は300Hz〜3.4kHzで十分な
音声品質が得られることが知られている。このことから
音声信号を標本化する周波数は8kHzが標準に使用さ
れる。
【0003】図3は音声符号・復号装置の要部を示すブ
ロック図であり、(A)は符号化装置、(B)は復号装
置である。図3(A)において、音声符号化装置に入力
される標本化・量子化された音声信号はフレーム化処理
器1で適当な長さのフレーム長に区切られる。このフレ
ーム長の値は音声信号が持つスペクトルの変化が概略定
常と見なされる時間間隔として20〜30msecが選
ばれている。フレーム化された音声信号はディジタル信
号処理による線形予測分析器2によって線形予測分析を
施すことにより音声信号の線形予測係数が得られる。線
形予測係数を基に逆フィルタ3によって、フレーム化処
理器1からの信号に処理を施すと残差信号が得られる。
フレーム化された音声信号は音声レベル計算器5により
フレーム毎の音声レベルが出力される。またピッチ周期
抽出回路4によって残差信号の相関係数を求めることに
よりピッチ周期情報が得られる。以上の処理で求められ
た線形予測係数,ピッチ周期,及び音声レベルは音声信
号を表現する特徴パラメータとして符号化され受信側即
ち音声合成を実行する音声復号器に送出される。
【0004】図3(B)において、受信側ではこれらの
パラメータを分離し、ピッチ周期で音源に相当するパル
ス系列をパルス発生器6で生成し、線形予測係数をもと
にして構成される音声合成フィルタ7に入力すること
で、そのフィルタ出力には合成音声が得られる。合成音
声出力に音声レベルに相当する利得係数を音声レベル利
得乗算器8で乗算することにより線形予測分析による復
元音声出力が得られる。以上の処理が線形予測分析によ
る音声符号化・復号方式の概要である。
【0005】次に、本発明で改良しようとするピッチ抽
出に関する従来技術について説明する。従来のピッチ周
期抽出回路4によるピッチ情報の抽出は、残差信号の相
関係数を計算し、それが最大となる相関点を検出し、そ
の最大値の値がある閾値を越えるならばその点に相当す
る周期をピッチ周期として出力していた。図4は従来の
ピッチ周期抽出回路の詳細構成例図である。線形予測逆
フィルタ3からの残差信号は、相関係数計算器11でN
個の相関値R(k)が計算される。第1の相関値であ
るR(0)はR(0)メモリ12に記憶される。第2以
降の相関値R(1),……R(N−1)は除算器13に
よってR(0)で除算処理され、正規化された相関値と
してR(1)メモリ14,R(2)メモリ15,…,R
(N−1)メモリ16に記憶される。これらのR(k)
メモリはN−1個の値を記憶することができる。最大値
検出器17はこれらのN−1個の正規化された相関値R
(k)の中から最大の値を示すkの値Jと相関値R
(J)を検出する。この相関値R(J)は比較器18に
おいて閾値と比較され閾値よりも大きいときはピッチ周
期としてJを出力し、閾値よりも小さい時は無声音を示
す信号を出力する。閾値は通常0.25の近傍の値に選
ばれる。
【0006】
【発明が解決しようとする課題】しかしこのような従来
のピッチ周期抽出回路では、残差信号からピッチ周期を
検出するとき、レベルの大きい母音部分でピッチ周期が
あるにもかかわらずピッチ周期がないと誤判定される場
合があり、復元したときの聴感上の不快感が大きいとい
う欠点がある。本発明の目的は、分析・合成方式の音声
符号化装置におけるピッチ周期抽出の際の検出誤判定を
減らして復元音声の聴感上の不快感を軽減するようにし
た音声符号化装置を提供することにある。
【0007】
【課題を解決するための手段】本発明の音声符号化装置
は、所定の長さのフレームに区切られ標本化・量子化さ
れた音声信号を入力して線形予測係数を出力する線形予
測分析器と、該線形予測分析器の入出力信号から予測残
差信号を求めて出力する逆フィルタと、該予測残差信号
から正規化した(N−1)個の相関値を求めその中の最
大値を検出し該最大値が所定の閾値より大きいときピッ
チ周期を出力するピッチ周期抽出回路と、前記フレーム
に区切られ、標本化,量子化された音声信号から音声レ
ベルを判定して出力する音声レベル計算器とを備え、前
記線形予測係数,ピッチ周期および音声レベルを音声信
号の特徴パラメータとして送出する音声符号化装置にお
いて、前記ピッチ周期抽出回路は、前記正規化相関係数
の最大値と該最大値を与える指標とを出力する最大値検
出器と、該正規化相関係数の最大値を記憶する最大値メ
モリと、該最大値メモリから出力される最大値を第1の
閾値と比較し最大値が該第1の閾値より大きいとき該最
大値を出力する第1の比較器と、前記最大値メモリから
出力される最大値を前記第1の閾値より小さい値に設定
された第2の閾値と比較し最大値が該第2の閾値より大
きいとき該最大値を出力する第2の比較器と、前記第1
の比較器と前記第2の比較器からの出力を比較し前記第
1の閾値と等しいか又は小さく前記第2の閾値より大き
いとき判定出力を出す第1の判定器と、前記最大値検出
器から出力される前記最大値を与える指標を記憶する第
1の最大位置メモリと、該第1の最大位置メモリから出
力される指標を前フレームの指標として記憶する第2の
最大位置メモリと、前記第1の最大位置メモリからの現
在フレームの指標と前記第2の最大位置メモリからの前
フレームの指標とを入力としてその差を求める減算回路
と、該減算回路からの差出力の絶対値を第3の閾値と比
較し差出力の絶対値が第3の閾値より小さいときその判
定結果を出力する絶対値判定器と、前記第1の判定器か
らの判定出力と前フレームの判定結果が記憶されている
結果メモリからの出力とを比較しピッチ周期の有無を判
定する制御信号を出力する第2の判定器と、前記第2の
判定器からの制御信号により前記第1の最大位置メモリ
からの出力が制御されてピッチ周期を出力するゲート回
路とを備えて、前記最大値メモリから出力される最大値
が第1の閾値と比較され最大値が該第1の閾値より大き
いときピッチ周期が出力されるとともに、前記最大値が
前記第1の閾値と等しいか又は小さく前記第2の閾値よ
り大きいとき、前記絶対値判定器からの差出力の絶対値
が前記第3の閾値より小さく、かつ、前フレームがピッ
チ周期を有するとき前記第1の最大位置メモリからの出
力がピッチ周期として出力されるように構成されたこと
を特徴とするものである。
【0008】
【実施例】図1は本発明の実施例を示すブロック図であ
る。図において、相関係数計算器11からR(1)メモ
リ14〜R(N−1)メモリ16までは図4の従来回路
と同じである。本発明では、最大値検出器20から2つ
の信号を出力させる。その一つは、現在フレームを分析
して検出した正規化相関係数の最大値を最大値メモリ2
1に与えて記憶させるもので、その出力は正規化相関係
数R(J(n))そのものである。もう一方の出力は、
現在分析対象としているフレーム“n”の正規化相関係
数の最大値を与える指標J(n)を最大位置メモリ2
2に与えて記憶させるものであり、その出力は指標J
(n)の値である。この最大位置メモリ22の出力は
最大位置メモリ23に入力される。すなわち最大位置
メモリ23は一つ前のフレーム“n−1”の正規化相
関値の最大値R(J(n−1))の指標J(n−1)の
値を記憶する。最大値メモリ21からの最大値の現在の
出力は比較器24と比較器25に入力される。
【0009】比較器24は、最大値R(J(n))と
閾値1とを比較して、最大値が閾値1より大きい時はJ
(n)をピッチ周期として出力する。この処理は従来の
処理と同じである。最大値が閾値1よりも小さい時は最
大値は比較器25で閾値2と比較される。この場合の
閾値2は0.25〜0.20に設定されている。R(J
(n))がこの比較器24の閾値1よりも小さく、比
較器25の閾値2よりも大きい時は、その結果が両者
の出力から判定器26で判定され、判定結果を判定器
29に入力する。最大位置メモリ22と最大位置メ
モリ23の出力は減算回路27で減算され、さらにそ
の絶対値が絶対値判定器28で閾値3と比較され判定結
果が出力される。閾値3は数値の3が設定されている。
この処理は前フレームのピッチ周期に相当する正規化相
関係数の最大点を与える位置と現フレームのピッチ周期
の差が大きいか小さいかを判定する。また判定器29
には、前フレームの判定結果が記憶されている結果メモ
リ30の出力もまた同時に入力される。判定器29はこ
れらの入力からピッチ周期の有無を判定しゲート回路3
1を制御してピッチ周期に相当する最大位置メモリ2
2の値を出力する。
【0010】これらの処理は次のピッチ判定論理に従
う。 1) R(J(N))>R1のときはピッチ有りと判定
し、そのときのピッチ周期=J(N)を出力する。ここ
でR1は閾値1である。 2) R(J(N))≦R1で、R(J(N))>R
2、|J(N)−J(N−1)|≦3、かつ、前フレー
ム(N−1)がピッチ有りのとき、ピッチ有りと判定し
てそのときのピッチ周期=J(N)を出力する。ここで
R2は閾値2である。 3) その他のときはピッチ無しと判定する。ここでN
は分析対象のフレーム番号、J(N)はフレームNで最
大の正規化相関係数を与える指標、R(J(N))は指
標J(N)の時の正規化相関係数である。 これらの処理はマイクロプロセッサを用いて実現でき
る。
【0011】図4は上記判定処理のフローチャートであ
る。このフローチャートにおいて、ステップ41では正
規化相関係数の最大値R(J(N))を検出する。最大
値はステップ42で閾値1と比較され、正規化相関係数
の最大値R(J(N))が閾値1より大きいときはYE
Sのルートを辿りピッチ周期J(N)を出力する。最大
値R(J(N))が閾値1より小さいときはステップ4
3で閾値2と比較され、閾値2より小さいときはピッチ
無しとして次のフレームの処理に移る。最大値R(J
(N))が閾値2より大きいときはステップ44で前フ
レームのピッチの状況を調べ、ピッチが無いときは現フ
レームもピッチ無しと判断して次のフレーム処理に移
る。前フレームのピッチがあるときは、現フレームと前
フレームの指標の比較をステップ45で行い、その差が
閾値3以下の時はピッチが有ると判断しJ(N)をピッ
チ周期として出力して、次のフレーム処理に移る。差が
閾値3を超えたときはピッチ無しと判断し、次のフレー
ム処理に移る。
【0012】
【発明の効果】以上詳細に説明したように、本発明を実
施することにより、ピッチパルス抽出の誤判定が排除さ
れるため、復元音声の聴感上の不快感が軽減され実用上
の効果は大きい。
【図面の簡単な説明】
【図1】本発明の実施例を示すブロック図である。
【図2】本発明のピッチ周期判定抽出処理のフローチャ
ートである。
【図3】本発明を適用する装置のブロック図である。
【図4】従来のピッチ抽出回路のブロック図である。
【符号の説明】
1 フレーム化処理器 2 線形予測分析器 3 線形予測逆フィルタ 4 ピッチ周期抽出回路 5 音声レベル計算器 6 パルス発生器 7 線形予測合成フィルタ 8 音声レベル利得乗算器 11 相関係数計算器 12,14,15,16 メモリ 13 除算器 17 最大値検出器 18 比較器 20 最大値検出器 21 最大値メモリ 22,23 最大位置メモリ 24,25 比較器 26,29 判定器 27 減算回路 28 絶対値判定器 30 結果メモリ 31 ゲート回路 41〜47 ステップ番号
───────────────────────────────────────────────────── フロントページの続き (72)発明者 三宅 正泰 東京都港区虎ノ門二丁目3番13号 国際電 気株式会社内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 所定の長さのフレームに区切られ標本化
    ・量子化された音声信号を入力して線形予測係数を出力
    する線形予測分析器と、該線形予測分析器の入出力信号
    から予測残差信号を求めて出力する逆フィルタと、該予
    測残差信号から正規化した(N−1)個の相関値を求め
    その中の最大値を検出し該最大値が所定の閾値より大き
    いときピッチ周期を出力するピッチ周期抽出回路と、前
    記フレームに区切られ標本化,量子化された音声信号か
    ら音声レベルを判定して出力する音声レベル計算器とを
    備え、前記線形予測係数,ピッチ周期および音声レベル
    を音声信号の特徴パラメータとして送出する音声符号化
    装置において、 前記ピッチ周期抽出回路は、 前記正規化相関係数の最大値と該最大値を与える指標と
    を出力する最大値検出器と、 該正規化相関係数の最大値を記憶する最大値メモリと、
    該最大値メモリから出力される最大値を第1の閾値と比
    較し最大値が該第1の閾値より大きいとき該最大値を出
    力する第1の比較器と、前記最大値メモリから出力され
    る最大値を前記第1の閾値より小さい値に設定された第
    2の閾値と比較し最大値が該第2の閾値より大きいとき
    該最大値を出力する第2の比較器と、前記第1の比較器
    と前記第2の比較器からの出力を比較し前記第1の閾値
    と等しいか又は小さく前記第2の閾値より大きいとき判
    定出力を出す第1の判定器と、 前記最大値検出器から出力される前記最大値を与える指
    標を記憶する第1の最大位置メモリと、該第1の最大位
    置メモリから出力される指標を前フレームの指標として
    記憶する第2の最大位置メモリと、前記第1の最大位置
    メモリからの現在フレームの指標と前記第2の最大位置
    メモリからの前フレームの指標とを入力としてその差を
    求める減算回路と、該減算回路からの差出力の絶対値を
    第3の閾値と比較し差出力の絶対値が第3の閾値より小
    さいときその判定結果を出力する絶対値判定器と、前記
    第1の判定器からの判定出力と前フレームの判定結果が
    記憶されている結果メモリからの出力とを比較しピッチ
    周期の有無を判定する制御信号を出力する第2の判定器
    と、 前記第2の判定器からの制御信号により前記第1の最大
    位置メモリからの出力が制御されてピッチ周期を出力す
    るゲート回路とを備えて、 前記最大値メモリから出力される最大値が第1の閾値と
    比較され最大値が該第1の閾値より大きいときピッチ周
    期が出力されるとともに、 前記最大値が前記第1の閾値と等しいか又は小さく前記
    第2の閾値より大きいとき、前記絶対値判定器からの差
    出力の絶対値が前記第3の閾値より小さく、かつ、前フ
    レームがピッチ周期を有するとき前記第1の最大位置メ
    モリからの出力がピッチ周期として出力されるように構
    成されたことを特徴とする音声符号化装置。
JP4184791A 1992-06-19 1992-06-19 音声符号化装置 Expired - Fee Related JP2772598B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4184791A JP2772598B2 (ja) 1992-06-19 1992-06-19 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4184791A JP2772598B2 (ja) 1992-06-19 1992-06-19 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH064099A true JPH064099A (ja) 1994-01-14
JP2772598B2 JP2772598B2 (ja) 1998-07-02

Family

ID=16159361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4184791A Expired - Fee Related JP2772598B2 (ja) 1992-06-19 1992-06-19 音声符号化装置

Country Status (1)

Country Link
JP (1) JP2772598B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08194499A (ja) * 1995-01-17 1996-07-30 Nec Corp 音声符号化装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08194499A (ja) * 1995-01-17 1996-07-30 Nec Corp 音声符号化装置

Also Published As

Publication number Publication date
JP2772598B2 (ja) 1998-07-02

Similar Documents

Publication Publication Date Title
US6199035B1 (en) Pitch-lag estimation in speech coding
US6188981B1 (en) Method and apparatus for detecting voice activity in a speech signal
JP3423906B2 (ja) 音声の動作特性検出装置および検出方法
EP0677202B1 (en) Discriminating between stationary and non-stationary signals
EP2030199B1 (en) Linear predictive coding of an audio signal
EP1160763B1 (en) Voice detecting method and apparatus
JP3992545B2 (ja) 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ
EP0747879B1 (en) Voice signal coding system
RU2127912C1 (ru) Способ обнаружения и кодирования и/или декодирования стационарных фоновых звуков и устройство для кодирования и/или декодирования стационарных фоновых звуков
JPS62274941A (ja) 音声符号化方式
US5632004A (en) Method and apparatus for encoding/decoding of background sounds
US20020156620A1 (en) Method and apparatus for speech coding with voiced/unvoiced determination
JPH08254994A (ja) 分類化及び輪郭の目録(インベントリー)による音声符号化パラメータの配列の再構成
US4845753A (en) Pitch detecting device
JP3418005B2 (ja) 音声ピッチ検出装置
JP2772598B2 (ja) 音声符号化装置
JP2564821B2 (ja) 音声判定検出装置
JP2656069B2 (ja) 音声検出装置
JP3289512B2 (ja) 無声音検出による自動利得制御装置
GB2430129A (en) Voice activity detector
EP1083548A2 (en) Method for gain control of a CELP speech decoder
JPH06118993A (ja) 有声/無声判定回路
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JPS6039695A (ja) 自動音声アクチビテイ検出方法および装置
JPH0637734A (ja) 音声伝送方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees