JPH02266400A - 有音/無音判定回路 - Google Patents
有音/無音判定回路Info
- Publication number
- JPH02266400A JPH02266400A JP1086860A JP8686089A JPH02266400A JP H02266400 A JPH02266400 A JP H02266400A JP 1086860 A JP1086860 A JP 1086860A JP 8686089 A JP8686089 A JP 8686089A JP H02266400 A JPH02266400 A JP H02266400A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- lpc
- analysis
- distance
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000013598 vector Substances 0.000 claims abstract description 89
- 230000003595 spectral effect Effects 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 abstract description 4
- 206010019133 Hangover Diseases 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 241000270666 Testudines Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は有音/無音判定回路に関し、例えば、音声認識
を目的とする音声区間検出装置に適用し得るものである
。
を目的とする音声区間検出装置に適用し得るものである
。
[従来の技術]
従来、有音/無音判定回路として、第2図のブロック図
に示すものがある(加藤忠晴、西谷隆夫、下山治夫、「
適応閾値型音声検出器」、システム研究会誌CAS84
−238、pp71−18)。
に示すものがある(加藤忠晴、西谷隆夫、下山治夫、「
適応閾値型音声検出器」、システム研究会誌CAS84
−238、pp71−18)。
第2図において、非線形PCM符号化された入力信号は
、符号変換回路1によて振幅の大きさのみを表す絶対値
信号に符号変換され、閾値計算回路2に17−えられて
雑音レベルの計算に用いられる。
、符号変換回路1によて振幅の大きさのみを表す絶対値
信号に符号変換され、閾値計算回路2に17−えられて
雑音レベルの計算に用いられる。
また、絶対値信号は比較回路3にも与えられ、音声信号
有無の判定に用いられる。
有無の判定に用いられる。
閾値計算回路2では、内部の雑音電力算出回路4が絶対
値信号となった入力信号から算出した雑音レベルに応じ
て振幅閾値THI、TH2を発生し、また、音声の有無
に対する内部のヒステリシス回fi’85によるヒステ
リシスをもった閾値TH3を発生する。
値信号となった入力信号から算出した雑音レベルに応じ
て振幅閾値THI、TH2を発生し、また、音声の有無
に対する内部のヒステリシス回fi’85によるヒステ
リシスをもった閾値TH3を発生する。
なお、雑音電力算出回路4が無音時のみ閾値レベルの計
算を行なうように、比較回路6の出力とハングオーバー
回路7の出力で制御する。
算を行なうように、比較回路6の出力とハングオーバー
回路7の出力で制御する。
比較回路3では、絶対値信号となった入力信号と閾値計
算回路2から出力された振幅閾値THI、T1(2とを
比較し、入力信号が閾値TH2よりも大きい場合には+
Cを、閾値TH2より小さく閾値THIより大きい場合
には+bを、また、閾値THIよりも小さい場合には−
aをそれぞれ出力し、累積回路8でその出力を累積する
。
算回路2から出力された振幅閾値THI、T1(2とを
比較し、入力信号が閾値TH2よりも大きい場合には+
Cを、閾値TH2より小さく閾値THIより大きい場合
には+bを、また、閾値THIよりも小さい場合には−
aをそれぞれ出力し、累積回路8でその出力を累積する
。
累積回路8の累積値は、比較回路6によって閾値計算回
路2から出力された判定閾値TH3と比較される。この
判定閾値TH3はヒステリシスを持ち、ハングオーバー
回路7の出力が無音を示している時は高い閾値を、有音
を示している時は低い閾値をとる。
路2から出力された判定閾値TH3と比較される。この
判定閾値TH3はヒステリシスを持ち、ハングオーバー
回路7の出力が無音を示している時は高い閾値を、有音
を示している時は低い閾値をとる。
比較回路6の出力は、ハングオーバー回路7によって、
累積値が閾値TH3より小さくなってもある一定時間音
声検出出力を有音を指示する状態のままとされる。
累積値が閾値TH3より小さくなってもある一定時間音
声検出出力を有音を指示する状態のままとされる。
[発明が解決しようとする課M]
この有音/無音判定回路によれば、背景雑音レベルに応
じて闇値を変化させているので、背景雑音レベルの変動
にも拘らず安定に判定することができる。
じて闇値を変化させているので、背景雑音レベルの変動
にも拘らず安定に判定することができる。
しかしながら、この従来の有音/無音判定回路では、レ
ベル検出法に従っているため、音声信号パワーが背fl
t’a音パワーよりも小さな有音区間、例えば、音声信
号の開始部分や音声信号の終了部分について、無音と誤
って判定してしまう、すなわち、その分だけ本来の有音
区間より短い区間を有“a゛区間判定してしまう。
ベル検出法に従っているため、音声信号パワーが背fl
t’a音パワーよりも小さな有音区間、例えば、音声信
号の開始部分や音声信号の終了部分について、無音と誤
って判定してしまう、すなわち、その分だけ本来の有音
区間より短い区間を有“a゛区間判定してしまう。
本発明は、以上の点を考慮してなされたものであり、音
声信号パワーが背景雑音パワーよりも小さな有a部分を
も正確に判定することができる有音/無音判定特性の優
れた有音/無計判定回路を提供しようとするものである
。
声信号パワーが背景雑音パワーよりも小さな有a部分を
も正確に判定することができる有音/無音判定特性の優
れた有音/無計判定回路を提供しようとするものである
。
し課題を解決するための手段1
かかる課題を解決するため、本発明では、有音/無音判
定回路を以下の各手段で構成した。
定回路を以下の各手段で構成した。
すなわち、標本化された入力信号を所定の分析区間毎に
区分し、各分析区間毎にスペクトル構造を表す特徴パラ
メータベクトルを算出する分析手段と、既に無音判定が
なされた分析区間であって、処理対象となっている分析
区間に時間的に近い複数の分析区間の特徴パラメータベ
クトルを平均化して特徴パラメータ標準ベクトルを算出
する標準ベクトル演算手段とを設けた。また、算出され
た標準ベクトルと、既に無音判定がなされた分析区間で
あって、処理対象となっている分析区間に時間的に近い
複数の分析区間の特徴パラメータベクトルとの距離を算
出する第1の距離演算手段と、この第1の距離演算手段
から出力された複数の距離について、統計量を演算する
統計量演算手段と、分析手段から出力された処理対電分
析区間についての特徴パラメータベクトルと、標準ベク
トル演算手段から出力された標準ベクトルとの距離を演
算する第2の距離演算手段とを設けた。さらに、統計量
演算手段から出力された統計量に基づいて、第2の距離
演算手段から出力された距離を統計的距離に変換する統
計的距離演算手段と、得られた統計的距離を、所定のし
きい値と比較して処理対象分析区間についての有音/無
音判定結果を得る有音/無音判定手段とを設けた。
区分し、各分析区間毎にスペクトル構造を表す特徴パラ
メータベクトルを算出する分析手段と、既に無音判定が
なされた分析区間であって、処理対象となっている分析
区間に時間的に近い複数の分析区間の特徴パラメータベ
クトルを平均化して特徴パラメータ標準ベクトルを算出
する標準ベクトル演算手段とを設けた。また、算出され
た標準ベクトルと、既に無音判定がなされた分析区間で
あって、処理対象となっている分析区間に時間的に近い
複数の分析区間の特徴パラメータベクトルとの距離を算
出する第1の距離演算手段と、この第1の距離演算手段
から出力された複数の距離について、統計量を演算する
統計量演算手段と、分析手段から出力された処理対電分
析区間についての特徴パラメータベクトルと、標準ベク
トル演算手段から出力された標準ベクトルとの距離を演
算する第2の距離演算手段とを設けた。さらに、統計量
演算手段から出力された統計量に基づいて、第2の距離
演算手段から出力された距離を統計的距離に変換する統
計的距離演算手段と、得られた統計的距離を、所定のし
きい値と比較して処理対象分析区間についての有音/無
音判定結果を得る有音/無音判定手段とを設けた。
〔作用]
本発明において、分析手段は、標本化された入力信号を
所定の分析区間毎に区分して各分析区間毎にスペクトル
構造を表す特徴パラメータベクトルを算出する。従来と
は異なり、本発明では、パワー情報ではなく、このよう
にして得られた特徴パラメータベクトルに以下のような
処理を施して有音/無音判定を行なう。
所定の分析区間毎に区分して各分析区間毎にスペクトル
構造を表す特徴パラメータベクトルを算出する。従来と
は異なり、本発明では、パワー情報ではなく、このよう
にして得られた特徴パラメータベクトルに以下のような
処理を施して有音/無音判定を行なう。
この判定には、過去の判定結果、特に、無音判定結果が
得られた分析区間の特徴パラメータベクトルを利用する
。椋準ベクトル演算手段は、既に無音判定がなされた分
析区間であって、処理対象となっている分析区間に時間
的に近い複数の分析区間の特徴パラメータベクトルを平
均化して特徴パラメータ標準ベクトルを算出する。また
、第1の距離演算手段は、算出された標準ベクトルと、
既に無音判定がなされた分析区間であって、処理対象と
なっている分析区間に時間的に近い複数の分析区間の特
徴パラメータベクトルとの距離を算出し、統計量演算手
段は、算出された複数の距離について統計量を演算する
。
得られた分析区間の特徴パラメータベクトルを利用する
。椋準ベクトル演算手段は、既に無音判定がなされた分
析区間であって、処理対象となっている分析区間に時間
的に近い複数の分析区間の特徴パラメータベクトルを平
均化して特徴パラメータ標準ベクトルを算出する。また
、第1の距離演算手段は、算出された標準ベクトルと、
既に無音判定がなされた分析区間であって、処理対象と
なっている分析区間に時間的に近い複数の分析区間の特
徴パラメータベクトルとの距離を算出し、統計量演算手
段は、算出された複数の距離について統計量を演算する
。
上述のように算出された特徴パラメータ標準ベクトルは
、第2の距離算出手段に与えられ、処理対象となってい
る分析区間の特徴パラメータベクトルとの距離が算出さ
れて統計的距離演算手段に与えられる。統計的距離演算
手段には、上述した統計量も与えられており、この統計
量に基づいて、処理対象となっている分析区間の距離を
統計的距離に変換する。
、第2の距離算出手段に与えられ、処理対象となってい
る分析区間の特徴パラメータベクトルとの距離が算出さ
れて統計的距離演算手段に与えられる。統計的距離演算
手段には、上述した統計量も与えられており、この統計
量に基づいて、処理対象となっている分析区間の距離を
統計的距離に変換する。
このようにして得られた統計的距離が有音/無音判定手
段によってしきい値と比較され、対象となっている分析
区間についての判定結果が得られる。
段によってしきい値と比較され、対象となっている分析
区間についての判定結果が得られる。
上述のように、本発明は、判定にスペクトル構造を表す
特徴パラメータベクトルを用い、無音と判定された過去
の分析区間の平均的な特徴パラメータベクトルと、全対
象となっている分析区間の特徴パラメータベクトルとの
相違量(距離)を得て対象分析区間の判定を行なうもの
である。
特徴パラメータベクトルを用い、無音と判定された過去
の分析区間の平均的な特徴パラメータベクトルと、全対
象となっている分析区間の特徴パラメータベクトルとの
相違量(距離)を得て対象分析区間の判定を行なうもの
である。
[実施例J
以下、本発明の一実施例を図面を参照しながら詳述する
。
。
ここで、第1図はこの実施例を示すブロック図である。
且施透辺皿戒
第1図において、入力信号サンプル値列Xがこの有音/
無音判定回路10に与えられる。有音/無音判定回路1
0は、LPC分析部11と、第2のLPCケプストラム
距離演算部12と、LPCケプストラム係数標準ベクト
ル演算部13と、統計的距離演算部14と、統計量演算
部15と、有音/無音判定部16と、パワーバッファメ
モリ部17と、LPG係数ベクトルバッファメモリ部1
8と、第1のLPCケプストラム距離演算部19とで構
成されている。
無音判定回路10に与えられる。有音/無音判定回路1
0は、LPC分析部11と、第2のLPCケプストラム
距離演算部12と、LPCケプストラム係数標準ベクト
ル演算部13と、統計的距離演算部14と、統計量演算
部15と、有音/無音判定部16と、パワーバッファメ
モリ部17と、LPG係数ベクトルバッファメモリ部1
8と、第1のLPCケプストラム距離演算部19とで構
成されている。
LPG分析部11は、入力信号サンプル値列XをN個(
N個のサンプルを分析区間と呼ぶ)ずつ切り出して線形
予測(以下、LPCと呼ぶ)による分析を行ない、対象
となっている分析区間のLPC係数ベクトルaとパワー
Pとを得て出力するものである。
N個のサンプルを分析区間と呼ぶ)ずつ切り出して線形
予測(以下、LPCと呼ぶ)による分析を行ない、対象
となっている分析区間のLPC係数ベクトルaとパワー
Pとを得て出力するものである。
LPG係数係数ベクトルクツ2アメモ9既に無音と判定
された最も新しい1個の分析区間のLPC係数ベクトル
a1 、a2 、・・・、alを格納しておくものであ
る。
された最も新しい1個の分析区間のLPC係数ベクトル
a1 、a2 、・・・、alを格納しておくものであ
る。
LPCケプストラム係数標準ベクトル演算部13は、L
PC係数ベクトルバッファメモリ部8に格納されている
各LPC係数ベクトルa1 、a2、・・・、alのそ
れぞれについてケプストラム係数を演算した後、1個の
分析区間についての同一次数のケプストラム係数の平均
値を得て、各次数の平均値を並べたLPCケプストラム
係数標準ベクトルCを演算するものである。
PC係数ベクトルバッファメモリ部8に格納されている
各LPC係数ベクトルa1 、a2、・・・、alのそ
れぞれについてケプストラム係数を演算した後、1個の
分析区間についての同一次数のケプストラム係数の平均
値を得て、各次数の平均値を並べたLPCケプストラム
係数標準ベクトルCを演算するものである。
第2のLPCケプストラム距雛演算部12は、LPC分
析部11から与えられた対象となっている分析区間のL
PC係数ベクトル2亀についてLPCケプストラム係数
ベクトルを演算した後、LPCケプストラム係数標準ベ
クトル演算部13から与えられた標準ベクトルiとのL
PCケプストラム距離りを演算するものである。
析部11から与えられた対象となっている分析区間のL
PC係数ベクトル2亀についてLPCケプストラム係数
ベクトルを演算した後、LPCケプストラム係数標準ベ
クトル演算部13から与えられた標準ベクトルiとのL
PCケプストラム距離りを演算するものである。
第1のLPCケプストラム距離演算部19は、LPG係
数ベクトルバッファメモリ部18から与えられた最新1
個の無音分析区間のLPG係数ベクトルa1 、a2
、・・・、aIのそれぞれについてLPCケプストラム
係数ベクトルを演算した後、各分析期間のそれぞれにつ
いてLPCケプストラム係数標準ベクトル演算部13か
ら与えられた棟準ベクトルτとのLPCケプストラム距
離D1、C2、・・・、DIを演算するものである。
数ベクトルバッファメモリ部18から与えられた最新1
個の無音分析区間のLPG係数ベクトルa1 、a2
、・・・、aIのそれぞれについてLPCケプストラム
係数ベクトルを演算した後、各分析期間のそれぞれにつ
いてLPCケプストラム係数標準ベクトル演算部13か
ら与えられた棟準ベクトルτとのLPCケプストラム距
離D1、C2、・・・、DIを演算するものである。
パワーバッファメモリ部17は、既に無音と判定された
最も新しい1個の分析区間のパワーP1、P2、・・・
、Plを格納しておくものである。
最も新しい1個の分析区間のパワーP1、P2、・・・
、Plを格納しておくものである。
統計量演算部15は、パワーバッファメモリ部17に格
納されている最新1個の分析区間のパワーP1、P2
、・・・、PIと、第1のLPCケプストラム距薄演算
部19から与えられた最新1個の分析区間のL P C
クプストラム距ID1 、C2、・・・、DIとから、
I(IIの分析区間のLPCケプストラム距離の平均値
りと分散σ。8、パワーの平均1直Pと分散σPP、パ
ワー及びLPCケプストラム距離の共分散σ。、とを演
算するものである。
納されている最新1個の分析区間のパワーP1、P2
、・・・、PIと、第1のLPCケプストラム距薄演算
部19から与えられた最新1個の分析区間のL P C
クプストラム距ID1 、C2、・・・、DIとから、
I(IIの分析区間のLPCケプストラム距離の平均値
りと分散σ。8、パワーの平均1直Pと分散σPP、パ
ワー及びLPCケプストラム距離の共分散σ。、とを演
算するものである。
統計的距離演算部14は、対象となっている分析区間の
LPCケプストラム距jliDと、パワーPと、過去の
分析区間の情報から得られた統計ID、σ 百、σP
P、σDPとを用いて対象となっていDO・ る分析区間の統計的距i11DMを演算するものである
。
LPCケプストラム距jliDと、パワーPと、過去の
分析区間の情報から得られた統計ID、σ 百、σP
P、σDPとを用いて対象となっていDO・ る分析区間の統計的距i11DMを演算するものである
。
有音/無音判定部16は、統計的距離DMを予め定めら
れているしきい値DTHと比較し、しきい値Drl+よ
り大きいときに有音を指示し、しきい値DrHより小さ
いときに無音を指示する有音/無音判定結果VUを出力
するものである。
れているしきい値DTHと比較し、しきい値Drl+よ
り大きいときに有音を指示し、しきい値DrHより小さ
いときに無音を指示する有音/無音判定結果VUを出力
するものである。
上述したパワーバッファメモリ部17及びLPC係数ベ
クトルバッファメモリ部18は、また、この有音/無音
判定結果VUが無音を指示しているとき、対象となって
いる分析区間のパワーP及びLPG係数ベクトルaを収
り込んで最も古いパワーPH及びLPC係数ベクトルa
■を削除して格納内容を更新するものである。
クトルバッファメモリ部18は、また、この有音/無音
判定結果VUが無音を指示しているとき、対象となって
いる分析区間のパワーP及びLPG係数ベクトルaを収
り込んで最も古いパワーPH及びLPC係数ベクトルa
■を削除して格納内容を更新するものである。
夾旌鍔凶勲芥
以上の各部よりなる有音/無音判定回路10は、以下の
ように動作する。
ように動作する。
入力信号サンプル値列Xは、LPC分析部11によって
N個のサンプルでなる分析区間毎に切り出される。今、
処理対象となっている分析区間のサンプルX1 、X2
、・・・XHはLPC分析され、LPC係数ベクトル
a (al 、a2 、”・a−及びパワーPが収出さ
れる。
N個のサンプルでなる分析区間毎に切り出される。今、
処理対象となっている分析区間のサンプルX1 、X2
、・・・XHはLPC分析され、LPC係数ベクトル
a (al 、a2 、”・a−及びパワーPが収出さ
れる。
このLPC分析は、次式
%式%))
、(mはケプストラム係数の次数であり、総次数をMと
すると、1.2、・・・Mのいずれかの値である)が求
められる。このようにして求められたしPCケプストラ
ム係数ベクトルC(CI 、C2。
すると、1.2、・・・Mのいずれかの値である)が求
められる。このようにして求められたしPCケプストラ
ム係数ベクトルC(CI 、C2。
・”cH)と、LPCケプストラム係数標準ベクトルτ
(石1、τ2、・・・τH)とのLPCケプストラム距
離りが、LPCケプストラム距離演算部12によって求
められる。
(石1、τ2、・・・τH)とのLPCケプストラム距
離りが、LPCケプストラム距離演算部12によって求
められる。
LPCケプストラム係数ベクトル及びLPCケプストラ
ム距離の算出は、次式 %式%(3) に従ってなされる。なお、riはiサンプル区間だけ離
れた自己相関係数である。
ム距離の算出は、次式 %式%(3) に従ってなされる。なお、riはiサンプル区間だけ離
れた自己相関係数である。
このようにして得られたLPC係数ベクI・ルa(al
、a2 、”・a−は、LPCケプストラム距離演算
部12にb−えられてケプストラム係数Cに従ってなさ
れる。
、a2 、”・a−は、LPCケプストラム距離演算
部12にb−えられてケプストラム係数Cに従ってなさ
れる。
このようにして得られたLPCケプストラム距離りは、
統計的距離演算部14に与えられる。統計的距離演算部
14にはまた、LPC分析部11から処理対象分析区間
についてのパワーPが与えられ、統計量演算M15から
無音と判定された最新過去の1個の分析区間についての
パワー乎均値■)、パワー分散σpp、 L P Cケ
プストラム距離平均値り、LPCケプストラム距離分散
σDD、パワー及びLPCケプストラム距離の共分散σ
叶とが与えられる。これら入力から、統計的距離演算部
14によって処理対象分析区間についての統計的距離D
Mが算出される。
統計的距離演算部14に与えられる。統計的距離演算部
14にはまた、LPC分析部11から処理対象分析区間
についてのパワーPが与えられ、統計量演算M15から
無音と判定された最新過去の1個の分析区間についての
パワー乎均値■)、パワー分散σpp、 L P Cケ
プストラム距離平均値り、LPCケプストラム距離分散
σDD、パワー及びLPCケプストラム距離の共分散σ
叶とが与えられる。これら入力から、統計的距離演算部
14によって処理対象分析区間についての統計的距離D
Mが算出される。
統計的距離DMの算出は、次式
%式%(6)
に従って求められる。
このようにして得られた統計的距離DMが有音/無音判
定部16に与えられる。有ff/無音判定部16にはま
た、判定しきい値DTtlが与えられている。かくして
、この有音/無音判定部16からは、統計的距離DMが
しきい値DTllより大きい場合に有音(論理「1」)
を指示し、統計的距離DMがしきい値DTtlより小さ
い場合に無音(論理「0」)を指示する有音/無音判定
結果VUが処理対象となっている分析区間の判定結果と
して出力される。
定部16に与えられる。有ff/無音判定部16にはま
た、判定しきい値DTtlが与えられている。かくして
、この有音/無音判定部16からは、統計的距離DMが
しきい値DTllより大きい場合に有音(論理「1」)
を指示し、統計的距離DMがしきい値DTtlより小さ
い場合に無音(論理「0」)を指示する有音/無音判定
結果VUが処理対象となっている分析区間の判定結果と
して出力される。
以上、基本的な動作を説明したが、以下では、このよう
な動作に用いられるLPCケプストラム係数標準ベクト
ルCと、統計量5、σ08、r、σ38、σ叶との算出
動作について説明する。
な動作に用いられるLPCケプストラム係数標準ベクト
ルCと、統計量5、σ08、r、σ38、σ叶との算出
動作について説明する。
これらのLPCケプストラム係数標準ベクトルiと、統
計ftD、σ09、P、σ18、σ0.とは共に、無音
と判定された最も新しい1個の分析区間の情報に基づい
て形成される。
計ftD、σ09、P、σ18、σ0.とは共に、無音
と判定された最も新しい1個の分析区間の情報に基づい
て形成される。
LPG係数ベクトルバッファメモリ部18には、LPC
分析部11から出力されたLPG係数係数ベクトル間え
られると共に、そのLPG係数係数ベクトル間する分析
区間の有音/無音判定結果■Uが有音/無音判定部16
から与えられる。有音/無音判定結果VUが無音を示し
ているときには、LPC係数係数ベクトル内部に収り込
まれて格納され、同時に、格納されている最も古い分析
区間のLPG係数ベクトルは格納内容から削除される。
分析部11から出力されたLPG係数係数ベクトル間え
られると共に、そのLPG係数係数ベクトル間する分析
区間の有音/無音判定結果■Uが有音/無音判定部16
から与えられる。有音/無音判定結果VUが無音を示し
ているときには、LPC係数係数ベクトル内部に収り込
まれて格納され、同時に、格納されている最も古い分析
区間のLPG係数ベクトルは格納内容から削除される。
他方、有音/無音判定結果■Uが有音を示しているとき
には、格納内容の更新は実行されない、従って、LPG
係数ベクトルバッファメモリ部18には、無音と判定さ
れた最も新しい1個の分析区間のしPC係数ベクトルa
1〜a■が常に格納されている。
には、格納内容の更新は実行されない、従って、LPG
係数ベクトルバッファメモリ部18には、無音と判定さ
れた最も新しい1個の分析区間のしPC係数ベクトルa
1〜a■が常に格納されている。
パワーバッファメモリ部17には、LPC分析部11か
ら出力されたパワーPが与えられると共に、そのパワー
Pに関する分析区間の有音/無音判定結果vUが有音/
無音判定部16から与えられ、LPC係数ベクトルバッ
ファメモリ部18と同様にして、無音と判定された最も
新しい1個の分析区間のパワーP1〜r)■が常に格納
されている。
ら出力されたパワーPが与えられると共に、そのパワー
Pに関する分析区間の有音/無音判定結果vUが有音/
無音判定部16から与えられ、LPC係数ベクトルバッ
ファメモリ部18と同様にして、無音と判定された最も
新しい1個の分析区間のパワーP1〜r)■が常に格納
されている。
1個の最新無音分析区間のLPC係数係数ベクトル−1
〜alLPCケプストラム係数標準ベクトル演算部13
に与えられ、LPCケプストラム係数標準ベクトル演r
L部13によるLPCケプストラム係数標準ベクトルi
の算出に用いられる。
〜alLPCケプストラム係数標準ベクトル演算部13
に与えられ、LPCケプストラム係数標準ベクトル演r
L部13によるLPCケプストラム係数標準ベクトルi
の算出に用いられる。
LPCケプストラム係数標準ベクトル演算部13では、
まず各LPG係数ベクトルa1〜a■のそれぞれについ
て総次数Mのケプストラム係数(C11・C12・””
1M)・ (021・022・”” 2)1)・・・
・(C11、C10、・・・CIN)を計算する。かか
る演算は、上述した(4)式と同様に実行されるので、
ここでは、演算式の表示を省略する。
まず各LPG係数ベクトルa1〜a■のそれぞれについ
て総次数Mのケプストラム係数(C11・C12・””
1M)・ (021・022・”” 2)1)・・・
・(C11、C10、・・・CIN)を計算する。かか
る演算は、上述した(4)式と同様に実行されるので、
ここでは、演算式の表示を省略する。
その後、LPCケプストラム係数標準ベクトル演算部1
3では、次式 %式%(7) に従って、1個の分析区間の同一次数mのケプストラム
係数の平均を得て、平均ケプストラム係数τ。を要素と
したt、pcケプストラム係数標準ベクトルi(C1、
””2、・・・C8)を求める。
3では、次式 %式%(7) に従って、1個の分析区間の同一次数mのケプストラム
係数の平均を得て、平均ケプストラム係数τ。を要素と
したt、pcケプストラム係数標準ベクトルi(C1、
””2、・・・C8)を求める。
このようにして得られたLPCケプストラム係数控準ベ
クトルでは、上述したように、第2のしPCケプストラ
ム距離演算部12に与えられて、対象となっている分析
区間のLPG係数ベクトルaの標準ベクトルτに対する
LPCケプストラム距離りの演算に用いられる。
クトルでは、上述したように、第2のしPCケプストラ
ム距離演算部12に与えられて、対象となっている分析
区間のLPG係数ベクトルaの標準ベクトルτに対する
LPCケプストラム距離りの演算に用いられる。
また、LPCケプストラム係数棟準ベクトル下は、第1
のLPCケプストラム距離演算部19にもJトえられる
。このL P Cケプストラム距離演算部19には、L
PC係数ベクトルバッファメモリ部18から1個の最新
の無音分析区間のLPC係数ベクトル11〜a■が与え
られる。
のLPCケプストラム距離演算部19にもJトえられる
。このL P Cケプストラム距離演算部19には、L
PC係数ベクトルバッファメモリ部18から1個の最新
の無音分析区間のLPC係数ベクトル11〜a■が与え
られる。
LPCケプストラム距離演算部1つでは、まず各LPC
係数ベクトルa1〜aIのそれぞれについて、総次数M
のLPCケプストラム係数ペクト′しC1(C11,C
12,”CIH) 、 C2(C21,C22・”
” 2H>・°°°町(C11・’12・””IH)を
計算する。かかる演算式は、上述した(4)式と同様で
あるので、その表示は省略する。
係数ベクトルa1〜aIのそれぞれについて、総次数M
のLPCケプストラム係数ペクト′しC1(C11,C
12,”CIH) 、 C2(C21,C22・”
” 2H>・°°°町(C11・’12・””IH)を
計算する。かかる演算式は、上述した(4)式と同様で
あるので、その表示は省略する。
その後、LPCケプストラム距離演算部1つでは、各無
音分析区間のLPCケプストラム係数ベクトルCI 、
C2、・・・CIのそれぞれについて、LPCケプスト
ラム係数標準ベクトルτとのLPCケプストラム距@D
I 、C2、・・・DIを演算する。かかる演算式は、
上述した(5)式と同様であるので、その表示は省略す
る。
音分析区間のLPCケプストラム係数ベクトルCI 、
C2、・・・CIのそれぞれについて、LPCケプスト
ラム係数標準ベクトルτとのLPCケプストラム距@D
I 、C2、・・・DIを演算する。かかる演算式は、
上述した(5)式と同様であるので、その表示は省略す
る。
統計量演算部15には、このようにして得られた1個の
無音分析区間についてのLPCケプストラム距離D1、
C2、・・・Dlが与えられ、また、パワーバッファメ
モリ部」7から1個の無音分析区間についてのパワーP
1、P2、・・・P丁が与えられる。
無音分析区間についてのLPCケプストラム距離D1、
C2、・・・Dlが与えられ、また、パワーバッファメ
モリ部」7から1個の無音分析区間についてのパワーP
1、P2、・・・P丁が与えられる。
これら入力情報から統計量演算部15によって、次式
に従って、最新1個の無音分析区間のLPCケプストラ
ム距離の平均値百、分散σDo、最新1個の無音分析区
間のパワーの平均値P、分散σP1、最新l個の無音分
析区間のパワー及びLPCケプストラム距離の共分散σ
、Pとが算出される。
ム距離の平均値百、分散σDo、最新1個の無音分析区
間のパワーの平均値P、分散σP1、最新l個の無音分
析区間のパワー及びLPCケプストラム距離の共分散σ
、Pとが算出される。
このようにして得られた統計量が統計的距離演X部14
に与えられて上述した統計的距離の算出に利用される。
に与えられて上述した統計的距離の算出に利用される。
実施例9勲ス
上述の実施例によれば、音声成分と背景雑音とでは周波
数成分が異なることに着目してスペクトル横道情報(L
PCケプストラム係数)を用いて有音/無音を判定する
ようにしたので、背景雑音パワーが音声のパワーよりも
大きい有音区間をも検出することができる。なお、雑音
がランダム雑音でない場合であっても過去の情報を用い
ているので、正確に判別できる。
数成分が異なることに着目してスペクトル横道情報(L
PCケプストラム係数)を用いて有音/無音を判定する
ようにしたので、背景雑音パワーが音声のパワーよりも
大きい有音区間をも検出することができる。なお、雑音
がランダム雑音でない場合であっても過去の情報を用い
ているので、正確に判別できる。
この実施例では、さらに、パワー情報をも判定に用いて
いるので、より正確な判定を行なうことができる。
いるので、より正確な判定を行なうことができる。
かくするにつき、統計的距離の算出に必要となる、LP
Cケプストラム係数標準ベクトルや統計量を、背景雑音
の時間的な変化をも考慮して更新していくようにしたの
で、より正確に有音/無音を判定することができる。
Cケプストラム係数標準ベクトルや統計量を、背景雑音
の時間的な変化をも考慮して更新していくようにしたの
で、より正確に有音/無音を判定することができる。
仏ム叉施倒
(I>上述の実施例においては、統計的距離を、パワー
とLPCケプストラム距離との相関性をも考慮した(6
)式に従って得るものを示したが、単純な次式 %式% に従って求めるようにしても良い。
とLPCケプストラム距離との相関性をも考慮した(6
)式に従って得るものを示したが、単純な次式 %式% に従って求めるようにしても良い。
(If)上述の実施例においては、構成を機能的に分け
て、同様な演算でも各部で別個に行なうものを示したが
、同様な演算を共通部分が実行するようにしても良い、
すなわち、第2のLPCケプストラム距離演算部12、
LPCケプストラム係数標準ベクトル演算部13及び第
1のLPCケズストラム距離演算部19が実行するLP
Cケプストラム係数の算出処理を共通な演算部が実行す
るようにしても良い0例えば、第2のLPCケプストラ
ム距離演算部12で得られたLPCケプストラム係数を
無音判定結果が得られたときにLPCケプストラム係数
標準ベク]・ル演算部13及び第1のLPCケプストラ
ム距離演算部19に与えるようにしても良い。
て、同様な演算でも各部で別個に行なうものを示したが
、同様な演算を共通部分が実行するようにしても良い、
すなわち、第2のLPCケプストラム距離演算部12、
LPCケプストラム係数標準ベクトル演算部13及び第
1のLPCケズストラム距離演算部19が実行するLP
Cケプストラム係数の算出処理を共通な演算部が実行す
るようにしても良い0例えば、第2のLPCケプストラ
ム距離演算部12で得られたLPCケプストラム係数を
無音判定結果が得られたときにLPCケプストラム係数
標準ベク]・ル演算部13及び第1のLPCケプストラ
ム距離演算部19に与えるようにしても良い。
また、第2のLPCケプストラム距離演算部12及び第
1のLPCケプストラム距離演算部19が実行するLP
Cケプストラム距離の算出処理を共通な演算部が実行す
るようにしても良い。例えば、第2のLPCケプストラ
ム距離演算部12で得られたLPCケプストラム距離を
無音判定結果が得られたときに第1のLPCケプストラ
ム距離演算部19に与えるようにしても良い。
1のLPCケプストラム距離演算部19が実行するLP
Cケプストラム距離の算出処理を共通な演算部が実行す
るようにしても良い。例えば、第2のLPCケプストラ
ム距離演算部12で得られたLPCケプストラム距離を
無音判定結果が得られたときに第1のLPCケプストラ
ム距離演算部19に与えるようにしても良い。
(III)上述の実施例においては、スペクトル精造情
報を表す特性として、LPCケプストラム係数を用いた
ものを示したが、フーリエ変換を利用したケプストラム
係数を用いるようにしても良い。
報を表す特性として、LPCケプストラム係数を用いた
ものを示したが、フーリエ変換を利用したケプストラム
係数を用いるようにしても良い。
ナオ、LPCケプストラム係数の方がフーリエ変換を利
用したケプストラム係数より冗長度が少なく、判定精度
が高くなると推測できる。
用したケプストラム係数より冗長度が少なく、判定精度
が高くなると推測できる。
(IV)上述の実施例においては、パワー及びLPCケ
プストラム距離の両方を用いて有音/無音判定を行なう
ものを示したが、判定精度は多少落ちるが、LPCケプ
ストラム距離だけを用いて有音/無音判定を行なうよう
にしても良い。この場合であっても、背景゛雑音パワー
よりパワーが小さい有音区間を検出することができる。
プストラム距離の両方を用いて有音/無音判定を行なう
ものを示したが、判定精度は多少落ちるが、LPCケプ
ストラム距離だけを用いて有音/無音判定を行なうよう
にしても良い。この場合であっても、背景゛雑音パワー
よりパワーが小さい有音区間を検出することができる。
[発明の効果]
以上のように、本発明によれば、スペクトル梧造特性を
考慮して有音/無音を判定するようにしたので、背景雑
音パワーより小さいパワーの有音区間をも確実に検出す
ることができる有音/無音判定回路を得ることができる
。
考慮して有音/無音を判定するようにしたので、背景雑
音パワーより小さいパワーの有音区間をも確実に検出す
ることができる有音/無音判定回路を得ることができる
。
第1図は本発明による有音/無音判定回路の一実施例を
示すブロック図、第2図は従来の有音/無音判定回路を
示すブロック図である。 11・・・L p c分析部、12・・・対象分析区間
についてのLPCケプストラム距離演算部、13・・・
LPCケプストラム係数標準ベクトル演算部、14・・
・統計的距離演算部、15・・・統計量演算部、16・
・・有音/無音判定部、17・・・パワーバッファメモ
リ部、18・・・LPC係数ベクトルバッファメモリ部
、19・・・過去の分析区間についてのLPCケプスト
ラム距離演算部。
示すブロック図、第2図は従来の有音/無音判定回路を
示すブロック図である。 11・・・L p c分析部、12・・・対象分析区間
についてのLPCケプストラム距離演算部、13・・・
LPCケプストラム係数標準ベクトル演算部、14・・
・統計的距離演算部、15・・・統計量演算部、16・
・・有音/無音判定部、17・・・パワーバッファメモ
リ部、18・・・LPC係数ベクトルバッファメモリ部
、19・・・過去の分析区間についてのLPCケプスト
ラム距離演算部。
Claims (1)
- 【特許請求の範囲】 標本化された入力信号を所定の分析区間毎に区分し、各
分析区間毎にスペクトル構造を表す特徴パラメータベク
トルを算出する分析手段と、既に無音判定がなされた分
析区間であって、処理対象となっている分析区間に時間
的に近い複数の分析区間の特徴パラメータベクトルを平
均化して特徴パラメータ標準ベクトルを算出する標準ベ
クトル演算手段と、 算出された標準ベクトルと、既に無音判定がなされた分
析区間であって、処理対象となっている分析区間に時間
的に近い複数の分析区間の特徴パラメータベクトルとの
距離を算出する第1の距離演算手段と、 この第1の距離演算手段から出力された複数の距離につ
いて、統計量を演算する統計量演算手段上記分析手段か
ら出力された処理対象分析区間についての特徴パラメー
タベクトルと、上記標準ベクトル演算手段から出力され
た標準ベクトルとの距離を演算する第2の距離演算手段
と、 上記統計量演算手段から出力された統計量に基づいて、
上記第2の距離演算手段から出力された距離を統計的距
離に変換する統計的距離演算手段と、 得られた統計的距離を、所定のしきい値と比較して処理
対象分析区間についての有音/無音判定結果を得る有音
/無音判定手段とを備えたことを特徴とする有音/無音
判定回路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1086860A JPH02266400A (ja) | 1989-04-07 | 1989-04-07 | 有音/無音判定回路 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1086860A JPH02266400A (ja) | 1989-04-07 | 1989-04-07 | 有音/無音判定回路 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH02266400A true JPH02266400A (ja) | 1990-10-31 |
Family
ID=13898568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1086860A Pending JPH02266400A (ja) | 1989-04-07 | 1989-04-07 | 有音/無音判定回路 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH02266400A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003323199A (ja) * | 2002-04-26 | 2003-11-14 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置及び符号化方法、復号化方法 |
JP2009122710A (ja) * | 1998-08-21 | 2009-06-04 | Panasonic Corp | パラメータ抽出装置及びパラメータ抽出方法 |
US7752052B2 (en) | 2002-04-26 | 2010-07-06 | Panasonic Corporation | Scalable coder and decoder performing amplitude flattening for error spectrum estimation |
-
1989
- 1989-04-07 JP JP1086860A patent/JPH02266400A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009122710A (ja) * | 1998-08-21 | 2009-06-04 | Panasonic Corp | パラメータ抽出装置及びパラメータ抽出方法 |
JP4527175B2 (ja) * | 1998-08-21 | 2010-08-18 | パナソニック株式会社 | スペクトルパラメータ平滑化装置及びスペクトルパラメータ平滑化方法 |
JP2010186190A (ja) * | 1998-08-21 | 2010-08-26 | Panasonic Corp | 量子化lspパラメータ動的特徴抽出器及び量子化lspパラメータ動的特徴抽出方法 |
JP2003323199A (ja) * | 2002-04-26 | 2003-11-14 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置及び符号化方法、復号化方法 |
US7752052B2 (en) | 2002-04-26 | 2010-07-06 | Panasonic Corporation | Scalable coder and decoder performing amplitude flattening for error spectrum estimation |
US8209188B2 (en) | 2002-04-26 | 2012-06-26 | Panasonic Corporation | Scalable coding/decoding apparatus and method based on quantization precision in bands |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR950000842B1 (ko) | 피치 검출기 | |
US8326612B2 (en) | Non-speech section detecting method and non-speech section detecting device | |
KR101437830B1 (ko) | 음성 구간 검출 방법 및 장치 | |
EP1420389A1 (en) | Speech bandwidth extension apparatus and speech bandwidth extension method | |
KR20010040669A (ko) | 잡음 보상되는 음성 인식 시스템 및 방법 | |
KR100269216B1 (ko) | 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법 | |
KR20070099372A (ko) | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 | |
US5704000A (en) | Robust pitch estimation method and device for telephone speech | |
JP3105465B2 (ja) | 音声区間検出方法 | |
KR100463417B1 (ko) | 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치 | |
JP2001236085A (ja) | 音声区間検出装置、定常雑音区間検出装置、非定常雑音区間検出装置、及び雑音区間検出装置 | |
KR100220377B1 (ko) | 정상신호와 비정상신호 판별방법 및 장치 | |
US8849662B2 (en) | Method and system for segmenting phonemes from voice signals | |
JP2625998B2 (ja) | 特徴抽出方式 | |
JPH02266400A (ja) | 有音/無音判定回路 | |
JP2002258881A (ja) | 音声検出装置及び音声検出プログラム | |
JP3465941B2 (ja) | ピッチ抽出装置 | |
KR100388488B1 (ko) | 유성음 구간에서의 고속 피치 탐색 방법 | |
JP2585214B2 (ja) | ピッチ抽出方法 | |
JPH0458297A (ja) | 有音検出装置および有音検出方法 | |
JPH034918B2 (ja) | ||
JPH0772899A (ja) | 音声認識装置 | |
JPH0827637B2 (ja) | 有音/無音判定回路 | |
JPH067353B2 (ja) | 音声認識装置 | |
JPS6039700A (ja) | 音声区間検出方法 |