JPH0467200A - 有音区間判定方法 - Google Patents

有音区間判定方法

Info

Publication number
JPH0467200A
JPH0467200A JP2180811A JP18081190A JPH0467200A JP H0467200 A JPH0467200 A JP H0467200A JP 2180811 A JP2180811 A JP 2180811A JP 18081190 A JP18081190 A JP 18081190A JP H0467200 A JPH0467200 A JP H0467200A
Authority
JP
Japan
Prior art keywords
frame
power
input signal
judgment
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2180811A
Other languages
English (en)
Inventor
Manabu Ono
学 小野
Yoshio Sato
佐藤 好男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2180811A priority Critical patent/JPH0467200A/ja
Publication of JPH0467200A publication Critical patent/JPH0467200A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声符号化、音声認識、音声蓄積等の技術に
利用する有音区間判定方法に関する。
従来の技術 従来、この種の有音区間判定方法は、判定フレームにお
ける入力信号のパワーと固定のしきい値とを比較するこ
とにより、判定フレームの入力信号のパワーがしきい値
以下であり、かつ判定フレームの直前の数フレーム連続
するフレームにおける入力信号のパワーが全てしきい値
以下であるとき判定フレームを無音であると判断し、判
定フレームの入力信号のパワーがしきい値以下であり、
かつ判定フレームの直前の数フレーム連続するフレーム
における入力信号のパワーが少なくとも1フレームにお
いてしきい値を越えるとき、および判定フレームの入力
信号のパワーがしきい値を越えるときに判定フレームを
有音であると判定している。
第2図は従来の有音区間判定方法のフローチャートを示
している。第2図において、1は判定フレームの入力信
号のデータを取り込むステップであり、2は判定フレー
ムの入力信号のパワーを求めるステップである。3は判
定信号の入力信号パワーとしきい値とを比較するステッ
プであり、4は判定フレームの直前の数フレームにおけ
るステップ3の比較結果を調べるステップである。5は
有音判定ステップであり、6は無音判定ステップである
。7は判定フレームの次のフレームがあるかどうかを調
べるステップであり、8は次のフレームへ移るステップ
であり、9は有音無音の判定を終了するステップである
次に、上記従来例の動作について説明する。第2図にお
いて、まずステップ1で判定フレームの入力信号を取り
込み、ステップ2で判定フレームの入力信号のパワーを
求める。次にステップ3で予め定められたしきい値とス
テップ2で求めた判定フレームの入力信号のパワーとを
比較し、判定フレームの入力信号のパワーがしきい値を
越える場合(ステップ3のN)、およびステップ3とス
テップ4とで判定フレームの入力信号パワーがしきい値
以下であり(ステップ3のY)、かつ判定フレームの直
前の予め定められた数フレームの入力信号のパワーのう
ちの1つでもしきい値を越えた場合(ステップ4のN)
は、ステップ5で判定フレームを有音と判定する。また
、判定フレームの入力信号のパ^ワーがしきい値以下で
あり(ステップ3のY)、かつ判定フレームの直前の数
フレームの入力信号のパワーが全てしきい値を越えた場
合(ステップ4のY)は、ステップ6で判定フレームを
無音と判定する。そしてステップ7で判定フレームの次
のフレームが存在するかどうかを判断し、存在すると判
断された場合(ステップ7のY)は、ステップ8で判定
フレームの次のフレームを新しく判定フレームとし、判
定フレームの次のフレームが存在しない場合(ステップ
7のN)は、ステップ9で有音区間判定を終了する。
このように、従来の有音区間判定方法でも、入力信号の
中の雑音のパワーが小さい場合には、有音が存在しない
フレームを無音とし、有音が存在するフレームを有音と
判定することができる。
発明が解決しようとする課題 しかしながら、上記従来の有音区間判定方法では、雑音
のパワーが大きい場合、有音が存在しないフレームであ
っても、雑音パワーが大きいためにフレームの入力信号
が判定のしきい値を越え、有音と判断されることがある
。これを避けるために判定のしきい値を高めに設定する
と、今度は有音が存在するフレームであるにも拘らずフ
レームの入力信号のパワーが判定のしきい値以下となり
、無音と判定されるという問題があった。
本発明は、このような従来の問題を解決するものであり
、入力信号中の雑音のパワーが大きくても、無音である
フレームは無音と判定し、有音であるフレームは有音と
判定することのできる優れた有音区間判定方法を提供す
ることを目的とするものである。
課題を解決するための手段 本発明は、上記目的を達成するために、過去の複数の無
音フレームのそれぞれの自己相関関数の平均値から求め
た線形予測係数(以下、無音予測係数という。)を用い
て判定フレームの予測を行ない、判定フレームの入力信
号と判定フレームを予測した値との差である予測残差か
ら判定フレームにおける予測残差の2乗平均値であるパ
ワーを求め、この予測残差のパワーと予め設定された第
1のしきい値とを比較するとともに、判定フレームにお
ける入力信号のパワーと第3のしきい値とを比較するこ
とにより、判定フレームが無音か有音かを判定するよう
にしたものである。
本発明はまた、フレームを小区間に分けて、小区間の予
測残差のパワーと第1のしきい値とを比較し、小区間に
おける入力信号のパワーと第2および第3のしきい値と
をそれぞれ比較することにより判定フレームが有音か無
音かを決定するにしたものである。
作用 したがって本発明によれば、過去の複数の無音フレーム
から求めた無音予測係数を用いて判定フレームの予測残
差を求めているので、判定フレームの予測残差のパワー
は判定フレームの入力信号のパワーから雑音のパワーを
引いたものとすることができる。したがって、判定フレ
ームの小区間の雑音を除いた予測残差パワーと第1のし
きい値とを比較するとともに、判定フレームの小区間の
入力信号のパワーと第2および第3のしきい値とを比較
することにより、雑音のパワーが大きい場合でも、有音
が少しでも存在する判定フレームを有音と判定し、判定
フレームに有音が少しも存在せず、かつ判定フレームの
直前の数フレームにおいても有音が少しも存在しない判
定フレームのみを無音と判定することができる。
実施例 第1図は本発明の有音区間判定方法の一実施例を示すフ
ローチャートである。第1図において、11は判定を行
なうための第1、第2および第3のしきい値と、無音予
測係数の初期値と、有音の存在しない連続するフレーム
を無音と判定する際の最大連続フレーム数を設定する初
期化ステップである。12は判定フレームの入力信号の
データを取り込むステップである。13は判定フレーム
の直前の1フレームが有音と判定されたフレームである
か無音と判定されたフレームであるかを調べるステップ
である。14はステップ13で判定フレームの直前の1
フレームが無音フレームであると判定された場合に、判
定フレームの一番最近の4つの無音フ奔し−ムから求め
た無音予測係数を用いて判定フレームの予測残差を求め
るステップである。15は判定フレームの4つに分割さ
れた小区間の予測残差のパワーと判定フレームの小区間
の入力信号のパワーとを求めるステップである。16は
ステップ15で求めた判定フレームの小区間の予測残差
パワーと第1のしきい値とを比較するステップである。
17は無音判定ステップである。18はステップ16で
判定フレームの小区間の予測残差のパワーが少なくとも
1つだけ第1のしきい°値を越える場合に判定フレーム
の小区間の入力信号のパワーと第3のしきい値とを比較
するステップである。19は有音判定ステップである。
20はステップ13で判定フレームの直前のフレームが
有音フレームであると判定された場合に判定フレームの
小区間の入力信号のパワーを求めるステップである。2
1はステップ20で求めた判定フレームの小区間の入力
信号のパワーと第2のしきい値とを比較するステップで
ある。22はステップ21で判定フレームの小区間の入
力信号のパワーが全て第2のしきい値以下である場合、
判定フレームの直前の4フレームが全て有音フレームで
あり、かつ判定フレームの直前の4フレームの小区間の
入力信号のパワーが全て第2のしきい値以下であったか
どうかを調べるステップである。23は有音判定ステッ
プであり、24は無音判定ステップである。25は判定
フレームの次のフレームが存在するかどうかを調べるス
テップである。26はステップ25で判定フレームの次
のフレームが存在するとされたときに判定フレームの次
のフレームを新しく判定フレームとするステップである
。27は有音無音の判定を終了するステップである。
次に、上記実施例の動作について説明する。上記実施例
において、まずステップ11で有音区間判定開始直後の
4フレームを全て無音フレームとし、第1および第2お
よび第3のしきい値を設定し、判定フレームを有音区間
判定開始直後フレームから5番目のフレームとする初期
化を行なう。
次にステップ12で判定フレームの入力信号のデータを
取り込み、ステップ13で判定フレームの直前の1フレ
ームが無音フレームであるかどうかを調べる。判定フレ
ームの直前の1フレームが無音フレームである場合(ス
テップ13のY)、ステップ14で判定フレームと一番
最近の4つの無音フレームから求めた無音予測係数を用
いて予測残差を求め、次でステップ15で判定フレーム
の小区間の予測残差のパワーと判定フレームの小区間の
入力信号のパワーとを求め、さらにステップ16で判定
フレームの小区間の予測残差のパワーと第1のしきい値
とを比較する。この比較の結果、判定フレームの小区間
の予測残差のパワーが全て第1のしきい値以下である場
合は(ステップ16Y)、ステップ17で判定フレーム
を無音フレームと判定し、判定フレームの小区間の予測
残差のパワーが少なくとも1つだけ第1のしきい値を越
え(ステップ16のN)、かつ入力信号のパワーが全て
第3のしきい値をこえている場合は(ステップ18のN
)、ステップ19で判定フレームを有音フレームと判定
する。
一方、ステップ13で判定フレームの直前の1フレーム
が有音フレームであると判定された場合は(ステップ1
3のN)、ステップ20で判定フレームの小区間の入力
信号のパワーを求め、次いでステップ21で判定フレー
ムの小区間の入力信号のパワーと第2のしきい値とを比
較する。この比較の結果、判定フレームの小区間の入力
信号のパワーが少なくとも1つだけ第2のしきい値を越
えた場合は(ステップ21のN)、ステップ23で判定
フレームを有音フレームと判定し、判定フレームの小区
間の入力信号のパワーが全て第2のしきい値以下であり
(ステップ21のY)、かつ判定フレームの直前の4フ
レームが1つでも有音フレームであるときは(ステップ
22のN)、ステップ23で判定フレームを有音フレー
ムであると判定する。また、判定フレームの小区間の入
力信号のパワーが全て第2のしきい値以下であり(ステ
ップ21のY)、かつ判定フレームの直前の4フレーム
が全て第2のしきい値以下であるときは(ステップ22
のY)、ステップ24で判定フレームを無音フレームと
判定する。
ステップ17.19.24.23で判定フレームを有音
フレームか無音フレームかに決定した後、ステップ25
で判定フレームの次のフレームが存在するかどうかを調
べ、判定フレームの次のフレームが存在する場合は(ス
テップ25のY)、ステップ26で判定フレームの次の
フレームを新しく判定フレームとし、判定フレームの次
のフレームが存在しない場合は(ステップ25のN)、
ステップ27で有音区間の判定を終了する。
このように、上記実施例によれば、判定フレームの一番
最近の4フレームの無音フレームの無音予測係数を求め
て判定フレームの予測を行なうため、予測値が雑音のみ
を表わし、判定フレームの入力信号と予測値の差が入力
信号から雑音を引いたものを表わすため、雑音のパワー
が大きいとき判定フレームに有音が存在するときとしな
いときの差は、判定フレームの入力信号パワーより判定
フレームの入力信号と予測値との差である予測残差のパ
ワーの方が大きくなり、予測残差のパワーと予め決めら
れたしきい値とを比較すると、判定フレームに有音が存
在するときに有音フレームと判定することが容易になる
利点を有する。
また上記実施例によれば、判定フレームを4つの小区間
に分けて、判定フレームの小区間の予測残差パワーと第
2のしきい値とを比較しているため、判定フレームの小
区間に有音が少しでも存在していれば、判定フレームを
有音フレームと判定することができるという効果を有す
る。
発明の効果 本発明は、上記実施例から明らかなように、以下に示す
効果を有する。
(1)判定フレームより前の複数の無音フレームから求
めた無音予測係数を用いて判定フレームの予測残差を求
めているので、判定フレームの予測残差のパワーは判定
フレームの入力信号のパワーから雑音のパワーを引いた
ものとすることができる。
(2)判定フレームの予測残差のパワーと第1のしきい
値とを比較し、さらに判定フレームの入力信号のパワー
と第3のしきい値とを比較するため、雑音パワーが大き
くても有音が存在しなければ無音フレームと判定するこ
とができる。
(3)判定フレームの小区間の予測残差のパワーと第1
のしきい値とを比較し、さらに判定フレームの小区間の
入力信号のパワーと第2および第3のしきい値と比較し
ているので、雑音パワーが太き(でも判定フレームに少
しでも有音が存在していれば有音フレームと判定するこ
とができ、判定フレームに有音が少しも存在せず、かつ
直前の数フレームにおいても有音が少しも存在しなけれ
ば無音フレームと判定することができる
【図面の簡単な説明】
第1図は本発明の一実施例における有音区間判定方法の
フローチャート、第2図は従来の有音区間判定方法のフ
ローチャートである。 第1図

Claims (2)

    【特許請求の範囲】
  1. (1)入力音声信号を時間によりフレームに分け、判定
    を行なう対象となる判定フレームの直前の1フレームが
    無音と判定された場合、過去の複数の無音であると判定
    された各々のフレームの自己相関関数の平均値から求め
    た線形予測係数を用いて判定フレームの予測を行ない、
    判定フレームの入力信号と判定フレームを予測した値と
    の差である予測残差から判定フレームにおける予測残差
    の2乗平均値であるパワーを求め、上記予測残差のパワ
    ーと予め設定された第1のしきい値とを比較するととも
    に、判定フレームにおける入力信号のパワーと予め設定
    された第3のしきい値とを比較することにより判定フレ
    ームが無音か有音かを判定し、判定フレームの直前の1
    フレームが有音と判定された場合、判定フレームの入力
    信号のパワーと予め設定された第2のしきい値とを比較
    するとともに、判定フレームの直前の数フレームにおい
    て入力信号のパワーと第2のしきい値とを比較すること
    により判定フレームが有音か無音かを決定する有音区間
    判定方法。
  2. (2)判定フレームを複数の小区間に分けて求めた小区
    間における残差信号のパワーと第1のしきい値とを比較
    し、小区間における入力信号のパワーと第2のしきい値
    とを比較し、小区間における入力信号のパワーと第3の
    しきい値とを比較することにより判定フレームが有音か
    無音かを決定する請求項(1)記載の有音区間判定方法
JP2180811A 1990-07-09 1990-07-09 有音区間判定方法 Pending JPH0467200A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2180811A JPH0467200A (ja) 1990-07-09 1990-07-09 有音区間判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2180811A JPH0467200A (ja) 1990-07-09 1990-07-09 有音区間判定方法

Publications (1)

Publication Number Publication Date
JPH0467200A true JPH0467200A (ja) 1992-03-03

Family

ID=16089772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2180811A Pending JPH0467200A (ja) 1990-07-09 1990-07-09 有音区間判定方法

Country Status (1)

Country Link
JP (1) JPH0467200A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100429978B1 (ko) * 1996-12-26 2004-07-27 엘지전자 주식회사 음성합성시스템의음질저하방지장치
US7130796B2 (en) * 2001-02-27 2006-10-31 Mitsubishi Denki Kabushiki Kaisha Voice encoding method and apparatus of selecting an excitation mode from a plurality of excitation modes and encoding an input speech using the excitation mode selected
US9233761B2 (en) 2010-07-01 2016-01-12 Mitsubishi Heavy Industries, Ltd. Display apparatus, control support system, and display method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58143394A (ja) * 1982-02-19 1983-08-25 株式会社日立製作所 音声区間の検出・分類方式
JPS62141594A (ja) * 1985-12-16 1987-06-25 日本電気株式会社 音声検出方式
JPS6438320A (en) * 1987-07-31 1989-02-08 Tokyo Wells Kk Work feeder
JPH01286643A (ja) * 1988-05-13 1989-11-17 Fujitsu Ltd 音声検出装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58143394A (ja) * 1982-02-19 1983-08-25 株式会社日立製作所 音声区間の検出・分類方式
JPS62141594A (ja) * 1985-12-16 1987-06-25 日本電気株式会社 音声検出方式
JPS6438320A (en) * 1987-07-31 1989-02-08 Tokyo Wells Kk Work feeder
JPH01286643A (ja) * 1988-05-13 1989-11-17 Fujitsu Ltd 音声検出装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100429978B1 (ko) * 1996-12-26 2004-07-27 엘지전자 주식회사 음성합성시스템의음질저하방지장치
US7130796B2 (en) * 2001-02-27 2006-10-31 Mitsubishi Denki Kabushiki Kaisha Voice encoding method and apparatus of selecting an excitation mode from a plurality of excitation modes and encoding an input speech using the excitation mode selected
US9233761B2 (en) 2010-07-01 2016-01-12 Mitsubishi Heavy Industries, Ltd. Display apparatus, control support system, and display method

Similar Documents

Publication Publication Date Title
RU2417456C2 (ru) Системы, способы и устройства для обнаружения изменения сигналов
RU2251750C2 (ru) Обнаружение активности сложного сигнала для усовершенствованной классификации речи/шума в аудиосигнале
JP3141450B2 (ja) オーディオ信号処理方法
KR100302370B1 (ko) 음성구간검출방법과시스템및그음성구간검출방법과시스템을이용한음성속도변환방법과시스템
US20050177363A1 (en) Apparatus, method, and medium for detecting voiced sound and unvoiced sound
TWI467979B (zh) 用於信號改變偵測之系統、方法及裝置
JPH02267599A (ja) 音声検出装置
EP1426926A2 (en) Apparatus and method for changing the playback rate of recorded speech
US7254532B2 (en) Method for making a voice activity decision
JPH0467200A (ja) 有音区間判定方法
JP2002261553A (ja) 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
CN112669872B (zh) 一种音频数据的增益方法及装置
JPH0449952B2 (ja)
CN112102818B (zh) 结合语音活性检测和滑动窗噪声估计的信噪比计算方法
JPH08305388A (ja) 音声区間検出装置
JP2656069B2 (ja) 音声検出装置
JPS6367197B2 (ja)
JPH04115299A (ja) 音声有音無音判定方法および装置
JPH03241400A (ja) 音声検出器
JPH04204898A (ja) 有音区間判定方法
KR100263296B1 (ko) G.729 음성 부호화기를 위한 음성 활성도 측정 방법
KR20040073145A (ko) 음성인식기의 성능 향상 방법
KR100554165B1 (ko) 피치 지연값의 배수에 의한 영향 제거가 가능한 celp기반 음성부호화기 및 피치 지연값의 배수에 의한 영향제거 방법
JPH087596B2 (ja) 雑音抑圧型音声検出器
JPH02272837A (ja) 音声区間検出方式