JPS6242197A - 音声区間検出方法 - Google Patents
音声区間検出方法Info
- Publication number
- JPS6242197A JPS6242197A JP60181082A JP18108285A JPS6242197A JP S6242197 A JPS6242197 A JP S6242197A JP 60181082 A JP60181082 A JP 60181082A JP 18108285 A JP18108285 A JP 18108285A JP S6242197 A JPS6242197 A JP S6242197A
- Authority
- JP
- Japan
- Prior art keywords
- section
- microphone
- level
- input
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は音声認識等において、音声区間と音声の存在し
ない区間とが連続している入力音より音声区間を検出す
る音声区間検出方法に間するものである。
ない区間とが連続している入力音より音声区間を検出す
る音声区間検出方法に間するものである。
(従来の技術)
第4図は従来の音声区間検出方法を示すフロー図である
。第4図に示す音声区間検出方法において、音声を入力
するマイクロホンは1個であり、ここからの入カバワの
レベルを用いて音声区間の検出を行う。先ず入力される
以前の周囲ノイズのパワのレベルを学習しておく。以後
、入力パワレベルの監視を続け、そのパワレベルがスレ
ッショルドPTより大である時間がスレッショルド11
以上のときにその区間を音声区間とし、上記条件を満た
さない場合には以」−の動作を続ける。ここでパワレベ
ルのスレッショルドPrは、前述の学習された周囲ノイ
ズのパワレベルに予め定められた適当な値を加えた値と
する。また時間のスレッショルドt、rは予め適当に定
められた値である。
。第4図に示す音声区間検出方法において、音声を入力
するマイクロホンは1個であり、ここからの入カバワの
レベルを用いて音声区間の検出を行う。先ず入力される
以前の周囲ノイズのパワのレベルを学習しておく。以後
、入力パワレベルの監視を続け、そのパワレベルがスレ
ッショルドPTより大である時間がスレッショルド11
以上のときにその区間を音声区間とし、上記条件を満た
さない場合には以」−の動作を続ける。ここでパワレベ
ルのスレッショルドPrは、前述の学習された周囲ノイ
ズのパワレベルに予め定められた適当な値を加えた値と
する。また時間のスレッショルドt、rは予め適当に定
められた値である。
次に上記従来例を、入力音声の例を用いて説明する。第
5図は「アサヒ」と発声したときのパワのレベル変化を
示す図である。横軸52は時刻、縦軸53はパワのレベ
ルを示す。点線54はスし・ツショルドPrを示す。「
アサヒ」のパワのレベルの変1ヒは実線55に示すよう
に連続した山のような形となり、その間そのレベルがス
レッショルドPTより大きい状態を保つことことにより
「アリヒ」の音声区間検出がなされる。なお、実際には
、無声子音なとでは子音区間でレベルが著しく小さくな
り、スレッショルドPTより小さくなることがあり、そ
のような場合でも正しく音声区間検出を行うためには第
4図に示すよりもやや複雑な方法を必要とrる。しかし
、本発明の説明においては、これは本質的な問題ではな
いので、この問題への対応についての説明は一切省略す
るものとする。
5図は「アサヒ」と発声したときのパワのレベル変化を
示す図である。横軸52は時刻、縦軸53はパワのレベ
ルを示す。点線54はスし・ツショルドPrを示す。「
アサヒ」のパワのレベルの変1ヒは実線55に示すよう
に連続した山のような形となり、その間そのレベルがス
レッショルドPTより大きい状態を保つことことにより
「アリヒ」の音声区間検出がなされる。なお、実際には
、無声子音なとでは子音区間でレベルが著しく小さくな
り、スレッショルドPTより小さくなることがあり、そ
のような場合でも正しく音声区間検出を行うためには第
4図に示すよりもやや複雑な方法を必要とrる。しかし
、本発明の説明においては、これは本質的な問題ではな
いので、この問題への対応についての説明は一切省略す
るものとする。
前述のように、上記従来の音声認識方法でも、周囲ノイ
ズのレベルが常に十分少さいと吉には正しく音声区間検
出ができる。
ズのレベルが常に十分少さいと吉には正しく音声区間検
出ができる。
しかしながら、上記従来の音声区間検出方法では、ノイ
ズレベルが変動した場合、ノイズレベルの大きい部分を
音声区間と誤ることが多かった。
ズレベルが変動した場合、ノイズレベルの大きい部分を
音声区間と誤ることが多かった。
その−例を第6図に示す。第6図は、第5図の場合と同
様に「アサヒ」と発声したときの入力のパワのレベルを
示すものであり、横軸62は時刻、縦軸63はパワのレ
ベル、点線64はスレッシ9ルFPlを表す。入力のパ
ワのレベルは実線65で示すように、「アサヒ」の音声
区間でスレッシ9ルI”PTよりも前にノイズレベルの
大きい区間66が存在し、従来の音声区間検出方法では
そのノイズの区間を誤って音声区間としていた。このよ
うに従来の音声区間検出方法では、ノイズレベルが変動
した場合、レベルの大きいノイズの区間を誤って音7R
区間としてしシ〉ことが多いという問題があった。
様に「アサヒ」と発声したときの入力のパワのレベルを
示すものであり、横軸62は時刻、縦軸63はパワのレ
ベル、点線64はスレッシ9ルFPlを表す。入力のパ
ワのレベルは実線65で示すように、「アサヒ」の音声
区間でスレッシ9ルI”PTよりも前にノイズレベルの
大きい区間66が存在し、従来の音声区間検出方法では
そのノイズの区間を誤って音声区間としていた。このよ
うに従来の音声区間検出方法では、ノイズレベルが変動
した場合、レベルの大きいノイズの区間を誤って音7R
区間としてしシ〉ことが多いという問題があった。
次に第2の従来例について説明する。
第2の従来例は、上記第1の従来例の問題点に対応し、
2個のマイクロホンを用い、一方のマイクロホンは発声
者の音声と周囲ノイズのSN比が大となるように設置し
、他方のマイクロホンは前者のマイクロホンに比へSN
比が小となるように設置し、それぞれのマイクロホンに
おける入力のパワを計算し、前者のマイクロホンによる
パワから後者のマイクロホンによるパワを引き算し、こ
の差の値を、第1の従来例における入力のパワの値の代
わりに用いて音声区間検出を行うものである。すなわち
、2個のマイクロホンにおけるパワの差を求めることに
よりノイズ成分をキャンセルし、音声区間を正しく検出
しようとするものである。この第2の従来例は、理想的
に機能すれば、原理的には第1の従来例の問題点を解決
できるが、変動するノイズを時々刻々キャンセルするこ
とは調整が困難である等の理由により実際には難しく、
十分な性能は得られていない。
2個のマイクロホンを用い、一方のマイクロホンは発声
者の音声と周囲ノイズのSN比が大となるように設置し
、他方のマイクロホンは前者のマイクロホンに比へSN
比が小となるように設置し、それぞれのマイクロホンに
おける入力のパワを計算し、前者のマイクロホンによる
パワから後者のマイクロホンによるパワを引き算し、こ
の差の値を、第1の従来例における入力のパワの値の代
わりに用いて音声区間検出を行うものである。すなわち
、2個のマイクロホンにおけるパワの差を求めることに
よりノイズ成分をキャンセルし、音声区間を正しく検出
しようとするものである。この第2の従来例は、理想的
に機能すれば、原理的には第1の従来例の問題点を解決
できるが、変動するノイズを時々刻々キャンセルするこ
とは調整が困難である等の理由により実際には難しく、
十分な性能は得られていない。
(発明が解決しようとする問題点)
上述のように、従来の音声区間検出方法では、ノイズレ
ベルが変動した場合、レベルの大きいノイズの区間を誤
フて音声区間としてしまうことが多いという問題があっ
た。
ベルが変動した場合、レベルの大きいノイズの区間を誤
フて音声区間としてしまうことが多いという問題があっ
た。
本発明はこのような問題を解決することを目的とするも
のである。
のである。
(問題を解決するための手段)
本発明は上記目的を達成するために、音声入力に2個の
マイクロホンを用い、一方のマイクロホン(メインマイ
クという)は発声者の音声と周囲ノイズのSN比が大と
なるように設置し、他方のマイクロホン(サブマイクと
いう)はメインマイクに比べ前記SN比が小となるよう
に設置す、 メインマイクにおいて、周囲ノイズレベ
ルに比へ大きいレベルの入力が続いたときにその区間を
音声区間検出とし、その区間におけるメインマイクおよ
びサブマイクそれぞれのマイクロホンにおける入力のレ
ベルの差(または比)、または入力のレベルと周囲ノイ
ズレベルとの差(または比)の11nの差(または比)
が、予め定められたスレッショルド値より大きいときに
はその音声区間候補を音声区間とし、そうでないときに
は、その音声区間候補を棄却するようにしたものである
。
マイクロホンを用い、一方のマイクロホン(メインマイ
クという)は発声者の音声と周囲ノイズのSN比が大と
なるように設置し、他方のマイクロホン(サブマイクと
いう)はメインマイクに比べ前記SN比が小となるよう
に設置す、 メインマイクにおいて、周囲ノイズレベ
ルに比へ大きいレベルの入力が続いたときにその区間を
音声区間検出とし、その区間におけるメインマイクおよ
びサブマイクそれぞれのマイクロホンにおける入力のレ
ベルの差(または比)、または入力のレベルと周囲ノイ
ズレベルとの差(または比)の11nの差(または比)
が、予め定められたスレッショルド値より大きいときに
はその音声区間候補を音声区間とし、そうでないときに
は、その音声区間候補を棄却するようにしたものである
。
(作用)
本発明は上記のような方法であるから、2個のマイクロ
ホンから入力される音声のパワのレベル、またはSN比
を比較することにより、音声区間として検出するため、
ノイズ区間を音声区間に誤ることの少ない確度の高い音
声区間検出ができる。
ホンから入力される音声のパワのレベル、またはSN比
を比較することにより、音声区間として検出するため、
ノイズ区間を音声区間に誤ることの少ない確度の高い音
声区間検出ができる。
(実施例)
第1図および第2図は本発明の一実施例による音声区間
検出方法に使用する装置の機能ブロック図およびその動
作フローを示す図である。
検出方法に使用する装置の機能ブロック図およびその動
作フローを示す図である。
第1図において、lは発声者の音声と周囲ノイズのSN
比が大きくなるように設置したメインマイク、2はメイ
ンマイクに比べSN比が小さくなるように設置したサブ
マイク、3はメインマイク1からの入力信号を前処理す
るメインマイク前処理部、4はサブマイク2からの入力
信号を前処理するサブマイク而処理部、5はメインマイ
クからの入力信号のパワを算出するメインマイクパワ算
出部、6はサブマイクからの入力信号のパワを算出する
サブマイクパワ算出部、7は騒音学習時にメインマイク
パワ算出部で算出した騒音レベルのパワに基づき音声区
間検出のためのスレッショルドptを設定する騒音学習
部、8は騒音学習部7により設定されたスレッショルド
Pvと予め定められた時間のスレッショルド時閉のスレ
ッショルドtrに基づき音声区間候補を検出する音声区
間候補検出部、9はメインマイクパワ算出部5の出力と
サブマイクパワ算出部6の出力との差(または比)を求
めるレベル差(または比)検出部、10はレベル差検出
部9の出力に基づき音声区間候補検出部8により判定さ
れた音声区間候補音声区間として採用するかまたはそれ
を棄却するかを決定する音声区間決定部である。本実施
例においては、入力用の2個のマイクロホンの内メイン
マイクは発声者の正面20cmの位置に設置し、サブマ
イクは横80cmの位置に設置している。また両マイク
共、周囲ノイズは回し・ような条件で入力するように設
置しである。第】図において、先ず音声が入力される以
前の周囲ノイズのパワのレベルを、メインマイク1を用
いて騒音学習部7において学習しておく。
比が大きくなるように設置したメインマイク、2はメイ
ンマイクに比べSN比が小さくなるように設置したサブ
マイク、3はメインマイク1からの入力信号を前処理す
るメインマイク前処理部、4はサブマイク2からの入力
信号を前処理するサブマイク而処理部、5はメインマイ
クからの入力信号のパワを算出するメインマイクパワ算
出部、6はサブマイクからの入力信号のパワを算出する
サブマイクパワ算出部、7は騒音学習時にメインマイク
パワ算出部で算出した騒音レベルのパワに基づき音声区
間検出のためのスレッショルドptを設定する騒音学習
部、8は騒音学習部7により設定されたスレッショルド
Pvと予め定められた時間のスレッショルド時閉のスレ
ッショルドtrに基づき音声区間候補を検出する音声区
間候補検出部、9はメインマイクパワ算出部5の出力と
サブマイクパワ算出部6の出力との差(または比)を求
めるレベル差(または比)検出部、10はレベル差検出
部9の出力に基づき音声区間候補検出部8により判定さ
れた音声区間候補音声区間として採用するかまたはそれ
を棄却するかを決定する音声区間決定部である。本実施
例においては、入力用の2個のマイクロホンの内メイン
マイクは発声者の正面20cmの位置に設置し、サブマ
イクは横80cmの位置に設置している。また両マイク
共、周囲ノイズは回し・ような条件で入力するように設
置しである。第】図において、先ず音声が入力される以
前の周囲ノイズのパワのレベルを、メインマイク1を用
いて騒音学習部7において学習しておく。
以後メインマイク1の人カバワレベルの監視を続け、音
声区間候補8においてそのレベルが騒音学習部7て設定
したスレッショルドPtより大である時間がスレッショ
ルドtT以上のときにその区間を音声区間候補とし、そ
の条件を満たさない場合には以上の動作を続ける。音声
区間候補が見出された場合には、レベル差検出部9はそ
の区間における、メインマイク1からの入力の平均のパ
ワレベル(db)とサブマイク2からの入力の平均のパ
ワレベル(db)の差を計算し、音声区間決定部10は
その差が予め定めたスレッショルドTla。より大きい
ときにはその区間を音声区間とし、条件を満たさないと
きにはその音声候補区間を棄却し、ノイズレベル学習直
後の動作に戻る。ここでパワレベルのスレッショルドP
yは、前述の学習された周囲ノイズのパワレベルに、予
め定められた適当な値を加えた値とする。時間のスレッ
ショルドb、およびパワのレベルの差のスレッショルド
T16.は、予めそれぞれ適当に定められた値である。
声区間候補8においてそのレベルが騒音学習部7て設定
したスレッショルドPtより大である時間がスレッショ
ルドtT以上のときにその区間を音声区間候補とし、そ
の条件を満たさない場合には以上の動作を続ける。音声
区間候補が見出された場合には、レベル差検出部9はそ
の区間における、メインマイク1からの入力の平均のパ
ワレベル(db)とサブマイク2からの入力の平均のパ
ワレベル(db)の差を計算し、音声区間決定部10は
その差が予め定めたスレッショルドTla。より大きい
ときにはその区間を音声区間とし、条件を満たさないと
きにはその音声候補区間を棄却し、ノイズレベル学習直
後の動作に戻る。ここでパワレベルのスレッショルドP
yは、前述の学習された周囲ノイズのパワレベルに、予
め定められた適当な値を加えた値とする。時間のスレッ
ショルドb、およびパワのレベルの差のスレッショルド
T16.は、予めそれぞれ適当に定められた値である。
次に本実施例の動作を、入力例を用いて説明する。
入力例として、「アサヒ」と発声し、メインマイクへの
入力のパワが第5図のようになった場合を用いる。この
入力例は、従来の音声区間検出方法の問題点の説明に用
いたものと同じものであり、従来の音声区間検出方法で
は、真の音声区間よりも前に存在するノイズ区間を音声
区間として誤って検出してしまっていた。本実施例にお
ける音声区間検出方法ではサブマイクを用いるが、上記
入力例におけるサブマイクへの入力のパワは第7図に示
される。第7図において、横軸72は時刻、縦軸73は
パワのレベルであり、大力パワのレベルは実線75に示
すように変化した。第6図と第7図を比べると、通常の
ノイズレベルより大きなレベルのノイズが入力した場合
、そのノイズの区間66においてそのノイズのパワのレ
ベルはメインマイク、サブマイクともほぼ等しい(この
ノイズは遠方で発生されたものとする)。ところが音声
区間におけるパワのレベルは、発声者とメインマイク、
ザブマイクそれぞれとの距離が、正面20cm、横80
cmであるため、サブマイクにおけるレベルはメインマ
イクにおけるそれと比へ一12dbとなった。よって、
本実施例においてはT+ sn = 6 dbに設定さ
れているため、前記ノイズ区間においては、〔メインマ
イクのレベル〕−〔サブマイクのレベル〕=0<T1.
。 となり、正しく音声区間検出がなされる。
入力のパワが第5図のようになった場合を用いる。この
入力例は、従来の音声区間検出方法の問題点の説明に用
いたものと同じものであり、従来の音声区間検出方法で
は、真の音声区間よりも前に存在するノイズ区間を音声
区間として誤って検出してしまっていた。本実施例にお
ける音声区間検出方法ではサブマイクを用いるが、上記
入力例におけるサブマイクへの入力のパワは第7図に示
される。第7図において、横軸72は時刻、縦軸73は
パワのレベルであり、大力パワのレベルは実線75に示
すように変化した。第6図と第7図を比べると、通常の
ノイズレベルより大きなレベルのノイズが入力した場合
、そのノイズの区間66においてそのノイズのパワのレ
ベルはメインマイク、サブマイクともほぼ等しい(この
ノイズは遠方で発生されたものとする)。ところが音声
区間におけるパワのレベルは、発声者とメインマイク、
ザブマイクそれぞれとの距離が、正面20cm、横80
cmであるため、サブマイクにおけるレベルはメインマ
イクにおけるそれと比へ一12dbとなった。よって、
本実施例においてはT+ sn = 6 dbに設定さ
れているため、前記ノイズ区間においては、〔メインマ
イクのレベル〕−〔サブマイクのレベル〕=0<T1.
。 となり、正しく音声区間検出がなされる。
このように本実施例においては、2個のマイクロホンを
使用しメインマイクにおいて、事前に学習された周囲ノ
イズのレベルに比へ大きいレベルの入力が一定時間以上
続く区間を音声区間候補とした」二で、その区間が真に
音声区間であるかどうかをメインマイクとサブマイクへ
の入力のレベル差を利用してチェックすることにより、
高い確度で音声区間検出をすることができる。なお、本
実施例においては、音声区間候補という、ある程度長時
間にわたる平均パワレベルを求めるため、前述の第2の
従来例のように、動作が不安定になることもない。
使用しメインマイクにおいて、事前に学習された周囲ノ
イズのレベルに比へ大きいレベルの入力が一定時間以上
続く区間を音声区間候補とした」二で、その区間が真に
音声区間であるかどうかをメインマイクとサブマイクへ
の入力のレベル差を利用してチェックすることにより、
高い確度で音声区間検出をすることができる。なお、本
実施例においては、音声区間候補という、ある程度長時
間にわたる平均パワレベルを求めるため、前述の第2の
従来例のように、動作が不安定になることもない。
次に第2の実施例について説明する。第3図は第2の実
施例を示すフロー図であり、第1の実施例と異る部分の
み説明する。第3図において、先ずノイズレベル学習を
行うが、このとき、メインマイクのみでなくサブマイク
においてもノイズレベルの学習を行う。音声区間候補を
第1の実施例と同様に求めた後、その区間において、メ
インマイク、サブマイクそれぞれの入力における平均S
N比を求め、その値の差がスレッショルl”TS/Nよ
り大きいときにその区間を音声区間とするものである。
施例を示すフロー図であり、第1の実施例と異る部分の
み説明する。第3図において、先ずノイズレベル学習を
行うが、このとき、メインマイクのみでなくサブマイク
においてもノイズレベルの学習を行う。音声区間候補を
第1の実施例と同様に求めた後、その区間において、メ
インマイク、サブマイクそれぞれの入力における平均S
N比を求め、その値の差がスレッショルl”TS/Nよ
り大きいときにその区間を音声区間とするものである。
つまり、レベルの絶対値ではなく、それぞれのマイクに
おける入力のパワのSN比の比較を行うものである。こ
こで上記SN比を求めるときのノイズレベルNは、それ
ぞれのマイクロホンにより、音声区間検出に先だって学
習された周囲ノイズのレベルである。なお、2個のマイ
クの特性が等しく、周囲ノイズに対する設置条件に差が
ない場合には、本実施例は第1の実施例と事実上、同様
な結果、効果が得られる。しかし、第10実施例におい
ては一方のマイクロホンと交換するとスレッショルドT
l5nの値の再設定またはマイクアンプのゲインの調整
が必要であったが、第2の実施例においては、マイクロ
ホンを交換しても常に同し動作をするという利点がある
。このように第2の実施例では、2個のマイクにおける
入力のパワの絶対値の代わりにそれぞれのマイクにおけ
るSN比を用いることにより、第1の実施例と同様の効
果を持つと同時にマイクロホンを感度の異るものと交換
しても何らの調整も必要としないという利点を有する。
おける入力のパワのSN比の比較を行うものである。こ
こで上記SN比を求めるときのノイズレベルNは、それ
ぞれのマイクロホンにより、音声区間検出に先だって学
習された周囲ノイズのレベルである。なお、2個のマイ
クの特性が等しく、周囲ノイズに対する設置条件に差が
ない場合には、本実施例は第1の実施例と事実上、同様
な結果、効果が得られる。しかし、第10実施例におい
ては一方のマイクロホンと交換するとスレッショルドT
l5nの値の再設定またはマイクアンプのゲインの調整
が必要であったが、第2の実施例においては、マイクロ
ホンを交換しても常に同し動作をするという利点がある
。このように第2の実施例では、2個のマイクにおける
入力のパワの絶対値の代わりにそれぞれのマイクにおけ
るSN比を用いることにより、第1の実施例と同様の効
果を持つと同時にマイクロホンを感度の異るものと交換
しても何らの調整も必要としないという利点を有する。
(発明の効果)
本発明は上述の実施例の説明から明らかなように、2個
のマイクロホンを用い、メインマイクにおいて周囲ノイ
ズレベルよりも大きいレベルを持つ音声区間候補を見つ
けた上で、その区間が真に音声区間であるかどうかを2
個のマイクロホンにおける入力のパワのレベル、または
SN比の差または比の値を利用してチェックすることに
より、ノイズ区間を音声区間に誤ることの少ない、確度
の高い音声区間検出をすることができる。
のマイクロホンを用い、メインマイクにおいて周囲ノイ
ズレベルよりも大きいレベルを持つ音声区間候補を見つ
けた上で、その区間が真に音声区間であるかどうかを2
個のマイクロホンにおける入力のパワのレベル、または
SN比の差または比の値を利用してチェックすることに
より、ノイズ区間を音声区間に誤ることの少ない、確度
の高い音声区間検出をすることができる。
第1図は本発明の音声区間検出方法の第1の実施例を実
施するための装置の一例を示す機能ブロック図である。 第2図は本発明の実施例の音声区間検出方法を示す動作
フロー図である。 第3図は第2実施例の音声区間検出方法を示す動作フロ
ー図である。 第4図は従来の音声区間検出方法の動作を説明する動作
フロー図である。 第5図は入力音声のパワの例を示す図である。 第6図は通常の周囲ノイズレベルよりも大きいレベルの
ノイズが存在するときの入力音声のパワの例を示す図で
ある。 第7図はメインマイクにおける入力のパワが第6図で示
されるときのサブマイクにおける入力のパワな示す図で
ある。 1・・・メインマイク、2・・・サブマイク、3・・・
メインマイク前処理部、4・・・サブマイク前処理部、
5・・・メインマイクパワ算出部、6・・・サブマイク
パワ算出部、7・・・騒音学習部、8・・・音声区間候
補検出部、9・・・レベル差検出部、10・・・音声区
間決定部、52.62.72・・・時刻を示す軸、53
,63.73・・・パワのレベルを示す軸、54.64
・・・パワのスレッショルドPT、55.65.75・
・・パワのレベルの時間変化、66・・・ノイズ区間。 特許出願人 松下電器産業株式会社 第2図 第3図 第5図 第6因
施するための装置の一例を示す機能ブロック図である。 第2図は本発明の実施例の音声区間検出方法を示す動作
フロー図である。 第3図は第2実施例の音声区間検出方法を示す動作フロ
ー図である。 第4図は従来の音声区間検出方法の動作を説明する動作
フロー図である。 第5図は入力音声のパワの例を示す図である。 第6図は通常の周囲ノイズレベルよりも大きいレベルの
ノイズが存在するときの入力音声のパワの例を示す図で
ある。 第7図はメインマイクにおける入力のパワが第6図で示
されるときのサブマイクにおける入力のパワな示す図で
ある。 1・・・メインマイク、2・・・サブマイク、3・・・
メインマイク前処理部、4・・・サブマイク前処理部、
5・・・メインマイクパワ算出部、6・・・サブマイク
パワ算出部、7・・・騒音学習部、8・・・音声区間候
補検出部、9・・・レベル差検出部、10・・・音声区
間決定部、52.62.72・・・時刻を示す軸、53
,63.73・・・パワのレベルを示す軸、54.64
・・・パワのスレッショルドPT、55.65.75・
・・パワのレベルの時間変化、66・・・ノイズ区間。 特許出願人 松下電器産業株式会社 第2図 第3図 第5図 第6因
Claims (2)
- (1)2個のマイクロホンを用い、第1のマイクロホン
は発声者の音声と周囲ノイズのSN比が大きくなるよう
に設置し、第2のマイクロホンは第1のマイクロホンに
比べ前記SN比が小さくなるように設置し、第1のマイ
クロホンにおいて、周囲ノイズレベルに比べ大きいレベ
ルの入力が続いたときにその区間を音声区間候補とし、
その区間における第1および第2のそれぞれのマイクロ
ホンにおける入力レベルの差または比が、予め定められ
たスレッショルド値より大きいときにはその音声区間候
補を音声区間とし、そうでないときには、その音声区間
候補を棄却することを特徴とする音声区間検出方法。 - (2)前記音声区間候補における第1および第2のそれ
ぞれのマイクロホンにおける入力のレベルと周囲のノイ
ズレベルとの差または比が、予め定められたスレッショ
ルド値より大きいときにはその音声区間候補を音声区間
とし、そうでないときには、その音声区間候補を棄却す
ることを特徴とする特許請求範囲第(1)項記載の音声
区間検出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60181082A JPH07109559B2 (ja) | 1985-08-20 | 1985-08-20 | 音声区間検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60181082A JPH07109559B2 (ja) | 1985-08-20 | 1985-08-20 | 音声区間検出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6242197A true JPS6242197A (ja) | 1987-02-24 |
JPH07109559B2 JPH07109559B2 (ja) | 1995-11-22 |
Family
ID=16094495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60181082A Expired - Lifetime JPH07109559B2 (ja) | 1985-08-20 | 1985-08-20 | 音声区間検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07109559B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001075580A (ja) * | 1999-08-18 | 2001-03-23 | Siemens Ag | 音声認識方法および音声認識装置 |
JP2003524794A (ja) * | 1999-02-08 | 2003-08-19 | クゥアルコム・インコーポレイテッド | 雑音のある信号におけるスピーチのエンドポイント決定 |
JP2008304498A (ja) * | 2007-06-05 | 2008-12-18 | Yamaha Corp | 音声検出装置、音声会議システムおよび遠隔会議システム |
US7697699B2 (en) | 2004-04-12 | 2010-04-13 | Sony Corporation | Method of and apparatus for reducing noise |
JP2016226024A (ja) * | 2016-08-16 | 2016-12-28 | 富士ゼロックス株式会社 | 音声解析装置および音声解析システム |
-
1985
- 1985-08-20 JP JP60181082A patent/JPH07109559B2/ja not_active Expired - Lifetime
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003524794A (ja) * | 1999-02-08 | 2003-08-19 | クゥアルコム・インコーポレイテッド | 雑音のある信号におけるスピーチのエンドポイント決定 |
JP2001075580A (ja) * | 1999-08-18 | 2001-03-23 | Siemens Ag | 音声認識方法および音声認識装置 |
JP4520596B2 (ja) * | 1999-08-18 | 2010-08-04 | シーメンス アクチエンゲゼルシヤフト | 音声認識方法および音声認識装置 |
US7697699B2 (en) | 2004-04-12 | 2010-04-13 | Sony Corporation | Method of and apparatus for reducing noise |
JP2008304498A (ja) * | 2007-06-05 | 2008-12-18 | Yamaha Corp | 音声検出装置、音声会議システムおよび遠隔会議システム |
JP2016226024A (ja) * | 2016-08-16 | 2016-12-28 | 富士ゼロックス株式会社 | 音声解析装置および音声解析システム |
Also Published As
Publication number | Publication date |
---|---|
JPH07109559B2 (ja) | 1995-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106531172B (zh) | 基于环境噪声变化检测的说话人语音回放鉴别方法及系统 | |
KR101437830B1 (ko) | 음성 구간 검출 방법 및 장치 | |
US9959886B2 (en) | Spectral comb voice activity detection | |
US7359856B2 (en) | Speech detection system in an audio signal in noisy surrounding | |
JPS59139099A (ja) | 音声区間検出装置 | |
JP3105465B2 (ja) | 音声区間検出方法 | |
US6868378B1 (en) | Process for voice recognition in a noisy acoustic signal and system implementing this process | |
EP0614169B1 (en) | Voice signal processing device | |
JPS6242197A (ja) | 音声区間検出方法 | |
JP2002538514A (ja) | 周波数スペクトラムにおける確率論的信頼度を用いた音声検出方法 | |
Koolwaaij et al. | Local normalization and delayed decision making in speaker detection and tracking | |
JP3520430B2 (ja) | 左右音像方向抽出方法 | |
JPH03114100A (ja) | 音声区間検出装置 | |
JP3026855B2 (ja) | 音声認識装置 | |
JPH034918B2 (ja) | ||
JP2737109B2 (ja) | 音声区間検出方式 | |
JPH0567039B2 (ja) | ||
JPS6131478B2 (ja) | ||
JPH09127982A (ja) | 音声認識装置 | |
JPH07225592A (ja) | 有音区間検出装置 | |
JPH04340598A (ja) | 音声認識装置 | |
JP2000155600A (ja) | 音声認識システムおよび入力音声レベル警告方法 | |
JPH0398098A (ja) | 音声認識装置 | |
Oh et al. | Endpoint detection of isolated Korean utterances for bimodal speech recognition in acoustic noisy environments | |
JP2003271189A (ja) | 話者方向検出回路及びその検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |