JPH0285898A - 音声検出方式 - Google Patents

音声検出方式

Info

Publication number
JPH0285898A
JPH0285898A JP63238051A JP23805188A JPH0285898A JP H0285898 A JPH0285898 A JP H0285898A JP 63238051 A JP63238051 A JP 63238051A JP 23805188 A JP23805188 A JP 23805188A JP H0285898 A JPH0285898 A JP H0285898A
Authority
JP
Japan
Prior art keywords
value
waveform
amplitude
input signal
periodicity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63238051A
Other languages
English (en)
Inventor
Shingo Nishimura
新吾 西村
Masashi Miyagawa
宮川 正志
Masayuki Unno
海野 雅幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sekisui Chemical Co Ltd
Original Assignee
Sekisui Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sekisui Chemical Co Ltd filed Critical Sekisui Chemical Co Ltd
Priority to JP63238051A priority Critical patent/JPH0285898A/ja
Publication of JPH0285898A publication Critical patent/JPH0285898A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野] 本発明は、音声検出方式に関する。
[従来の技術] 従来、雑音環境下て音声の存在を検出する方法は多数あ
り、特公昭57−12999号公報に記載されているよ
うな通信における音声区間の検出に用いたり、音声言語
内容の認識の前処理に用いたりされているが、高雑音下
での一般用途への展開は困難で、例えば、着信ベル音が
鳴っているような状態でのハンズフリー電話機の音声に
よる応答開始等ができなかった。
なお、雑音環境下で簡易に音声の存在を検出する方法と
しては、入力信号か一定時間間隔内に参照軸な横切る回
数を検出する方法があった。
[発明が解決しようとする課題] しかしながら、上記従来の音声検出方式を用いる方法に
あっては、一般に雑音の振幅は音声の振幅に比較して小
さいという前提を用いており、雑音の振幅が音声の振幅
と同程度の場合、音声の存在を検出することができない
そこで本出願人は、雑音環境下ての音声の存在を簡易に
検出することができる音声検出方式として、■入力信号
の参照軸交差数と波高値(波形の振幅レベルの無次元化
N)とを特徴パラメータとして有声音を検出する方法、
■入力信号の参照軸交差数と圧基準振幅時間(波形の振
幅が一定時間間隔内に実効値を目安とするしきい値を越
える時間)とを特徴パラメータとして有声音を検出する
方法を提案している。
上記■、■の音声検出方式は、従来方式に比して有用で
あるものの、以下の理由によりその有声音検出率の向上
に限界かある。
すなわち、上記■、■の場合には、有声音のもつ基本的
な特徴の1つである波形の周期性に関する情報量(声帯
に固有の情報量)が不足しているため、有声音検出率を
向上するのに困難がある。
本発明は、雑音の振幅か大きく音声の検出に対する影響
が大きい場合にも、雑音環境下での音声の存在を、簡易
に高い検出率で検出することを目的とする。
[課題を解決するための手段] 請求項1に記載の本発明は、入力信号の参照軸交差数と
、波形の振幅分布に関する値と、波形の周期性に関する
値とを特徴パラメータとして算出し、この算出結果を、
有声音と特定雑音についての辞書データと比較し、入力
信号か有声音を含むかどうかを判定するようにしたもの
である。ここで、参照軸交差数は、入力信号か一定時間
内に零レベル等、予め定めた参照レベルを横切る回数で
あり、入力信号か有声音を含む場合、一般にある一定範
囲内の値を示す。
請求項2に記載の本発明は、前記波形の振幅分布に関す
る値として、例えば次式で表わされる波高値Pを用いる
ようにしたものである。この波高値は、入力信号か有声
音を含む場合、一般にある一定範囲内の値を示す。
p = 20X lOgto (Vp/Vr□)ただし
、vPニ一定時間間隔内の振幅の絶対値の最大値 ■、、M、二同一定時間間隔内の振幅の実効値 請求項3に記載の本発明は、前記波形の振幅分布に関す
る値として、例えば次式で表わされる波高値Pを用いる
ようにしたものである。この波高値は、入力信号が有声
音を含む場合、一般にある一定範囲内の値を示す。
P =20X log+o(Vp/Va)ただし、vP
ニ一定時間間隔内の振幅の絶対値の最大値 ■、:同一定時間間隔内の振幅の 絶対値の平均値 請求項4に記載の本発明は、前記波形の振幅分布に関す
る値として振幅が一定時間間隔内に実効値を目安とする
しきい値を越える時間(圧基準振幅時間と呼ぶ)を用い
るようにしたものである。この圧基準振幅時間は、入力
信号が有声音を含む場合、一般にある一定範囲内の値を
示す。
請求項5に記載の本発明は、前記波形の周期性に関する
値として入力信号の極性相関係数の最大値を用いるよう
にしたものである。
この時、本発明で用いる極性相関係数とは、入力信号(
アナログデータ)を標本化周期t [m5eclで標本
化した標本値(デジタルデータ) x (n)(n=0
.1.・・・、 N−1)に対し、ここてsign(x
 (n))= +1  (x (n)≧0)= −1(
x(n) <O) ■(次数) =o、i、・・・、N−1で示される。こ
れは、1個たけ離れた(時間的にt X i [o+5
eclだけ離れた)標本値の符号間の積和であり、1個
たけ離れたデータ間にどれくらい対応関係(相関)があ
るかを示す。
一般に有声音の音声波形には強い周期性がみられ、その
周期は2.5〜10.0 [m5eclの範囲内にある
。そのため、入力信号が有声音を含む場合、その極性相
関係数r (ilは、txtか2.5〜10.0[m5
ec]  (すなわち次数1が2.5/l 〜10.0
/l)の範囲で極大値をもつ9周期性か明瞭であるほど
、その極大値は大きくなる。本発明では、次数1が2.
5/l −10,0/lの範囲内での極性相関係数r 
(i)の最大値を周期性に関する値とする。
波形の周期性に関する値としては、その他、極性相関係
数の代わりに、−殻内に知られている特徴パラメータで
ある自己相関、残差相関、ケプストラム、平均振幅差関
数(Average MagnitudeDiffer
ence Function )を用いることも可能で
ある。
[作用コ 請求項1に記載の本発明にあっては、雑音環境下の音声
を以下の如く検出する。なお、本発明にあっては、有声
音(母音、半母音、鼻音等の声帯の振動をともなう音で
あり、人間が発声する殆どすべての音声には有声音が含
まれている)をもって音声とする。
(1)有声音と特定雑音について、それらの信号の一定
時間間隔内における参照軸交差数と波形の振幅分布に関
する値と、波形の周期性に関する値とを特徴パラメータ
とする辞書データを用意する。
辞書データとしては、例えば、下記(a)(b) 、 
 (c)が用いられる。
(a)多数の音声から得られた有声音についての特徴パ
ラメータの組。
(b)特定雑音(例えば特定電話機の着信ベル音)につ
いて求められた多数の特徴パラメータの組。
(c)有声音と、特定雑音とを特定の比率で加え合わせ
た結果を多数の音声について求めた特徴パラメータの組
なお、上記(al  (b)、(c)のデータは、音響
データを特徴パラメータ化した数値データ、数値データ
を統計処理した平均値、分散等の統計的データ、もしく
は統計的データに基づいて定まる境界方程式等の判別式
データ等の各種態様にて用意できる。
(2)入力信号を採取し、この入力信号の一定時間間隔
内における参照軸交差数と波形の振幅分布に関する値と
波形の周期性に関する値、とを特徴パラメータとして算
出する。
(3)上記(2)で算出した特徴パラメータと、上記(
1)で定めた辞書データが規定する標準パターンとを、
パラメータ空間上で比較し、入力信号か有声音を含むか
どうかをパターン認識により判定する。
辞書データを用いて上述のパターン認識は例えば以下の
如くなされる。
■辞書データが規定するカテゴリー「有声音j(前記(
a)の有声音、もしくは前記(c)の特定雑音を特定の
比率で加え合わされた有声音のカテゴリー)と、カテゴ
リー「その他」とで2分されるパラメータ空間を構成し
、入力信号の特徴パラメータがどちらのカテゴリーに属
するかを判定する。
0次に、特定雑音の振幅が大きく、これが有゛声音の検
出に大きく影響を与えることの可能性を考慮し、上記■
に加え、カテゴリー「特定雑音」とカテゴリー「有声音
」の境界を定め、入力信号の特徴パラメータがどちらの
カテゴリーに属するかを判定する。
■上記■、■の判定の結果、入力信号が、■においてカ
テゴリー「有声音」に属し、かつ■においてカテゴリー
「特定雑音」に属さないことを条件に、入力信号中に有
声音が存在することを判定する。
しかして、請求項1に記載の本発明にあっては、参照軸
交差数と波形の振幅分布に関する値の2つの特徴パラメ
ータのみを用いる場合に比して、有声音のもつ基本的な
特徴の1っである波形の周期性を反映した特徴パラメー
タを第3のパラメータとして用いることから、特定雑音
の振幅が大きく音声の検出に対する影響が支配的である
場台にも、カテゴリー「有声音」とカテゴリー「特定雑
音」とをパラメータ空間において明瞭に分離でき、雑音
環境下での音声の存在を、簡易に高い検出率て検出でき
る。
請求項2に記載の本発明によれば、波形の振幅分布に関
する値として、前述した如くの波高値を用いたから、有
声音の特徴である先鋭な波形を忠実に反映したパラメー
タ値を用いることとなり、雑音の識別性が向上するとい
うメリットがある。
請求項3に記載の本発明によれは、波形の振幅分布に関
する値として、前述した如くの波高値を用いたから、請
求項2に記載の本発明に比して演算量を少なくてき、か
つ有声音の特徴である先鋭な波形を比較的忠実に反映し
たパラメータ値を用いることとなり、雑音の識別性が向
上するというメリットがある。なお、演算量が少ないと
いうことは応答速度が速いことを特徴する 請求項4に記載の本発明によれば、波形の振幅分布に関
する値として、前述した如くの圧基準振幅時間を用いた
から、請求項2または3に記載の本発明に比して演算量
をより少なくできるというメリットがある。
請求項5に記載の本発明によれば、波形の周期性に関す
る値として、前述した如くの極性相関係数の最大値を用
いたから、少ない演算量で波形の周期性に関する値を得
ることができるというメリットがある。
[実施例] 第1図は本発明の実施に用いられる音声検出装置の一例
を示すブロック図、第2図は本発明の特徴パラメータに
よって形成されるパラメータ空間を示す模式図である。
第1図において、11はマイク、12は増幅器、13は
ローパスフィルタ、14はA/Dコンバータ、15はパ
ラメータ計算部、16は辞書データ記憶部、17は判定
部、18は結果出力部である。この実施例にあっては、
雑音環境下の音声を以下の如く検出する。
(1)有声音と特定雑音について、それらの信号の20
m5間における参照軸交差数X1と、波形の振幅分布に
関する値x2と、波形の周期性に関する値Xffとを特
徴パラメータとする辞書データを用意し、これを辞書デ
ータ記憶部16に記憶せしめる。
ここで、波形の振幅分布に関する値X2としては、下記
■、■、■のいずれかを用いることができる。
■下式で表わされる波高値P0 P = 20X log+o(Vp/Vr+ws)たた
し、VPユニー時間間隔内の振幅の絶対値の最大値 ■、、□ :同一定時間間隔内の振幅の実効値 ■下式で表わされる波高値P。
P = 20X log+o(Vp/Va)ただし、V
pコニ−時間間隔内の振幅の絶対値の最大値 Vl:同一定時間間隔内の振幅の 絶対値の平均値 ■振幅が一定時間間隔内に実効値を目安とするしきい値
を越える時間(圧基準振幅時間)。
上記■の波高値を用いる場合には、有声音の特徴である
先鋭な波形を比較的忠実に反映したパラメータ値を用い
ることとなり、雑音の識別性か向上するというメリット
がある。
上記■の波高値を用いる場合には、上記■の波高値に比
して演算量を少なくてき、かつ有声音の特徴である先鋭
な波形を忠実に反映したパラメータ値を用いることとな
り、雑音の識別性か向」二するというメリットかある。
上記■の波高値を用いる場合には、上記■、■の波高値
に比して演算■をより少なくできるというメリットかあ
る。
また、波形の周期性に関する値X−1としては、前述し
た、人力信号の極性相関係数の最大値を用いることかて
きる。この極性相関係数の最大値を用いる場合には、少
ない演算量で波形の周期性に関する値を得ることがてき
るというメリットがある。
また、辞書データとしては、例えは下記(a)、(b)
、および(clが作成される。
(a)多数の音声から得られた有声音[ア]についての
特徴パラメータの組。
(b)特定雑音(特定電話機の着信ベル音)について求
められた多数の特徴パラメータの組。
(C)有声音[ア]と特定雑音とを、 20XlOg+o (Sr+++g/Nr、、1m) 
[dB]て定義される有声音対特定雑音比−10[dB
]て加え合わせた結果を多数の音声について求めた特徴
パラメータの組、なお、S r、gは有声音「ア」の振
幅の実効値を表わし、Nr□、は特定雑音の振幅の実効
値を表わす。
(2)マイク11にて人力信号を採取し、この入力信号
を、増幅器12で増幅し、ローバスフイ入夕13を通ず
ことによって4.2Kllz以上の成分はカッ1〜し、
A/Dコンバータ14によって標本化周波数10にtl
z 、変換ビット数16bitのデジタル信号に変換し
、パラメータ計算部15に送り込む。パラメータ計算部
15は、上記入力信号の20 +n 3間における参照
軸交差数×1と、波形の振幅分布に関する値×2と、波
形の周期性に関する値X、とを特徴パラメータとして算
出する。
(3)上記(2)で算出した特徴パラメータと、上記(
1)で定めた辞書データが規定する標準パターンとを、
判定部17において比較し、入力信号か有声音を含むか
どうかを判定し、この判定結果を結果出力部18から出
力する。
ここて、前述の辞書データを用いたパターン認識は、例
えば第2図のパラメータ空間上で以下の如くなされる。
なお、第2図は零交差数(参照軸レベルを零レベルに設
定したもの)と波形の振幅分布に関する値と波形の周期
性に関する値の3つの特徴パラメータをそれぞれXl軸
と×2軸と×3軸にとったものである。第2図において
、μm、σ1σ1□、σ13はそれぞれ有声音(前記(
a)の有声音[アコ、もしくは前記(C)の特定雑音を
特定の有声音対特定雑音比で加え合わされた有声音)の
辞書パラメータの平均値、×11成分の標準偏差、×2
2成分の標準偏差、×33成分の標準偏差を表わし、μ
2、21、σ2□、σ23はそれぞれ特定σ 雑音の辞書パラメータについての同様の値を表わす。
■辞書データか規定するカテゴリー「有声音」(前記(
a)の有声音[ア]、もしくは前記(c)の特定雑音を
特定の比率て加え合わせた有声音のカテゴリー)と、カ
テゴリー「その他」とを2分する境界1を定める。境界
1にあっては、有声音の辞調データの平均値μmを含む
側がカテゴリー「有声音」である。この境界1は、平均
値のまわりにどれたけ有声音の辞書データが集中してい
るかを表わす集中楕円てあり、軸の長さを変えることに
より有声音の辞書データが楕円内に入る割合を変えるこ
とかできる。この実施例の場合は有声音の辞書データの
9割が楕円内に入るように軸の長さを定めた。破線はμ
とσて規定されるカテゴリー「有声音」の概念を表わす
。すなわち、この■の過程にあっては、入力信号の特徴
パラメータか境界1のいずれの側のカテゴリーに属する
かを判定することとなる。
■次に、特定雑音の振幅が大きく、これか有声音の検出
に大きく影響を与えることの可能性を考慮し、上記■に
加え、カテゴリー「特定雑音」とカテゴリー「有声音」
の境界2を定める。境界2にあっては、特定雑音の平均
値μ2を含む側がカテゴリー「特定雑音」となる。この
境界2は、カテゴリー「有声音」とカテゴリー「特定雑
音」に対する尤度か等しい点の集まりである。この実施
例の場合には特定雑音の標準偏差か、人工的に作られた
電話機の着信ベル音であって、有声音と特定雑音を特定
の有声音対特定雑音比で加え合わせたものの辞書データ
の標準偏差より一般的に小さいのて、カテゴリー「特定
雑音」か閉じた空間にな9ている。破線はμとσで規定
されるカテゴリー「特定雑音」の概念を表わす。すなわ
ち、この■の過程にあっては、入力信号の特徴パラメー
タか境界2のいずれの側のカテゴリーに属するかを判定
することとなる。
■上記■、■の判定の結果、入力信号が、特徴パラメー
タ空間上て、■において境界1のμm側に属し、かつ■
において境界2のμ2側に属さない時、入力信号をカテ
ゴリー「有声音」に属すると判定する。すなわち、入力
信号中に有声音か存在することを判定する。
しかして、上記実施例にあっては、参照軸交差数と波形
の振幅分布に関する値の2つの特徴パラメータのみを用
いる場合に比して、有声音のもつ基本的な特徴の1つで
ある波形の周期性を反映した特徴パラメータを第3のパ
ラメータとして用いることから、特定雑音の振幅か大き
く音声の検出に対する影響か大きい場合にも、カテゴリ
ー「有声音」とカテゴリー「特定雑音」とをパラメータ
空間において明瞭に分離でき、雑音環境下ての音声の存
在を、簡易に高い検出率て検出てきる。
特に、有声音対特定雑音比−10[dB]の非常に雑音
の大きな環境下で実験を行なった結果、■零交差数と波
高値を特徴パラメータとして有声音を検出する場合、検
出率は50[%]、■零交差数と超基僧振幅時間を特徴
パラメータとして有声音を検出する場合、60[%]で
あったか、上記実施例の場合には90[%コとなり本発
明の効果か表われている。
なお、上記実施例においては、特徴パラメータ空間上で
標準パターンを規定する境界線として集中楕円と2つの
カテゴリーに対する尤度が等しくなる点の集まりを用い
たが、本発明の実施においては、もちろん他の一般的な
パターン認識の手法を用いることができる。例えば、カ
テゴリー「有声音」とカテゴリー「特定雑音」に対する
尤度が等しくなる点の集まりの代わりに、Mahara
nobis距離やEuclid距離が等しくなる点の集
まり等を用いることかできる。
[発明の効果コ 以上のように本発明によれば、雑音の振幅が大きく音声
の検出に対する影響か大きい場合にも、雑音環境下ての
音声の存在を、簡易に高い検出率て検出することができ
る。
【図面の簡単な説明】
第1図は本発明の実施に用いられる音声検出装置の一例
を示すブロック図、第2図は本発明の特徴パラメータに
よって形成されるパラメータ空間を示す模式図である。 11・・・マイク、 15・・・パラメータ計算部、 16・・・占?害データ5己憶部、 17・・・制定部。 18・・・結果出力部。 第1図 特許出願人 積水化学工業株式会社 代表者  廣1)馨

Claims (5)

    【特許請求の範囲】
  1. (1)入力信号の参照軸交差数と、波形の振幅分布に関
    する値と、波形の周期性に関する値とを特徴パラメータ
    として算出し、この算出結果を、有声音と特定雑音につ
    いての辞書データと比較し、入力信号が有声音を含むか
    どうかを判定する音声検出方式。
  2. (2)前記波形の振幅分布に関する値として一定時間間
    隔内の振幅の絶対値の最大値に対する該一定時間間隔内
    の振幅の実効値の比で表わされる波高値を用いる請求項
    1記載の音声検出方式。
  3. (3)前記波形の振幅分布に関する値として一定時間間
    隔内の振幅の絶対値の最大値に対する該一定時間間隔内
    の振幅の絶対値の平均値の比で表わされる波高値を用い
    る請求項1記載の音声検出方式。
  4. (4)前記波形の振幅分布に関する値として振幅が一定
    時間間隔内に実効値を目安とするしきい値を越える時間
    を用いる請求項1記載の音声検出方式。
  5. (5)前記波形の周期性に関する値として入力信号の極
    性相関係数の最大値を用いる請求項1記載の音声検出方
    式。
JP63238051A 1988-09-22 1988-09-22 音声検出方式 Pending JPH0285898A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63238051A JPH0285898A (ja) 1988-09-22 1988-09-22 音声検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63238051A JPH0285898A (ja) 1988-09-22 1988-09-22 音声検出方式

Publications (1)

Publication Number Publication Date
JPH0285898A true JPH0285898A (ja) 1990-03-27

Family

ID=17024436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63238051A Pending JPH0285898A (ja) 1988-09-22 1988-09-22 音声検出方式

Country Status (1)

Country Link
JP (1) JPH0285898A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05227332A (ja) * 1991-10-25 1993-09-03 Internatl Business Mach Corp <Ibm> 通信線における音声存在の検出方法
KR100921661B1 (ko) * 2005-08-01 2009-10-15 다이킨 고교 가부시키가이샤 축류 팬

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5925237A (ja) * 1982-08-03 1984-02-09 Hitachi Ltd 半導体装置
JPS60114900A (ja) * 1983-11-25 1985-06-21 松下電器産業株式会社 有音・無音判定法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5925237A (ja) * 1982-08-03 1984-02-09 Hitachi Ltd 半導体装置
JPS60114900A (ja) * 1983-11-25 1985-06-21 松下電器産業株式会社 有音・無音判定法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05227332A (ja) * 1991-10-25 1993-09-03 Internatl Business Mach Corp <Ibm> 通信線における音声存在の検出方法
KR100921661B1 (ko) * 2005-08-01 2009-10-15 다이킨 고교 가부시키가이샤 축류 팬

Similar Documents

Publication Publication Date Title
JPH06332492A (ja) 音声検出方法および検出装置
JPH0990974A (ja) 信号処理方法
JP6758890B2 (ja) 音声判別装置、音声判別方法、コンピュータプログラム
KR20050080649A (ko) 유성음 및 무성음 검출방법 및 장치
JPH0285898A (ja) 音声検出方式
JP2797861B2 (ja) 音声検出方法および音声検出装置
JP2559475B2 (ja) 音声検出方式
JPH0449952B2 (ja)
JP2992324B2 (ja) 音声区間検出方法
JP2599974B2 (ja) 音声検出方式
Nilsson et al. Human whistle detection and frequency estimation
JP2557497B2 (ja) 男女声の識別方法
JPS6367197B2 (ja)
JPH0285897A (ja) 音声検出方式
JPH04369698A (ja) 音声認識方式
JPH0424692A (ja) 音声区間検出方式
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JPS59124397A (ja) 無音区間検出回路
JPH04324499A (ja) 音声認識装置
JPH02289899A (ja) 音声検出方式
JP3065739B2 (ja) 音声区間検出装置
JPH0546196A (ja) 音声認識装置
JP2951333B2 (ja) 音声信号の区間判別方法
JP2975808B2 (ja) 音声認識装置
JPH0297998A (ja) 音声判定方式