JPS63262693A - 音声判定検出装置 - Google Patents
音声判定検出装置Info
- Publication number
- JPS63262693A JPS63262693A JP62097779A JP9777987A JPS63262693A JP S63262693 A JPS63262693 A JP S63262693A JP 62097779 A JP62097779 A JP 62097779A JP 9777987 A JP9777987 A JP 9777987A JP S63262693 A JPS63262693 A JP S63262693A
- Authority
- JP
- Japan
- Prior art keywords
- coefficients
- voice
- distance
- line spectrum
- lsp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は入力する音声を判定して検出する装置に関し、
とくに音声認識装置などにおける入力音声の存在範囲を
判定し検出する音声判定検出装置に関する。
とくに音声認識装置などにおける入力音声の存在範囲を
判定し検出する音声判定検出装置に関する。
従来、音声区間を判定検出する音声判定検出装置は、第
4図に示されるように、入力する音に対応する入力信号
1からレベルを抽出する回路8と、音声入力時の雑音レ
ベル、ならびに入力音声レベルなどによってレベルのし
きい値を設定し、該しきい値と、前記レベル抽出回路8
から送出される入力レベル信号9とを比較して、該入力
レベル信号9が大である状態が、定められた一定時間以
上継続したとき、音声区間の始端と判定し、そののち、
前記しきい値と当該入力レベル信号9とを比較して、該
入力レベル信号9が小である状態が、定められた一定時
間以上継続したときに、音声区間の終端と判定して、音
声区間の始端ならびに終端の判定信号11を送出するし
きい値設定回路10と、該音声区間始端終端判定信号1
1を入力して、音声検出の結果信号7を送出する音声区
間の検出回路12と、を備えていて、上述の判定により
決定された始端から終端までを、音声区間として検出し
ていた。
4図に示されるように、入力する音に対応する入力信号
1からレベルを抽出する回路8と、音声入力時の雑音レ
ベル、ならびに入力音声レベルなどによってレベルのし
きい値を設定し、該しきい値と、前記レベル抽出回路8
から送出される入力レベル信号9とを比較して、該入力
レベル信号9が大である状態が、定められた一定時間以
上継続したとき、音声区間の始端と判定し、そののち、
前記しきい値と当該入力レベル信号9とを比較して、該
入力レベル信号9が小である状態が、定められた一定時
間以上継続したときに、音声区間の終端と判定して、音
声区間の始端ならびに終端の判定信号11を送出するし
きい値設定回路10と、該音声区間始端終端判定信号1
1を入力して、音声検出の結果信号7を送出する音声区
間の検出回路12と、を備えていて、上述の判定により
決定された始端から終端までを、音声区間として検出し
ていた。
上述した従来の音声判定検出装置は、入力音声のパワー
情報を用いるため、周囲雑音が混入しやすく、入力音声
と周囲雑音との区別が困難という欠点がある。
情報を用いるため、周囲雑音が混入しやすく、入力音声
と周囲雑音との区別が困難という欠点がある。
本発明の音声判定検出装置は、入力信号を一定の抽出区
間ごとに線スペクトル対係数に変換する変換回路と、該
変換された線スペクトル対係数の隣接する係数間の距離
が、しきい値より大きいか小さいかを判定する係数間距
離の判定回路と、該係数間距離判定回路の判定結果が、
連続して一定時間以」二継続したかどうかを判定し音声
を検出する有声音判定回路と、を備えている。
間ごとに線スペクトル対係数に変換する変換回路と、該
変換された線スペクトル対係数の隣接する係数間の距離
が、しきい値より大きいか小さいかを判定する係数間距
離の判定回路と、該係数間距離判定回路の判定結果が、
連続して一定時間以」二継続したかどうかを判定し音声
を検出する有声音判定回路と、を備えている。
したがって本発明によると、入力信号が音声信号である
か否かの判定に、線スペク)・ル対係数の係数間距離を
用いるため、周囲雑音があっても音声を判定し検出する
ことができる。
か否かの判定に、線スペク)・ル対係数の係数間距離を
用いるため、周囲雑音があっても音声を判定し検出する
ことができる。
〔実施例〕
以下に本発明を、その実施例について図面を参照して説
明する。
明する。
第1図は本発明による一実施例を示すブロック図、第2
図ならびに第3図はそれぞれ、同上の実施例を説明する
グラフ図である。入力する音に対応する入力信号lは、
通常、周囲雑音を含んでいる。線スペクトル対の変換回
路2は、入力信号1を、線形予測符号化法の一種である
線スペクトル対(Line Spectrum Pa1
r、以下、LSPと称す)方式により、周波数領域のパ
ラメータである線スペクトル対(LSP)係数の信号3
に変換する。
図ならびに第3図はそれぞれ、同上の実施例を説明する
グラフ図である。入力する音に対応する入力信号lは、
通常、周囲雑音を含んでいる。線スペクトル対の変換回
路2は、入力信号1を、線形予測符号化法の一種である
線スペクトル対(Line Spectrum Pa1
r、以下、LSPと称す)方式により、周波数領域のパ
ラメータである線スペクトル対(LSP)係数の信号3
に変換する。
たとえば、LSP係数は、分析次数を8次で計算すると
、第2図、第3図の如く、Wl 、 w2 。
、第2図、第3図の如く、Wl 、 w2 。
W3、〜.wBの8個が求められる。なお、分析は、標
本化周波数が8 kHzで、帯域幅を電話帯域の0.4
へ−3,4kHzとし、分析フレーム周期を10〜20
m秒とする。
本化周波数が8 kHzで、帯域幅を電話帯域の0.4
へ−3,4kHzとし、分析フレーム周期を10〜20
m秒とする。
また、LSPについては、1881年2月2日発行のr
8経工1/りl・ロニクスJ No、257の記事「
線スペクトル周波数をパラメータとした音声合成法とそ
のLSI化J P、P、 128〜158に解説されて
いる。
8経工1/りl・ロニクスJ No、257の記事「
線スペクトル周波数をパラメータとした音声合成法とそ
のLSI化J P、P、 128〜158に解説されて
いる。
L S P係数W1〜Wpは、周波数領域のパラメータ
であって、音声のホルマント周波数F、〜F P/2の
近ぼうに集中するという性質があり、また、各LSP係
数W1〜Wp間には、次の関係が成立している。すなわ
ち、O<W、<W2<・・・< W p−1< W p
<πであり、ここでPは分析次数である。
であって、音声のホルマント周波数F、〜F P/2の
近ぼうに集中するという性質があり、また、各LSP係
数W1〜Wp間には、次の関係が成立している。すなわ
ち、O<W、<W2<・・・< W p−1< W p
<πであり、ここでPは分析次数である。
この性質を利用して、係数間距離の判定回路4により、
線スペクトル対係数信号3にて、第2図のように隣接す
るLSP係数間の距離(W、、−W+)〜(W8 W
7)を計算する。
線スペクトル対係数信号3にて、第2図のように隣接す
るLSP係数間の距離(W、、−W+)〜(W8 W
7)を計算する。
係数間圧fin (W−Wn−1)の計算方法の一例を
つぎに述べる。LSP分析の次数がP次のとき、n=2
.3.・・・Pにおいて、次式を計算する。
つぎに述べる。LSP分析の次数がP次のとき、n=2
.3.・・・Pにおいて、次式を計算する。
(W n W n−+ ) < W TM 1 −
−−− (1)(Wn w 、T−1) <
WT82 −一−−(2)なお、W Tel
1 とW T142 とは、LSP係数間距離(Wn
−wn−、)のしきい値であり、wT、1<W to
2に設定される。
−−− (1)(Wn w 、T−1) <
WT82 −一−−(2)なお、W Tel
1 とW T142 とは、LSP係数間距離(Wn
−wn−、)のしきい値であり、wT、1<W to
2に設定される。
(1)式を満足するLSP係数Wl−wpが1個以上存
在し、かつ(2)式を満足するLSP係数係数−1〜W
p個以上存在すれば、係数間距離判定結果の信号5が、
有声音であると判定され、次に有声音の判定回路6は、
係数間距離判定結果信号5が有声音であることを、たと
えば連続して3フレーム継続して入力されると、音声検
出結果の信号7を出力する。
在し、かつ(2)式を満足するLSP係数係数−1〜W
p個以上存在すれば、係数間距離判定結果の信号5が、
有声音であると判定され、次に有声音の判定回路6は、
係数間距離判定結果信号5が有声音であることを、たと
えば連続して3フレーム継続して入力されると、音声検
出結果の信号7を出力する。
第2図は、第1図の実施例において、有声音の場合の周
波数スペクトルとLSP係数との関係を示し、また第3
図は、第1図の実施例において、無声音あるいは周囲雑
音の周波数スペクトルとLSP係数との関係を示す。
波数スペクトルとLSP係数との関係を示し、また第3
図は、第1図の実施例において、無声音あるいは周囲雑
音の周波数スペクトルとLSP係数との関係を示す。
第2図から分かるように、有声音の場合、ホルマン)・
周波数F1〜F4の近ぼうにLSP係数係数−1〜W8
中している。また、第1ホルマント周波数F1は一般に
共振の利得が高いため、LSP係数Wl 、w2の集中
度も強まって、LSP係数間距l!1L(W2−Wl)
は、しきい値WTHIより小さくなり、第2ホルマント
周波数F2近ぼうのLSF係数間距gl((W4−w3
)はしきい値W 7H2よりも小さくなる。
周波数F1〜F4の近ぼうにLSP係数係数−1〜W8
中している。また、第1ホルマント周波数F1は一般に
共振の利得が高いため、LSP係数Wl 、w2の集中
度も強まって、LSP係数間距l!1L(W2−Wl)
は、しきい値WTHIより小さくなり、第2ホルマント
周波数F2近ぼうのLSF係数間距gl((W4−w3
)はしきい値W 7H2よりも小さくなる。
しかし無声音や周囲雑音の場合、第3図の如く、周波数
スペクトルが平坦であり、LSP係数係数−1〜w8中
は少ない。このため、LSP係数間距gI (Wn
Wn−+ )はしきい値WTHIIw to 2 より
小さくなることはない。
スペクトルが平坦であり、LSP係数係数−1〜w8中
は少ない。このため、LSP係数間距gI (Wn
Wn−+ )はしきい値WTHIIw to 2 より
小さくなることはない。
以上説明したように本発明は、入力信号が音声信号であ
るかどうかを判定するために、入力信号レベルの大きさ
で判定するかわりに、線スペクトル対係数の係数間距離
を用いることにより、周囲雑音にうもれた音声でも、有
声音であれば検出することが可能であるから、音声認識
装置における認識率の向上に効果がある。
るかどうかを判定するために、入力信号レベルの大きさ
で判定するかわりに、線スペクトル対係数の係数間距離
を用いることにより、周囲雑音にうもれた音声でも、有
声音であれば検出することが可能であるから、音声認識
装置における認識率の向上に効果がある。
第1図は本発明による一実施例を示すブロック図、第2
図ならびに第3図は、それぞれ同上を説明するためのグ
ラフ図、第4図は従来例を示すブロック図である。 2・・・線スペクトル対変換回路、 4・・・係数間距離判定回路、 6・・・有声音判定回路。 第1図 しSPを1文 第3図
図ならびに第3図は、それぞれ同上を説明するためのグ
ラフ図、第4図は従来例を示すブロック図である。 2・・・線スペクトル対変換回路、 4・・・係数間距離判定回路、 6・・・有声音判定回路。 第1図 しSPを1文 第3図
Claims (1)
- 【特許請求の範囲】 入力信号を一定の抽出区間ごとに線スペクトル対係数に
変換する変換回路と、 該変換された線スペクトル対係数の隣接する係数間の距
離が、しきい値より大きいか小さいかを判定する係数間
距離の判定回路と、 該係数間距離判定回路の判定結果が、連続して一定時間
以上継続したかどうかを判定し音声を検出する有声音判
定回路と、を備えている音声判定検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62097779A JP2564821B2 (ja) | 1987-04-20 | 1987-04-20 | 音声判定検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62097779A JP2564821B2 (ja) | 1987-04-20 | 1987-04-20 | 音声判定検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63262693A true JPS63262693A (ja) | 1988-10-28 |
JP2564821B2 JP2564821B2 (ja) | 1996-12-18 |
Family
ID=14201317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62097779A Expired - Lifetime JP2564821B2 (ja) | 1987-04-20 | 1987-04-20 | 音声判定検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2564821B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02172367A (ja) * | 1988-12-26 | 1990-07-03 | Casio Comput Co Ltd | 電子スチルカメラ |
JPH0619499A (ja) * | 1992-07-02 | 1994-01-28 | Kokusai Electric Co Ltd | 有声/無声判定回路 |
WO2001033548A1 (fr) * | 1999-10-29 | 2001-05-10 | Fujitsu Limited | Dispositif et procede de reglage du debit dans un systeme de codage de la parole a debit variable |
JP2001265396A (ja) * | 2000-01-11 | 2001-09-28 | Matsushita Electric Ind Co Ltd | マルチモード音声符号化装置及び復号化装置 |
EP1533791A2 (en) * | 2003-11-21 | 2005-05-25 | Samsung Electronics Co., Ltd. | Voice/unvoice determination and dialogue enhancement |
JP2009198892A (ja) * | 2008-02-22 | 2009-09-03 | Yamaha Corp | 音処理装置およびプログラム |
-
1987
- 1987-04-20 JP JP62097779A patent/JP2564821B2/ja not_active Expired - Lifetime
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02172367A (ja) * | 1988-12-26 | 1990-07-03 | Casio Comput Co Ltd | 電子スチルカメラ |
JPH0619499A (ja) * | 1992-07-02 | 1994-01-28 | Kokusai Electric Co Ltd | 有声/無声判定回路 |
WO2001033548A1 (fr) * | 1999-10-29 | 2001-05-10 | Fujitsu Limited | Dispositif et procede de reglage du debit dans un systeme de codage de la parole a debit variable |
JP2001265396A (ja) * | 2000-01-11 | 2001-09-28 | Matsushita Electric Ind Co Ltd | マルチモード音声符号化装置及び復号化装置 |
JP4619549B2 (ja) * | 2000-01-11 | 2011-01-26 | パナソニック株式会社 | マルチモード音声復号化装置及びマルチモード音声復号化方法 |
EP1533791A2 (en) * | 2003-11-21 | 2005-05-25 | Samsung Electronics Co., Ltd. | Voice/unvoice determination and dialogue enhancement |
JP2005157363A (ja) * | 2003-11-21 | 2005-06-16 | Samsung Electronics Co Ltd | フォルマント帯域を利用したダイアログエンハンシング方法及び装置 |
EP1533791A3 (en) * | 2003-11-21 | 2008-04-23 | Samsung Electronics Co., Ltd. | Voice/unvoice determination and dialogue enhancement |
JP2009198892A (ja) * | 2008-02-22 | 2009-09-03 | Yamaha Corp | 音処理装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2564821B2 (ja) | 1996-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9454976B2 (en) | Efficient discrimination of voiced and unvoiced sounds | |
WO2000031720A3 (en) | Complex signal activity detection for improved speech/noise classification of an audio signal | |
JP2573352B2 (ja) | 音声検出装置 | |
US6243672B1 (en) | Speech encoding/decoding method and apparatus using a pitch reliability measure | |
US9135925B2 (en) | Apparatus and method of enhancing quality of speech codec | |
Ramirez et al. | Voice activity detection with noise reduction and long-term spectral divergence estimation | |
Kotnik et al. | Evaluation of pitch detection algorithms in adverse conditions | |
JPS63262693A (ja) | 音声判定検出装置 | |
SE470577B (sv) | Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud | |
US5812966A (en) | Pitch searching time reducing method for code excited linear prediction vocoder using line spectral pair | |
JPH06236195A (ja) | 音声区間検出方法 | |
JP2656069B2 (ja) | 音声検出装置 | |
JP3355473B2 (ja) | 音声検出方法 | |
JPH0558551B2 (ja) | ||
KR100345402B1 (ko) | 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법 | |
US8242836B2 (en) | Acoustic characteristic control apparatus | |
JPS6242197A (ja) | 音声区間検出方法 | |
JPH03114100A (ja) | 音声区間検出装置 | |
JPS6217800A (ja) | 音声区間判定方式 | |
KR100667522B1 (ko) | Lpc 계수를 이용한 이동통신 단말기 음성인식 방법 | |
KR0171004B1 (ko) | Samdf를 이용한 기본 주파수와 제1포만트의 비율 측정방법 | |
KR100523905B1 (ko) | 이중화된 검출조건을 이용한 음성 추출 방법 | |
JP3033537B2 (ja) | 音声検出器 | |
JPS59105697A (ja) | 音声認識装置 | |
JPS6039700A (ja) | 音声区間検出方法 |