JPS58175157A - 音声始端検出装置 - Google Patents

音声始端検出装置

Info

Publication number
JPS58175157A
JPS58175157A JP57056860A JP5686082A JPS58175157A JP S58175157 A JPS58175157 A JP S58175157A JP 57056860 A JP57056860 A JP 57056860A JP 5686082 A JP5686082 A JP 5686082A JP S58175157 A JPS58175157 A JP S58175157A
Authority
JP
Japan
Prior art keywords
voice
output
frequency analyzer
section
detection device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57056860A
Other languages
English (en)
Other versions
JPH035594B2 (ja
Inventor
Yoshiharu Abe
芳春 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP57056860A priority Critical patent/JPS58175157A/ja
Publication of JPS58175157A publication Critical patent/JPS58175157A/ja
Publication of JPH035594B2 publication Critical patent/JPH035594B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/22Means responsive to presence or absence of recorded information signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B15/00Driving, starting or stopping record carriers of filamentary or web form; Driving both such record carriers and heads; Guiding such record carriers or containers therefor; Control thereof; Control of operating function
    • G11B15/02Control of operating function, e.g. switching from recording to reproducing
    • G11B15/05Control of operating function, e.g. switching from recording to reproducing by sensing features present on or derived from record carrier or container
    • G11B15/087Control of operating function, e.g. switching from recording to reproducing by sensing features present on or derived from record carrier or container by sensing recorded signals

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は音声帯域の信号(以下、音声信号と略す)中
に存在する音声波の存在区間(以下、音声区間と略す)
の始端を検出するために供される音声始端検出装置の改
良に関するものである。
まず、第1図に示す従来の音声始端検出装置について説
明する。第1図において、(1)は音声信号の入力端、
Qは二乗平均検波器、Hはメモリ、Cは二乗平均検波器
Qの出力とメモIJ Hの出力を比較し、二乗平均検波
器Qの出力がメモリ)(の出力より大きい場合111を
、その外の場合WOWを出力する比較器、Fは比較器0
の出力がそのセット側入力端Sに与えられ、またリセッ
ト側入力端Rは外部につながれているセットリセット型
のフリップフロップである。
このような構成において、入力端(1)には雑音区間と
音声区間から成る音声信号が与えられているものとし、
またメモリHKは、雑音区間において二乗平均検波器Q
に生ずる雑音電力(以下、 Noと記す)に所定の許容
値(以下、δ0と記す)を加えた値が記憶されていて、
さらに初期状態において、フリップフロップFは外部か
らの信号により状態101にリセットされているものと
する。
いま、入力端filに雑音区間が印加されているとする
と、二乗平均検波器Qの出力は、雑音電力にほぼ等しく
、メモリHに記憶されている値θ。コN+δ。を超える
ことがないため、比較器Cの出力は001であり、フリ
ップフロップF#′i状態”0″を保つ。一方、入力端
(11に音声区間が印加されると、二乗平均検波器Qの
出力は雑音電力N。と音声電力(以下、Soと記す)の
和N。+86となり、音声電力S。が許容値δ。を超え
た時点において、比較器Cは111を出力し、フリップ
フロ、プFは状態@11にセットされ、外部に対し音声
区間の始端が検出されたことを知らせるこの従来の音声
始端検出装置においては、雑音電力と音声電力の差を利
用して音声区間の始端の検出を行っているため9語頭に
音声電力の小さな子音(例えば、[S]や[h]や[p
]などの無声子音)を有する音声区間に対しては、音声
電力が雑音電力に接近するため、安定に始端を検出する
ことができなく、またハムや外部雑音などの比較的電力
の大きな雑音波形に相対的に小さな電力の音声波形が埋
もれているような音声信号に対しても、音声区間の始端
を正確に検出することができない。
この発明は、このような従来の音声始端検出装置の欠点
を改善するためになされた本ので。
語頭に音声電力の小さい子音を有する音声区間や比較的
電力の大きな雑音波形に埋吃れた相対的に小さなレベル
の音声区間の始端でも、安定かつ正確に検出することの
できる音声始端検出装置を提供するものである。
以下第2図に示すこの発明の一実施例について説明する
。第2図において、(1)は音声信号の入力端、(2)
は符号B、−Bnを付して示した通過帯域のそれぞれ異
なる帯域8波器の群と符号Q〜Qnを付して示した複数
の二乗平均検波器から構成される周波数分析器、H1〜
Hnはメモリ。
01〜Onはそれぞれ二乗平均検波器Q1〜Qnの出力
とメモリH1〜Hnの出力を比較し、二乗平均検波器Q
l−Qnの出力がメモリH1=Hnの出力よりも大きい
場合@11を出力し、その外の場合101を出力する比
較器、(3)は比較器017 Onの出力の論理和を出
力する論理利器、Fは論理利器(3)の出力がセット側
入力端Sに与えられ。
一方リセット側入力端Rは外部につながれているセット
リセット型のフリップフロップであるこのような構成に
おいて、入力端(1)には雑音区間と音声区間から成る
音声信号が与えられているものとし、またメモリH,−
Hnには雑音区間においてそれぞれの周波数帯域の二乗
平均検波器Q、〜Qnに生ずる帯域雑音電力(以下、 
Nl〜Nnと記す)に所定の許容値(以下、δ!〜δn
と記す)を加えた値θl〜θn(すなわち、第1番目の
帯域に対してθ1==Ni+δi )がそれぞれ記憶さ
れているものとし、さらに、初期状態において、フリッ
プフロップFは外部からの信号により状態101にリセ
ットされているものとする。
いま、入力端(1)に雑音区間が印加されているとする
と、二乗平均検波器Q1〜Qnの出力は。
それぞれ、その帯域の帯域雑音電力NI−Nnにはぼ等
しく、メモリH1〜Hnに記憶されている値θl〜θn
 (すなわち、第1番目の帯域に対してθi = N 
i+δi)よりも大きくなることはないため、比較器C
1−Onの出力はすべてIQIであり、論理利器(3)
の出力もIQfとなり、フリップフロップは状態101
を保つ。一方、入力端(1)に音声区間が印加されると
、二乗平均検波器Ql〜Qnの出力はそれぞれ雑音波の
帯域電力Nl〜Nnと音声波の帯域電力(以下、8.−
8nと記す)の和(すなわち、第1番目の帯域に対しN
i+Si)となり、音声波の帯域寛力亀〜8nのうち少
なくとも一つ(以下、−膜性を失うことなく、これを第
1番目の帯域成分とする)の成分Sφ;それに対応する
許容値δiよりも大きくなる時点において、第1番目の
比較器ciは111を出力し、そのため、論理利器(3
)の出力は111となり、フリップフロップFは状態1
11にセットされ、外部に対し音声区間の始端が検出さ
れたことを知らせる。
この構成では、従来の第1図に示すものに比べて、入力
音声に対する周波数分析の機能が付加されているため1
語頭に音声電力の小さい子音を有する音声区間に対して
も、雑音電力の周波数特性(すなわち雑音電カスベクト
ル)と音声電力の周波数特性(すなわち音声型カスベク
トル)の差異を捕えていることから、始端を安定かつ正
確に検出することができる。
第8図は、この発明の他の実施例を示すもので、第2図
に示した周波数分析器(2)の構成要素として、そこで
用いた帯域8波器B1〜Bnと二乗平均検波器Ql−Q
nから成るものの代わりに、入力端(11に印加された
音声信号の短時間区間を切り出すために用いる窓関数発
生器Wと乗算器P、及び、この短時間区間のフーリエパ
ワースペクトルを計算し、またその計算結果を出力端f
s = fnに出力する高速ディジタルフーリエ変換器
Tによって構成される周波数分析器(2)を用いたもの
である。第4図はこの発明のさらに他の実施例を示すも
ので、(1)は音声信号の入力端、(2)は符号B!〜
Bnを付して示L〜た通過帯域のそれぞれ異なる帯域3
波器の群と符号Q、〜Qnを付して示した二乗平均検波
器から構成される周波数分析器、01〜Gnは二乗平均
検波器Q1〜Qn の出力がそのデータ入力端にそれぞ
れ与えられ、一方、制御入力端は共通の一つの書き込み
制御端(4)にそれぞれつながれている書き換え可能な
メモリ、al−anはメモリG1〜Onの出力に所定の
許容値(それぞれ、δl〜δn とする)を加える加算
器、c、 −Onはそれぞれ二乗平均検波器Q+−Qn
の出力と加算器al〜anの出力を比較し、二乗平均検
波器Qx−Qnの出力が加算器&r ” anの出力よ
りも大きい場合111を出力し、その外の場合”01を
出力する比較器。
(3)は比較器C1〜cnの出力の論理和を出力する論
理利器、Fは論理利器(3)の出力がセット側入力端S
に与えられ、一方、リセット側入力端Rは外部につなが
れているセットリセット型のフリップフロッグである。
この実施例の音声始端検出装置では、外部に設けられ入
力端(11に雑音区間が印加されていることを検出する
装置の出力する信号パルスを。
入力端子(1)に雑音区間が印加されている状態におい
て、書き込み制御端(4)に印加し、その時の二乗平均
検波器Q、〜Qnの出力に現われている雑音波の帯域電
力N1〜Nnを書き換え可能なメモリ01〜onにそれ
ぞれ記憶しておくことによって、第2図のものと同様の
動作原理に基づき音声区間の始端の検出動作がなされる
第5図はこの発明のさらに他の実施例を示すもので、第
4図に示した周波数分析器(2)の構成要素として、そ
こで用いた帯域8波器BI−Bnと二乗平均検波器Q1
〜Qnから成るものの代わりに、入力端(1)に印加さ
れた音声信号の短時間区間を切り出すために用いる窓関
数発生器Wとワスペクトルを計算し、またその計算結果
を出力端f!〜fnに出力する高速ディジタルフーリエ
変換器Tによって構成される周波数分析器を用いたもの
である。
第4図及び第5図に示す実施例では、音声信号中の雑音
区間の周波数特性が変化する場合においても、音声区間
の始端を最適に検出することができるという特徴があり
9例えば電話回線を通した音声信号に対して1回線の切
換えによる回線雑音や送話端における外来騒音などの雑
音電カスベクトルの変化の影響を軽減できるなどの利点
があり、さらに応用範囲の拡大がなされている。゛ なお9以上の説明において、帯域8波器、二乗平均検波
器、メモリー、比較器等はアナログ回路によって構成で
きることはもちろんであるが、ディジタル回路によって
構成できることも言うまでもない。
以上述べたように、この発明は、入力音声信号に対して
周波数分析を行い、また音声区間と雑音区間の電カスベ
クトルの特性の違いを利用することによって、音声始端
検出装置の始端検出釦おける安定性を改善できること、
さらに音声電力対雑音電力比(すなわちS/N比)の比
較的小さい音声区間に対しても始端の検出を可能となる
こと、さらにまた、雑音電カスベクトルの特性変化が起
り得る場合にも音声区間の始端の最適な検出を行うこと
ができることなどの効果を有する。
【図面の簡単な説明】
第1図は従来の音声始端検出装置の構成図。 第2図はこの発明による音声始端検出装置の一実施例を
示す構成図、第8図はこの発明による音声始端検出装置
の他の実施例を示す構成図。 第4図はこの発明による音声始端検出装置のさらに他の
実施例を示す構成図、第5図はこの発明による音声始端
検出装置のさらにもう一つの他の実施例を示す構成図で
ある。(1)は音声信号の入力端、(2)は周波数分析
器* Bl ””’Bnは帯域8波器、Q及びQ!〜Q
nは二乗平均検波器、Wは窓関数発生器、Pは乗算器、
Tは高速ディジタルフーリエ変換器、H及びH+ −H
nはメモリ、01〜Gnは誓き換え可能なメモIJ 、
 +41は書き込み制御端、C及びc+−Onは比較器
、(3)は論理利器、Fは七ノドリセット型のフリ、ツ
ブフロッグである。なお1図中同一あるいは相当部分に
は同一符号を付して示しである。 代理人  為 野 信 − 第1図 第2図 第3図 第4図 第5図

Claims (1)

  1. 【特許請求の範囲】 (1)雑音区間及び音声区間から成る音声帯域の信号中
    から音声区間の始端を検知する音声始端検出装置におい
    て、音声帯域の信号がその入力端に与えられる複数の出
    力端を有する周波数分析器と、この周波数分析器の出力
    がその一つの入力端につながり、他の入力端には所定の
    しきい値の記憶されているメモリの出力が与えられる複
    数の比較器と、この複数の比較器の出力の論理和を求め
    る論理利器と。 この論理利器の出力がセット入力端に与えられるフリッ
    プフロップとを有し、音声区間の始端を上記フリップフ
    ロップの状態によって検知するように構成【7たことを
    特徴とする音声始端検出装置。 (2)上記周波数分析器として、複数の帯域8波器と、
    この帯域8波器の出力がその入力端にそれぞれ与えられ
    る複数の二乗平均検波器とから構成されるものを用いた
    ことを特徴とする特許請求の範囲第fi1項記載の音声
    始端検出装置。 (3)上記周波数分析器として、高速ディジタルフーリ
    エ変換器を用いたことを特徴とする特許請求の範囲第(
    1)項記載の音声始端検出装置(4)雑音区間及び音声
    区間から成る音声帯域の信号中から音声区間の始端を検
    知する音声始端検出装置において、音声帯域の信号がそ
    の入力端に与えられる複数の出力端を有する周波数分析
    器と、この周波数分析器の出力がその入力端に与えられ
    、一方、その書き込み制御入力端は共通の一つのサンプ
    ル制御入力端につながれている書き換え可能なメモリと
    。 このメモリの出力にそれぞれ所定の値を加え:る複数の
    加算器と、この加算器の出力がその一つの入力端に与え
    られ、他の入力端には上記周波数分析器の出力がそれぞ
    れ与えられる複数の比較器と、この複数の比較器の出力
    の論理和を求める論理利器と、この論理利器の出力がセ
    ント入力端に与えられるフリップフロッグとを有し、上
    記サンプル制御入力端に与えられる外部制御信号によっ
    て上記周波数分析器の出力を上記メモリに記憶するよう
    に構成し、かつ、音声区間の始端を上記フリップフロッ
    グの状態によって検知するように構成したことを特徴と
    する音声始端検出装置。 (5)上記周波数分析器として、複数の帯域8波器と、
    この帯域8波器の出力がその入力端に/ それぞれ与えられる複数の二乗平均検波器とから構成さ
    れるものを用いたことを特徴とする特許請求の範囲第(
    4)項記載の音声始端検出装置。 (6)上記周波数分析器として、高速ディジタルフーリ
    エ変換器を用いたことを特徴とする特許請求の範囲第(
    4)項記載の音声始端検出装置
JP57056860A 1982-04-06 1982-04-06 音声始端検出装置 Granted JPS58175157A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57056860A JPS58175157A (ja) 1982-04-06 1982-04-06 音声始端検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57056860A JPS58175157A (ja) 1982-04-06 1982-04-06 音声始端検出装置

Publications (2)

Publication Number Publication Date
JPS58175157A true JPS58175157A (ja) 1983-10-14
JPH035594B2 JPH035594B2 (ja) 1991-01-25

Family

ID=13039162

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57056860A Granted JPS58175157A (ja) 1982-04-06 1982-04-06 音声始端検出装置

Country Status (1)

Country Link
JP (1) JPS58175157A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08500471A (ja) * 1992-04-30 1996-01-16 セリディアン コーポレイション 放送セグメントを認識するための方法とシステム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56145000U (ja) * 1980-03-28 1981-10-31

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56145000U (ja) * 1980-03-28 1981-10-31

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08500471A (ja) * 1992-04-30 1996-01-16 セリディアン コーポレイション 放送セグメントを認識するための方法とシステム

Also Published As

Publication number Publication date
JPH035594B2 (ja) 1991-01-25

Similar Documents

Publication Publication Date Title
US4015088A (en) Real-time speech analyzer
CN110265064B (zh) 音频爆音检测方法、装置和存储介质
US5070337A (en) Optimization method and an optimized filter for sidelobe suppression
US11102569B2 (en) Methods and apparatus for a microphone system
CN110994553B (zh) 一种基于波形衰变特性的变压器差动保护定值调整方法
JPS60500885A (ja) デコーダ回路
CN111383646A (zh) 一种语音信号变换方法、装置、设备和存储介质
US3617636A (en) Pitch detection apparatus
CA1090919A (en) Arrangement for discriminating speech signals
US4044204A (en) Device for separating the voiced and unvoiced portions of speech
US4634966A (en) Binary processing of sound spectrum
US5257211A (en) Adjustable bandwidth concept (ABC) signal energy detector
JPS58175157A (ja) 音声始端検出装置
US9245537B2 (en) Speech enhancement apparatus and method for emphasizing consonant portion to improve articulation of audio signal
JPS58123293A (ja) 多周波信号受信方法
Curtis et al. An investigation of several frequency-domain processing methods for enhancing the intelligibility of speech in wideband random noise
Zaitsev Elimination on power line interference from ECG signal using combined bidirectional narrow-band notch filter
Tucker et al. A pitch estimation algorithm for speech and music
JPH04369698A (ja) 音声認識方式
US4063030A (en) Detection circuit for significant peaks of speech signals
Sankar Pitch extraction algorithm for voice recognition applications
KR100198057B1 (ko) 음성신호 특징 추출방법 및 장치
Harris et al. Pitch and formant shifts accompanying changes in speech power level
JPS59228300A (ja) 音声区間検出方式
JP3419705B2 (ja) ノイズに埋もれた音声のフォルマント成分の強調方法、装置及びプログラム記録媒体