JPH02192335A - 語頭検出方式 - Google Patents

語頭検出方式

Info

Publication number
JPH02192335A
JPH02192335A JP1009853A JP985389A JPH02192335A JP H02192335 A JPH02192335 A JP H02192335A JP 1009853 A JP1009853 A JP 1009853A JP 985389 A JP985389 A JP 985389A JP H02192335 A JPH02192335 A JP H02192335A
Authority
JP
Japan
Prior art keywords
buffer
word
feature parameter
voice signal
converter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1009853A
Other languages
English (en)
Inventor
Kimitatsu Satou
佐藤 仁樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1009853A priority Critical patent/JPH02192335A/ja
Publication of JPH02192335A publication Critical patent/JPH02192335A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Time-Division Multiplex Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) ATM (Asynchronous Transfe
r Mode)通信やDSI(DigitaL 5pe
ech Interplation)やパケット通信等
で音声信号中の語頭を検出する語頭検出方式に関する。
(従来の技術) 従来、音声信号分析器9、判定器11、雑音区間設定器
lO1しきい値決定器12からなる語頭検出装置21が
あった。これを第4図に示す。以下同図について説明す
る。
入力端子8に入力された音声信号の、電力、雰交差数、
自己相関関数、スペクトルなどの特徴パラメータを音声
信号分析器9で計算する。判定器11で、音声信号分析
器9の出力をしきい値と比較し、語頭・無音の判定を行
なう。
判定器11で用いるしきい値は、あらかじめ、語頭と背
景雑音の特徴パラメータの分布を測定し、その分布によ
り語頭と背景雑音が分離するように設定される。
また、背景雑音の影響や入力音声レベルの大きさによる
誤検出を防ぐために、以下のように判定WIllで用い
るしきい値を制御する。
まず、雑音区間設定器10では、受話器を上げてから話
者の音声が入力される間の背景雑音信号のみ入る区間の
、音声信号分析器9からの出力である特徴パラメータを
、しきい値決定器12に出力する。しきい値決定器12
では、あらかじめ設定された語頭と雑音を区別する判定
しきい値を、雑音区間設定器10の出力を用いて適応的
に制御する。
−例として、音声信号分析器9で音声信号の電力Pを特
徴パラメータとして計算した場合、判定器11では、 しきい値Ta≦電力Pならば1語頭 そうでなければ、無音 として判定している。
一方、しきい値決定手段12では、雑音区間設定器10
から得られた特徴パラメータ(電力)の平均P、と、あ
らかじめ設定したしきい値T及び、しきい値Tを決める
際に用いた雑音の平均電力Pnより、判定器11で用い
るしきい値Taを1例えば、以下に示した式に従って計
算することができる。
Ta=T+(P−Pn) このような方法では、判定しきい値を適確に制御するた
めの情報として、入力端子8に入力された音声信号のあ
らかじめ設定した区間の背景雑音の特徴を用いているた
め、背景雑音が変化すると正常に動作しないという欠点
を持つ。
(発明が解決しようとする課運) 以上述べてきたように頭語は音声の中間部と異なりパワ
ーが小さく、シかも1語頭の性質は1語頭が母音である
場合や、破裂音、摩擦音、破擦音等の子音である場合、
また、同じ子音でも後続の母音によって大きく異なる。
そのため、音声全体の特徴の細部まで表現できない特徴
パラメータ(例えば、電力、零交差数(ある一定時間内
に信号の値が零となる回数)、自己相関関数等)では、
語頭と背景雑音の境界が曖昧となる。また、語頭の特徴
を細部まで表現できるパラメータを用いると、各子音に
よって特徴の現れ方が大きく異なるため、語頭/雑音の
判定を行なうためには、各子音毎にマツチングをとる必
要があり、語頭/雑音の判定が複雑になる。
そのため、有音検出を行うにあたり1語頭部分の検出は
困難であり1語頭の検出誤りが多く、音質の劣化の原因
になっていた。
一方、有音と雑音を区別するためのしきい値を固定とし
た場合、背景雑音の性質は一定でなく常に変化している
ため、背景雑音の影響で誤検出が多くなる。そのため、
あらかじめ設定した区間で背景雑音の特徴を調べ、しき
い値をコントロールしていた。しかし、この方法では背
景雑音の性質やレベルが急激に変化するような状況下で
はその変化に追随できず、語頭の検出精度は非常に悪く
なる。
これらの要因で、通信の分野では音質の劣化、音声認識
の分野では認識率の悪化という問題があった。
本発明は、背景雑音の性質やレベルの変動が大きい場合
でも、安定した語頭検出を行うことができる方式を簡単
な構成で提供することを目的とする。
〔発明の構成〕
(課題を解決するための手段) 上記目的を達成するために本発明においては、音声信号
中の語頭を検出する語頭検出方式において、音声信号を
フレーム単位に分割して、このフレーム毎に特徴パラメ
ータを計算する音声信号分析手段と、特徴パラメータ夫
々を順次記憶しておくバッファと、このバッファ内の特
徴パラメータ夫々の変化量を計算する変化量計算手段と
、この変化量計算手段から出力される変化量の情報によ
り音声区間を検出する語頭検出手段とを具備したことを
特徴とするものである。
(作用) 本発明は、音声信号中の語頭を検出する語頭検出方式で
ある。
音声信号分析手段では、音声信号の語頭を検出して、こ
のフレーム毎に特徴パラメータの計算をしている。
この特徴パラメータはフレーム順番どおりに順次バッフ
ァに記憶される。
バッファに記憶された特徴パラメータ夫々については、
変化量計算手段により変化量が計算される。
そして、語頭検出手段によりこの変化量計算手段から出
力された変化量の情報により音声区間を検出させている
(実施例) 本発明の一実施例を図面を用いて説明する。
第1図は本発明の一実施例を示すブロック図である。
同図において、入力音声信号は入力端子1より音声信号
分析器2に入力される。
音声信号分析器2では、音声信号をある長さのフレーム
ごとに、電力、零交差数、自己相関関数、バンドパスフ
ィルタの出力、PARCOR係数、LPCケプストラム
などの手法により求められた特徴パラメータを、バッフ
ァ3と変換器4に出力する。
バッファ3では、バッファ3内で蓄積される順序関係を
保存するために、特徴パラメータがバッファ3に入力さ
れた順番で、バッファ3のヘッド(先頭)からティル(
語尾)に向かって蓄積される。すなわち、一番新しい特
徴パラメータ(現在判定すべきフレームの特徴パラメー
タ)をバッファ3のヘッドに、一番過去の特徴パラメー
タをテイルに蓄積する。
従来の手法と異なり本発明では、判定方法が音声信号の
分析方法に依存しない。すなわち、一般に語頭の特徴を
細部まで表現できるパラメータを用いると、各子音によ
って特徴の現れ方が大きく異なるため、子音全体として
の特徴を表現するのが困難になり、語頭/雑音の判定が
複雑になる。
ところが本発明によれば、2個の要素からなる特徴パラ
メータを、スカラーである過去の特徴パラメータからの
変化量のノルムに変換するため、どのような特徴パラメ
ータを用いても、簡単な判定手法で判定できる。
そのため、この分析器は、例えば、電力、零交差数、自
己相関関数等により、語頭の特徴を細部まで表現できる
パラメータ(バンドパスフィルタの出力、PARCOR
係数、LPCケプストラム等)を用いたほうが有効であ
る。しかし、音声の特徴を表すものであれば、特に上記
の分析手法に限らない。
変換器4では、音声信号分析器2の出力特徴パラメータ
を、判定器5で判定可能な特徴パラメータに変換する。
変換器4の一構成例を第2図に示す。
正規化係数計算器41では、バッファ3に蓄積された特
徴パラメータのうち、現在判定すべきフレームのにフレ
ーム前(バッファのヘッドからにフレームめ)からバッ
ファのテイルに向がってNフレー4分の特徴パラメータ
を取り出し、その平均・標準偏差等の正規化係数を計算
する。その方法を以下に示す。
現在判定すべきフレームのにフレーム前から数えてnフ
レーム過去の特徴パラメータC(n)のi番目の要素を
C(n)i 各要素の平均値をMi 各要素の標準偏差をDi とすると、 またDiを分散 としでも。
Di=1 としてもよい。
正規化器42では、正規化係数計算器41で計算した正
規化係数Mi、Diにより音声信号分析器の出力特徴パ
ラメータCを以下のように変換する。特徴パラメータC
の要素をC1,Ciを正規化係数で変換したものをC′
iとすると C’i= (Ci−Mi)/Di    i=1.2.
・・・pC’iは判定器5に出力する。
判定器5で変換器4の出力特徴パラメータC′= (C
’l、C’2.・・・C’p)により現在のフレームが
有音か無音かを判定し、出力端子7よりその結果を出力
する。
その方法の一例を第3図に示す。
まず、ノルム計算部51で、ベクトルC′のノルムIC
’lを次のように計算する。
Ilc’扉=(ΣC’i”)” または、 しきい値比較器52で、このようにして得られたノルム
と判定のしきい値をTと比較して、以下のように判定す
る。
もし IIC’ll>T ならば有音 もし lc’話 ≦Tならば無音 ここで、Tの値は正規化係数の定義により変化する。
〔発明の効果〕
以上詳述してきたように1本発明によれば、複数個の要
素からなる特徴パラメータを過去の特徴パラメータから
の変化量と比較するという簡単な判定手法で短時間に判
定できる。
以上本発明により、背景雑音のレベルが大きくその変動
が激しい場合でも、簡単な装置で、語頭の検出が高精度
で可能となる。また、判定すべきフレームの後のフレー
ムの特徴パラメータを参照する必要がないので、判定の
ための遅延時間が小さく、リアルタイムの検出が可能と
なる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
第1図に示した変換器の一構成例を示した図、第3図は
第1図に示した判定器5の一構成例を示した図、第4図
は従来の語頭検出方式のブロック図である。 1・・・入力端子 3・・・バッファ 5・・・判定器 8・・・入力端子 10・・・ノイズ区間分析器 12・・・しきい値決定器 41・・・正規化係数計算器 51・・・ノルム計算部 2・・・音声信号分析器 4・・・変換器 7・・・出力端子 9・・・音声信号分析器 11・・・判定器 13・・・出力端子 42・・・正規化器 52・・・しきい値比較器

Claims (1)

  1. 【特許請求の範囲】 音声信号中の語頭を検出する語頭検出方式において、 前記音声信号をフレーム単位に分割して、このフレーム
    毎に特徴パラメータを計算する音声信号分析手段と、 前記特徴パラメータ夫々を順次記憶しておくバッファと
    、 このバッファ内の前記特徴パラメータ夫々の変化量を計
    算する変化量計算手段と、 この変化量計算手段から出力される変化量の情報により
    前記音声区間を検出する語頭検出手段とを具備したこと
    を特徴とする語頭検出方式。
JP1009853A 1989-01-20 1989-01-20 語頭検出方式 Pending JPH02192335A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1009853A JPH02192335A (ja) 1989-01-20 1989-01-20 語頭検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1009853A JPH02192335A (ja) 1989-01-20 1989-01-20 語頭検出方式

Publications (1)

Publication Number Publication Date
JPH02192335A true JPH02192335A (ja) 1990-07-30

Family

ID=11731693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1009853A Pending JPH02192335A (ja) 1989-01-20 1989-01-20 語頭検出方式

Country Status (1)

Country Link
JP (1) JPH02192335A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03273722A (ja) * 1989-11-28 1991-12-04 Nec Corp 音声・モデム信号識別回路
WO2013114425A1 (ja) * 2012-01-30 2013-08-08 三菱電機株式会社 残響抑圧装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03273722A (ja) * 1989-11-28 1991-12-04 Nec Corp 音声・モデム信号識別回路
WO2013114425A1 (ja) * 2012-01-30 2013-08-08 三菱電機株式会社 残響抑圧装置
JPWO2013114425A1 (ja) * 2012-01-30 2015-05-11 三菱電機株式会社 残響抑圧装置
US9437179B2 (en) 2012-01-30 2016-09-06 Mitsubishi Electric Corporation Reverberation suppression device

Similar Documents

Publication Publication Date Title
KR101942521B1 (ko) 음성 엔드포인팅
US5692104A (en) Method and apparatus for detecting end points of speech activity
US7756700B2 (en) Perceptual harmonic cepstral coefficients as the front-end for speech recognition
US4811399A (en) Apparatus and method for automatic speech recognition
US5596680A (en) Method and apparatus for detecting speech activity using cepstrum vectors
US8326610B2 (en) Producing phonitos based on feature vectors
US8489404B2 (en) Method for detecting audio signal transient and time-scale modification based on same
JPH0990974A (ja) 信号処理方法
Özaydın Examination of energy based voice activity detection algorithms for noisy speech signals
CN108847218A (zh) 一种自适应门限整定语音端点检测方法,设备及可读存储介质
WO1983002190A1 (en) A system and method for recognizing speech
JPH02192335A (ja) 語頭検出方式
JPH0449952B2 (ja)
AU612737B2 (en) A phoneme recognition system
CN107039046B (zh) 一种基于特征融合的语音声效模式检测方法
GB2216320A (en) Selective addition of noise to templates employed in automatic speech recognition systems
JPS60129796A (ja) 音声入力装置
RU2807170C2 (ru) Детектор диалогов
JPH034918B2 (ja)
JPS6151320B2 (ja)
JP3032215B2 (ja) 有音検出装置及びその方法
JPS5936759B2 (ja) 音声認識方法
Manjutha et al. Analysis on Regularity of Speech Energy based on Optimal Thresholding for Tamil Stuttering Dataset
JPH0546558B2 (ja)
JPH0441357B2 (ja)