JPS6338993A - 音声区間検出装置 - Google Patents

音声区間検出装置

Info

Publication number
JPS6338993A
JPS6338993A JP61182919A JP18291986A JPS6338993A JP S6338993 A JPS6338993 A JP S6338993A JP 61182919 A JP61182919 A JP 61182919A JP 18291986 A JP18291986 A JP 18291986A JP S6338993 A JPS6338993 A JP S6338993A
Authority
JP
Japan
Prior art keywords
voice
section
noise
speech
voice section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61182919A
Other languages
English (en)
Inventor
金指 久則
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61182919A priority Critical patent/JPS6338993A/ja
Publication of JPS6338993A publication Critical patent/JPS6338993A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識装置における音声区間検出装置に関す
るものである。
従来の技術 第3図は従来の音声認識装置における音声区間検出装置
の機能ブロック図である。従来例を第3図、第4図によ
り説明する。
第3図において、14はマイクであり、ここから音声ま
たは騒音を入力し、前処理部15で前処理を行ないパワ
ー算出部16でパワーを算出する。
21は音声認識モードa、または騒音学習モードbの切
換えを行なう切換えスイッチである。17は騒音学習部
、1Bは音声区間検出部であり、騒音学習モードにおい
て音声区間検圧のためのいき値を設定し、音声区間検出
部で音声区間を検出する。検出した音声区間内の音声を
音声認識部19において認識する。20は認識結果出力
部である。
次に、上記従来例の動作について説明する。最初に、音
声認識モードに入る前に切換スイッチ21で騒音学習モ
ードを選択し、騒音の学習を行なう。第3図において、
マイク14から入力した騒音は、前処理部15において
、異名現象を取除くためのLPFi通り、A/D変換さ
れ、サンプル値xを得る。次にパワー算出部16におい
て、(1)式に従い、単位時間(以後フレームと称する
)ごとにパワーP(J)’を算出する。
PO):Jフレームめのパワーの値 X(i)=17レーム内における1番目のサンプル値N
 :1フレーム内のサンプ)V敗 騒音学習部17では、P(J ’)をもとに(2)式に
従って音声区間の贋き値TPを設定する訳であるが、こ
こでLは騒音学習に要する時間であり、認識装置の仕様
により任意に設定するパラメータである。
なおTP’の値は学習時間における環境騒音の平均パワ
ーである。
TP=TP’+A TP:音声区間検出のためのいき値 P(T): J 7レーム目のパワーの値L :騒音学
習時間 A :定数 次に切換スイッチ21で認識モードを選択し、音声認識
を行なう。
第3図において、入力した音声は、騒音学習モードと同
じ条件で前処理を行ない、パワーを算出する。得られた
パワーの時系列をもとに、騒音学習モードで得られたい
き値TP’i−用いて音声区間の検出に行なう。′f2
4図は/ak1ta/(秋田)と発声した時のP(J 
)の時系列に示したものである。
第4図において、いき値TPを使って、パワーの大きい
山形の部分S1、S2、S3および山形の部分に挾まれ
た谷形の部分P1、P2、P3を検出し、各々に対応す
る時間S1、S2、S3およびPl、P2、P3の値を
使って(3)式に示す条件との整合を検定し音声区間、
音声の始端S1終端Eを検出する。
第2図は第4図とは異なる人声や音楽等のようにレベル
やスペクトルが時間的に変動している騒音下で学習し、
/aklta/ (秋田)と発声した場合のいき値TP
O設定から音声区間検出までのようすを表わしている。
音声を発声する直前に、レベルの高い山形のパワーを示
す騒音が入り音声区間を誤り、本来の音声波形(点線で
示す)の前に騒音が入り込み実際上シ長く音声区間が検
出されている。このような信号を入力として音声認識を
行なうと、前半の騒音の部分もスペクトルに山谷がある
ため、音声信号に近い特徴を持ち、/akita/を/
 yamakita/(山土)と誤る場合が多かった。
発明が解決しようとする問題点 しかしながら上記従来の音声区間検出装置では、音楽や
人声等のように音声入力環境において、周囲騒音のレベ
ルやスペクl−/L/が時間的に変動している場合、周
囲騒音を入力音声として、本来の音声区間に加えて検出
してしまうため、音声区間検出を誤シ、ひいては音声認
識を誤る問題があった。
本発明は上記従来例の欠点を除去し、時間的変動を伴う
周囲騒音に対しても認識を誤らない音声区間検出装置を
提供することを目的とするものである。
問題点を解決するための手段 本発明は、上記目的を達成するために、音声区間検出を
行なう[祭、マイクからの音声信号のみを用いて音声区
間を検出するのではなく、音声を発声する時の口唇の動
きを検知するセンサからの出力を併用して音声区間を検
出するようにしたものである。
作  用 従って本発明によれば、マイクからの音声信号と口唇の
動きを検知するセンサからの2つの信号を併用して音声
区間を検出することにより、音楽や人声等の騒音環境に
おいても精度よく音声区間を検出することができ、その
結果、音声認識誤シを減少することができる。
実施例 以下に、本発明の一実施例の構成について第1図、第2
図とともに説明する。
第1図において1はマイク、2は前処理部、3はパワー
算出部、4は騒音学習部、6は音声認識部、7は認識結
果出力部、13はモード切換スイッチ、8は超音波送信
器、9は送信機、10は超音波受信器、11は受信機、
12は口唇動作検出部及び5は音声区間検出部である。
次に本発明の実施例の動作について説明する。
先ずモード切換スイッチ13は、騒音学習モードbにし
ておく。マイク1から入力した騒音は前処理部2でA/
D変換されLPFを通ってパワー算出部BK入り、従来
例と同様に(1)式に従いフレーム毎のパワーを算出す
る。
騒音学習部4では、得られたフレーム毎のパワーの値か
ら(2)式に従って音声区間のいき値TPを設定する。
次にモード切換スイッチ13で認識モードaを選択し音
声認識を行なう。
第1図において、発声した音声はマイク1から入力され
、騒音学習モードと同じ条件で前処理を行すい、パワー
算出部3でフレーム毎のパワーを算出する。一方、口唇
の動きを検知するために、超音波送信器8から発せられ
た超音波は口唇で反射して超音波受信器10で信号を受
ける。受けた信号は受信機11を通り口唇動作検出部1
2に入る。第2図は、従来例の第4図の騒音環境と同じ
条件で/akita/と発声した時のマイクからの信号
を処理して得たパワーの時系列と、超音波による口唇の
動きの信号を処理して得た信号(口唇の位置の変位量)
の時系列を示したものである。
第2図において、マイクからの信号を処理して得られた
音声信号のパワーの時系列を使っての音声区間検出は従
来例と同様て行ない、音声区間の始端S1と終端E1を
検出する。
次に、上記結果と口唇の動きを検知する超音波センサか
らの信号を処理して得られた口唇位置の変位量の時系列
とを併用して音声区間検出を以下のように行なう。第2
図において、変位量のピーク(M1〜M6)を持つフレ
ーム位置(m 1〜m6 )を検出し、mlとm2の間
の長さをn2、m2とm3の間の長さをn3、同様にn
4、n5、n6とする。次に音声パワーから求めた音声
区間の始端S1を含む区間(Ml〜M2)を見つけ、そ
の区間から時間軸方向に対して1つ前の区間から(4式
を満たす変位量のピークを持つフレーム位置MS(=M
2)を検出する。
以下余白 次に検出したピークのフレーム位置MSとパワーから求
めた始端S1の位置関係をみて(5式に従って音声区間
の始端Sを決定する。
次に音声区間の終端の検出は以下のように行なう。
先づ、音声区間の始端検出の際求めたMSから時間軸方
向に向かって(6)式を満たず変位量のピークを持つフ
レーム位置ME(=M5)を検出する。
次に検出したピークのフレーム毎ff1M Eとパワー
の位置関係をみて(71式に従って音声区間の終端Eを
決定する。
以上、本発明は、マイクからの音声信号と口唇の動きを
検知するセンサからの信号の2つの信号を併用して音声
区間を検出することにより精度よく音声区間を検出でき
る。
発明の効果 本発明は以上の説明から明らかなように、音声区間を検
出する際、マイクからの音声信号のみを用いて音声区間
を検出するのではなく、音声を発声する時の口唇の動き
を検知するセンサからの出力を併用して音声区間を検出
するため、レベルやスペクトルが時間的に変動する音楽
等の騒音下での発声においても精度よく音声区間を検出
できる利点を有する。更に、音声区間を精度よく検出で
きるため、音声認識率を向上させる効果を有する。
【図面の簡単な説明】
第1図は本発明の一実施例における音声区間検出装置を
用いた音声認識装置の概略ブロック図、第2図はある騒
音環境で/akita/と発声した場合の騒音と音声の
パワーの時間変化及び口唇の動きを検知するセンサから
の出力信号の時間変化を同期させて表した波形図、第3
図は従来例における音声区間検出装置を用いた音声認識
装置の概略ブロック図、第4図は第2図とは異なる騒音
環境で/akita7’と発声した場合の騒音と音声の
パワーの時間変化を表した波形図である。 4・・・・・・騒音学習部、5・・・・・・音声区間検
出部、6・・・・・音声認識部、7・・・・・・認識結
果出力部、8・・・・・・超音波送信機、9・・・・・
・送信機、10・・・・・・超音波受信器、11・・・
・・・受信機、12・・・・・・口唇動作検出部、13
モード切換スイツチ。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名植椋 ■

Claims (2)

    【特許請求の範囲】
  1. (1)口唇が動いているかどうかを検知するためのセン
    サの出力とマイク又はそれに代わる音圧・電気信号変換
    器からの音声信号出力とを併用して音声区間の検出を行
    なうことを特徴とする音声区間検出装置。
  2. (2)口唇が動いているかどうかを検知するためのセン
    サとして超音波発振器及び受信器を用いることを特徴と
    する特許請求の範囲第1項に記載の音声区間検出装置。
JP61182919A 1986-08-04 1986-08-04 音声区間検出装置 Pending JPS6338993A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61182919A JPS6338993A (ja) 1986-08-04 1986-08-04 音声区間検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61182919A JPS6338993A (ja) 1986-08-04 1986-08-04 音声区間検出装置

Publications (1)

Publication Number Publication Date
JPS6338993A true JPS6338993A (ja) 1988-02-19

Family

ID=16126675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61182919A Pending JPS6338993A (ja) 1986-08-04 1986-08-04 音声区間検出装置

Country Status (1)

Country Link
JP (1) JPS6338993A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5884257A (en) * 1994-05-13 1999-03-16 Matsushita Electric Industrial Co., Ltd. Voice recognition and voice response apparatus using speech period start point and termination point
JPH11219421A (ja) * 1998-01-30 1999-08-10 Toshiba Corp 画像認識装置及び画像認識装置方法
JP2005135432A (ja) * 2004-12-13 2005-05-26 Toshiba Corp 画像認識装置及び画像認識装置方法
JP2005516263A (ja) * 2002-01-30 2005-06-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識システムのための音声アクティビティのオーディオビジュアル検出
JP2006139117A (ja) * 2004-11-12 2006-06-01 Kenwood Corp マイクロホン装置、発話検出装置、発話検出方法および音声出力方法
US10910001B2 (en) 2017-12-25 2021-02-02 Casio Computer Co., Ltd. Voice recognition device, robot, voice recognition method, and storage medium

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5781300A (en) * 1980-11-10 1982-05-21 Matsushita Electric Ind Co Ltd Voice recognition apparatus

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5781300A (en) * 1980-11-10 1982-05-21 Matsushita Electric Ind Co Ltd Voice recognition apparatus

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5884257A (en) * 1994-05-13 1999-03-16 Matsushita Electric Industrial Co., Ltd. Voice recognition and voice response apparatus using speech period start point and termination point
JPH11219421A (ja) * 1998-01-30 1999-08-10 Toshiba Corp 画像認識装置及び画像認識装置方法
JP2005516263A (ja) * 2002-01-30 2005-06-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識システムのための音声アクティビティのオーディオビジュアル検出
JP4681810B2 (ja) * 2002-01-30 2011-05-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識システムのための音声アクティビティのオーディオビジュアル検出
JP2006139117A (ja) * 2004-11-12 2006-06-01 Kenwood Corp マイクロホン装置、発話検出装置、発話検出方法および音声出力方法
JP4568905B2 (ja) * 2004-11-12 2010-10-27 株式会社ケンウッド マイクロホン装置および発話検出装置
JP2005135432A (ja) * 2004-12-13 2005-05-26 Toshiba Corp 画像認識装置及び画像認識装置方法
US10910001B2 (en) 2017-12-25 2021-02-02 Casio Computer Co., Ltd. Voice recognition device, robot, voice recognition method, and storage medium

Similar Documents

Publication Publication Date Title
DE68910859D1 (de) Detektion für die Anwesenheit eines Sprachsignals.
JP2573352B2 (ja) 音声検出装置
JPS6338993A (ja) 音声区間検出装置
JPWO2003107326A1 (ja) 音声認識方法及びその装置
US6738312B1 (en) Arrangement and method for measuring the speed of sound
JP2656069B2 (ja) 音声検出装置
JP2001166783A (ja) 音声区間検出方法
JPS5999497A (ja) 音声認識装置
JP3008593B2 (ja) 音声認識装置
JPS6242197A (ja) 音声区間検出方法
JPH09247800A (ja) 左右音像方向抽出方法
JPH02178699A (ja) 音声認識装置
KR940005047B1 (ko) 음성전이구간 검출기
JPS63259596A (ja) 音声区間検出方式
JP2712692B2 (ja) 信号制御装置
JPH04184495A (ja) 音声認識装置
JP3107905B2 (ja) 音声認識装置
Kalgaonkar et al. An acoustic Doppler-based front end for hands free spoken user interfaces
JP2585214B2 (ja) ピッチ抽出方法
JP3125928B2 (ja) 音声認識装置
JPH01310399A (ja) 音声認識装置
JPS6267598A (ja) 音声区間検出方式
JPH039400A (ja) 音声認識装置
JPS60230200A (ja) 音声検出回路
KR20010091093A (ko) 음성 인식 및 끝점 검출방법