JPS6267598A - 音声区間検出方式 - Google Patents

音声区間検出方式

Info

Publication number
JPS6267598A
JPS6267598A JP60208397A JP20839785A JPS6267598A JP S6267598 A JPS6267598 A JP S6267598A JP 60208397 A JP60208397 A JP 60208397A JP 20839785 A JP20839785 A JP 20839785A JP S6267598 A JPS6267598 A JP S6267598A
Authority
JP
Japan
Prior art keywords
speech
beginning
word
section
detection system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60208397A
Other languages
English (en)
Other versions
JP2737109B2 (ja
Inventor
安田 晴剛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60208397A priority Critical patent/JP2737109B2/ja
Publication of JPS6267598A publication Critical patent/JPS6267598A/ja
Application granted granted Critical
Publication of JP2737109B2 publication Critical patent/JP2737109B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 肢血立■ 本発明は、音声認識における音声区間検出方式音声認識
装置における音声区間検出部は以後の認識結果を左右す
る重要な部分である。通常の音声認識装置では、入力信
号から音声らしい部分の始端から終端までをバッファレ
ジスタに貯えてから認識演算するか、又は始端らしき部
分からバ・7フアレジスタへとり込みながらそれと平行
して認識演算を始める。音声の始端はパワーレベル或い
はその変化の大きさなどから決め、終端はパワーのレベ
ルが低下した後に無音時間を測定し、無音時間が促音に
よるものより長いと判断された時点で決めるのが一般的
である。ところが人は音声を発する前に無意識に舌打ち
や口唇の開閉による短い音を出す事が多い。而して、従
来においては、音声区間検出閾値より音声パワーが大き
くなった時点で音声の語頭としため、語頭の舌打音や瞬
間的ノイズが混入したりし、誤認識の原因になっていた
。このような誤認識を避けるために、本出願人は、先に
、ある語頭のnフレーム内に無音区間が存在した場合、
その無音の前を除去することについて提案した。しかし
ながら、一般に破裂音で始まる語頭部分等も比較的短い
無音区間を有し易く、有用な情報まで削除してしまう可
能性がある。
このように、音声認識装置の音声入力時において、口の
開閉時の舌打音が、音声区間検出に誤検出を行わせる場
合がある。
第5図は、舌打音を有する場合の従来の音声区間検出を
説明するための図で、(a)は音声波形、(b)は音声
パワー波形、(C)は音声区間信号で、図中、Aは舌打
音、Bは正規(本来)の音声で、舌打音Aは、通常、人
の口の開閉時に生じるもので、人によってひんばんに生
ずる場合もある。
(a)に示す正規の音声Bにこの様な舌打音Aが入った
場合、その音声パワー波形は(b)に示す様になり、そ
れをある閾値Tsで音声区間を検出した場合、(c)に
示すような音声区間信号が検出されるが、この場合、語
頭の部分Aは、本来の音声区間ではなく、特に、語頭の
データを用いて発声中に予備選択を行う様なシステムに
おいては問題となる。
置皿 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、語頭部分に入る舌打音部を効果的に除去すること
のできる誤認識の少ない音声認識装置を提供することを
目的としてなされたものである。
M「叉 本発明は、上記目的を達成するため、入力された音声を
ある周期毎に音声パワーに変換する手段と、その音声パ
ワーをある閾値と比較する手段と、上記2つの手段によ
って音声区間信号を得る手段とを有する音声認識装置に
おいて、語頭のnフレーム以内に無音区間の開始点を検
出し、その無音区間がmサンプル継続した場合に限って
語頭における舌打音などのノイズと判断してその部分を
削除する事を特徴としたものである。以下、本発明の実
施例に基づいて説明する。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図で、第2図は、フローチャートで、図中、1
はマイク、2はアンプ、3は特徴抽出部、4はフレーム
カウンタ部、5はエツジ検出部、6は無音検出部、7は
入力データ制御部、8は認識処理部、9は結果出力部で
ある。
第3図は、舌打音Aを有する音声の場合の真の音声Bの
語頭B゛が破裂音などで始まる場合の図で、(a)は音
声パワー波形、(b)は音声区間信号である。音声認識
装置においては、通常、10m5の周期で特徴抽出を行
っており、音声区間信号によってそのデータが有効かど
うかを判断しており、本発明においては、そのサンプル
周期内の音声区間データの変化を調べる。
まず、語頭のnフレーム内で音声区間の下がりエツジが
存在するか否かを調べる。nフレーム内で下がりエツジ
を検出しなかった場合は、そのまま真の語頭とする。ま
た、検出した場合は次のmフレーム間が無音区間である
かを調べ2.ここにおいてmフレーム間に立ち上がりエ
ツジが存在する場合は、先の語頭を真の語頭とし、ない
場合は、次の立ち上がりエツジを待ってそれを真の語頭
とする。以上の処理を第2図のフローチャートに示した
が、この様にすれば、あるサンプル周期で生成される特
徴データをリアルタイムで検出処理が可能となる。
第4図は、上記本発明を説明するためのアルゴリズムで
、(a)は音声パワー信号、(b)は−単語パルス信号
、(c)は音声区間信号、(d、)は認識処理(1)、
(d2)は認識処理(2)で、語頭が発生した時点で認
識処理を始める例えばDPマツチングの様なシステムに
おいては、語頭が発生した時点でまず認識処理(1)を
開始し、真の語頭が発見された場合は、キャンセル信号
を発生し、新たに認識処理(2)を開始する。
処理 以上の説明から明らかなように、本発明によると、語頭
の舌打ちノイズ又は同様のノイズを削除する事が可能と
なり、しかも、上記削除をリアルタイムで処理すること
ができる。
【図面の簡単な説明】 第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図、第2図は、フローチャート、第3図は、本
発明の動作説明をするための信号波形図、第4図は、ア
ルゴリズム、第5図は、舌打音を有する音声信号波形図
である。 1・・・マイク、2・・・アンプ、3・・・特徴抽出部
、4・・・フレームカウンタ部、5・・・エツジ検出部
、6・・・無音検出部、7・・・入力データ制御部、8
・・・認識処理部、9・・・結果出力部。 第3図 第5図

Claims (1)

    【特許請求の範囲】
  1. 入力された音声をある周期毎に音声パワーに変換する手
    段と、その音声パワーをある閾値と比較する手段と、上
    記2つの手段によって音声区間信号を得る手段とを有す
    る音声認識装置において、語頭のnフレーム以内に無音
    区間の開始点を検出し、その無音区間がmサンプル継続
    した場合に限って語頭における舌打音などのノイズと判
    断してその部分を削除する事を特徴とする音声区間検出
    方式。
JP60208397A 1985-09-20 1985-09-20 音声区間検出方式 Expired - Lifetime JP2737109B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60208397A JP2737109B2 (ja) 1985-09-20 1985-09-20 音声区間検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60208397A JP2737109B2 (ja) 1985-09-20 1985-09-20 音声区間検出方式

Publications (2)

Publication Number Publication Date
JPS6267598A true JPS6267598A (ja) 1987-03-27
JP2737109B2 JP2737109B2 (ja) 1998-04-08

Family

ID=16555576

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60208397A Expired - Lifetime JP2737109B2 (ja) 1985-09-20 1985-09-20 音声区間検出方式

Country Status (1)

Country Link
JP (1) JP2737109B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005257748A (ja) * 2004-03-09 2005-09-22 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、収音プログラム
JP2009180958A (ja) * 2008-01-31 2009-08-13 Yamaha Corp パラメータ設定装置、音響生成装置およびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB475466A (en) * 1936-03-06 1937-11-19 Dow Chemical Co Improvements in or relating to the preparation of cellulose ethers
JPS58192095A (ja) * 1982-05-04 1983-11-09 三洋電機株式会社 音声認識装置
JPS58170698U (ja) * 1982-05-10 1983-11-14 カシオ計算機株式会社 音声認識装置におけるノイズ防止回路
US4581446A (en) * 1985-03-15 1986-04-08 The Dow Chemical Company Purification of cellulose ethers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB475466A (en) * 1936-03-06 1937-11-19 Dow Chemical Co Improvements in or relating to the preparation of cellulose ethers
JPS58192095A (ja) * 1982-05-04 1983-11-09 三洋電機株式会社 音声認識装置
JPS58170698U (ja) * 1982-05-10 1983-11-14 カシオ計算機株式会社 音声認識装置におけるノイズ防止回路
US4581446A (en) * 1985-03-15 1986-04-08 The Dow Chemical Company Purification of cellulose ethers

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005257748A (ja) * 2004-03-09 2005-09-22 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、収音プログラム
JP4518817B2 (ja) * 2004-03-09 2010-08-04 日本電信電話株式会社 収音方法、収音装置、収音プログラム
JP2009180958A (ja) * 2008-01-31 2009-08-13 Yamaha Corp パラメータ設定装置、音響生成装置およびプログラム

Also Published As

Publication number Publication date
JP2737109B2 (ja) 1998-04-08

Similar Documents

Publication Publication Date Title
EP0077194B1 (en) Speech recognition system
JPS6267598A (ja) 音声区間検出方式
Taboada et al. Explicit estimation of speech boundaries
JP2002073061A (ja) 音声認識装置及びその方法
JP2992324B2 (ja) 音声区間検出方法
JPH0950288A (ja) 音声認識装置及び音声認識方法
JPS59124397A (ja) 無音区間検出回路
JP3484559B2 (ja) 音声認識装置および音声認識方法
JPS6217800A (ja) 音声区間判定方式
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JP3190231B2 (ja) 有声音信号のピッチ周期抽出装置およびピッチ周期抽出方法
JPH0567039B2 (ja)
JP2891259B2 (ja) 音声区間検出装置
JPS61260299A (ja) 音声認識装置
JPS6239754B2 (ja)
JPH02103599A (ja) 音声認識装置
JPS60498A (ja) 音声検出装置
JPS61140999A (ja) 音声区間検出方式
JPS6177099A (ja) 音声認識方法
JP3125928B2 (ja) 音声認識装置
JPS6193499A (ja) 音声パタ−ン照合方式
JPS63127296A (ja) 音声区間検出方式
JPS62238599A (ja) 音声区間検出方法
JPS6039700A (ja) 音声区間検出方法
JPS60209800A (ja) 音声認識装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term