JP2737109B2 - 音声区間検出方式 - Google Patents

音声区間検出方式

Info

Publication number
JP2737109B2
JP2737109B2 JP60208397A JP20839785A JP2737109B2 JP 2737109 B2 JP2737109 B2 JP 2737109B2 JP 60208397 A JP60208397 A JP 60208397A JP 20839785 A JP20839785 A JP 20839785A JP 2737109 B2 JP2737109 B2 JP 2737109B2
Authority
JP
Japan
Prior art keywords
beginning
sound
voice
section
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60208397A
Other languages
English (en)
Other versions
JPS6267598A (ja
Inventor
晴剛 安田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60208397A priority Critical patent/JP2737109B2/ja
Publication of JPS6267598A publication Critical patent/JPS6267598A/ja
Application granted granted Critical
Publication of JP2737109B2 publication Critical patent/JP2737109B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は、音声認識における音声区間検出方式に関す
る。 従来技術 音声認識装置における音声区間検出部は以後の認識結
果を左右する重要な部分である。通常の音声認識装置で
は、入力信号から音声らしい部分の始端から終端までを
バッファレジスタに貯えてから認識演算するか、又は始
端らしき部分からバッファレジスタへとり込みながらそ
れと平行して認識演算を始める。音声の始端はパワーレ
ベル或いはその変化の大きさなどから決め、終端はパワ
ーのレベルが低下した後に無音時間を測定しし、無音時
間が促音によるものより長いと判断された時点で決める
のが一般的である。ところが人は音声を発する前に無意
識に舌打ちや口唇の開閉による短い音を出す事が多い。
而して、従来においては、音声区間検出閾値より音声パ
ワーが大きくなった時点で音声の語頭としため、語頭の
舌打音や瞬間的ノイズが混入したりし、誤認識の原因に
なっていた。このような誤認識を避けるために、本出願
人は、先に、ある語頭のnフレーム内に無音区間が存在
した場合、その無音の前を除去することについて提案し
た。しかしながら、一般に破裂音で始まる語頭部分等も
比較的短い無音区間を有し易く、有用な情報まで削除し
てしまう可能性がある。このように、音声認識装置の音
声入力時において、口の開閉時の舌打音が、音声区間検
出に誤検出を行わせる場合がある。 第5図は、舌打音を有する場合の従来の音声区間検出
を説明するための図で、(a)は音声波形、(b)は音
声パワー波形、(c)は音声区間信号で、図中、Aは舌
打音、Bは正規(本来)の音声で、舌打音Aは、通常、
人の口の開閉時に生じるもので、人によってひんぱんに
生ずる場合もある。(a)に示す正規の音声Bにこの様
な舌打音Aが入った場合、その音声パワー波形は(b)
に示す様になり、それをある閾値Tsで音声区間を検出し
た場合、(c)に示すような音声区間信号が検出される
が、この場合、語頭の部分Aは、本来の音声区間ではな
く、特に、語頭のデータを用いて発生中に予備選択を行
う様なシステムにおいては問題となる。 目的 本発明は、上述のごとき実情に鑑みてなされたもの
で、特に、語頭部分に入る舌打音部を効果的に除去する
ことのできる誤認識の少ない音声認識装置を提供するこ
とを目的としてなされたものである。 構成 本発明は、上記目的を達成するため、入力された音声
をある周期毎に音声パワーに変換する変換手段と、該変
換手段により変換された音声パワーをある閾値と比較す
る比較手段と、前記変換手段と比較手段によって音声区
間信号を得る検出手段とを有する音声認識装置におい
て、語頭のnフレーム以内に無音区間の開始点を検出
し、該無音区間がmフレーム継続した場合に限って語頭
における舌打音などのノイズと判断し、該ノイズ部分を
削除することを特徴としたものである。以下、本発明の
実施例に基づいて説明する。 第1図は、本発明の一実施例を説明するための電気的
ブロック線図で、第2図は、フローチャートで、図中、
1はマイク、2はアンプ、3は特徴抽出部、4はフレー
ムカウンタ部、5はエッジ検出部、6は無音検出部、7
は入力データ制御部、8は認識処理部、9は結果出力部
である。 第3図は、舌打音Aを有する音声の場合の真の音声B
の語頭B′が破裂音などで始まる場合の図で、(a)は
音声パワー波形、(b)は音声区間信号である。音声認
識装置においては、通常、10msの周期で特徴抽出を行っ
ており、音声区間信号によってそのデータが有効かどう
かを判断しており、本発明においては、そのサンプル周
期内の音声区間データの変化を調べる。 まず、語頭のnフレーム内で音声区間の下がりエッジ
が存在するか否かを調べる。nフレーム内で下がりエッ
ジを検出しなかった場合は、そのまま真の語頭とする。
また、検出した場は次のmフレーム間が無音区間である
かを調べ、ここにおいてmフレーム間に立ち上がりエッ
ジが存在する場合は、先の語頭を真の語頭とし、ない場
合は、次の立ち上がりエッジを待ってそれを真の語頭と
する。以上の処理を第2図のフローチャートに示した
が、この様にすれば、あるサンプル周期で生成される特
徴データをリアルタイムで検出処理が可能となる。 第4図は、上記本発明を説明するためのアルゴリズム
で、(a)は音声パワー信号、(b)は一単語パルス信
号、(c)は音声区間信号、(d1)は認識処理(1)、
(d2)は認識処理(2)で、語頭が発生した時点で認識
処理を始める例えばDPマッチングの様なシステムにおい
ては、語頭が発生した時点でまず認識処理(1)を開始
し、真の語頭が発見された場合は、キャンセル信号を発
生し、新たに認識処理(2)を開始する。 効果 以上の説明から明らかなように、本発明によると、語
頭の舌打ちノイズ又は同様のノイズを削除する事が可能
となり、しかも、上記削除をリアルタイムでで処理する
ことがきる。
【図面の簡単な説明】 第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図、第2図は、フローチャート、第3図は、本
発明の動作説明をするための信号波形図、第4図は、ア
ルゴリズム、第5図は、舌打音を有する音声信号波形図
である。 1……マイク,2……アンプ,3……特徴抽出部,4……フレ
ームカウンタ部,5……エッジ検出部,6……無音検出部,7
……入力データ制御部,8……認識処理部,9……結果出力
部。

Claims (1)

  1. (57)【特許請求の範囲】 1.入力された音声をある周期毎に音声パワーに変換す
    る変換手段と、該変換手段により変換された音声パワー
    をある閾値と比較する比較手段と、前記変換手段と比較
    手段によって音声区間信号を得る検出手段とを有する音
    声認識装置において、語頭のnフレーム以内に無音区間
    の開始点を検出し、該無音区間がmフレーム継続した場
    合に限って語頭における舌打音などのノイズと判断し、
    該ノイズ部分を削除することを特徴とする音声区間検出
    方式。
JP60208397A 1985-09-20 1985-09-20 音声区間検出方式 Expired - Lifetime JP2737109B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60208397A JP2737109B2 (ja) 1985-09-20 1985-09-20 音声区間検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60208397A JP2737109B2 (ja) 1985-09-20 1985-09-20 音声区間検出方式

Publications (2)

Publication Number Publication Date
JPS6267598A JPS6267598A (ja) 1987-03-27
JP2737109B2 true JP2737109B2 (ja) 1998-04-08

Family

ID=16555576

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60208397A Expired - Lifetime JP2737109B2 (ja) 1985-09-20 1985-09-20 音声区間検出方式

Country Status (1)

Country Link
JP (1) JP2737109B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4518817B2 (ja) * 2004-03-09 2010-08-04 日本電信電話株式会社 収音方法、収音装置、収音プログラム
JP5157488B2 (ja) * 2008-01-31 2013-03-06 ヤマハ株式会社 パラメータ設定装置、音響生成装置およびプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB475466A (en) * 1936-03-06 1937-11-19 Dow Chemical Co Improvements in or relating to the preparation of cellulose ethers
JPS58192095A (ja) * 1982-05-04 1983-11-09 三洋電機株式会社 音声認識装置
JPS58170698U (ja) * 1982-05-10 1983-11-14 カシオ計算機株式会社 音声認識装置におけるノイズ防止回路
US4581446A (en) * 1985-03-15 1986-04-08 The Dow Chemical Company Purification of cellulose ethers

Also Published As

Publication number Publication date
JPS6267598A (ja) 1987-03-27

Similar Documents

Publication Publication Date Title
US4531228A (en) Speech recognition system for an automotive vehicle
EP0077194B1 (en) Speech recognition system
US4597098A (en) Speech recognition system in a variable noise environment
KR100302370B1 (ko) 음성구간검출방법과시스템및그음성구간검출방법과시스템을이용한음성속도변환방법과시스템
JPH0713584A (ja) 音声検出装置
JPH10210075A (ja) 有音検知装置および方法
JP3069531B2 (ja) 音声認識方法
JP2737109B2 (ja) 音声区間検出方式
JP2992324B2 (ja) 音声区間検出方法
JPH08263092A (ja) 応答音声生成方法および音声対話システム
JPH0950288A (ja) 音声認識装置及び音声認識方法
JPH03114100A (ja) 音声区間検出装置
JP3588929B2 (ja) 音声認識装置
JP3360978B2 (ja) 音声認識装置
JPS6147437B2 (ja)
JPH09127982A (ja) 音声認識装置
JP3484559B2 (ja) 音声認識装置および音声認識方法
JPS6242197A (ja) 音声区間検出方法
JP2891259B2 (ja) 音声区間検出装置
JPS6131478B2 (ja)
JPS59124397A (ja) 無音区間検出回路
JPH0474720B2 (ja)
JP3125928B2 (ja) 音声認識装置
JPS6217800A (ja) 音声区間判定方式
JPS63127296A (ja) 音声区間検出方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term