JPS59105697A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS59105697A
JPS59105697A JP21600682A JP21600682A JPS59105697A JP S59105697 A JPS59105697 A JP S59105697A JP 21600682 A JP21600682 A JP 21600682A JP 21600682 A JP21600682 A JP 21600682A JP S59105697 A JPS59105697 A JP S59105697A
Authority
JP
Japan
Prior art keywords
section
threshold value
threshold
power
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP21600682A
Other languages
English (en)
Other versions
JPH0343639B2 (ja
Inventor
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP21600682A priority Critical patent/JPS59105697A/ja
Publication of JPS59105697A publication Critical patent/JPS59105697A/ja
Publication of JPH0343639B2 publication Critical patent/JPH0343639B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識装置に関する。
従来例の構成とその問題点 離散的に発声された単語音声等を認識する場合、実際に
音声信号が存在する区間を正しく検出する必要がある。
第1図は音声認識装置の従来例を示す。(1)は音声信
号入力端子、(2)はフィルタバンク等で構成され、入
力音声信号を一定時間毎に特徴ベクトルに変換する特徴
抽出部、(3)は特徴抽出部(2)の出力から電力を計
算する電力計算部、(4)はあらかじめ閾値を設定する
閾値設定部、(5)は前記電力計算部(3)の出、力と
前記閾値設定部(4)の出力から音声区間を切シ出す音
声区間切出部、(6)は認識に先立って、認識すべき全
語集と前記特徴ベク)/しの系列として登録されている
標準パターン記憶部、(7)は音声区間切出部(5)の
出力として得られる入力音声信号に対する特徴ベク) 
y&の系列を前記標準パターン記憶部(6)のそれぞれ
の特徴ベクトルの系列と照合して系列間の距離を計算す
るパターンマッチング部、(8)はパターンマッチンク
部(7)で計算されたそれぞれの距離のうち最小値を与
える標準パターンに対応する単語を今入力された単語音
声の認識結果として出力端子(9)に出力する判定部で
ある。6特徴抽出部(2)としては、n個の帯域フィル
りを周波数軸上に対数間隔で並べたいわゆるnチャンネ
ルのフィルタバンクがよく用いられ、それぞれの帯域フ
ィルタの出力を整流平滑したものはそれぞれの周波数成
分の大きさを表わしていると考えられる。この出力を1
0〜30m5eC位の間隔で標本化し、特徴ベク)/し
の系列を得る。すなわち、第にチャンネルの前記平滑回
路の第1番(第1フレーム)の標本値を特徴とする特徴
抽出部(2)の出力は、A=a、a、、 −・−a、、
たたし”i =(”1llai21’ ain)、なる
特徴ベクトルの系列になる。この場合、電力については
色々と定義することができる。すなわち、第1フレーム
の電力としては W++−房耳刀扉1J ・・・・・・・・(1)J2 
=ai’l + ai2 +・・・+ al、、、−、
−(2)等が良く用いられる。(1)式はベク)/l/
a、の大ささである。これらの対数を取ったものも良く
用いられる。
音声区間の切り出しは、最も簡単には、■人力音声の電
力があらかじめ設定した閾値を越えた時点からその閾値
以上の期間かある期間以上続し)たとき前記閾値を越え
た時点を音声区ILl]の開始時点とし、C)入力音声
の電力が前記閾値以下になる時点からその閾値以下の期
間がある期間以上続いたとき前記閾値以下となった時点
を音声区間の終了時点とする。■は前記電力が前記閾値
以上である区間かある期間以下の場合は雑音とみなし音
声信号とはみなさんいということであり、■は語中にも
しばしば無声区間が存在するので、前記電力が前記閾値
以下になる期間がある程度長くならないと音声が終った
とみなきないということである。
この閾値は外部の雑音の大きさで決定される。
すなわち、外部の雑音の電力がこの閾値を越える期間が
一定値以上になると音声信号と区別がつかなくなったり
、音声信号の切り出しが正確に行なわれなくなる。従っ
て、この閾値は外部雑音の電力より大きく設定しなけれ
ばならない。
ところが、外部雑音の大きさに応じて閾値を変えるとな
ると一つの問題が生じる。第2図はと、れを説明する図
である。0Qは電力計算部(3)の出力であって、入力
音声信号の電力の時間的変化を示す図である。いま、標
準パターンを登録するとき、閾値T1を採用したとする
と、切)出される音声区間はt18〜t1eの区間とな
る。認識させるとき、外部雑音の影響を避けるために閾
値T2を採用すると、同じ音声信号に列して切p出され
る音声区間はt2S〜t2eの区間となシ、語頭と語尾
の近くで差を生じることになる。この差は誤認識の原因
となる。しからば、最初から閾値を高めに設定しておけ
ばどうかというと、閾値はなるべく低くして論頭の子音
などを落さないようにする方が認識率の点から当然良い
わけで、最初から閾値を高めに設定しておくのはあまり
好ましくない。
発明の目的 本発明は以上述べたような音声区間の切υ出しの際に生
じる問題点を解決し、認識率を大幅に向上できる音声認
識装置、を提供することを目的とするものである。
発明の構成 本発明は、上記欠点が音声を登録するときと認識すると
きとで、音声区間切出部しのだめの閾値か変ることによ
って生じていることに着目し、認識の際設定する閾値を
入力音声信号に列すると共に、標準パターンの読み出し
に対しても通用することによって等測的に登録するとき
と認識するとさと同じ閾値になるようにして所期の目的
を達成(7たものでろ9、従って、登録は静かな外部雑
音の少ないところで、なるべく低い閾値レベルで行うの
が望ましい。
実施例の説明 以下本発明の実施例を図面に基づいて説明する。
第3図は本発明の一実施例を示す構成図である。
第1図と同一の番号を付したブロックは第1図で説明し
たものと同一の機能を有し、第1図との相違点は、電力
計算部(3)′と音声区間切出部(5)′を標準パター
ンに対しても設けたところにある。これらは電力計W部
(3)と音声区間切山部(5)と同じ働きをし、閾値設
定部(4)によって設定される閾値をもって標準音声パ
ターンの区間を設定する。このよ4うな構成とすること
により標準パターンに対しても電力を計算し、それに対
して入力音声信号に適用するのと同じ閾値を通用して、
登録のときと認識のときが等価的に同じ閾値(従って切
り出し位F4′)になるようにしている。
なお、本実施例では電力の計算は特徴ベクトルで行った
か、入力端子(1)に到来する信号そのものから計算す
ることもできる。このときは、登録の際、このようにし
て得ら扛た電力値のフレーム毎の値をも標準パターンと
して登録して2く盛装があシ、認識の場合の標準パター
ンに苅する電力の計算は不要となる。その代シ記憶しで
ある電力値を読み出すことになる。
発明の効果 以上本発明によれば登録のときと、認識のときの入力音
声の音声区間を切シ出すだめの閾値が等価的に同じにな
るようにしたので、登録のときと認識のときの音声区間
の切9出し位置の相違に基づく誤認識か減り、雑音の少
い静かなところでは低い閾110が通用できるので認識
率が太いに同上する。
【図面の簡単な説明】
第1図は音声認識装置の従来例を示す構成図、第2図は
その動作を示す波形図、第3図は本発明による音声認識
装置の一実施例を示す構成図である。 (2)・・特徴抽出部、(3バ3)′・・電力計算部、
(4)・・・閾値設定部、<5) (5)’・・音声区
闇切出部、(6)・・・標準パターン記憶部 代理人     森   本   義   弘第を図 乙 第3因 乙

Claims (1)

    【特許請求の範囲】
  1. 1、 閾値を設定する閾値設定手段と、入力音声パター
    ンの電力がこの閾値を所定期間越えて続いたときにその
    閾値を越した点を始端、閾値以下が所定時間続いたとき
    にその閾値以−トになった点を終端とする入力音声パタ
    ーン区間設定手段と、認識@黍としてあらかじめ登録さ
    れているそれぞれの標準音声パターンに対しても、前記
    入力音声パターンに対するのと同様に前記閾値設定手段
    によって設定され・る閾値をもつ前記標準音声パターン
    の区間を設定する標準音声パターン区間設定手段とを設
    け、前記区間検出された入力音声パターンを前記区間設
    定された標準音声パターンのそれぞれと比較照合するこ
    とによって入力音声の認識を行うことを特徴とする音声
    認識装置。
JP21600682A 1982-12-09 1982-12-09 音声認識装置 Granted JPS59105697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21600682A JPS59105697A (ja) 1982-12-09 1982-12-09 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21600682A JPS59105697A (ja) 1982-12-09 1982-12-09 音声認識装置

Publications (2)

Publication Number Publication Date
JPS59105697A true JPS59105697A (ja) 1984-06-19
JPH0343639B2 JPH0343639B2 (ja) 1991-07-03

Family

ID=16681826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21600682A Granted JPS59105697A (ja) 1982-12-09 1982-12-09 音声認識装置

Country Status (1)

Country Link
JP (1) JPS59105697A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61223796A (ja) * 1985-03-29 1986-10-04 沖電気工業株式会社 音声区間検出回路
JPS63259690A (ja) * 1987-04-17 1988-10-26 松下電器産業株式会社 音声認識応答装置
JPH0772894A (ja) * 1993-06-15 1995-03-17 Ontario Hydro 自動知的監視装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61223796A (ja) * 1985-03-29 1986-10-04 沖電気工業株式会社 音声区間検出回路
JPS63259690A (ja) * 1987-04-17 1988-10-26 松下電器産業株式会社 音声認識応答装置
JPH0772894A (ja) * 1993-06-15 1995-03-17 Ontario Hydro 自動知的監視装置

Also Published As

Publication number Publication date
JPH0343639B2 (ja) 1991-07-03

Similar Documents

Publication Publication Date Title
EP0077194B1 (en) Speech recognition system
US8326610B2 (en) Producing phonitos based on feature vectors
JPH09325790A (ja) 音声処理方法および装置
JPS5844500A (ja) 音声認識方式
JPS59105697A (ja) 音声認識装置
KR100574883B1 (ko) 비음성 제거에 의한 음성 추출 방법
WO2009055718A1 (en) Producing phonitos based on feature vectors
JPS61233791A (ja) 音声認識装置における音声区間検出方式
JP2666296B2 (ja) 音声認識装置
JP2901976B2 (ja) パターン照合予備選択方式
JPH0376471B2 (ja)
JP2969663B2 (ja) 音声認識装置
JP2891259B2 (ja) 音声区間検出装置
JPS6285300A (ja) 単語音声認識装置
KR100523905B1 (ko) 이중화된 검출조건을 이용한 음성 추출 방법
JPS62255999A (ja) 単語音声認識装置
JPS60101598A (ja) 音声区間検出装置
JPS62238599A (ja) 音声区間検出方法
JPS63274998A (ja) 単語音声認識装置
JPS60260096A (ja) 音声認識装置
JPS62293299A (ja) 音声認識方法
JPS62177600A (ja) 音声認識装置
JPS6059394A (ja) 音声認識装置
JPS58190998A (ja) 音声認識装置
JPS6165300A (ja) 音声信号処理回路