JPH02173699A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH02173699A
JPH02173699A JP63327749A JP32774988A JPH02173699A JP H02173699 A JPH02173699 A JP H02173699A JP 63327749 A JP63327749 A JP 63327749A JP 32774988 A JP32774988 A JP 32774988A JP H02173699 A JPH02173699 A JP H02173699A
Authority
JP
Japan
Prior art keywords
recognition
standard
special
pattern
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63327749A
Other languages
English (en)
Inventor
Tetsuya Abe
哲也 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP63327749A priority Critical patent/JPH02173699A/ja
Publication of JPH02173699A publication Critical patent/JPH02173699A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は標錫となる比較パターンを多様化して認識率を
改善した音声認識装置に関する。
[従来の技術] 第2図は従来の音声認識装置のブロック図を示す。音声
認識装置は、制御部10による制御の基で、以下のよう
な処理を実行する各部を有する。
即ち、アナログ人力信号に変換した入力音声を帯域フィ
ルタでスペクトル分析して、音声に含まれる言語的特徴
を抽出する周波数分析部11、入力音声データの時系列
の音声パワーに基づき音声の始端、終端を検出して入力
音声から音声区間のみを切り出す音声区間検出部12、
発声者の個人差2発声速度の変化による舎声の伸縮等を
補正して、後述する比較パターンと最も近似した状態に
おいて比較するために正規化する正規化部13、人力音
声データと比較パターンとのパターンマツチングを行う
マツチング部I4、選択的重み付はマツチングによる距
離値、パワーデイツプによる非類似度、音声区間長によ
る非類似度値を加算し、その結果を比較して認識結果を
制御部10を介して出力する判定部15、及び人力音声
との比較に用いられる比較パターンが記憶されるメモリ
部16を、上記音声認識装置は備えている。
ここで、入力音声との比較のためにメモリ部16に記憶
されている比較パターンは、全国各地で多数の話者より
1カテゴリ(単語等の認識対象Jh、以下同じ)当たり
数千のデータを収集し、これらデータに重み付けを行い
平均化した、平均化重み付はパターン群としている。
[発明が解決しようとする課題J しかしながら、上記のような比較パターンを用いた従来
装置では、各地方における独特の発声方法、例えば訛り
による人力データについては、比較パターンそのものが
標準語を基にして収集したデータであるため、満足でき
る認識率を得ることができなかった。
そこで、満足できる認識率を得る方法として、比較パタ
ーンデータの数を増やすことが考えられる。しかし、単
にデータ数か多くなると、比較時間がそれだけ長くなる
ため認識結果が出力されるまでに時間がかかってしまう
という欠点があった。
本発明の目的は、上述した訛り等による認識率の低下や
、データ量の増加による認識時間の増大という従来の欠
点を解消して、優れた認識機能を持つ音声認識装置を提
供することにある。
「課題を解決するための手段] 本発明の音声認識装置は、音声に含まれる言語的特徴に
関する比較パタンを予め記憶させ、この比較パタンと入
力音声とを比較して類似性を調べ、類似性に基づいて認
識判定をおこなう比較認識1′す足部が、上記人力音声
と比較する比較パターンを標?■語に関する標準パター
ンで形成した標準認識判定部と、各地方特有の発声方法
による非標準語に関する特別パターンで形成した特別認
識判定部とで分離して構成されている。
そしで、これら標準認識判定部と特別認識判定部とが共
通の入力音声に基づき並列に類似性を調べ これら類似
性のより高い方のパターンに付加されたカテゴリ名を認
識結果として出力するように構成したちのである。
[作用] 各地方特有の発声方法を持つ音声が入力されると、この
入力音声は標準認識判定部と特別認識fllll色部同
時に入力される。 すると、標準認識判定部と特別認識
判定部とで並行して各パタンとの類似性が調べられ、類
似性に基づいた認識判定が各部からそれぞれ出力される
。入力音声か非標準語であることから、これらの出力の
内、類似性のより高い特別パターンに付加されたカテゴ
リ名が認識結果として出力される。
このようにして、当該発声方法による人力音声に最も近
いカテゴリ名を、標準パターンからではなく、特定パタ
ーンから見いだすことが可能となるため、標準語に関す
る標準パターンでの比較のみによっていた場合に比して
、非標準語に関する認識率が向上する。
また、比較パターンの数が増えることになるけれども、
標準パターンと特別パターンとはそれぞれ標準認識判定
部と特別認識判定部とに記憶され、これら記憶内容をも
とに、各部で並列して比較されるため、hQパターンか
終了したら次に特定パターンどの比較をするというよう
に直列的に比較する場合に比して、認識結果が出力され
るまでの時間が短くてすむ。
[実施例] 以[、本発明の実施例を第1図を用いて説明する。
第1図は本発明の音声認識装置例を示すプロ。
り図である。なお、図中第2図に示した従来例と同一機
能を有する部分については、同一符号を付してその説明
を省略ないし簡略化した。
第2図と異なる点は、正規化部13より後段のマ、チン
グ部141判定部15、メモリ部16から構成される認
識判定部を、標準認識判定部24と、特別認識判定部2
5と、最終判定部26とに分離した点である。
標準認識判定部24は、正規化部13で正規化された入
力音声データと標準パターンとのパターンマツチングを
、例えば動的計画法(DP)を用いて行い、選釈的重み
付はマツチングによる距離。
パワーデイツプによる非類似度、音声区間長による非類
似度を出力する標準マツチング部22.そして選択的重
み付はマツチングによる距離値、パワーデイツプによる
非類似度、音声区間長による非類似度値を加算し、その
加算結果を比較して加算値の中から最小の加算値を出力
する標準判定部29、人力音声との比較に用いられる標
準パターンが記憶されている標準メモリ部27から成る
ここで、入力音声との比較のために標準メモリ部28に
記憶される標準パターンは、標準語に含まれる言語的特
徴に関するものであり、既述したように全国各地で多数
の話者より1カテゴリ当たり多数のデータを標準語につ
いて収集し、これらデータに重み付けを行って平均化し
た、平均化重み付はパターン群とする。
また、特別認識判定部25は、正規化部13より標準マ
、チング部22と並列に人力される入力音声データと特
別パターンとのパターンマツチングをDPを用いて行い
、選択的重み付はマツチングによる距離値、パワーデイ
ツプによる非類似度。
音声区間長による非類似度値を出力する特別マツチング
部23.そして選択的重み付はマ・ソチングニヨる距離
値、パワーデイツプによる非類似度。
音声区間長による非類似度値を加算市、その加算結果を
比較して加算値の中から最小の加算値を出力する特別判
定部30.訛り等を持った入力音声との比較に用いられ
る特別パターンが記憶されている特別メモリ部28から
成る。
ここで、入力音声との比較のために特別メモリ部28に
記憶される特別パターンは、標準パターンと同様に、訛
り等の各地方特有の発声に含まれる言語的特徴に関する
もので、例えば全国各地で多数の話者より1カテゴリ当
たり多数のデータを訛り等について収集し、これらデー
タに重み付けを行い平均化した、平均化重み付はパター
ン群とする。
そして、最終判定部26は、標準判定部29と特別判定
部30との最小加算結果同士を比較して数値の小さい、
即ち類似性のより高い方の加算値を出したパターンに付
加されたカテゴリ名を、認識結果として制御部10を介
して出力する。
さて、上記したような構成において、音声が入力される
と、入力音声は周波数分析部11でスペクトル分析され
、音声区間検出部12で音声区間の切り出しを行い、正
規化部13で正規化される。
この正規化された人力音声データは、標準認識判定部2
4及び特別認識判定部25へ同時に入力され、標準判定
部29と特別判定部30とで並列に処理されて、標準判
定部29で算出される最小加算値と、特別判定部30で
算出される最小加算値とが最終判定部26に入力される
この最終判定部26では、標準判定部29と特別判定部
30との最小加算値同士が比較され、数値の小さい方(
認識確度が高い方)のパターンに付加されたカテゴリ名
が認識結果として判定され、制御部10を介して出力さ
れる。
以上述べたように、上記実施例によれば、標準語と主体
とした標準認識判定部24の他に、方言などで発音がく
ずれる訛り等、各地方における独特の発声方法による非
標準語を主体とした特定認識判定部25を設けることに
より、訛り等についても別個に認識するように構成しで
ある。このため、標準パターンのみによっていた場合の
特定地域による音声認識率の低下を、特別パターンを持
つことで抑えることができ、その結果、認識率が改善さ
れる。
また、認識処理時間は、標準パターンと特別パターンと
の比較認識を並列処理して同時に判定しているため、単
に標準パターンと特定パターンとの比較認識を直列処理
するようにした場合に比べて、パターンデータが増大し
ても処理時間が大幅に短縮される。
なお、上記実施例では比較パターンを、標準パターンと
特別パターンとに2様化して、特別パターンを各地方独
特の発声方法を一つのグループにまとめた場合について
述べたが、これに限定されるものではな(、各地方独特
の発声方法を更に多様化した形で把握するようにしても
よい。
また、人力音声データと比較パターン(標準パターン又
は特定パターン)との類似性を非類似度テ判定している
が、これとは逆に類似度で判定するようにしてもよい。
[発明の効果] 本発明は、各地方特有の発声方法(訛り等)による特別
なパターンを持つので、特有の発声方法による音声が入
力されても、発声方法による影響を受けることなく、入
力音声を高度に認識できる。
また、入力音声と標準パターン及び特別パターンとの比
較は並列してなされるので、データ量が増大してもデー
タ量の影響を受けることなく、認識時間の増大を抑制す
ることができる。
【図面の簡単な説明】
第1図は本発明の実施例を示す音声認識装置のブロック
図、第2図は従来例を示すブロック図である。 図中、10は認識結果を出力する制御部、24は標準認
識判定部、25は特別認識判定部、26は最終判定部、
27は標準パターンを記憶する標準メモリ部、28は特
別パターンを記憶する特別メモリ部である。

Claims (1)

  1. 【特許請求の範囲】 音声に含まれる言語的特徴に関する比較パタンを予め記
    憶させ、この比較パタンと入力音声とを比較して類似性
    を調べ、類似性に基づいて認識判定をおこなう比較認識
    判定部を、 上記入力音声と比較する比較パターンが標準語に関する
    標準パターンで形成された標準認識判定部と、各地方特
    有の発声方法による非標準語に関する特別パターンで形
    成された特別認識判定部とで分離構成し、 これら標準認識判定部と特別認識判定部とが共通の入力
    音声に基づき並、列に類似性を調べ、これら類似性のよ
    り高い方のパターンに付加されたカテゴリ名を認識結果
    として出力するように構成したことを特徴とする音声認
    識装置。
JP63327749A 1988-12-27 1988-12-27 音声認識装置 Pending JPH02173699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63327749A JPH02173699A (ja) 1988-12-27 1988-12-27 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63327749A JPH02173699A (ja) 1988-12-27 1988-12-27 音声認識装置

Publications (1)

Publication Number Publication Date
JPH02173699A true JPH02173699A (ja) 1990-07-05

Family

ID=18202553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63327749A Pending JPH02173699A (ja) 1988-12-27 1988-12-27 音声認識装置

Country Status (1)

Country Link
JP (1) JPH02173699A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0541365A2 (en) * 1991-11-08 1993-05-12 Canon Kabushiki Kaisha Character recognition method and apparatus
KR100423460B1 (ko) * 2001-07-19 2004-03-18 한국전자통신연구원 주제어 인식이 가능한 음성인식시스템 및 방법
JP2010107982A (ja) * 2008-10-31 2010-05-13 Qinghua Univ コンピュータによる複数の方言を背景とする共通語音声認識のモデリング方法及びシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0541365A2 (en) * 1991-11-08 1993-05-12 Canon Kabushiki Kaisha Character recognition method and apparatus
US5465305A (en) * 1991-11-08 1995-11-07 Canon Kabushiki Kaisha Character recognition method and apparatus for preparing a plurality of character recognition processes in parallel
KR100423460B1 (ko) * 2001-07-19 2004-03-18 한국전자통신연구원 주제어 인식이 가능한 음성인식시스템 및 방법
JP2010107982A (ja) * 2008-10-31 2010-05-13 Qinghua Univ コンピュータによる複数の方言を背景とする共通語音声認識のモデリング方法及びシステム

Similar Documents

Publication Publication Date Title
US4783802A (en) Learning system of dictionary for speech recognition
US6553342B1 (en) Tone based speech recognition
EP0380297A2 (en) Method and apparatus for speech recognition
US4882755A (en) Speech recognition system which avoids ambiguity when matching frequency spectra by employing an additional verbal feature
US5732190A (en) Number-of recognition candidates determining system in speech recognizing device
JPH02173699A (ja) 音声認識装置
KR930011739B1 (ko) 초성 프리매칭의 2단매칭을 이용한 음성 인식방법
JP2520392B2 (ja) 単語音声認識装置
KR100346736B1 (ko) 음성인식방법
JPH01193800A (ja) 連続音声認識装置
Kido et al. Spoken word recognition system for unlimited speakers
Elghonemy et al. Speaker independent isolated Arabic word recognition system
JPH0619497A (ja) 音声認識方法
JPH0554116B2 (ja)
KR950009328B1 (ko) 단음절단위의 음성인식방법
JPH0667695A (ja) 音声認識方法および音声認識装置
JPH07146696A (ja) 音声認識における単語テンプレートの自動作成方法
JPH02118698A (ja) 音声認識装置
JPS62111292A (ja) 音声認識装置
JPS59211098A (ja) 音声認識装置
JPH02193200A (ja) 音声認識装置
JPS62119598A (ja) 単語音声認識装置
JPH0380299A (ja) 単語音声予備選択方式
Yalabik et al. An efficient algorithm for recognizing isolated Turkish words
JPH01253799A (ja) 音声の認識方法