JPH01285998A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH01285998A
JPH01285998A JP63117185A JP11718588A JPH01285998A JP H01285998 A JPH01285998 A JP H01285998A JP 63117185 A JP63117185 A JP 63117185A JP 11718588 A JP11718588 A JP 11718588A JP H01285998 A JPH01285998 A JP H01285998A
Authority
JP
Japan
Prior art keywords
syllable
word
registered
speech
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63117185A
Other languages
English (en)
Inventor
Toru Ueda
徹 上田
Hiroyuki Iwahashi
岩橋 弘幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP63117185A priority Critical patent/JPH01285998A/ja
Publication of JPH01285998A publication Critical patent/JPH01285998A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、入力された音声を音節に分割して認識する
音声認識装置に関する。
〈従来の技術〉 従来の音声認識装置においては、予め発声者によって音
節標準パターンを登録し、音声入力単語を音節lこ分割
し、この分割された音節の特徴パターン七上記音節標準
パターンとの距離を計算して音声入力単語の音節を認識
するようにしている。
そして、音節標準パターンを登録する際には、発声者に
よって音声入力された単語の音響的特徴によって音節区
間を抽出し、その抽出された音節区間に従って音節標準
パターンを得るようにしている。
〈発明が解決しようとする課題〉 しかしながら、上記従来の音声認識装置においては、音
節標準パターン登録時に発声者が音声入力単語を入力す
る際の発声のし方が音声入力単語認識の精度?こ大きな
影響を及ぼず。これは、音声入力単語の音節区間抽出が
音声入力単語の音響的特徴によって行うようになってい
るため、使用者の発声が正確でない場合には音声入力単
語の音節区間が誤って抽出されるからである。ずなイっ
ち、誤って抽出された音節区間における音響的特徴を音
節標準パターンとして記憶すると、音節入力?1″1語
を認識する際に、入力された音声の特徴パターンと音節
標準パターンとの距離計算を行って671Eしい音節標
準パターンとの距離が算出されない。
したがって、このような場合には、算出された距離かい
くら小さくても正しい音節標準パターンとの距離は小さ
くならず、音声入力単語を誤認してしまうのである。
このように、音節標準パターンを登録する場合、現在の
技術では総ての入力音声に対して正確に音節区間を抽出
することは困難である。したがって、誤った音節標準パ
ターンが登録される場合が多く、音声入力単語の認識の
精度が低いという問題がある。そこで、精度の高い音声
入力単語の認識を行うためには、音節標準パターン登録
時において正確に音声入力単語の音節区間が抽出される
ように、正しい発声によって音声入力単語を入ツノする
ことが不可欠である。
ところが、音声入力に不慣れな使用者の場合は、非常に
早口で発声したり、語頭・語尾を弱く発声したりして、
正しく音節標準パターンを登録する場合に必要な正しい
発声が行イつれない場合が多い。
したがって音声入力に不慣れな使用者の場合は音声入力
単語の音節区間の抽出の精度が低いという問題がある。
そこで、この発明の目的は、音節標準パターンを登録す
る際に、音声入力の不慣れな発声者であっても正しい発
声によって音声入力を行うことができる音声認識装置を
提供することにある。
〈課題を解決するだめの手段〉 上記目的を達成するため、この発明は、予め発声者によ
って音節槽重パターンを登録し、音声によって入力され
た音声入力単語を音節に分割し、この分割された音節毎
に」二足音節標準パターンとの距離を計算し、その31
−算結果に基づいて上記音声入力単語を認識する音声認
識装置において、音節標準パターンの登録時に、登録単
語記憶部に記憶された登録単語に基づいで、発声者が発
声すべき単語を指示する登録単語指示手段と、」二記登
録単語記憶部に記憶された登録単語に関する識別ルール
を記憶するルール記憶部と、上記ルール記憶部に記憶さ
れた上記識別ルールに従って発声者に音声入力時におけ
る発声方法の指示を行う発声方法指示手段を備えたこと
を特徴としている。
く作用〉 音節標準パターンの登録時に、登録単語指示手段によっ
て登録単語が指示されると、ルール記憶部にこの登録単
語に関する識別ルールがある場合は、発声方法指示手段
によって上記登録単語の発声方法が表示部に表示される
。したかっ−ζ、音節標準パターンの登録時に発声者は
この表示に従って正しい発声によって登録単語を発声す
ることができる。
〈実施例〉 以下、この発明を図示の実施例ににり詳細に説明する。
第1図はこの発明の音声認識装置のブロック図であり、
1は音声を入力するマイクロホン、2はマイクロホン1
より入力された音声の音声帯域のみを増幅する増幅器、
3は増幅器2から入力された音声波形から音節区間抽出
時や音声入力単語の認識時の距離計算に使用される特徴
量を計算する特徴抽出部、4は音声認識装置全体を制御
するCPU(中央制御装置)、5は入力音声を認識する
際に使用する音節標準パターンを格納する標準パターン
記憶部、6は上記音節標準パターンの登録時に発声者に
発声させる登録単語を記憶する登録単語記憶部、7は登
録単語記憶部6に記憶された登録単語の発声方法に関す
るルール、音声入力単語の音響的特徴が不適切な場合に
関するルールおよび上記音声入力単語の音響的特徴が適
切な場合に関するルールを記憶するだめのルール記憶部
、8は音節標準パターン登録動作および音節認識動作の
際に使用される作業用メモリ、9は図示しない外部装置
(表示部、キーボード部およびボス!−CPU等)とデ
ータを交換するためのI10インタフエ−ス、IOは音
節槽重パターンの登録時等における発声者への指示を合
成音声によって行う際に合成音声を出力する音声合成部
である。
この実施例の音声認識装置には大きく分けて登録モード
および認識モードの2つのモードかある。
この発明に係る登録モードは、音声合成部10からの出
力によって指示される登録単語を発声音が音声入力し、
その音声入力単語の音響的特徴から音声入力単語の音節
区間を抽出し、この音節区間毎に音節標準パターンを作
成して登録するモードである。そして、」−記登録モー
トでは、発声者か登録単語を音声入力する際に、本装置
が、°)・声入力単語の音節区間を正しく抽出できるよ
うな発声方法を発声者に知らせることによって、発声音
が市しい発声方法によって登録11i語を音声入力でき
ろようにしている。また、」二記認識モードは、発声者
が発声した音声入力eli AAからその音声の音節区
間を抽出し、登録モードによってpめ登録されノこ音節
標準パターンとの距離1什算を抽出された音節区間毎に
行って、その計算された距離にJNづいて音声入力単語
を認識して認識結果を出力するモートである。
次に、」―記構成の音声認識装置における登録モート時
の音声入力単語指示の動作を具体的な例を上げて説明す
る。
第2図は登録モードにおいて発声音に発声方法を指示す
るための識別ルールを示し、ルール記憶部7に記憶され
ている。ここで、第2図に示すルール中のフレームとは
8〜20m5程度の区間を指し、音声の分析を行う際の
時間の単位である。尚、上述のルール中の数値は一例と
しての数値であり特に意味をもたない。
まず、第1の例について説明する。
(1)登録単語記憶部6に記憶された登録単語の一つを
音声入力することを促す指示が、音声合成部IOから次
のように出力される。
“−m−ひとつ −一− と発声して下さい。” (2)ルール記憶部7に記憶された識別ルールの中に、
(1)において指示された登録単語の発声方法に該当す
るルールがある場合は、そのルールに基づく発声者への
発声方法の指示が音声合成部10から出力される。
すなわち、第2図において、登録単語「ひとっJの発声
方法に該当するルールは1番1」の指示ルールであるた
め、その1番目のルールに従って次のような発声者への
指示が音声合成部10から出力される。
“音節/ひ/を強く発声して下さい” そうすると、発声者は上述のように表示された指示にし
たがって音節/ひ/を強く発声し、適切な発声によって
音声入力単語「ひとっ1が入力される。
次に、第2の例について説明4−る。
(1)登録単語記憶部6に記憶された登録単語の一つを
音声入力することを促す指示が、音声合成部IOから次
のように出力される。
“−一−かいさん −m− と発声して下さい。” (2)(1)における表示に基づいで、発声者に、にっ
=8− て発声された音声入力単語「かいさん」は増幅器2によ
って増幅され、特徴抽出部3によって継続長およびパワ
ー等の音響的特徴が算出される。そして、この算出され
た音響的特徴lこ基づいで、CPU4によって音声入力
単語「かいさん」が音節に分割される。
上記音節の分割方法は、例えば、記憶された認識給電の
中から予め音声入力単語に応じて数個の認識単語候を選
択し、この認識単語候補の音響的特徴の時系列と音声入
力単語の音響的特徴の時系列とを対応付けることによっ
て、音声入力単語の音節区間を抽出して行う。
(3)(2)において音節に分解された音声入力単語「
かいさん」の音節毎に、算出された音響的特徴がルール
記憶部7に記憶された音声入力単語の音響的特徴が不適
切な場合に関するルール?こ該当するか否か判別される
。その結果、該当する場合は適切な発声方法に関する指
示が音声合成部10から出力される。
すなわち、例えば音声入力単語「かいさん」の音節/ん
/の継続長が5フレームであったと4−る。そうすると
、このこ七は第2図の2番目のルール(音声入力単語の
音響的特徴が不適切な場合のルール)に該当するので、
その2番1」のルールにしたがって、発声者への適切な
発声方法の指示が音声合成部IOから次のように出力さ
れる。
“音節/ん/を強めてもう一度発声して下さい。”そう
すると、発声者は」二連のように表示された指示にした
がって音節/ん/を強く発声し、適切な発声によって登
録単語「かいさん」が音声入力される。
次に、第3の例について説明する。
(1)登録単語記憶部6に記憶された登録単語の一つを
音声入力することを促す指示が、音声合成部10から次
のように出力される。
“−−−−かいさん −m= と発声して下さい。” (2)(1)における表示に基づいで、発声者によって
発声された音声入力単語「かいさん」は増幅器2によっ
て増幅され、特徴抽出部3によって継続長およびパワー
等の音響的特徴が算出される。そして、この算出された
音響的特徴に基づいで、CPU4によって音声入力単語
「かいさん」が」二連のようにして音節に分割される。
(3)(2)において音節に分解された音声入力単語「
かいさん」の音節毎に、算出された音響的特徴がルール
記憶部7に記憶された音声入力単語の音響的特徴が適切
な場合に関するルールに該当するか否か判別される。そ
の結果、該当する場合は現在の発声方法が適切であるこ
とを表す合成音声が音声合成部10より出力される。
すなわち、例えば音声入力単語「かいさん」の各音節の
継続長が総て5フレ一ム以上24フレーム以下であり、
各音節の平均バワーカ月000以上であったとする。そ
うすると、このことは第2図の3番目のルール(音声入
力単語の音響的特徴が適切な場合のルール)に該当する
ので、その3番目のルールにしたがって、現在の発声方
法が適切な発声方法であることを発声者に知らせるため
の合成音声が音声合成部IOから次のように出力lI− される。
”その調子です。頑張って下さい。” そうすると、」二連のように表示された指示にしたがっ
て、さらに次の音声入力単語が発声者に、1;7、て入
力される。
このように、登録モート時において、ルール記憶部7に
記憶している登録単語の発声方法に関するルール、音声
入力単語の音響的特徴が不適切な場合に関するルールお
よび音声入力単語の音響的特徴が適切な場合に関するル
ールに従って、発声者に対する音声入力時の指示を行う
ようにしたので、発声者は常に適切な発声方法によって
登録単語の音声入力を行うことができ、音声入ノJの不
慣れな発声者であっても、正しい発声によって登録単語
の音声入力を行うことができる。したか−)で、この発
明によれば、正しい発声による音声入力単語に基づいて
正確な音節標準パターンを登録し、この正確な音節標準
パターンを用いて正しく音声入力単語を認識することが
できる。
上記実施例においては、音声入力時の指示を音声合成部
10からの合成音声によって行うようにしているが、C
RT(カソード・レイ・デユープ)等の表示部に表示す
るようにしてもよい。
〈発明の効果〉 以上にり明らかなように、この発明の音声認識装置は、
登録単語に関する識別ルールをルール記憶部に記憶し、
音節標準パターンの登録時においては、発声方法指示手
段は、発声者が登録単語を音声入力する際の発声方法を
上記識別ルールに従って表示するようにしたので、音声
入力の不慣れな発声者であっても、この表示に従って正
しい発声による登録単語の音声入力を行うことができる
したがって、この発明によれば、常に正確な音節標準パ
ターンを登録することができ、この正確な音節標準パタ
ーンを用いて精度の高い音声入力単語の認識を行うこと
ができる。
【図面の簡単な説明】
第1図はこの発明の音声認識装置のブロック図、第2図
はルール記憶部に記憶された登録単語に関する識別ルー
ルの一例を示す図である。 1 マイクロボン、  2・増幅器、 3 特徴抽出部、    4・・CI) LJ 。 5 標準パターン記憶部、 6・・・登録単語記憶部、  7 ・ルール記憶部、8
・作業用メモリ、 9・・I10インターフェース IO・・音声合成部。

Claims (1)

    【特許請求の範囲】
  1. (1)予め発声者によって音節標準パターンを登録し、
    音声によって入力された音声入力単語を音節に分割し、
    この分割された音節毎に上記音節標準パターンとの距離
    を計算し、その計算結果に基づいて上記音声入力単語を
    認識する音声認識装置において、 音節標準パターンの登録時に、登録単語記憶部に記憶さ
    れた登録単語に基づいで、発声者が発声すべき単語を指
    示する登録単語指示手段と、上記登録単語記憶部に記憶
    された登録単語に関する識別ルールを記憶するルール記
    憶部と、上記ルール記憶部に記憶された上記識別ルール
    に従って、発声者に音声入力時における発声方法の指示
    を行う発声方法指示手段を備えたことを特徴とする音声
    認識装置。
JP63117185A 1988-05-13 1988-05-13 音声認識装置 Pending JPH01285998A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63117185A JPH01285998A (ja) 1988-05-13 1988-05-13 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63117185A JPH01285998A (ja) 1988-05-13 1988-05-13 音声認識装置

Publications (1)

Publication Number Publication Date
JPH01285998A true JPH01285998A (ja) 1989-11-16

Family

ID=14705517

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63117185A Pending JPH01285998A (ja) 1988-05-13 1988-05-13 音声認識装置

Country Status (1)

Country Link
JP (1) JPH01285998A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001042887A (ja) * 1999-06-26 2001-02-16 Koninkl Philips Electronics Nv 自動音声認識器を訓練する方法
WO2004032113A1 (ja) * 2002-10-07 2004-04-15 Mitsubishi Denki Kabushiki Kaisha 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58178396A (ja) * 1982-04-12 1983-10-19 株式会社日立製作所 音声認識用標準パタ−ン登録方式
JPS59107391A (ja) * 1982-12-13 1984-06-21 株式会社日立製作所 発声法訓練装置
JPS59216200A (ja) * 1983-05-24 1984-12-06 三菱電機株式会社 音声入力制御装置
JPS6057898A (ja) * 1983-09-09 1985-04-03 電子計算機基本技術研究組合 音声登録方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58178396A (ja) * 1982-04-12 1983-10-19 株式会社日立製作所 音声認識用標準パタ−ン登録方式
JPS59107391A (ja) * 1982-12-13 1984-06-21 株式会社日立製作所 発声法訓練装置
JPS59216200A (ja) * 1983-05-24 1984-12-06 三菱電機株式会社 音声入力制御装置
JPS6057898A (ja) * 1983-09-09 1985-04-03 電子計算機基本技術研究組合 音声登録方式

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001042887A (ja) * 1999-06-26 2001-02-16 Koninkl Philips Electronics Nv 自動音声認識器を訓練する方法
WO2004032113A1 (ja) * 2002-10-07 2004-04-15 Mitsubishi Denki Kabushiki Kaisha 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
US7822613B2 (en) 2002-10-07 2010-10-26 Mitsubishi Denki Kabushiki Kaisha Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus

Similar Documents

Publication Publication Date Title
JP4867804B2 (ja) 音声認識装置及び会議システム
JP4516112B2 (ja) 音声認識プログラム
JPS6126677B2 (ja)
JPH01285998A (ja) 音声認識装置
JP3277579B2 (ja) 音声認識方法および装置
JPH01285997A (ja) 音声認識装置
JPS6057898A (ja) 音声登録方式
JP2001282098A (ja) 外国語学習装置、外国語学習方法および媒体
JP3959540B2 (ja) 自動翻訳装置
JPS6126678B2 (ja)
JP3192324B2 (ja) 特定話者用単語音声認識装置
JPH08110790A (ja) 音声認識装置
JP2638151B2 (ja) 会話補助装置
JPH03149598A (ja) 音声認識装置
Dzibela et al. Hidden-Markov-Model Based Speech Enhancement
JP4445371B2 (ja) 認識語彙の登録装置と音声認識装置および方法
JPH01285995A (ja) 音声認識装置
JPH01289997A (ja) 音声登録方式
JP2004309654A (ja) 音声認識装置
JP2578771B2 (ja) 音声認識装置
JPS59176791A (ja) 音声登録方式
JPS6032098A (ja) 音声情報入力装置
JPH05197397A (ja) 音声認識方法及びその装置
JPH0731472B2 (ja) 音声語学練習機
JP2006337963A (ja) 音声対話装置及び訂正発話認識方法