JPH01285997A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH01285997A
JPH01285997A JP63117184A JP11718488A JPH01285997A JP H01285997 A JPH01285997 A JP H01285997A JP 63117184 A JP63117184 A JP 63117184A JP 11718488 A JP11718488 A JP 11718488A JP H01285997 A JPH01285997 A JP H01285997A
Authority
JP
Japan
Prior art keywords
word
instruction
syllable
mode
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63117184A
Other languages
English (en)
Inventor
Toru Ueda
徹 上田
Mitsuhiro Toya
充宏 斗谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP63117184A priority Critical patent/JPH01285997A/ja
Publication of JPH01285997A publication Critical patent/JPH01285997A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、音声人力すべき単語を発声者に指示するこ
とかできる音声認識装置に関する。
〈従来の技術〉 従来の音声認識装置においては、予め発声音によって音
節標準パターンを登録し、音声入力単語を音節に分割し
、この分割された音節の特徴パターンと上記音節標準パ
ターンとの距離を計算して音声入力単語の音節を認識す
るようにしている。
その際に、発声者によって音声入力された単語は音響的
特徴によって音節区間が抽出されるようになっている。
〈発明が解決しようとする課題〉 しかしながら、音声入力単語を音節に分解し、この分解
した音節と音節標準パターンとの距離に基づいて上記音
声入力単語を認識する上記従来の音声認識装置において
は、発声者が音声入力単語を入力する際の発声のし方が
音声入力単語認識の精度に大きな影響を及ぼす。これは
、音声入力単語の音節区間抽出が音声入力単語の音響的
特徴によって行うようになっているため、使用者の発声
が正確でない場合には音声人力単語の音節区間が誤って
抽出されるためである。すなわち、人力された音声の特
徴パターンと音節標準パターンとの距離計算を、上記誤
って抽出された音節区間において行っても音節標準パタ
ーンとの正しい距離が算出されない。したがって、この
ような場合には、算出された距離がいくら小さくても音
節標準パターンとの実際の距離は小さくならず、音声入
力Qt語を誤認してしまうのである。
このように、現在の技術では総ての入力音声に対して正
確に音節区間を抽出することは困%tである。したがっ
て、誤った音節が認識される場合が多く、音声入力単語
の認識の精度が低いという問題がある。そこで、精度の
高い音声人力単語の認識を行うためには、指示単語の音
声入力時において正確に音声入力単語の音節区間が抽出
されるJ、うに、正しい発声によって音声入力単語を入
力することが不可欠である。
ところが、音声人力に不慣れな使用音の場合は、非常に
早口で発声したり、語頭・語尾を弱く発声したりして、
音声入力単語の正しい音節区間抽出に必要な正しい発声
が行われない場合が多い。したがって音声入力に不慣れ
な使用者の場合は音声入力単語の音節区間の抽出の精度
が低いという問題がある。
そこで、この発明の目的は、音声入力単語指示モード時
に、音声入力の不慣れな使用者であっても正しい発声に
よって音声人力を行うことができる音声認識装置を提供
することにある。
〈課題を解決するための手段〉 上記目的を達成するため、この発明は、音声入力すべき
単語を発声者に指示する音声入力単語指示モードを有す
る音声認識装置において、上記音声入力単語指示モード
時に、指示単語記憶部に記憶された指示単語に基づいて
、発声者が発声すべき単語を指示する音声入力単語指示
手段と、上記指示単語記憶部に記憶された指示単語に関
する識別ルールを記憶するルール記憶部と、上記ルール
記憶部に記憶された上記識別ルールに従って発声者に音
声入力時における発声方法の指示を行う発声方法指示手
段を備えたことを特徴としている。
〈作用〉 音声入力単語指示モート時に、音声入力単語指示手段に
よって指示単語が指示されると、ルール記憶部にこの指
示単語に関する識別ルールがある場合は、発声方法指示
手段によって上記指示単語の発声方法が表示部に表示さ
れる。したがって、発声者はこの表示に従って正しい発
声によって指示単語を発声することができる。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明の音声認識装置のブロック図であり、
1は音声を入力するマイクロホン、2はマイクロホン1
より人力された音声の音声帯域のみを増幅する増幅器、
3は増幅器2から人力された音声波形から音節区間抽出
時や音声入力単語の認識時の距離計算に使用される特徴
量を計算する特徴抽出部、4は音声認識装置全体を制御
するCPU(中央制御装置)、5は音節標準パターンを
格納する標準パターン記憶部、6は音声人力単語指=4
= 示モード時に使用音に発声させる単語を記憶する指示単
語記憶部、7は指示単語記憶部6に記憶された指示単語
の発声方法に関するルール、上記音声入力単語の音響的
特徴が不適切な場合に関するルールおよび上記音声人力
単語の音響的特徴が適切な場合に関するルールを記憶す
るためのルール記憶部、8は音節標準パターン登録動作
および音節認識動作の際に使用される作業用メモリ、9
は図示しない外部装置(表示部、キーボード部およびホ
ストCPU等)とデータを交換するためのr10インタ
フェースである。
この実施例の音声認識装置には大きく分けて登録モード
、認識モードおよび独習モードの3つのモードがある。
上記登録モードは、図示しない表示部に表示された指示
単語を発声者が音声入力し、その音声入力単語の音響的
特徴から音声入力単語の音節区間を抽出し、この音節区
間毎に音節標準パターンを作成して登録するモードであ
る。また、上記認識モートは、発声者が発声した音声入
力単語からその音声の音節区間を抽出し、登録モードに
よ−)で予め登録された音節標準パターンとの距離計搾
を抽出された音節区+1jJ fηに行−)ζ、その、
;1算された距離に基づいて音声入力単語を認識して認
識結果を出力するモードである。さらに、この発明に係
る独習モートは、本装置が、′11重入力Q’+語の音
節区間を正しく抽出できるような発声方法を発声者に知
らせ“ることによって、発声音か正しい発声方法を独習
するモードである。
従来の音声認識装置Iこおいては、通;9゛は登録モー
ド、認識モードおよびテストモードの3モードを備えて
いる。上記テストモードは登録モードにおいて音節標準
パターンの登録が正しく行イっれたか否かをテストする
モードであり、本発明に係る独習モードとは本質的に異
なるモードである3゜次に、」−記構成の音声認識装置
にお()ろ独習モートの動作を具体的な例を上げて説明
する。
第2図は独習モードにおいて発声者゛に発声方法を指示
するための識別ルールを示し、ルール記憶部7に記憶さ
れている。ここで、第2図に示すルールの中のフレーム
とは8〜20m5程度の区間を指し、音声の分析を行う
際の時間の単位である。
なお、第2図中の数値は一例きしての値であり、特に意
味をもたない。
まV、第1の例について説明する。
(+)  指示単語記憶部6に記憶された指示単語の一
つを音声入力することを促す指示が、図示しない表示部
に次のように表示される。
“−一〜 ひとつ −m− と発声して下さい。” (2)ルール記憶部7に記憶された識別ルールの中に、
(1)において指示された指示単語の発声方法に該当す
るルールがある場合は、そのルールに基づく発声者への
発声方法の指示が表示部に表示される。
すなわち、第2図において、指示単語「ひとつ」の発声
方法に該当するルールは1番目の指示ルールであるため
、その1番目のルールに従って次のような発声者への指
示が表示部に表示される。
“音節/ひ/を強く発声して下さい” そうすると、発声者は上述のように表示された指示にし
たがって音節/ひ/を強く発声し、適切な発声によって
音声入力単語「ひとつJが入力される。
次に、第2の例について説明する。
(1)  指示単語記憶部6に記憶された指示!11語
の一つを音声入力することを促す指示が、図示しない表
示部に次のように表示される。
“−−一 かいさん −一− と発声して士さい。” (2)(+)における表示に基づいて、発声台によって
発声された音声人力単語「かいざん」は増幅器2によっ
て増幅され、特徴抽出部3によって継続長およびパワー
等の音響的特徴が算出される。そして、この算出された
音響的特徴に基づいて、CPU4によって音声入力単語
「かいさん」が音節に分割される。
上記音節の分割方法は、例えば、記憶された認識語案の
中から予め音声入力単語に応して数個の認識単語候を選
択し、この認識単語候補の音響的特徴の時系列と音声入
力単語の音響的特徴の時系=8− 列とを対応付けることによって、音声入力単語の音節区
間を抽出して行う。
(3)(2)において音節に分解された音声人力単語「
かいさん」の音節毎に、算出された音響的特徴がルール
記憶部7に記憶された音声入力単語の音響的特徴が不適
切な場合に関するルールに該当するか否か判別される。
その結果、該当する場合は適切な発声方法に関する指示
が上記表示部に表示される。
すなわち、例えば音声人ツノ単語「かいさん」の音節/
ん/の継続長が5フレームであったとする。そうすると
、このことは第2図の2番目のルール(音声入力単語の
音響的特徴が不適切な場合のルール)に該当するため、
その2番目のルールにしたがって、発声者への適切な発
声方法の指示が表示部に次のように表示される。
“音節/ん/を強めてもう一度発声して下さい。”そう
すると、発声者は上述のようIこ表示された指示にした
がって音節/ん/を強く発声し、適切な発声によって音
声人力単語「かいさん」が入力される。
次に、第3の例について説明する。
(1)指示単語記憶部6に記憶された指示111語の一
つを音声入力することを促す指示が、図示しない表示部
に次のように表示される。
“−一−かいさん −−−− と発声して下さい3.“ (2)(1)における表示に基づいて、発声者によ。
て発声された音声入力単語「かいさん」は増幅器2によ
って増幅され、特徴抽出部3によって継続長およびパI
ノー等の?”? 性的特徴が算出される。そして、この
算出された音響的特徴に基づいて、CPU4によって音
声人力単語[かいさん1が1−述のようにして音節に分
割される。
(3)(2)において音節に分解された音声人力単語「
かいさん」の音節毎に、算出された音響的特徴がルール
記憶部7に記憶された音声人力単語の音響的特徴が適切
な場合に関するルールに該当するか否か判別される。そ
の結果、該当する場合は現在の発声方法が適切であるこ
とを表す表示が上記表示部Iこ表示される。
すなわち、例えば音声入力単語「かいさん」の各音節の
継続長が総て5フレーム以」二24フレーム以下であり
、各音節の平均バヮーカ<1000以」二であったとす
る。そうすると、このことは第2図の3番目のルール(
音声入力単語の音響的特徴が適切な場合のルール)に該
当するため、その3番目のルールにしたがって、現在の
発声方法が適切な発声方法であることを発声者に知らせ
る次のような表示が表示部に表示される。
“その調子です。頑張って下さい。” そうすると、」二連のように表示された指示にしたがっ
て、さらに次の音声入力単語が発声者によって入力され
る。
このように、ルール記憶部7に記憶している指示単語の
発声方法に関するルール、音声入力単語の音響的特徴が
不適切な場合に関するルールおよび音声入力単語の音響
的特徴が適切な場合に関するルールに従って、発声者に
対する音声入力時の指示を行うJ:うにしたので、発声
者は常に適切なII− 発声方法によって音声人力単語の入力を行うことができ
、音声入力の不慣れな発声者であってら、正しい発声に
よって音声入力を行うことかできる。
したがって、この発明によれば、発声者は正しい発声方
法を独習することができる。またごの発明によれば、正
しい発声による音声入力単語に塙づいて正確な音節区間
抽出を行い、この正確な区間によって正しく音声入力単
語を認識することができる。
」1記実施例は、この発明を独習モードに用いた例であ
るが、この発明はこれに限定される乙のではなく、」1
記登録モートにおいて発声者が指示Q’を語を音声入力
する際に用いてムよい。
上述の実施例において、音声入力時の指示を合成音声に
よる音声指示で行うようにすれば、表示部に表示される
指示を目で確認する必要がないので音声入力が更に簡単
になり、尚−層の効果が期待できる。
〈発明の効果〉 以−により明らかなように、この発明の音声認識装置は
、指示単語に関する識別ルールをルール記憶部に記憶し
、音声人力単語指示モード時に、発声方法指示手段は、
発声者に音声入力時における発声方法の指示を行うよう
にしたので、音声入力の不慣れな発声者であってもこの
指示に従って正しい発声による指示単語の音声入力を行
うことができる。
したがって、この発明によれば、常に正しい発声?こよ
って正確な音節区間を抽出することができ、この正確な
音節区間を用いて精度の高い音声入力単語の認識を行う
ことができる。
【図面の簡単な説明】
第1図はこの発明の音声認識装置のブロック図、第2図
はルール記憶部に記憶された指示単語に関する識別ルー
ルの一例を示す図である。 1・・・マイクロホン、   2・・・増幅器、3・特
徴抽出部、    4・CPU。 5・・・標準パターン記憶部、 6・指示単語記憶部、  7・・ルール記憶部、8 ・
作業用メモリ、 9 ■10インターフェース。

Claims (1)

    【特許請求の範囲】
  1. (1)音声入力すべき単語を発声者に指示する音声入力
    単語指示モードを有する音声認識装置において、 上記音声入力単語指示モード時に、指示単語記憶部に記
    憶された指示単語に基づいて、発声者が発声すべき単語
    を指示する音声入力単語指示手段と、 上記指示単語記憶部に記憶された指示単語に関する識別
    ルールを記憶するルール記憶部と、上記ルール記憶部に
    記憶された上記識別ルールに従って、発声者に音声入力
    時における発声方法の指示を行う発声方法指示手段を備
    えたことを特徴とする音声認識装置。
JP63117184A 1988-05-13 1988-05-13 音声認識装置 Pending JPH01285997A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63117184A JPH01285997A (ja) 1988-05-13 1988-05-13 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63117184A JPH01285997A (ja) 1988-05-13 1988-05-13 音声認識装置

Publications (1)

Publication Number Publication Date
JPH01285997A true JPH01285997A (ja) 1989-11-16

Family

ID=14705495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63117184A Pending JPH01285997A (ja) 1988-05-13 1988-05-13 音声認識装置

Country Status (1)

Country Link
JP (1) JPH01285997A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0446399A (ja) * 1990-06-14 1992-02-17 Sharp Corp 音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0446399A (ja) * 1990-06-14 1992-02-17 Sharp Corp 音声認識装置

Similar Documents

Publication Publication Date Title
JP4867804B2 (ja) 音声認識装置及び会議システム
JP4516112B2 (ja) 音声認識プログラム
JP2010197644A (ja) 音声認識システム
JP2844817B2 (ja) 発声練習用音声合成方式
JP2007148170A (ja) 外国語学習支援システム
Batlouni et al. Mathifier—Speech recognition of math equations
JPS6126677B2 (ja)
JPH01285997A (ja) 音声認識装置
JP3277579B2 (ja) 音声認識方法および装置
JPH09319297A (ja) 音声筆談器
JPH01285998A (ja) 音声認識装置
JP2017015823A (ja) 発話練習装置、表示制御方法、及びプログラム
JPS6057898A (ja) 音声登録方式
Komissarchik et al. Application of knowledge-based speech analysis to suprasegmental pronunciation training
JP2001282098A (ja) 外国語学習装置、外国語学習方法および媒体
JP6517417B1 (ja) 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム
JP3959540B2 (ja) 自動翻訳装置
JP2001188556A (ja) 音声認識方法及び装置
JPS6126678B2 (ja)
JP3192324B2 (ja) 特定話者用単語音声認識装置
Schneider et al. Use of word Pairs and context to achieve better automatic speech recognition results with foreign English speakers
JP2528890B2 (ja) 発声訓練機
JPH08110790A (ja) 音声認識装置
JP2578771B2 (ja) 音声認識装置
JPH03149598A (ja) 音声認識装置