JP3083660B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3083660B2
JP3083660B2 JP04279921A JP27992192A JP3083660B2 JP 3083660 B2 JP3083660 B2 JP 3083660B2 JP 04279921 A JP04279921 A JP 04279921A JP 27992192 A JP27992192 A JP 27992192A JP 3083660 B2 JP3083660 B2 JP 3083660B2
Authority
JP
Japan
Prior art keywords
learning
recognition
display
voice
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP04279921A
Other languages
English (en)
Other versions
JPH06130985A (ja
Inventor
徹 真田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP04279921A priority Critical patent/JP3083660B2/ja
Publication of JPH06130985A publication Critical patent/JPH06130985A/ja
Application granted granted Critical
Publication of JP3083660B2 publication Critical patent/JP3083660B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声認識装置に係り、特
に利用者の音声を学習する音声認識装置に関する。
【0002】
【従来の技術】特定話者用の音声認識装置では、不特定
話者用に用意された辞書を特定話者用に修正して認識率
を向上するために、利用者の音声を入力してこれを学習
することが必要である。例えば図7に示すように、辞書
21と、学習部22と、認識部23と、学習認識制御部
24を設ける。
【0003】初めに、学習認識制御部24を学習モード
にしておき、利用者が例えばあらかじめ決められている
複数の単語を順次音声入力する。学習認識制御部24は
これを学習部22に送出する。これにより学習部22
は、辞書21を順次特定話者用に修正する。このように
して学習終了後、学習認識制御部24を認識モードにす
る。そして未知の入力音声を認識部23に送出し、認識
部23はこれを特定話者用に修正された辞書21を参照
して認識結果を出力する。
【0004】
【発明が解決しようとする課題】ところで、この学習状
態は利用者により個人差のあることが判明された。例え
ば個人によっては、予定の半分程度の音声入力で辞書が
特定話者用に充分に修正されていても、予定した単語、
あるいは音節等をすべて音声入力することが必要であ
り、このような場合、利用者は必要以上の負担をうける
ことになる。従って本発明の目的は、辞書が特定話者用
に充分に修正されたとき、それ以上の学習を打ち切るよ
うにした音声認識装置を提供するものである。
【0005】
【課題を解決するための手段】前記目的を達成するため
本発明では、図1に示す如く、学習状況表示部5を設け
て、学習状況の進行状態を表示する。なお図1におい
て、1は辞書、2は学習部、3は認識部、4は学習認識
制御部である。
【0006】まず学習認識制御部4を、制御信号により
学習モードに制御しておき、利用者があらかじめ決めら
れている単語を順次音声入力する。学習認識制御部4
は、これを学習部22に送出する。これにより学習部2
2は辞書21を順次特定話者用に修正する。
【0007】このとき、学習状況表示部5は前記学習部
22から送出された特徴量を辞書1を用いて照合する。
そして照合を行った回数と、正解が得られた回数により
認識率を算出し、これを表示する。そして認識率があら
かじめ決められた値に到達したとき、利用者はその表示
によりこれを認識して、それ以上の学習をやめる。それ
から制御信号により学習認識制御部4を認識モードに制
御し、未知の入力音声信号を認識部3に送出して、特定
話者用に修正された辞書1と例えばDP照合して音声認
識を行う。
【0008】
【作用】本発明によれば認識率が充分高くなったとき、
利用者にこれを表示して学習の停止を知らせることにな
るので、利用者が必要以上に学習を行うことがなくな
り、学習時の負担を軽減することができる。
【0009】
【実施例】本発明の一実施例を図2〜図4にもとづき説
明する。図2は本発明の音声認識装置の一実施例構成
図、図3は認識率計算部の詳細図、図4は表示部におけ
る表示例説明図である。
【0010】図2において、図1と同記号は同一部分を
示し、2は学習部、3は認識部であるDP照合部、4は
学習認識制御部、5は学習状況表示部、6は音響分析
部、10はテンプレート記憶部である。
【0011】学習部2は、テンプレート記憶部10に格
納されている不特定話者用の辞書を特定話者用に学習す
るものであって、学習入力記憶部2−1、テンプレート
学習部2−2を有する。学習入力記憶部2−1は、後述
する音響分析部6において音声入力された単語に対して
抽出された音響レベルの特徴量を一時保持するものであ
る。またテンプレート学習部2−2は、前記音響レベル
の特徴量を、テンプレート記憶部10に保持されている
被学習用の辞書から、該当するものを抽出し、その距離
が特定範囲のものに対して置き換え、特定話者により適
した辞書にするものである。このとき、前記距離が特定
範囲以内のものについては入れ替える必要はなく、また
特定範囲以上のものについては、ミスかもしれないので
これまた入れ替える必要はない。
【0012】DP照合部3は、認識モードのとき、未知
の音声入力をテンプレート記憶部10に保持されている
特定話者用の辞書とDP照合してこれを認識するもので
ある。
【0013】学習認識制御部4は、制御信号にもとづき
音声認識装置を学習モードで動作させたり、認識モード
で動作させたり制御するものであり、学習モードのとき
には、音響分析部6から入力された特徴量を学習入力記
憶部2−1に送出し、また認識モードのときには、音響
分析部6から入力された特徴抽出信号をDP照合部3に
送出するものである。
【0014】学習状況表示部5は、学習モードのときそ
の学習進行状況を表示するものであり、DP照合部5−
1、認識率計算部5−2、表示制御部5−3、表示部5
−4を有する。
【0015】DP照合部5−1は学習時に学習入力記憶
部2−1から送出された単語の特徴量をテンプレート記
憶部10とDP照合し単語認識処理を行い、正解が得ら
れたときその正解信号を認識率計算部5−2に送出す
る。また学習毎に、正解か否かにかかわらず、学習を行
ったことを示す学習実行信号をこれまた認識率計算部5
−2に送出する。なお正解か否かは、学習モードのと
き、どの単語をどの順序で音声入力して学習するのか装
置がわかっているので、学習対象単語辞書にあらかじめ
この順番を付加しておき、学習時に照合出力された単語
のこのコードと、照合出力された回数が一致したとき正
解と判断する。勿論正解の判断はこれのみに限定される
ものではなく、他の手段でも可能である。
【0016】認識率計算部5−2は学習時において、同
時に行う照合がどの程度の正解率であるのか演算するも
のであって、図3に示す如く、学習回数を計数する学習
回数カウント部5−6、正解回数を計数する正解回数カ
ウント部5−7、学習回数と正解回数をあらかじめ定め
られた計算式にもとづき演算を行って予想認識率を算出
する演算部5−8を具備する。
【0017】演算部5−8は、次式の演算を行い予想認
識率×(%)を得る。 X=50+(50×正解回数)/(学習回数+m) ここで右辺の初項の50は初期値であり、またmは1、
2、3等の適当な数値である。いまm=2とし、学習回
数20のうち正解回数が18であればX=90.9%、
学習回数50のうち正解回数が48であればX=96.
2%である。
【0018】表示制御部5−3は、前記認識率計算部5
−2から送出された予想認識率の値に応じて表示部5−
4を制御するものである。表示部5−4は学習状況をオ
ペレータに表示して、学習を続けるか否かを判断させる
ものである。表示部5−4は、図4(A)に示す如く、
予想認識率を数値で表示するように構成しても、同
(B)に示す如く、予想認識率をグラフで表示するよう
に構成しても、同(C)に示す如く、予想認識率に応じ
て?、△、○等の記号で示す如く構成しても、同(D)
に示す如く、予想認識率に応じてカラーランプ表示する
ように構成してもよい。
【0019】予想認識率が80%以下のときは実用的で
なく、90%以下のときは何とか使用できる状態であ
り、95%になれば学習終了と判断できる。勿論この数
値はその用途に応じて相追し、非常に正確な認識を要求
される場合には、その数値はこれよりも高くなる。
【0020】音響分析部6は、入力音声を解析して特徴
抽出するものであり、例えば音響レベルの特徴量の抽出
を行うものである。テンプレート記憶部10は音声認識
を行うときに必要な被照合用の辞書を保持するものであ
る。この辞書は最初不特定話者用のものであるが、前記
の如く、学習モードのときの入力音声にもとづき、音響
レベルで特徴が入れ替えられ、認識モードのときには特
定話者用の辞書を保持するものとなる。
【0021】次に図2の動作について、表示部5−4が
図4(A)に示す如き数値表示を行うもので構成された
場合について説明する。 (1) 最初に、音声認識装置を学習モードにするため、図
2における学習認識制御部4に学習モード用の制御信号
を入力する。
【0022】(2) 利用者は、次に既知の単語を音声入力
する。この入力音声は、音響分析部6において特徴抽出
され、学習認識制御部4に送出される。このとき学習モ
ードで制御されているため、学習認識制御部4はこの特
徴量を学習入力記憶部2−1に送出し、学習入力記憶部
2−1はこの特徴量を保持する。
【0023】(3) テンプレート学習部2−2は、この特
徴量にもとづき、前記の如く、テンプレート記憶部10
に保持されている辞書を学習させ、利用者用に修正す
る。 (4) なお、前記学習入力記憶部2−1は、前記のように
保持した特徴量を、DP照合部5−1に順次送出する。
これにもとづきDP照合部5−1はテンプレート記憶部
10に保持されている辞書とDP距離を用いて照合す
る。そしてこの結果、正解が得られたか否か等を、前記
の如く、認識率計算部5−2に送出する。そして認識率
計算部5−2は予想認識率Xを演算する。
【0024】(5) 学習の初めは、正解が得られない場合
も存在するが、学習回数を重ねるにしたがって、辞書が
特定話者用に順次特徴量の入れ替えが行われほとんど正
解が得られることになる。従って、学習前は、初期値5
0%の予想認識率であったものが、順次高率となり80
%→90%→95%になる。そして95%以上になった
とき、利用者はこれをみて学習がほぼ終了したものと判
断して学習を停止する。
【0025】(6) それから音声認識装置を認識モードで
動作させるため、認識モード用の制御信号を学習認識制
御部4に印加する。これにより、音響分析部6から送出
された特徴量を、学習認識制御部4が、今度はDP照合
部3に送出するので、DP照合部3がテンプレート記憶
部10に保持されている特定話者用に修正された辞書に
対しDP照合を行い、未知の入力音声の認識を行う。
【0026】本発明の他の実施例を図5、図6にもとづ
き説明する。図5は本発明の第2実施例の構成を示し、
図6は表示例説明図である。図5において他図と同記号
は同一部を示し、15は学習状況表示部を示す。そして
学習状況表示部15はカウント部、表示制御部15−
3、表示部15−4等を具備する。
【0027】図5では、学習状況をテンプレート記憶部
10に対して音響レベルでの特徴量を入れ替えた回数で
判断する。前記の如く、テンプレート学習部2−2では
音響レベルの特徴を、テンプレート記憶部10の辞書か
ら該当するものと比較して、その距離が特定範囲のもの
について入れ替えを行い、辞書を特定話者用に修正す
る。図5ではこの入れ替える度にこれをカウント部15
−2に通知することによりカウント部15−2がこれを
カウントし、学習達成度を示す。
【0028】表示制御部15−3はこのカウント部15
−2が送出されたカウント値にもとづきこれに応じて表
示部15−4を制御するものである。このとき、表示制
御部15−3は、例えばカウント値が100以下のとき
は実用的でなく、更に学習を必要と判断し、500以下
のときは何とか使用可能と判断し、600以上のとき実
用上充分に学習されたものと判断し、これらに応じた制
御を行う。
【0029】表示部15−4は、図6(A)に示す如
く、カウント値つまり学習達成度を数値で表示するよう
に構成しても、同(B)に示す如く、学習達成度を?、
△・・・等の記号で示す如く構成しても、同(C)に示
す如く、カラーランプ表示するように構成してもよい。
勿論グラフ表示してもよい。
【0030】このようにして、学習達成度が利用者の所
望のレベルに達したとき、利用者はそれ以上の学習を停
止する。そして音声認識装置を認識モードで動作するた
め、認識モード用の制御信号を学習認識制御部4に印加
する。これにより今度は音響分析部6から送出された特
徴量が学習認識制御部4からDP照合部3側に送出さ
れ、未知の入力音声を認識することができる。
【0031】なお、前記説明では照合をDP照合にもと
づき行う例について説明したが、本発明は勿論これのみ
に限定されるものではなく、他の照合手段を用いてもよ
い。また特徴抽出を音響レベルで行う例について説明し
たが、これまたこれのみに限定されるものではなく、本
発明は音韻レベル、音素レベル、音節レベルでも可能で
ある。
【0032】
【発明の効果】本発明によれば、学習の進行状況を利用
者に対して表示することができるので、必要以上の学習
を行うことを防止可能となる。その結果利用者の負担を
大きく軽減することができる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の一実施例構成図である。
【図3】本発明における認識率計算部の構成図である。
【図4】本発明における表示例説明図である。
【図5】本発明の第2実施例構成図である。
【図6】本発明の第2実施例における表示例説明図であ
る。
【図7】従来例である。
【符号の説明】
1 辞書 2 学習部 3 認識部(DP照合部) 4 学習認識制御部 5 学習状況表示部 6 音響分析部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭60−212799(JP,A) 特開 昭59−87500(JP,A) 特開 昭62−235991(JP,A) 特開 昭60−201396(JP,A) 特開 平2−35499(JP,A) 特開 昭57−64800(JP,A) 特開 昭61−47997(JP,A) 特公 平3−14359(JP,B2) 特公 平1−60159(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10L 15/06

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】 利用者の音声を学習する音声認識装置に
    おいて、 利用者の音声入力にもとづき学習を行う学習手段(2)
    と、 前記学習手段(2)にもとづき特定話者用に修正される
    辞書(1)と、 未知音声と前記辞書(1)とを照合して未知音声を認識
    する認識手段(3)と、 学習モードのとき入力音声に関する信号を前記学習手段
    (2)に送出し、認識モードのとき入力音声に関する信
    号を前記認識手段(3)に送出する学習認識制御手段
    (4)と、 学習モードにおける学習進行状況を表示する学習状況表
    示手段(5)を具備し、 学習モードのとき、前記学習認識制御手段(4)から送
    出される学習用の音声信号にもとづき、前記学習手段
    (2)により前記辞書(1)を利用者用に学習するとと
    もに、その学習の進行状況を前記学習状況表示手段
    (5)により表示するように構成したことを特徴とする
    音声認識装置。
  2. 【請求項2】 前記学習状況表示手段(5)として、 辞書と照合する照合手段(5−1)と、予想認識率を算
    出する認識率計算手段(5−2)と、表示手段(5−
    4)を有することを特徴とする請求項1記載の音声認識
    装置。
  3. 【請求項3】 前記学習状況表示手段(5)として、 辞書に対する修正回数を計数するカウント手段(15−
    2)と、表示手段(15−4)を有することを特徴とす
    る請求項1記載の音声認識装置。
  4. 【請求項4】 前記表示手段(5−4)として予想認識
    率を数字にもとづき表示するように構成したことを特徴
    とする請求項2記載の音声認識装置。
  5. 【請求項5】 前記表示手段(5−4)として、予想認
    識率をグラフにもとづき表示するように構成したことを
    特徴とする請求項2記載の音声認識装置。
  6. 【請求項6】 前記表示手段(5−4)として、予想認
    識率をカラーランプにもとづき表示するように構成した
    ことを特徴とする請求項2記載の音声認識装置。
  7. 【請求項7】 前記表示手段(5−4)として、予想認
    識率を記号にもとづき表示するように構成したことを特
    徴とする請求項2記載の音声認識装置。
  8. 【請求項8】 前記表示手段(15−4)として、学習
    達成度にもとづく表示を行うように構成したことを特徴
    とする請求項3記載の音声認識装置。
  9. 【請求項9】 前記表示手段(15−4)として,学習
    達成度を数字にもとづき表示するように構成したことを
    特徴とする請求項3記載の音声認識装置。
JP04279921A 1992-10-19 1992-10-19 音声認識装置 Expired - Lifetime JP3083660B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04279921A JP3083660B2 (ja) 1992-10-19 1992-10-19 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04279921A JP3083660B2 (ja) 1992-10-19 1992-10-19 音声認識装置

Publications (2)

Publication Number Publication Date
JPH06130985A JPH06130985A (ja) 1994-05-13
JP3083660B2 true JP3083660B2 (ja) 2000-09-04

Family

ID=17617768

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04279921A Expired - Lifetime JP3083660B2 (ja) 1992-10-19 1992-10-19 音声認識装置

Country Status (1)

Country Link
JP (1) JP3083660B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USD758474S1 (en) 2015-05-07 2016-06-07 Gopro, Inc. Camera mount
US9389491B2 (en) 2013-07-22 2016-07-12 Gopro, Inc. Camera mount with spring clamp

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6324507B1 (en) * 1999-02-10 2001-11-27 International Business Machines Corp. Speech recognition enrollment for non-readers and displayless devices
US7949533B2 (en) 2005-02-04 2011-05-24 Vococollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
US7865362B2 (en) 2005-02-04 2011-01-04 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US7827032B2 (en) 2005-02-04 2010-11-02 Vocollect, Inc. Methods and systems for adapting a model for a speech recognition system
EP3627497A1 (en) * 2006-04-03 2020-03-25 Vocollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
US8914290B2 (en) 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US9978395B2 (en) 2013-03-15 2018-05-22 Vocollect, Inc. Method and system for mitigating delay in receiving audio stream during production of sound from audio stream
US10714121B2 (en) 2016-07-27 2020-07-14 Vocollect, Inc. Distinguishing user speech from background speech in speech-dense environments

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9389491B2 (en) 2013-07-22 2016-07-12 Gopro, Inc. Camera mount with spring clamp
USD758474S1 (en) 2015-05-07 2016-06-07 Gopro, Inc. Camera mount
USD800207S1 (en) 2015-05-07 2017-10-17 Gopro, Inc. Camera mount

Also Published As

Publication number Publication date
JPH06130985A (ja) 1994-05-13

Similar Documents

Publication Publication Date Title
US7711560B2 (en) Speech recognition device and speech recognition method
US5428707A (en) Apparatus and methods for training speech recognition systems and their users and otherwise improving speech recognition performance
EP0380297A2 (en) Method and apparatus for speech recognition
DE3778579D1 (de) Ausbildung von in einem spracherkennungssystem verwandten markov-modellen.
JP3083660B2 (ja) 音声認識装置
KR20040061659A (ko) 음성인식방법 및 장치
US7406417B1 (en) Method for conditioning a database for automatic speech processing
JP5105943B2 (ja) 発話評価装置及び発話評価プログラム
JP2004341518A (ja) 音声認識処理方法
JPS6326700A (ja) 音声認識システム
JP2002358097A (ja) 音声認識装置
JP3311460B2 (ja) 音声認識装置
EP0421744B1 (en) Speech recognition method and apparatus for use therein
JPH10254489A (ja) 数字用音声認識システム
Lea What causes speech recognizers to make mistakes?
JP2015099335A (ja) 情報処理装置およびその方法
JP3090204B2 (ja) 音声モデル学習装置及び音声認識装置
KR100404852B1 (ko) 언어모델적응기능을가진음성인식장치및그제어방법
JP3353334B2 (ja) 音声認識装置
CN108133706A (zh) 语义识别方法及装置
JPH06289899A (ja) 音声認識装置
KR20010085219A (ko) 서브단어 메모리를 포함하는 음성인식 장치
JPH075890A (ja) 音声対話装置
WO1994015330A1 (en) Method and apparatus for automatic evaluation of pronunciation
JPH1097270A (ja) 音声認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000613

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090630

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100630

Year of fee payment: 10