JPH07199989A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH07199989A JPH07199989A JP5354522A JP35452293A JPH07199989A JP H07199989 A JPH07199989 A JP H07199989A JP 5354522 A JP5354522 A JP 5354522A JP 35452293 A JP35452293 A JP 35452293A JP H07199989 A JPH07199989 A JP H07199989A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- voice
- recognition target
- target
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
判断でき、認識対象の音声認識が難しい場合、丁寧に発
音したり、認識の困難さの回避できる高性能で使いやす
い音声認識装置を提供することを目的とする。 【構成】 入力された音声情報を音声認識部103に送
り、入力された音声と認識対象データとを比較すること
により音声認識処理を行う。ステップS303では、認
識結果を状況管理部104に送り、認識結果に応じて次
の認識対象を決定する。また、表示部102に対し認識
結果が出力される(S312)。次の認識対象も表示部
102に提示される(S313)。さらに、ステップS
204で、認識対象情報が難易度演算部105に送ら
れ、次の認識状況における難易度を計算し、結果を表示
部102へ出力して使用者に注意を促す(S314)。
Description
のである。
媒体の中で、最も自然に使われるのが音声である。一
方、計算機の飛躍的な進歩により、計算機は数値計算の
みならず様々な情報を扱えるように進歩してきている。
そこで、音声を人間と計算機との情報交換の媒体として
利用する要求が高まり、より正確な音声認識が必要とさ
れてきている。
識を行うための認識対象の範囲が動的に変更されること
がないか、変更があっても少数単語であって、多くの単
語,文または文体まで変更するものではなかった。この
ため認識する状況に応じて、音声認識を行なう難しさ
(認識性能)が変化することもなく、認識率と使用者の
発声との相対関係にも動的変化は起らなかった。従っ
て、使用者に対して状況に応じた音声認識の難しさ等を
提示し、使用者に注意を促す必要もなかった。
対象範囲が動的に変更される音声認識装置の出現によ
り、認識率と使用者の発声との関係が動的に変化するよ
うになった。
は、例えば、図4に示すように、住所・名前を順に入力
することが分っている場合に、最初に日本の地方名が特
定の約10の認識単語数に基づいて認識される。ここで
“関東”と入力・認識された場合には、次に関東の県名
が特定の約7の認識単語数に基づいて認識される。他の
地方名が入力されれば、次はその地方の県名の認識とな
る。このように、先の認識結果に基づいて次の認識対象
範囲及び認識難易度が変更されることを言う。
される音声認識装置では、変更される認識対象及び/又
は認識対象の変更に伴う音声認識の難しさ(認識性能)
を使用者に提示して、発声について注意を促すことが認
識率向上の大きな要素となる。
声認識の難しさを使用者に提示することにより、使用者
が次の発話で何を発声すれば良いか、丁寧に発声するべ
きか否か等の判断を可能として、認識率を向上させた音
声認識装置を提供する。
に、本発明の音声認識装置は、人間の発生する音声を認
識し、音声認識の結果または認識状況に対応して次の認
識対象範囲が変更される音声認識装置において、音声デ
ータを入力する音声入力手段と、所定の認識対象範囲の
データを格納する認識対象格納手段と、前記入力音声デ
ータと前記所定の認識対象範囲のデータとの比較に基づ
いて、音声認識を行う音声認識手段と、認識結果及び前
記認識対象を出力する出力手段と、前記認識結果に基づ
いて、次の認識対象を決定する認識対象決定手段とを備
えることを特徴とする音声認識装置。
音声認識対象の単語または文を出力する。また、前記出
力手段は、変更された次の音声認識対象の文体を文法ま
たは例を用いて出力する。また、音声認識の難易度を認
識対象の単語または文の数、または文体の複雑度から計
算する難易度演算手段を更に備え、前記出力手段は、更
に変更された次の音声認識対象の認識難易度を数字,色
または画像を用いて使用者に出力する。
する。
示す図である。本実施例の音声認識装置は以下の構成要
素からなる。
aとA/D変換器101bとを含む音声入力部、102
は、認識結果,認識対象,認識難易度等を表示する表示
部、103は、入力音声の認識を行なう音声認識部、1
04は、認識結果や次の認識対象等の状況を管理する状
況管理部、105は、次の認識対象から認識難易度を計
算する難易度計算部である。ここで、状況管理部104
は、図4のような認識対象の情報テーブル(認識対象テ
ーブル104a)を有し、難易度演算部105は、図5
のような認識対象と認識難易度との関係を示す情報テー
ブル(変換関数105a)を有している。認識対象はツ
リー状にリンクされて不図示の辞書に格納され、先の認
識結果により次の認識対象が1つ選択される。
ウエア構成を示す図である。尚、図1と同一の参照番号
は同様な機能を果す。
制御を司る演算・制御用のCPU、202は、CPU2
1の処理手順と変換関数105aを格納するROM、2
03は、演算補助用で認識対象テーブル104aを含む
RAM、205は、マイク101aからの入力されA/
D変換器101bでデジタルに変換されたデータを、装
置に入力する入力インタフェース、206は、認識対象
テーブル104aに基づき認識結果,認識対象,認識難
易度等を表示する表示部102に、データを出力する出
力インタフェースである。
よる構成で図3に示す流れにしたがって動作する。
ら入力された音声に対して音声入力処理を行う。次のス
テップS302では、入力された音声情報を音声認識部
103に送り、入力された音声と認識対象データとを比
較することにより音声認識処理を行う。ステップS30
3では、認識結果を状況管理部104に送り、認識結果
に応じて次の認識対象を決定する。また、表示部102
に対し認識結果が出力される(S312)。
(S313)。さらに、ステップS204で、認識対象
情報が難易度演算部105に送られ、次の認識状況にお
ける難易度を計算し、結果を表示部102へ出力して使
用者に注意を促す(S314)。
象テーブルを図4に示す。図4は、認識した音声に対し
て、その次の発話の対象(認識対象),認識対象単語,
認識の難易度(対象単語数)及び入力結果を示す。ここ
では、住所と名前の単語を入力する例を示している。
識対象になっており、約10の地方名が認識できるの
で、その認識対象の「日本の地方名」を使用者に提示す
る。また、この認識状況における難易度をこの例では認
識対象語数に対応して演算する。これは、図5に示すよ
うな関数やテーブルを用いて言葉や色などに変換し提示
することができる。ここでは、約10の地方名が対象で
あるため、認識難易度は「易しい」となる。
うに、「関東地方の県名」に認識対象が変更されて表示
される。認識対象は7県名であり、認識難易度はやはり
「易しい」になる。
ように認識対象は「東京の市町村名」となり表示され
る。東京の市町村は約50であり、認識難易度は「普
通」として提示される。
ように認識対象は「新宿住人の名前」となり表示され
る。新宿住人の名前は約5000もあり、認識難易度は
「難しい」として提示される。
更されたことを提示し、さらに、その状況における認識
の難易度を使用者に提示することを特徴としている。
尚、上記例で認識対象「日本の地方名」や「関東地方の
県名」は、認識対象数が少ないので全対象を表示すれ
ば、使用者の入力間違いが減り認識率も高くなる。
認識対象の認識状況に応じた音声認識を行なうために、
認識対象およびその状況における難易度を提示でき、使
用者に注意を促すことにより、より高性能で使いやすい
音声認識装置が実現できることが保証される。
のや変更される認識対象データが単語で表されている
が、入力が連続音声であり、変更される認識対象データ
が文であったり、文体を表す文法であっても処理するこ
とができる。すなわち、変更される認識対象データが文
体を表す文法などに関しても変更される時には、典型的
な例文を提示することができる。
表す基準(複雑度)に認識対象データの単語数を用いた
が、以下の場合も可能である。
に基づいた難易度の計算。
基づいた難易度の計算。
数,パープレキシティ,エントロピー等)に基づいた難
易度の計算。
葉または表現などの画像を含め、何らかの使用者に分る
形で難易度との対応がとれる表現方法であれば良い。
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによって達成される場合にも適用で
きることは言うまでもない。
いは音声認識の難しさを使用者に提示することにより、
使用者が次の発話で何を発声すれば良いか、丁寧に発声
するべきか否か等の判断を可能として、認識率を向上さ
せた音声認識装置を提供できる。
識対象が動的に変更される音声認識装置において、変更
された認識対象を使用者に提示し、また認識対象の変更
に伴う音声認識の難しさ(認識性能)を使用者に提示す
ることにより、使用者は、次の発話で何を発声すれば良
いか判断でき、また、音声認識の難しさを提示すること
により、難しい場合には、丁寧に発声したり、場合によ
っては、認識の困難さを回避したりでき、より高性能で
使いやすい音声認識装置の実現を可能とする。
る。
示す図である。
る。
図である。
Claims (4)
- 【請求項1】 人間の発生する音声を認識し、音声認識
の結果または認識状況に対応して次の認識対象範囲が変
更される音声認識装置において、 音声データを入力する音声入力手段と、 所定の認識対象範囲のデータを格納する認識対象格納手
段と、 前記入力音声データと前記所定の認識対象範囲のデータ
との比較に基づいて、音声認識を行う音声認識手段と、 認識結果及び前記認識対象を出力する出力手段と、 前記認識結果に基づいて、次の認識対象を決定する認識
対象決定手段とを備えることを特徴とする音声認識装
置。 - 【請求項2】 前記出力手段は、変更された次の音声認
識対象の単語または文を出力することを特徴とする請求
項1記載の音声認識装置。 - 【請求項3】 前記出力手段は、変更された次の音声認
識対象の文体を文法または例を用いて出力することを特
徴とする請求項1記載の音声認識装置。 - 【請求項4】 音声認識の難易度を認識対象の単語また
は文の数、または文体の複雑度から計算する難易度演算
手段を更に備え、 前記出力手段は、更に変更された次の音声認識対象の認
識難易度を数字,色または画像を用いて使用者に出力す
ることを特徴とする請求項1記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35452293A JP3501488B2 (ja) | 1993-12-29 | 1993-12-29 | 音声認識装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35452293A JP3501488B2 (ja) | 1993-12-29 | 1993-12-29 | 音声認識装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07199989A true JPH07199989A (ja) | 1995-08-04 |
JP3501488B2 JP3501488B2 (ja) | 2004-03-02 |
Family
ID=18438127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP35452293A Expired - Fee Related JP3501488B2 (ja) | 1993-12-29 | 1993-12-29 | 音声認識装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3501488B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09114490A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
JPH09288494A (ja) * | 1996-04-23 | 1997-11-04 | Sony Corp | 音声認識装置および音声認識方法 |
JP2005148724A (ja) * | 2003-10-21 | 2005-06-09 | Zenrin Datacom Co Ltd | 音声認識を用いた情報入力を伴う情報処理装置 |
JP2006251059A (ja) * | 2005-03-08 | 2006-09-21 | Nissan Motor Co Ltd | 音声対話装置および音声対話方法 |
JP2007212919A (ja) * | 2006-02-13 | 2007-08-23 | Fujitsu Ten Ltd | 音声対話システム |
CN107004414A (zh) * | 2015-10-08 | 2017-08-01 | 索尼公司 | 信息处理设备、信息处理方法及程序 |
-
1993
- 1993-12-29 JP JP35452293A patent/JP3501488B2/ja not_active Expired - Fee Related
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09114490A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
JPH09288494A (ja) * | 1996-04-23 | 1997-11-04 | Sony Corp | 音声認識装置および音声認識方法 |
JP2005148724A (ja) * | 2003-10-21 | 2005-06-09 | Zenrin Datacom Co Ltd | 音声認識を用いた情報入力を伴う情報処理装置 |
JP2006251059A (ja) * | 2005-03-08 | 2006-09-21 | Nissan Motor Co Ltd | 音声対話装置および音声対話方法 |
JP4624825B2 (ja) * | 2005-03-08 | 2011-02-02 | 日産自動車株式会社 | 音声対話装置および音声対話方法 |
JP2007212919A (ja) * | 2006-02-13 | 2007-08-23 | Fujitsu Ten Ltd | 音声対話システム |
CN107004414A (zh) * | 2015-10-08 | 2017-08-01 | 索尼公司 | 信息处理设备、信息处理方法及程序 |
CN107004414B (zh) * | 2015-10-08 | 2020-11-13 | 索尼公司 | 信息处理设备、信息处理方法及记录介质 |
Also Published As
Publication number | Publication date |
---|---|
JP3501488B2 (ja) | 2004-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4838351B2 (ja) | キーワード抽出装置 | |
US11450313B2 (en) | Determining phonetic relationships | |
US5797116A (en) | Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word | |
US7624018B2 (en) | Speech recognition using categories and speech prefixing | |
JP3248981B2 (ja) | 計算機 | |
US20020123894A1 (en) | Processing speech recognition errors in an embedded speech recognition system | |
JP3426176B2 (ja) | 音声認識装置、方法、コンピュータ・システム及び記憶媒体 | |
JP2002116796A (ja) | 音声処理装置、音声処理方法及び記憶媒体 | |
JP3523213B2 (ja) | コマンド処理装置、コマンド処理方法、及びコマンド処理プログラム | |
JP2011504624A (ja) | 自動同時通訳システム | |
JP7255032B2 (ja) | 音声認識 | |
JP3501488B2 (ja) | 音声認識装置及び方法 | |
US20010056345A1 (en) | Method and system for speech recognition of the alphabet | |
JP2005283972A (ja) | 音声認識方法及びこの音声認識方法を利用した情報提示方法と情報提示装置 | |
JP2002132291A (ja) | 自然言語対話処理装置およびその方法並びにその記憶媒体 | |
CN112185339A (zh) | 一种用于供电智能客户的语音合成处理方法及系统 | |
JP6383748B2 (ja) | 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム | |
JPH07168520A (ja) | 学習習熟度判別装置付き語学用教育装置 | |
US20220270503A1 (en) | Pronunciation assessment with dynamic feedback | |
JPH0683381A (ja) | 音声合成装置 | |
JP2003330923A (ja) | 自動対話装置 | |
JP3308402B2 (ja) | 音声出力装置 | |
JPH08314492A (ja) | 音声入力翻訳装置 | |
KR20220030448A (ko) | 언어 대응 화상 출력 장치, 방법 및 시스템 | |
KR20240073991A (ko) | 음성 합성 서비스 제공 방법 및 그 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20031125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20031202 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081212 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081212 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091212 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091212 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101212 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121212 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131212 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |