JP2000250587A - 音声認識装置及び音声認識翻訳装置 - Google Patents

音声認識装置及び音声認識翻訳装置

Info

Publication number
JP2000250587A
JP2000250587A JP11052443A JP5244399A JP2000250587A JP 2000250587 A JP2000250587 A JP 2000250587A JP 11052443 A JP11052443 A JP 11052443A JP 5244399 A JP5244399 A JP 5244399A JP 2000250587 A JP2000250587 A JP 2000250587A
Authority
JP
Japan
Prior art keywords
recognition
voice
candidate
display
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11052443A
Other languages
English (en)
Inventor
Takeo Mori
竹雄 森
Makoto Tanaka
田中  誠
Yasunari Obuchi
康成 大淵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Solutions Technology Ltd
Original Assignee
Hitachi Ltd
Hitachi ULSI Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi ULSI Systems Co Ltd filed Critical Hitachi Ltd
Priority to JP11052443A priority Critical patent/JP2000250587A/ja
Publication of JP2000250587A publication Critical patent/JP2000250587A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 音声認識における候補選択操作の簡略化を図
ることにある。 【解決手段】 所望の認識候補が表示手段に表示された
状態で、その認識候補の確定を指示するための入力手段
(24)と、入力手段の入力結果に応じて対応する認識
候補を確定するための音声認識手段(12a)とを設
け、さらに所定時間内に入力手段により確定操作が行わ
れたか否かの判別を行う第1手段と、第1手段の判別結
果に基づいて音声認識の次候補への表示切り換えを制御
するための第2手段とを設ける。入力手段を介して認識
候補を確定するまでは、認識候補が上記表示手段に順次
切り換え表示されるので、音声認識における候補選択操
作操作の簡略化を図ることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された音声を
認識するための音声認識装置、及びそれを含んで成る音
声認識翻訳装置に関する。
【0002】
【従来の技術】例えば、特開平8−329088号公報
に記載されているように、マイクロフォンから入力され
た第1言語の音声信号を音声認識手段で認識し、その認
識信号を第2言語に翻訳して、その結果を音声合成して
スピーカから出力するようにした翻訳装置が知られてい
る。
【0003】また、音声認識においては音声照合処理が
行われる。この処理は、辞書に登録されている単語と入
力情報とを照合するもので、この照合には動的計画法に
おける最適化処理による照合、あるいはHMM(Hid
den Markov Model)を用いた確率累積
による照合が行われる。
【0004】音声認識には、音声を1語づつ区切って認
識する単語音声認識と、連続して発せられた言葉を認識
する連続音声認識があるが、いずれの場合においても、
音声認識では、100パーセントの認識率を得るのは極
めて困難である。
【0005】尚、音声認識について記載された文献の例
としては、昭和58年8月20日に株式会社オーム社か
ら発行された「電子通信ハンドブック(第1775
〜)」がある。
【0006】
【発明が解決しようとする課題】上記のように100パ
ーセントの認識率を得るのは極めて困難であるから、誤
認識しているか否かをユーザに問い合わせることが行わ
れる。例えばディスプレイに候補を表示して「次」とい
う音声コマンド又は特定のボタンを押下することによ
り、次候補への切り換え表示が行われる。
【0007】しかしながら、誤認識しているか否かの確
認について本願発明者が検討したところ、ディスプレイ
に次候補を表示して「次」という音声コマンド又は特定
のボタンを押下することにより、次候補を表示する方式
では、希望する候補が表示されるまで、上記音声コマン
ドの入力又はボタン操作を繰り返さなければならず、そ
れは、多くの次候補がある場合には特に面倒な操作とな
ることが、見いだされた。
【0008】本発明の目的は、音声認識における候補選
択操作の簡略化を図るための技術を提供することにあ
る。
【0009】
【課題を解決するための手段】本願において開示される
発明のうち代表的なものの概要を簡単に説明すれば下記
の通りである。
【0010】すなわち、音声認識の候補を切り換え表示
可能な表示手段(22)と、所望の認識候補が上記表示
手段に表示された状態で、その認識候補の確定を指示す
るための入力手段(24)と、所定時間内に上記入力手
段により確定操作が行われたか否かの判別を行う第1手
段(S14)と、上記第1手段の判別結果に基づいて音
声認識の次候補への表示切り換えを制御するための第2
手段(S17)とを設ける。
【0011】上記した手段によれば、第1手段は、所定
時間内に上記入力手段により確定操作が行われたか否か
の判別を行い、上記第2手段は、上記第1手段の判別結
果に基づいて音声認識の次候補への表示切り換えを制御
する。これにより、上記入力手段を介して認識候補を確
定するまでは、ボタン操作や音声コマンドを入力しなく
ても、認識候補が上記表示手段に順次切り換え表示さ
れ、このことが、音声認識における候補選択操作の簡略
化を達成する。
【0012】また、音声認識の候補一覧を表示可能な表
示手段(22)と、所望の認識候補が上記表示手段に表
示された状態で、その認識候補の確定を指示可能なタッ
チパネル(705)と、上記タッチパネルにより確定操
作が行われたか否かの判別を行う第1手段(S24)
と、上記第1手段の判別結果に基づいて音声認識の次候
補一覧への表示切り換えを制御するための第2手段(S
27)とを含んで、音声認識手段を構成する。
【0013】上記した手段によれば、第1手段は、上記
タッチパネルにより確定操作が行われたか否かの判別を
行い、第2手段は、上記第1手段の判別結果に基づいて
音声認識の次候補一覧への表示切り換えを制御する。こ
れにより、ボタン操作や音声コマンドを入力しなくても
音声認識の次候補一覧が上記表示手段に順次切り換え表
示され、このことが、音声認識における候補選択の容易
化を達成する。
【0014】そして、識別のための番号が付された音声
認識候補を表示可能な表示手段(22)と、所望の認識
候補が上記表示手段に表示された状態で、その認識候補
の確定を音声により指示可能な入力手段(16)とを含
み、所定時間内に上記入力手段を介して候補番号が音声
入力されたか否かの判別を行う第1手段(S34)と、
上記第1手段の判別結果に基づいて音声認識の次候補一
覧への表示切り換えを制御するための第2手段(S3
7)とを設ける。
【0015】上記した手段によれば、第1手段は、所定
時間内に上記入力手段を介して候補番号が音声入力され
たか否かの判別を行い、第2手段は上記第1手段の判別
結果に基づいて音声認識の次候補一覧への表示切り換え
を制御する。これにより、ボタン操作や音声コマンドを
入力しなくても音声認識の次候補一覧が上記表示手段に
順次切り換え表示され、このことが、音声認識における
候補選択の容易化を達成する。
【0016】さらに、音声認識の候補を音声出力可能な
出力手段(17)と、所望の認識候補が上記出力手段か
ら音声出力された状態で、その認識候補の確定を指示可
能な入力手段(24)と、所定時間内に確定操作が行わ
れたか否かの判別を行う第1手段(S44)と、上記第
1手段の判別結果に基づいて音声認識の次候補の音声出
力を制御するための第2手段(S47)とを設ける。
【0017】上記した手段によれば、第1手段は、所定
時間内に確定操作が行われたか否かの判別を行い、第2
手段は、上記第1手段の判別結果に基づいて音声認識の
次候補の音声出力を制御する。これにより、ボタン操作
や音声コマンドを入力しなくても音声認識の次候補一覧
が順次音声出力され、このことが、音声認識における候
補選択の容易化を達成する。
【0018】
【発明の実施の形態】図1には本発明にかかる音声認識
翻訳装置の構成例が示される。
【0019】図1に示される音声認識翻訳装置100
は、特に制限されないが、中央処理装置(「CPU」と
いう)12、読み出し専用メモリ(「ROM」という)
13、読み書きメモリ(「RAM」という)14、周辺
制御装置15、マイクロフォン(「マイク」という)1
6、入力アンプ18、A/D(アナログ/ディジタル)
変換器19、スピーカ17、出力アンプ20、D/A
(ディジタル/アナログ)変換器21、ディスプレイ2
2、及び押しボタンスイッチ23,24を含んで成る。
【0020】マイク16を介して取り込まれた音声信号
は後段の入力アンプ18で増幅され、A/D変換器19
でディジタル信号に変換された後に、周辺制御装置15
へ取り込まれるようになっている。
【0021】ROM13は、CPU12で実行されるプ
ログラムや各種データが記憶されている。ここで各種デ
ータとしては、音声認識の際に参照される認識用辞書、
翻訳の際に参照される翻訳用辞書、音声合成の際に使用
される音源データなどが挙げられる。
【0022】RAM14は、主としてCPU12で行わ
れる演算処理の作業領域として使用される。ROM13
に記憶されているプログラムや各種データがロードされ
ることもある。
【0023】押しボタンスイッチ23,24は、オペレ
ータの操作により音声認識翻訳装置100に対して所定
の指示を与えるために設けられている。特に制限されな
いが、押しボタンスイッチ23は、音声認識翻訳装置1
00を初期化させるためのスイッチ、押しボタンスイッ
チ24は音声認識の候補確定及び翻訳開始を指示するス
イッチとされる。押しボタンスイッチ23,24の押下
は周辺制御装置15を介して認識される。
【0024】CPU12では、そこで実行されるプログ
ラムによって種々の機能が実現される。ここで実現され
る代表的な機能としては、音声認識手段12a、翻訳手
段12b、音声合成手段12cを挙げることができる。
【0025】音声認識手段12aは、マイク16を介し
て入力された第1言語による音声信号から音声を認識す
る機能を有する。この音声認識においてはROM13に
格納された認識用辞書13aが参照される。特に制限さ
れないが、第1言語は日本語とされる。翻訳手段12b
は、上記音声認識手段12aでの認識結果を第2言語に
翻訳する。特に制限されないが、第2言語は英語とされ
る。この翻訳において、ROM13に格納された翻訳用
辞書13bが参照される。音声合成手段12cは、音源
記憶部19に格納された音源データに基づいて、上記翻
訳手段12bの翻訳結果や上記音声認識手段12aの認
識結果を音声合成する機能を有する。音源データは、特
に制限されないが、翻訳用辞書13bに対応して英語と
される。
【0026】ディスプレイ22は、特に制限されない
が、液晶ディスプレイとされ、周辺制御装置15の制御
下で音声認識のための各種情報や翻訳結果などが表示さ
れる。
【0027】また、周辺制御装置15からD/A変換器
21に音声データが伝達されると、そこでアナログ信号
に変換され、後段の出力アンプ20で増幅されてからス
ピーカ17に伝達され、それによりスピーカ17が駆動
される。例えば上記音声合成手段12cでの音声合成結
果がスピーカ17を介して音声出力される。
【0028】図6には音声認識翻訳装置100の外観の
一例が示される。
【0029】図6に示されるようにこの音声認識翻訳装
置100は、特に制限されないが、棒状に形成され、携
帯に便利なペンサイズとされる。ディスプレイ22は横
長であり、それに隣接してマイク16及びスピーカ17
が配置されている。また、ディスプレイ22の上端近傍
には押しボタンスイッチ23,24が設けられる。
【0030】図2には音声認識処理に関する主要処理の
流れが示される。
【0031】音声認識させたい単語あるいはキーワード
をマイク16に向かってしゃべる(S11)と、その音
声信号が周辺制御装置15を介してCPU12に伝達さ
れ、音声認識手段12aにより音声認識のための処理が
開始される(S12)。この音声認識のための処理にお
いて、認識用辞書13aが参照されて、該当する認識候
補が周辺制御装置15を介してディスプレイ22に表示
される。このとき、認識候補が複数ある場合には、先ず
認識候補群の先頭に位置する候補が表示され、音声認識
手段12aは入力待ち状態となる(S13)。そして、
音声認識手段12aにおいて、所定時間内に確定操作が
行われたか否かの判別が行われる(S14)。ここで、
所定時間は、特に制限されないが、数秒に設定される。
この判別において、所定時間内に確定操作が行われた
(YES)と判断された場合には、ディスプレイ22に
現在表示されている認識候補を確定し(S18)、認識
処理が終了される。認識候補の確定は、音声による確定
コマンド入力、あるいは押しボタンスイッチ24を押下
することによって行われる。音声による確定コマンド
は、特に制限されないが、オペレータによって発声され
た「OK」などの音声とされる。つまり、オペレータに
よって発声された「OK」などの音声が、マイク16を
介して入力され、それがCPU12によって認識される
ことにより、上記認識候補が確定される。認識処理が終
了された後は当該認識結果の翻訳処理に移行される。
【0032】しかし、上記ステップS14の判別におい
て、所定時間内に確定操作が行われない(NO)と判断
された場合には、音声認識を中止する操作が行われたか
否かの処理に移行される(S15)。ここで、音声認識
を中止する操作には、音声による中止コマンド入力、あ
るいは押しボタンスイッチ23を押下する操作が含まれ
る。音声による中止コマンドは、特に制限されないが、
オペレータによって発声された「おわり」などの音声と
される。つまり、オペレータによって発声された「おわ
り」などの音声が、マイク16を介して入力され、それ
がCPU12によって認識されることにより、認識処理
が中止される。上記ステップS15の判別において、中
止の操作が行われていない(NO)と判断された場合に
は、次の認識候補があるか否かの判別が行われる(S1
6)。この判別において、次の認識候補がある(YE
S)と判断された場合には、次の認識候補がディスプレ
イ22に表示された後に(S17)、上記ステップS1
4の判別に移行される。そして、上記ステップS16の
判別において、次の認識候補が無い(NO)と判断され
た場合には上記ステップS13の認識候補の先頭表示に
移行される。
【0033】上記した例によれば、以下の作用効果を得
ることができる。
【0034】ステップS14において、所定時間内に上
記入力手段により確定操作が行われたか否かの判別が行
われた後に、ステップS17において、上記判別結果に
基づいて音声認識の次候補への表示切り換えが制御され
ることから、認識候補を確定するまでは、ボタン操作や
音声コマンドを入力しないにもかかわらず、認識候補が
ディスプレイ22に順次切り換え表示されため、音声認
識における候補選択操作の簡略化を図ることができる。
【0035】次に、音声認識翻訳装置の第2の構成例に
ついて説明する。尚、装置の基本的なブロック構成につ
いては、図1に示されるのと同一となるため、その詳細
な説明は省略する。
【0036】図7には音声認識翻訳装置のパネル面が示
される。
【0037】情報表示のためのディスプレイ22は、複
数行が同時に表示可能な比較的広い面積のものが適用さ
れる。図7に示される例では、特に制限されないが、音
声認識における候補1〜6が同時に表示されている。そ
してこのディスプレイ722の表示面を覆うようにタッ
チパネル705が設けられている。タッチパネル705
は、図1に示される周辺制御装置15に結合され、この
周辺制御装置15により各種情報の入力制御が行われ
る。タッチパネル705には、上スクロールマーク70
1、下スクロールマーク702が予め表示されている。
上スクロールマーク701に指が触れると、表示内容が
上方向にスクロールされる。また、下スクロールマーク
702に指が触れると、表示内容が下方向にスクロール
される。そして、文字列が長すぎるために1行に表示し
きれない場合には、対応する行に横スクロールマークが
703,704が表示される。この横スクロールマーク
703,704に指が触れると、対応する行が横スクロ
ールされる。ディスプレイ22の右側には、音声入力の
ためのマイク16、音声出力のためのスピーカ17、及
び押しボタンスイッチ23,24が配置される。
【0038】図3には、図7に示される装置での音声認
識処理手段12aに関する処理の流れが示される。
【0039】音声認識させたい単語あるいはキーワード
をマイク16に向かってしゃべる(S21)と、その音
声信号が周辺制御装置15を介してCPU12に伝達さ
れ、音声認識手段12aにより音声認識のための処理が
開始される(S22)。この音声認識のための処理にお
いて、認識用辞書13aが参照されて、該当する認識候
補一覧がディスプレイ22に表示される(S23)。そ
して、所定時間内にタッチパネルにより確定操作が行わ
れたか否かの判別が行われる(S24)。このタッチパ
ネルによる確定操作は、図7に示されるように複数の候
補が表示されている状態で、所望の候補の表示位置に触
れることで可能とされる。例えば候補4が適切であるな
ら、この候補4の表示箇所(タッチパネル)に指で触れ
ることにより、確定操作を行う。それにより、ステップ
S24の判別においては、タッチパネルにより確定操作
が行われた(YES)と判断され、音声認識手段12a
において上記候補4が確定される(S28)。
【0040】しかし、上記ステップS24の判別におい
て、タッチパネルにより確定操作が行われない(NO)
と判断された場合には、音声認識を中止する操作が行わ
れたか否かの処理に移行される(S25)。ここで、音
声認識を中止する操作には、音声による中止コマンド入
力、あるいは押しボタンスイッチ23を押下する操作が
含まれる。音声による中止コマンドは、特に制限されな
いが、オペレータによって発声された「おわり」などの
音声とされる。
【0041】上記ステップS25の判別において、中止
の操作が行われていない(NO)と判断された場合に
は、次の認識候補があるか否かの判別が行われる(S2
6)。この判別において、次の認識候補がある(YE
S)と判断された場合には、次の認識候補一覧がディス
プレイ22に表示された後に(S27)、上記ステップ
S24の判別に移行される。また、上記ステップ26の
判別において、次の認識候補が無い(NO)と判断され
た場合には上記ステップS23の認識候補の先頭からの
一覧表示に移行される。
【0042】上記した例によれば、以下の作用効果を得
ることができる。
【0043】タッチパネル705により確定操作が行わ
れたか否かの判別が行われ、この判別結果に基づいて音
声認識の次候補一覧への表示切り換えが制御される。こ
れにより、ボタン操作や音声コマンドを入力しなくても
音声認識の次候補一覧が上記表示手段に順次切り換え表
示され、このことが、音声認識における候補選択の容易
化を図ることができる。
【0044】次に、音声認識翻訳装置の第3の構成例に
ついて説明する。尚、装置の基本的なブロック構成につ
いては、図1に示されるのと同一となるため、その詳細
な説明は省略する。
【0045】図4には音声認識処理手段12aにおける
処理の流れが示される。
【0046】音声認識させたい単語あるいはキーワード
をマイク16に向かってしゃべる(S31)と、その音
声信号が周辺制御装置15を介してCPU12に伝達さ
れ、音声認識手段12aにより音声認識のための処理が
開始される(S32)。この音声認識のための処理にお
いて、認識用辞書13aが参照されて、該当する認識候
補毎に、それらの識別を可能とするための番号(「候補
番号」という)が付けられる。そして図8に示されるよ
うに、候補の先頭から複数個(1〜3)がディスプレイ
22に一覧表示されて、入力待ち状態とされる(S3
3)。次に、音声認識手段12aにおいて、所定時間内
に候補番号がオペレータによって発声されたか否かの判
別が行われる(S34)。例えば、候補番号2が適切で
あるなら、オペレータは、「に」と発音することで、確
定操作を行う。すると、それがマイク16を介して入力
され、音声認識手段12aによって認識され、音声認識
手段12aにおいて候補2が確定される(S38)。
【0047】しかし、上記ステップS34の判別におい
て、所定時間内に候補番号が発声されていないと判断さ
れた場合には、音声認識を中止する操作が行われたか否
かの処理に移行される(S35)。ここで、音声認識を
中止する操作には、音声による中止コマンド入力、ある
いは押しボタンスイッチ23を押下する操作が含まれ
る。音声による中止コマンドは、特に制限されないが、
オペレータによる「おわり」などの音声とされる。
【0048】上記ステップS35の判別において、中止
の操作が行われていない(NO)と判断された場合に
は、次の認識候補があるか否かの判別が行われる(S3
6)。この判別において、次の認識候補がある(YE
S)と判断された場合には、次の複数の認識候補に数字
が付され、それらがディスプレイ22に一覧表示され、
音声認識手段12aは入力待ち状態とされ(S37)、
再び上記ステップS34の判別が行われる。また、上記
ステップ36の判別において、次の認識候補が無い(N
O)と判断された場合には上記ステップS33の認識候
補の先頭からの一覧表示に移行される。
【0049】上記した例によれば、以下の作用効果を得
ることができる。
【0050】所定時間内にマイク16を介して候補番号
が音声入力されたか否かの判別が行なわれ、上記第1手
段の判別結果に基づいて音声認識の次候補一覧への表示
切り換えを制御する。これにより、ボタン操作や音声コ
マンドを入力しなくても音声認識の次候補一覧が上記表
示手段に順次切り換え表示され、このことが、音声認識
における候補選択の容易化を達成する。
【0051】次に、音声認識翻訳装置の第4の構成例に
ついて説明する。尚、装置の基本的なブロック構成につ
いては、図1に示されるのと同一となるため、その詳細
な説明は省略する。
【0052】図5には音声認識処理手段12aにおける
処理の流れが示される。
【0053】音声認識させたい単語あるいはキーワード
をマイク16に向かってしゃべる(S41)と、その音
声信号が周辺制御装置15を介してCPU12に伝達さ
れ、音声認識手段12aにより音声認識のための処理が
開始される(S42)。この音声認識のための処理にお
いて、認識用辞書13aが参照されて、該当する認識候
補群の中から先頭に位置する候補が読み上げられ、音声
認識手段12aは入力待ち状態とされる(S43)。す
なわち、認識用辞書13aが参照されて、該当する認識
候補群の中から先頭に位置する候補データが選択される
と、それに基づいて音声合成手段12cにより音声合成
される。この音声合成処理において、ROM13内の音
源データが参照される。そしてこの音声合成の結果が、
D/A変換器21でアナログ信号に変換されてから後段
の出力アンプ20で増幅されてスピーカ17に伝達され
る。伝達された信号によってスピーカ17が駆動され、
このスピーカ17から上記先頭に位置する候補が音声出
力される。
【0054】次に、音声認識手段12aにおいて、所定
時間内に確定操作が行われたか否かの判別が行われる
(S44)。ここで、所定時間は、特に制限されない
が、数秒に設定される。この判別において、所定時間内
に確定操作が行われた(YES)と判断された場合に
は、ディスプレイ22に現在表示されている認識候補を
確定し(S48)、認識処理が終了される。認識候補の
確定は、音声による確定コマンド入力、あるいは押しボ
タンスイッチ24を押下することによって行われる。音
声による確定コマンドは、特に制限されないが、オペレ
ータによって発声された「OK」などの音声とされる。
つまり、オペレータによって発声された「OK」などの
音声が、マイク16を介して入力され、それがCPU1
2によって認識されることにより、上記認識候補が確定
される。認識処理が終了された後は当該認識結果の翻訳
処理に移行される。
【0055】しかし、上記ステップS44の判別におい
て、所定時間内に確定操作が行われないと判断された場
合には、音声認識を中止する操作が行われたか否かの処
理に移行される(S45)。ここで、音声認識を中止す
る操作には、音声による中止コマンド入力、あるいは押
しボタンスイッチ23を押下する操作が含まれる。音声
による中止コマンドは、特に制限されないが、オペレー
タによって発声された「おわり」などの音声とされる。
つまり、オペレータによって発声された「おわり」など
の音声が、マイク16を介して入力され、それがCPU
12によって認識されることにより、認識処理が中止さ
れる。上記ステップS15の判別において、中止の操作
が行われていない(NO)と判断された場合には、次の
認識候補があるか否かの判別が行われる(S46)。こ
の判別において、次の認識候補がある(YES)と判断
された場合には、次の認識候補が読み上げられた後に入
力待ちとされ、上記ステップS44の判別に移行され、
所定時間内に確定操作が行われたか否かの判別が行わ
れ、この判別結果に基づいて音声認識の次候補の音声出
力を制御する。これにより、ボタン操作や音声コマンド
を入力しなくても音声認識の次候補一覧が順次音声出力
されるので、音声認識における候補選択の容易化を達成
することができる。
【0056】以上本発明者によってなされた発明を具体
的に説明したが、本発明はそれに限定されるものではな
く、その要旨を逸脱しない範囲で種々変更可能であるこ
とはいうまでもない。
【0057】以上の説明では主として本発明者によって
なされた発明をその背景となった利用分野である音声認
識翻訳装置に適用した場合について説明したが、本発明
はそれに限定されるものではなく、音声認識を行う装置
に広く適用することができる。
【0058】本発明は、少なくとも音声を認識する機能
を備えることを条件に適用することができる。
【0059】
【発明の効果】本願において開示される発明のうち代表
的なものによって得られる効果を簡単に説明すれば下記
の通りである。
【0060】すなわち、所定時間内に入力手段により確
定操作が行われたか否かの判別が行われ、その判別結果
に基づいて音声認識の次候補への表示切り換えが制御さ
れることにより、入力手段を介して認識候補を確定する
までは、ボタン操作や音声コマンドを入力しなくても、
認識候補が上記表示手段に順次切り換え表示されるの
で、音声認識における候補選択操作の簡略化を図ること
ができる。
【0061】タッチパネルにより確定操作が行われたか
否かの判別が行われ、その判別結果に基づいて音声認識
の次候補一覧への表示切り換えが制御される。これによ
り、ボタン操作や音声コマンドを入力しなくても音声認
識の次候補一覧が表示手段に順次切り換え表示されるの
で、音声認識における候補選択の容易化を図ることがで
きる。
【0062】所定時間内に上記入力手段を介して候補番
号が音声入力されたか否かの判別が行われ、この判別結
果に基づいて音声認識の次候補一覧への表示切り換えが
制御される。これにより、ボタン操作や音声コマンドを
入力しなくても音声認識の次候補一覧が上記表示手段に
順次切り換え表示されるので、音声認識における候補選
択の容易化を図ることができる。
【0063】所定時間内に確定操作が行われたか否かの
判別が行われ、その判別結果に基づいて音声認識の次候
補の音声出力が制御される。これにより、ボタン操作や
音声コマンドを入力しなくても音声認識の次候補一覧が
順次音声出力されるので、音声認識における候補選択の
容易化を図ることができる。
【0064】そしてそのような音声認識装置を含んで音
声認識翻訳装置を構成することができる。
【図面の簡単な説明】
【図1】本発明にかかる音声認識翻訳装置の構成例ブロ
ック図である。
【図2】上記音声認識翻訳装置における主要部の処理の
流れを示すフローチャートである。
【図3】上記音声認識翻訳装置における主要部の別の処
理の流れを示すフローチャートである。
【図4】上記音声認識翻訳装置における主要部の別の処
理の流れを示すフローチャートである。
【図5】上記音声認識翻訳装置における主要部の別の処
理の流れを示すフローチャートである。
【図6】上記音声認識翻訳装置の外観平面図である。
【図7】上記音声認識翻訳装置の別の外観平面図であ
る。
【図8】上記音声認識翻訳装置の表示例説明図である。
【符号の説明】
12 CPU 12a 音声認識手段 12b 翻訳手段 12c 音声合成手段 13 ROM 13a 認識用辞書 13b 翻訳用辞書 13c 音源データ 14 RAM 15 周辺制御装置 16 マイク 17 スピーカ 18 入力アンプ 19 A/D変換器 20 出力アンプ 21 D/A変換器 22 ディスプレイ 23,24 押しボタンスイッチ 100 音声認識翻訳装置 705 タッチパネル
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G06F 15/38 V B G10L 3/00 551C 571T (72)発明者 田中 誠 東京都小平市上水本町5丁目22番1号 株 式会社日立超エル・エス・アイ・システム ズ内 (72)発明者 大淵 康成 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 Fターム(参考) 5B091 AA03 BA12 CB06 CB12 CB26 CB32 CD15 DA03 DA11 5D015 KK02 LL05 LL10

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声認識の候補を表示可能な表示手段
    と、 所望の認識候補が上記表示手段に表示された状態で、そ
    の認識候補の確定を指示するための入力手段とを含み、 上記入力手段の入力結果に応じて対応する認識候補を確
    定する音声認識装置であって、 所定時間内に上記入力手段により確定操作が行われたか
    否かの判別を行う第1手段と、 上記第1手段の判別結果に基づいて音声認識の次候補へ
    の表示切り換えを制御するための第2手段と、 を含むことを特徴とする音声認識装置。
  2. 【請求項2】 音声認識の候補一覧を表示可能な表示手
    段と、 所望の認識候補が上記表示手段に表示された状態で、そ
    の認識候補の確定を指示可能なタッチパネルとを含み、 上記タッチパネルからの指示に応じて対応する認識候補
    を確定する音声認識装置であって、 所定時間内に上記タッチパネルにより確定操作が行われ
    たか否かの判別を行う第1手段と、 上記第1手段の判別結果に基づいて音声認識の次候補一
    覧への表示切り換えを制御するための第2手段と、 を含むことを特徴とする音声認識装置。
  3. 【請求項3】 識別のための番号が付された音声認識候
    補を表示可能な表示手段と、 所望の認識候補が上記表示手段に表示された状態で、そ
    の認識候補の確定を音声により指示可能な入力手段とを
    含み、 上記入力手段からの指示に応じて対応する認識候補を確
    定する音声認識装置であって、 所定時間内に上記入力手段を介して候補番号が音声入力
    されたか否かの判別を行う第1手段と、 上記第1手段の判別結果に基づいて音声認識の次候補一
    覧への表示切り換えを制御するための第2手段と、 を含むことを特徴とする音声認識装置。
  4. 【請求項4】 音声認識の候補を音声出力可能な出力手
    段と、 所望の認識候補が上記出力手段から音声出力された状態
    で、その認識候補の確定を指示可能な入力手段とを含
    み、 上記入力手段からの指示に応じて対応する認識候補を確
    定する音声認識装置であって、 所定時間内に確定操作が行われたか否かの判別を行う第
    1手段と、 上記第1手段の判別結果に基づいて音声認識の次候補の
    音声出力を制御するための第2手段と、 を含むことを特徴とする音声認識装置。
  5. 【請求項5】 請求項1乃至4のいずれか1項記載の音
    声認識装置と、当該音声認識装置で認識された第1言語
    をそれとは異なる第2言語に翻訳するための翻訳手段と
    を含んで成る音声認識翻訳装置。
  6. 【請求項6】 上記翻訳手段の翻訳結果に基づいて音声
    合成する音声合成手段を含んで成る請求項5記載の音声
    認識翻訳装置。
JP11052443A 1999-03-01 1999-03-01 音声認識装置及び音声認識翻訳装置 Withdrawn JP2000250587A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11052443A JP2000250587A (ja) 1999-03-01 1999-03-01 音声認識装置及び音声認識翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11052443A JP2000250587A (ja) 1999-03-01 1999-03-01 音声認識装置及び音声認識翻訳装置

Publications (1)

Publication Number Publication Date
JP2000250587A true JP2000250587A (ja) 2000-09-14

Family

ID=12914890

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11052443A Withdrawn JP2000250587A (ja) 1999-03-01 1999-03-01 音声認識装置及び音声認識翻訳装置

Country Status (1)

Country Link
JP (1) JP2000250587A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006505002A (ja) * 2002-11-02 2006-02-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識の方法およびシステム
JP2009529704A (ja) * 2006-03-10 2009-08-20 インフィニティー テレコム カンパニー リミテッド 移動通信端末装置を利用した通訳サービス方法
JP2012090151A (ja) * 2010-10-21 2012-05-10 Mazda Motor Corp 車両用情報機器
JP2013045282A (ja) * 2011-08-24 2013-03-04 Kyushu Institute Of Technology コミュニケーション支援システム
JP2014174307A (ja) * 2013-03-08 2014-09-22 Kikuichi Nishi 話し言葉表示処理装置
JP2014235356A (ja) * 2013-06-04 2014-12-15 アルパイン株式会社 音声認識を利用した候補選択装置および候補選択方法
JP2021096493A (ja) * 2019-12-13 2021-06-24 コニカミノルタ株式会社 制御装置、制御システム及び制御プログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006505002A (ja) * 2002-11-02 2006-02-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識の方法およびシステム
JP2009529704A (ja) * 2006-03-10 2009-08-20 インフィニティー テレコム カンパニー リミテッド 移動通信端末装置を利用した通訳サービス方法
JP2012090151A (ja) * 2010-10-21 2012-05-10 Mazda Motor Corp 車両用情報機器
JP2013045282A (ja) * 2011-08-24 2013-03-04 Kyushu Institute Of Technology コミュニケーション支援システム
JP2014174307A (ja) * 2013-03-08 2014-09-22 Kikuichi Nishi 話し言葉表示処理装置
JP2014235356A (ja) * 2013-06-04 2014-12-15 アルパイン株式会社 音声認識を利用した候補選択装置および候補選択方法
US9355639B2 (en) 2013-06-04 2016-05-31 Alpine Electronics, Inc. Candidate selection apparatus and candidate selection method utilizing voice recognition
JP2021096493A (ja) * 2019-12-13 2021-06-24 コニカミノルタ株式会社 制御装置、制御システム及び制御プログラム
JP7447458B2 (ja) 2019-12-13 2024-03-12 コニカミノルタ株式会社 制御装置、制御システム及び制御プログラム

Similar Documents

Publication Publication Date Title
US7260529B1 (en) Command insertion system and method for voice recognition applications
JP6570651B2 (ja) 音声対話装置および音声対話方法
JP2003076389A (ja) タッチスクリーン又は音声認識を通じて動作制御される情報端末及びその命令実行方法
US8478600B2 (en) Input/output apparatus based on voice recognition, and method thereof
JPH11231886A (ja) 登録名称認識装置
JP2000250587A (ja) 音声認識装置及び音声認識翻訳装置
JP6522009B2 (ja) 音声認識システム
JP7063844B2 (ja) ロボット教示装置
JP6832503B2 (ja) 情報提示方法、情報提示プログラム及び情報提示システム
JP6993382B2 (ja) ロボット教示装置
JP2993872B2 (ja) マルチモーダル情報統合解析装置
JP2009104047A (ja) 情報処理方法及び情報処理装置
JP2007127896A (ja) 音声認識装置及び音声認識方法
JP4702081B2 (ja) 文字入力装置
JPH07168691A (ja) 表示図形領域選択方式
JP2002259113A (ja) 音声マクロ処理装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体
KR20000030906A (ko) 음성 인식과 음성 합성을 이용한 컴퓨터에서의 명령 실행방법 및 어플리케이션 프로그램에서의 선택된 텍스트를음성으로 변환하여 출력하기 위한 방법
KR20020087297A (ko) 음성처리 기능을 갖는 키오스크
JP2018196922A (ja) ロボット制御システム
JP2003288098A (ja) ディクテーション装置、方法及びプログラム
JPH06110495A (ja) 音声認識装置
JP2000056796A (ja) 音声入力装置および方法
JPH08160988A (ja) 音声認識装置
JPH1011248A (ja) 対話制御機能を具備した情報処理装置
JP2007334665A (ja) 文字入力装置及び携帯情報端末

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060509