JP2007127896A - 音声認識装置及び音声認識方法 - Google Patents

音声認識装置及び音声認識方法 Download PDF

Info

Publication number
JP2007127896A
JP2007127896A JP2005321428A JP2005321428A JP2007127896A JP 2007127896 A JP2007127896 A JP 2007127896A JP 2005321428 A JP2005321428 A JP 2005321428A JP 2005321428 A JP2005321428 A JP 2005321428A JP 2007127896 A JP2007127896 A JP 2007127896A
Authority
JP
Japan
Prior art keywords
speech recognition
candidate
utterance
speech
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005321428A
Other languages
English (en)
Inventor
Takeshi Ono
健 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nissan Motor Co Ltd
Original Assignee
Nissan Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nissan Motor Co Ltd filed Critical Nissan Motor Co Ltd
Priority to JP2005321428A priority Critical patent/JP2007127896A/ja
Publication of JP2007127896A publication Critical patent/JP2007127896A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】一度行った訂正要求を再度行わなければならなくなる頻度を低減することができる音声認識装置を提供する。
【解決手段】音声認識装置は、過去の発話についての音声認識候補のうち、訂正意図に応じて、信号処理装置14によって生成されたシステム応答とは異なる第1位以外の候補が採用された音声認識候補のパターンを、当該第1位以外の候補と関連付けてメモリ22に記憶しておく。そして、信号処理装置14は、今回の発話についての音声認識候補のパターンが、メモリ22に記憶されている過去の発話についての音声認識候補のパターンと同一である場合には、当該第1位以外の候補を音声認識結果として採用する。
【選択図】図3

Description

本発明は、入力された音声を認識する音声認識装置及び音声認識方法に関する。
従来から、入力された音声を認識することにより、その音声に基づく所定の処理を行うことが可能な音声認識装置が提案されている。また、音声認識装置としては、ユーザからの要求に応じて誤認識を容易に訂正することができるものも提案されている(例えば、特許文献1等参照。)。
特開2000−315096号公報
しかしながら、従来の音声認識装置においては、以前誤認識した状況と同様の音響条件のもとで同様の発話を行った場合には、同様の誤認識の発生を招来してしまうという問題があった。そのため、ユーザは、音響条件が変化しない状況で発話する場合には、毎回、誤認識の訂正要求を行わなければならないことがあった。
そこで、本発明は、上述した実情に鑑みて提案されたものであり、一度行った訂正要求を再度行わなければならなくなる頻度を低減することができる音声認識装置及び音声認識方法を提供することを目的とする。
本発明にかかる音声認識装置は、音声認識手段による過去の発話についての音声認識候補のうち、訂正意図に応じて、当該音声認識手段によって生成されたシステム応答とは異なる第1位以外の候補が採用された音声認識候補のパターンを、当該第1位以外の候補と関連付けて記憶手段に記憶し、今回の発話についての音声認識候補のパターンが、記憶手段に記憶されている過去の発話についての音声認識候補のパターンと同一である場合には、当該第1位以外の候補を音声認識結果として採用することにより、上述の課題を解決する。
また、本発明にかかる音声認識方法は、音声認識工程における過去の発話についての音声認識候補のうち、訂正意図に応じて、システム応答とは異なる第1位以外の候補が採用された音声認識候補のパターンを、当該第1位以外の候補と関連付けて記憶手段に記憶し、今回の発話についての音声認識候補のパターンが、記憶手段に記憶されている過去の発話についての音声認識候補のパターンと同一である場合には、当該第1位以外の候補を音声認識結果として採用することにより、上述の課題を解決する。
本発明にかかる音声認識装置及び音声認識方法においては、今回の発話についての音声認識候補のパターンが、記憶手段に記憶されている過去の発話についての音声認識候補のパターンと同一である場合には、過去に採用されたシステム応答とは異なる第1位以外の候補を音声認識結果として採用することから、一度行った訂正要求を再度行わなければならなくなる頻度を低減することができる。
以下、本発明の実施の形態について図面を参照して説明する。
この実施の形態として示す音声認識装置は、車両や、携帯端末装置などに搭載されるナビゲーション装置に適用した場合の構成である。この音声認識装置をナビゲーション装置に適用すると、ナビゲーション装置で要求される各種機能を、ユーザとシステムとのインタラクティブな対話によって動作させることができる。
なお、本発明は、これに限定されるものではなく、各種情報処理装置に搭載されて、各種機能をインタラクティブに段階的に動作させることができる、どのようなアプリケーションにも適用することができる。
[第1の実施の形態]
[音声認識装置の構成]
まず、図1を用いて、本発明の第1の実施の形態として示す音声認識装置の構成について説明をする。
音声認識装置は、信号処理ユニット1と、マイク2と、スピーカ3と、入力装置4と、タッチパネルディスプレイ5とを備えている。なお、本発明にかかわる主要構成要素ではないことから、図示しないが、携帯端末装置のナビゲーション装置であれば、他に送受信手段を備えた構成であってもよく、また、車両に搭載されたナビゲーション装置であれば、送受信手段または通信接続手段などを備えた構成であってもよい。
信号処理ユニット1は、マイク2から入力されるユーザによって発話された音声をデジタル音声信号に変換して出力するA/Dコンバータ11と、システム応答として信号処理装置14から出力されるデジタル音声信号をアナログ音声信号に変換して出力するD/Aコンバータ12と、D/Aコンバータ12から出力されるアナログ音声信号を増幅する出力アンプ13と、信号処理装置14と、外部記憶装置15とを備えている。
信号処理装置14は、CPU(Central Processing Unit)21と、メモリ22とを備えており、マイク2から、A/Dコンバータ11を介して入力されるユーザによって発話された音声の音声認識処理を実行し、音声認識結果に応じたシステム応答を生成して出力する。また、信号処理装置14は、バージイン機能を備えており、当該信号処理装置14によるシステム応答に割り込むように入力されたユーザの発話音声に対しても音声認識処理を実行することができる。さらに、信号処理装置14は、タッチパネルディスプレイ5を用いて入力された情報を認識し、認識結果に応じたシステム応答を生成して出力する。
CPU21は、信号処理装置14を統括的に制御する制御手段である。CPU21は、メモリ22に記憶されている処理プログラムを読み出して実行し、音声認識処理を制御したり、バージイン機能の制御を行ったりする。
通常、バージイン機能は、有効となっておらず機能していない。バージイン機能は、システム応答に対して、ユーザによる割り込み発話がなされると予測された場合にのみ有効となり、割り込み発話に対する音声認識処理が実行される。
メモリ22は、CPU21で実行される処理プログラムや、使用頻度の高い各種データなどをあらかじめ記憶している。また、メモリ22は、CPU21によって音声認識処理が実行される場合には、外部記憶装置15から読み出された認識対象語及びその音響モデルが格納されることにより、認識対象語の辞書が構築される。
信号処理装置14のCPU21は、このメモリ22に構築された辞書を参照して、ユーザによって発話された発話音声の音声特徴パターンと、認識対象語の音響モデルの音声パターンとの一致度を演算することで音声認識処理を行う。
外部記憶装置15は、ナビゲーション装置で使用される各種データや、信号処理装置14で実行される音声認識処理で使用される認識対象データや、システム応答用の音声データなどを記憶している。外部記憶装置15は、認識対象データとして、音声認識処理で音声認識の対象となる認識対象語や、認識対象語の音響モデル、さらに、認識対象語とその接続関係を規定したネットワーク文法などの言語モデルを記憶している。認識対象語の音響モデルは、音響的に意味を持つ部分単語モデルを定義したものである。
認識対象語の音響モデルは、音響的に意味を持つ部分単語モデルを定義したものであり、一般的な発話速度で発話される際の通常発話と、通常発話を一旦行った際に誤認識されたと判断した後に、ユーザによって発話される訂正発話(言い直し発話)とのそれぞれ対応した音響モデルが用意されている。
また、ネットワーク文法とは、認識対象語の接続関係を規定するためのルールであり、例えば、図2に示すような階層構造で表すことができる。図2に示す例では、認識対象語である“駅名”を下位の階層Bとし、この下位の階層Bに接続される上位の階層Aとして“都道府県名”を規定している。
信号処理装置14は、図2に示すように認識対象語に対して規定された階層構造をなすネットワーク文法を用いることで、ユーザによって、例えば、「神奈川県の鶴見駅」といったような発話がなされた場合でも、音声認識をすることができる。
また、“都道府県名”と、“駅名”とを、それぞれ個別に有するネットワーク文法を切り替えて用いれば、「神奈川県」で発話が一旦完了され、その後「鶴見駅」と発話された場合でも音声認識をすることができる。
マイク2は、ユーザの発話音声を、当該音声認識装置に入力する。マイク2から入力されたユーザの発話音声は、電気信号である音声信号に変換され、A/Dコンバータ11でデジタル音声信号に変換されて信号処理装置14に供給される。
スピーカ3は、システムの発話として、信号処理装置14から出力され、D/Aコンバータ12でアナログ音声信号に変換され、出力アンプ13で信号増幅されたアナログ音声信号を音声として出力する。
入力装置4は、ユーザによって押下される発話スイッチ4a及び訂正スイッチ4bを備えている。発話スイッチ4aは、音声認識の開始指示を行うためのスイッチである。一方、訂正スイッチ4bは、ユーザによって発話された音声が、システムにおいて誤認識された場合に、訂正を行うためのスイッチである。なお、この訂正スイッチ4bを一定期間押し続けると、音声認識処理を途中で終了させることができる。
タッチパネルディスプレイ5は、例えばLCD(液晶表示装置)などで実現され、ナビゲーションの行き先や、探索条件設定時のガイダンス表示を行ったり、経路誘導などの画面を表示したり、信号処理装置14による音声認識処理結果である応答画像を表示させたりする。また、タッチパネルディスプレイ5は、ユーザが表示画面を接触操作することにより、表示された項目の選択操作や文字の手書き入力など、各種情報の入力を行うことが可能とされ、入力内容に応じた信号を信号処理装置14に供給する。
[音声認識装置の動作]
このような構成からなる音声認識装置は、図3に示す一連の手順にしたがった処理動作を行う。なお、同図においては、ナビゲーション装置の所定の機能を動作させる場合に、ユーザが、要求される設定事項を音声認識装置を介して入力し、ナビゲーション装置を動作させるまでの一連の処理工程を示している。
まず、音声認識装置における信号処理装置14は、ステップS1において、ユーザによる発話スイッチ4aの操作によって発話開始が指示されたことに応じて、発話された音声に対する音声認識処理を開始する。
続いて、信号処理装置14は、ステップS2において、認識対象語として待ち受ける文法(言語モデル)を読み出し、メモリ22に設定する。すなわち、信号処理装置14は、認識対象データとして外部記憶装置15に記憶されている音声認識処理で音声認識の対象となる認識対象語や、認識対象語の音響モデル、さらには、認識対象語とその接続関係を規定したネットワーク文法などの言語モデルを読み出し、メモリ22に設定する。ここで、認識対象語は、例えば図4に示すように、複数階層構造からなる。そして、信号処理装置14は、例えば図5に示すように、行き先設定を行うための「行き先」、経路の探索条件を設定するための「探索条件」、所望の施設の情報を表示するための「施設表示」、所望の電話番号を入力して発呼するための「電話番号」、操作マニュアルなどを表示するための「ヘルプ」といった、車両用のナビゲーション装置及び車両用の電子機器に対する指示からなる複数の認識対象語を音声によって択一的に入力させるための各種メニュー項目スイッチをタッチパネルディスプレイ5に表示させる。なお、タッチパネルディスプレイ5に表示されるメニュー項目スイッチに対応する認識対象語は、図4に示した複数階層構造のうち、最上位階層に規定されているものである。
ユーザは、このようなタッチパネルディスプレイ5に表示されたメニュー項目スイッチを視認することにより、どのような認識対象語を発話すればよいかを把握することができる。なお、図5においては、5つの認識対象語がメニュー項目スイッチとして表示されている様子を示しているが、これらは代表例であり、信号処理装置14は、これら以外のメニュー項目スイッチを選択肢としてタッチパネルディスプレイ5に表示させてもよい。また、同図中5aは、音声認識結果を表示する認識結果表示領域である。信号処理装置14は、どの語彙が認識されたかをユーザに報知するために、認識結果表示領域5aに音声認識候補の1位となった語彙を表示させる。これにより、ユーザは、表示されている語彙以外の語彙が音声認識結果となった場合などには、後述するように訂正を行うことが可能となる。
信号処理装置14は、このようにして認識対象語として待ち受ける文法をメモリ22に設定すると、図3中ステップS3において、外部記憶装置15に記憶された告知音声データを読み出して、D/Aコンバータ12、出力アンプ13、スピーカ3を介して出力させることで、プロンプト、すなわち、処理を開始した旨をユーザに告知し、発話要求を行う。
すなわち、ユーザは、スピーカ3を介して出力される、信号処理装置14による処理が開始された旨を知らせる告知音声を聞いたことに応じて、認識対象データに含まれる認識対象語の発話を開始する。ユーザによって発話され、マイク2を介して入力された音声は、A/Dコンバータ11でデジタル音声信号に変換されて、信号処理装置14に出力される。
そして、信号処理装置14は、ユーザによって発話された音声の取り込みを開始する。
通常、信号処理装置14は、発話スイッチ4aの操作がなされるまでは、D/Aコンバータ12の出力(デジタル音声信号)の平均パワーを演算している。信号処理装置14は、上述したステップS1において、発話スイッチ4aの操作がなされると、演算された平均パワーと、入力されたデジタル音声信号の瞬間パワーとを比較する。そして、信号処理装置14は、入力されたデジタル音声信号が、演算された平均パワーよりも所定値以上大きくなった場合に、ユーザが発話をした音声区間であると判断して、音声の取り込みを開始する。その後も、信号処理装置14は、平均パワーの演算を継続して実行し、平均パワーが所定値よりも小さくなった場合に、ユーザの発話が終了したと判断をする。
続いて、信号処理装置14は、ステップS4において、取り込まれた発話音声と、外部記憶装置15からメモリ22に読み込まれた認識対象語との一致度演算を開始する。一致度は、音声区間部分のデジタル音声信号と、個々の認識対象語がどの程度似ているのかをスコアとして示したものである。例えば、信号処理装置14は、スコアの値が大きい認識対象語ほど一致度が高いと評価する。なお、信号処理装置14は、この一致度演算を実行している間も、並列処理により音声取り込みを継続して実行する。
そして、信号処理装置14は、ステップS5において、デジタル音声信号の瞬間パワーが所定時間以上、所定値以下となったことに応じて、ユーザの発話が終了したと判断し、音声取り込みを終了する。
信号処理装置14は、音声取り込みを終了すると、ステップS6において、ステップS4における一致度演算が終了するまで待機し、一致度が大きい順序で複数の音声認識候補を求め、システム応答として出力する。ここで、最も一致度が大きい音声認識候補が「行き先」であったものとすると、信号処理装置14は、システム応答として「行き先」を出力する。具体的には、信号処理装置14は、図示しない音声合成処理機能を用いて音声認識結果である「行き先」を音声信号に変換する。この音声信号は、D/Aコンバータ12でアナログ音声信号に変換され、出力アンプ13で信号増幅された上で、スピーカ3を介して音声として出力される。
この後、信号処理装置14は、ステップS7乃至ステップS13において、過去の発話について誤認識が発生したときの音声認識候補のパターンである誤認識パターンに基づく処理を行う。なお、この処理については、後述するものとする。
そして、信号処理装置14は、ステップS14において、出力された認識対象語よりも下位階層の語彙があるか否かを判定する。ここで、信号処理装置14は、下位階層の語彙があった場合には、ステップS2へと処理を戻し、下位階層に応じた待ち受け処理、すなわち、メモリ22への代表語彙の提示と認識対象語の設定を行う。信号処理装置14は、このような発話をともなうステップS2乃至ステップS14の処理を繰り返し行い、図4に示した階層構造にしたがって、下位の階層まで処理を進める。そして、信号処理装置14は、下位階層の語彙がない場合には、ステップS15において、音声認識結果を決定し、その音声認識結果に応じた処理を行う。なお、信号処理装置14は、第1階層で「行き先」が選択されて開始された入力系列については、音声認識結果に応じた処理として、行き先設定処理を行う。
さて、信号処理装置14は、上述したように、ステップS7乃至ステップS13において、過去の誤認識パターンに基づく処理を行う。
まず、過去の誤認識パターンに対する正解候補の登録処理について説明する。
ここでは、ユーザは、行き先設定を行うことを目的として図4に示した階層を進み、行き先としての駅名の発話を完了しているものとする。具体的には、信号処理装置14は、図6中Aに示すように、ユーザが駅名として発話した「穴内」について、図3中ステップS2乃至ステップS6の処理を行い、図7に示す音声認識候補Aを得ているものとする。すなわち、信号処理装置14は、第1位の候補として、スコアが0.344となった「阿波海南」を求める一方で、正解の「穴内」についてはスコアを0.225として第3位の候補として求め、誤認識が発生している状態である。
この場合、信号処理装置14は、図3中ステップS7において、過去の誤認識パターンを参照し、今回の誤認識パターンが過去の誤認識パターンと同一であるか否かを判定する。ここでは、過去の誤認識パターンが存在しないことから、信号処理装置14は、ステップS8へと処理を移行する。
信号処理装置14は、ステップS8へと処理を移行すると、図示しない音声合成処理機能を用いて音声認識結果である「阿波海南」を音声信号に変換し、例えば図6中Bに示すように、「阿波海南を行き先にします」といった内容のメッセージからなる音声信号を生成する。この音声信号は、D/Aコンバータ12でアナログ音声信号に変換され、出力アンプ13で信号増幅された上で、スピーカ3を介して音声として出力される。
続いて、信号処理装置14は、図3中ステップS9において、ユーザによる訂正スイッチ4bの押下があるか否かを所定時間待ち受ける。すなわち、音声認識装置においては、ユーザによる発話音声「穴内」に対して誤認識が発生した場合には、音声認識結果に応じたシステム応答を訂正する意図を入力する訂正意図入力手段としての訂正スイッチ4bの押下に応じて、音声認識処理以前の状態に戻ることができる。ここで、信号処理装置14は、訂正スイッチ4bの押下がなかった場合には、音声認識結果をユーザが認容したと判断し、ステップS10へと処理を移行する一方で、訂正スイッチ4bの押下があった場合には、音声認識結果をユーザが否定したと判断し、ステップS12へと処理を移行する。なお、ここでは、ユーザによる発話音声「穴内」に対して、システム応答が「阿波海南」となったことを受けて、図6中Cに示すように、ユーザによって訂正スイッチ4bの押下がなされ、図3中ステップS12へと処理を移行したものとする。
そして、信号処理装置14は、ステップS12へと処理を移行すると、図6中Dに示すように、誤認識パターンとして、図7に示した音声認識候補Aをメモリ22に記憶させた上で、図3中ステップS3へと処理を移行し、図6中Eに示すように、外部記憶装置15に記憶された「もう一度発話してください」といった内容からなるシステムメッセージの音声データを読み出して、D/Aコンバータ12、出力アンプ13、スピーカ3を介して出力させることで、ユーザに駅名の再発話要求を行う。
ここで、ユーザは、訂正発話として、図6中Fに示すように、「穴内」という語彙を再度発話する。このとき、ユーザは、訂正発話である旨を意識し、「穴内」という語彙をはっきりと且つゆっくり発話したものとし、信号処理装置14は、かかる発話内容について、図3中ステップS3乃至ステップS6の処理を行い、図7に示す音声認識候補Bを得たものとする。すなわち、信号処理装置14は、正解の「穴内」について、スコアを0.281として第1位の候補として正しく認識したものとする。
この場合、信号処理装置14は、今回の発話が訂正発話であるため、通常のユーザの発話からの変形度合いが大きいことから、図3中ステップS7において、過去の誤認識パターンとの照合の結果、一致する誤認識パターンが存在しないと判定し、ステップS8へと処理を移行し、図示しない音声合成処理機能を用いて音声認識結果である「穴内」を音声信号に変換し、例えば図6中Gに示すように、「穴内を行き先にします」といった内容のメッセージからなる音声信号を生成する。この音声信号は、D/Aコンバータ12でアナログ音声信号に変換され、出力アンプ13で信号増幅された上で、スピーカ3を介して音声として出力される。
そして、信号処理装置14は、図3中ステップS9において、ユーザによる訂正スイッチ4bの押下があるか否かを所定時間待ち受けるが、ここでは、「穴内」という正しい音声認識結果が得られたことから、ユーザが音声認識結果を認容して訂正スイッチ4bの押下を行わず、ステップS10へと処理を移行する。
続いて、信号処理装置14は、ステップS10において、今回の発話が前回の発話に対する訂正発話であるか否かを判定する。ここで、信号処理装置14は、訂正発話でない場合には、ステップS3からの処理を繰り返す一方で、訂正発話である場合には、ステップS13へと処理を移行する。なお、ここでは、前回の発話に対して訂正スイッチ4bの押下がなされた後の訂正発話であることから、信号処理装置14は、ステップS13へと処理を移行することになる。
そして、信号処理装置14は、ステップS13において、図6中Hに示すように、今回の音声認識結果「穴内」を訂正結果としてメモリ22に記憶させ、図3中ステップS3からの処理を繰り返す。このとき、信号処理装置14は、訂正結果を、図7に示した音声認識候補Aと関連付けてメモリ22に記憶させ、以降の発話時に参照する誤認識パターンとして用いる。
信号処理装置14は、このような一連の処理を行うことにより、過去の誤認識パターンに対する正解候補を登録することができる。
つぎに、過去の誤認識パターン、及びこの誤認識パターンに対する正解候補が存在する場合における処理について説明する。
ここでも、ユーザは、行き先設定を行うことを目的として図4に示した階層を進み、行き先としての駅名の発話を完了しているものとする。具体的には、信号処理装置14は、図8中Aに示すように、ユーザが駅名として発話した「穴内」について、図3中ステップS2乃至ステップS6の処理を行い、図9に示す音声認識候補Cを得ているものとする。すなわち、信号処理装置14は、第1位の候補として、スコアが0.310となった「阿波海南」を求める一方で、正解の「穴内」についてはスコアを0.245として第3位の候補として求め、誤認識が発生している状態である。
この場合、信号処理装置14は、図3中ステップS7において、過去の誤認識パターンを参照し、今回の誤認識パターンが過去の誤認識パターンと同一であるか否かを判定する。具体的には、信号処理装置14は、図7に示した音声認識候補Aが誤認識パターンとして存在していることから、図8中Bに示すように、その音声認識候補Aと図9に示す音声認識候補Cとの比較を行い、共通する音声認識候補の個数、その音声認識候補の出現順位、その音声認識候補のスコア(尤度値)の差などに基づいて、今回の誤認識パターンが過去の誤認識パターンと同一であるか否かを判定する。
ここで、音声認識候補A,Cは、それぞれの音声認識候補のうち、「阿波海南」、「穴内」、「吾野」、「阿南」、「穴太」、「浜」という6つの候補が共通であり、所定個数以上の候補が共通であるという条件を満たす。また、音声認識候補A,Cは、これら共通する候補の出現順位も略同一であり、これら共通する候補のスコア差も所定値以内である。そのため、信号処理装置14は、これら音声認識候補A,Cを同一パターンであると判定し、図3中ステップS11へと処理を移行する。
信号処理装置14は、ステップS11へと処理を移行すると、図8中Cに示すように、音声認識候補Aと関連付けてメモリ22に記憶されている訂正結果(正解候補)である「穴内」を読み出し、図3中ステップS8へと処理を移行する。
そして、信号処理装置14は、ステップS8において、図示しない音声合成処理機能を用いて音声認識結果である「穴内」を音声信号に変換し、例えば図8中Dに示すように、「穴内を行き先にします」といった内容のメッセージからなる音声信号を生成する。この音声信号は、D/Aコンバータ12でアナログ音声信号に変換され、出力アンプ13で信号増幅された上で、スピーカ3を介して音声として出力される。
信号処理装置14は、過去の誤認識パターン、及びこの誤認識パターンに対する正解候補が存在する場合には、このような一連の処理を行うことにより、一度行った訂正要求を再度行わなければならなくなる頻度を低減した上で、ナビゲーション装置の所定の機能を動作させることができる。
[第1の実施の形態の効果]
以上詳細に説明したように、第1の実施の形態として示した音声認識装置においては、信号処理装置14により、過去の発話についての音声認識候補のうち、訂正意図に応じて、システム応答とは異なる第1位以外の候補が採用された音声認識候補のパターンを、当該第1位以外の候補と関連付けてメモリ22に記憶させておき、今回の発話についての音声認識候補のパターンが、メモリ22に記憶されている過去の発話についての音声認識候補のパターンと同一である場合には、当該第1位以外の候補を音声認識結果として採用する。
このように、この音声認識装置においては、今回の発話についての音声認識候補のパターンが、メモリ22に記憶されている過去の発話についての音声認識候補のパターンと同一である場合には、過去に採用されたシステム応答とは異なる第1位以外の候補を音声認識結果として採用することから、一度行った訂正要求を再度行わなければならなくなる頻度を低減することができる。
また、この音声認識装置においては、信号処理装置14により、メモリ22に記憶されている過去の発話についての音声認識候補のパターンと、今回の発話についての音声認識候補のパターンとの比較を行い、共通する音声認識候補の個数が所定個数以上である場合には、当該過去の発話についての音声認識候補のパターンと、当該今回の発話についての音声認識候補のパターンとが同一であると判定することにより、誤判定を確実に回避することができる。
さらに、この音声認識装置においては、信号処理装置14により、共通する音声認識候補の個数とともに、その出現順位に基づいて、当該過去の発話についての音声認識候補のパターンと、当該今回の発話についての音声認識候補のパターンとが同一であると判定することにより、かかる判定を適切且つ高精度に行うことができる。
さらに、この音声認識装置においては、信号処理装置14により、共通する音声認識候補の個数とともに、その尤度値差に基づいて、当該過去の発話についての音声認識候補のパターンと、当該今回の発話についての音声認識候補のパターンとが同一であると判定することにより、かかる判定を適切且つ高精度に行うことができる。
[第2の実施の形態]
つぎに、本発明の第2の実施の形態として示す音声認識装置について説明をする。
この第2の実施の形態として示す音声認識装置は、図1を用いて説明した第1の実施の形態として示す音声認識装置と同一の構成である。したがって、第2の実施の形態として示す音声認識装置の構成については、同一符号を付すことによってその説明を省略する。
また、この第2の実施の形態として示す音声認識装置は、上述した第1の実施の形態として示した音声認識装置と同様に、一度行った訂正要求を再度行わなければならなくなる頻度を低減することができるものであり、その処理動作は、第1の実施の形態として示した音声認識装置の処理動作として図3に示したフローチャートのうち、過去の誤認識パターンに対する正解候補の登録処理の内容が異なるだけである。したがって、以下では、第2の実施の形態として示す音声認識装置の処理動作のうち、同一の処理内容については、同一ステップ番号を付すことによってその説明を省略し、変更があったステップ番号の処理内容についてのみ説明するものとする。
[音声認識装置の動作]
音声認識装置における信号処理装置14は、図10に示す一連の手順にしたがった処理動作を行う。このとき、信号処理装置14は、以下のようにして、過去の誤認識パターンに対する正解候補を登録する。
なお、ここでは、ユーザは、行き先設定を行うことを目的として図4に示した階層を進み、行き先としての駅名の発話を完了しているものとする。具体的には、信号処理装置14は、図11中Aに示すように、ユーザが駅名として発話した「穴内(あなない)」について、図10中ステップS2乃至ステップS6の処理を行い、図7に示した音声認識候補Aを得ているものとする。すなわち、信号処理装置14は、第1位の候補として、スコアが0.344となった「阿波海南(あわかいなん)」を求める一方で、正解の「穴内」についてはスコアを0.225として第3位の候補として求め、誤認識が発生している状態である。
この場合、信号処理装置14は、図10中ステップS8において、図示しない音声合成処理機能を用いて音声認識結果である「あわかいなん」を音声信号に変換し、例えば図11中Bに示すように、「阿波海南を行き先にします」といった内容のメッセージからなる音声信号を生成する。この音声信号は、D/Aコンバータ12でアナログ音声信号に変換され、出力アンプ13で信号増幅された上で、スピーカ3を介して音声として出力される。
そして、信号処理装置14は、図10中ステップS9において、ユーザによる訂正スイッチ4bの押下があるか否かを所定時間待ち受ける。ここで、信号処理装置14は、ユーザによる発話音声「あなない」に対して、システム応答が「あわかいなん」となったことを受けて、ユーザによって訂正スイッチ4bの押下がなされた場合には、図10中ステップS21へと処理を移行する。
続いて、信号処理装置14は、ステップS21において、ユーザによるタッチパネルディスプレイ5の操作があるか否かを所定時間待ち受ける。すなわち、音声認識装置においては、ユーザによる発話音声「あなない」に対して誤認識が発生した場合には、音声認識結果に応じたシステム応答を訂正する意図を入力する訂正意図入力手段としてのタッチパネルディスプレイ5による手操作入力を行うことによって誤認識を訂正することができる。ここで、信号処理装置14は、タッチパネルディスプレイ5の操作がなかった場合には、音声認識結果をユーザが認容したと判断し、ステップS14へと処理を移行する一方で、タッチパネルディスプレイ5の操作があった場合には、音声認識結果をユーザが否定したと判断し、ステップS22へと処理を移行する。
なお、ここでは、図11中Cに示すように、ユーザがタッチパネルディスプレイ5を用いて正しい駅名である「あなない」を入力することによって訂正を試みるものとする。具体的には、信号処理装置14は、例えば図12に示すように、認識結果表示領域5aに音声認識候補の1位となった「あわかいなん」という語彙を誤表示した状態で、全ての平仮名文字に対応した文字スイッチを50音順に配列してタッチパネルディスプレイ5に表示させ、ユーザに他の語彙を入力させる。これに応じて、ユーザは、「あなない」に訂正するために、図13に示すように、「あ」、「な」、「な」、「い」という4つの文字スイッチを順次選択操作(図13中点線枠で図示)することにより、訂正を試みる。信号処理装置14は、ユーザによって文字スイッチが選択操作されると、図示しない音声合成処理機能を用いて音声認識結果である「穴内」を音声信号に変換し、例えば図11中Dに示すように、「穴内を行き先にします」といった内容のメッセージからなる音声信号を生成し、D/Aコンバータ12、出力アンプ13、スピーカ3を介して音声として出力させる。
そして、信号処理装置14は、図10中ステップS22へと処理を移行すると、図11中Eに示すように、誤認識パターンとして、図7に示した音声認識候補Aをメモリ22に記憶させた上で、図10中ステップS23へと処理を移行し、図11中Fに示すように、タッチパネルディスプレイ5を用いた入力結果「あなない」を訂正結果としてメモリ22に記憶させ、ステップS14へと処理を移行する。このとき、信号処理装置14は、訂正結果を、図7に示した音声認識候補Aと関連付けてメモリ22に記憶させ、以降の発話時に参照する誤認識パターンとして用いる。
信号処理装置14は、このような一連の処理を行うことにより、過去の誤認識パターンに対する正解候補を登録することができる。そして、信号処理装置14は、このようにして登録した過去の誤認識パターン、及びこの誤認識パターンに対する正解候補が存在する場合には、第1の実施の形態として示した音声認識装置と同様の処理を行うことにより、一度行った訂正要求を再度行わなければならなくなる頻度を低減するとともに、手操作による訂正を再度行わなければならなくなる頻度も低減し、ナビゲーション装置の所定の機能を動作させることができる。
[第2の実施の形態の効果]
以上詳細に説明したように、第2の実施の形態として示した音声認識装置においては、システム応答を訂正する意図を入力する手段として、手操作によって情報の入力を行うことが可能とされるタッチパネルディスプレイ5を用い、過去の発話についての音声認識結果に応じたシステム応答を採用せずに、タッチパネルディスプレイ5を介して入力された情報を第1位以外の候補として採用したときの音声認識候補のパターンを、当該第1位以外の候補と関連付けてメモリ22に記憶することにより、過去の誤認識パターンに対する正解候補の登録を行う。
これにより、この音声認識装置においては、一度行った訂正要求を再度行わなければならなくなる頻度を低減するとともに、手操作による訂正を再度行わなければならなくなる頻度も低減することができる。
[第3の実施の形態]
つぎに、本発明の第3の実施の形態として示す音声認識装置について説明をする。
この第3の実施の形態として示す音声認識装置は、図1を用いて説明した第1の実施の形態として示す音声認識装置と同一の構成である。したがって、第3の実施の形態として示す音声認識装置の構成については、同一符号を付すことによってその説明を省略する。
また、この第3の実施の形態として示す音声認識装置は、上述した第1の実施の形態及び第2の実施の形態として示した音声認識装置と同様に、一度行った訂正要求を再度行わなければならなくなる頻度を低減することができるものであり、その処理動作は、第1の実施の形態及び第2の実施の形態として示した音声認識装置の処理動作として図3及び図10に示したフローチャートのうち、過去の誤認識パターンに対する正解候補の登録処理の内容が異なるだけである。したがって、以下では、第3の実施の形態として示す音声認識装置の処理動作のうち、同一の処理内容については、同一ステップ番号を付すことによってその説明を省略し、変更があったステップ番号の処理内容についてのみ説明するものとする。
[音声認識装置の動作]
音声認識装置における信号処理装置14は、図14に示す一連の手順にしたがった処理動作を行う。このとき、信号処理装置14は、以下のようにして、過去の誤認識パターンに対する正解候補を登録する。
なお、ここでは、ユーザは、行き先設定を行うことを目的として図4に示した階層を進み、行き先としての駅名の発話を完了しているものとする。具体的には、信号処理装置14は、図15中Aに示すように、ユーザが駅名として発話した「穴内」について、図14中ステップS2乃至ステップS6の処理を行い、図7に示した音声認識候補Aを得ているものとする。すなわち、信号処理装置14は、第1位の候補として、スコアが0.344となった「阿波海南」を求める一方で、正解の「穴内」についてはスコアを0.225として第3位の候補として求め、誤認識が発生している状態である。
この場合、信号処理装置14は、図14中ステップS8において、図示しない音声合成処理機能を用いて音声認識結果である「阿波海南」を音声信号に変換し、例えば図15中Bに示すように、「阿波海南を行き先にします」といった内容のメッセージからなる音声信号を生成する。この音声信号は、D/Aコンバータ12でアナログ音声信号に変換され、出力アンプ13で信号増幅された上で、スピーカ3を介して音声として出力される。
そして、信号処理装置14は、図14中ステップS31において、ユーザによる訂正対話があるか否かを所定時間待ち受ける。すなわち、音声認識装置においては、ユーザによる発話音声「穴内」に対して誤認識が発生した場合には、音声認識結果に応じたシステム応答を訂正する意図を入力する訂正意図入力手段としての訂正対話を行うことにより、誤認識を訂正することができる。ここで、信号処理装置14は、訂正対話がなかった場合には、音声認識結果をユーザが認容したと判断し、ステップS14へと処理を移行する一方で、訂正対話があった場合には、音声認識結果をユーザが否定したと判断し、ステップS32へと処理を移行する。なお、ここでは、図15中Cに示すように、ユーザが「ちがう穴内」と訂正対話することによって訂正を試みるものとする。
これに応じて、信号処理装置14は、図14中ステップS32において、図示しない音声合成処理機能を用いて音声認識結果であり且つ訂正結果である「穴内」を音声信号に変換し、例えば図15中Dに示すように、「穴内を行き先にします」といった内容のメッセージからなる音声信号を生成し、D/Aコンバータ12、出力アンプ13、スピーカ3を介して音声として出力させる。
続いて、信号処理装置14は、訂正発話を行ったユーザ自身の誤認識の可能性を排除するために、図14中ステップS33において、訂正対話があるか否かを再度所定時間待ち受ける。ここで、信号処理装置14は、訂正対話がなかった場合には、音声認識結果をユーザが認容したと判断し、ステップS34へと処理を移行する一方で、訂正対話があった場合には、音声認識結果をユーザが否定したと判断し、ステップS32へと処理を移行する。
そして、信号処理装置14は、訂正対話がなかった場合には、ステップS34へと処理を移行すると、図15中Eに示すように、誤認識パターンとして、図7に示した音声認識候補Aをメモリ22に記憶させた上で、図14中ステップS35へと処理を移行し、図15中Fに示すように、今回の音声認識結果「穴内」を訂正結果としてメモリ22に記憶させ、ステップS14へと処理を移行する。このとき、信号処理装置14は、訂正結果を、図7に示した音声認識候補Aと関連付けてメモリ22に記憶させ、以降の発話時に参照する誤認識パターンとして用いる。
信号処理装置14は、このような一連の処理を行うことにより、過去の誤認識パターンに対する正解候補を登録することができる。そして、信号処理装置14は、このようにして登録した過去の誤認識パターン、及びこの誤認識パターンに対する正解候補が存在する場合には、第1の実施の形態および第2の実施の形態として示した音声認識装置と同様の処理を行うことにより、一度行った訂正要求を再度行わなければならなくなる頻度を低減するとともに、手操作による訂正を再度行わなければならなくなる頻度も低減し、ナビゲーション装置の所定の機能を動作させることができる。
[第3の実施の形態の効果]
以上詳細に説明したように、第3の実施の形態として示した音声認識装置においては、システム応答を訂正する意図を入力する手段として訂正対話を用い、過去の発話についての音声認識結果に応じたシステム応答を採用せずに、訂正対話を介して入力された情報に基づいて、第1位以外の候補を採用したときの音声認識候補のパターンを、当該第1位以外の候補と関連付けてメモリ22に記憶することにより、過去の誤認識パターンに対する正解候補の登録を行う。
これにより、この音声認識装置においては、一度行った訂正要求を再度行わなければならなくなる頻度を低減するとともに、手操作による訂正を再度行わなければならなくなる頻度も低減することができる。
なお、上述の実施の形態は本発明の一例である。このため、本発明は、上述の実施の形態に限定されることはなく、この実施の形態以外の形態であっても、本発明に係る技術的思想を逸脱しない範囲であれば、設計などに応じて種々の変更が可能であることは勿論である。
本発明の実施の形態として示す音声認識装置の構成について説明するブロック図である。 ネットワーク文法について説明するための図である。 本発明の第1の実施の形態として示す音声認識装置の処理動作について説明するフローチャートである。 本発明の第1の実施の形態として示す音声認識装置の処理動作について説明するための図であり、複数階層構造からなる認識対象語について説明するための図である。 本発明の第1の実施の形態として示す音声認識装置の処理動作について説明するための図であり、メニュー項目スイッチが表示されたタッチパネルディスプレイの表示内容の具体例について説明するための図である。 本発明の第1の実施の形態として示す音声認識装置の処理動作について説明するための図であり、当該音声認識装置における過去の誤認識パターンに対する正解候補の登録処理動作と、ユーザの動作との対応について説明するための図である。 本発明の第1の実施の形態として示す音声認識装置の処理動作について説明するための図であり、過去の誤認識パターンに対する正解候補の登録処理動作にて求められる音声認識候補の具体例について説明するための図である。 本発明の第1の実施の形態として示す音声認識装置の処理動作について説明するための図であり、当該音声認識装置における過去の誤認識パターン、及びこの誤認識パターンに対する正解候補が存在する場合における処理動作と、ユーザの動作との対応について説明するための図である。 本発明の第1の実施の形態として示す音声認識装置の処理動作について説明するための図であり、過去の誤認識パターン、及びこの誤認識パターンに対する正解候補が存在する場合における処理動作にて求められる音声認識候補の具体例について説明するための図である。 本発明の第2の実施の形態として示す音声認識装置の処理動作について説明するフローチャートである。 本発明の第2の実施の形態として示す音声認識装置の処理動作について説明するための図であり、当該音声認識装置における過去の誤認識パターンに対する正解候補の登録処理動作と、ユーザの動作との対応について説明するための図である。 本発明の第2の実施の形態として示す音声認識装置の処理動作について説明するための図であり、文字スイッチが表示されたタッチパネルディスプレイの表示内容の具体例について説明するための図である。 本発明の第2の実施の形態として示す音声認識装置の処理動作について説明するための図であり、文字スイッチを選択した様子を説明するための図である。 本発明の第3の実施の形態として示す音声認識装置の処理動作について説明するフローチャートである。 本発明の第3の実施の形態として示す音声認識装置の処理動作について説明するための図であり、当該音声認識装置における過去の誤認識パターンに対する正解候補の登録処理動作と、ユーザの動作との対応について説明するための図である。
符号の説明
1 信号処理ユニット
2 マイク
3 スピーカ
4 入力装置
4a 発話スイッチ
4b 訂正スイッチ
5 タッチパネルディスプレイ
5a 認識結果表示領域
11 A/Dコンバータ
12 D/Aコンバータ
13 出力アンプ
14 信号処理装置
15 外部記憶装置
21 CPU
22 メモリ

Claims (7)

  1. 発話音声を入力する音声入力手段と、
    前記音声入力手段によって入力された発話音声を音声認識し、音声認識結果に応じたシステム応答を生成する音声認識手段と、
    前記音声認識手段によって生成された前記システム応答を出力する出力手段と、
    前記音声認識手段によって生成された前記システム応答を訂正する意図を入力する訂正意図入力手段と、
    前記音声認識手段による過去の発話についての音声認識候補のうち、前記訂正意図入力手段を介した訂正意図に応じて、前記システム応答とは異なる第1位以外の候補が採用された音声認識候補のパターンを、当該第1位以外の候補と関連付けて記憶する記憶手段とを備え、
    前記音声認識手段は、今回の発話についての音声認識候補のパターンが、前記記憶手段に記憶されている過去の発話についての音声認識候補のパターンと同一である場合には、前記第1位以外の候補を音声認識結果として採用すること
    を特徴とする音声認識装置。
  2. 前記訂正意図入力手段は、手操作によって情報の入力を行うことが可能とされる手操作入力手段であり、
    前記記憶手段は、前記音声認識手段による過去の発話についての音声認識結果に応じたシステム応答を採用せずに、前記手操作入力手段を介して入力された情報を前記第1位以外の候補として採用したときの音声認識候補のパターンを、当該第1位以外の候補と関連付けて記憶すること
    を特徴とする請求項1記載の音声認識装置。
  3. 前記訂正意図入力手段は、訂正対話を行うための訂正対話手段であり、
    前記記憶手段は、前記音声認識手段による過去の発話についての音声認識結果に応じたシステム応答を採用せずに、前記訂正対話手段を介して入力された情報に基づいて、前記第1位以外の候補を採用したときの音声認識候補のパターンを、当該第1位以外の候補と関連付けて記憶すること
    を特徴とする請求項1記載の音声認識装置。
  4. 前記音声認識手段は、前記記憶手段に記憶されている過去の発話についての音声認識候補のパターンと、今回の発話についての音声認識候補のパターンとの比較を行い、共通する音声認識候補の個数が所定個数以上である場合には、当該過去の発話についての音声認識候補のパターンと、当該今回の発話についての音声認識候補のパターンとが同一であると判定すること
    を特徴とする請求項1記載の音声認識装置。
  5. 前記音声認識手段は、前記記憶手段に記憶されている過去の発話についての音声認識候補のパターンと、今回の発話についての音声認識候補のパターンとの比較を行い、共通する音声認識候補の出現順位が略同一である場合には、当該過去の発話についての音声認識候補のパターンと、当該今回の発話についての音声認識候補のパターンとが同一であると判定すること
    を特徴とする請求項4記載の音声認識装置。
  6. 前記音声認識手段は、前記記憶手段に記憶されている過去の発話についての音声認識候補のパターンと、今回の発話についての音声認識候補のパターンとの比較を行い、共通する音声認識候補の尤度値差が所定値以内である場合には、当該過去の発話についての音声認識候補のパターンと、当該今回の発話についての音声認識候補のパターンとが同一であると判定すること
    を特徴とする請求項4又は請求項5記載の音声認識装置。
  7. 入力された発話音声を音声認識し、音声認識結果に応じたシステム応答を生成する音声認識工程と、
    前記音声認識工程にて生成された前記システム応答を出力する出力工程と、
    前記音声認識工程にて生成された前記システム応答を訂正する意図を入力する訂正意図入力工程と、
    前記音声認識工程における過去の発話についての音声認識候補のうち、前記訂正意図入力工程にてなされた訂正意図に応じて、前記システム応答とは異なる第1位以外の候補が採用された音声認識候補のパターンを、当該第1位以外の候補と関連付けて記憶手段に記憶する記憶工程と、
    前記音声認識工程における今回の発話についての音声認識候補のパターンが、前記記憶手段に記憶されている過去の発話についての音声認識候補のパターンと同一である場合には、前記第1位以外の候補を音声認識結果として採用する処理工程とを備えること
    を特徴とする音声認識方法。
JP2005321428A 2005-11-04 2005-11-04 音声認識装置及び音声認識方法 Pending JP2007127896A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005321428A JP2007127896A (ja) 2005-11-04 2005-11-04 音声認識装置及び音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005321428A JP2007127896A (ja) 2005-11-04 2005-11-04 音声認識装置及び音声認識方法

Publications (1)

Publication Number Publication Date
JP2007127896A true JP2007127896A (ja) 2007-05-24

Family

ID=38150594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005321428A Pending JP2007127896A (ja) 2005-11-04 2005-11-04 音声認識装置及び音声認識方法

Country Status (1)

Country Link
JP (1) JP2007127896A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016002251A1 (ja) * 2014-06-30 2016-01-07 クラリオン株式会社 情報処理システム、及び、車載装置
US10366163B2 (en) 2016-09-07 2019-07-30 Microsoft Technology Licensing, Llc Knowledge-guided structural attention processing
JP2020187163A (ja) * 2019-05-10 2020-11-19 本田技研工業株式会社 音声操作システム、音声操作制御方法、及び音声操作制御プログラム
US11449744B2 (en) 2016-06-23 2022-09-20 Microsoft Technology Licensing, Llc End-to-end memory networks for contextual language understanding
WO2023073945A1 (ja) * 2021-10-29 2023-05-04 パイオニア株式会社 情報処理装置、情報処理方法および情報処理プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016002251A1 (ja) * 2014-06-30 2016-01-07 クラリオン株式会社 情報処理システム、及び、車載装置
CN106462513A (zh) * 2014-06-30 2017-02-22 歌乐株式会社 信息处理系统及车载装置
JPWO2016002251A1 (ja) * 2014-06-30 2017-05-25 クラリオン株式会社 情報処理システム、及び、車載装置
US10008204B2 (en) 2014-06-30 2018-06-26 Clarion Co., Ltd. Information processing system, and vehicle-mounted device
US11449744B2 (en) 2016-06-23 2022-09-20 Microsoft Technology Licensing, Llc End-to-end memory networks for contextual language understanding
US10366163B2 (en) 2016-09-07 2019-07-30 Microsoft Technology Licensing, Llc Knowledge-guided structural attention processing
JP2020187163A (ja) * 2019-05-10 2020-11-19 本田技研工業株式会社 音声操作システム、音声操作制御方法、及び音声操作制御プログラム
WO2023073945A1 (ja) * 2021-10-29 2023-05-04 パイオニア株式会社 情報処理装置、情報処理方法および情報処理プログラム

Similar Documents

Publication Publication Date Title
JP6570651B2 (ja) 音声対話装置および音声対話方法
JP3662780B2 (ja) 自然言語を用いた対話システム
US8818816B2 (en) Voice recognition device
US20020123894A1 (en) Processing speech recognition errors in an embedded speech recognition system
JP2005331882A (ja) 音声認識装置、音声認識方法、および音声認識プログラム
JP5189858B2 (ja) 音声認識装置
JP2011059676A (ja) 発話入力に基づいて複数の機能を有効にするためのシステム及び方法
JP2007127896A (ja) 音声認識装置及び音声認識方法
JP5277704B2 (ja) 音声認識装置及びこれを用いる車両システム
JP2009104047A (ja) 情報処理方法及び情報処理装置
JP4498906B2 (ja) 音声認識装置
JP4212947B2 (ja) 音声認識システムおよび音声認識の訂正・学習方法
JP3718088B2 (ja) 音声認識修正方式
JP2006337942A (ja) 音声対話装置及び割り込み発話制御方法
JP2007127895A (ja) 音声入力装置及び音声入力方法
JP2007183516A (ja) 音声対話装置及び音声認識方法
JP4951422B2 (ja) 音声認識装置、および音声認識方法
JP2007212658A (ja) 文字入力装置
JP4635743B2 (ja) 音声対話装置及び音声理解結果生成方法
JP2006251059A (ja) 音声対話装置および音声対話方法
JP2017102320A (ja) 音声認識装置
JP2008233009A (ja) カーナビゲーション装置及びカーナビゲーション装置用プログラム
JP2005283797A (ja) 音声認識装置および音声認識方法
JP2007272123A (ja) 音声操作システム
US20080256071A1 (en) Method And System For Selection Of Text For Editing