JP3880383B2 - 音声認識装置及びその方法、プログラム - Google Patents

音声認識装置及びその方法、プログラム Download PDF

Info

Publication number
JP3880383B2
JP3880383B2 JP2001370353A JP2001370353A JP3880383B2 JP 3880383 B2 JP3880383 B2 JP 3880383B2 JP 2001370353 A JP2001370353 A JP 2001370353A JP 2001370353 A JP2001370353 A JP 2001370353A JP 3880383 B2 JP3880383 B2 JP 3880383B2
Authority
JP
Japan
Prior art keywords
speech recognition
selection
selection field
description
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001370353A
Other languages
English (en)
Other versions
JP2003167598A (ja
Inventor
哲夫 小坂
隆也 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001370353A priority Critical patent/JP3880383B2/ja
Publication of JP2003167598A publication Critical patent/JP2003167598A/ja
Application granted granted Critical
Publication of JP3880383B2 publication Critical patent/JP3880383B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、入力された音声を認識し、その音声認識結果に基づいて処理を実行する音声認識装置及びその方法、プログラムに関するものである。
【0002】
【従来の技術】
従来の音声認識技術のインプリメントは、プログラムを作成することにより行うことが一般的であった。しかし、近年では、VoiceXMLなどハイパーテキスト文書の利用により音声認識技術のインプリメントをすることが行われるようになってきている。VoiceXMLでは、入出力の手段として基本的には音声のみが使用されているが(厳密にはDTMFなども使用)、特開2001−166915、特開平10−154063などのように音声入出力のみならずGUIも併用したUIの記述にハイパーテキスト文書を用いることも考案されている。
【0003】
このような方式では、GUIの記述にはHTMLのようなマークアップ言語を用い、さらに音声入出力を可能にするために、音声入力や音声出力に対応するいくつかのタグを追加して実施している。
【0004】
【発明が解決しようとする課題】
しかしながら、上記特開2001−166915における装置では、文字入力欄や選択欄中の選択肢の選択に音声認識が使用される。この場合、選択肢の選択では選択肢の数を数え、各選択肢に対応する番号を装置が自動的に割り振り、番号を発声することにより、どの選択肢を選択するかの動作を行う。この場合、その選択肢に対する音声入力を音声認識を認識するための音声認識文法としては、番号を受け付けるものであればよい。あるいは、各選択肢に対応する語彙を音声認識文法に登録しておけば、直接語彙を発声することにより選択欄から所望の選択肢を選択することが可能である。
【0005】
しかしながら、この装置においては、あらかじめ音声認識文法に登録された語彙に対する音声入力しか受けつけることができず、新たな選択肢を音声認識で選択することができず、利便性が欠けている。
【0006】
本発明は上記課題を解決するためになされたものであり、画面上に表示される任意の選択肢の選択を容易にかつ柔軟に音声入力で実現することができる音声認識装置及びその方法、プログラムを提供することを目的とする。
【0007】
【課題を解決するための手段】
上記の目的を達成するための本発明による音声認識装置は以下の構成を備える。即ち、
入力された音声を認識し、その音声認識結果に基づいて処理を実行する音声認識装置であって、
複数の選択肢からなる選択欄を表示するための記述と、該選択欄中の選択肢の音声入力による選択を受け付けるための記述を含むハイパーテキスト文書を読み込む読込手段と、
前記読込手段で読み込んだハイパーテキスト文書中の前記選択欄を表示するための記述に基づいて選択欄を表示する表示手段と、
前記表示手段で表示された複数の前記選択欄へのいずれかの選択欄への指示がなされた場合に、該指示がなされた前記ハイパーテキスト文書中の前記選択欄中の選択肢に関する記述に基づいて音声認識文法を生成する生成手段と、
前記生成手段で生成された音声認識文法に基づいて、前記入力された音声の音声認識を実行する音声認識手段と、
前記音声認識手段の音声認識結果に基づいて、前記選択欄中の選択肢の選択を確定する確定手段と
を備える。
【0008】
また、好ましくは、前記確定手段は、前記音声認識手段の音声認識結果に基づいて、前記選択欄中の1つの選択肢の選択を確定する。
【0009】
また、好ましくは、前記確定手段は、前記音声認識手段の音声認識結果に基づいて、前記選択欄中の複数の選択肢の選択を確定する。
【0010】
また、好ましくは、前記ハイパーテキスト文書を解析する解析手段と、
前記解析手段の解析が完了した後、前記音声認識手段は、前記音声認識を開始する。
【0011】
また、好ましくは、前記音声認識手段は、前記選択欄への指示がなされた場合に前記音声認識を開始し、該選択欄への指示が取り消された場合に該音声認識を終了する。
【0012】
また、好ましくは、前記解析手段の解析が完了した後、前記生成手段は、前記音声認識文法の生成を開始する。
【0013】
また、好ましくは、前記選択欄への指示がなされた場合に、前記生成手段は、前記音声認識文法の生成を開始する。
【0014】
上記の目的を達成するための本発明による音声認識方法は以下の構成を備える。即ち、
入力された音声を認識し、その音声認識結果に基づいて処理を実行する音声認識方法であって、
複数の選択肢からなる選択欄を表示するための記述と、該選択欄中の選択肢の音声入力による選択を受け付けるための記述を含むハイパーテキスト文書を読み込む読込工程と、
前記読込工程で読み込んだハイパーテキスト文書中の前記選択欄を表示するための記述に基づいて選択欄を表示する表示工程と、
前記表示工程で表示された複数の前記選択欄のいずれかの選択欄への指示がなされた場合に、該指示がなされた前記ハイパーテキスト文書中の前記選択欄中の選択肢に関する記述に基づいて、音声認識文法を生成する生成工程と、
前記生成工程で生成された音声認識文法に基づいて、前記入力された音声の音声認識を実行する音声認識工程と、
前記音声認識工程の音声認識結果に基づいて、前記選択欄中の選択肢の選択を確定する確定工程と
を備える。
【0015】
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
入力された音声を認識し、その音声認識結果に基づいて処理を実行する音声認識をコンピュータに機能させるためのプログラムであって、
複数の選択肢からなる選択欄を表示するための記述と、該選択欄中の選択肢の音声入力による選択を受け付けるための記述を含むハイパーテキスト文書を読み込む読込工程のプログラムコードと、
前記読込工程で読み込んだハイパーテキスト文書中の前記選択欄を表示するための記述に基づいて選択欄を表示する表示工程のプログラムコードと、
前記表示工程で表示された複数の前記選択欄のいずれかの選択欄への指示がなされた場合に、該指示がなされた前記ハイパーテキスト文書中の前記選択欄中の選択肢に関する記述に基づいて、音声認識文法を生成する生成工程のプログラムコードと、
前記生成工程で生成された音声認識文法に基づいて、前記入力された音声の音声認識を実行する音声認識工程のプログラムコードと、
前記音声認識手段の音声認識結果に基づいて、前記選択欄中の選択肢の選択を確定する確定工程のプログラムコードと
を備える。
【0016】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施形態を詳細に説明する。
<実施形態1>
図1は本発明の実施形態1の音声認識システムの構成を示す図である。また、図2は本発明の実施形態1の音声認識システムの動作フローを示すフローチャートである。以下、動作例について、図1及び図2を用いて説明する。
【0017】
尚、当該音声認識システムは、公衆回線や無線LAN等とのネットワークを介して、データ通信を行うことができ、汎用コンピュータや携帯端末に搭載される標準的な構成要素(例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等)で構成されている。また、以下に説明する音声認識システムで実現される各種機能は、システム内部のROMや外部記憶装置に記憶されるプログラムがCPUによって実行されることによって実現されても良いし、専用のハードウェアで実現されても良い。
【0018】
まず、ステップS100で、文書データ100の読み込みを文書読込部101を用いて行う。文書データは、マークアップ言語等の記述言語の記述からなるハイパーテキスト文書であり、その文書データ中には、GUIのデザイン、音声認識合成の動作、音声認識文法の位置(格納場所)を示す記述や表示対象/音声出力対象のテキストデータ等で構成されている。
【0019】
次に、ステップS101で、読み込んだ文書データ100の解析を文書解析部102を用いて行う。ここでは、文書データ100中のマークアップ言語の解析を行い、文書データ100がどのような構造になっているかの解析を行う。解析結果は、制御部103及び音声認識部文法生成部105へ送信する。
【0020】
ここで、解析対象の文書データ100の例を図4に示す。また、これをGUIで表示した例を図5に示す。
【0021】
図4の例では、マークアップ言語としてHTMLを用い、複数の選択肢を有する選択欄から所望の選択肢をGUIで選択する場合の記述を示している。また、この図4によって生成される図5のGUI上で表示される選択欄501中の選択肢は、マウスなどのポインティングデバイスで入力を与えることにより選択できる。実施形態1では、図4の文書データ100に新たな記述を加え、選択欄501中の選択肢がGUIでも音声認識でもどちらでも選択可能とする構成を実現する。このような構成の文書データ100の例を図6に示す。
【0022】
図6の記述の内、<select>タグ中に「voice:type=speech-in」という記述を行うことで、音声入力を受け付け、入力される音声を認識する音声認識部108を使用可能状態にする。
【0023】
文書解析部102は、図6に示すような文書データの選択欄を示す<select>タグ中に「voice:type=speech-in」の記述が検出される場合、制御部103を通じて音声認識部108を使用可能状態にし、GUI上の選択欄501による所望の選択肢が音声認識でもGUIでも可能にする。また、<select>タグ中に「voice:type=speech-in」の記述が検出されない場合、制御部103を通じて音声認識部108を使用不可能状態とし、GUI上の選択欄501による所望の選択肢がGUIのみで可能にする。
【0024】
また、選択欄中の選択肢の音声入力による選択を可能にするために、選択欄中の選択を示す各<option>〜</option>タグで囲まれる「炒飯」等の記述を音声認識文法生成部105に送信する。加えて、<option>〜</option>タグ中に「voice:yomi」という記述を検出すると、指定された読みを表すパラメータ(例えば、「炒飯」の場合は、その読みとして「チャーハン」)を音声認識文法生成部105に送信する。この場合、どの読みがどの記述に対応するかの対応情報も送信する。図7は、図6の文書データに対して、文書解析部102の解析結果によって、音声認識文法生成部105に送信する対応情報の一例である。尚、読みが「voice:yomi=」で指定されない場合(図6では、「カレー」)は、その読みは「NULL」データとなる。
【0025】
図2の説明に戻る。
【0026】
ステップS102で、文書解析部102の解析結果に基づいて、制御部103はGUI画像表示データを生成して、表示部/入力部104に送信する。これにより、表示部/入力部104にGUIが表示される。この時の表示例が図5である。表示部/入力部104の表示部は、一般的にはコンピュータディスプレであるが、視覚的に表示できるものであれば、どのようなものでも構わない。
【0027】
ステップS103で、音声認識文法生成部105は、例えば、図7で示すデータを受信し、音声認識文法を生成する。実施形態1では、「炒飯」、「カレー」、「寿司」の3単語を認識可能な音声認識文法を生成する。音声認識文法では、認識結果の出力文字列情報および読み情報が必要となるが、文書解析部102から読み情報を受信する場合は、その読み情報が読みとして与えられる。また、読み情報を受信していない場合は、自動的に読み情報が付与され認識文法生成に使用される。
【0028】
ステップS104で、音声認識文法変更部106にて、ステップS104で生成された音声認識文法が現在使用されている音声認識文法にマージされる。現在、使用されている音声認識文法とは、音声認識システム立ち上げ時にあらかじめ読み込まれている、例えば、音声認識システムを制御/操作する音声認識文法である。この音声認識文法における語彙としては、「進む」、「戻る」、「次」等が想定される。
【0029】
ステップS105で、音声認識文法保存部107に変更した音声認識文法107を保存する。この保存は、ハードディスクのようなものであっても、メモリのような一時記憶のようなものであってもよい。
【0030】
以上の処理によって、<select>タグに準ずる音声認識文法の生成を行う。
【0031】
次に、生成した音声認識文法に基づく音声認識処理について、図3を用いて説明する。
【0032】
図3は本発明の実施形態1の音声認識処理を示すフローチャートである。
【0033】
ステップS200で、マイク109にて、ユーザが発声した音声を取り込む。ステップS201で、音声認識部108にて、入力された音声の音声認識を行う。音声認識は、保存された音声認識文法107を使用して行う。ここでは、例えば、「スシ」と発声されたとする。この場合、作成された音声認識文法に従って、「寿司」の認識結果が得られる。
【0034】
ステップS202で、制御部103にて、音声認識結果をGUI上の選択欄501へ反映し、選択欄501中の選択肢の選択を確定する。この場合、表示部/入力部104に表示されるGUI上の選択欄501中の選択肢の1つである「寿司」が選択、表示される。ステップS203で、GUI上の送信ボタン502を押下されると、入力データ送信部110にて、アプリケーション111に選択欄の入力結果(この場合は、「寿司」)を送信する。
【0035】
ステップS204で、入力されたデータに従いアプリケーション111が動作する。
【0036】
以上説明したように、実施形態1によれば、ハイパーテキスト文書における選択欄表示において、選択欄中の選択肢からユーザが選択する場合、ポインティングデバイス等による選択のみならず、音声認識による選択が可能になる。また、その音声認識よる選択に対する音声認識文法を自動生成するため、選択欄中の選択肢に表示される語彙を音声認識文法に事前に登録する必要がなくなる。
<実施形態2>
実施形態1においては、選択欄中の複数の選択肢から1つの選択肢を排他的に選択する場合について開示したが、複数の選択肢を一度に選択する構成も可能である。例えば、選択欄から複数の選択肢を選択する場合は、HTMLにおいては、選択欄としてチェックボックスが存在する。このチェックボックスに対して、音声認識を可能とするマークアップ言語の記述の例を図8に示す。
【0037】
この場合、文書解析部102では、図7に示した対応情報を音声認識文法生成部105に送信し、実施形態1と同様な処理で音声認識文法が生成される。実施形態1と異なる点は、図2のステップS202において、認識結果が得られるごとに、選択肢を一つ選ぶのではなく、以前の認識結果を残したまま選択された選択肢を追加していく点である。また、同じ音声入力が2度ある場合は、その選択肢の選択から除外する。例えば、「チャーハン」と音声入力があった場合、「炒飯」を認識結果として確定し、次に、「カレー」と音声入力があれば、「炒飯」に追加して「カレー」も認識結果として確定する。この状態で、さらに「カレー」と音声入力があると、「カレー」に対する選択肢から除外され、「炒飯」のみが選択されるという動作をする。
【0038】
また、HTMLにおいては、選択欄としてラジオボタンと呼ばれる複数の選択肢から単一の選択肢を選択する選択欄もあるが、これは、実施形態1と同様な動作で選択可能であることは言うまでもない。
<実施形態3>
実施形態1では、文書データ100を読込を行った時点で、選択欄の選択肢に関する記述に従って音声認識文法を作成し、音声認識実行する構成について説明したが、文書データ100の読込以外の時点で音声認識文法を作成し、音声認識を実行しても良い。また、音声認識文法の作成と音声認識の動作が別の時点で行われても構わない。
【0039】
例えば、文書データ100の読込後、文書データ100中に選択欄に関する記述があり、かつタグ中に「voice:type=speech-in」が検出された場合、まず、その選択欄中の選択肢に関する音声認識文法を音声認識文法生成部105で作成する。但し、その時点では、音声認識文法107へ生成した音声認識文法の追加は行わず、該当する選択肢がGUIや音声等で指示(フォーカス)された時点で、音声認識文法変更部106を動作させ、音声認識文法107へ生成された音声認識文法を追加して、音声認識を開始する。また、フォーカスが外れた時点で再度追加した音声認識文法を除外して、音声認識を終了する。このように構成することで、該当する選択肢にフォーカスされたときのみ選択欄へ音声入力することが可能となり、音声認識システムの処理負荷を軽減することができる。
【0040】
尚、上記実施形態では、GUI上に表示される1つの選択欄中の選択肢に対する選択を音声入力する場合について説明したが、複数の選択欄が表示されるGUIに対しても本発明を適用できることは言うまでもない。この場合は、複数の選択欄のいずれかの選択欄の指示がなされた後に、上記実施形態で説明した処理を実行すれば良い。
【0041】
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。その場合、プログラムの機能を有していれば、形態は、プログラムである必要はない。
【0042】
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
【0043】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
【0044】
プログラムを供給するための記録媒体としては、例えば、フロッピーディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
【0045】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
【0046】
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0047】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
【0048】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
【0049】
【発明の効果】
以上説明したように、本発明によれば、画面上に表示される任意の選択肢の選択を容易にかつ柔軟に音声入力で実現することができる音声認識装置及びその方法、プログラムを提供できる。
【図面の簡単な説明】
【図1】本発明の実施形態1の音声認識システムの構成を示す図である。
【図2】本発明の実施形態1の音声認識システムの動作フローを示すフローチャートである。
【図3】本発明の実施形態1の音声認識処理を示すフローチャートである。
【図4】本発明の実施形態1の文書データの例を示す図である。
【図5】本発明の実施形態1のGUIの例を示す図である。
【図6】本発明の実施形態1の文書データの例を示す図である。
【図7】本発明の実施形態1の記述と読みの対応情報の例を示す図である。
【図8】本発明の実施形態2の文書データの例を示す図である。
【符号の説明】
100 文書データ
101 文書読込部
102 文書解析部
103 制御部
104 表示部/入力部
105 音声認識文法生成部
106 音声認識文法変更部
107 音声認識文法
108 音声認識部
109 マイク
110 入力データ送信部
111 アプリケーション

Claims (7)

  1. 入力された音声を認識し、その音声認識結果に基づいて処理を実行する音声認識装置であって、
    複数の選択肢からなる選択欄を表示するための記述と、該選択欄中の選択肢の音声入力による選択を受け付けるための記述を含むハイパーテキスト文書を読み込む読込手段と、
    前記読込手段で読み込んだハイパーテキスト文書中の前記選択欄を表示するための記述に基づいて選択欄を表示する表示手段と、
    前記表示手段で表示された複数の前記選択欄のいずれかの選択欄への指示がなされた場合に、該指示がなされた前記ハイパーテキスト文書中の前記選択欄中の選択肢に関する記述に基づいて音声認識文法を生成する生成手段と、
    前記生成手段で生成された音声認識文法に基づいて、前記入力された音声の音声認識を実行する音声認識手段と、
    前記音声認識手段の音声認識結果に基づいて、前記選択欄中の選択肢の選択を確定する確定手段と
    を備えることを特徴とする音声認識装置。
  2. 前記確定手段は、前記音声認識手段の音声認識結果に基づいて、前記選択欄中の1つの選択肢の選択を確定する
    ことを特徴とする請求項1に記載の音声認識装置。
  3. 前記確定手段は、前記音声認識手段の音声認識結果に基づいて、前記選択欄中の複数の選択肢の選択を確定する
    ことを特徴とする請求項1に記載の音声認識装置。
  4. 前記音声認識手段は、前記解析手段の解析が完了した後、前記音声認識を開始する
    ことを特徴とする請求項1に記載の音声認識装置。
  5. 前記音声認識手段は、前記選択欄への指示がなされた場合に前記音声認識を開始し、該選択欄への指示が取り消された場合に該音声認識を終了する
    ことを特徴とする請求項1に記載の音声認識装置。
  6. 入力された音声を認識し、その音声認識結果に基づいて処理を実行する音声認識方法であって、
    複数の選択肢からなる選択欄を表示するための記述と、該選択欄中の選択肢の音声入力による選択を受け付けるための記述を含むハイパーテキスト文書を読み込む読込工程と、
    前記読込工程で読み込んだハイパーテキスト文書中の前記選択欄を表示するための記述に基づいて選択欄を表示する表示工程と、
    前記表示工程で表示された複数の前記選択欄のいずれかの選択欄への指示がなされた場合に、該指示がなされた前記ハイパーテキスト文書中の前記選択欄中の選択肢に関する記述に基づいて、音声認識文法を生成する生成工程と、
    前記生成工程で生成された音声認識文法に基づいて、前記入力された音声の音声認識を実行する音声認識工程と、
    前記音声認識工程の音声認識結果に基づいて、前記選択欄中の選択肢の選択を確定する確定工程と
    を備えることを特徴とする音声認識方法。
  7. 入力された音声を認識し、その音声認識結果に基づいて処理を実行する音声認識をコンピュータに機能させるためのプログラムであって、
    複数の選択肢からなる選択欄を表示するための記述と、該選択欄中の選択肢の音声入力による選択を受け付けるための記述を含むハイパーテキスト文書を読み込む読込工程のプログラムコードと、
    前記読込工程で読み込んだハイパーテキスト文書中の前記選択欄を表示するための記述に基づいて選択欄を表示する表示工程のプログラムコードと、
    前記表示工程で表示された複数の前記選択欄へのいずれかの選択欄への指示がなされた場合に、該指示がなされた前記ハイパーテキスト文書中の前記選択欄中の選択肢に関する記述に基づいて、音声認識文法を生成する生成工程のプログラムコードと、
    前記生成工程で生成された音声認識文法に基づいて、前記入力された音声の音声認識を実行する音声認識工程のプログラムコードと、
    前記音声認識手段の音声認識結果に基づいて、前記選択欄中の選択肢の選択を確定する確定工程のプログラムコードと
    を備えることを特徴とするプログラム。
JP2001370353A 2001-12-04 2001-12-04 音声認識装置及びその方法、プログラム Expired - Fee Related JP3880383B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001370353A JP3880383B2 (ja) 2001-12-04 2001-12-04 音声認識装置及びその方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001370353A JP3880383B2 (ja) 2001-12-04 2001-12-04 音声認識装置及びその方法、プログラム

Publications (2)

Publication Number Publication Date
JP2003167598A JP2003167598A (ja) 2003-06-13
JP3880383B2 true JP3880383B2 (ja) 2007-02-14

Family

ID=19179593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001370353A Expired - Fee Related JP3880383B2 (ja) 2001-12-04 2001-12-04 音声認識装置及びその方法、プログラム

Country Status (1)

Country Link
JP (1) JP3880383B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006155035A (ja) * 2004-11-26 2006-06-15 Canon Inc ユーザインタフェースの構築方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6282511B1 (en) * 1996-12-04 2001-08-28 At&T Voiced interface with hyperlinked information
JPH10222342A (ja) * 1997-02-06 1998-08-21 Nippon Telegr & Teleph Corp <Ntt> ハイパーテキスト音声制御方法及び装置
JP2001042890A (ja) * 1999-07-30 2001-02-16 Toshiba Tec Corp 音声認識装置
JP2001134418A (ja) * 1999-11-08 2001-05-18 Nippon Telegr & Teleph Corp <Ntt> ハイパーテキスト中継方法及び装置
JP2001255881A (ja) * 2000-03-13 2001-09-21 Matsushita Electric Ind Co Ltd 自動音声認識/合成ブラウザシステム
JP3862470B2 (ja) * 2000-03-31 2006-12-27 キヤノン株式会社 データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体
JP4565585B2 (ja) * 2000-04-13 2010-10-20 キヤノン株式会社 データ処理装置、データ処理方法、記録媒体
JP2001306601A (ja) * 2000-04-27 2001-11-02 Canon Inc 文書処理装置及びその方法、及びそのプログラムを格納した記憶媒体

Also Published As

Publication number Publication date
JP2003167598A (ja) 2003-06-13

Similar Documents

Publication Publication Date Title
US7165034B2 (en) Information processing apparatus and method, and program
JP4006395B2 (ja) 情報処理装置及びその制御方法、プログラム
CN1779782B (zh) 用户界面设计装置和方法
CN100530085C (zh) 实现虚拟语音一键通功能的方法和装置
RU2379745C2 (ru) Совместное использование пошагового языка разметки и объектно ориентированного инструментального средства разработки
US6499015B2 (en) Voice interaction method for a computer graphical user interface
JP2005149485A (ja) 逐次的なマルチモーダル入力
JP2007171809A (ja) 情報処理装置及び情報処理方法
KR100738175B1 (ko) 정보 처리 방법 및 장치
US8725505B2 (en) Verb error recovery in speech recognition
JP2010102302A (ja) 文書ナビゲーションのシステム、方法およびプログラム
US7174509B2 (en) Multimodal document reception apparatus and multimodal document transmission apparatus, multimodal document transmission/reception system, their control method, and program
JP2008145769A (ja) 対話シナリオ生成システム,その方法およびプログラム
JP3542578B2 (ja) 音声認識装置及びその方法、プログラム
JP3880383B2 (ja) 音声認識装置及びその方法、プログラム
JP4565585B2 (ja) データ処理装置、データ処理方法、記録媒体
JP2003202890A (ja) 音声認識装置及びその方法、プログラム
WO2000038043A1 (en) Hypertext display device
JP2004054811A (ja) 入力表示方法、入力表示装置、入力表示プログラム及び入力表示プログラムを記録した記録媒体
WO2021205832A1 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
JP2007220129A (ja) ユーザインタフェース設計装置およびその制御方法
JP3187317B2 (ja) 対話処理プログラム生成装置
JP2003223314A (ja) 情報処理装置及びその方法、プログラム
JP2017182675A (ja) 情報処理装置と、その処理方法及びプログラム
JP5342737B2 (ja) 文字処理装置、文字処理方法およびプログラムならびに文字処理装置を使用する情報処理システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040513

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061107

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101117

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101117

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111117

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131117

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees