JP4200607B2 - 情報処理装置および方法、並びにプログラム格納媒体 - Google Patents

情報処理装置および方法、並びにプログラム格納媒体 Download PDF

Info

Publication number
JP4200607B2
JP4200607B2 JP25067499A JP25067499A JP4200607B2 JP 4200607 B2 JP4200607 B2 JP 4200607B2 JP 25067499 A JP25067499 A JP 25067499A JP 25067499 A JP25067499 A JP 25067499A JP 4200607 B2 JP4200607 B2 JP 4200607B2
Authority
JP
Japan
Prior art keywords
program
voice
word
still image
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25067499A
Other languages
English (en)
Other versions
JP2001075777A (ja
Inventor
清信 小島
靖彦 加藤
修二 米倉
聡 藤村
崇司 笹井
直樹 藤澤
純司 大井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP25067499A priority Critical patent/JP4200607B2/ja
Priority to US09/648,863 priority patent/US6879958B1/en
Priority to EP00118753A priority patent/EP1081586A3/en
Publication of JP2001075777A publication Critical patent/JP2001075777A/ja
Priority to US11/081,542 priority patent/US7035806B2/en
Priority to US11/081,539 priority patent/US7047199B2/en
Application granted granted Critical
Publication of JP4200607B2 publication Critical patent/JP4200607B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、情報処理装置および方法、並びにプログラム格納媒体に関し、特に、音声を認識する情報処理装置および方法、並びにプログラム格納媒体に関する。
【0002】
【従来の技術】
パーソナルコンピュータなどの情報処理装置は、インターネットなどを介して、電子メールを所定の相手に送信することができる。
【0003】
【発明が解決しようとする課題】
しかしながら、電子メールなどを送信するたびに、所定の画面で、通信相手を特定するデータであるアドレスを設定しなければならず、面倒であった。
【0004】
本発明はこのような状況に鑑みてなされたものであり、簡単に、通信相手を特定するデータが設定できるようにすることを目的とする。
【0005】
【課題を解決するための手段】
請求項1に記載の情報処理装置は、シャッタボタンが押圧されたとき、カメラが撮像している画像を基に静止画像のデータを生成し、生成した前記静止画像のデータを格納するとともに、音声認識によって認識されたコメントをヘッダに格納したファイルを記録媒体に記録させる記録手段と、シャッタボタンが押圧された後に、シャッタボタンが押圧されたまま入力された音声を認識する認識手段と、前記記録手段により前記ファイルが記録されたときに起動した静止画閲覧プログラムによって実現される、前記記録手段により生成された前記静止画像を前記カメラが撮像している画像を表示する第1のウインドウと異なる第2のウインドウに表示させ、前記認識手段により認識された音声を表す単語または文を、前記静止画像の隣に表示させる静止画像表示制御手段と、前記第2のウインドウに表示されている、メッセージを作成するときに操作されるボタンが操作されたときに起動した電子メールプログラムによって実現される、前記第1のウインドウに替えて、メッセージの作成に用いられる第3のウインドウを表示させ、前記第3のウインドウに設けられるメッセージの本文の表示フィールドに、コメントとして前記ファイルのヘッダに前記記録手段により格納された、前記認識手段により認識された単語または文を表示させ、前記記録手段により記録された前記ファイルを添付した前記メッセージを生成する生成手段と、音声の認識を行うときに操作される認識キーが押圧されたまま入力された音声を前記認識手段がさらに認識する場合、呼び名として登録されている単語とメールの言葉からなる音声が前記認識手段により認識されたことに応じて前記電子メールプログラムが起動するとき、認識された音声を表す単語または文を表示する領域と音声のレベルを表示する領域が設けられるウインドウから周りに広がり、前記電子メールプログラムを表すアイコンに向かって収束するように波紋状の画像を表示させ、前記アイコンを強調表示させる表示制御手段と、前記アイコンが強調表示された後に表示されたメッセージの作成に用いられるウインドウのメールアドレスの表示欄に、前記認識手段により認識された前記呼び名として登録されている単語に対応付けて登録されているメールアドレスをメッセージの送信先として設定する設定手段とを備える。
【0007】
請求項2に記載の情報処理方法は、シャッタボタンが押圧されたとき、カメラが撮像している画像を基に静止画像のデータを生成し、生成した前記静止画像のデータを格納するとともに、音声認識によって認識されたコメントをヘッダに格納したファイルを記録媒体に記録させ、シャッタボタンが押圧された後に、シャッタボタンが押圧されたまま入力された音声を認識し、前記ファイルを記録したときに静止画閲覧プログラムを起動させ、生成した前記静止画像を前記カメラが撮像している画像を表示する第1のウインドウと異なる第2のウインドウに表示させ、認識した音声を表す単語または文を、前記静止画像の隣に表示させ、前記第2のウインドウに表示されている、メッセージを作成するときに操作されるボタンが操作されたときに電子メールプログラムを起動させ、前記第1のウインドウに替えて、メッセージの作成に用いられる第3のウインドウを表示させ、前記第3のウインドウに設けられるメッセージの本文の表示フィールドに、コメントとして前記ファイルのヘッダに格納した、認識した単語または文を表示させ、前記ファイルを添付した前記メッセージを生成し、音声の認識を行うときに操作される認識キーが押圧されたまま入力された音声をさらに認識する場合、呼び名として登録されている単語とメールの言葉からなる音声を認識したことに応じて前記電子メールプログラムが起動するとき、認識された音声を表す単語または文を表示する領域と音声のレベルを表示する領域が設けられるウインドウから周りに広がり、前記電子メールプログラムを表すアイコンに向かって収束するように波紋状の画像を表示させ、前記アイコンを強調表示させ、前記アイコンを強調表示させた後に表示させたメッセージの作成に用いられるウインドウのメールアドレスの表示欄に、認識した前記呼び名として登録されている単語に対応付けて登録しているメールアドレスをメッセージの送信先として設定するするステップを含む。
【0008】
請求項3に記載のプログラム格納媒体のプログラムは、シャッタボタンが押圧されたとき、カメラが撮像している画像を基に静止画像のデータを生成し、生成した前記静止画像のデータを格納するとともに、音声認識によって認識されたコメントをヘッダに格納したファイルを記録媒体に記録させ、シャッタボタンが押圧された後に、シャッタボタンが押圧されたまま入力された音声を認識し、前記ファイルを記録したときに静止画閲覧プログラムを起動させ、生成した前記静止画像を前記カメラが撮像している画像を表示する第1のウインドウと異なる第2のウインドウに表示させ、認識した音声を表す単語または文を、前記静止画像の隣に表示させ、前記第2のウインドウに表示されている、メッセージを作成するときに操作されるボタンが操作されたときに電子メールプログラムを起動させ、前記第1のウインドウに替えて、メッセージの作成に用いられる第3のウインドウを表示させ、前記第3のウインドウに設けられるメッセージの本文の表示フィールドに、コメントとして前記ファイルのヘッダに格納した、認識した単語または文を表示させ、前記ファイルを添付した前記メッセージを生成し、音声の認識を行うときに操作される認識キーが押圧されたまま入力された音声をさらに認識する場合、呼び名として登録されている単語とメールの言葉からなる音声を認識したことに応じて前記電子メールプログラムが起動するとき、認識された音声を表す単語または文を表示する領域と音声のレベルを表示する領域が設けられるウインドウから周りに広がり、前記電子メールプログラムを表すアイコンに向かって収束するように波紋状の画像を表示させ、前記アイコンを強調表示させ、前記アイコンを強調表示させた後に表示させたメッセージの作成に用いられるウインドウのメールアドレスの表示欄に、認識した前記呼び名として登録されている単語に対応付けて登録しているメールアドレスをメッセージの送信先として設定するするステップを含む処理をコンピュータに実行させる。
【0009】
本発明においては、シャッタボタンが押圧されたとき、カメラが撮像している画像を基に静止画像のデータが生成され、生成された前記静止画像のデータを格納するとともに、音声認識によって認識されたコメントをヘッダに格納したファイルが記録媒体に記録される。また、シャッタボタンが押圧された後に、シャッタボタンが押圧されたまま入力された音声が認識され、前記ファイルを記録したときに静止画閲覧プログラムが起動し、生成された前記静止画像が前記カメラが撮像している画像を表示する第1のウインドウと異なる第2のウインドウに表示され、認識された音声を表す単語または文が、前記静止画像の隣に表示される。さらに、前記第2のウインドウに表示されている、メッセージを作成するときに操作されるボタンが操作されたときに電子メールプログラムが起動し、前記第1のウインドウに替えて、メッセージの作成に用いられる第3のウインドウが表示され、前記第3のウインドウに設けられるメッセージの本文の表示フィールドに、コメントとして前記ファイルのヘッダに格納された、認識された単語または文が表示され、前記ファイルを添付した前記メッセージが生成される。音声の認識を行うときに操作される認識キーが押圧されたまま入力された音声がさらに認識される場合、呼び名として登録されている単語とメールの言葉からなる音声を認識したことに応じて前記電子メールプログラムが起動するとき、認識された音声を表す単語または文を表示する領域と音声のレベルを表示する領域が設けられるウインドウから周りに広がり、前記電子メールプログラムを表すアイコンに向かって収束するように波紋状の画像が表示され、前記アイコンが強調表示され、前記アイコンが強調表示された後に表示されたメッセージの作成に用いられるウインドウのメールアドレスの表示欄に、認識された前記呼び名として登録されている単語に対応付けて登録しているメールアドレスがメッセージの送信先として設定される。
【0010】
【発明の実施の形態】
以下、本発明に係る情報処理装置の一実施の形態を図面を参照して説明する。
【0011】
図1乃至図6は、本発明を適用した携帯型パーソナルコンピュータの構成例を表している。このパーソナルコンピュータ1は、ミニノート型のパーソナルコンピュータとされ、基本的に、本体2と、本体2に対して開閉自在とされている表示部3により構成されている。図1は、表示部3を本体2に対して開いた状態を示す外観斜視図、図2は、図1の平面図、図3は、表示部3を本体2に対して閉塞した状態を示す左側側面図、図4は、表示部3を本体2に対して180度開いた状態を示す右側側面図、図5は、図3の正面図、図6は、図4の底面図である。
【0012】
本体2には、各種の文字や記号などを入力するとき操作されるキーボード4、マウスカーソルを移動させるときなどに操作されるスティック式ポインティングデバイス5が、その上面に設けられている。また、本体2の上面には、音を出力するスピーカ8と、表示部3に設けられているCCDビデオカメラ23で撮像するとき操作されるシャッタボタン10がさらに設けられている。
【0013】
表示部3の上端部には、ツメ13が設けられており、図3に示すように、表示部3を本体2に対して閉塞した状態において、ツメ13に対向する位置における本体2には、ツメ13が嵌合する孔部6が設けられている。本体2の前面には、スライドレバー7が前面に平行に移動可能に設けられており、スライドレバー7は孔部6に嵌合したツメ13と係合してロックし、またロック解除することができるようになっている。ロックを解除することにより、表示部3を本体2に対して回動することができる。ツメ13の隣りには、マイクロホン24が取り付けられている。このマイクロホン24は、図6にも示すように、背面からの音も収音できるようになされている。
【0014】
本体2の正面にはまた、プログラマブルパワーキー(PPK)9が設けられている。本体2の右側面には、図4に示すように、排気孔11が設けられており、本体2の前面下部には、図5に示すように、吸気孔14が設けられている。さらに、排気孔11の右側には、PCMCIA(Personal Computer Memory Card International Association)カード(PCカード)を挿入するためのスロット12が設けられている。
【0015】
表示部3の正面には、画像を表示するLCD(Liquid Crystal Display)21が設けられており、その上端部には、撮像部22が、表示部3に対して回動自在に設けられている。すなわち、この撮像部22は、LCD21と同一の方向と、その逆の方向(背面の方向)との間の180度の範囲の任意の位置に回動することができるようになされている。撮像部22には、CCDビデオカメラ23が取り付けられている。
【0016】
表示部3の下側の本体側には、電源ランプPL、電池ランプBL、メッセージランプML、その他のLEDよりなるランプが設けられている。なお、図3に示す符号40は、本体2の左側面に設けられた電源スイッチであり、図5に示す符号25は、CCDビデオカメラ23のフォーカスを調整する調整リングである。さらに、図6に示す符号26は、本体2内に増設メモリを取り付けるための開口部を被覆する蓋であり、符号41は、蓋26のロックツメを外すためのピンを挿入する小孔である。
【0017】
図7は、パーソナルコンピュータ1の内部の構成を表している。内部バス51には、図7に示すように、CPU(Central Processing Unit)52、必要に応じて挿入されるPCカード53、RAM(Random Access Memory)54、およびグラフィックチップ81が接続されている。この内部バス51は、外部バス55に接続されており、外部バス55には、ハードディスクドライブ(HDD)56、I/O(入出力)コントローラ57、キーボードコントローラ58、スティック式ポインティングデバイスコントローラ59、サウンドチップ60、LCDコントローラ83、モデム50などが接続されている。
【0018】
CPU52は、各機能を統括するコントローラであり、PCカード53は、オプションの機能を付加するとき適宜装着される。
【0019】
RAM54の中には、起動が完了した時点において、電子メールプログラム(アプリケーションプログラム)54A、オートパイロットプログラム(アプリケーションプログラム)54B、そしてOS(基本プログラム)54Cが、HDD56から転送され、記憶される。
【0020】
電子メールプログラム54Aは、電話回線のような通信回線などからネットワーク経由で通信文を授受するプログラムである。電子メールプログラム54Aは、特定機能としての着信メール取得機能を有している。この着信メール取得機能は、メールサーバ93に対して、そのメールボックス93A内に自分(利用者)宛のメールが着信しているかどうかを確認して、自分宛のメールがあれば取得する処理を実行する。
【0021】
オートパイロットプログラム54Bは、予め設定された複数の処理(またはプログラム)などを、予め設定された順序で順次起動して、処理するプログラムである。
【0022】
OS54Cは、Windows98(商標)に代表される、コンピュータの基本的な動作を制御するものである。
【0023】
一方、外部バス55側のハードディスクドライブ(HDD)56には、電子メールプログラム56A、オートパイロットプログラム56B、OS56Cが記憶されている。ハードディスクドライブ56内のOS56C、オートパイロットプログラム56B、および電子メールプログラム56Aは、起動(ブートアップ)処理の過程で、RAM54内に順次転送され、格納される。
【0024】
I/Oコントローラ57は、マイクロコントローラ61を有し、このマイクロコントローラ61には、I/Oインタフェース62が設けられている。このマイクロコントローラ61は、I/Oインタフェース62、CPU63、RAM64、ROM69が相互に接続されて構成されている。このRAM64は、キー入力ステイタスレジスタ65、LED(発光ダイオード)制御レジスタ66、設定時刻レジスタ67、レジスタ68を有している。設定時刻レジスタ67は、ユーザが予め設定した時刻(起動条件)になると起動シーケンス制御部76の動作を開始させる際に利用される。レジスタ68は、予め設定された操作キーの組み合わせ(起動条件)と、起動すべきアプリケーションプログラムの対応を記憶するもので、その記憶された操作キーの組み合わせがユーザにより入力されると、その記憶されたアプリケーションプログラム(例えば電子メール)が起動されることになる。
【0025】
キー入力ステイタスレジスタ65は、ワンタッチ操作用のプログラマブルパワーキー(PPK)9が押されると、操作キーフラグが格納されるようになっている。LED制御レジスタ66は、レジスタ68に記憶されたアプリケーションプログラム(電子メール)の立ち上げ状態を表示するメッセージランプMLの点灯を制御するものである。設定時刻レジスタ67は、所定の時刻を任意に設定することができるものである。
【0026】
なお、このマイクロコントローラ61には、バックアップ用のバッテリ74が接続されており、各レジスタ65,66,67の値は、本体2の電源がオフとされている状態においても保持されるようになっている。
【0027】
マイクロコントローラ61内のROM69の中には、ウェイクアッププログラム70、キー入力監視プログラム71、LED制御プログラム72が予め格納されている。このROM69は、例えばEEPROM(electrically erasable and programmable read only memory)で構成されている。このEEPROMはフラッシュメモリとも呼ばれている。さらにマイクロコントローラ61には、常時現在時刻をカウントするRTC(Real-Time Clock)75が接続されている。
【0028】
ROM69の中のウェイクアッププログラム70は、RTC75から供給される現在時刻データに基づいて、設定時刻レジスタ67に予め設定された時刻になったかどうかをチェックして、設定された時刻になると、所定の処理(またはプログラム)などの起動をするプログラムである。キー入力監視プログラム71は、PPK9が利用者により押されたかどうかを常時監視するプログラムである。LED制御プログラム72は、メッセージランプMLの点灯を制御するプログラムである。
【0029】
ROM69には、さらにBIOS(Basic Input Output System)73が書き込まれている。このBIOS73は、電源投入時にOS56Cを起動したり、起動した後、各種アプリケーションソフトウェアと周辺機器(ディスプレイ、キーボード、ハードディスクドライブなど)の間でデータを授受する等の機能を有する。
【0030】
外部バス55に接続されているキーボードコントローラ58は、キーボード4からの入力をコントロールする。スティック式ポインティングデバイスコントローラ59は、スティック式ポインティングデバイス5の入力を制御する。
【0031】
サウンドチップ60は、マイクロホン24からの入力を取り込み、あるいは内蔵スピーカ8に対して音声信号を供給する。
【0032】
モデム50は、公衆電話回線90、インターネットサービスプロバイダ91を介して、インターネットなどの通信ネットワーク92やメールサーバ93などに接続することができる。
【0033】
内部バス51に接続されているグラフィックチップ81には、CCDビデオカメラ23で取り込んだ画像データが、処理部82で処理された後、ZV(Zoomed Video)ポートを介して入力されるようになされている。グラフィックチップ81は、処理部82を介してCCDビデオカメラ23より入力されたビデオデータを、内蔵するVRAM81に記憶し、適宜、これを読み出して、LCDコントローラ83に出力する。LCDコントローラ83は、グラフィックチップ81より供給された画像データをLCD21に出力し、表示させる。バックライト84は、LCD21を後方から照明するようになされている。
【0034】
電源スイッチ40は、電源をオンまたはオフするとき操作される。半押しスイッチ85は、シャッタボタン10が半押し状態にされたときオンされ、全押しスイッチ86は、シャッタボタン10が全押し状態にされたときオンされる。反転スイッチ87は、撮像部22が180度回転されたとき(CCDビデオカメラ23がLCD21の反対側を撮像する方向に回転されたとき)、オンされるようになされている。
【0035】
ドライブ88は、外部バス55に接続されている。ドライブ88は、磁気ディスク351(フロッピディスクを含む)、光ディスク352(CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク353(MD(Mini-Disc)を含む)、または半導体メモリ354などが装着され、装着された磁気ディスク351、光ディスク352、光磁気ディスク353、または半導体メモリ354などに記録されているプログラムまたはデータを、外部バス55または内部バス51を介して、HDD56またはRAM54に供給する。
【0036】
ドライブ88は、外部バス55または内部バス51を介して、モデム50、HDD56、またはRAM54から供給されたプログラムまたはデータなどを、装着された磁気ディスク351、光ディスク352、光磁気ディスク353、または半導体メモリ354などに記録させる。
【0037】
図8は、音声認識に係るプログラムをパーソナルコンピュータ1が起動させたときの、所定のプログラムによる機能ブロックを示す図である。音声認識エンジン101は、読み仮名辞書データベース111に予め記憶されている漢字に対する読み、またはエンジン用認識単語・文法データベース112に予め記憶されている認識単語、若しくは文法を基に、マイクロホン24から入力された使用者の音声に対応するデータを入力し、使用者が喋った言葉に対応するテキストなどの所定の方式のデータを生成して、音声コマンダ102に供給する。
【0038】
音声認識エンジン101は、音声コマンダ102から認識単語、若しくは文法などのデータを受信して、読み仮名辞書データベース111またはエンジン用認識単語・文法データベース112に記憶させる。
【0039】
音声コマンダ102は、使用者が喋った所定の言葉に対応する単語(テキストなど)などのデータが音声認識エンジン101から供給されたとき、静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105を起動させ、または静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105に所定コマンド(使用者が喋った言葉に対応する)を送信する。
【0040】
音声コマンダ102は、使用者が喋った他の所定の言葉に対応する単語(テキストなど)などのデータが音声認識エンジン101から供給されたとき、ランチャ設定データベース113に記憶されている起動に関する設定に基づき、電子メールプログラム54A、ワードプロセッサプログラム106、または表計算プログラム107を起動させ、電子メールプログラム54Aにメールアドレスなどの所定のデータを供給する。
【0041】
また、音声コマンダ102は、グラフィカルなユーザインターフェースを有し、使用者により、グラフィカルなユーザインターフェースを介して種々の設定がなされ、使用者により設定された内容を分類して、アプリケーションプログラム(電子メールプログラム54A、ワードプロセッサプログラム106、または表計算プログラム107)の起動に関する設定をランチャ設定データベース113に、漢字の読み、または静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のコマンドなどに関する設定を辞書設定データベース114に、音声認識する単語または文法に関する設定を認識単語・文法データベース115にそれぞれ記憶させる。
【0042】
音声コマンダ102は、所定のタイミングで、例えば、音声認識エンジン101に音声を認識させるとき、認識単語・文法データベース115に記憶している認識単語のデータおよび文法のデータを、音声認識エンジン101に送信する。
【0043】
音声認識エンジン101は、OS54Cを起動するとき入力される使用者を判別するデータに基づいて、その使用者用の読み仮名辞書データベース111およびエンジン用認識単語・文法データベース112を利用する。音声コマンダ102は、OS54Cを起動するとき入力される使用者を判別するデータに基づいて、その使用者用のランチャ設定データベース113、辞書設定データベース114、および認識単語・文法データベース115を利用する。
【0044】
仮名辞書データベース111、エンジン用認識単語・文法データベース112、ランチャ設定データベース113、辞書設定データベース114、および認識単語・文法データベース115は、パーソナルコンピュータ1の使用者毎に生成され、HDD56に記録される。
【0045】
静止画撮影プログラム103は、CCDビデオカメラ23から入力された画像を、シャッタボタン10などの操作に対応した信号に基づき、静止画像のデータを生成して、所定のファイルとしてHDD56に記録する。
【0046】
静止画閲覧プログラム104は、静止画撮影プログラム103が記録させた静止画像のファイルを選択し、または使用者に選択させ、選択された静止画像をLCD21に表示させる。電子ペットプログラム105は、LCD21に仮想的なペットを表示させ、使用者の操作に対応して、仮想的なペットに指示などを与える。
【0047】
ワードプロセッサプログラム106は、文字または図形などから成る文書を編集するためのプログラムである。表計算プログラム107は、所定の形式の表に配置された数値に所定の演算を実行する、または配置された数値に対応するグラフを描写するなどの機能を有する。
【0048】
図9は、音声コマンダ102のより詳細な機能を説明する図である。UI(ユーザインターフェース)処理部123は、アプリケーション通信部121、エンジン通信部122、音声ランチャ制御部124、ユーザ辞書制御部125、または認識テスト処理部126から所定のデータを入力するとともに、キーボード4またはスティック式ポインティングデバイス5などから所定の信号を入力して、マイクロフォン24を介して入力された音声の大きさまたは音声認識の結果などを、所定のウィンドウに表示させる。UI処理部123は、所定のプログラムを起動させるとき、アプリケーション通信部121、または音声ランチャ制御部124から入力されたデータを基に、所定の画像をLCD21に表示させる。
【0049】
UI処理部123は、キーボード4またはステッィク式ポインティングデバイス5などの操作に対応した信号を基に、UI処理部123自身の状態を変化させ、所定のデータをアプリケーション通信部121、エンジン通信部122、音声ランチャ制御部124、ユーザ辞書制御部125、または認識テスト処理部126に供給する。
【0050】
また、UI処理部123は、静止画撮影プログラム103、静止画閲覧プログラム104、および電子ペットプログラム105の状態、並びにエンジン通信部122を介して音声認識エンジン101から供給された、使用者が喋った所定の言葉に対応する所定のテキストなどのデータを基に、アプリケーション通信部121または音声ランチャ制御部124に、コマンドを送信または所定のプログラムの起動をさせるか否かを決定し、アプリケーション通信部121または音声ランチャ制御部124にコマンドを送信させ、または所定のプログラムの起動させる。
【0051】
アプリケーション通信部121は、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105を起動させ、起動している静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105と通信を行い、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105からそれぞれの状態を示すデータを受信する。
【0052】
アプリケーション通信部121は、静止画撮影プログラム103、静止画閲覧プログラム104、および電子ペットプログラム105の状態を示すデータなどをエンジン通信部122またはUI処理部123に供給するとともに、エンジン通信部122またはUI処理部123から、使用者が喋った所定の言葉に対応する所定のテキストなどのデータ、または使用者のキーボード4などへの操作に対応するデータなどを受信する。
【0053】
また、アプリケーション通信部121は、静止画撮影プログラム103、静止画閲覧プログラム104、および電子ペットプログラム105の状態、並びにエンジン通信部122を介して音声認識エンジン101から供給された、使用者が喋った所定の言葉に対応する所定のテキストなどのデータを基に、静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のいずれかを起動させ、または静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のいずれかに所定のコマンドを供給する。
【0054】
静止画撮影プログラム103、静止画閲覧プログラム104、および電子ペットプログラム105のいずれもが、フォーカスがあてられていないとき(いずれもアクティブでないとき)、音声コマンダ102は、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれかを対象としたコマンドを実行できない。
【0055】
静止画撮影プログラム103、静止画閲覧プログラム104、および電子ペットプログラム105のいずれかが、フォーカスがあてられているとき(いずれかがアクティブであるとき)、音声コマンダ102は、アクティブである、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれかを対象としたコマンドを実行することができる。
【0056】
このような静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれかの特定のプログラムを対象としたコマンドをローカルなコマンドと称する。
【0057】
なお、音声コマンダ102がローカルなコマンドを送信するプログラムを特定する方法は、フォーカスに限らず、他の状態またはデータを参照するようにしてもよい。
【0058】
エンジン通信部122は、所定の方式を基づいて、認識単語・文法データベース115から認識単語のデータおよび文法のデータを読み出して、そのデータを音声認識エンジン101に送信するとともに、音声認識エンジン101から供給された使用者が喋った所定の言葉に対応する所定のテキストなどのデータを受信する。
【0059】
エンジン通信部122は、例えば、図10に例を示すMicrosoft Speech API(商標)(以下、SAPIと称する)に規定された方式で、音声認識エンジン101に認識単語・文法データベース115に記憶されている認識単語のデータおよび文法のデータを送信する。図10に示すデータの例には、音声認識の対象が<Global>および<SVCommand>から構成され、<Global>が更に(ChangeWin),(VoiceCommand)から構成され、<SVCommand>が「ヘルプ」、「前へ」などのコマンドの他、<SendMail>で表されるメールのコマンドも含むことが記述されている。また、図10に示すデータの例には、「ヘルプ」というコマンドのコード番号が102であり、「パパ」という読みを有する単語に「daddy@test.company.co.jp」という文字列が関連していることなどが示されている。
【0060】
音声認識エンジン101は、エンジン通信部122から受信したデータを、所定の方式のデータに変換して、読み仮名辞書データベース111またはエンジン用認識単語・文法データベース112に記憶させ、読み仮名辞書データベース111またはエンジン用認識単語・文法データベース112に記憶しているデータに基づき、音声認識の処理を実行する。
【0061】
音声認識エンジン101は、エンジン通信部122に、使用者が喋った所定の言葉に対応する、コード番号(例えば、102など)、認識した単語または文(例えば、”パパにメール”など)、および認識した単語に関連する文字列(例えば、”daddy@test.company.co.jp”)のデータを送信する。
【0062】
例えば、使用者がマイクロフォン24に向かって「パパにメール」という音声を入力して、音声認識エンジン101が正しく音声を認識したとき、音声認識エンジン101は、7fffffff(16進数)、”パパにメール”、および”daddy@test.company.co.jp”をエンジン通信部122に送信する。
【0063】
エンジン通信部122は、音声認識エンジン101から受信したデータを基に、受信したデータをアプリケーション通信部121、UI処理部123、音声ランチャ制御部124、ユーザ辞書制御部125、または認識テスト処理部126のいずれに送信するかを判断し、その判断に基づいて、音声認識エンジン101から受信したデータを所定の方式に変換して、選択されたアプリケーション通信部121、UI処理部123、音声ランチャ制御部124、ユーザ辞書制御部125、または認識テスト処理部126のいずれかに変換したデータを供給する。
【0064】
音声ランチャ制御部124は、グラフィカルなユーザインターフェースを表示させて使用者により入力された、アプリケーションプログラム(電子メールプログラム54A、ワードプロセッサプログラム106、または表計算プログラム107)の起動に関する設定をランチャ設定データベース113に保存させるとともに、その設定に基づき、認識単語・文法データベース115に記憶されている音声認識する単語または文法に関する設定を更新させる。
【0065】
音声ランチャ制御部124は、エンジン通信部122からランチャに関するデータを受信したとき、ランチャ設定データベース113に記憶されている起動に関する設定に基づき、電子メールプログラム54A、ワードプロセッサプログラム106、または表計算プログラム107のいずれかを起動させ、電子メールプログラム54Aにメールアドレスなどを供給する。
【0066】
音声コマンダ102は、フォーカスの状態にかかわらず(いずれのプログラムがアクティブであっても)、電子メールプログラム54A、ワードプロセッサプログラム106、または表計算プログラム107のいずれかを起動させるコマンドを実行することができる。
【0067】
このような、フォーカスの状態などにかかわらず、常に実行することができる、例えば、電子メールプログラム54A、ワードプロセッサプログラム106、または表計算プログラム107のいずれかを起動させるコマンドをグローバルなコマンドと称する。
【0068】
ユーザ辞書制御部125は、グラフィカルなユーザインターフェースを表示させ使用者により入力された、認識する音声に関する設定を辞書設定データベース114に記憶させるとともに、その設定に基づき、認識単語・文法データベース115に記憶されている音声認識する単語または文法に関する設定を更新させる。
【0069】
認識テスト処理部126は、使用者によりテストを実行する旨がユーザ辞書制御部125に入力されたとき、グラフィカルなユーザインターフェースを表示させて、辞書設定データベース114に記憶され、選択されている所定の1の単語と、エンジン通信部122を介して、音声認識エンジン101から供給された、音声を認識した結果を示す単語とが一致するか否かを判定し、その判定の結果を表示する。
【0070】
また、認識テスト処理部126は、使用者によりテストを実行する旨がユーザ辞書制御部125に入力されたとき、グラフィカルなユーザインターフェースを表示させて、エンジン通信部122を介して、音声認識エンジン101から供給された、音声を認識した結果を示す単語が、辞書設定データベース114に記憶され、選択されている所定の1以上の単語に含まれるか否かを判定し、その判定の結果を表示する。
【0071】
図11は、所定の入力に対応した、UI処理部123の状態の遷移を説明する状態遷移図である。図11において、()で囲まれた文は、状態の遷移の条件(例えば、プログラムの起動、エンジン起動完了など)を示し、[]で囲まれた文は、状態の遷移に伴って実行される処理(例えば、起動中の旨表示、認識単語・文法設定など)を示す。
【0072】
音声コマンダ102が起動されると、UI処理部123は、LCD21に起動中を示す画像を表示させるとともに、図12に示す音声コマンダ102のウィンドウを表示させ、音声認識エンジン101の起動を待つ状態1に遷移する。
【0073】
音声コマンダウィンドウ151は、レベルゲージ161、認識結果表示部162、表示切り換えボタン163、ランチャ設定ボタン164、辞書管理ボタン165、ヘルプボタン166、最小化ボタン167、閉じるボタン168、認識状態表示部169、および音声入力モード切り換えボタン170を有する。
【0074】
レベルゲージ161は、マイクロフォン24を介して入力された使用者の音声のレベル(マイクロフォン24が出力する信号の振幅)を表示する。認識結果表示部162は、エンジン通信部122から供給された認識された音声に対応する単語または文を表示する。
【0075】
表示切り換えボタン163は、音声コマンダウィンドウ151を図示せぬ小型のウィンドウに切り換えるとき、操作される。ランチャ設定ボタン164は、電子メールプログラム54A、ワードプロセッサプログラム106、または表計算プログラム107の起動に関する設定をするとき、操作される。
【0076】
辞書管理ボタン165は、認識する音声に関する設定を辞書設定データベース114に記憶させるとき、操作される。ヘルプボタン166は、オンラインヘルプをLCD21に表示させるとき、操作される。最小化ボタン167は、音声コマンダウィンドウ151をLCD21から消去し、例えば、タスクトレイ上に所定のアイコンを表示させるとき、操作される。閉じるボタン168は、音声コマンダ102を終了させるとき、操作される。
【0077】
認識状態表示部169は、音声認識エンジン101の状態またはローカルコマンドが使用できるか否か(所定のプログラムがアクティブであるか否か)などを表示する。音声入力モード切り換えボタン170は、常時認識モードと通常の認識モードとを切り換えるときに、操作される。
【0078】
状態1において、音声認識エンジン101の起動が失敗したとき、UI処理部123は終了する。
【0079】
状態1において、音声認識エンジン101の起動が成功したとき、UI処理部123は、ユーザの操作を待つ状態2に遷移する。
【0080】
状態2において、閉じるボタン168がクリックされたとき、UI処理部123は、音声コマンダ102を終了させる。状態2において、使用者が音声認識に割り当てているキー(例えば、キーボード4のコントロールキーなど。以下、認識キーと称する)が押圧されたとき、UI処理部123は、音声入力可能な状態3に遷移する。
【0081】
状態2から状態3に遷移するとき、UI処理部123は、アプリケーション通信部121から静止画撮影プログラム103、静止画閲覧プログラム104、および電子ペットプログラム105の内、アクティブであるプログラムを示すデータを受信し、アクティブであるプログラムの名称を音声コマンダウィンドウ151の認識状態表示部169に表示させる。静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれもアクティブでないとき、UI処理部123は、音声コマンダウィンドウ151の認識状態表示部169にその旨(例えば、”Global Command”など)を表示させる。
【0082】
状態3において、使用者がマイクロフォン24から入力させた音声に対応する信号が音声認識エンジン101に供給され、音声認識エンジン101に供給された音声に対応する信号のレベルに対応するデータが、エンジン通信部122を介して、UI処理部123に供給される。状態3において、UI処理部123は、音声に対応する信号のレベルに対応するデータに基づき、音声コマンダウィンドウ151のレベルゲージ161の表示を更新する。
【0083】
また、状態3において、音声認識エンジン101が音声を認識したとき、UI処理部123は、音声認識エンジン101から認識した単語または文などのデータを受信し、音声コマンダウィンドウ151の認識結果表示部162に認識した単語または文を表示させる。
【0084】
状態3において、使用者が認識キーの押圧を続けると、UI処理部123は、状態3における処理を繰り返す。
【0085】
状態3において、使用者が認識キーを離したとき、UI処理部123は、アプリケーション通信部121または音声ランチャ制御部124に、音声認識エンジン101から供給された、コード番号、認識した単語または文、および認識した単語に関連する文字列のデータに対応する、所定の動作(例えば、電子メールプログラム54Aの起動など)を要求する。
【0086】
このとき、アプリケーション通信部121は、UI処理部123からの要求に対応して、静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のいずれかを起動させ、または静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のいずれかに所定のコマンドを送信する。
【0087】
このとき、音声ランチャ制御部124は、UI処理部123からの要求に対応して、電子メールプログラム54A、ワードプロセッサプログラム106、若しくは表計算プログラム107のいずれかを起動させ、または電子メールプログラム54Aに所定のデータ(例えば、メールアドレスなど)を供給する。
【0088】
アプリケーション通信部121または音声ランチャ制御部124が所定のプログラムに対して、所定の動作を完了させたとき、アプリケーション通信部121または音声ランチャ制御部124はUI処理部123にその旨を通知し、UI処理部123は、動作の対象となる所定のプログラムに応じて、動作の対象となる所定のプログラムを使用者に認識させる画像(後述する)をLCD21に表示させる。
【0089】
LCD21に動作の対象となる所定のプログラム認識させる画像が表示されるので、使用者は、音声の認識の結果、および音声コマンダ102の動作を知ることができる。
【0090】
状態3から状態2に遷移するとき、UI処理部123は、認識状態表示部169の表示を消去する。
【0091】
状態2において、音声入力モード切り換えボタン170がクリックされたとき、UI処理部123は、常時認識モードである状態4に遷移する。
【0092】
状態2から状態4に遷移するとき、UI処理部123は、アプリケーション通信部121から静止画撮影プログラム103、静止画閲覧プログラム104、および電子ペットプログラム105の内、アクティブであるプログラムを示すデータを受信し、アクティブであるプログラムの名称を認識状態表示部169に表示させる。静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれもアクティブでないとき、UI処理部123は、音声コマンダウィンドウ151の認識状態表示部169にその旨(例えば、”Global Command”など)を表示させる。
【0093】
状態4において、使用者がマイクロフォン24から入力させた音声に対応する信号が音声認識エンジン101に供給され、音声認識エンジン101に供給された音声に対応する信号のレベルに対応するデータが、エンジン通信部122を介して、UI処理部123に供給される。状態4において、UI処理部123は、音声に対応する信号のレベルに対応するデータに基づき、音声コマンダウィンドウ151のレベルゲージ161の表示を更新する。
【0094】
また、状態4において、音声認識エンジン101が音声を認識したとき、UI処理部123は、音声認識エンジン101から認識した単語または文などのデータを受信し、音声コマンダウィンドウ151の認識結果表示部162に認識した単語または文を表示させる。
【0095】
状態4において、UI処理部123が、音声認識エンジン101から認識した単語または文などのデータを受信したとき、UI処理部123は、アプリケーション通信部121または音声ランチャ制御部124に、音声認識エンジン101から供給された、コード番号、認識した単語または文、および認識した単語に関連する文字列のデータに対応する、所定の動作を要求する。
【0096】
このとき、アプリケーション通信部121は、UI処理部123からの要求に対応して、静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のいずれかを起動させ、または静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のいずれかに所定のコマンドを送信する。
【0097】
このとき、音声ランチャ制御部124は、UI処理部123からの要求に対応して、電子メールプログラム54A、ワードプロセッサプログラム106、若しくは表計算プログラム107のいずれかを起動させ、または電子メールプログラム54Aに所定のデータ(例えば、メールアドレスなど)を供給する。
【0098】
アプリケーション通信部121または音声ランチャ制御部124が所定のプログラムに対して、所定の動作を完了させたとき、アプリケーション通信部121または音声ランチャ制御部124はUI処理部123にその旨を通知し、UI処理部123は、動作の対象となる所定のプログラムに応じて、動作の対象となる所定のプログラムを使用者に認識させる画像(後述する)をLCD21に表示させる。
【0099】
状態4においては、音声コマンダ2は、認識キーに対する操作に係わらず、音声認識エンジンが所定の音声を認識したとき、静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のいずれかを起動させ、若しくは静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のいずれかに所定のコマンドを送信し、または電子メールプログラム54A、ワードプロセッサプログラム106、若しくは表計算プログラム107のいずれかを起動させ、若しくは電子メールプログラム54Aに所定のデータを供給する。
【0100】
状態4において、音声入力モード切り換えボタン170がクリックされたとき、UI処理部123は、状態2に遷移する。
【0101】
状態2において、静止画撮影プログラム103に静止画像を撮影する操作が加えられたとき(例えば、シャッタボタン10が押圧されたなど)、UI処理部123は、静止画像に添付するコメントを入力する状態5に遷移する。
【0102】
状態5において、使用者がマイクロフォン24から入力させた音声に対応する信号が音声認識エンジン101に供給され、音声認識エンジン101に供給された音声に対応する信号のレベルに対応するデータが、エンジン通信部122を介して、UI処理部123に供給される。状態5において、UI処理部123は、音声に対応する信号のレベルに対応するデータに基づき、音声コマンダウィンドウ151のレベルゲージ161の表示を更新する。
【0103】
また、状態5において、音声認識エンジン101が音声を認識したとき、UI処理部123は、音声認識エンジン101から認識した単語または文などのデータを受信し、LCD21に表示されている、コメントを添付する画像に対応する所定のダイアログなどに認識した単語または文を表示させる。
【0104】
状態5において、UI処理部123は、アプリケーション通信部121に、音声認識エンジン101から供給された、認識した単語または文を送信する。アプリケーション通信部121は、静止画撮影プログラム103に認識した単語または文を送信し、静止画撮影プログラム103に認識した単語または文を画像のコメントとして保存させる。
【0105】
状態5において、アプリケーション通信部121を介して、静止画撮影プログラム103からコメントの入力を終了させる操作(例えば、シャッタボタン10が離されたなど)を示すデータがUI処理部123に入力されたとき、UI処理部123は、状態2に遷移する。
【0106】
状態2において、音声コマンダウィンドウ151の辞書管理ボタン165がクリックされると、UI処理部123は、辞書を設定する状態6に遷移し、ユーザ辞書制御部125に辞書の設定の処理を要求する。
【0107】
状態6において、ユーザ辞書制御部125は、辞書設定用のダイアログをLCD21に表示させ、辞書設定用のダイアログへの操作に基づき、辞書設定データベース114および認識単語・文法データベース115に記憶されている設定を更新する。
【0108】
状態6において、辞書設定用のダイアログに配置されているテストボタンがクリックされると、UI処理部123は、音声認識テストを実行するする状態8に遷移し、認識テスト処理部126に音声認識テストの処理を要求する。
【0109】
認識テスト処理部126は、音声認識テストのダイアログをLCD21に表示させ、エンジン通信部122を介して、音声認識エンジン101から供給された、音声を認識した単語が、辞書設定データベース114に登録されている単語と一致するか否かを判定する音声認識のテストを実行し、その結果を表示する。
【0110】
または、認識テスト処理部126は、音声認識テストのダイアログをLCD21に表示させ、エンジン通信部122を介して、音声認識エンジン101から供給された認識した単語が、辞書設定データベース114に登録されている単語に含まれているか否かを判定する音声認識のテストを実行し、その結果を表示する。
【0111】
状態8において、音声認識テストのダイアログに配置されているテストボタンがクリックされると、UI処理部123は、状態6に遷移する。
【0112】
状態6において、辞書設定用のダイアログに配置されている閉じるボタンがクリックされると、UI処理部123は、状態2に遷移する。
【0113】
状態2において、音声コマンダウィンドウ151のランチャ設定ボタン164がクリックされると、UI処理部123は、音声ランチャ制御部124の電子メールプログラム54A、ワードプロセッサプログラム106、または表計算プログラム107を起動する設定を行う状態7に遷移し、音声ランチャ制御部124にプログラムの起動の設定の処理を要求する。
【0114】
状態7において、音声ランチャ制御部124は、ランチャ設定用のダイアログをLCD21に表示させ、ランチャ設定用のダイアログへの操作に基づき、ランチャ設定データベース113に記憶されている設定を更新する。
【0115】
状態7において、ランチャ設定用のダイアログに配置されているテストボタンがクリックされると、UI処理部123は、音声認識テストを実行する状態9に遷移し、認識テスト処理部126に音声認識テストの処理を要求する。
【0116】
認識テスト処理部126は、音声認識テストのダイアログをLCD21に表示させ、エンジン通信部122を介して、音声認識エンジン101から供給された認識した単語または文に、ランチャ設定データベース113に登録されている単語が含まれ、認識した単語または文が設定されている文法に一致するか否かを判定する音声認識のテストを実行し、その結果を表示する。
【0117】
状態9において、音声認識テストのダイアログに配置されているテストボタンがクリックされると、UI処理部123は、状態7に遷移する。
【0118】
状態7において、ランチャ設定用のダイアログに配置されている閉じるボタンがクリックされると、UI処理部123は、状態2に遷移する。
【0119】
図13は、所定の入力に対応した、エンジン通信部122の状態の遷移を説明する状態遷移図である。図13において、()で囲まれた文は、状態の遷移の条件(例えば、プログラムの起動、起動の終了通知など)を示し、[]で囲まれた文は、状態の遷移に伴って実行される処理(例えば、処理結果通知、認識結果転送など)を示す。
【0120】
音声コマンダ102が起動されると、エンジン通信部122は、音声認識エンジン101を起動し、音声認識エンジン101の起動を待つ状態11に遷移する。状態11において、初期化に失敗すると、エンジン通信部122は、その結果をUI処理部123に送信する。初期化に失敗した旨を受信したUI処理部123は、音声コマンダ102を終了させるので、初期化に失敗したとき、エンジン通信部122は、終了する。
【0121】
状態11において、音声認識エンジン101の起動の結果をUI処理部123に通知したとき、エンジン通信部122は、イベント待ちの状態12に遷移する。
【0122】
使用者が認識キー(例えば、コントロールキー)を押圧すると、UI処理部123がその旨のデータをエンジン通信部122に送信するので、状態11において、エンジン通信部122は、使用者が認識キーを押圧した旨のデータを受信したとき、アプリケーション通信部121から静止画撮影プログラム103、静止画閲覧プログラム104、および電子ペットプログラム105の内、アクティブであるプログラムを示すデータを受信し、そのデータに対応した単語および文法を示すデータを認識単語・文法データベース115から読み出す。
【0123】
エンジン通信部122は、アクティブであるプログラムに対応した単語および文法を示すデータ、または静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のコマンドなどに関するデータを適宜変換して、音声認識エンジン101に送信して、音声認識エンジン101から音声認識の結果を示すデータを受信できる状態13に遷移する。
【0124】
状態13において、エンジン通信部122は、使用者がマイクロフォン24から入力させた音声に対応する信号を受信した音声認識エンジン101が生成する、信号のレベルに対応するデータを受信して、UI処理部123に供給する。UI処理部123は、音声に対応する信号のレベルに対応するデータに基づき、音声コマンダウィンドウ151のレベルゲージ161の表示を更新する。
【0125】
使用者がマイクロフォン24に向かって音声を発すると、音声認識エンジン101が、それを検知して、音声を検出した旨のデータをエンジン通信部122に送信する。状態13において、エンジン通信部122は、音声を検出した旨のデータを受信すると、そのデータをUI処理部123に転送するとともに、状態14に遷移する。
【0126】
状態14において、エンジン通信部122は、使用者がマイクロフォン24から入力させた音声に対応する信号を受信した音声認識エンジン101が生成する、信号のレベルに対応するデータを受信して、UI処理部123に供給する。UI処理部123は、音声に対応する信号のレベルに対応するデータに基づき、音声コマンダウィンドウ151のレベルゲージ161の表示を更新する。
【0127】
状態14において、エンジン通信部122は、音声認識エンジン101から認識した単語または文などのデータを受信したとき、そのデータをUI処理部123に供給する。UI処理部123は、認識した単語または文などのデータを基に、LDC21に表示する画像または文字などを更新する。
【0128】
状態14において、エンジン通信部122は、音声認識エンジン101から受信した、認識した単語または文などのデータが、静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のいずれかの起動、または静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のいずれかにコマンドに対応すると判定したとき、認識した単語または文などのデータをアプリケーション通信部121に供給する。
【0129】
状態14において、エンジン通信部122は、音声認識エンジン101から受信した、認識した単語または文などのデータが、電子メールプログラム54A、ワードプロセッサプログラム106、若しくは表計算プログラム107のいずれかの起動、または電子メールプログラム54Aに供給すべきデータに対応すると判定したとき、認識した単語または文などのデータを音声ランチャ制御部124に供給する。
【0130】
状態14において、認識した単語または文などのデータをアプリケーション通信部121または音声ランチャ制御部124に供給したとき、エンジン通信部122は、状態12に遷移する。
【0131】
図14は、所定の入力に対応した、アプリケーション通信部121の状態の遷移を説明する状態遷移図である。
【0132】
アプリケーション通信部121は、音声コマンダ102の起動とともに、状態21に遷移する。状態21において、音声コマンダ102が終了したとき、アプリケーション通信部121は、終了する。
【0133】
アプリケーション通信部121は、動作しているとき、常に状態21にあり、ウィンドウのフォーカスが変化したとき、または所定の時間が経過したとき、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105が起動されているか否か、またはいずれがアクティブになっているかを調べて、アプリケーション通信部121内部に記憶されている所定のデータを更新する。
【0134】
また、アプリケーション通信部121は、UI処理部123またはエンジン通信部122から要求があったとき、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105が起動されているか否か、または、いずれがアクティブになっているか(いずれもアクティブでない場合、それを示すデータ含む)を示すデータをUI処理部123またはエンジン通信部122に送信する。
【0135】
状態21において、エンジン通信部122から認識した単語または文などのデータを受信したとき、アプリケーション通信部121は、図47で後述するフローチャートに示す手順に従って、静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105を起動させ、静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105のいずれかをアクティブにし、または静止画撮影プログラム103、静止画閲覧プログラム104、若しくは電子ペットプログラム105に所定のコマンドを供給する。
【0136】
また、状態21において、静止画撮影プログラム103からコメントの入力させる、または終了させる操作(例えば、シャッタボタン10が押圧された、または離されたなど)を示すデータが入力されたとき、アプリケーション通信部121は、UI処理部123にそのデータを転送する。
【0137】
次に、パーソナルコンピュータ1のLCD21に表示する画面について説明する。図15は、音声コマンダ102、音声認識エンジン101、および静止画撮影プログラム103が起動しているとき、LCD21に表示される画面を示す図である。
【0138】
LCD21の画面の所定の位置に、電子メールプログラム54Aに対応するアイコン191、ワードプロセッサプログラム106に対応するアイコン192、表計算プログラム107に対応するアイコン193、音声コマンダウィンドウ151、および静止画撮影プログラム103が表示させるウィンドウ194が配置される。
【0139】
スティック式ポインティングデバイス5などを操作してアイコン191を選択して、起動コマンドを実行する(図示せぬメニューなどから選択するなどの操作をする)と、電子メールプログラム54Aが起動される。アイコン192を選択して、起動コマンドを実行すると、ワードプロセッサプログラム106が起動される。アイコン193を選択して、起動コマンドを実行すると、表計算プログラム107が起動される。
【0140】
静止画撮影プログラム103が表示させるウィンドウ194は、CCDビデオカメラ23が撮像している画像を表示する画像表示領域195およびエフェクトボタン196などを有する。
【0141】
図15に示す状態からパーソナルコンピュータ1のシャッタボタン10を押圧すると、静止画撮影プログラム103は、CCDビデオカメラ23が撮像ている画像を基に、所定の形式(例えば、JPEG(Joint Photographic Experts Group)など)の静止画像のデータを生成して、そのデータを格納したファイルを生成して、生成したファイルをHDD56に記録させるとともに、静止画閲覧プログラム104を起動させる。
【0142】
パーソナルコンピュータ1のシャッタボタン10を押圧したまま、使用者がマイクロフォン24に音声(例えば、”パパと八丈島で”)を入力すると、UI処理部123は、状態5に遷移して、アプリケーション通信部122を介して、音声認識エンジン101から供給された、認識された単語または文を受信して、アプリケーション通信部121を介して受信した単語または文を静止画撮影プログラム103に出力する。
【0143】
静止画撮影プログラム103は、静止画像のファイルの、例えば、ヘッダの所定の位置に、受信した単語または文をコメントとして貼付する。
【0144】
パーソナルコンピュータ1のシャッタボタン10が離されたとき、UI処理部123は、状態2に遷移するので、音声の認識の処理は終了する。
【0145】
なお、静止画像のファイルへのコメントの貼付は、静止画閲覧プログラム104が実行するようにしてもよい。
【0146】
図16に示すように、静止画閲覧プログラム104は、生成したファイルに格納されている静止画像を表示させる。静止画閲覧プログラム104が表示させるウィンドウ201は、生成したファイルの静止画像を表示させる画像表示領域203、貼付された単語または文を表示させるコメント入力ダイアログ202、メールと名前が付されたボタン204などを有する。
【0147】
次に、静止画像のファイルに添付する単語を登録するダイアログについて説明する。図17は、音声コマンダウィンドウ151の辞書管理ボタン165をクリックしたとき、ユーザ辞書制御部125がLCD21に表示させる辞書管理ダイアログを示す図である。
【0148】
辞書管理ダイアログには、呼び名(音声認識エンジン101に認識させる単語または文)に対応するメールアドレスを表示させるときクリックされるメールアドレスと名前が付されたタブ221、呼び名に対応する人名を表示させるときクリックされる人名と名前が付されたタブ222、呼び名に対応する地名を表示させるときクリックされる地名と名前が付されたタブ223、呼び名に対応する都道府県名を表示させるときクリックされる都道府県と名前が付されたタブ224、および呼び名に対応するURLを表示させるときクリックされるURLと名前が付されたタブ225が配置されている。
【0149】
図17に示す例では、タブ222がクリックされ、呼び名表示フィールド226には、辞書設定データベース114に記憶されている、人名のカテゴリに属する、呼び名および呼び名に対応する登録語(音声認識が成功したとき、コメントとして入力される単語)が表示されている。例えば、呼び名”パパ”に対する登録語は、”パパ”である。”かおりちゃん”または”かおりん”のいずれかが認識されたとき、コメントとして入力される登録語は、”かおりちゃん”である。呼び名”隣のお姉さん”に対する登録語は、”隣のお姉さん”である。
【0150】
辞書管理ダイアログには、状態8に遷移するためのテストボタン227および登録ボタン228が配置されている。
【0151】
登録ボタン228がクリックされたとき、ユーザ辞書制御部125は、図18に示す新規登録ダイアログをLCD21に表示させる。新規登録ダイアログは、呼び名を入力するための呼び名入力フィールド241、および登録語を入力するための登録語入力フィールド242を有する。呼び名入力フィールド241に所定の呼び名を入力して、登録語入力フィールド242に呼び名に対応する登録語を入力して、OKと名前が付されたボタンをクリックすれば、呼び名入力フィールド241に入力された呼び名、および登録語入力フィールド242に登録語(呼び名に対応する)は、辞書設定データベース114に記憶される。
【0152】
新規登録ダイアログのテストと名前が付されたボタン243をクリックすると、UI処理部123は、状態8に遷移して、認識テスト処理部126は、図19に示す新規登録単語テストダイアログを表示させる。
【0153】
新規登録単語テストダイアログは、呼び名入力フィールド241、所定のメッセージを表示するメッセージフィールド252、およびテスト結果表示フィールド253を有する。使用者がマイクロフォン24に向かって音声を入力すると(マイクロフォン24に向かって呼び名を喋ると)、認識テスト処理部126は、音声認識エンジン101が認識した音声と、呼び名入力フィールド241に入力した単語とが一致したか否かを判定し、その結果をテスト結果表示フィールド253に表示する。
【0154】
図19に示す、テスト結果表示フィールド253の例は、使用者がマイクロフォン24に向かって”おねえちゃん”と入力し、音声認識エンジン101が”おねえちゃん”を認識して、認識テスト処理部126が、音声認識エンジン101が認識した”おねえちゃん”と、呼び名入力フィールド241に入力されている”おねえちゃん”とが一致したと判定したとき、表示される例である。
【0155】
音声認識エンジン101が認識した音声と、呼び名入力フィールド241に入力した単語とが一致しないと判定された場合、例えば、認識テスト処理部126は、テスト結果表示フィールド253に音声認識エンジン101が認識した音声に対応するテキスト、および一致しないことを示すメッセージ(例えば、”NG”など)を表示させる。
【0156】
新規登録単語テストダイアログのテスト中と名前が付されたボタン251がクリックされたとき、UI処理部123は、状態6に遷移して、ユーザ辞書制御部125に辞書管理ダイアログを表示させる。
【0157】
辞書管理ダイアログのテストボタン227がクリックされたとき、UI処理部123は、状態8に遷移して、認識テスト処理部126は、図20に示す登録単語テストダイアログを表示する。
【0158】
登録単語テストダイアログは、タブ221、タブ222、タブ223、タブ224、タブ225、および呼び名表示フィールド226に加えて、所定のメッセージを表示するメッセージフィールド272、およびテスト結果表示フィールド273を有する。
【0159】
登録単語テストダイアログが表示されている状態において、使用者がマイクロフォン24に向かって音声を入力すると(マイクロフォン24に向かって呼び名を喋ると)、認識テスト処理部126は、呼び名表示フィールド226に表示されているいずれかの単語と、音声認識エンジン101が認識した単語とが一致したか否かを判定し、呼び名表示フィールド226に表示されているいずれかの単語と、音声認識エンジン101が認識した単語とが一致した場合、呼び名表示フィールド226に表示されている一致した単語をハイライトにして表示させる。
【0160】
音声認識エンジン101が認識した単語が、呼び名表示フィールド226に表示されているいずれの単語とも一致しないと判定された場合、認識テスト処理部126は、例えば、テスト結果表示フィールド273に音声認識エンジン101が認識した音声に対応するテキスト、および一致しないことを示すメッセージ(例えば、”NG”など)を表示させる。
【0161】
登録単語テストダイアログのテスト中と名前が付されたボタン271がクリックされたとき、UI処理部123は、状態6に遷移して、ユーザ辞書制御部125に辞書管理ダイアログを表示させる。
【0162】
辞書管理ダイアログのタブ223がクリックされたとき、ユーザ辞書制御部125は、図21に示すように、呼び名表示フィールド281に、辞書設定データベース114に記憶されている、地名のカテゴリに属する、呼び名および呼び名に対応する登録語(音声認識が成功したとき、コメントとして入力される単語)を表示させる。例えば、呼び名”八丈島”または”八丈”に対する登録語は、”八丈島”である。呼び名”東京タワー”に対する登録語は、”東京タワー”である。”野球場”または”球場”のいずれかが認識されたとき、コメントとして入力される登録語は、”野球場”である。
【0163】
図16に示すように、静止画閲覧プログラム104が、所定の静止画像を表示させている状態から、メールと名前が付されたボタン204をクリックすると、静止画閲覧プログラム104は、電子メールプログラム54Aが起動していないとき、電子メールプログラム54Aを起動させる。
【0164】
静止画閲覧プログラム104は、電子メールプログラム54Aに新規のメールを生成させる。静止画像閲覧プログラム104は、生成させた新規のメールに静止画像のファイル(表示している静止画像に対応する)を添付する。
【0165】
更に、静止画像閲覧プログラム104は、添付した静止画像ファイルに格納されているコメントを、新規のメールの本文に貼付させる。
【0166】
図22は、静止画像閲覧プログラム104が、電子メールプログラム54Aに新規のメッセージを生成させたとき、電子メールプログラム54AがLCD21に表示させるメッセージウィンドウ301を説明する図である。
【0167】
添付ファイル表示フィールド312には、添付された静止画像のファイルのファイル名が表示される。本文表示フィールド313には、添付した静止画像ファイルに格納されているコメントから貼付された新規のメッセージの本文が表示される。
【0168】
宛先フィールド311に、所定のメールアドレスが入力され、メッセージウィンドウ301の送信と名前が付されたボタンがクリックされたとき、メッセージウィンドウ301に表示されたメッセージは、宛先フィールド311に設定されたメールアドレス宛てに、インターネット92を介して、送信される。
【0169】
次に、音声コマンダ102が電子メールプログラム54Aを起動させて、電子メールプログラム54Aに所定のメールアドレスが設定されたメールを生成させる処理について説明する。音声コマンダ102が起動している状態で、認識キーを押圧したまま、マイクロフォン24に、例えば、”姉さんにメール”と音声を入力すると、音声認識エンジン101は、”姉さんにメール”に対応する所定のデータを音声コマンダ102に供給する。
【0170】
図23に示すように、UI処理部123は、音声コマンダウィンドウ151から画面全体に向かって広がるように(図中の点線の矢印(点線の矢印は、説明のための矢印で、実際には表示されない)で示す方向に向かって)、LCD21に波紋状の画像を表示させる。
【0171】
次に、図24に示すように、UI処理部123は、画面全体から電子メールプログラム54Aに対応するアイコン191に向かって収束するように(図中の点線の矢印(点線の矢印は、説明のための矢印で、実際には表示されない)で示す方向に向かって)、LCD21に波紋状の画像を表示させる。
【0172】
そして、図25に示すように、UI処理部123は、電子メールプログラム54Aに対応するアイコン191を強調表示させる。電子メールプログラム54Aが起動していないとき、音声コマンダ102のアプリケーション通信部12は、静止画像閲覧プログラム104に、電子メールプログラム54Aを起動させる。
【0173】
その後、図26に示すように、音声ランチャ制御部124は、電子メールプログラム54Aに、新規のメッセージを生成させ、電子メールプログラム54Aは、新規のメッセージをメッセージウィンドウ301に表示させる。音声ランチャ制御部124は、電子メールプログラム54Aに、新規のメッセージのメールアドレスとして、エンジン通信部122を介して、音声認識エンジンから供給された、”姉さんにメール”の”姉さん”に対応するメールアドレスを設定させる。
【0174】
新規のメッセージを表示するメッセージウィンドウ301の宛先フィールド311には、”姉さんにメール”の”姉さん”に対応して設定したメールアドレス(例えば、ane@home.zzz)が表示される。
【0175】
図27は、辞書管理ダイアログのメールアドレスと名前が付されたタブ221がクリックされたとき、辞書管理ダイアログの例を示す図である。呼び名表示フィールド351には、ランチャ設定データベース113に記憶されている、メールアドレスのカテゴリに属する、呼び名および呼び名に対応する登録語(音声認識が成功したとき、メールアドレスとして設定されるテキスト)が表示されている。例えば、呼び名”パパ”に対する登録語は、”daddy@nowhere.xxx”である。”兄さん”が認識されたとき、メールアドレスとして設定される登録語は、”ani@home.yyy”である。呼び名”姉さん”に対する登録語は、”ane@home.zzz”である。
【0176】
次に、音声コマンダ102が静止画撮影プログラム103に所定のコマンドを供給するときの画面の表示について説明する。静止画撮影プログラム103が表示させるウィンドウ194のエフェクトボタン196をクリックすると、図28に示すエフェクト設定ダイアログ371がLDC21に表示される。
【0177】
エフェクト設定ダイアログ371のエフェクト選択フィールド372から所定のエフェクトを選択すると、静止画撮影プログラム103は、CCDビデオカメラ23が撮像した画像に選択されたエフェクトをかける。
【0178】
例えば、エフェクト設定ダイアログ371で”モザイク”を選択すると、静止画撮影プログラム103は、CCDビデオカメラ23が撮像した画像にいわゆる”モザイク”エフェクトをかけ、”モザイク”エフェクトをかけた画像を画像表示領域195に表示させる。エフェクト設定ダイアログ371で”ネガポジ反転”を選択すると、静止画撮影プログラム103は、CCDビデオカメラ23が撮像した画像にいわゆる”モザイク”エフェクトをかけ、”ネガポジ反転”エフェクトをかけた画像を画像表示領域195に表示させる。
【0179】
図29に示すように、静止画撮影プログラム103がアクティブで、音声コマンダウィンドウ151および静止画撮影プログラム103が表示させるウィンドウ194がLCD21に表示されている場合、認識キーを押圧したまま、マイクロフォン24に、例えば、”モザイク”と音声を入力すると、音声認識エンジン101は、”モザイク”に対応するコマンドを示すデータを音声コマンダ102に供給する。
【0180】
図30に示すように、UI処理部123は、音声コマンダウィンドウ151から画面全体に向かって広がるように(図中の点線の矢印(点線の矢印は、説明のための矢印で、実際には表示されない)で示す方向に向かって)、LCD21に波紋状の画像を表示させる。
【0181】
図31に示すように、UI処理部123は、画面全体からウィンドウ194に向かって収束するように(図中の点線の矢印(点線の矢印は、説明のための矢印で、実際には表示されない)で示す方向に向かって)、LCD21に波紋状の画像を表示させる。
【0182】
そして、図32に示すように、UI処理部123は、静止画撮影プログラム103が表示させるウィンドウ194を強調表示させる。
【0183】
音声コマンダ102は、”モザイク”に対応するコマンドを示すデータを基に、静止画撮影プログラム103に”モザイク”に対応するコマンドを送信する。図33に示すように、静止画撮影プログラム103は、音声コマンダ102から”モザイク”に対応するコマンドを受信して、CCDビデオカメラ23が撮像した画像にいわゆる”モザイク”エフェクトをかけ、”モザイク”エフェクトをかけた画像を画像表示領域195に表示させる。
【0184】
次に、音声コマンダ102がワードプロセッサプログラム106を起動させる処理について説明する。図34に示すように、音声コマンダ102が起動している状態で、認識キーを押圧したまま、マイクロフォン24に、例えば、”ワープロ”と音声を入力すると、音声認識エンジン101は、”ワープロ”に対応する所定のデータを音声コマンダ102に供給する。
【0185】
図35に示すように、UI処理部123は、音声コマンダウィンドウ151から画面全体に向かって広がるように(図中の点線の矢印(点線の矢印は、説明のための矢印で、実際には表示されない)で示す方向に向かって)、LCD21に波紋状の画像を表示させる。
【0186】
図36に示すように、UI処理部123は、画面全体からワードプロセッサプログラム106に対応するアイコン192に向かって収束するように(図中の点線の矢印(点線の矢印は、説明のための矢印で、実際には表示されない)で示す方向に向かって)、LCD21に波紋状の画像を表示させる。
【0187】
そして、図37に示すように、UI処理部123は、ワードプロセッサプログラム106に対応するアイコン192を強調表示させる。
【0188】
音声コマンダ102の音声ランチャ制御部124は、ワードプロセッサプログラム106を起動させる。ワードプロセッサプログラム106は、所定のウィンドウ391をLCD21に表示させる。ワードプロセッサプログラム106が表示させるウィンドウ391には、文書ファイルを表示させる表示領域392が配置される。
【0189】
マイクロフォン24に、例えば、”ワープロ”と音声を入力して、音声コマンダ102の音声ランチャ制御部124にワードプロセッサプログラム106を起動させたとき、音声ランチャ制御部124は、ワードプロセッサプログラム106のみを起動させる。このとき、ワードプロセッサプログラム106は新規の文書を生成して、新規の文書を表示領域392に表示させる。
【0190】
マイクロフォン24に、例えば、”ワープロで手紙”と音声を入力して、音声コマンダ102の音声ランチャ制御部124にワードプロセッサプログラム106を起動させたとき、音声ランチャ制御部124は、”手紙”に対応する文書ファイルをワードプロセッサプログラム106に開かせる。このとき、図39に示すように、ワードプロセッサプログラム106は”手紙”に対応する文書ファイルに対応する文字または画像を、表示領域392に表示させる。
【0191】
同様に、マイクロフォン24に、例えば、”表計算”と音声を入力して、音声コマンダ102の音声ランチャ制御部124に表計算プログラム107を起動させたとき、音声ランチャ制御部124は、表計算プログラム107のみを起動させる。音声ランチャ制御部124が表計算プログラム107を起動させときも、UI処理部123は、所定の波紋状の画像の表示、およびアイコン193の強調の表示を実行する。図40に示すように、表計算プログラム107は新規の文書を生成して、新規の文書を表計算プログラム107が表示させるウィンドウ411の表示領域412に表示させる。
【0192】
マイクロフォン24に、例えば、”表計算で家計簿”と音声を入力して、音声コマンダ102の音声ランチャ制御部124に表計算プログラム107を起動させたとき、音声ランチャ制御部124は、”家計簿”に対応する文書ファイルを表計算プログラム107に開かせる。このとき、図41に示すように、表計算プログラム107は”家計簿”に対応する文書ファイルに対応する文字または画像を、表示領域412に表示させる。
【0193】
次に、起動するプログラムに対応する単語を登録するダイアログについて説明する。図42は、音声コマンダウィンドウ151のランチャ設定ボタン164をクリックしたとき、音声ランチャ制御部113がLCD21に表示させるランチャ設定ダイアログを示す図である。
【0194】
ランチャ設定ダイアログは、実行可能ファイルと名前が付されたチェックボックスがチェックされているとき、呼び名表示フィールド451に、ランチャ設定データベース113に記憶されている、呼び名および呼び名に対応する実行ファイルの名前(ディレクトリを含む)を表示する。このとき、呼び名表示フィールド451に表示される、実行ファイルの名前に対応する実行ファイルは、実行ファィルカテゴリに属すると称する。
【0195】
例えば、呼び名”ワープロ”に対する実行ファイルの名前は、”C:\ProgramFiles\ProWord”である。呼び名”表計算”に対する実行ファイルの名前は、”C:\ProgramFiles\大介”である。呼び名”お絵かき”に対する実行ファイルの名前は、”C:\ProgramFiles1\華子”である。
【0196】
ランチャ設定ダイアログは、テストと名前が付されたボタンおよび詳細と名前が付されたボタン452を有する。
【0197】
文書ファイルと名前が付されたチェックボックスがチェックされているとき、ランチャ設定ダイアログは、図43に示すように、呼び名表示フィールド451に、ランチャ設定データベース113に記憶されている、呼び名および呼び名に対応する文書ファイルの名前(ディレクトリを含む)を表示する。例えば、呼び名”家計簿”に対する文書ファイルの名前は、”C:\文書ファイル\家計簿”である。呼び名”見積り”に対する文書ファイルの名前は、”C:\文書ファイル1\見積り”である。呼び名”手紙”に対する文書ファイルの名前は、”C:\文書ファイル1\手紙”である。
【0198】
このとき、呼び名表示フィールド451に表示される、文書ファイルの名前に対応する文書ファイルは、文書ファイルカテゴリに属すると称する。
【0199】
呼び名表示フィールド451に表示されている所定の呼び名(例えば、”ワープロ”)、および呼び名に対応する実行ファイルの名前を選択して、詳細と名前が付されたボタン452をクリックすると、音声ランチャ制御部113は、図44に示すランチャ詳細設定ダイアログをLCD21に表示させる。
【0200】
ランチャ詳細設定ダイアログは、呼び名表示フィールド471に、呼び名表示フィールド451で選択された呼び名(例えば、”ワープロ”)に対応するボイス形式[実行ファイル=ワープロ]が表示される。ランチャ詳細設定ダイアログに配置された辞書参照と名前が付されたボタンなどを操作して、使用者は、実行ファイルと文書ファイルを組み合わせたボイス形式、例えば、”[実行ファイル=ワープロ]で[文書ファイル]”に定義することができる。
【0201】
音声ランチャ制御部124は、設定されたボイス形式に所定の文法番号を割り振って、ランチャ設定データベース113に記憶させる。
【0202】
使用者に設定された実行ファイルと文書ファイルを組み合わせたボイス形式は、呼び名表示フィールド471に表示される。例えば、図44に示す実行ファイルカテゴリに属するファイルと文書ファイルカテゴリに属するファイルとを組み合わせたボイス形式、”[実行ファイル=ワープロ]で[文書ファイル]”は、”[文書ファイル]”を引数としているので、音声ランチャ制御部124に”[実行ファイル=ワープロ]で[文書ファイル]”に対応する音声が認識されたデータ(例えば、”ワープロで手紙”および文法番号など)が供給されたとき、音声ランチャ制御部124は、文法番号を基に、呼び名が”ワープロ”に対応する実行ファイルカテゴリに属する実行ファイル(例えば、C:\ProgramFiles\ProWord)を開き(すなわち、ワードプロセッサプログラム106を起動して)、呼び名が設定されている文書ファイルカテゴリに属する文書ファイル(例えば、”手紙”に対応するC:\文書ファイル1\手紙)を、ワードプロセッサプログラム106に開かせる。
【0203】
同様に、例えば、音声ランチャ制御部124に、”[実行ファイル=ワープロ]で[文書ファイル]”に対応する音声が認識された”ワープロで家計簿”およびその文法番号が供給されたとき、音声ランチャ制御部124は、文法番号を基に、呼び名が”ワープロ”に対応する実行ファイルカテゴリに属する実行ファイルであるC:\ProgramFiles\ProWordを開き、文書ファイルカテゴリに属する文書ファイルであるC:\文書ファイル\家計簿を、ワードプロセッサプログラム106に開かせる。
【0204】
なお、ランチャ制御部124は、図示せぬ所定のスクリプト実行プログラムに、所定のスクリプトファイル(コマンドなどの処理手順が記述されているファイル)を実行させるようにしてもよい。更に、スクリプトファイルの引数として、所定のデータ(例えば、メールアドレスまたは画像データなど)を指定するようにしてもよい。このとき、ランチャ設定データベース113は、スクリプトファイルまたはスクリプトファイルの引数としてのデータを特定するデータ、または文法番号などを記憶する。
【0205】
次に、音声認識エンジン101、音声コマンダ102、および静止画撮影プログラム103を実行するCPU52の静止画像の撮像の処理を図45のフローチャートを参照して説明する。ステップS11において、静止画撮影プログラム103は、マイクロコントローラ61、外部バス55、および内部バス51を介して、前押しスイッチ86から供給される信号を基に、シャッタボタン10が押されたか否かを判定し、シャッタボタン10が押されていないと判定された場合、ステップS11に戻り、シャッタボタン10が押されるまで判定の処理を繰り返す。
【0206】
ステップS11において、シャッタボタン10が押されたと判定された場合、ステップS12に進み、静止画撮影プログラム103は、静止画像閲覧プログラム104を起動させる。ステップS13において、静止画像撮影プログラム103は、処理部82およびグラフィックチップ81を介して、CCDビデオカメラ23から供給された信号を基に、所定の方式の静止画像データのファイルを生成して、生成した静止画像データのファイルをHDD56に保存させる。
【0207】
ステップS14において、静止画撮影プログラム103は、シャッタボタン10が押されているか否かを判定し、シャッタボタン10が押されていると判定された場合、ステップS15に進み、音声コマンダ102は、音声認識エンジン101にマイクロフォン24から入力された信号を基に、音声認識の処理を実行させる。ステップS16において、音声コマンダ102は、音声認識エンジン101から、音声認識の処理の結果を受信する。
【0208】
ステップS17において、音声コマンダ102は、音声認識の結果を静止画撮影プログラム103に送信する。ステップS18において、音声コマンダ102は、静止画撮影プログラム103に音声認識の結果を画像ファイルのコメントとして添付させる。
【0209】
ステップS19において、音声コマンダ102は、静止画像閲覧プログラム104にコメントを表示させ、処理は終了する。
【0210】
ステップS14において、シャッタボタン10が離されたと判定された場合、ステップS15乃至ステップS19の処理は、スキップされ、処理は終了する。
【0211】
このように、使用者は、静止画撮影プログラム103で撮像した静止画像に、キーボート4などを操作することなく、簡単にコメントを貼付することができる。
【0212】
次に、音声認識エンジン101および音声コマンダ102を実行するCPU52の音声によるコマンド送信または起動の処理を図46のフローチャートを参照して説明する。ステップS31において、音声コマンダ102は、常時入力モードが選択されているか否かを判定し、常時入力モードが選択されていないと判定された場合、ステップS32に進み、認識キーが押圧されているか否かを判定する。
【0213】
ステップS32において、認識キーが押圧されていないと判定された場合、ステップS32に戻り、音声コマンダ102は、認識キーが押圧されるまで、認識キーの押圧の判定の処理を繰り返す。
【0214】
ステップS32において、認識キーが押圧されたと判定された場合、ステップS33に進み、音声コマンダ102は、音声認識エンジン101に音声認識の処理を実行させる。ステップS34において、音声コマンダ102は、音声認識エンジン101から音声認識の処理の結果を受信する。
【0215】
ステップS35において、音声コマンダ102は、音声認識エンジン101から受信した音声認識の処理の結果を表示させる。
【0216】
ステップS36において、音声コマンダ102は、認識キーが離されたか否かを判定し、認識キーが離されたと判定された場合、ステップS37に進み、コマンドの送信または起動を実行して、処理は終了する。
【0217】
ステップS36において、認識キーが離されていないと判定された場合、ステップS38に進み、音声コマンダ102は、解除キー(例えば、シフトキー)が押圧されたか否かを判定する。ステップS38において、解除キーが押圧されたと判定された場合、ステップS39に進み、音声コマンダ102は、音声認識の結果をクリアして、ステップS33に戻り、音声認識の処理を繰り返す。
【0218】
ステップS38において、解除キーが押圧されていないと判定された場合、ステップS39はスキップされ、ステップS33に戻り、音声認識の処理を繰り返す。
【0219】
ステップS31において、常時入力モードが選択されていると判定された場合、ステップS40に進み、音声コマンダ102は、音声認識エンジン101に音声認識の処理を実行させる。ステップS41において、音声コマンダ102は、音声認識エンジン101から音声認識の処理の結果を受信する。
【0220】
ステップS42において、音声コマンダ102は、音声認識エンジン101から受信した音声認識の処理の結果を表示させる。ステップS43において、音声コマンダ102は、コマンドの送信または起動を実行して、ステップS31に戻り、コマンドの送信または起動の処理を繰り返す。
【0221】
このように、認識キーの操作により、使用者は、音声が認識された結果を確認して、コマンドの送信または所定のプログラムの起動をさせることができ、誤った認識による処理の実行を防止することができる。
【0222】
次にステップS37またはステップS43に対応する、音声コマンダ102を実行するCPU52のアプリケーションプログラムの起動またはコマンド送信の処理を図47のフローチャートを参照して説明する。ステップS51において、音声コマンダ102は、音声認識エンジン101から受信した音声認識の処理の結果が、所定のアプリケーションプログラムの起動させるデータであるか否かを判定し、所定のアプリケーションプログラムの起動させるデータであると判定された場合、ステップS52に進む。
【0223】
ステップS52において、音声コマンダ102は、音声認識エンジン101から受信した音声認識の処理の結果に対応する所定のアプリケーションプログラムが既に起動されているか否かを判定し、所定のアプリケーションプログラムが既に起動されていると判定された場合、ステップS53に進み、ウィンドウのフォーカスを対応するアプリケーションプログラムに移し、処理は終了する。
【0224】
ステップS52において、所定のアプリケーションプログラムが起動されていないと判定された場合、ステップS54に進み、音声コマンダ102は、対応するアプリケーションプログラムを起動して、処理は終了する。
【0225】
ステップS51において、所定のアプリケーションプログラムの起動させるデータであると判定された場合、ステップS55に進み、音声コマンダ102は、対応するコマンドをアプリケーションプログラムに送信して、処理は終了する。
【0226】
このように、音声コマンダ102は、プログラムの状態、および音声で入力されたデータに対応して、コマンドの送信またはプログラムの起動の処理を実行することができる。
【0227】
次に、静止画閲覧プログラム104を実行するCPU52の電子メールプログラム54Aの起動の処理を図48のフローチャートを参照して説明する。ステップS71において、静止画閲覧プログラム104は、電子メールプログラム54Aを起動させる。ステップS72において、静止画閲覧プログラム104は、電子メールプログラム54Aに新規のメールを開かせる。
【0228】
ステップS73において、静止画閲覧プログラム104は、画像データを新規のメールに添付する。ステップS74において、静止画閲覧プログラム104は、画像データのコメントを新規のメールの本文に貼り付け、処理は終了する。
【0229】
以上のように、使用者は、キーボード4などを操作することなく、簡単に、所定の画像を貼付し、所定のコメントを貼付したメールを生成することができる。
【0230】
次に、図48のステップS37またはステップS43に対応する、音声コマンダ102を実行するCPU52のアプリケーションプログラムの起動またはデータの送信の処理を図49のフローチャートを参照して説明する。ステップS91において、音声コマンダ102は、音声認識の結果に引数が含まれているか否かを判定し、音声認識の結果に引数が含まれていないと判定された場合、ステップS92に進み、対応するアプリケーションプログラムを起動して、処理は終了する。
【0231】
ステップS91において、音声認識の結果に引数が含まれていると判定された場合、ステップS93に進み、音声コマンダ102は、音声認識の結果に含まれる引数のカテゴリがメールアドレスであるか否かを判定し、音声認識の結果に含まれる引数のカテゴリがメールアドレスであると判定された場合、ステップS94に進み、電子メールプログラム54Aを起動する。ステップS95において、音声コマンダ102は、引数に対応したメールアドレスを設定した新規のメールを開き、処理は終了する。
【0232】
ステップS93において、音声認識の結果に含まれる引数のカテゴリがメールアドレスでないと判定された場合、ステップS96に進み、音声コマンダ102は、引数で指定される文書ファイルを対応するアプリケーションプログラムで開き、処理は終了する。
【0233】
以上のように、音声コマンダ102は、入力された音声に対応して、所定のプログラムを起動させ、そのプログラムに文書ファイルカテゴリに属する所定の文書ファイルを開かせることができる。
【0234】
次に、音声コマンダ102を実行するCPU52の起動またはコマンド送信のときの画像表示の処理を図50のフローチャートを参照して説明する。ステップS101において、音声コマンダ102は、コマンドの送信であるか否かを判定し、コマンドの送信であると判定された場合、ステップS102に進み、音声コマンダウィンドウ151から画面全体に広がるように波紋の画像を表示させる。
【0235】
ステップS103において、音声コマンダ102は、画面全体からアプリケーションプログラムのウィンドウに収束するように波紋の画像を表示させる。
【0236】
ステップS104において、音声コマンダ102は、コマンドを受信するアプリケーションプログラムのウィンドウを強調表示させ、処理は終了する。
【0237】
ステップS101において、コマンドの送信でないと判定された場合、アプリケーションプログラムの起動なので、ステップS105に進み、音声コマンダ102は、画面全体からアプリケーションプログラムのウィンドウに収束するように波紋の画像を表示させる。
【0238】
ステップS106において、音声コマンダ102は、画面全体からアプリケーションプログラムのアイコンに収束するように波紋の画像を表示させる。
【0239】
ステップS107において、音声コマンダ102は、起動するアプリケーションプログラムのアイコンを強調表示させ、処理は終了する。
【0240】
このように、音声コマンダ102は、音声コマンダウィンドウ151から、コマンドを受信するプログラムのウィンドに向かう画像を表示させるので、使用者は、確実に、音声コマンダ102が動作していること、および音声コマンダ102の操作対象を知ることができる。
【0241】
また、音声コマンダ102は、音声コマンダウィンドウ151から、起動させるプログラムのアイコンに向かう画像を表示させるので、使用者は、確実に、音声コマンダ102が動作していること、および音声コマンダ102の操作対象を知ることができる。
【0242】
次に、音声コマンダ102を実行するCPU52の音声認識のテストの処理を図51のフローチャートを参照して説明する。ステップS131において、音声コマンダ102は、音声認識エンジン101から供給された所定の単語の認識結果を基に、所定の単語が認識されたか否かを判定する単語の認識テストを実行する。
【0243】
ステップS132において、音声コマンダ102は、ステップS131の結果を基に、所定の単語が認識されたか否かを判定し、所定の単語が認識されたと判定された場合、ステップS133に進み、所定のカテゴリに含まれる単語の認識のテストを実行する。
【0244】
ステップS134において、音声コマンダ102は、所定のカテゴリに含まれる単語が認識されたか否かを判定し、所定のカテゴリに含まれる単語が認識されたと判定された場合、ステップS135に進み、複数の単語を含むときの文法の認識のテストを実行する。
【0245】
ステップS136において、音声コマンダ102は、複数の単語を含むときの文法が認識されたか否かを判定し、複数の単語を含むときの文法が認識されたと判定された場合、処理は終了する。
【0246】
ステップS136において、複数の単語を含むときの文法が認識されないと判定された場合、ステップS138に進み、音声コマンダ102は、文法を修正して、ステップS135に戻り、複数の単語を含むときの文法の認識のテストを繰り返す。
【0247】
ステップS134において、所定のカテゴリに含まれる単語が認識されない判定された場合、およびステップS132において、所定の単語が認識されないと判定された場合、ステップS137に進み、音声コマンダ102は、単語を修正して、ステップS131に戻り、単語の認識のテストから処理を繰り返す。
【0248】
以上のように、音声コマンダ102は、音声認識のテストの結果を表示して、単語または文法を修正するので、確実に所定の音声を認識することができる。
【0249】
ステップS131の単語の認識のテストに対応する、音声コマンダ102を実行するCPU52の登録する呼び名のテストの処理を図52のフローチャートを参照して説明する。ステップS151において、音声コマンダ102は、音声認識エンジン101から音声認識の結果を受信する。
【0250】
ステップS152において、音声コマンダ102は、音声認識の結果と呼び名が一致するか否かを判定し、音声認識の結果と呼び名が一致すると判定された場合、ステップS153に進み、テスト結果表示フィールド253に正しく認識された旨を表示して、処理は終了する。
【0251】
ステップS152において、音声認識の結果と呼び名が一致しないと判定された場合、ステップS154に進み、音声コマンダ102は、テスト結果表示フィールド253に正しく認識されなかった旨を表示して、処理は終了する。
【0252】
ステップS133のカテゴリの認識のテストに対応する、音声コマンダ102を実行するCPU52のカテゴリの呼び名のテストの処理を図53のフローチャートを参照して説明する。ステップS171において、音声コマンダ102は、音声認識エンジン101から音声認識の結果を受信する。
【0253】
ステップS172において、音声コマンダ102は、音声認識の結果と一致する呼び名が登録されているか否かを判定し、音声認識の結果と一致する呼び名が登録されていると判定された場合、ステップS173に進み、呼び名表示フィールド226に表示されている、音声認識の結果と一致する呼び名を強調表示して、処理は終了する。
【0254】
ステップS172において、音声認識の結果と一致する呼び名が登録されていないと判定された場合、ステップS174に進み、音声コマンダ102は、テスト結果表示フィールド273に音声認識の結果と一致する呼び名が登録されていない旨を表示して、処理は終了する。
【0255】
次に、音声コマンダ102を実行するCPU52が、静止画撮影プログラム103を起動させて、静止画像を撮像させて、静止画像にコメントを貼付するまでの一連の処理を図54および図55にフローチャートを参照して説明する。ステップS211において、エンジン通信部122は、音声認識エンジン101を起動させ、状態11に遷移する。ステップS251において、UI処理部123は、エンジン起動中の表示を実行して、状態1に遷移する。ステップS301において、アプリケーション通信部121は、状態21に遷移する。
【0256】
ステップS212において、エンジン通信部122は、音声認識エンジン101から起動が成功した旨のデータを受信して、音声認識エンジン101の起動が成功したことを示すデータをUI処理部123に送信する。ステップS252において、UI処理部123は、音声認識エンジン101の起動が成功したことを示すデータを受信して、状態2に遷移する。
【0257】
ステップS253において、UI処理部123は、音声認識エンジン101が起動完了したことを示す画像または文をLCD21に表示させる。
【0258】
ステップS254において、UI処理部123は、認識キーであるコントロールキーが押圧されているか否かを検出する。認識キーであるコントロールキーが押圧されているとき、ステップS255に進み、UI処理部123は、アプリケーション通信部121に、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれにフォーカスがあたっているか(いずれのプログラムがアクティブになっているか、またはいずれもアクティブになっていないか)を示すデータの送信を要求する。ステップS302において、アプリケーション通信部121は、アプリケーション通信部121からの、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれにフォーカスがあたっているかを示すデータの送信の要求を受信する。
【0259】
ステップS303において、アプリケーション通信部121は、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれにフォーカスがあたっているかを示すデータを送信する。ステップS256において、UI処理部123は、アプリケーション通信部121からの、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれにフォーカスがあたっているかを示すデータを受信する。ステップS257において、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれにもフォーカスがあたっていないことを示すデータを受信したとき、UI処理部123は、音声コマンダウィンドウ151の認識状態表示部169に、グローバルコマンドしか受け付けないことを示す文字(例えば、「(Global Command)」)と表示させる。
【0260】
ステップS258において、UI処理部123は、エンジン通信部122に音声受付(すなわち、音声入力を可能にすること)を要求を送信して、状態3に遷移する。ステップS213において、エンジン通信部122は、音声受付の要求を受信する。ステップS214において、エンジン通信部122は、アプリケーション通信部121に、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれにフォーカスがあたっているか(いずれのプログラムがアクティブになっているか、またはいずれもアクティブになっていないか)を示すデータの送信を要求する。
【0261】
ステップS305において、アプリケーション通信部121は、エンジン通信部122に、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれにフォーカスがあたっているかを示すデータを送信する。
【0262】
ステップS215において、エンジン通信部122は、静止画撮影プログラム103、静止画閲覧プログラム104、または電子ペットプログラム105のいずれにフォーカスがあたっているかを示すデータを受信する。ステップS216において、エンジン通信部122は、認識単語・文法データベース115から現在受付可能な単語および文法のデータを読み出し、読み出したデータを音声認識エンジン101に送信して、状態13に遷移する。
【0263】
使用者がマイクロフォン24に音声を入力し始めると、ステップS217に進み、エンジン通信部122は、音声認識エンジン101から音声検知を示すデータを受信して、状態14に遷移する。
【0264】
ステップS218において、エンジン通信部122は、音声認識エンジン101から音声に対応する信号のレベル(音声の音量を示す)に対応するデータを受信する。ステップS219において、エンジン通信部122は、音声に対応する信号のレベルに対応するデータをUI処理部123に送信する。ステップS259において、UI処理部123は、音声に対応する信号のレベルに対応するデータを受信する。ステップS260において、UI処理部123は、受信した音声に対応する信号のレベルに対応するデータに基づき、音声コマンダウィンドウ151のレベルゲージ161の表示を更新する。
【0265】
ステップS220において、エンジン通信部122は、音声認識エンジン101から音声に対応する信号のレベル(音声の音量を示す)に対応するデータを受信する。ステップS221において、エンジン通信部122は、音声に対応する信号のレベルに対応するデータをUI処理部123に送信する。ステップS261において、UI処理部123は、音声に対応する信号のレベルに対応するデータを受信する。ステップS262において、UI処理部123は、受信した音声に対応する信号のレベルに対応するデータに基づき、音声コマンダウィンドウ151のレベルゲージ161の表示を更新する。
【0266】
音声認識エンジン101から音声に対応する信号のレベルを受信して、音声コマンダウィンドウ151のレベルゲージ161の表示を更新する処理は、音声受付が可能である状態では、随時繰り返される。
【0267】
ステップS222において、エンジン通信部122は、音声認識エンジン101から音使用者が喋った所定の言葉に対応する、コード番号(例えば、106など)、認識した単語または文(例えば、”撮影”など)、および認識した単語に関連する文字列のデータを受信する。ステップS223において、エンジン通信部122は、コード番号、認識した単語または文、および認識した単語に関連する文字列のデータをUI処理部123に送信する。ステップS263において、UI処理部123は、コード番号、認識した単語または文、および認識した単語に関連する文字列のデータを受信する。ステップS264において、UI処理部123は、認識した単語または文を、音声コマンダウィンドウ151の認識結果表示部162に表示させる。
【0268】
ステップS224において、エンジン通信部122は、コード番号を基にアプリケーション通信部121にも受信したデータを送信すべきものと判定して、コード番号、認識した単語または文、および認識した単語に関連する文字列のデータをアプリケーション通信部121に送信して、状態13に遷移する。ステップS306において、アプリケーション通信部121は、コード番号、認識した単語または文、および認識した単語に関連する文字列のデータを受信する。
【0269】
ステップS265において、UI処理部123は、認識キーであるコントロールキーがは離されているか否かを検出する。認識キーであるコントロールキーが離されているとき、ステップS266に進み、UI処理部123は、エンジン通信部122に音声受付の終了を要求するとともに、アプリケーション通信部121に対して、ステップ306でアプリケーション通信部121が受信しているコード番号、認識した単語または文、および認識した単語に関連する文字列のデータを基にした、所定の処理(例えば、静止画撮影プログラム103を起動させる)の実行を要求して、状態2に遷移する。
【0270】
ステップS225において、エンジン通信部122は、UI処理部123からの音声受付の終了の要求を受信する。ステップS226において、エンジン通信部122は、音声認識エンジン101に音声受付を終了させ、状態12に遷移する。
【0271】
ステップS307において、アプリケーション通信部121は、UI処理部123からの要求を受信する。ステップS308において、アプリケーション通信部121は、静止画撮影プログラム103を起動させる。
【0272】
ステップS309において、アプリケーション通信部121は、静止画撮影プログラム103から、シャッタボタン10の押し下げなどに対応した、コメント入力の要求を受信する。ステップS310において、アプリケーション通信部121は、コメント入力の要求をUI処理部123に送信する。ステップS267において、UI処理部123は、コメント入力の要求を受信する。ステップS268において、UI処理部123は、コメント入力の要求をエンジン通信部122に送信して、状態5に遷移する。ステップS227において、エンジン通信部122は、コメント入力の要求を受信する。
【0273】
ステップS228において、エンジン通信部122は、認識単語・文法データベース115から現在受付可能な単語および文法のデータを読み出し、読み出したデータを音声認識エンジン101に送信して、状態13に遷移する。
【0274】
使用者がマイクロフォン24に音声を入力し始めると、ステップS229に進み、エンジン通信部122は、音声認識エンジン101から音声検知を示すデータを受信して、状態14に遷移する。
【0275】
ステップS230において、エンジン通信部122は、音声認識エンジン101から音声に対応する信号のレベル(音声の音量を示す)に対応するデータを受信する。ステップS231において、エンジン通信部122は、音声に対応する信号のレベルに対応するデータをUI処理部123に送信する。ステップS269において、UI処理部123は、音声に対応する信号のレベルに対応するデータを受信する。ステップS270において、UI処理部123は、受信した音声に対応する信号のレベルに対応するデータに基づき、音声コマンダウィンドウ151のレベルゲージ161の表示を更新する。
【0276】
ステップS232において、エンジン通信部122は、音声認識エンジン101から音使用者が喋った所定の言葉に対応する、コード番号(例えば、107など)、認識した単語または文(例えば、”パパと八丈島で”など)、および認識した単語に関連する文字列のデータを受信する。ステップS233において、エンジン通信部122は、コード番号、認識した単語または文、および認識した単語に関連する文字列のデータをUI処理部123に送信する。ステップS271において、UI処理部123は、コード番号、認識した単語または文、および認識した単語に関連する文字列のデータを受信する。ステップS272において、UI処理部123は、認識した単語または文を、音声コマンダウィンドウ151の認識結果表示部162に表示させる。
【0277】
ステップS234において、エンジン通信部122は、コード番号を基にアプリケーション通信部121にも受信したデータを送信すべきものと判定して、コード番号、認識した単語または文、および認識した単語に関連する文字列のデータをアプリケーション通信部121に送信して、状態13に遷移する。ステップS311において、アプリケーション通信部121は、コード番号、認識した単語または文、および認識した単語に関連する文字列のデータを受信する。
【0278】
ステップS312において、アプリケーション通信部121は、認識した単語または文をコメントとして静止画撮影プログラム103に送信して、静止画撮影プログラム103に識した単語または文をコメントとして貼付させる。
【0279】
ステップS232乃至ステップS312の処理は、シャッタボタン10が離されず、使用者の音声を音声認識エンジン101が認識したとき、繰り返し実行される。
【0280】
ステップS313において、アプリケーション通信部121は、静止画撮影プログラム103から、シャッタボタン10を離すなどの操作に対応した、コメント入力の終了の要求を受信する。ステップS314において、アプリケーション通信部121は、コメント入力の終了の要求をUI処理部123に送信する。ステップS273において、UI処理部123は、コメント入力の終了の要求を受信する。ステップS274において、UI処理部123は、コメント入力の終了の要求をエンジン通信部122に送信して、状態2に遷移する。ステップS225において、エンジン通信部122は、コメント入力の終了の要求を受信する。ステップS236において、エンジン通信部122は、音声認識エンジン101に音声受付を終了させ、状態12に遷移して、処理は終了する。
【0281】
このように、キーボード4またはスティック式ポインティングデバイス5への複雑な操作することなく、音声コマンダ102は、音声の入力に対応して、静止画撮影プログラム103を起動させ、静止画撮影プログラム103が撮像した静止画像にコメントを入力することができる。
【0282】
なお、音声認識エンジン101は、登録された単語または文のみを認識するだけでなく、任意の単語または文を認識する機能(いわゆる、ディクテーション機能)を有するようにしてもよい。
【0283】
上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム格納媒体からインストールされる。
【0284】
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム格納媒体は、図7に示すように、磁気ディスク95(フロッピディスクを含む)、光ディスク96(CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク97(MD(Mini-Disc)を含む)、若しくは半導体メモリ98などよりなるパッケージメディア、または、プログラムが一時的若しくは永続的に格納されるROM69や、ハードディスク56などにより構成される。プログラム格納媒体へのプログラムの格納は、必要に応じてルータ、モデム50などのインタフェースを介して、ローカルエリアネットワーク、インターネット92、図示せぬデジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。
【0285】
なお、本明細書において、プログラム格納媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0286】
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
【0287】
【発明の効果】
本発明によれば、簡単に、通信相手を特定するデータが設定できるようになる。
【図面の簡単な説明】
【図1】パーソナルコンピュータ1の外観斜視図である。
【図2】パーソナルコンピュータ1の平面図である。
【図3】パーソナルコンピュータ1の左側側面図である。
【図4】パーソナルコンピュータ1の右側側面図である。
【図5】パーソナルコンピュータ1の正面図である。
【図6】パーソナルコンピュータ1の底面図である。
【図7】パーソナルコンピュータ1の構成を示すブロック図である。
【図8】パーソナルコンピュータ1の機能ブロックを示す図である。
【図9】パーソナルコンピュータ1の機能ブロックを示す図である。
【図10】 SAPIを説明する図である。
【図11】UI処理部123の状態遷移図である。
【図12】音声コマンダウィンドウ151を示す図である。
【図13】エンジン通信部122の状態遷移図である。
【図14】アプリケーション通信部121の状態遷移図である。
【図15】 LCD21に表示される画面を説明する図である。
【図16】 LCD21に表示される画面を説明する図である。
【図17】 LCD21に表示される画面を説明する図である。
【図18】 LCD21に表示される画面を説明する図である。
【図19】 LCD21に表示される画面を説明する図である。
【図20】 LCD21に表示される画面を説明する図である。
【図21】 LCD21に表示される画面を説明する図である。
【図22】 LCD21に表示される画面を説明する図である。
【図23】 LCD21に表示される画面を説明する図である。
【図24】 LCD21に表示される画面を説明する図である。
【図25】 LCD21に表示される画面を説明する図である。
【図26】 LCD21に表示される画面を説明する図である。
【図27】 LCD21に表示される画面を説明する図である。
【図28】 LCD21に表示される画面を説明する図である。
【図29】 LCD21に表示される画面を説明する図である。
【図30】 LCD21に表示される画面を説明する図である。
【図31】 LCD21に表示される画面を説明する図である。
【図32】 LCD21に表示される画面を説明する図である。
【図33】 LCD21に表示される画面を説明する図である。
【図34】 LCD21に表示される画面を説明する図である。
【図35】 LCD21に表示される画面を説明する図である。
【図36】 LCD21に表示される画面を説明する図である。
【図37】 LCD21に表示される画面を説明する図である。
【図38】 LCD21に表示される画面を説明する図である。
【図39】 LCD21に表示される画面を説明する図である。
【図40】 LCD21に表示される画面を説明する図である。
【図41】 LCD21に表示される画面を説明する図である。
【図42】 LCD21に表示される画面を説明する図である。
【図43】 LCD21に表示される画面を説明する図である。
【図44】 LCD21に表示される画面を説明する図である。
【図45】静止画像の撮像の処理を説明するフローチャートである。
【図46】音声によるコマンド送信または起動の処理を説明するフローチャートである。
【図47】アプリケーションプログラムの起動またはコマンド送信の処理を説明するフローチャートである。
【図48】電子メールプログラム54Aの起動の処理を説明するフローチャートである。
【図49】アプリケーションプログラムの起動またはデータの送信の処理を説明するフローチャートである。
【図50】起動またはコマンド送信のときの画像表示の処理を説明するフローチャートである。
【図51】音声認識のテストの処理を説明するフローチャートである。
【図52】登録する呼び名のテストの処理を説明するフローチャートである。
【図53】カテゴリの呼び名のテストの処理を説明するフローチャートである。
【図54】静止画撮影プログラム103を起動させて、静止画像を撮像させて、静止画像にコメントを貼付するまでの一連の処理を説明するフローチャートである。
【図55】静止画撮影プログラム103を起動させて、静止画像を撮像させて、静止画像にコメントを貼付するまでの一連の処理を説明するフローチャートである。
【符号の説明】
1 パーソナルコンピュータ, 4 キーボード, 10 シャッタボタン,21 LCD, 23 CCDビデオカメラ, 24 マイクロフォン, 52 CPU, 59 ROM, 54 RAM, 84A 電子メールプログラム, 86 前押しスイッチ, 88 ドライブ, 92 インターネット, 95 磁気ディスク, 96 光ディスク, 97 光磁気ディスク, 98 半導体メモリ,101 音声認識エンジン, 102 音声コマンダ, 103 静止画撮影プログラム, 104 静止画閲覧プログラム, 111 読み仮名辞書データベース, 112 エンジン用認識単語・文法データベース, 113 ランチャ設定データベース, 114 辞書設定データベース, 115 認識単語データベース, 121 アプリケーション通信部, 122 エンジン通信部,123 UI処理部, 124 音声ランチャ制御部, 125 ユーザ辞書制御部, 126 認識テスト処理部

Claims (3)

  1. シャッタボタンが押圧されたとき、カメラが撮像している画像を基に静止画像のデータを生成し、生成した前記静止画像のデータを格納するとともに、音声認識によって認識されたコメントをヘッダに格納したファイルを記録媒体に記録させる記録手段と、
    シャッタボタンが押圧された後に、シャッタボタンが押圧されたまま入力された音声を認識する認識手段と、
    前記記録手段により前記ファイルが記録されたときに起動した静止画閲覧プログラムによって実現される、前記記録手段により生成された前記静止画像を前記カメラが撮像している画像を表示する第1のウインドウと異なる第2のウインドウに表示させ、前記認識手段により認識された音声を表す単語または文を、前記静止画像の隣に表示させる静止画像表示制御手段と、
    前記第2のウインドウに表示されている、メッセージを作成するときに操作されるボタンが操作されたときに起動した電子メールプログラムによって実現される、前記第1のウインドウに替えて、メッセージの作成に用いられる第3のウインドウを表示させ、前記第3のウインドウに設けられるメッセージの本文の表示フィールドに、コメントとして前記ファイルのヘッダに前記記録手段により格納された、前記認識手段により認識された単語または文を表示させ、前記記録手段により記録された前記ファイルを添付した前記メッセージを生成する生成手段と、
    音声の認識を行うときに操作される認識キーが押圧されたまま入力された音声を前記認識手段がさらに認識する場合、呼び名として登録されている単語とメールの言葉からなる音声が前記認識手段により認識されたことに応じて前記電子メールプログラムが起動するとき、認識された音声を表す単語または文を表示する領域と音声のレベルを表示する領域が設けられるウインドウから周りに広がり、前記電子メールプログラムを表すアイコンに向かって収束するように波紋状の画像を表示させ、前記アイコンを強調表示させる表示制御手段と、
    前記アイコンが強調表示された後に表示されたメッセージの作成に用いられるウインドウのメールアドレスの表示欄に、前記認識手段により認識された前記呼び名として登録されている単語に対応付けて登録されているメールアドレスをメッセージの送信先として設定する設定手段と
    を備える情報処理装置。
  2. シャッタボタンが押圧されたとき、カメラが撮像している画像を基に静止画像のデータを生成し、生成した前記静止画像のデータを格納するとともに、音声認識によって認識されたコメントをヘッダに格納したファイルを記録媒体に記録させ、
    シャッタボタンが押圧された後に、シャッタボタンが押圧されたまま入力された音声を認識し、
    前記ファイルを記録したときに静止画閲覧プログラムを起動させ、生成した前記静止画像を前記カメラが撮像している画像を表示する第1のウインドウと異なる第2のウインドウに表示させ、認識した音声を表す単語または文を、前記静止画像の隣に表示させ、
    前記第2のウインドウに表示されている、メッセージを作成するときに操作されるボタンが操作されたときに電子メールプログラムを起動させ、前記第1のウインドウに替えて、メッセージの作成に用いられる第3のウインドウを表示させ、前記第3のウインドウに設けられるメッセージの本文の表示フィールドに、コメントとして前記ファイルのヘッダに格納した、認識した単語または文を表示させ、前記ファイルを添付した前記メッセージを生成し、
    音声の認識を行うときに操作される認識キーが押圧されたまま入力された音声をさらに認識する場合、呼び名として登録されている単語とメールの言葉からなる音声を認識したことに応じて前記電子メールプログラムが起動するとき、認識された音声を表す単語または文を表示する領域と音声のレベルを表示する領域が設けられるウインドウから周りに広がり、前記電子メールプログラムを表すアイコンに向かって収束するように波紋状の画像 を表示させ、前記アイコンを強調表示させ、
    前記アイコンを強調表示させた後に表示させたメッセージの作成に用いられるウインドウのメールアドレスの表示欄に、認識した前記呼び名として登録されている単語に対応付けて登録しているメールアドレスをメッセージの送信先として設定する
    ステップを含む情報処理方法。
  3. シャッタボタンが押圧されたとき、カメラが撮像している画像を基に静止画像のデータを生成し、生成した前記静止画像のデータを格納するとともに、音声認識によって認識されたコメントをヘッダに格納したファイルを記録媒体に記録させ、
    シャッタボタンが押圧された後に、シャッタボタンが押圧されたまま入力された音声を認識し、
    前記ファイルを記録したときに静止画閲覧プログラムを起動させ、生成した前記静止画像を前記カメラが撮像している画像を表示する第1のウインドウと異なる第2のウインドウに表示させ、認識した音声を表す単語または文を、前記静止画像の隣に表示させ、
    前記第2のウインドウに表示されている、メッセージを作成するときに操作されるボタンが操作されたときに電子メールプログラムを起動させ、前記第1のウインドウに替えて、メッセージの作成に用いられる第3のウインドウを表示させ、前記第3のウインドウに設けられるメッセージの本文の表示フィールドに、コメントとして前記ファイルのヘッダに格納した、認識した単語または文を表示させ、前記ファイルを添付した前記メッセージを生成し、
    音声の認識を行うときに操作される認識キーが押圧されたまま入力された音声をさらに認識する場合、呼び名として登録されている単語とメールの言葉からなる音声を認識したことに応じて前記電子メールプログラムが起動するとき、認識された音声を表す単語または文を表示する領域と音声のレベルを表示する領域が設けられるウインドウから周りに広がり、前記電子メールプログラムを表すアイコンに向かって収束するように波紋状の画像を表示させ、前記アイコンを強調表示させ、
    前記アイコンを強調表示させた後に表示させたメッセージの作成に用いられるウインドウのメールアドレスの表示欄に、認識した前記呼び名として登録されている単語に対応付けて登録しているメールアドレスをメッセージの送信先として設定する
    ステップを含む処理をコンピュータに実行させるプログラムが記録されたプログラム格納媒体。
JP25067499A 1999-09-03 1999-09-03 情報処理装置および方法、並びにプログラム格納媒体 Expired - Fee Related JP4200607B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP25067499A JP4200607B2 (ja) 1999-09-03 1999-09-03 情報処理装置および方法、並びにプログラム格納媒体
US09/648,863 US6879958B1 (en) 1999-09-03 2000-08-25 Communication apparatus, communication method and program storage medium
EP00118753A EP1081586A3 (en) 1999-09-03 2000-08-30 Voice command of an electronic mail client
US11/081,542 US7035806B2 (en) 1999-09-03 2005-03-17 Communication apparatus, communication method and program storage medium
US11/081,539 US7047199B2 (en) 1999-09-03 2005-03-17 Communication apparatus, communication method and program storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25067499A JP4200607B2 (ja) 1999-09-03 1999-09-03 情報処理装置および方法、並びにプログラム格納媒体

Publications (2)

Publication Number Publication Date
JP2001075777A JP2001075777A (ja) 2001-03-23
JP4200607B2 true JP4200607B2 (ja) 2008-12-24

Family

ID=17211370

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25067499A Expired - Fee Related JP4200607B2 (ja) 1999-09-03 1999-09-03 情報処理装置および方法、並びにプログラム格納媒体

Country Status (3)

Country Link
US (3) US6879958B1 (ja)
EP (1) EP1081586A3 (ja)
JP (1) JP4200607B2 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4363076B2 (ja) * 2002-06-28 2009-11-11 株式会社デンソー 音声制御装置
US20050132271A1 (en) * 2003-12-11 2005-06-16 International Business Machines Corporation Creating a session document from a presentation document
US7487451B2 (en) * 2003-12-11 2009-02-03 International Business Machines Corporation Creating a voice response grammar from a presentation grammar
US20050132273A1 (en) * 2003-12-11 2005-06-16 International Business Machines Corporation Amending a session document during a presentation
US9378187B2 (en) * 2003-12-11 2016-06-28 International Business Machines Corporation Creating a presentation document
US20050132274A1 (en) * 2003-12-11 2005-06-16 International Business Machine Corporation Creating a presentation document
US8499232B2 (en) * 2004-01-13 2013-07-30 International Business Machines Corporation Differential dynamic content delivery with a participant alterable session copy of a user profile
US7430707B2 (en) 2004-01-13 2008-09-30 International Business Machines Corporation Differential dynamic content delivery with device controlling action
US7890848B2 (en) 2004-01-13 2011-02-15 International Business Machines Corporation Differential dynamic content delivery with alternative content presentation
US7571380B2 (en) * 2004-01-13 2009-08-04 International Business Machines Corporation Differential dynamic content delivery with a presenter-alterable session copy of a user profile
US7827239B2 (en) * 2004-04-26 2010-11-02 International Business Machines Corporation Dynamic media content for collaborators with client environment information in dynamic client contexts
US7519683B2 (en) * 2004-04-26 2009-04-14 International Business Machines Corporation Dynamic media content for collaborators with client locations in dynamic client contexts
US7519904B2 (en) * 2004-07-08 2009-04-14 International Business Machines Corporation Differential dynamic delivery of content to users not in attendance at a presentation
US7921362B2 (en) * 2004-07-08 2011-04-05 International Business Machines Corporation Differential dynamic delivery of presentation previews
US8185814B2 (en) 2004-07-08 2012-05-22 International Business Machines Corporation Differential dynamic delivery of content according to user expressions of interest
US7487208B2 (en) * 2004-07-08 2009-02-03 International Business Machines Corporation Differential dynamic content delivery to alternate display device locations
US9167087B2 (en) 2004-07-13 2015-10-20 International Business Machines Corporation Dynamic media content for collaborators including disparate location representations
US7426538B2 (en) 2004-07-13 2008-09-16 International Business Machines Corporation Dynamic media content for collaborators with VOIP support for client communications
US8160884B2 (en) * 2005-02-03 2012-04-17 Voice Signal Technologies, Inc. Methods and apparatus for automatically extending the voice vocabulary of mobile communications devices
US8620658B2 (en) * 2007-04-16 2013-12-31 Sony Corporation Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
US10296874B1 (en) 2007-12-17 2019-05-21 American Express Travel Related Services Company, Inc. System and method for preventing unauthorized access to financial accounts
CN102177127B (zh) * 2008-08-13 2014-04-09 Amt国际有限公司 从含有相应酯的原料流回收醋酸的方法和装置
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
CN102918586B (zh) * 2010-06-02 2015-08-12 拿索斯财务有限公司 用于图像数据记录和再现的设备及其方法
TWI460601B (zh) * 2010-12-16 2014-11-11 Ind Tech Res Inst 用於資訊致動的物件關聯系統與方法以及計算機系統
KR101295711B1 (ko) * 2011-02-15 2013-08-16 주식회사 팬택 음성 인식으로 애플리케이션의 실행 가능한 이동통신 단말 장치 및 방법
US20120281097A1 (en) * 2011-05-06 2012-11-08 David Wood Vehicle media system
US8136724B1 (en) 2011-06-24 2012-03-20 American Express Travel Related Services Company, Inc. Systems and methods for gesture-based interaction with computer systems
US20130054337A1 (en) * 2011-08-22 2013-02-28 American Express Travel Related Services Company, Inc. Methods and systems for contactless payments for online ecommerce checkout
US8714439B2 (en) 2011-08-22 2014-05-06 American Express Travel Related Services Company, Inc. Methods and systems for contactless payments at a merchant
EP2575128A3 (en) * 2011-09-30 2013-08-14 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9106757B2 (en) 2013-03-26 2015-08-11 Lg Uplus Corp. Terminal, server, and method for actively providing information based on communication contents
KR101455924B1 (ko) 2013-03-26 2014-11-03 주식회사 엘지유플러스 통화 기반 관심사 제공을 위한 단말, 서버 장치, 방법, 및 기록 매체
US11176930B1 (en) * 2016-03-28 2021-11-16 Amazon Technologies, Inc. Storing audio commands for time-delayed execution
JP2018073067A (ja) * 2016-10-27 2018-05-10 京セラ株式会社 電子機器、制御方法およびプログラム
CN108109621A (zh) * 2017-11-28 2018-06-01 珠海格力电器股份有限公司 家电设备的控制方法、装置和系统
US11438452B1 (en) 2019-08-09 2022-09-06 Apple Inc. Propagating context information in a privacy preserving manner

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5086391A (en) * 1989-02-24 1992-02-04 Chambers Bryan R Remote controller for activating speech messages and for contacting emergency services
US5615296A (en) 1993-11-12 1997-03-25 International Business Machines Corporation Continuous speech recognition and voice response system and method to enable conversational dialogues with microprocessors
US5852801A (en) * 1995-10-04 1998-12-22 Apple Computer, Inc. Method and apparatus for automatically invoking a new word module for unrecognized user input
US5960395A (en) * 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming
KR19990015749A (ko) * 1997-08-09 1999-03-05 구자홍 음성을 인식하여 전자우편
US5950167A (en) * 1998-01-26 1999-09-07 Lucent Technologies Inc. Screen-less remote voice or tone-controlled computer program operations via telephone set
US6295391B1 (en) * 1998-02-19 2001-09-25 Hewlett-Packard Company Automatic data routing via voice command annotation
US6182046B1 (en) * 1998-03-26 2001-01-30 International Business Machines Corp. Managing voice commands in speech applications
US6519479B1 (en) * 1999-03-31 2003-02-11 Qualcomm Inc. Spoken user interface for speech-enabled devices
US6574599B1 (en) * 1999-03-31 2003-06-03 Microsoft Corporation Voice-recognition-based methods for establishing outbound communication through a unified messaging system including intelligent calendar interface
JP4320487B2 (ja) * 1999-09-03 2009-08-26 ソニー株式会社 情報処理装置および方法、並びにプログラム格納媒体
JP4292646B2 (ja) * 1999-09-16 2009-07-08 株式会社デンソー ユーザインタフェース装置、ナビゲーションシステム、情報処理装置及び記録媒体
US6891932B2 (en) * 2001-12-11 2005-05-10 Cisco Technology, Inc. System and methodology for voice activated access to multiple data sources and voice repositories in a single session
US6895257B2 (en) * 2002-02-18 2005-05-17 Matsushita Electric Industrial Co., Ltd. Personalized agent for portable devices and cellular phone

Also Published As

Publication number Publication date
EP1081586A2 (en) 2001-03-07
US7035806B2 (en) 2006-04-25
EP1081586A3 (en) 2002-08-28
US7047199B2 (en) 2006-05-16
US6879958B1 (en) 2005-04-12
JP2001075777A (ja) 2001-03-23
US20050171782A1 (en) 2005-08-04
US20050171776A1 (en) 2005-08-04

Similar Documents

Publication Publication Date Title
JP4200607B2 (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP4320487B2 (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP4194575B2 (ja) ウエブサービスアプリケーションベースの光学文字認識システム及び方法
JP2007066092A (ja) 情報処理装置及びネットワークデバイス及びそれらの制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
EP1081615A2 (en) Picture information transmission apparatus and method
JP2003006133A (ja) 情報処理方法および制御プログラムおよび情報処理装置および周辺装置および応答方法および代理応答装置およびネットワークシステム
JP2000207263A (ja) 情報処理装置及び方法、並びに提供媒体
JP2000222185A (ja) 情報処理装置および方法、並びに提供媒体
JP4200608B2 (ja) 情報処理装置および方法、並びにプログラム格納媒体
US20070299961A1 (en) Information receiving system, information receiving method, information providing device, information providing method, information providing method providing medium, information processing device, information processing method and information processing method providing medium
JP4513192B2 (ja) 情報処理装置および方法、並びにプログラム記録媒体
JP4320488B2 (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP4210880B2 (ja) 携帯情報端末装置及び情報処理方法
JP2001075591A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2004362601A (ja) 情報処理装置及び方法、並びにグラフィカルユーザインタフェース
JP2005284880A (ja) 音声認識サービスシステム
JP2001075773A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2001216131A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2001075775A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP2010147716A (ja) 情報処理端末、情報処理方法、及び情報処理プログラム
JP2003122771A (ja) 情報処理装置及び情報処理方法、並びに情報処理プログラム
JP4868728B2 (ja) 情報処理装置、情報処理方法、及びそのプログラム
JP2001101064A (ja) 情報処理装置、情報処理方法、およびプログラム格納媒体
JP2001216128A (ja) 情報処理装置および方法、並びにプログラム格納媒体
JPH11161567A (ja) 情報処理装置及び方法及びシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080916

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080929

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111017

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees