JP2006501788A - コンピュータとのワイヤレス音声通信用システム及び方法 - Google Patents

コンピュータとのワイヤレス音声通信用システム及び方法 Download PDF

Info

Publication number
JP2006501788A
JP2006501788A JP2005500357A JP2005500357A JP2006501788A JP 2006501788 A JP2006501788 A JP 2006501788A JP 2005500357 A JP2005500357 A JP 2005500357A JP 2005500357 A JP2005500357 A JP 2005500357A JP 2006501788 A JP2006501788 A JP 2006501788A
Authority
JP
Japan
Prior art keywords
computer
file
user
voice
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005500357A
Other languages
English (en)
Inventor
マッコンネル、クリストファー、フランク
プリートマン、トーマス、アラン
パーカー、ジェニファー、ウェア
ビルマイヤー、チャド、ウォルター
Original Assignee
マッコンネル、クリストファー、フランク
プリートマン、トーマス、アラン
パーカー、ジェニファー、ウェア
ビルマイヤー、チャド、ウォルター
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マッコンネル、クリストファー、フランク, プリートマン、トーマス、アラン, パーカー、ジェニファー、ウェア, ビルマイヤー、チャド、ウォルター filed Critical マッコンネル、クリストファー、フランク
Publication of JP2006501788A publication Critical patent/JP2006501788A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/21Combinations with auxiliary equipment, e.g. with clocks or memoranda pads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/24Radio transmission systems, i.e. using radiation field for communication between two or more posts
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】
【解決手段】 コンピュータと交信するための方法及びシステムを提供する。1つの実施形態において、前記コンピュータと通信装置との間の通信接続が確立される。所望の機能を決定するために、前記ユーザーからの音声信号を受信し、処理する。前記所望の機能が音声応答を要求するものかどうかを決定し、要求されていれば、前記遠隔通信装置を経由して前記ユーザーへの音声応答が提供され、前記所望の機能が果たされる。代替実施形態において、データファイルへのエントリが読み取られ、前記エントリに応答して前記コンピュータと遠隔通信装置との間で通信接続が開始される。前記エントリに従って音声通知が生成され、前記遠隔通信装置を経由して送信される。

Description

関連出願
本出願は、「コンピュータとのワイヤレス音声通信用システム及び方法(A System and Method forWireless Audio Communication with a computer)」と題する2002年10月1日に申請済みの米国特許出願番号第60/415,311号、及び同じく「コンピュータとのワイヤレス音声通信用システム及び方法(A System and Method forWireless Audio Communication with a computer)」と題する2003年3月25日に申請済みの米国特許出願番号第60/457,732号に対して優先権を主張するものであり、この開示によりそれらの全体が本明細書に組み込まれるものである。
本発明は、コンピュータ・インターフェースに関する。より具体的には、本発明は、音声通信を経由してコンピュータとインターフェース接続するためのシステム及び方法に関するものである。さらに具体的には、本発明は、音声入力を受信するための音声認識システム及び方法と、コンピュータ・アプリケーションと交信するためのモジュールと、音声出力を送信するための音声合成モジュールとに関するものである。
一般の人々が、日常生活に影響を与える情報を保存したり利用したりするのにコンピュータを使うことがますます増えている。予約、タスク、連絡などの個人情報、及びスプレッドシート、データベース、ワープロ文書などに収められた企業データといったタイプの情報は、すべて容易に更新、整理、利用できるので、特にコンピュータでの保管に適している。また、コンピュータは、インターネットまたは別のネットワークを介し、リアルタイム若しくはほぼリアルタイムで、株価や天気予報など時間に依存する情報を離れた処から利用することができる。コンピュータに要求される全てのタスクを実行するために、コンピュータはかなり洗練され、強力な処理能力を備えるようになってきた。従って、ユーザーが自分のコンピュータを利用できる際には(つまりユーザーが自宅またはオフィスにいる際)、前記ユーザーはそのようなコンピュータの処理能力を容易に利用して所望のタスクを実行することができる。
しかしながら、多くの状況において、ユーザーは旅行中若しくは自分のコンピュータから離れた場所にいるときに、そのような情報を利用することが要求される。残念なことに、コンピュータの完全な処理能力を携帯することは大半において不可能である。例えば、デスクトップ・コンピュータは一定の場所に置かれるように設計されており、従って、携帯利用には適さない。ラップトップ・コンピュータはデスクトップ・コンピュータよりもはるかに優れた可動性と、ほぼ同等の処理能力とを備えているが、高価であり、未だにかなり扱いにくい。また、ワイヤレス・インターネット接続は高価であり、未だに利用可能な範囲が限られており、そのようなラップトップのための携帯電話接続は現在のインターネット標準では遅い。さらに、ユーザーは自宅やオフィスにあるインターネット接続に加えてリモートインターネット接続を持つことになり、それに伴って費用が重なる。
従来から、携帯情報端末(PDA)を使ってユーザーの情報を利用することが可能である。そのようなPDAは、クレードルまたはIRビームを介してコンピュータと断続的に接続することができ、それにより、前記コンピュータから情報をアップロードまたはダウンロードすることができる。一部のPDAsではワイヤレス接続により情報を利用することができる、または携帯電話としての役割も果たすことがある。しかし、PDAには多くの欠点がある。例えば、PDAsは高価であり、ユーザーのコンピュータにすでに備わっている処理能力の一部を重複することが多く、場合によっては高価なサービスを購読しなくてはならないこともあり、ベース・ステーションまたはパーソナル・コンピュータとの同期化が必要なことも多い。また、PDAの使い方の学習や、PDAの小さな画面及び両手を使うことを要求する入力装置という点において使い勝手が悪く、ユーザーのコンピュータに比べて機能性が限られている。モバイル処理能力の増強につれ、PDAの費用と複雑性も増す。さらに、従来のPDAは前記ユーザーの情報をそれに格納するため、PDAの盗難または損失によるデータ損失の危険が伴う。
携帯電話機のサイズ、費用、可動性の向上に伴い、極めて一般的に携帯電話機が使用されるようになった。従来の一部の携帯電話機には、例えば特定の人物に電話をする際に音声コマンドを使って簡単なタスクを実行する、音声起動機能を限してきた。同様に、一部の自動車及び高度な機能を備えた携帯電話機は、音声を認識して簡単なコマンドを受け取ることができる。そのような従来式システムにおいて使用されるソフトウェアは、例えばかけたい人物に電話をかけるといったような所望の機能を実行する既知のコマンド(すなわち音声)を単純に特定する。すなわち、従来式システムは、発話された言葉の意味の決定することなしに音声と所望の機能とを一致させる。同様に、従来から、携帯電話機を経由してユーザーに電子メールのメッセージを音声で伝えるソフトウェア・アプリケーションがある。そのようなアプリケーションにおいて、前記携帯電話機は前記ソフトウェアにコマンドを単に再生し、前記ソフトウェアが前記メッセージをプレイする。
発話を認識できる従来のソフトウェアは、サーバー・ベースであるか、または主にコンピュータと共にいるユーザーのためのものであるかのどちらかである。例えば、電話センターの音声認識システムはサイズが大型で複雑であるため、強力なサーバー上で実行される必要がある。そのようなシステムが大型且つ複雑であるのは、様々なアクセントや発話パターンを持つ話者の発話を認識する能力を必要とするためである。その複雑な性質にも関わらず、通常、そのようなシステムは未だにメニュー方式の応答に限られている。すなわち、典型的な音声認識ソフトウェア・パッケージへ電話をした通話者は、単に所望のリクエストを話して前記システムにリクエストを認識させるのではなく、メニューを成す1若しくはそれ以上の層を経由して所望の機能まで到達しなくてはならない。パーソナル・コンピュータで実行するために設計された従来の発話認識ソフトウェアは、主にディクテーション用であり、そのようなソフトウェアはさらに、ユーザーがコンピュータの前にいる必要や、前記ソフトウェアが定める単純なメニュー項目にユーザーが制約される。従って、従来の発話認識ソフトウェアは、キーボードまたはマウスのような典型的な入力装置の代替若しくは補助としての役割を果たすに過ぎない。
さらに、従来のPDAs、携帯電話機、及びラップトップ・コンピュータには、いずれもそれ以外のものの機能を基本的に果たすことができないという欠点がある。高度なワイヤレス装置はPDAと携帯電話機の機能性を兼ね備えているが、非常に高価である。従って、ユーザーはPDAと携帯電話機だけでなく場合によってはラップトップの機能も果たす能力のある1つの高額な装置を購入するか、または携帯電話機とPDA、及び/またはラップトップを個別に購入するかのどちらかにせざるを得ず、後者になる見込みが高い。
従って、コンピュータと通信するためのポータブルな方法が必要である。より具体的には、コンピュータにより音声で通信して携帯電話機のような安価でポータブルな装置を経由して情報を入手するためのシステム及び方法が必要である。さらに具体的には、コンピュータで作動する複数の演算プログラムを、操作可能な方法で相互接続するシステムおよび方法が必要であり、それにより、リモートコンピュータへコマンドを送信し、そこから情報を受信するための統合システムを提供する。
前述の制約と欠点を鑑みて、コンピュータに格納されたデータと交信するための方法およびシステムを提供する。前記方法において、遠隔通信装置を経由してコンピュータとユーザーとの間の通信接続が確立される。ユーザーからの音声発話または音声信号は、前記遠隔通信装置を経由して受信される。前記発話または信号を処理することによって所望の機能が決定され、前記発話に従って、前記コンピュータ上の格納データに対する所望の機能が実行される。
前記システムにおいて、前記コンピュータと遠隔通信装置との間の通信は、通信チャネルによって可能になり、前記チャネルは前記コンピュータまたは前記遠隔通信装置のいずれかによって始動される。音声認識コンポーネントが音声入力を受信し、それをテキスト形式に変換する。テキスト−音声変換コンポーネントがテキスト形式のデータを音声形式に変換し、ファイル・インターフェース・コンポーネントが、前記データの格納されているファイルと交信する。インターフェース・プログラムは、前記通信チャネルを経由して音声入力を受信し、前記音声認識コンポーネントに前記発話を変換させて所望の機能を決定さえ、前記所望の機能に従って前記ファイル・インターフェースに前記ファイルと交信させ、さらに前記テキスト−音声変換コンポーネントに音声形式の結果または確認を前記遠隔通信装置へ提供させ、及び/または前記所望のアクションが実行されるようにする。
音声コマンドを経由して遠隔通信装置をコンピュータに有効に接続するシステム及び方法について説明する。本発明の1つの実施形態において、例えば携帯電話機、ワイヤレス・トランシーバー、マイクロフォン、有線電話等の遠隔通信装置を用い、音声または音声コマンドをユーザーのコンピュータに送信する。別の実施形態において、前記ユーザーのコンピュータは、同じ遠隔通信装置を経由して、前記ユーザーに音声発話または同種のものを始動する。前記ユーザーのコンピュータ上で稼動中のインターフェース・プログラムは、例えば前記ユーザーの音声発話を認識する発話認識ソフトウェア、前記ユーザーと通信するためのテキスト−スピーチ変換ソフトウェア、予約及び/または電子メールソフトウェア、スプレッドシート、データベース、インターネット、またはその他のネットワーク及び/または同種のものと有効に相互接続する。前記インターフェース・プログラムはまた、コンピュータ入出力ポートとインターフェース接続して、例えばアクチュエータ、センサ、ファックス、電話装置、ステレオ、電化製品等の外部電子装置と通信することが可能である。当然のことながら、本発明の実施形態は、そのような方法により、ユーザーがポータブル通信装置を用いてどこからでも自分のコンピュータと通信できるようにする。
例えば、1つの実施形態において、ユーザーは携帯電話機を操作して自分のコンピュータに通話することができる。通信が確立されたあと、前記ユーザーは、前記ソフトウェア・コンポーネントがアクセスするように設定されたどのようなタイプの情報でも要求することができる。別の実施形態において、前記コンピュータはそのような携帯電話機を経由して前記ユーザーに連絡することにより、例えば前記ユーザーに予約等について通知することができる。また、当然のことながら、前記携帯電話機は、あらゆる音声認識を実行する必要がなく、前記ユーザーがアクセスしようとする前記ユーザー情報のいずれも含む必要もない。事実、本発明の1つの実施形態によれば、コンピュータ実行ソフトウェアと共に、従来の市販の携帯電話機等を用いることが可能である。その結果、本発明の実施形態は、ユーザーが様々な通信装置から好きなものを使い、自分のコンピュータの強力な演算能力をどこからでも使えるようにする。
1つの実施形態によるそのようなコンピュータの一例を、図1と共に以下に示す。同様に、コンピュータ及び1若しくはそれ以上の遠隔通信装置のデバイス・コンフィギュレーションの例を、図2A〜Cと共に以下に示す。上述のように、本発明の実施形態を実施する目的のために、インターフェース・プログラムによって、ソフトウェア及び/またはハードウェアが操作可能な方法で相互接続されるが、そのようなプログラムとソフトウェアのコンフィギュレーション例については、図3と共に以下で説明する。ユーザー始動のトランザクションの方法例を、図4A〜Cと共に以下に示す。コンピュータ始動のトランザクションの方法例を、図5と共に以下に示す。図6A〜Fは、本発明の1つの実施形態による、ソフトウェア及び/またはハードウェア・コンポーネント及びプログラムのコンフィギュレーション例を示す。最後に、図7A〜Bは、1つの実施形態によるスプレッドシートのコンフィギュレーション例を示す。以下の説明において、そのようなソフトウェア及び/またはハードウェア・コンポーネント及び通信装置の導入に関する詳細、及び相互操作性の技術的な特徴は、当業者には既知のものと理解されるため、本明細書においては除外する。
次に図1を参照すると、本発明の特徴を実施することが可能なコンピュータ実施例100が示されている。コンピュータ100は、本明細書に記述の方法を実行する能力のあるコンピュータであれば、汎用でも特殊演算装置でもよい。1つの実施形態において、コンピュータ100はCPU筐体102と、キーボード104と、ディスプレー装置106と、マウス108とを有する。当然のことながら、本発明の実施形態との一貫性を維持したまま、コンピュータ100のコンフィギュレーションを設定するいくつもの方法が可能である。例えば、コンピュータ100は、ラップトップ・コンピュータの場合のように、統合されたディスプレー装置106とCPU筐体102とを有することができる。別の実施形態において、コンピュータ100は、キーボード104及び/またはマウス108の代わりに、若しくはそれと共に、ユーザー入力を受け入れる代替手段を有することができる。1つの実施形態において、前記インターフェース・プログラムまたはソフトウェア・コンポーネントなどのようなプログラム130が、前記ディスプレー装置106に表示される。そのようなインターフェース・プログラム及びソフトウェア・コンポーネントについて、図3及び6と共に以下で説明する。
また、1つの実施形態においてコンピュータ100は、例えばインターネットやイントラネットのようなネットワーク120と操作可能な方法で接続される。コンピュータ100はさらに、データ処理のためのプロセッサ112、データ格納のためのメモリ110、前記ネットワーク120と通信するための入出力(I/O)114、及び/または電話線などのようなもう1つの通信媒体を有する。当然のことながら、コンピュータ100のプロセッサ112は、単一のプロセッサでも相互接続された複数のプロセッサでもよい。メモリ110は、例えば、RAM、ROM、ハードドライブ、CD−ROM、USB格納デバイスなどでも、あるいはそのようなメモリのタイプの組み合わせでもよい。加えて、メモリ110は、コンピュータ100の内部または外部に取り付けることができる。入出力114は、ユーザーまたは外部装置がコンピュータ100に通信するのを可能とするものであれば、どのようなハードウェア及び/またはソフトウェア・コンポーネントでもよい。入出力114は、内部及び/または外部に取り付けられる複数の装置でよい。
次に図2A〜Cは、本発明の特徴を実施することが可能なコンピュータ・コンフィギュレーションの例を示す。図2Aは、筐体102と、キーボード104と、ディスプレー装置106と、マウス108とを有する、図1と共に上述したようなコンピュータ100を示す。加えて、マイクロフォン202及びスピーカ203が、操作可能な方法でコンピュータ100に接続される。当然のことながら、音波を受信してコンピュータ100による解釈が可能な電気的信号に変換するために、マイクロフォン202に適応可能である。スピーカ203は、コンピュータ100からの電気的信号を音波に変換するという、逆の機能を果たす。当然のことながら、ユーザーはコンピュータ100に対するコマンドまたはリクエストを発するためにマイクロフォン202に向かって話すことができ、コンピュータ100はスピーカ203を通して応答することができる。逆にコンピュータ100は、スピーカ203を通して発話するか音を出すことにより、あるいはディスプレー装置106などにメッセージを表示することにより、ユーザーとの「会話」を始めることができる。図2Aが示すように、キーボード104、マウス108、マイクロフォン202、及び/またはスピーカ203のいずれかに加え、若しくはその代わりに、カリフォルニア州サニーヴェイル(Sunnyvale)のActiontec Electronics,Inc.製のInternetPhoneWizardのような、任意のコード付またはコードレスの電話機またはスピーカフォンを、例えば前記コンピュータ100に接続された電話ゲートウェーを経由してコンピュータ100に接続することができる。認識されるように、1つの実施形態において、従来のコード付またはコードレスの電話機またはスピーカフォンのような電話機210が、マイクロフォン202及びスピーカ203のリモート版としての役割を果たし、それにより、コンピュータ100とのリモート交信が可能である。コンピュータ100に接続するために特に設計された電話機210の一例として、イリノイ州エルク・グローブ・ビレッジ(Elk Glove Village)のClarysis社製のClarisys i750 インターネット電話機が挙げられる。
図2Bは、筐体102と、キーボード104と、ディスプレー装置106と、マウス108とを有する、図1と共に上述したようなコンピュータ100を示す。加えて、コンピュータ100は、操作可能な方法でローカル電話機206に接続される。認識されるように、1つの実施形態において、コンピュータ100は、外部電話の存在を必要とせずに直接に電話線に接続される。コンピュータ100は、例えば入出力114を経由して電話線から信号を受信するように適応可能である(ローカル電話206の代わりとなるのであり、図2Bには示されていない)。前述の実施形態において入出力114は音声モデムまたは同等の装置である。任意のリモート電話機204及び/または携帯電話機208を、操作可能な方法でローカル電話機206または音声モデムに接続することもできる。また別の実施形態において、ローカル電話機206は携帯電話機であり、コンピュータ100との通信は携帯電話ネットワークを介して行われる。
例えば、1つの実施形態において、ユーザーは、リモート電話機204または携帯電話機208を経由してローカル電話機206につながる電話番号をかけることができる。前述の実施形態において、コンピュータ100は、設定済みの信号などを検出するためにすべての着信通話をモニタし、そのような信号を検出すると、前記通話からのそのような情報を前記インターフェース・プログラムまたはその他のソフトウェア・コンポーネントに転送する。前述の方法において、前記通話と接続するとコンピュータ100は、前記ユーザーからの音声コマンドまたはリクエストを受信し、応答を発することができる。逆に、前記コンピュータ100は、ユーザーのリモート電話機204または携帯電話機208へ通話することによって会話を始めることができる。当然のことながら、コンピュータ100は電話ダイヤル機能を有することができるか、若しくはローカル電話機206があればそれを使って同じ機能を実行することが可能である。
当然のことながら、電話機204〜208は、距離を隔てて音を再生する器具であればよく、前記において、音は(アナログまたはデジタル形式のいずれかの)電気インパルスに変換され、有線方法または例えばセル方式ネットワークのような無線(ワイヤレス)方法のいずれかによって送信される。当然のことながら、1つの実施形態において、コンピュータ100にリモート・アクセスする電話機を使用することにより、前記ユーザーにとって比較的低コスト且つ容易に利用可能な送受話器が確保される。加えて、あらゆるタイプまたは数の周辺機器を電話機と接続して採用することが可能であり、そのようなタイプの周辺機器はいずれも、本発明の実施形態に等しく一致する。加えて、電話機204〜208のような電話機若しくはコンピュータ100で、どのようなタイプのフィルタリングまたは雑音消去を実行するハードウェアまたはソフトウェアを使うことも可能であるため、そのような電話機204〜208から受信する信号の強度及び/または明瞭度を増すことができる。
ローカル電話206として、例えば、家屋内の環境に置かれたまま前記コンピュータ100から離れた場所で使用するコード付きまたはコードレス電話機が可能である。代替実施形態として、例えばオフィス環境において、複数の電話線及び/または長距離コードレス電話機を本発明と接続して使用することができる。当然のことながら、本明細書において、単独のユーザーが単独の電話機204〜208を操作する状況の中で本発明の実施形態を説明しているが、ユーザー及び電話機204〜208の数はいくつでもよく、そのような数がいくつであっても本発明の実施形態と一致する。上述したように、ローカル電話機206は携帯電話機でも、携帯電話ネットワークを介する通信機能を持つ他の装置でもよい。
電話機204〜208に加え、または前記代わりとして、ポケベルや押しボタン式無線機(push−to−talk radios)のような装置をコンピュータ100に接続することができる。当然のことながら、前記ユーザーの情報のすべて若しくは大半が、コンピュータ100に格納される。従って、例えば電話機204〜208のような遠隔通信装置を紛失しても、前記ユーザーはデータを一切損失することなく、迅速且つ安価に前記装置を交換することができる。
図2Cも、筐体102と、キーボード104と、ディスプレー装置106と、マウス108とを有する、図1と共に上述したようなコンピュータ100を示す。図2Bと共に先に例示した実施形態と異なり、コンピュータ100は、ネットワーク120を経由して操作可能な方法でリモート電話機204及び/または携帯電話機208と接続されている。当然のことながら、コンピュータ100は、例えばダイアルアップ・モデム、DSL、ケーブル・モデム、衛星接続、T1接続などを経由してネットワーク120と操作可能な方法で接続することができる。例えば、ユーザーは、前記コンピュータ100に提供された「ウェブ電話」番号か従来の電話番号のような電話番号のうちいずれかに通話して、ネットワーク120を経由してコンピュータ100に接続することができる。同様に、コンピュータ100は、ネットワーク120を経由してリモート電話機204及び/または携帯電話機208に接続することができる。当然のことながら、前述の実施形態において、コンピュータ100はネットワーク120にアクセスするために電話ダイヤル機能を搭載しているか、若しくは操作可能な方法で電話ダイヤル機能と通信している。そのような機能を、ハードウェアまたはソフトウェア・コンポーネント若しくはそれらの組み合わせによって提供することができるが、それについては図4Bと共に以下により詳細に説明する。
そのような電話通信のコンフィギュレーション方法の例として、ボイス・オーバー・インターネット・プロトコル(VoIP)接続が挙げられる。前述の実施形態において、リモート電話は前記コンピュータ100に直接にダイヤルすることができ、ネットワーク120の特徴を使って前記インターフェース・プログラムに接続することができる。そのようなインターフェース・プログラムについて、図3及び6A〜Fと共に、以下により詳細に説明する。当然のことながら、代替実施形態において、コンピュータ100と通信するために、セッション・イニシエーション・プロトコル(SIP)電話機204〜208か、若しくはインスタント・メッセージング技術のようなものを使うことが可能である。
従って、本発明の特徴を実施することが可能なユーザー100のコンフィギュレーションの例をいくつか示す。当然のことながら、ユーザーをコンピュータ100に操作可能な方法で接続することにより、前記ユーザーが前記コンピュータ100と音声で通信することができるようにするあらゆる方法は、本発明の実施形態と等しく一致する。
従って、コンピュータ100とリモート通信するあらゆる手段は、本発明の実施形態と等しく一致する、と更に理解されたい。そのようなコンピュータ100が効果的にそのような遠隔通信装置と通信するには、採用される通信媒体のタイプにより、追加的な設備が必要なことがある。例えば、一般に発話認識エンジンへの入力は、マイクロフォンのような標準的入力から受信される。同様に、テキスト−スピーチ変換エンジンからの出力は、スピーカのような標準的出力装置に送られる。同様に、携帯電話機のような通信装置は、(ヘッドセット)マイクロフォンからの入力を受信し、スピーカに出力送信する機能を持つことが可能である。従って、本発明の実施形態は、前記発話エンジンと、前記コンピュータに直接に接続された通信装置(例えば、図2Bが示す電話機206)との間の接続を提供することにより、一般にスピーカに送られる前記装置からの出力を、(一般にマイクロフォンから送られる)前記発話エンジンの入力に転送する。同様に、装置テキスト−スピーチ変換エンジン(これも通常はスピーカに送られる)からの出力を前記装置の入力へつなげ、それにより前記装置が、離れた場所にいる通話者へ前記音声出力を転送するようにする接続が必要である。
基本的実施形態において、そのような転送は、(図2Bのように)パッチ・コードを用いて前記コンピュータに外付けされた電話機206との間で行われる。ただし、一部の実施形態では、前記信号は転送だけでなく調整も必要とする。例えば、前記音声信号がアナログの場合、1つの実施形態は、可変抵抗器や音量調節などによるインピーダンス整合を必要とする。前記音声信号がデジタルの場合、前記フォーマット(例えばサンプルレート、サンプルビット(ブロックサイズ)、チャネル数)の調整が必要である。
そのような信号転送と調整の別の実施形態には、前記コンピュータ100で前記インターフェースと共に作動する「ソフトフォン」ソフトウェアが関係する。そのようなソフトウェアは、セッション・イニシエーション・プロトコル(SIP)標準または例えばH.323の様なその他のプロトコルを用いたコンピュータ100でのVoIP電話通信による通話の送受信を促進する。そのようなソフトウェアの一例として、カナダのブリティッシュコロンビア州バーナビー(Burnaby)にあるXten Networks,Inc.製のX−PROが挙げられる。通常、ソフトフォン・ソフトウェアは、ローカル・スピーカまたはヘッドセットを経由してユーザーに電話音声を送信し、ローカル・マイクロフォンを経由して電話音声を受信する。コンピュータ100が利用可能な複数の音声装置を有することもあるため、そのようなソフトフォン・ソフトウェアが使う特別の音声装置を、ユーザー設定として選択可能であることが多い。上述のように、通常、テキスト−スピーチ変換ソフトウェアは、ローカル・スピーカまたはヘッドセットを経由してローカル・ユーザーに音声(出力)を送信し、発話認識ソフトウェアはローカル・マイクロフォンを経由して音声(入力)を受信する。従って、本発明の実施形態によって、前記ソフトフォン・ソフトウェアを前記テキスト−スピーチ変換ソフトウェア及び前記発話認識ソフトウェアに連結する必要がある。そのような連結は様々な方法で達成可能であり、ハードウェアかソフトウェア、若しくはそれらの組み合わせを用いることができる。1つの実施形態において、各アプリケーションにハードウェア音声装置が割当てられた後、適切な出力ポートと入力ポートがパッチ・ケーブルを用いて連結される。そのような配置により、前記ソフトフォンから前記発話認識ソフトウェアへの音声、及び前記テキスト−スピーチ変換ソフトウェアから前記ソフトフォン・ソフトウェアへの音声の流れが可能となる。そのような配置によって、スピーカ出力ポートをマイクロフォン入力ポートへ接続することになり、従って、1つの実施形態において、当然のことながら、パッチ・ケーブルにおけるインピーダンス整合を使って音のひずみが軽減される。
別の実施形態は、アプリケーション間の音声信号を連結する特殊なソフトウェアを使う。そのようなソフトウェアの例として、ソフトウェアで音声ケーブルをすべてエミュレートすることにより、音声信号の送受信をする異なるソフトウェア・プログラムの接続を容易にするVirtual Audio Cable(Eugene V.Muzychenko作のソフトウェア)が挙げられる。前述の実施形態において、一対のVirtual Audio Cableを、前記ソフトフォンから前記発話認識ソフトウェアへの音声、及び前記テキスト−スピーチ変換ソフトウェアから前記ソフトフォン・ソフトウェアへの音声の流れが可能となるようにコンフィギュレーションする。更に別の実施形態において、前記ソフトフォン・ソフトウェア、前記テキスト−スピーチ変換ソフトウェア、及び前記発話認識ソフトウェアに変更を加えるか、若しくはそれらを統合することにより、外部音声転送装置に求められるリクエストを完全に取り除く。
図3は本発明の実施形態に従ったソフトウェア及び/またはハードウェアのコンフィギュレーションの例をブロック図で示したものである。当然のことながら、本発明の1つの実施形態において、そのようなソフトウェアは前記コンピュータ100によって実行される。そのような方法によれば、図2A〜Cと共に上述したように例えば電話機204〜210のような遠隔通信装置でそのようなソフトウェアの実行を試みるのではなく、そのようなコンピュータ100の演算能力が活用される(明確に示すために図3には示されていない)。
当然のことながら、図3が示す各ソフトウェア及び/またはハードウェア・コンポーネントを、少なくとも別の1つのソフトウェア及び/またはハードウェア・コンポーネントに操作可能な方法で接続する。加えて、当然のことながら、図3が示しているのは本発明の実施形態の1つに過ぎず、ソフトウェア及び/またはハードウェア・コンポーネントのその他のコンフィギュレーションも実施形態と一致する。当然のことながら、図3が示すソフトウェア・コンポーネントとして、スタンドアロン型のプログラムやアプリケーション・プログラム・インターフェース(API)などが可能である。重要なのは、一部のソフトウェア・コンポーネントがすでにある場合には、それによって大幅な費用削減、複雑さの軽減、ハードディスク容量の節約、効率の向上が行われるという点である。
電話入力302は、例えば図2A〜Cと共に上述した入力装置を介して、ユーザーが音声発話または音声コマンド(例えばDTMF信号)により前記コンピュータ100と通信することを可能にする何らかのタイプのコンポーネントである。同様に、ユーザーが音として聞くための電気信号を出力するのが電話出力304である。当然のことながら、電話入力302と電話出力304のどちらも、例えば電話またはネットワーク120への信号の送受信のようなその他の目的を果たすために適応可能であり、そのような電話またはネットワーク120を通した接続を確立するために必要な機能を有するという目的も含めて適応可能である。電話入力302及び出力304として、前記コンピュータ100の内部または外部のハードウェア、若しくはソフトフォン・アプリケーション及び付属ネットワーク・インターフェース・カードのようなソフトウェアが可能である。
また、音声認識ソフトウェア310も提供され、前記ソフトウェアは、その名からもわかるように、電話入力302が受信する信号のような電子信号すなわちユーザーの音声発話を受け入れ、そのような発話を解読するように適応される。例えば音声認識ソフトウェア310は、特殊な音声認識ソフトウェアでも市販のものでもよい。そのような認識ソフトウェア310には、発話認識を最適化するためのユーザー・トレーニングが含まれている場合がある。加えて、ユーザーと通信するためのテキスト−スピーチ変換エンジン315を例証する。1つの実施形態におけるそのようなテキスト−スピーチ変換エンジン315は、電子データから音声メッセージを生成し、それを前記ユーザーに送信する。図3が示すように1つの実施形態において、自然言語処理モジュール325及び自然言語合成モジュール330を提供することにより、音声メッセージを解釈及び構成する。
ユーザー・データ320はコンピュータ100に格納またはアクセス可能なあらゆる種類の情報を有し、前記情報は本発明の実施形態に従って利用可能である。例えば、個人情報データファイル322として、あらゆるタイプの情報を含むあらゆるタイプのコンピュータ・ファイルが可能である。例えば、個人情報データベースに格納されるタイプの情報として、電子メール、予約ファイル、個人情報などが挙げられる。加えて、例えばスプレッドシート、データベース、文書ファイル、電子メールデータなども、そのような個人情報データファイル322として可能である。さらに、そのようなデータファイル322(及び以下のデータファイル324)は、ユーザーの裁量により、例えばガレージドアの開放、文書の印刷、ファックスの送信、電子メールの送信、家電品のスイッチ入力及び/または調整、テレビまたはラジオ番組の録音または再生、通信装置及び/またはシステムとのインターフェースなどの仕事を実行することができる。そのような機能を前記データファイル322〜324に含めること、若しくは、例えば電話入力302及び出力304、入出力350、及び/またはそれに類似のものを経由してそのような機能にそのようなデータファイル322〜324がアクセスできるようにすることができる。当然のことながら、前記インターフェース・プログラム300が、前記コンピュータ100内部の上述のようなコンポーネントを用いてそのようなような仕事を実行することができること、あるいは前記プログラム300が、電話入力302及び出力304、入出力350、及び/またはそれに類似のものを用いて、前記コンピュータ100の外部の装置とインターフェース接続できる。
ユーザーに代わりコンピュータ100がアクセスすることのできるもう1つのファイルは、ネットワークベース・データファイル324である。そのようなデータファイル324は、前記ユーザーのために最新情報を入手するための、マクロ、XMLタグ、またはネットワーク120にアクセスするその他の機能(例えばインターネット)を含む。そのような情報として、例えば株価、天気予報、ニュースなどが挙げられる。そのようなデータファイル324のもう1つの例について、以下、図7A〜Bにおいて、インターネット接続可能なスプレッドシートを使って説明する。当然のことながら、本明細書に記載するユーザー・データ320という言葉は、前記データファイル322及び/または324を含むあらゆるタイプのデータファイルを指す。前記インターフェース・プログラム300が前記ユーザー・データ320にアクセスするのを許可するために、データファイル・インターフェース335を提供する。当然のことながら、単独のデータファイル・インターフェース335、若しくは特定のファイルまたはファイルタイプとのみインターフェース接続可能な複数のインターフェース335が可能である。また、1つの実施形態において、前記インターフェース・プログラム300による時刻及び日付情報の決定を可能にするために、システム・クロック340を提供する。加えて、1つの実施形態において、外部装置やコンポーネントとのインターフェース接続のための入出力350を提供する。例えば、入出力350は、プリンタ・ポート、シリアル・ポート、USBポートなどを1若しくはそれ以上有することができる。
インターフェース・プログラム300は、そのようなハードウェア及びソフトウェア・コンポーネントに、操作可能な方法で接続されている(図中点線で示されている)。以下、そのようなインターフェース・プログラム300に付随されるユーザー・インターフェースの例について、詳細を図6A〜Fと共に説明する。しかし、前記インターフェース・プログラム300自体は、スタンドアロン型のプログラムか、本発明の実施形態に従ってタスクの実行を調整するソフトウェア・コンポーネントのいずれかである。例えば、前記インターフェース・プログラム300は、その他のソフトウェア・コンポーネントを制御し、且つ、どのユーザー・データ320が開かれていて、どの「文法」(ユーザーが話すと見込まれるフレーズ)が聞き取られるかを制御する。
当然のことながら、前記インターフェース・プログラム300自体は、前記ユーザーが関心を持つユーザー・データ320を含む必要がない。そのような方法において、前記インターフェース・プログラム300は、そのようなユーザー・データ320またはその他のソフトウェア・コンポーネントから独立に変更及び更新が可能な比較的小さくて効率的なプログラムのまま維持される。加えて、そのようなモジュール式コンフィギュレーションは、あらゆるタイプのソフトウェア・コンポーネントを実行中の、あらゆるコンピュータ100において、前記インターフェース・プログラム300を使うことを可能にする。その結果、適合性の問題が軽減される。さらに、前記インターフェース・プログラム300が、パーソナル・コンピュータのようなコンピュータ100で作動するよう設計されたコンポーネント及びプログラムを使用することにより、高度な音声認識を非サーバー演算環境で実行することが可能になる。従って、前記インターフェース・プログラム300は、サーバーではなくコンピュータ100で実行するように設計された、コンピュータ100のユーザーが使い慣れたプログラムとインターフェース接続する。例えば、そのようなプログラムとして、コンピュータ100のオペレーティング・システムの一部であるか、若しくは前記にアクセス可能な既存のソフトウェア・アプリケーションが可能である。当然のことながら、そのようなプログラムとしても、スタンドアロン型のアプリケーションやハードウェア・インターフェースなどが可能である。
また、本発明の実施形態がモジュール式であることにより、実質的にあらゆる音声認識ソフトウェア310の使用が可能であることも、理解されたい。しかし、人間の発話パターンと訛りが実に様々であることにより、そのような認識ソフトウェア310の精度は制約される。従って、1つの実施形態において、そのようなソフトウェア310の精度を、前記ソフトウェア310が認識する音声素材のコンテクストを制約することによって改善する。例えば、ある特定の対象分野からの言葉を前記ソフトウェア310が認識するように制限すれば、前記ソフトウェア310が、数多くの無関係な言葉と類似した音声の発話を、前記特定された対象分野に関連する言葉として正しく認識する見込みは高まる。従って、1つの実施形態において、前記インターフェース・プログラム300がアクセスする前記ユーザー・データ320を、そのようなコンテクスト制約を実行する方法によってコンフィギュレーション及び整理する。そのようなコンフィギュレーションは、図3で例示した前記インターフェース・プログラム300若しくはその他のソフトウェア・コンポーネントに変更を加える必要なく、前記ユーザー・データ320自体において実行することができる。
例えば、Microsoft(登録商標)Excelのようなスプレッドシート・アプリケーションは、前記インターフェース・プログラム300と共に使うのに適した方法でデータの格納及びアクセスをするための手段を提供する。スクリプトファイル、アラームファイル、参照ファイル、コマンドファイル、ソルバーファイルなどはすべて、本発明の実施形態において使用することが可能なスプレッドシート・ファイルのタイプである。本発明の実施形態と共にスプレッドシートを使うことについて、以下、図7Aと共に詳細に説明する。
スクリプトファイルは、ユーザーとコンピュータ100の間で交わされる音声ダイアログのためのスプレッドシートである。例えば、1つの実施形態において、スプレッドシートの1若しくはそれ以上の列(または行)は、ユーザーによって発話され得る文法を表し、従って、前記インターフェース・プログラム300によって認識され、前記スプレッドシートの1若しくはそれ以上の列(または行)は、前記コンピュータ100の応答を表す。従って、ユーザーが例えば「ハロー」と言えば、前記コンピュータ100は「ハーイ」あるいは「グッドモーニング」などと言うことができる。それにより、そのようなスクリプトファイルは、よりユーザー・フレンドリーなコンピュータ100との交信を可能にする。
1つの実施形態において、アラームファイルは、所望の機能に対応するスプレッドシートの1若しくはそれ以上の列(または行)にエントリを有する。例えば、前記スプレッドシートの1つのエントリは、前記ユーザーが例えば薬を飲むとか会議に出席するといったことをする特定の日付及び/または時刻に合わせて設定された「お知らせ」機能に対応することができる。従って、前記インターフェース・プログラム300は、電話出力304のようなコンポーネントとインターフェース接続することにより、前記ユーザーに連絡してそのお知らせを伝える。従って、当然のことながら、設定済みの条件に対するアクションを起こすためにアラームファイルが実行されている必要があるため、一部の実施形態においてアラームファイルが常にアクティブである。
1つの実施形態において、参照ファイルは情報を含むスプレッドシート、若しくは情報を相互参照するスプレッドシートである。1つの実施形態において、前記情報のすべてが前記参照ファイルに含まれており、別の実施形態においては、前記参照ファイルは前記参照ファイルの外にあるデータソースからの情報を参照する。例えば、スプレッドシートは、(例えば「スマートタグ」などを使うことにより)インターネット上で利用可能なデータを参照するセルを含むことができ、前もって設定済みの間隔でそれを「リフレッシュ」することにより、情報を常に確実に更新することができる。従って、ユーザーのために例えば株価、スポーツのスコア、天気などの情報を検索するために参照ファイルを使うことができる。当然のことながら、そのような情報をコンピュータ100にローカルまたはリモートに格納可能である。
1つの実施形態においてコマンドファイルは、ユーザーに前記コンピュータ100へのコマンドを入力させ、前記コマンドを実行するために適切なコンポーネントと前記インターフェース・プログラム300とをインターネット接続させるスプレッドシートである。例えば、前記ユーザーが歌を聴きたいと思ったときに、前記インターフェース・プログラム300はその歌を奏でるためにミュージック・プログラムとインターフェース接続することができる。1つの実施形態においてソルバーファイルは、コンピュータ100に音声で尋ねることによって、ユーザーが数学及びその他の分析の問題を解くことを可能にする。
ファイルの各タイプにおいて、そこに含まれるデータは、一連の行及び/または列に整理され、前記データは、前記ユーザーが参照しているデータを決定するために前記音声認識ソフトウェア310が認識する必要のある「文法」または文法へのリンクを含む。上述のように、本発明の実施形態で用いたスプレッドシートの例について、以下、図7A〜Bと共に説明する。
上述のように、スクリプトファイルとは、所望の情報をユーザーに提供する、または所望のタスクをユーザーが実行するのを前記インターフェース・プログラム300によって支援することが可能な、スプレッドシート技術の単純なアプリケーションである。当然のことながら、実施形態において使用される具体的な音声認識ソフトウェア310によって、そのようなスクリプトの構文はユーザーの音声発話についてそのようなソフトウェアが何を聞き取るかに影響を与える。図7Aと共に以下に説明するように、本発明の実施形態は臨機応変な文法と、そのような文法をプログラムするためのユーザーにとって使いやすい方法とを提供するので、所望のタスクをコンピュータ100に行わせるために発話すべき言葉をユーザーが丸暗記する必要はない。
ユーザーが要求したときに、例えば参照ファイルだけを開くように、1つの実施形態のコンフィギュレーションを行った。そのような方法において、前記コンピュータ100が解読する必要のある可能性がある文法の数を削減することにより、そのような音声認識の速さと信頼性が向上する。加えて、そのようなコンフィギュレーションは、他の活動のためにコンピュータ100のリソースを解放することにもつながる。そのようなファイルを開こうとするユーザーは、例えば「株価を参照」といった音声コマンドを発話する。するとコンピュータ100は、データファイル322〜324若しくはそれと同類のどのデータファイルが前記音声発話に応答するかを決定してそれを開く。次に前記コンピュータは、前記データがアクセス可能になったことを音声の合図によって前記ユーザーに伝える。
代替実施形態において、前記ユーザーは、前記標準スプレッドシート技術を用いた前記スプレッドシートまたはそれと同類のものへの記入を行わない。代わりに、例えば標準テンプレート・ファイルを記入するために、ウィザード、API、またはそれと同類のものを使うことができる。別の実施形態において、そのようなテンプレートに記入するために、キーボード104またはそれと同類のものを使う代わりに、そのような発話認識技術を用いることができる。更に別の実施形態において、前記インターネットプログラム300は、一連の音声質問によって前記ユーザーを促すことができ、それに対し前記ユーザーは答を発話することができる。そのような方法において、前記コンピュータ100はより詳細な質問を問うこと、ユーザー・データ320を作成または変更することなどができる。さらに、また別の実施形態において、ウィザードは、既存のスプレッドシートまたはインターネットなどからダウンロードしたスプレッドシートを、前記インターフェース・プログラム300にアクセス可能且つ理解可能なフォーマットに変換する。
従って、図3に示したそのようなコンフィギュレーション例において、本発明の実施形態に従った前記インターフェース・プログラム300は、ユーザーとの間で情報の送受信をすることが可能である。そのような情報には、(例えばメモリ110の中など)コンピュータ100の中、インターネットなどネットワーク120の中、及び/または前記と同類のものの中に含まれ得るユーザー・データ320が含まれ得る。従って、そのようなタスクを実行する方法について、図4及び5と共に、以下において説明する。
次に図4A〜Cは、本発明の実施形態に従った、ユーザー始動のトランザクションの方法例を示す工程図である。上述の図3と共にアラームスクリプトについて説明したように、1つの実施形態において、前記インターフェース・プログラム300は電話出力304を経由してトランザクションを開始することもできる。以下、そのような状況について、図5と共に以下に説明する。
ステップ405において、ユーザーは前記コンピュータ100と通信を確立する。そのような確立は、例えば、図2B〜Cと共に上述した携帯電話機208を経由して前記ユーザーが前記コンピュータ100に通話することによって可能となる。そのような確立は、例えば、前記ユーザー・データ320などへアクセスするためにセキュリティをクリアするといったような中間的な工程を持つこともできると、理解されたい。任意の工程410において、前記ユーザーに「音声」のプロンプトが提供される。そのようなプロンプトは、前記コンピュータ100による音声発話聞き取り準備ができていることを前記ユーザーに示すという簡単なものでよく、若しくはそのようなプロンプトは、日付、時刻などのようなその他の情報を有することもできる。
工程415において、例えば前記電話入力302などを経由して、ユーザー・リクエストが受信される。工程420において、前記ユーザーのリクエストを決定するために、前記リクエストの構文分析及び/または分析が行われる。そのような構文分析及び/または分析は、例えば前記音声認識モジュール310及び/または前記自然言語処理モジュール325によって行われる。工程425において、前記ユーザーのリクエストに対応する所望の機能が決定される。当然のことながら、工程410〜425を、例えば音声認識ソフトウェア310が前記ユーザーのリクエストを認識するために、必要に応じ何度でも繰り返すことができる。そのような繰り返しは、例えば、前記ユーザーが前記コンピュータ100と通信するために用いる通信チャネルの質が悪いため、あるいは前記ユーザーの話し方が明瞭ではないため、あるいはその他の何らかの理由によって必要となることがある。
工程425により、前記ユーザーが要求しているものが、既存の情報またはコンピュータ100によるアクションであることが決定されたら、前記方法は図4Bの工程430へ進む。例えば、前記ユーザーは翌日の予約を前記コンピュータ100に読み取ってもらいたいと思うかもしれない。あるいは、以下に図7A〜Bと共に説明するように、前記ユーザーは現在の株価を知りたいかもしれない。前記場合と異なり、工程425により、前記ユーザーのリクエストに対応する所望の機能が、データの追加または作成をすることだと決定された場合は、前記方法は図4Cの工程450へ進む。例えば、前記ユーザーはメッセージの録音や、既存または新規連絡先の新しい電話番号の入力などを望んでいるかもしれない。
従って、図4Bを参照すると、工程430において、前記リクエストされたユーザー・データ320がインターフェース・プログラム300によって選択され、取得される。図3と共に上述したように、前記インターフェース・プログラム300によって適切なデータ・ファイル・インターフェース335が始動し、前記ユーザー・データ320と交信して前記リクエストされた情報へアクセスする。あるいは、例えば入出力350を用いて、リクエストされたアクションを実行するように前述のインターフェース335を適応することが可能である。工程432において、前記インターフェース・プログラム300は、前記テキスト−スピーチ変換エンジン315及び/または前記自然言語合成コンポーネント330のいずれかによる、前記ユーザー・データ320から取得した情報に基づく音声による答の生成、及び/または所望のアクションを引き起こす。前記リクエストされたデータによって必要とされる場合は、任意の工程434において、音声プロンプトを再び前記ユーザーに提供することにより、追加ユーザー・データ320のリクエストまたは前記オリジナル・リクエストの明瞭化を更に進める。任意の工程436においてユーザーの応答が受信され、任意の工程438において前記応答が再び構文分析及び/または分析される。当然のことながら、そのような任意の工程434〜438は、図4Aの工程410〜420と共に上述したように実行される。また、当然のことながら、前記所望する機能が、前記インターフェース・プログラム300によるアクション(例えば、ガレージドアを開く、ファックスを送信する、文書を印刷するといった措置)であるならば、(例えば前記ユーザーに、前記アクションが滞りなく実行されたことを伝えるための)応答がいずれにせよ生成される場合もあるが、応答が必要ない場合もあるので、前述の工程434〜438は任意である。工程440において、更なるアクションが必要かどうかの決定が行われる。必要であれば、前記方法は工程430へ戻り、更なるユーザー・データ320を取得する。更なるアクションが不要であれば、工程442において前記会話は終了する(例えば前記ユーザーが電話を切る場合)か、待機モードに置かれ更なるユーザー入力を待つ。
当然のことながら、工程425の決定の結果、前記ユーザーが具体的なアクションの実行を要求していると決定されることもある。例えば、前記ユーザーが電話をかけようとする場合がある。前述の実施形態において、前記インターフェース・プログラム300は、電話入力及び出力302及び304、入出力350、及び/または前記と同類の何か(明確に示すために図4Bでは示されていない)を経由して、前記ユーザーが支持した電話番号へ通話をするよう、セッション・イニシエーション・プロトコル(SIP)に指示を送る。別の実施形態において、前記ユーザーは、例えばMicrosoft(登録商標)Outlook(登録商標)若しくはその他の連絡データベースに登録された電話番号への通話をリクエストすることができる。前述の実施形態において、前記ユーザーは前記プログラム300に、前記連絡データベースに登録された具体的な名前または他のエントリへの通話をするようにリクエストし、前記プログラム300は前記SIPソフトフォンに、前記連絡データベースに登録された前記名前または他のエントリに付随する電話番号へダイヤルさせる。本明細書における説明は単独の通話に関連づけているが、通話数または接続通話数は何本でも可能であり、従って会議電話なども可能である。
前述の実施形態において通話をする際、前記プログラム300は、例えばSIP電話を利用して会議電話を始動し、それにより、前記ユーザー及び1人若しくはそれ以上の他のユーザーは、全員が同じ電話線で接続されると共に、音声でコマンドを発し、且つ前記プログラムからの情報をリクエストすることが可能である。特定の文法により、情報の提供及び/または具体的な活動を実行するよう前記プログラム300へ特定のリクエストが提供されるまでは、前記ユーザーらの会話を前記プログラムが静かに「聞く」ようにすることができる。あるいは、別のユーザーへの通話または複数ユーザー間の会議電話を前記プログラムがいったん始動すると、前記プログラム300は前記ユーザーから「遮断」する。
図4Aと共に上述したように、前記ユーザーは、データの取得または特定のアクションを単純に要求する代わりに、データを追加または作成したいと思うかもしれない。従って、図4Cの工程450において、新規データベースまたはスプレッドシートなどの形式、あるいは既存ファイルへの新規エントリとして、ユーザー・データ320が、上述の図4Aと共に受け取られるユーザーの指示に従って選択または作成される。工程452において、音声プロンプトが前記ユーザーに提供され、それにより前記ユーザーは前記新規データまたは指示を話すように指示を受ける。工程454においてユーザーの応答が受信され、工程456において前記応答が構文分析及び/または分析される。工程458において、工程450で作成または選択されたユーザー・データ320に、前記音声データまたはフィールドが追加される。任意のステップ460において必要であれば、追加の新規データを要求する音声プロンプトが再び前記ユーザーに提供される。任意の工程462においてそのようなデータが前記ユーザーの音声応答という形式で受信され、任意の工程464においてそのような応答が再び分析及び/または分析される。工程466において、更なるアクションが必要かどうかの決定が行われる。必要であれば、前記方法は工程458に戻り、前記音声データまたはフィールドを前記ユーザー・データ320に追加する。更なるアクションが不要であれば、工程468において前記会話は終了するか、待機モードに置かれて更なるユーザー入力を待つ。当然のことながら、そのようなプロンプト提供及びユーザー発話の受信は、図4A〜Bと共に上述したように行われる。
図4A〜Cと共に上述した方法と異なり、図5の方法は、本発明の実施形態に従った、コンピュータ100始動のトランザクションの方法例を示す。それに従い図5を参照すると、工程500においてユーザー・データ320がモニタされる。当然のことながら、例えばアラームファイル、予約データベース、電子メール/スケジューリング・プログラムファイルなどのようなユーザー・データ320の複数の例をインターフェース・プログラム300によってモニタすることができる。工程505において、モニタされるユーザー・データ320がアクション項目を含んでいるかどうかの決定が行われる。1つの実施形態において、前記インターフェース・プログラム300を適応し、例えばデータベースへのエントリのレビュー及び現行項目のうち、どれがアクションを必要とするかの決定を実行するためのシステム・クロック340を用いる。アクション項目が検知されなければ、前記インターフェース・プログラム300は引き続き工程500において前記ユーザー・データ320のモニタを実行する。前記ユーザー・データ320がアクション項目を含んでいれば、前記インターフェース・プログラム300は、工程510において前記ユーザーとの会話を開始する。そのような開始の実行は、例えば前記インターフェース・プログラム300がソフトウェア・コンポーネントによる前記ユーザーへの連絡を電話機204または携帯電話機208を経由して引き起こすことによって可能である。図2A〜Cと共に説明した上述のハードウェア・コンフィギュレーションは、いずれもそのような機能を実行することができる。
工程515において、音声プロンプトが前記ユーザーに送られる。例えば、前記ユーザーが自分の携帯電話機208に応えると、前記インターフェース・プログラム300が前記テキスト−スピーチ変換エンジン315に前記アクション項目に関するメッセージの生成を行わせる。当然のことながら、そのようなときに、例えばセキュリティ確認、設定済み挨拶などのようなその他の非アクション項目関連のメッセージも前記ユーザーへ音声で送られ得る。図4A〜Bと共に前述したように、工程520においてユーザーの応答が受信され、工程525において前記応答が構文分析及び/または分析される。工程530において、前記音声発話に基づき、更なるアクションが必要かどうかの決定が行われる。必要であれば、前記方法は工程515へ戻る。更なるアクションが必要でなければ、任意の工程535において、例えば前記データベース・インターフェース320に変更または設定を保存させるとかアラームをセットするといったような前記ユーザーのリクエストを完了するために、ユーザー・データ320に対して実行する必要のあるあらゆる調整を前記インターフェース・プログラム300が実行する。次に前記インターフェース・プログラム300は工程500に戻り、前記ユーザー・データ320のモニタを続ける。当然のことながら、前記ユーザーは前記コンピュータ100を遮断することも、他のタスクを実行するために接続を維持することもできる。事実、前記ユーザーは次に、例えば図4と共に上述した前記方法に従って取り扱われる指示を発することができる。
従って、当然のことながら、インターフェース・プログラム300はコンピュータ100に格納またはアクセス可能なユーザー・データ320に関する連絡をユーザーと送受信する機能を持つ。さらに、当然のことながら、一部の実施形態においてインターフェース・プログラム300は、前記ユーザーが離れたところからコンピュータ100にアクセスすることにより、前記ユーザーに見られずに実行する。ただし、前記ユーザーは、インターフェース・プログラム300が前記ユーザーの設定通りに作動するように、そのようなプログラム300のコンフィギュレーションまたは変更を実行する必要があるかもしれない。それに従い、図6A〜Fは、本発明の実施形態に従ったそのようなインターフェース・プログラム300のユーザー・インターフェース600の実施例を示すスクリーンショットである。上述のように、前記技術に精通した者であれば、コンピュータ100のディスプレー装置に表示するユーザー・インターフェースのプログラミング及びコンフィギュレーションを知っているはずなので、明確にするためにそのようなコンフィギュレーションに関する詳細は本明細書から省いた。
図6Aを参照すると、そのようなインターフェース・プログラム300のユーザー・インターフェース600が示されている。図6Aからわかるように、ユーザー・インターフェース600にはいくつかの選択可能なタブ602があり、各タブはそれぞれ機能ごとに分類された機能に対応する。当然のことながら、本発明の実施形態との一貫性を維持したまま、タブ602の代わりに、若しくはそれらに加えて、あらゆるタイプの選択機能を使うことができる。図6Aから判るように、ユーザー・インターフェース600は「メイン・メニュー」を提供する。ユーザー・インターフェース600のメイン・メニューの中には、ユーザーが発話可能な任意のフレーズ604のリストと共に、各フレーズ604が何を実行するかの簡単な説明が示されている。そのようなフレーズは、前記音声認識310及び自然言語処理325コンポーネントにより解読可能な前述の文法の例である。
次に図6Bを見ると、前記ユーザー・インターフェース600の別のビューが示されている。図6Bのビューには、利用可能な発話プロファイル606が表示されている。当然のことながら、図3と共に上述したように、1つの実施形態において前記音声認識ソフトウェア315(明確にするために図6Bでは省いた)を、可能な様々な発話プロファイルに対応するようにコンフィギュレーションすることができる。そのような異なるプロファイルは、図2と共に上述したように、例えば異なるハードウェアまたはソフトウェアのコンフィギュレーション、あるいは異なるユーザーに対応することができる。
次に図6Cを見ると、前記ユーザー・インターフェース600のまた別のビューが示されている。図6Cには、コンフィギュレーション・オプション608のリストが示されている。当然のことながら、前述のオプション608は前記インターフェース・プログラム300を前記ユーザーの設定に合わせてカスタマイズすることを可能にする。例えば、前記ユーザーの居住地のタイムゾーンなどを知るために、前記ユーザーの場所(例えば郵便番号などの条件による)を要求することができる。上述のように、前記インターフェース・プログラム300を、Microsoft(登録商標)Outlook(登録商標)やEudoraなどのような電子メール及び/またはカレンダーまたは予約ソフトウェアと交信するようにコンフィギュレーションすることもできる。その他の可能なコンフィギュレーション・オプション608として、また1つの実施形態において、音声フォーマット設定608a、接続設定608bなどが挙げられる。当然のことながら、前記ユーザー・インターフェース600を経由して、あらゆる数とタイプのコンフィギュレーション・オプション608をユーザーに提供することができ、そのようなコンフィギュレーション・オプション608は本発明の実施形態にいずれも等しく一致するものである。
次に図6Dを見ると、前記ユーザー・インターフェース600の別のビューが示されている。そのようなビューには、前記インターフェース・プログラム300に利用可能なユーザー・データ320のシート610が示されている。上述したように、前記インターフェース・プログラム300は他のプログラム、データファイル、ウェブサイトなどとインターフェース接続する機能を持つ。図6Dが示すビューは、ユーザーが選択または口頭リクエスト可能な「シート」として利用可能なファイルとプログラムとを示している。
次に図6Eを見ると、前記ユーザー・インターフェース600の別のビューが示されている。図6Eには、利用可能な検索レコード614と共に、利用可能な検索フレーズ612が記載されている。図3と共に上述したように、前記インターフェース・プログラム300及び/または前記ユーザー・データ320は、前記コンピュータ100が前記音声認識コンポーネント310を経由して認識を試みる設定済みフレーズまたは文法の一式を有することができる。従ってそのような方法において、前記音声認識コンポーネント310による解釈の信頼性を向上することができる。以下、そのような文法について、図7と共により詳細に説明する。
次に図6Fを見ると、前記ユーザー・インターフェース600のまた別のビューが示されている。このビューには、前記音声認識ソフトウェア310によるユーザーの音声リクエストの分析を示すダイアログ618が示されている。当然のことながら、本発明の1つの実施形態において、ユーザーが前記コンピュータ100から離れた場所にいれば、前記ユーザーが前述のダイアログ618を見ることはない。ただし、診断、娯楽、その他の目的のために、前述のダイアログ618を前述のユーザー・インターフェース600によって示すことができる。
次に図7Aを見ると、ユーザー・データ320のシート700が示されている。当然のことながら、図7Aが示すように、例示のシート700はスプレッドシートであるが、コンピュータ100に格納またはアクセス可能なタイプのデータであれば前記シート700はどのようなタイプの情報データでもよい。前記シート700には、文法712のリストと検索レコード714が示されており、図7Aにおいて前記レコードは個別株レコードである。加えて、図7Aから判るように、前記スプレッドシート700はデータのシート716をいくつか有しており、前記シートのいずれも本発明の実施形態にアクセス可能である。シート716は、ユーザーがアクセス可能な複数レベルのデータが前記スプレッドシート716に含まれていることを示している。図3と共に上述したように、あらゆる方法であらゆるタイプのファイルに格納して整理されたあらゆるタイプのユーザー・データ320は、本発明の実施形態と等しく一致する。
ただし、1つの実施形態において、前記コンピュータ100と入出力される音声は、シート716の各列の1行目と2行目に置かれる。前述の実施形態において、質問全体あるいはキーワードのみなどを検知するように前記コンピュータ100をプログラムすることができる。従って前記コンピュータ100は、第2行目が示すように設定済みの返答により応答する。1つの実施形態において、前記返答は前記質問を何らかの形で復唱することにより、前記ユーザーが混乱しないようにし、且つ前記コンピュータ100が前記ユーザーの質問を正確に解釈したことを前記ユーザーに知らせる。
当然のことながら、ユーザーはカスタマイズされた情報で前述のスプレッドシート700をプログラムすることができ、それにより前記ユーザーは、前記ユーザーが所望するあらゆる情報をあらゆるフォーマットで含むことができるスプレッドシート700を有することになる。加えて、スプレッドシートを利用することにより前記ユーザーは、インターネットなどのようなネットワーク120から、前述のスプレッドシート700を例えばダウンロードすることができる。当然のことながら、前述のスプレッドシート700のプログラムの完全な機能(ウェブクエリー、スマートタグなどを含め)を使うことにより、使用される前記インターフェース・プログラム300及び前記遠隔通信装置の両方から独立したデータを格納及び利用するための柔軟な手段を前記ユーザーに提供し得る。当然のことながら、図7に例示した株価スプレッドシート700は、前記ネットワーク120などを経由して株価を自動更新する機能を用いることにより、時間に依存するデータを常に更新する。
当然のことながら、1つの実施形態において前述のフレーズ712は、同じ情報を要求するための複数の可能な文法を含む。そのような方法において、前記ユーザーは所望のクエリーの構文を丸暗記する必要がなく、これは前記ユーザーが前記コンピュータ100から離れた場所にいる実施形態において顕著である。従って、発話構文に若干の変化を持つリクエストでも、前記コンピュータ100によって認識される。
例えば、ある具体的な株の現在の価格を要求する文法が臨機応変でないと、「現在の[レコードの]価格を示してください(What is the current price of [record]?)」という構文と一言も違わない音声発話のみに応答が返されることになるかもしれない。これに対し臨機応変に対応できる文法は、例えば[レコード]の「最後の価格(last price)」「現在の価格(current price)」「価格(current price)」は「いくらですか(what is)」「いくら(what’s)」「いくらでしたか(what was)」など、前記コンピュータ100に話しかけるユーザーが使う可能性のある、文法的に同等のフレーズを複数含むことができる。従って、ユーザーが「[レコード]の価格を示してください(what’s the price for[record]?)」と言っても、「[レコード]の最後の価格はいくらでしたか(what was the last price of [record]?)」と言っても、同じ応答を得ることになる。当然のことながら、1つの実施形態において、ロジカル記号などを経由してそのような臨機応変な対応を提供するが、臨機応変な文法を提供するそのような方法はすべて、本発明の実施形態と等しく一致する。前記スプレッドシート700の第2行目が示すように、上述の質問への返答は、「[レコード]の最後の価格は[いくら]でした。(the last price for[record]was[price].)」というようなものになる。
1つの実施形態において、前記インターフェース・プログラム300は、前記データファイル・インターフェース335を経由して、ロジカルでありながら人間味のある方法でユーザーが容易にデータにアクセスできる方法によって、Microsoft(登録商標)Excelスプレッドシートのようなスプレッドシートとインターフェース接続する。データファイル・インターフェース335は、例えばシート2の第1行目にある入力文法、シート2の第2行目にある出力文法、及びシート2の第1列目にあるレコード・ラベルを検索する。ユーザーが前記インターフェース・プログラム300にファイル検索を依頼すると、前記データファイル・インターフェース335は前記スプレッドシートを開き、シート2へ行く。前記インターフェース・プログラム300は、可能な入力文法(すなわち臨機応変な文法に関係するあらゆる形式による1行目の全質問)をすべて生成し、すべてのレコードと組み合わせる。例えば、上記の例において臨機応変な文法は、[レコード]の(of/for)「最後の価格(last price)」[現在の価格(current price)]「価格(price)」は「いくらですか(what is)」「いくら(what’s)」「いくらでしたか(what was)」である。そのような文法は、「いくらですか(what is)」「いくら(what’s)」「いくらでしたか(what was)」という3つの文法を生成する。これを、「最後の価格(last price)」[現在の価格(current price)]「価格(price)」という3つの文法で掛け、更に「of」または「for」という2つの文法で掛け、次に前記シートにある株(レコード)の数で更に掛ける。
次に、前述の実施形態において、識別された入力文法に対応するテキスト−スピーチ変換出力文法を用いて応答するように、前記インターフェース・プログラムをプログラムする。通常、前記出力文法は、前記入力文法の一部であるレコード・ラベルを有する、2行目にある「出力文法」と、前記入力文法の行及び前記入力レコードと相関するセル内にあるデータ「エレメント」との組み合わせである。次に、前記インターフェース・プログラム300は、前記テキスト−スピーチ変換出力を、前記選ばれた出力通信装置へ送信する。このフォーマットにより、前記ユーザーは、便利で個人に合った入力及び出力文法を容易にプログラムすることができる。
また、当然のことながら、一部の実施形態またはコンテクストにおいては、臨機応変な文法が適切ではないことがあり、その他の実施形態においては、前記コンピュータ100の音声テキストも臨機応変な文法であることがある。そのような方法において、前記コンピュータ100は、より現実的な方法でテキストを変化させるため、前記ユーザーに、より「自然な」感じを与える。そのような変化は、例えば、複数の同等な文法の1つを無作為に選択するか、若しくは特定のユーザーや時刻などに従うことによって達成され得る。
また、当然のことながら、スプレッドシート700は特定のタスクを実行するためのマクロを含むことができる。例えば、スプレッドシートの1つのエントリを、同じまたは異なるスプレッドシートにある「Joe Smith」だけでなく別のアプリケーションにある「Joe Smith」というエントリにも付随する電話番号の検索によって、「Joe Smith に電話する(call Joe Smith)」というコマンドに応答するようにコンフィギュレーション設定することができる。次に、前記インターフェース・プログラム300は、電話番号をダイヤルするためのコンポーネントにアクセスし、前記電話番号がダイヤルされ、前記ユーザーへの通話が接続する。そのような機能のいずれも、本発明の実施形態に従って用いることができる。例えば、図7Aのスプレッドシート700において、前記株価及びその他の情報を、各株価のアクティブなウェブリンクを経由してウェブサイトから取得する。また、当然のことながら、例えばタブ区切りテキストファイル、データベースファイル、ワープロファイルなどその他のタイプのファイルもすべて、前記ユーザーが多数の個人向けデータソースを作成することができるようなオープンなアーキテクチャを提供することができる。
次に図7Bを見ると、前記スプレッドシート700の別のビューが示されている。このビューにも、一連の検索レコード714が示されている。図7Bが示す検索レコード714は、様々な株価指数であるが、上述したように、前述のレコード714は、あらゆるタイプの情報を有することができる。当然のことながら、この株価指数の例及び図7Aの株価の例において、例えばインターネットのようなネットワーク120を経由して前述のレコード714に付随するデータを更新可能である。図7Aが示すケースのように、シート716は、ユーザーによってアクセス可能な複数のレベルのデータが前記スプレッドシート700に含まれることを示している。当然のことながら、図7Bの前記シート716は図7Aの前記スプレッドシート700の中に含まれるが、シート716及びスプレッドシートのあらゆる配置は、本発明の実施形態に等しく一致する。
このように、口頭コマンドを経由してコンピュータを操作可能な方法で遠隔通信装置に接続する方法及びシステムを提供する。本発明について、実施例の様々な図と共に説明してきたが、本発明から逸脱することなく本発明の同じ機能を実行するために、他の類似の実施形態を用いること、若しくは前述の実施形態に変更及び追加を加えることが可能であると理解すべきである。例えば、前記技術に精通した者であれば、本特許申請書に記述された本発明を、通信装置またはソフトウェア・アプリケーションのあらゆるコンフィギュレーションに適用することが可能だと認識するであろう。従って、本発明はいずれか単独の実施形態に限定されるべきではなく、むしろ添付の特許請求の範囲に従う範囲の中で解釈されるべきである。
前述の要約、及び好ましい実施形態の詳細な説明は、添付の図面と合わせて考慮することによってより良く理解ができる。本発明を説明する目的で、図中に本発明の実施例を示したが、本発明は開示されている前記具体的な方法及び手段に限定されるものではない。
図1は、本発明の観点が実施されているコンピュータの例を示す。 図2A〜Cは、本発明の観点が実施されているコンピュータ・コンフィギュレーションの例を示す。 図2A〜Cは、本発明の観点が実施されているコンピュータ・コンフィギュレーションの例を示す。 図2A〜Cは、本発明の観点が実施されているコンピュータ・コンフィギュレーションの例を示す。 図3は本発明の実施形態に従ったソフトウェア・コンフィギュレーションの例を示すブロック図。 図4A〜Cは、本発明の実施形態に従った、ユーザー始動トランザクションの方法例を示すフローチャート。 図4A〜Cは、本発明の実施形態に従った、ユーザー始動トランザクションの方法例を示すフローチャート。 図4A〜Cは、本発明の実施形態に従った、ユーザー始動トランザクションの方法例を示すフローチャート。 図5は、本発明の実施形態に従った、ユーザー始動トランザクションの方法例を示すフローチャート。 図6A〜Fは、本発明の実施形態に従ったインターフェース・プログラムの実施例を示すスクリーンショット。 図6A〜Fは、本発明の実施形態に従ったインターフェース・プログラムの実施例を示すスクリーンショット。 図6A〜Fは、本発明の実施形態に従ったインターフェース・プログラムの実施例を示すスクリーンショット。 図6A〜Fは、本発明の実施形態に従ったインターフェース・プログラムの実施例を示すスクリーンショット。 図6A〜Fは、本発明の実施形態に従ったインターフェース・プログラムの実施例を示すスクリーンショット。 図6A〜Fは、本発明の実施形態に従ったインターフェース・プログラムの実施例を示すスクリーンショット。 図7A〜Bは、本発明の実施形態に従ったスプレッドシートの実施例を示すスクリーンショット。 図7A〜Bは、本発明の実施形態に従ったスプレッドシートの実施例を示すスクリーンショット。

Claims (86)

  1. コンピュータと交信するための方法であって、
    前記コンピュータと遠隔通信装置との間の通信接続を確立する工程と、
    ユーザーからのリクエストの形式で音声信号を受信する工程と、
    前記音声信号を処理して所望の機能を決定する、前記音声信号を処理する工程と、
    前記所望の機能が音声応答を要求しているかどうかを決定し、要求していれば、前記遠隔通信装置を経由して前記ユーザーへ音声応答を提供し、前記音声信号に応答する前記所望の機能を実行する工程と
    を有する方法。
  2. 請求項1の方法において、前記確立する工程は、前記コンピュータによって開始されるものである。
  3. 請求項1の方法において、前記確立する工程は、前記遠隔通信装置を経由してユーザーによって開始されるものである。
  4. 請求項1の方法において、前記確立する工程は、電話通信回線を確立する工程を有するものである。
  5. 請求項4の方法において、前記電話通信回線は、携帯電話ネットワークを経由するものである。
  6. 請求項1の方法において、前記確立する工程は、ボイス・オーバー・インターネット・プロトコル(VoIP)接続を確立する工程を有するものである。
  7. 請求項6の方法において、前記ボイス・オーバー・インターネット・プロトコル接続を確立する工程はさらに、電話通信回線を確立する工程を有するものである。
  8. 請求項7の方法において、前記確立する工程は、複数のテレコミュニケーション・ネットワークを経由するものである。
  9. 請求項7の方法において、前記ボイス・オーバー・インターネット・プロトコル接続は、セッション・イニシエーション・プロトコル電話を経由するものである。
  10. 請求項1の方法において、前記確立する工程は、前記コンピュータとの直接ワイヤレス通信回路を確立する工程を有するものである。
  11. 請求項10の方法において、前記直接ワイヤレス通信回路は、コードレス電話を経由するものである。
  12. 請求項1の方法において、この方法は、さらに、
    前記遠隔通信装置を経由してユーザーに音声プロンプトを提供する工程を有するものである。
  13. 請求項12の方法において、音声プロンプトを提供する工程は、出力文法を選択する工程と、前記出力文法を音声出力に変換する工程と、前記音声出力を前記遠隔通信装置を経由して前記ユーザーに送信する工程とを有するものである。
  14. 請求項1の方法において、前記音声信号は音声発話である。
  15. 請求項14の方法において、前記処理する工程は、前記音声発話を複数の可能な音声発話の文法と比較する工程と、前記ユーザーによって話された文法がどれかを決定する工程と、所望の機能を決定する工程とを有し、前記所望の機能が前記文法に対応するものである。
  16. 請求項15の方法において、複数の可能な音声発話の文法は、コンピュータ・ファイルに格納されるものである。
  17. 請求項16の方法において、前記コンピュータ・ファイルはスプレッドシートである。
  18. 請求項17の方法において、この方法は、さらに
    前記可能な音声発話の文法を前記スプレッドシートの第1のセルから選択する工程と、前記所望の機能を前記スプレッドシートの第2のセルから決定する工程とを有するものである。
  19. 請求項18の方法において、前記第1のセルは前記スプレッドシートの1行目にあり、前記第2のセルは前記スプレッドシートの2行目にあるものである。
  20. 請求項18の方法において、前記第1のセルは前記スプレッドシートの1列目にあり、前記第2のセルは前記スプレッドシートの2列目にあるものである。
  21. 請求項16の方法において、前記コンピュータ・ファイルはデータベースである。
  22. 請求項16の方法において、前記コンピュータ・ファイルはスケジューリング・プログラムと関連するファイルである。
  23. 請求項1の方法において、前記音声信号に応答して前記所望の機能を実行する工程は前記音声信号に従ってデータを検索する工程を有し、前記音声応答を提供する工程は前記データを音声フォーマットに変換し、前記音声フォーマットを前記通信接続を経由して送信する工程とを有する。
  24. 請求項1の方法において、前記音声信号に応答して前記所望の機能を実行する工程は、前記音声信号に従って格納データを修正する工程を有するものである。
  25. 請求項24の方法において、この方法は、さらに、
    前記ユーザーから新規データを受信し、前記新規データをファイルに記録する工程を有するものである。
  26. 請求項25の方法において、前記ファイルはデータベースである。
  27. 請求項25の方法において、前記ファイルはスプレッドシートである。
  28. 請求項25の方法において、前記ファイルはスケジューリング・ファイルである。
  29. パーソナル・コンピュータをユーザーと交信できるようにするための方法であって、
    データファイルにあるエントリを読み取る工程と、
    前記エントリに応答して、前記コンピュータと遠隔通信装置との間の通信接続を開始する工程と、
    前記エントリに従って音声通知を生成する工程と、
    前記遠隔通信装置を経由して前記音声通知を送信する工程と
    を有する方法。
  30. 請求項29の方法において、前記開始する工程は、電話通信回線を確立する工程を有するものである。
  31. 請求項30の方法において、前記電話通信回線は、携帯電話ネットワークを経由して行われるものである。
  32. 請求項29の方法において、前記開始する工程は、ボイス・オーバー・インターネット・プロトコル接続を確立する工程を有するものである。
  33. 請求項29の方法において、前記開始する工程は、前記コンピュータに直接ワイヤレス通信回路を確立する工程を有するものである。
  34. 請求項33の方法において、前記開始する工程はさらに、ボイス・オーバー・インターネット・プロトコル接続を確立する工程を有するものである。
  35. 請求項29の方法において、前記読み取る工程は、前記データファイルをメモリの中へロードし(読み込み)、前記データファイル内のエントリを認識する工程を有し、前記エントリは前記ユーザーにコンタクトを取る時刻を示すものである。
  36. 請求項35の方法において、可能な音声発話の文法は、前記データファイルに格納されるものである。
  37. 請求項36の方法において、前記データファイルはスプレッドシートである。
  38. 請求項36の方法において、前記データファイルはデータベースである。
  39. 請求項36の方法において、前記データファイルはアラームスクリプトである。
  40. 請求項36の方法において、前記データファイルはスケジューリング・プログラムと関連するものである。
  41. パーソナル・コンピュータへのアクセスを提供するためのシステムであって、
    前記コンピュータと遠隔通信装置との間の通信チャネルを確立する通信コンポーネントと、
    音声入力を受信し、この入力をデジタル形式に変換する音声認識コンポーネントと、
    テキスト形式データを音声形式に変換するテキスト−音声変換コンポーネントと、
    パーソナル・コンピュータに格納データを有するファイルと交信するためのファイル・インターフェース・コンポーネントと、
    インターフェース・プログラムであって、このインターフェース・プログラムは、前記通信チャネルを経由して前記入力を受信し、前記音声認識コンポーネントに前記入力を変換させて所望の機能を決定し、コンポーネントに前記所望の機能を実行させるようになっている、前記インターフェース・プログラムと
    を有するシステム。
  42. 請求項41のシステムにおいて、前記インターフェース・プログラムはさらに、前記所望の機能に従って前記ファイル・インターフェースに前記ファイルと交信させ、前記テキスト−音声変換コンポーネントに前記所望の機能の結果を音声形式で前記遠隔通信装置へ提供させるようになっているものである。
  43. 請求項41のシステムにおいて、前記インターフェース・プログラムはさらに、前記ファイル・インターフェースに前記ファイル内のデータを読み取らせ、前記通信コンポーネントに前記データに応じて前記遠隔通信装置と前記通信チャネルを確立させ、前記テキスト−音声変換コンポーネントに前記データに従ってメッセージを生成させ、さらに前記通信コンポーネントに前記メッセージを送信させるようになっているものである。
  44. 請求項41のシステムにおいて、前記システムはさらに、音声を生成するための音声生成コンポーネントを有し、前記インターフェース・プログラムはさらに、前記ファイル・インターフェースに前記ファイル内のデータを読み取らせ、前記通信コンポーネントに前記データに応じて前記遠隔通信装置と通信チャネルを確立させ、音声生成コンポーネントに音声を生成させ、さらに前記通信コンポーネントに前記音声を送信させるようになっているものである。
  45. 請求項41のシステムにおいて、前記通信チャネルは、前記コンピュータとケーブル相互接続を有する携帯電話、セル方式パーソナル・コンピューティング電話通信装置、コードレス電話、電話ゲートウェー装置、または前記コンピュータとケーブル相互接続を有するコード付電話のうちいずれか1つによって前記コンピュータで確立されるものである。
  46. 請求項41のシステムにおいて、前記通信チャネルは、携帯電話、コードレス電話、コード付電話、スピーカフォン、電話ソフトウェアを有する第2のコンピュータ、ボイス・オーバー・インターネット・プロトコル接続を有する第2のコンピュータ、またはインスタント・メッセージング・ソフトウェアを有する第2のコンピュータのうちいずれか1つによって前記遠隔通信装置で確立されるものである。
  47. 請求項41のシステムにおいて、前記通信チャネルは、PSTNネットワーク、携帯電話ネットワーク、ボイス・オーバー・インターネット・プロトコル・ネットワーク、または無線ネットワークのうちいずれか1つを経由して確立されるものである。
  48. 請求項47のシステムにおいて、前記通信チャネルは、複数のネットワークを経由して確立されるものである。
  49. 請求項41のシステムにおいて、前記音声入力は、リクエストの形式による音声発話である。
  50. 請求項41の方法において、前記音声入力はDTMF信号である。
  51. 請求項49のシステムにおいて、前記インターフェース・プログラムはさらに、前記所望の機能に従ってコンポーネントを選択し、前記選択されたコンポーネントに前記発話に従って前記所望の機能を実行させるようになっているものである。
  52. 請求項51のシステムにおいて、前記所望の機能は、前記格納データを取り出すことができるものである。
  53. 請求項51のシステムにおいて、前記所望の機能は、前記格納データを修正することができるものである。
  54. 請求項51のシステムにおいて、前記所望の機能は、新規データを前記コンピュータに追加することができるものである。
  55. 請求項51のシステムにおいて、前記所望の機能は、新規ファイルを作成することができるものである。
  56. 請求項51のシステムにおいて、前記所望の機能は、タスクを実行するができるものである。
  57. 請求項51のシステムにおいて、前記選択されたコンポーネントは、音声通信を記録するためのソフトウェア、音声通信を生成するためのソフトウェア、ハードウェア装置を制御するためのソフトウェア、またはソフトウェア活動を制御するためのソフトウェアのうちいずれか1つである。
  58. 請求項49のシステムにおいて、前記音声認識コンポーネントは、音声認識モジュールである。
  59. 請求項49のシステムにおいて、前記音声認識コンポーネントは、DTMFデコーダである。
  60. 請求項41のシステムにおいて、前記音声認識コンポーネント、テキスト−音声変換コンポーネント、及びファイル・インターフェース・コンポーネントは、アプリケーション・プログラム・インターフェースである。
  61. 請求項41のシステムにおいて、前記音声認識コンポーネント、テキスト−音声変換コンポーネント、及びファイル・インターフェース・コンポーネントは、ソフトウェア・アプリケーションである。
  62. 請求項41のシステムにおいて、前記ファイルは、スプレッドシート、電子メール・サーバー、電子メール・クライアント、データベース、モニタ、センサ、ワードプロセッシング・ファイル、またはエンタープライズ・アプリケーション・データのうちの1つである。
  63. 請求項62のシステムにおいて、前記ファイルは複数のファイルを有するものである。
  64. 請求項41のシステムにおいて、前記ファイル・インターフェース・コンポーネントは、インターネット・データとのリンクを有するスプレッドシートとインターフェース接続するものである。
  65. 請求項41のシステムにおいて、前記ファイル・インターフェース・コンポーネントは、インターネット・データとのリンクを有するデータベースとインターフェース接続するものである。
  66. 請求項41のシステムにおいて、前記ファイル・インターフェース・コンポーネントは、インターネット・データとのリンクを有するワードプロセッシング・ファイルとインターフェース接続するものである。
  67. 請求項41のシステムにおいて、前記ファイル・インターフェース・コンポーネントは、インターネット・データとのリンクを有するスケジューリング・ファイルとインターフェース接続するものである。
  68. 請求項41のシステムにおいて、前記インターフェース・プログラムはさらに、前記通信チャネルを確立し、前記テキスト−音声変換コンポーネントに音声警告を前記遠隔通信装置へ生成させるようになっているものである。
  69. 請求項68のシステムにおいて、前記インターフェース・プログラムは、前記格納データに応答して通信チャネルを確立するものである。
  70. 請求項69の方法において、前記格納データはアラームに対応するものである。
  71. コンピュータと交信するための、コンピュータ実行可能な命令を有するコンピュータ可読媒体であって、
    前記コンピュータと遠隔通信装置との間の通信接続を確立する工程と、
    ユーザーからのリクエストの形式で音声信号を受信する工程と、
    前記音声信号を処理して所望の機能を決定する、前記音声信号を処理する工程と、
    前記所望の機能が音声応答を要求しているかどうかを決定し、要求していれば、前記遠隔通信装置を経由して前記ユーザーへ音声応答を提供し、前記音声信号に応答する前記所望の機能を実行する工程と
    を有する方法。
  72. 請求項71のコンピュータ可読媒体において、前記確立する工程は、前記コンピュータによって開始されるものである。
  73. 請求項71のコンピュータ可読媒体において、前記確立する工程は、前記遠隔通信装置を経由して前記ユーザーによって開始されるものである。
  74. 請求項71のコンピュータ可読媒体において、このコンピュータ可読媒体は、さらに、
    前記遠隔通信装置を経由してユーザーに音声プロンプトを提供する工程を有するものである。
  75. 請求項74のコンピュータ可読媒体において、前記音声プロンプトを提供する工程は、出力文法を選択する工程と、前記出力文法を音声出力に変換する工程と、前記音声出力を前記遠隔通信装置を経由して前記ユーザーに送信する工程とを有するものである。
  76. 請求項71のコンピュータ可読媒体において、前記音声信号は音声発話である。
  77. 請求項76のコンピュータ可読媒体において、前記処理する工程は、前記音声発話を複数の可能な音声発話の文法と比較する工程と、前記ユーザーによって話された文法がどれかを決定する工程と、所望の機能を決定する工程とを有し、前記所望の機能は前記文法に対応するものである。
  78. 請求項77のコンピュータ可読媒体において、前記複数の可能な音声発話の文法は、コンピュータ・ファイルに格納されるものである。
  79. 請求項78のコンピュータ可読媒体において、前記コンピュータ・ファイルはスプレッド・シートである。
  80. 請求項79のコンピュータ可読媒体において、このコンピュータ可読媒体は、さらに、
    前記可能な音声発話の文法を前記スプレッドシートの第1のセルから選択する工程と、前記所望の機能を前記スプレッドシートの第2のセルから決定する工程とを有するものである。
  81. 請求項80のコンピュータ可読媒体において、前記第1のセルは前記スプレッドシートの1行目にあり、前記第2のセルは前記スプレッドシートの2行目にあるものである。
  82. 請求項80のコンピュータ可読媒体において、前記第1のセルは前記スプレッドシートの1列目にあり、前記第2のセルは前記スプレッドシートの2列目にあるものである。
  83. 請求項76のコンピュータ可読媒体において、前記音声発話に応答して前記所望の機能を実行する工程は前記音声発話に従ってデータを検索する工程を有し、前記音声応答を提供する工程は前記データを音声フォーマットに変換し、前記音声フォーマットを前記通信接続を経由して送信する工程を有するものである。
  84. パーソナル・コンピュータがユーザーと通信できるようにするための、コンピュータ実行可能な命令を有するコンピュータ可読媒体であって、
    データファイルにあるエントリを読み取る工程と、
    前記エントリに応答して前記コンピュータと遠隔通信装置との間の通信接続を開始する工程と、
    前記エントリに従って音声通知を生成する工程と、
    前記遠隔通信装置を経由して前記音声通知を送信する工程と
    を有するコンピュータ可読媒体。
  85. 請求項84のコンピュータ可読媒体において、前記開始する工程は、電話通信回線を確立する工程を有するものである。
  86. 請求項84のコンピュータ可読媒体において、前記読み取る工程は、前記データファイルをメモリの中へロードし(読み込み)、前記データファイル内のエントリを認識する工程を有し、前記エントリは前記ユーザーにコンタクトを取る時刻を示すものである。
JP2005500357A 2002-10-01 2003-10-01 コンピュータとのワイヤレス音声通信用システム及び方法 Pending JP2006501788A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US41531102P 2002-10-01 2002-10-01
US45773203P 2003-03-25 2003-03-25
PCT/US2003/031193 WO2004032353A1 (en) 2002-10-01 2003-10-01 A system and method for wireless audio communication with a computer

Publications (1)

Publication Number Publication Date
JP2006501788A true JP2006501788A (ja) 2006-01-12

Family

ID=32073368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005500357A Pending JP2006501788A (ja) 2002-10-01 2003-10-01 コンピュータとのワイヤレス音声通信用システム及び方法

Country Status (7)

Country Link
US (1) US20050272415A1 (ja)
EP (1) EP1576739A4 (ja)
JP (1) JP2006501788A (ja)
KR (1) KR20050083716A (ja)
AU (1) AU2003275388A1 (ja)
CA (1) CA2500574A1 (ja)
WO (1) WO2004032353A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050180464A1 (en) * 2002-10-01 2005-08-18 Adondo Corporation Audio communication with a computer
US7808969B2 (en) * 2005-06-10 2010-10-05 Hewlett-Packard Development Company, L.P. Voice over internet protocol (VoIP) ready computer system and method
US20070008912A1 (en) * 2005-06-23 2007-01-11 Cheng-Su Huang Method For Establishing Telephone Communication With A Wireless Web Phone In A Wireless Communication System
KR100742667B1 (ko) * 2005-09-15 2007-07-25 (주) 코아보이스 휴대가능한 음성 인식 및 합성장치 및 이를 이용한 음성 인식 및 합성방법
KR101373382B1 (ko) * 2006-05-31 2014-03-13 삼성전자주식회사 원격 장치 액세스 및 제어를 제공하기 위한 방법, 저장 매체 및 원격 장치
US20080071544A1 (en) * 2006-09-14 2008-03-20 Google Inc. Integrating Voice-Enabled Local Search and Contact Lists
US20080144134A1 (en) * 2006-10-31 2008-06-19 Mohamed Nooman Ahmed Supplemental sensory input/output for accessibility
US8995626B2 (en) * 2007-01-22 2015-03-31 Microsoft Technology Licensing, Llc Unified and consistent user experience for server and client-based services
US8626237B2 (en) * 2007-09-24 2014-01-07 Avaya Inc. Integrating a cellular phone with a speech-enabled softphone
US8677198B2 (en) * 2009-03-04 2014-03-18 Alcatel Lucent Method and apparatus for system testing using multiple processors
US8477921B2 (en) * 2010-06-30 2013-07-02 International Business Machines Corporation Managing participation in a teleconference by monitoring for use of an unrelated term used by a participant
US9330090B2 (en) * 2013-01-29 2016-05-03 Microsoft Technology Licensing, Llc. Translating natural language descriptions to programs in a domain-specific language for spreadsheets
US9747900B2 (en) * 2013-05-24 2017-08-29 Google Technology Holdings LLC Method and apparatus for using image data to aid voice recognition

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5661787A (en) * 1994-10-27 1997-08-26 Pocock; Michael H. System for on-demand remote access to a self-generating audio recording, storage, indexing and transaction system
US5752232A (en) * 1994-11-14 1998-05-12 Lucent Technologies Inc. Voice activated device and method for providing access to remotely retrieved data
US6069890A (en) * 1996-06-26 2000-05-30 Bell Atlantic Network Services, Inc. Internet telephone service
EP0941597B1 (en) * 1996-11-28 2002-01-30 BRITISH TELECOMMUNICATIONS public limited company Interactive apparatus and method
US6292480B1 (en) * 1997-06-09 2001-09-18 Nortel Networks Limited Electronic communications manager
US6636733B1 (en) * 1997-09-19 2003-10-21 Thompson Trust Wireless messaging method
US5950167A (en) * 1998-01-26 1999-09-07 Lucent Technologies Inc. Screen-less remote voice or tone-controlled computer program operations via telephone set
DE19835138A1 (de) * 1998-03-31 1999-10-07 Christoph Keller Verfahren zum Trennen von wenigstens einem ggf. in einer Strangpresse hergestellten Werkzeugprofil
US6792082B1 (en) * 1998-09-11 2004-09-14 Comverse Ltd. Voice mail system with personal assistant provisioning
US6577861B2 (en) * 1998-12-14 2003-06-10 Fujitsu Limited Electronic shopping system utilizing a program downloadable wireless telephone
SE525728C2 (sv) * 1999-01-27 2005-04-12 Ericsson Telefon Ab L M Portabel telekommunikationsanordning för flera ljudtillbehör
US6493324B1 (en) * 1999-03-29 2002-12-10 Worldcom, Inc. Multimedia interface for IP telephony
US6415257B1 (en) * 1999-08-26 2002-07-02 Matsushita Electric Industrial Co., Ltd. System for identifying and adapting a TV-user profile by means of speech technology
US6650871B1 (en) * 1999-10-14 2003-11-18 Agere Systems Inc. Cordless RF range extension for wireless piconets
US6823370B1 (en) * 1999-10-18 2004-11-23 Nortel Networks Limited System and method for retrieving select web content
US6546262B1 (en) * 1999-11-12 2003-04-08 Altec Lansing Technologies, Inc. Cellular telephone accessory device for a personal computer system
US20010032081A1 (en) * 1999-12-20 2001-10-18 Audiopoint, Inc. System for on-demand delivery of user-specific audio content
US6270651B1 (en) * 2000-02-04 2001-08-07 Abetif Essalik Gas component sensor
GB0008383D0 (en) * 2000-04-05 2000-05-24 Sontora Limited System and method for providing an internet audio stream to a wap mobile telephone or the like over a computer nrework
US20010042960A1 (en) * 2000-05-16 2001-11-22 Lewis Michael L. Casino card gaming method and apparatus
JP2002051164A (ja) * 2000-05-24 2002-02-15 Victor Co Of Japan Ltd 音声コンテンツ試聴システム及びシステムサーバ並びに携帯電話機
US6570969B1 (en) * 2000-07-11 2003-05-27 Motorola, Inc. System and method for creating a call usage record
GB2365262B (en) * 2000-07-21 2004-09-15 Ericsson Telefon Ab L M Communication systems
US6556563B1 (en) * 2000-09-11 2003-04-29 Yahoo! Inc. Intelligent voice bridging
US7095733B1 (en) * 2000-09-11 2006-08-22 Yahoo! Inc. Voice integrated VOIP system
US6621502B1 (en) * 2001-05-02 2003-09-16 Awa, Inc. Method and system for decoupled audio and video presentation
US6594483B2 (en) * 2001-05-15 2003-07-15 Nokia Corporation System and method for location based web services
US7006968B2 (en) * 2001-10-11 2006-02-28 Hewlett-Packard Development Company L.P. Document creation through embedded speech recognition
US20030115203A1 (en) * 2001-12-19 2003-06-19 Wendell Brown Subscriber data page for augmenting a subscriber connection with another party
US20030187657A1 (en) * 2002-03-26 2003-10-02 Erhart George W. Voice control of streaming audio
US7190950B1 (en) * 2002-06-27 2007-03-13 Bellsouth Intellectual Property Corporation Storage of voicemail messages at an alternate storage location
US7391763B2 (en) * 2002-10-23 2008-06-24 International Business Machines Corporation Providing telephony services using proxies

Also Published As

Publication number Publication date
US20050272415A1 (en) 2005-12-08
EP1576739A4 (en) 2006-11-08
EP1576739A1 (en) 2005-09-21
CA2500574A1 (en) 2004-04-15
KR20050083716A (ko) 2005-08-26
AU2003275388A1 (en) 2004-04-23
WO2004032353A1 (en) 2004-04-15

Similar Documents

Publication Publication Date Title
US20060276230A1 (en) System and method for wireless audio communication with a computer
US20050180464A1 (en) Audio communication with a computer
US7421390B2 (en) Method and system for voice control of software applications
US8452347B2 (en) Headset and audio gateway system for execution of voice input driven applications
US20090204409A1 (en) Voice Interface and Search for Electronic Devices including Bluetooth Headsets and Remote Systems
US7400712B2 (en) Network provided information using text-to-speech and speech recognition and text or speech activated network control sequences for complimentary feature access
US6931463B2 (en) Portable companion device only functioning when a wireless link established between the companion device and an electronic device and providing processed data to the electronic device
JP4348944B2 (ja) マルチチャネル通信方法、マルチチャネル電気通信システム、汎用コンピューティング装置、電気通信インフラストラクチャ、及びマルチチャネル通信プログラム
US8332227B2 (en) System and method for providing network coordinated conversational services
EP2008193B1 (en) Hosted voice recognition system for wireless devices
US20090298529A1 (en) Audio HTML (aHTML): Audio Access to Web/Data
US8831185B2 (en) Personal home voice portal
KR20070026452A (ko) 음성 인터랙티브 메시징을 위한 방법 및 장치
US7843899B2 (en) Apparatus and method for providing call status information
JP2006501788A (ja) コンピュータとのワイヤレス音声通信用システム及び方法
US20050216268A1 (en) Speech to DTMF conversion
US20090264107A1 (en) Pre-recorded voice responses for portable telecommunication devices
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
WO2008100420A1 (en) Providing network-based access to personalized user information
JP6659066B1 (ja) 音声通話システム、音声通話制御装置、音声通話プログラム、及び音声通話方法
KR100413270B1 (ko) 농아자의 의사소통을 위한 휴대전화기와 방법
EP1578097A1 (en) Method for translating visual call status information into audio information
WO2008075076A2 (en) Communicating information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060807

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081009

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081021

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090107

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090115

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090203

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090210

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090602