JP2005151553A - ボイス・ポータル - Google Patents

ボイス・ポータル Download PDF

Info

Publication number
JP2005151553A
JP2005151553A JP2004325600A JP2004325600A JP2005151553A JP 2005151553 A JP2005151553 A JP 2005151553A JP 2004325600 A JP2004325600 A JP 2004325600A JP 2004325600 A JP2004325600 A JP 2004325600A JP 2005151553 A JP2005151553 A JP 2005151553A
Authority
JP
Japan
Prior art keywords
request
user
text
computing system
receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004325600A
Other languages
English (en)
Inventor
Shailesh B Gandhi
シャイレシュ・ビィ・ガンディ
Pradeep P Mansey
プラディープ・ピィ・マンセイ
Anilkumar B Patel
アニルクマー・ビィ・パテル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2005151553A publication Critical patent/JP2005151553A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/06Authentication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】 電話接続およびパーソナル・コンピューティング・システムを介してボイス・サービスへアクセスするための方法、システム、およびマシン可読メディアを提供する。
【解決手段】 パーソナル・コンピューティング・システムを介してボイス・サービスへアクセス方法は、パーソナル・コンピューティング・システムにおいて、当該パーソナル・コンピューティング・システムへ登録された、当該パーソナル・コンピューティング・システムから離れた場所にいるユーザからの電話呼び出しを受信すること、電話呼び出しを介してユーザの発話を受信すること、ユーザの発話の音声認識を行いボイス・サービスのための要求を決定することを包含できる。
【選択図】 図2

Description

本発明は、ボイス・サービスに関し、より詳細には、コンピュータ・システムを介したネットワーク‐ベースの情報サービスに関する。
ポータルは、情報へアクセスするための入口ポイントとして機能するウェブ・サイトである。ポータルは、中心ネットワーク・ロケーションを提供し、それを介してユーザは、ニュース、天気予報、証券取引価格、電子メール等々の情報へアクセスすることができる。通常、ポータルを介して提供されるコンテンツおよびコンテンツが提供される方法は、ユーザによるカスタマイズが可能である。したがって各ユーザは、パーソナル化した情報はもとより、様々なサービスへ、ポータルを通じてユーザ固有の方法でアクセスし、見ることができる。
ポータルへアクセスするための主要なメカニズムは、ウェブ対応デバイスを介している。より具体的には、ユーザは、適切なインターネット接続を有するコンピュータ・システムを介してポータルへのアクセスを行っている。ユーザがその種のコンピュータ・システムへのアクセスを有している限り、ユーザは、情報ならびにそのほかのサービスをポータルから獲得することができる。
ユーザがコンピュータ・システムから離れているときにおいても、何らかのインターネット対応ワイヤレス・デバイスを介すことを前提とすれば、ポータルへアクセスすることができる。伝統的に、たとえばWAP(ワイヤレス・アクセス・プロトコル)を使用して通信するべく構成された携帯電話は、ユーザへポータルへのアクセスを提供する。携帯電話によって提供される移動の容易性にもかかわらず、ユーザは、携帯電話に組み込まれている小型のビジュアル・デバイスを介した情報ならびにサービスへのアクセスに限定される。
いずれの場合においてもユーザは、ウェブ・ポータルからの情報へアクセスするためにインターネット接続を有するデバイスを使用する以外に手段がなかった。さらにユーザは、移動時にパーソナル化された情報へアクセスするために、通常は有料サービスへ加入しなければならない。
本発明は、電話接続を介し、ボイス・コマンドを使用してウェブ・コンテンツへアクセスするための方法、システム、および装置を提供する。特に本発明は、ユーザが家庭用コンピュータ・システムを呼び出し、確立された呼び出しを介して情報もしくはサービスを要求することを可能にする。家庭用コンピュータ・システムは、要求された情報を獲得し、あるいはユーザの要求したサービスを実行することができる。したがってユーザは、インターネット上の、たとえばウェブ・ポータルからの情報ならびにコンテンツへ、ユーザ自身のコンピュータ・システムを介してアクセスすることができる。電話を経由したウェブ・ポータルならびにそのほかの、電子メールおよびインスタント・メッセージング等のサービスへのアクセスを可能にすることによって、追加のワイヤレス、ならびにそのほかの有料サービスへの加入の必要性が排除されるか、少なくとも最小化される。
本発明の1つの側面は、パーソナル・コンピューティング・システムを介してボイス・サービスへアクセスする方法を含むことができる。この方法は、パーソナル・コンピューティング・システムにおいて、当該パーソナル・コンピューティング・システムへ登録された、当該パーソナル・コンピューティング・システムから離れた場所にいるユーザからの電話呼び出しを受信すること、その電話呼び出しを介してユーザの発話を受信すること、およびユーザの発話の音声認識を行いボイス・サービスのための要求を決定することを包含できる。またこの方法は、ボイス・サービスのための要求に従って電子メッセージのフォーマットを行うこと、およびその電子メッセージを、ボイス・サービスのための要求に従ってリモート・コンピューティング・システムへ、通信ネットワークを介して送信することを包含できる。
本発明の一実施態様においては、要求を、リモート・コンピューティング・システムからのコンテンツのための要求とすることができる。その場合に、フォーマットを行うステップは、インターネットを介して送信されるべき電子メッセージの作成を包含することができる。またこの方法は、パーソナル・コンピューティング・システム内においてリモート・コンピューティング・システムからコンテンツを受信すること、そのコンテンツをパーソナル・コンピューティング・システム内において言語音オーディオへ変換すること、およびそのオーディオをユーザへ向けて、電話呼び出しを介して再生することを包含できる。
本発明の別の実施態様においては、要求を、電子メールを送信する要求とすることができる。それに相応じてこの方法は、少なくとも1つの追加のユーザの発話を受信すること、およびその少なくとも1つの追加のユーザの発話をテキストへ変換することを包含できる。特にフォーマットを行うステップは、送信するステップにおいて送信されるべき電子メールを作成することができる。音声認識されたテキストは、その電子メール内へ挿入することができる。
さらに別の実施態様においては、要求を、インスタント・メッセージを送信する要求とすることができる。それに相応じてこの方法は、少なくとも1つの追加のユーザの発話を受信すること、およびその追加のユーザの発話をテキストへ変換することを包含できる。この場合にフォーマットを行うステップは、送信するステップにおいて送信されるべきインスタント・メッセージを作成することができる。このインスタント・メッセージは、音声認識されたテキストを包含することができる。
本発明のもう1つの側面は、パーソナル・コンピューティング・システムを介してボイス・サービスへアクセスするためのシステムを含むことができる。このシステムは、パーソナル・コンピューティング・システム内において電話呼び出しを受信するためのインターフェース、およびパーソナル・コンピューティング・システム内に配置される、確立済みの電話呼び出しを介して受信されたユーザの発話をテキストへ変換するための音声認識システムを含むことができる。またこのシステムは、音声認識システムから音声認識済みのテキストを受け取り、そのテキストからユーザ要求を識別し、そのユーザ要求に従ってメッセージを生成し、かつそのメッセージを、通信ネットワークを介して少なくとも1つのリモート・コンピューティング・システムへ送信するべく構成されたサービス・エンジンを含むことができる。
本発明の別の実施態様においては、このシステムが、パーソナル・コンピューティング・システム内に配置される、受け取ったテキストを、確立済み電話呼び出しを介して再生されるべき言語音へ変換するためのテキスト読み上げエンジンを含むことができる。サービス・エンジンは、送信されたメッセージに応答するコンテンツを受け取って、そのコンテンツを、言語音としてレンダリングされるべく前記テキスト読み上げエンジンへ提供することができる。
本発明のさらに別の実施態様によれば、サービス・エンジンが、ユーザ要求に従ってメッセージを、たとえば電子メール・メッセージを生成するべく構成された電子メール・インターフェースを含むことができる。またサービス・エンジンは、ユーザ要求に従ってメッセージを生成するべく構成されたインスタント・メッセージング・インターフェースを含むことも可能であり、その場合には前述のメッセージがインスタント・メッセージになる。さらにサービス・エンジンは、インターネットを介して送信するためにユーザ要求をフォーマットするべく構成されたHTTP(ハイパーテキスト・トランスファ・プロトコル)インターフェース含むこともできる。
以下、現在のところ好ましいとされる図面ならびに実施態様を示すが、本発明がこのとおりの構成ならびに手段に限定されないことを理解されるものとする。
図1は、ここに開示されている発明性のある装置に従い、パーソナル・コンピューティング・システムを介して、電話経由でインターネット‐ベースのコンテンツへアクセスするためのシステム100を示した概略図である。ここに示されているように、システム100は、公衆交換電話網(PSTN)110等のネットワークを介してパーソナル・コンピューティング・システム105と通信可能にリンクされる1ないしは複数の電話を含むことができる。パーソナル・コンピューティング・システム105は、通信ネットワーク115を介して1ないしは複数のサーバと通信可能にリンクされている。
ワイヤレス電話120は、中継局またはタワー125を経由してPSTN 110と通信可能にリンクできる携帯電話もしくはそのほかのワイヤレス通信デバイスとすることができる。電話130は、中央局もしくはそのほかの電話交換システムを経由してPSTN 110と通信可能にリンクできる従来の陸線電話とすることができる。電話130には、限定する位置ではないが公衆電話も含めて、コンピューティング・システム105から離れた位置にある任意の電話を含めることができる。IP(インターネット・プロトコル)電話135は、サーバ140もしくはそのほかの、PSTN 110を伴うIPベースの通信ネットワークとのインターフェースが可能なゲートウエイ・メカニズムを経由してPSTN 110と通信可能にリンクできる。
ここで認識される必要があるが、これに開示されている実施態様は例示のみを目的として提供されている。したがって、本発明が、使用されている特定タイプの通信デバイスによって限定されることはない。むしろ本発明は、PSTNを介してボイス信号および/またはDTMF(デュアル・トーン・マルチ‐フリケンシー)信号の送受信が可能な多くの通信デバイスから任意のものを用いて実施することができる。
パーソナル・コンピューティング・システム105は、PSTN 110ならびに通信ネットワーク115、すなわちインターネット、ワールド・ワイド・ウェブ(ウェブ)、ローカル・エリア・ネットワーク(LAN)、ワイド・エリア・ネットワーク(WAN)等との接続が可能な各種のコンピューティングおよび/または情報処理デバイスのいずれとすることもできる。たとえば、パーソナル・コンピューティング・システム105を、従来の、モデムを備えた家庭用デスクトップ・コンピュータ、同様にモデムを備えたラップトップ等のポータブル・コンピュータ、あるいはそのほかの、ここに述べているように機能するべく構成された情報処理設備とすることができる。
パーソナル・コンピューティング・システム105は、パーソナル家庭用ボイス・ポータル(図示せず)を含むことができ、それによってユーザは、ここで述べるように離れた場所から電話デバイスを使用してパーソナル・コンピューティング・システム105を呼び出すことができる。パーソナル家庭用ボイス・ポータル(PHVP)は、ユーザの口述コマンド、口授、およびDTMF信号の受信を行い、パーソナル・コンピューティング・システム105に何らかのアクションを開始させることができる。たとえばPHVPは、ユーザがポータル・サーバ145からの情報および/またはサービスへアクセスすること、IMサーバ150を介してインスタント・メッセージ(IM)を送受すること、およびe‐メール・サーバ155を介して電子メール(e‐メール)を送受することを可能にする。PHVPは、テキスト読み上げおよび音声認識機能を含むことができ、その結果ユーザは、口述コマンド、口授、DTMF信号、あるいはこれらに任意の組み合わせを介して上記の機能を実行することができる。
パーソナル・コンピューティング・システム105は、ポータル・サーバ145、IMサーバ150、およびe‐メール・サーバ155等の1ないしは複数のサーバと、通信ネットワーク115を介して通信可能にリンクすることができる。IMサーバ150およびe‐メール・サーバ155は、特定の用途専用とすることができるが、ポータル・サーバ145は、e‐メール、ニュース、証券取引価格等の金融情報のサービス等、およびそのほかのリスト・サーブおよびグループといったサービスの組み合わせを提供することができる。ポータル・サーバ145は、各ユーザによる使用のためのカスタム化が可能である。つまり、ユーザは、そのユーザが希望するサービスのみを提供するべくポータル・サーバ145を構成することができる。通常、ユーザは、ポータル・サーバ145を使用して登録することができる。続いてユーザは、適切なユーザ名、パスワード、および/またはそのほかの認証メカニズムを用いてアクセスすることのできるポータル・サーバ145上の1ないしは複数のウェブ・ページをパーソナル化することができる。各ウェブ・ページは、ユーザによって選択されたコンテンツを含むことができる。ただし、ここで認識される必要があるが、パーソナル・コンピューティング・システム105は、申し込みベースであるか自由アクセス可能であるかによらず、ほかの1ないしは複数のウェブ‐ベースのサーバと通信可能にリンクすることができる。
動作において、ユーザは、ワイヤレス電話120、電話130、および/またはIP電話135から電話呼び出しを開始することができる。この呼び出しは、そのユーザ自身のパーソナル・コンピューティング・システム105へ、たとえばそのユーザの自宅に置かれているシステムへ向けて行うことができる。ユーザは、パーソナル・コンピューティング・システム105へのログインおよび認証を行った後に、1ないしは複数のボイス・コマンドを発行することができる。ユーザは、ポータル・サーバ145からの情報の要求、e‐メールの送信、受信e‐メールのチェック、IMの送信、およびIMの受信を行うことができる。
たとえばユーザは、e‐メールを送信する要求を口頭で行うことができる。ユーザは、そのe‐メールが送信されるユーザの名前またはe‐メール・アドレスを指定することができる。ユーザは、e‐メール本文の口授に進み、さらにその後、PHVPに、そのe‐メールを送信させることができる。PHVPは、そのe‐メールをe‐メール・サーバ155へ転送することのできるe‐メール・クライアントを含むか、それとインタラクションすることができる。
別の例においては、電話回線を介してユーザが1ないしは複数の証券取引価格を要求することが可能である。PHVPは、そのユーザに代わってポータル・サーバ145へログインすることができる。PHVPは、ユーザの要求を音声認識し、テキストへ変換し、HTTP(ハイパーテキスト・トランスファ・プロトコル)要求としてフォーマットし、さらにポータル・サーバ145へ転送することができる。PHVPは、要求されたコンテンツを受信し、そのコンテンツを言語音へ変換し、ユーザへ向けて電話呼び出しを介して再生することができる。
ここに開示されている装置は、ポータル・サーバ145等のリモート・サーバ上にユーザが登録済みのサービスへのアクセスによるか、あるいはパーソナル・コンピューティング・システム105上にストアされているアドレス帳もしくはそのほかの情報へのアクセスによるか、またはパーソナル・コンピューティング・システム105、IMサーバ150、およびe‐メール・サーバ155上のe‐メールもしくはインスタント・メッセージングへのアクセスによるかにかかわらず、呼び出しているユーザに対してパーソナル化したサービスへのアクセスを提供する。さらにパーソナル・コンピューティング・システム105は図1に例示されている電話デバイスからの呼び出しに応答することが可能であるが、当業者であれば認識されるように、パーソナル・コンピューティング・システム105は、従来のサーバとしては機能しない。特に、パーソナル・コンピューティング・システム105は、複数のクライアントにわたる管理的コントロールを行使しない。言い換えると、パーソナル・コンピューティング・システム105は、ポータル・サーバ145、IMサーバ150、およびe‐メール・サーバ155へのアクセスに関してクライアントとして機能する。パーソナル・コンピューティング・システム105を呼び出す各種の電話デバイスが、パーソナル・コンピューティング・システム105を介して管理もしくはコントロールされることは可能でない。
図2は、ここに開示されている装置に従ったPHVP 200の一実施態様を例示したブロック図である。PHVP 200は、モデム、音声認識システム(SRS)210、テキスト読み上げ(TTS)エンジン215、およびサービス・エンジン220といった電話インターフェース205を含むことができる。本発明の一実施態様においては、PHVP 200が、HTTPインターフェース225、IMインターフェース230、およびe‐メール・インターフェース235を含むことができる。それに代えてPHVP 200は、その種の機能を提供するべく構成されたそのほかのソフトウエア・アプリケーションとインタラクションを行うように構成することも可能である。たとえばPHVP 200は、ブラウザ、IMクライアント、および/またはe‐メール・クライアントとインタラクションを行うべく構成することができる。
電話インターフェース205は、PSTNから到来する電話呼び出しを受信することができる。また電話インターフェース205は、PSTNとPHVP 200の間において交換される言語音であるか、かつ/またはDTMF信号であるかによらず、オーディオのアナログ‐ディジタル変換およびディジタル‐アナログ変換を行うことができる。SRS 210は、この分野において知られているように、受信したオーディオをテキスト等価へ変換することができる。本発明の一実施態様においては、SRS 210が、話者非依存音声認識および/またはデバイス依存音声認識を行うことができる。つまりユーザは、SRS 210への登録をはじめ、そのユーザがPHVP 200とともに使用を希望する各電話デバイスのための1ないしは複数の登録を作成することができる。登録プロセスは、SRS 210がユーザの話し方および使用される電話デバイスのオーディオ特性を学習することから音声認識の精度を向上させる。しかしながら別の実施態様においては、SRS 210が、話者依存および/またはデバイス非依存音声認識を行うことができる。TTSエンジン215は、テキストを受信し、オーディオ出力を生成することができる。言い換えるとTTSエンジン215は、受信したテキストの言語音または口述等価を生成することができる。
HTTPインターフェース225は、ウェブ・ページおよび/またはポータルとのインタラクションのための機能を提供する。HTTPインターフェース225は、通信ネットワークを介して送信されるべき要求をフォーマットすること、および要求に応答して受信した情報をデコードすることができる。ここで認識される必要があるが、各種多様なタイプの要求のいずれもHTTPインターフェース225を介してフォーマットされ、デコードされ得る。たとえば、HTTPインターフェース225は、FTP(ファイル・トランスファ・プロトコル)、LDAP(ライトウエイト・ディレクトリ・アクセス・プロトコル)、HTTP、およびそのほかの、通信ネットワークを介した通信に使用することのできる通信プロトコルに適合する要求および応答を処理することができる。
IMインターフェース230は、通信ネットワークを介して送信するためのIMとしてメッセージをフォーマットすることをはじめ、サービス・エンジン220による使用のためにIMの受信ならびにデコードを行うことができる。同様にe‐メール・インターフェース235は、通信ネットワークを介して送信するためのe‐メールをフォーマットすることをはじめ、サービス・エンジン220による使用のためのe‐メールの受信ならびにデコードを行うことができる。
サービス・エンジン220は、PHVP 200の各種のコンポーネントのアクションを調和することができる。特にサービス・エンジン220は、音声認識されたテキストをSRS 210から受け取り、そのテキストを処理してユーザの希望している1ないしは複数の機能もしくはオペレーションを決定することができる。さらにサービス・エンジン220は、テキストをTTSエンジン215へ渡し、オーディオとしてレンダリングさせることができる。たとえばサービス・エンジン220は、HTTPインターフェース225、IMインターフェース230、およびe‐メール・インターフェース235を介して受信したコンテンツを言語音として再生するために、TTSエンジン215へルーティングすることができる。したがって、電話インターフェース205を経由し、確立済みの電話呼び出しを介して、ユーザへ向けたオーディオの再生が可能になる。
サービス・エンジン220は、IM、電子メール、またはそのほかのウェブ・ページ等のウェブ・コンテンツのテキストを、TTSエンジン215を介して再生するためにフォーマットすることができる。たとえばサービス・エンジン220は、マークアップ言語のタグまたはそのほかの本質的でない、TTSエンジン215によって必要とされないか、あるいは理解されない注釈の除去をはじめ、TTSエンジン215によって理解され得る注釈の追加を行うことができる。一実施態様においては、サービス・エンジン220が、HTTPインターフェース225、IMインターフェース230、および/またはe‐メール・インターフェース235によって使用されることのあるマークアップ言語、記号、および/またはテキストを除去するための規則を含むことができる。またサービス・エンジン220は、TTSエンジン215へ提供されて、ユーザに対してテキストが読み上げられる方法または再生される方法をコントロールするテキストの注釈を付することができる。たとえばサービス・エンジン220は、データ・フィールド、証券取引価格、またはそのほかのリスト内のアイテムの間にポーズを追加するテキストの注釈を付することができる。ポーズは、状況に応じてe‐メールの表題部分と本文部分の間へも追加することができる。ポーズの挿入は、ウェブ・ページ、IM、もしくはe‐メールのいずれからのものであるかによらず、滑らかかつ論理的なコンテンツの再生を促進することができる。
さらにサービス・エンジン220は、ユーザによって要求されている特定のアクションまたはサービスを決定することができる。ユーザ指定のアクションを実行するためにそれ以上の情報が必要ない場合に、サービス・エンジン220は、HTTPインターフェース225、IMインターフェース230、および/またはe‐メール・インターフェース235に対して、そのユーザ指定のアクションの実行を指示することができる。必要であればサービス・エンジン220は、TTSエンジン215に、ユーザに対して情報および/または口授の追加を要求するプロンプトを与えさせることができる。言語音であるかあるいはDTMF入力であるかによらず、ユーザの応答は、SRS 210によって処理可能であり、サービス・エンジン220による処理のためにそれへ提供される。サービス・エンジン220によって受け取られる情報は、HTTPインターフェース225からのコンテンツであるか、IMインターフェース230からの受信済みIMであるか、および/またはe‐メール・インターフェース235からの受信済みe‐メールであるかによらず、電話呼び出しを介してユーザへ向けて再生するために、TTSエンジン215へ提供することができる。
PHVP 200は、1ないしは複数のユーザ・プロファイルを有するデータ・ストア240を含むことができる。各ユーザ・プロファイルは、ユーザ要求とそれに対応するアクションの関連を指定することができる。たとえばユーザの証券取引価格についての要求を、そのユーザが口座のための登録を行った特定のウェブ・ポータルへ関連付けすることができる。ユーザの証券取引価格についての要求が受信され、そのユーザのプロファイル内にストアされている証券取引価格の要求と適合するとき、ユーザ・プロファイル内の適合した要求が実行されるようにできる。引き続き図面を参照するが、株式取引価格の要求に関連付けされたユーザ・プロファイル内に指定されている情報ソースへは、そのユーザ指定情報についてアクセスもしくはクエリを行うことが可能である。特に、ユーザ・プロファイルは、さらに、ユーザに代わってサービス・エンジン220がウェブ・ポータルもしくはそのほかの加入サービスへログインするために必要となることのある任意のユーザ名および/またはパスワードを含むことができる。
e‐メール、インスタント・メッセージ等の送信の要求についても類似の関係をユーザ・プロファイル内にストアしておくことができる。ユーザ要求の音声認識済みテキストとユーザ・プロファイル内に指定されている要求を比較することによって、サービス・エンジン220は、HTTPインターフェース225に対して要求の送信ならびに電子コンテンツの受信を、IMインターフェース230に対してIMの送受を、さらにe‐メール・インターフェース235に対してe‐メールの送受をそれぞれ伝えることができる。
図3は、ここに開示されている装置の一実施態様に従い、電話接続ならびに家庭用コンピューティング・システムを経由してネットワーク・ロケーションからの情報および/またはサービスへアクセスする方法300を示したフローチャートである。方法300は、ユーザがユーザ自身のパーソナル・コンピュータ・システムから離れているが、電話アクセスを有している状態において開始することができる。したがって、ステップ305においては、ユーザが、ユーザ自身のパーソナル・コンピューティング・システムに対する電話呼び出しを開始することができる。たとえばユーザは、そのユーザの自宅の電話番号をダイアルすることができる。
ステップ310においてPHVPは、受信した電話呼び出しに対して応答することができる。たとえば、ユーザのパーソナル・コンピューティング・システム上において動作するPHVPを、自宅で受信した電話呼び出しに応答するべく、あるいは特定のラインに応答するべく構成することができる。PHVPが電話呼び出しに応答した後は、ステップ315において、PHVPによるユーザもしくは呼者の認証を行うことができる。ユーザは、ユーザの言語音の形式であるか、かつ/またはDTMF信号の形式であるかによらず、ユーザ名および/またはパスワードを提供することができる。本発明の別の実施態様においては、生物測定学的認証方法を実施することができる。たとえば、声紋テクノロジを使用してユーザの認証を行うことが可能である。いずれの場合にもユーザが識別された後は、そのユーザに関するプロファイルを選択することができる。
ステップ320においてPHVPは、オプションとして、ユーザによって電話呼び出しの開始に使用されているデバイスの識別を行う。PHVPは、必要であればオーディオ・プロンプトを提供することも可能であり、あるいは単にユーザの言語音、もしくはその呼び出しの開始に使用されているデバイスのタイプを示すDTMF信号を認識することができる。たとえば、PHVPがユーザのパーソナル・コンピューティング・システム内において動作していることから、ユーザは、SRSへ複数の登録を行うことができる。各登録は、特定の電話もしくは音声通信デバイスと関係させることができる。例示の場合であれば、ユーザは、携帯電話、IP電話、あるいはユーザが電話呼び出しの開始のために選択することのできる任意のデバイスを使用して登録を行うことが可能である。各登録は、登録を行うために使用されたデバイスのオーディオ・チャンネル特性をはじめ、ユーザの言語音の特性をストアする。呼び出しのために使用されているデバイスに対応する登録を選択することによって、音声認識の精度の向上を達成することが可能になる。
本発明の一実施態様においては、PHVPに識別された後に、ユーザが特定のプロファイルを選択することができる。各プロファイルは、その呼び出しの持続する間にわたって使用されることになる特定の登録、および電話デバイスを指定することが可能である。各プロファイルは、異なる情報ソースを、所定のタスクのために使用されるべく指定することができる。たとえば、ユーザのための第1のプロファイルを、証券取引価格が『有料』サービスからアクセスされること、およびe‐メールが第1のe‐メール・アカウントからアクセスされることを指定するものとすることができる。また同一のユーザのための第2のユーザ・プロファイルを、証券取引価格が無料ウェブ・ポータルから獲得されること、および異なるe‐メール・アカウントがチェックされるべきであることを指定するものとすることができる。これによりユーザは、それぞれが異なる情報のソースへアクセスし、異なるタイプの電話装置を伴う利用のために設計される、たとえばビジネス・プロファイルおよびパーソナル・プロファイルを有することが可能になる。
ユーザならびに電話呼び出しの開始に使用されている特定のデバイスを識別すると、ステップ325においてその呼者のための登録をロードすることができる。すでに示したように、選択された登録は、ユーザとの対応が可能なだけでなく、その呼び出しの持続する間にわたり呼者によって使用される電話デバイスとの対応も可能である。方法300は、話者およびデバイス依存音声認識が実行される実施態様を例示しているが、当業者であれば認識されるように、本発明がそのように限定されることはない。むしろその逆に、話者非依存および/またはデバイス非依存音声認識も使用することができる。
ステップ330においては、PHVPが、確立済みの電話呼び出しを介してサービスに関するユーザ要求を受信することができる。このサービスの要求は、ウェブ・サイト、ポータル、あるいはそのほかのリモート情報ソースからのコンテンツの要求、e‐メールのチェック、e‐メールの送信もしくは作成、IMの受信に関するチェック、IMの作成、IMの送信、あるいはそのほかのこれらに類似した事項の要求とすることができる。ステップ335においては、音声認識されたユーザ要求のテキストと、選択済みのユーザ・プロファイルを比較することができる。このテキストは、ユーザ・プロファイル内に指定されている特定の要求との適合が可能である。続いて、適合した要求に関連付けされたアクションを具体化することができる。
ステップ340においては、PHVPが、そのユーザが登録済みのサーバへ、それがポータル・サーバであるか、IMサーバであるか、あるいはe‐メール・サーバであるかによらず、適合したユーザ・プロファイルの要求に関連付けされたアクションによって指定されるとおりにログインすることができる。たとえば、ユーザが証券取引価格情報を要求し、かつユーザ・プロファイル内に指定されている場合に、PHVPは、そのユーザのポータル・アカウントへログインしてパーソナル化した情報、すなわちこの場合であればオンラインで維持されているパーソナル化したポートフォリオからの取引価格をダウンロードすることができる。ユーザがe‐メールの作成もしくはアクセスを要求した場合には、PHVPが、リモート・サーバ上のそのユーザのアカウントへログインすることができる。ユーザが、より一般的な、加入を必要としないデータ・ソースから獲得可能な情報を要求した場合には、PHVPは、その情報を獲得するためにサーバへログインする必要はなく、それよりは一般的な情報サービスへのクエリを行う。
ステップ345においては、必要に応じてPHVPが、ユーザ指定のタスクの実行および/または完成のためにシステムによって必要とされる追加の情報があれば、ユーザに対してそのクエリを行う。たとえばこの追加の情報には、メッセージの送信先となる1ないしは複数のアドレス、電子通信の本文部分内へ挿入されるべき口授等を含めることができる。当業者であれば認識されるように、PHVPは、ユーザとの対話を行って任意の必要な情報を獲得するべく構成することができる。
ステップ350においては受信したデータをはじめ、PHVPによって決定されたか、あるいはアクセスされたあらゆるデータ、たとえばユーザ・プロファイルからのデータを、受信したユーザの要求に従ってフォーマットすることができる。たとえば、ユーザ要求がe‐メールの作成および/または送信であった場合には、受信した口授および指定されたe‐メール・アドレスをe‐メール・メッセージへ挿入することができる。同様に音声認識されたテキストをIMへ挿入し、あるいはHTTP要求へ組み込むことができる。
ステップ355においては、フォーマット済みのデータをリモート・コンピュータ・システムへ転送することができる。つまり、たとえばフォーマット済みe‐メールの送信、フォーマット済みIMの送信、HTTP要求の送信、あるいは新しいe‐メールのダウンロード要求の送信を行うことが可能である。ここで認識される必要があるが、ステップ355において送信されるメッセージが、応答を惹起するものである場合には、その応答をサービス・エンジンによって処理し、ユーザへ向けての再生のためにTTSエンジンへ提供することができる。例として述べれば、HTTP要求に応答して受信されたコンテンツをユーザへ向けて再生することができる。検索されたe‐メールもしくは受信されたIMについても、ユーザへ向けて再生することができる。
いずれの場合であってもステップ360において、リモート・コンピュータ・システムからの応答は、ユーザのパーソナル・コンピューティング・システム内のPHVP内で受信することができる。この応答は、ユーザの要求したオペレーションが実行に成功したか否かについての表示、あるいはユーザによって、したがって、PHVPによって要求された情報となり得る。たとえばPHVPは、e‐メールもしくはIMの送信に成功したことの表示を受信することができる。ユーザが金融情報を要求した場合には、その情報を受信することができる。
ステップ365においてPHVPは、この応答を処理するか、またはオーディオへ変換することができる。受信したメッセージの構文解析を行って、テキスト抽出することができる。たとえば、受信したメッセージから内容だけが抽出されるように、タグもしくはヘッダ情報といった余剰情報を除去することができる。それに加えて、コンテンツの韻律特性を変更し、結果として得られたオーディオ・サウンドをより自然なものとすることができる。たとえば、タブもしくはカンマによって区切られたデータ、コラム等の間にポーズを挿入するべくテキストに注釈を加えることができる。そのほかの、音節の強調等の韻律特性についても同様に変更することが可能である。結果として得られたコンテンツを、PHVPのTTSエンジンへ渡し、オーディオとしてレンダリングすることができる。ステップ370においては、結果として得られたオーディオを、PHVPが、ユーザへ向けて確立済みの電話呼び出しを介して再生することができる。
本発明は、ユーザがパーソナル・コンピューティング・システムならびに電話デバイスを使用して各種のウェブ・コンテンツおよびインターネット‐ベースの加入者サービスへアクセスすることを可能にするパーソナル化されたボイス・ポータルを提供する。ユーザ自身のパーソナル・コンピューティング・システムを呼び出すことによって、ユーザは、パーソナル化され、かつカスタム化されたデータ、たとえばウェブ・ポータルへ電話を介してアクセスすることができる。その結果としてユーザは、追加の課金ベースの移動情報サービスへ加入する必要なしに、電話呼び出しを介して要求したデータの可聴音表現を聞くことができる。
本発明は、ハードウエア、ソフトウエア、あるはハードウエアとソフトウエアの組み合わせによって実現することが可能である。また本発明は、1つのコンピュータ・システム内に集約される集中形式で、あるいはいくつかの相互接続されたコンピュータ・システムにわたって異なるエレメントが分散される分散形式で実現することが可能である。あらゆる種類のコンピュータ・システムまたはこれに述べられている方法を実行するべく適合されたそのほかの装置が適している。代表的なハードウエアとソフトウエアの組み合わせを、コンピュータ・プログラムを伴う汎用コンピュータ・システムとすることが可能であり、それにおいては、コンピュータ・プログラムがロードされて実行されたとき、ここに記述されている方法をコンピュータ・システムが実行するようにそれをコントロールする。
また本発明は、ここに記述されている方法の具体化を可能にするすべての特徴を包含するコンピュータ・プログラム・プロダクト内へ埋め込むことも可能であり、それがコンピュータ・システムへロードされたときには、これらの方法を実施することができる。これに関してコンピュータ・プログラムは、情報処理ケイパビリティを有するシステムに直接、あるいは(a)別の言語、コード、もしくは表記への変換;および(b)異なる物質形式での再生のうちのいずれかもしくは両方の後に特定の機能を実行させるべく意図された情報のセットの、任意の言語、コード、もしくは表記による任意の表現を意味する。
本発明は、その精神もしくは本質的な属性から逸脱することなしに別の型式で具体化することができる。したがって、本発明の範囲を示すものとして、以上の実施態様ではなく、付随する特許請求の範囲を参照するべきとする。
まとめとして、本発明の構成に関して以下の事項を開示する。
(1)コンピューティング・システムを介してボイス・サービスへアクセスする方法であって:前記コンピューティング・システムにおいて、前記コンピューティング・システムへ登録されたユーザからの電話呼び出しを受信するステップ;前記電話呼び出しを介してユーザ発話を受信するステップ;前記ユーザ発話の音声認識を行いボイス・サービスのための要求を決定する、音声認識を行うステップ;前記ボイス・サービスのための要求に従って電子メッセージのフォーマットを行うステップ;および、前記ボイス・サービスのための要求に従ってサーバ・システムへ、通信ネットワークを介して前記電子メッセージを送信するステップ;を包含する方法。
(2)前記要求は、サーバ・システムからのコンテンツのための要求であり、前記フォーマットを行うステップは、インターネットを介して送信されるべき電子メッセージの作成を包含する、上記(1)に記載の方法。
(3)さらに:前記コンピューティング・システム内において前記サーバ・システムからコンテンツを受信するステップ;前記コンピューティング・システム内において前記コンテンツを言語音のオーディオへ変換するステップ;および、前記電話呼び出しを介して、前記オーディオを前記ユーザへ向けて再生するステップ;を包含する、上記(2)に記載の方法。
(4)前記要求は電子メールを送信する要求であり、さらに前記方法は:少なくとも1つの追加のユーザ発話を受信するステップ;および、前記少なくとも1つの追加ユーザの発話をテキストへ変換するステップを包含し、それにおいて前記フォーマットを行うステップは、前記送信するステップにおいて送信されるべき電子メールを作成し、かつ前記音声認識済みのテキストを前記電子メール内へ含める、上記(1)に記載の方法。
(5)前記要求はインスタント・メッセージを送信する要求であり、さらに前記方法は:少なくとも1つの追加のユーザ発話を受信するステップ;および、前記少なくとも1つの追加のユーザ発話をテキストへ変換するステップを包含し、それにおいて前記フォーマットを行うステップは、前記送信するステップにおいて送信されるべきインスタント・メッセージを作成し、かつ前記音声認識済みのテキストを前記インスタント・メッセージ内へ含める、上記(1)に記載の方法。
(6)コンピューティング・システムを介してボイス・サービスへアクセスするためのシステムであって:前記コンピューティング・システム内において電話呼び出しを受信するためのインターフェース;前記コンピューティング・システム内に配置される、確立済みの電話呼び出しを介して受信されたユーザ発話をテキストへ変換するための音声認識システム;および、前記音声認識システムから音声認識済みのテキストを受け取り、前記テキストからユーザ要求を識別し、前記ユーザ要求に従ってメッセージを生成し、かつ通信ネットワークを介して少なくとも1つのサーバ・システムへ前記メッセージを送信するべく構成されたサービス・エンジン;を包含するシステム。
(7)さらに、前記コンピューティング・システム内に配置される、受け取ったテキストを、確立済み電話呼び出しを介して再生されるべき言語音へ変換するためのテキスト読み上げエンジンを包含し、それにおいて前記サービス・エンジンは、前記送信されたメッセージに応答するコンテンツを受け取って、前記コンテンツを、言語音としてレンダリングされるべく前記テキスト読み上げエンジンへ提供する、上記(6)に記載のシステム。
(8)前記サービス・エンジンは、ユーザ要求に従ってメッセージを生成するべく構成された電子メール・インターフェースを包含し、それにおいて前記メッセージは、電子メール・メッセージである、上記(7)に記載のシステム。
(9)前記サービス・エンジンは、ユーザ要求に従ってメッセージを生成するべく構成されたインスタント・メッセージング・クライアントを包含し、それにおいて前記メッセージは、インスタント・メッセージである、上記(7)に記載のシステム。
(10)前記サービス・エンジンは、インターネットを介して送信するためにユーザ要求をフォーマットするべく構成されたHTTP(ハイパーテキスト・トランスファ・プロトコル)インターフェースとインタラクションする、上記(6)に記載のシステム。
(11)コンピューティング・システムを介してボイス・サービスへアクセスするためのシステムであって:前記コンピューティング・システムにおいて、前記コンピューティング・システムへ登録されたユーザからの電話呼び出しを受信するための手段;前記電話呼び出しを介してユーザ発話を受信するための手段;前記ユーザ発話の音声認識を行いボイス・サービスのための要求を決定する、音声認識を行うための手段;前記ボイス・サービスのための要求に従って電子メッセージのフォーマットを行うための手段;および、前記ボイス・サービスのための要求に従ってサーバ・システムへ、通信ネットワークを介して前記電子メッセージを送信するための手段;を包含するシステム。
(12)前記要求は、サーバ・システムからのコンテンツのための要求であり、前記フォーマットを行うための手段は、インターネットを介して送信されるべき電子メッセージを作成するための手段を包含する、上記(11)に記載のシステム。
(13)さらに:前記コンピューティング・システム内において前記サーバ・システムからコンテンツを受信するための手段;前記コンピューティング・システム内において前記コンテンツを言語音のオーディオへ変換するための手段;および、前記電話呼び出しを介して、前記オーディオを前記ユーザへ向けて再生するための手段;を包含する、上記(12)に記載のシステム。
(14)前記要求は電子メールを送信する要求であり、さらに前記システムは:少なくとも1つの追加のユーザ発話を受信するための手段;および、前記少なくとも1つの追加のユーザ発話をテキストへ変換するための手段を包含し、それにおいて前記フォーマットを行うための手段は、送信されるべき電子メールを作成し、かつ前記音声認識済みのテキストを前記電子メール内へ含める、上記(11)に記載のシステム。
(15)前記要求はインスタント・メッセージを送信する要求であり、さらに前記システムは:少なくとも1つの追加のユーザ発話を受信するための手段;および、前記少なくとも1つの追加のユーザ発話をテキストへ変換するための手段を包含し、それにおいて前記フォーマットを行うステップは、前記送信するステップにおいて送信されるべきインスタント・メッセージを作成し、かつ前記音声認識済みのテキストを前記インスタント・メッセージ内へ含める、上記(11)に記載のシステム。
(16)コンピュータ・プログラムであって、コンピュータに:前記コンピュータへ登録されたユーザからの電話呼び出しを受信するステップ;前記電話呼び出しを介してユーザの発話を受信するステップ;前記ユーザの発話の音声認識を行いボイス・サービスのための要求を決定する、音声認識を行うステップ;前記ボイス・サービスのための要求に従って電子メッセージのフォーマットを行うステップ;および、前記ボイス・サービスのための要求に従ってサーバ・システムへ、通信ネットワークを介して前記電子メッセージを送信するステップ;を実行させるための、前記コンピュータによって実行可能な複数のコード・セクションを有するコンピュータ・プログラム。
(17)前記要求は、サーバ・システムからのコンテンツのための要求であり、前記フォーマットを行うステップは、インターネットを介して送信されるべき電子メッセージの作成を包含する、上記(16)に記載のコンピュータ・プログラム。
(18)さらに、前記コンピュータに:前記コンピュータ内において前記サーバ・システムからコンテンツを受信するステップ;前記コンピュータ内において前記コンテンツを言語音のオーディオへ変換するステップ;および、前記電話呼び出しを介して、前記オーディオを前記ユーザへ向けて再生するステップ;を実行させる、上記(17)に記載のコンピュータ・プログラム。
(19)前記要求は電子メールを送信する要求であり、さらに前記コンピュータ・プログラムは、前記コンピュータに:少なくとも1つの追加のユーザ発話を受信するステップ;および、前記少なくとも1つの追加のユーザ発話をテキストへ変換するステップを実行させ、それにおいて前記フォーマットを行うステップは、前記送信するステップにおいて送信されるべき電子メールを作成し、かつ前記音声認識済みのテキストを前記電子メール内へ含める、上記(16)に記載のコンピュータ・プログラム。
(20)前記要求はインスタント・メッセージを送信する要求であり、さらに前記コンピュータ・プログラムは、前記コンピュータに:少なくとも1つの追加のユーザ発話を受信するステップ;および、前記少なくとも1つの追加のユーザ発話をテキストへ変換するステップを実行させ、それにおいて前記フォーマットを行うステップは、前記送信するステップにおいて送信されるべきインスタント・メッセージを作成し、かつ前記音声認識済みのテキストを前記インスタント・メッセージ内へ含める、上記(16)に記載のコンピュータ・プログラム。
ここに開示されている発明性のある装置に従ったパーソナル・コンピューティング・システムを介して電話経由でインターネット‐ベースのコンテンツへアクセスするためのシステムを示した概略図である。 ここに開示されている発明性のある装置に従ったパーソナル家庭用ボイス・ポータルの一実施態様を例示した概略図である。 ここに開示されている発明性のある装置に従った電話接続ならびに家庭用コンピューティング・システムを経由してネットワーク・ロケーションからの情報および/またはサービスへアクセスする方法を示したフローチャートである。
符号の説明
100 システム
105 パーソナル・コンピューティング・システム
110 公衆交換電話網(PSTN)
115 通信ネットワーク
120 ワイヤレス電話
125 タワー;中継局
130 電話
135 IP(インターネット・プロトコル)電話
140 サーバ
145 ポータル・サーバ
150 IMサーバ
155 e‐メール・サーバ
200 PHVP
205 電話インターフェース
210 音声認識システム(SRS)
215 TTSエンジン;テキスト読み上げ(TTS)エンジン
220 サービス・エンジン
225 HTTPインターフェース
230 IMインターフェース
235 e‐メール・インターフェース
240 データ・ストア
300 方法

Claims (20)

  1. コンピューティング・システムを介してボイス・サービスへアクセスする方法であって:
    前記コンピューティング・システムにおいて、前記コンピューティング・システムへ登録されたユーザからの電話呼び出しを受信するステップ;
    前記電話呼び出しを介してユーザ発話を受信するステップ;
    前記ユーザ発話の音声認識を行いボイス・サービスのための要求を決定する、音声認識を行うステップ;
    前記ボイス・サービスのための要求に従って電子メッセージのフォーマットを行うステップ;および、
    前記ボイス・サービスのための要求に従ってサーバ・システムへ、通信ネットワークを介して前記電子メッセージを送信するステップ;
    を包含する方法。
  2. 前記要求は、サーバ・システムからのコンテンツのための要求であり、前記フォーマットを行うステップは、インターネットを介して送信されるべき電子メッセージの作成を包含する、請求項1に記載の方法。
  3. さらに:
    前記コンピューティング・システム内において前記サーバ・システムからコンテンツを受信するステップ;
    前記コンピューティング・システム内において前記コンテンツを言語音のオーディオへ変換するステップ;および、
    前記電話呼び出しを介して、前記オーディオを前記ユーザへ向けて再生するステップ;
    を包含する、請求項2に記載の方法。
  4. 前記要求は電子メールを送信する要求であり、さらに前記方法は:
    少なくとも1つの追加のユーザ発話を受信するステップ;および、
    前記少なくとも1つの追加ユーザの発話をテキストへ変換するステップを包含し、それにおいて前記フォーマットを行うステップは、前記送信するステップにおいて送信されるべき電子メールを作成し、かつ前記音声認識済みのテキストを前記電子メール内へ含める、請求項1に記載の方法。
  5. 前記要求はインスタント・メッセージを送信する要求であり、さらに前記方法は:
    少なくとも1つの追加のユーザ発話を受信するステップ;および、
    前記少なくとも1つの追加のユーザ発話をテキストへ変換するステップを包含し、それにおいて前記フォーマットを行うステップは、前記送信するステップにおいて送信されるべきインスタント・メッセージを作成し、かつ前記音声認識済みのテキストを前記インスタント・メッセージ内へ含める、請求項1に記載の方法。
  6. コンピューティング・システムを介してボイス・サービスへアクセスするためのシステムであって:
    前記コンピューティング・システム内において電話呼び出しを受信するためのインターフェース;
    前記コンピューティング・システム内に配置される、確立済みの電話呼び出しを介して受信されたユーザ発話をテキストへ変換するための音声認識システム;および、
    前記音声認識システムから音声認識済みのテキストを受け取り、前記テキストからユーザ要求を識別し、前記ユーザ要求に従ってメッセージを生成し、かつ通信ネットワークを介して少なくとも1つのサーバ・システムへ前記メッセージを送信するべく構成されたサービス・エンジン;
    を包含するシステム。
  7. さらに、前記コンピューティング・システム内に配置される、受け取ったテキストを、確立済み電話呼び出しを介して再生されるべき言語音へ変換するためのテキスト読み上げエンジンを包含し、それにおいて前記サービス・エンジンは、前記送信されたメッセージに応答するコンテンツを受け取って、前記コンテンツを、言語音としてレンダリングされるべく前記テキスト読み上げエンジンへ提供する、請求項6に記載のシステム。
  8. 前記サービス・エンジンは、ユーザ要求に従ってメッセージを生成するべく構成された電子メール・インターフェースを包含し、それにおいて前記メッセージは、電子メール・メッセージである、請求項7に記載のシステム。
  9. 前記サービス・エンジンは、ユーザ要求に従ってメッセージを生成するべく構成されたインスタント・メッセージング・クライアントを包含し、それにおいて前記メッセージは、インスタント・メッセージである、請求項7に記載のシステム。
  10. 前記サービス・エンジンは、インターネットを介して送信するためにユーザ要求をフォーマットするべく構成されたHTTP(ハイパーテキスト・トランスファ・プロトコル)インターフェースとインタラクションする、請求項6に記載のシステム。
  11. コンピューティング・システムを介してボイス・サービスへアクセスするためのシステムであって:
    前記コンピューティング・システムにおいて、前記コンピューティング・システムへ登録されたユーザからの電話呼び出しを受信するための手段;
    前記電話呼び出しを介してユーザ発話を受信するための手段;
    前記ユーザ発話の音声認識を行いボイス・サービスのための要求を決定する、音声認識を行うための手段;
    前記ボイス・サービスのための要求に従って電子メッセージのフォーマットを行うための手段;および、
    前記ボイス・サービスのための要求に従ってサーバ・システムへ、通信ネットワークを介して前記電子メッセージを送信するための手段;
    を包含するシステム。
  12. 前記要求は、サーバ・システムからのコンテンツのための要求であり、前記フォーマットを行うための手段は、インターネットを介して送信されるべき電子メッセージを作成するための手段を包含する、請求項11に記載のシステム。
  13. さらに:
    前記コンピューティング・システム内において前記サーバ・システムからコンテンツを受信するための手段;
    前記コンピューティング・システム内において前記コンテンツを言語音のオーディオへ変換するための手段;および、
    前記電話呼び出しを介して、前記オーディオを前記ユーザへ向けて再生するための手段;
    を包含する、請求項12に記載のシステム。
  14. 前記要求は電子メールを送信する要求であり、さらに前記システムは:
    少なくとも1つの追加のユーザ発話を受信するための手段;および、
    前記少なくとも1つの追加のユーザ発話をテキストへ変換するための手段を包含し、それにおいて前記フォーマットを行うための手段は、送信されるべき電子メールを作成し、かつ前記音声認識済みのテキストを前記電子メール内へ含める、請求項11に記載のシステム。
  15. 前記要求はインスタント・メッセージを送信する要求であり、さらに前記システムは:
    少なくとも1つの追加のユーザ発話を受信するための手段;および、
    前記少なくとも1つの追加のユーザ発話をテキストへ変換するための手段を包含し、それにおいて前記フォーマットを行うステップは、前記送信するステップにおいて送信されるべきインスタント・メッセージを作成し、かつ前記音声認識済みのテキストを前記インスタント・メッセージ内へ含める、請求項11に記載のシステム。
  16. コンピュータ・プログラムであって、コンピュータに:
    前記コンピュータへ登録されたユーザからの電話呼び出しを受信するステップ;
    前記電話呼び出しを介してユーザの発話を受信するステップ;
    前記ユーザの発話の音声認識を行いボイス・サービスのための要求を決定する、音声認識を行うステップ;
    前記ボイス・サービスのための要求に従って電子メッセージのフォーマットを行うステップ;および、
    前記ボイス・サービスのための要求に従ってサーバ・システムへ、通信ネットワークを介して前記電子メッセージを送信するステップ;
    を実行させるための、前記コンピュータによって実行可能な複数のコード・セクションを有するコンピュータ・プログラム。
  17. 前記要求は、サーバ・システムからのコンテンツのための要求であり、前記フォーマットを行うステップは、インターネットを介して送信されるべき電子メッセージの作成を包含する、請求項16に記載のコンピュータ・プログラム。
  18. さらに、前記コンピュータに:
    前記コンピュータ内において前記サーバ・システムからコンテンツを受信するステップ;
    前記コンピュータ内において前記コンテンツを言語音のオーディオへ変換するステップ;および、
    前記電話呼び出しを介して、前記オーディオを前記ユーザへ向けて再生するステップ;
    を実行させる、請求項17に記載のコンピュータ・プログラム。
  19. 前記要求は電子メールを送信する要求であり、さらに前記コンピュータ・プログラムは、前記コンピュータに:
    少なくとも1つの追加のユーザ発話を受信するステップ;および、
    前記少なくとも1つの追加のユーザ発話をテキストへ変換するステップを実行させ、それにおいて前記フォーマットを行うステップは、前記送信するステップにおいて送信されるべき電子メールを作成し、かつ前記音声認識済みのテキストを前記電子メール内へ含める、請求項16に記載のコンピュータ・プログラム。
  20. 前記要求はインスタント・メッセージを送信する要求であり、さらに前記コンピュータ・プログラムは、前記コンピュータに:
    少なくとも1つの追加のユーザ発話を受信するステップ;および、
    前記少なくとも1つの追加のユーザ発話をテキストへ変換するステップを実行させ、それにおいて前記フォーマットを行うステップは、前記送信するステップにおいて送信されるべきインスタント・メッセージを作成し、かつ前記音声認識済みのテキストを前記インスタント・メッセージ内へ含める、請求項16に記載のコンピュータ・プログラム。
JP2004325600A 2003-11-10 2004-11-09 ボイス・ポータル Pending JP2005151553A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/705,328 US8233592B2 (en) 2003-11-10 2003-11-10 Personal home voice portal

Publications (1)

Publication Number Publication Date
JP2005151553A true JP2005151553A (ja) 2005-06-09

Family

ID=34552335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004325600A Pending JP2005151553A (ja) 2003-11-10 2004-11-09 ボイス・ポータル

Country Status (3)

Country Link
US (2) US8233592B2 (ja)
JP (1) JP2005151553A (ja)
CN (1) CN1620018A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019531555A (ja) * 2016-10-08 2019-10-31 アリババ グループ ホウルディング リミテッド アプリケーションにおいてアクセシビリティ機能を実施するための方法及び装置

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8023624B2 (en) * 2005-11-07 2011-09-20 Ack Ventures Holdings, Llc Service interfacing for telephony
US8407052B2 (en) 2006-04-17 2013-03-26 Vovision, Llc Methods and systems for correcting transcribed audio files
WO2009073768A1 (en) 2007-12-04 2009-06-11 Vovision, Llc Correcting transcribed audio files with an email-client interface
US8015014B2 (en) * 2006-06-16 2011-09-06 Storz Endoskop Produktions Gmbh Speech recognition system with user profiles management component
US7890138B2 (en) * 2006-06-30 2011-02-15 Advanced Micro Devices, Inc. Mechanism for remotely accessing a portable computer including wireless communication functionality
US7805131B2 (en) * 2007-05-03 2010-09-28 Sonus Networks, Inc. Personal service integration on a network
US9191514B1 (en) 2007-05-07 2015-11-17 At&T Intellectual Property I, L.P. Interactive voice response with user designated delivery
US9953646B2 (en) 2014-09-02 2018-04-24 Belleau Technologies Method and system for dynamic speech recognition and tracking of prewritten script
US11875798B2 (en) 2021-05-03 2024-01-16 International Business Machines Corporation Profiles for enhanced speech recognition training

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953392A (en) * 1996-03-01 1999-09-14 Netphonic Communications, Inc. Method and apparatus for telephonically accessing and navigating the internet
US5884262A (en) * 1996-03-28 1999-03-16 Bell Atlantic Network Services, Inc. Computer network audio access and conversion system
US6233318B1 (en) * 1996-11-05 2001-05-15 Comverse Network Systems, Inc. System for accessing multimedia mailboxes and messages over the internet and via telephone
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
JPH10190884A (ja) 1996-12-27 1998-07-21 Casio Comput Co Ltd 通信制御装置及び記憶媒体
US5995597A (en) * 1997-01-21 1999-11-30 Woltz; Robert Thomas E-mail processing system and method
JP3244014B2 (ja) 1997-02-14 2002-01-07 日本電気株式会社 マルチメディア変換装置および変換方式
US6542497B1 (en) * 1997-03-11 2003-04-01 Verizon Services Corp. Public wireless/cordless internet gateway
KR100280045B1 (ko) * 1997-05-02 2001-02-01 윤종용 외부전화를이용한메일독출방법및그장치
EP0907271A1 (en) * 1997-09-25 1999-04-07 Alcatel Individualized system for exchanging data between a terminal and access means via a telephone network
US6859451B1 (en) * 1998-04-21 2005-02-22 Nortel Networks Limited Server for handling multimodal information
EP0987860A3 (en) * 1998-09-16 2004-01-14 Mitsubishi Materials Corporation Radio server system
US6243445B1 (en) * 1998-11-03 2001-06-05 At&T Corporation Method and apparatus for telephone data network access
US6401085B1 (en) * 1999-03-05 2002-06-04 Accenture Llp Mobile communication and computing system and method
CN1286561A (zh) 1999-08-30 2001-03-07 广东金科信息网络中心 使用普通电话机收发互联网电子邮件的信息服务系统
US6970915B1 (en) * 1999-11-01 2005-11-29 Tellme Networks, Inc. Streaming content over a telephone interface
JP2001216211A (ja) 1999-11-24 2001-08-10 Sharp Corp インターネットサービス提供システムおよび方法、ならびにインターネットサービス提供システムで用いられるマクロサーバ
US6625258B1 (en) * 1999-12-27 2003-09-23 Nortel Networks Ltd System and method for providing unified communication services support
US6721705B2 (en) * 2000-02-04 2004-04-13 Webley Systems, Inc. Robust voice browser system and voice activated device controller
US20010023400A1 (en) * 2000-02-04 2001-09-20 Webley Systems, Inc. Collectively functioning bundle of telephone and network services
JP2002033832A (ja) 2000-07-18 2002-01-31 Ntt Docomo Inc サービス提供システム、ボイスゲートウェイ、コンテンツサーバおよびサービス提供方法
US6507727B1 (en) * 2000-10-13 2003-01-14 Robert F. Henrick Purchase and delivery of digital content using multiple devices and data networks
US20020169615A1 (en) * 2001-03-23 2002-11-14 Irwin Kruger Computerized voice-controlled system for compiling quality control data
US7016348B2 (en) * 2001-08-28 2006-03-21 Ip Unity Method and system for direct access to web content via a telephone
JP2003167895A (ja) 2001-11-30 2003-06-13 Denso Corp 情報検索システム、サーバおよび車載端末
US20030152203A1 (en) * 2002-02-13 2003-08-14 Berger Adam L. Message accessing
JP2003309673A (ja) 2002-04-16 2003-10-31 Nippon Telegraph & Telephone East Corp 音声の提供及び課金装置、音声の提供及び課金方法、コンピュータプログラム及びそのプログラムを記録した記録媒体
US20040088358A1 (en) * 2002-11-05 2004-05-06 Nokia Corporation Method and system for setting up a notification
US20040117838A1 (en) * 2002-12-11 2004-06-17 Jeyhan Karaoguz Headend pre-processing media guide support for personal media exchange network
CN1531312A (zh) 2003-03-10 2004-09-22 联想(北京)有限公司 电话语音交互系统的输入方法
US20060218191A1 (en) * 2004-08-31 2006-09-28 Gopalakrishnan Kumar C Method and System for Managing Multimedia Documents
US7672440B2 (en) * 2005-01-20 2010-03-02 International Business Machines Corporation Single point of contact personal communication system
US8606781B2 (en) * 2005-04-29 2013-12-10 Palo Alto Research Center Incorporated Systems and methods for personalized search
US7976386B2 (en) * 2006-06-12 2011-07-12 Tran Bao Q Mesh network game controller with voice transmission, search capability, motion detection, and/or position detection
GB0703974D0 (en) * 2007-03-01 2007-04-11 Sony Comp Entertainment Europe Entertainment device
US20080318679A1 (en) * 2007-06-21 2008-12-25 Alexander Bach Tran Foot game controller with motion detection and/or position detection

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019531555A (ja) * 2016-10-08 2019-10-31 アリババ グループ ホウルディング リミテッド アプリケーションにおいてアクセシビリティ機能を実施するための方法及び装置

Also Published As

Publication number Publication date
CN1620018A (zh) 2005-05-25
US8233592B2 (en) 2012-07-31
US20120263281A1 (en) 2012-10-18
US20050100142A1 (en) 2005-05-12
US8831185B2 (en) 2014-09-09

Similar Documents

Publication Publication Date Title
US9214154B2 (en) Personalized text-to-speech services
US8831185B2 (en) Personal home voice portal
US9542944B2 (en) Hosted voice recognition system for wireless devices
US6507817B1 (en) Voice IP approval system using voice-enabled web based application server
US6618704B2 (en) System and method of teleconferencing with the deaf or hearing-impaired
US7003463B1 (en) System and method for providing network coordinated conversational services
JP4067276B2 (ja) スピーチ認識システムを構成する方法及びシステム
EP1125279B1 (en) System and method for providing network coordinated conversational services
US7308484B1 (en) Apparatus and methods for providing an audibly controlled user interface for audio-based communication devices
US20060276230A1 (en) System and method for wireless audio communication with a computer
US8014499B2 (en) Arrangement in a local computer for sending voice messages to a unified communications system
US20120004910A1 (en) System and method for speech processing and speech to text
JP2007529916A (ja) コンピュータでの音声通信
KR20050083716A (ko) 컴퓨터를 이용한 무선 오디오 통신 시스템 및 방법
US8594640B2 (en) Method and system of providing an audio phone card
GB2362540A (en) Accessing databases via the internet
Tsai et al. Dialogue session: management using voicexml
JPH09258785A (ja) 情報処理方法および情報処理装置
KR20060061612A (ko) 문자 메시지의 음성 안내 방법 및 그에 따른 저장매체 및그에 따른 통신 단말기
JP2002132639A (ja) 言語データ送信システム及び方法
JP2006508596A (ja) ネットワークのオーディオデータを処理する方法およびその方法を実行する装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061030

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20061030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20061031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070511

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070828

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20070928