JP2005237009A - アプリケーション間で移動するための方法およびシステム - Google Patents

アプリケーション間で移動するための方法およびシステム Download PDF

Info

Publication number
JP2005237009A
JP2005237009A JP2005041474A JP2005041474A JP2005237009A JP 2005237009 A JP2005237009 A JP 2005237009A JP 2005041474 A JP2005041474 A JP 2005041474A JP 2005041474 A JP2005041474 A JP 2005041474A JP 2005237009 A JP2005237009 A JP 2005237009A
Authority
JP
Japan
Prior art keywords
application
grammar
applications
token
entry point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2005041474A
Other languages
English (en)
Inventor
Daniel S Stoops
エス.ストゥープス ダニエル
Jeffrey Webb
ウェブ ジェフリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia of America Corp
Original Assignee
Lucent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lucent Technologies Inc filed Critical Lucent Technologies Inc
Publication of JP2005237009A publication Critical patent/JP2005237009A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B66HOISTING; LIFTING; HAULING
    • B66BELEVATORS; ESCALATORS OR MOVING WALKWAYS
    • B66B5/00Applications of checking, fault-correcting, or safety devices in elevators
    • B66B5/0006Monitoring devices or performance analysers
    • B66B5/0018Devices monitoring the operating condition of the elevator system
    • B66B5/0031Devices monitoring the operating condition of the elevator system for safety reasons
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B66HOISTING; LIFTING; HAULING
    • B66BELEVATORS; ESCALATORS OR MOVING WALKWAYS
    • B66B5/00Applications of checking, fault-correcting, or safety devices in elevators
    • B66B5/0006Monitoring devices or performance analysers
    • B66B5/0012Devices monitoring the users of the elevator system
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Machine Translation (AREA)

Abstract

【課題】アプリケーション間で移動するための方法およびシステムを提供する。
【解決手段】通信ネットワークにおいて音声中心のアプリケーション間における移動を円滑にするルート文法が提供される。ルート文法は、サポートされたアプリケーション群のアプリケーション文法から構築することができる。認識処理中、ルート文法を現在のアプリケーションのアクティブな文法と結合して、合成文法を生成することができる。合成文法の一部として認識されたオーディオ通信を使用して、現在のアプリケーションに役立てること、アプリケーション間で移動すること、および/または介在する複数のレベルを通って移動せずに、アプリケーションの異なる部分、または異なるドキュメントに直接にアクセスすることができる。詳細には、ユーザの見地から、より長いナビゲーション・プロセスを使用するのではなく、ルート文法によって参照される別のアプリケーションまたはドキュメントに直接にアクセスすることができる。
【選択図】図3

Description

本発明は、一般に、通信システムを介してアプリケーションにアクセスすることに関し、より詳細には、アプリケーション間で移動することに関する。
このセクションは、以下に説明し、かつ/または主張する本発明の様々な態様に関連することが可能な技術の様々な態様を読者に紹介することを目的とする。この説明は、本発明の様々な態様のよりよい理解を促進する背景情報を読者に提供するのに役立つものと考える。したがって、以下に述べることは、その見地から読まれるべきであり、従来の技術の承認ではないものと理解されたい。
過去数十年にわたり、有線通信システムおよび無線通信システムを含む通信システムが、着実に発展してきた。この発展の一例が、セルラー電話システムが採用されつづけ、ますます普及していることである。予想することができるとおり、潜在的なセルラー・サービス加入者の数が限られていることが、様々なセルラー・サービス・プロバイダ間で、自らの加入者ベースを保護し、増やすための競争をもたらしている。
加入者を求めるこの競争に応えて、セルラー・サービス・プロバイダは、自らが提供するサービスを基本的な電話から、多種多用な他のアプリケーションへのアクセスを含むように拡大している。例えば、音声メール・アプリケーションおよび会議通話アプリケーションが、加入者に提供されることが可能である。同様に、スケジューリング・アプリケーション、ニュース・アプリケーション、スポーツ・アプリケーション、気象アプリケーション、および金融アプリケーションなどのコンテンツ主導型アプリケーションも、加入者に提供されることが可能である。そのようなアプリケーションは、通常、加入者が、予約、ニュース記事、スポーツの得点、気象予報、および株価などの個人用コンテンツまたはサードパーティ・コンテンツにアクセスすることができるようにする。さらに、利用可能なアプリケーションの一部、またはすべてが、使用の容易さを向上させるため、アプリケーションの運用において場所ベースであること、または場所情報を利用することが可能である。理解されるとおり、電話番号またはアクセス番号のリスト、あるいはオーディオ・アプリケーション・メニューまたはビデオ・アプリケーション・メニューなどの、それらのアプリケーションにアクセスするための技術が、様々なアプリケーションの間で移動するのを容易にするためにサービス・プロバイダによって提供されることが可能である。
初めて主張される本発明に範囲が相応するいくつかの態様を以下に説明する。それらの態様は、単に、本発明がとることが可能ないくつかの形態の簡単な概要を読者に提供するために提示され、本発明の範囲を限定するものではないことを理解されたい。実際、本発明は、以下に記載されない可能性がある様々な態様を包含することが可能である。
本発明の一態様によれば、信号プロセッサが提供される。信号プロセッサは、合成文法に基づいて選択されたトークンを受け取るように構成することができる。トークンは、複数のアプリケーションの1つのアプリケーションのエントリ・ポイントに対応する。信号プロセッサは、エントリ・ポイントにおいてそれぞれのアプリケーションにアクセスするように構成することもできる。
本発明の別の態様によれば、通信システムが提供される。通信システムは、オーディオ・コマンドと互いに関連する被変調信号を受信し、その被変調信号を解析して合成文法の構成要素を特定するように構成された電話サーバを含むことが可能である。電話サーバは、構成要素に対応するトークンを選択するように構成することもできる。また、通信システムは、トークンを獲得し、そのトークンに基づいて複数のアプリケーションの1つのアプリケーションのエントリ・ポイントにアクセスするように構成されたブラウザ・モジュールも含むことが可能である。
本発明のさらに別の態様によれば、アプリケーションにアクセスするための方法が提供される。方法は、信号を処理して、オーディオ・コードを合成文法の構成要素として特定する動作を含むことが可能である。さらに、方法は、合成文法の構成要素に基づき、複数のアプリケーションの1つのアプリケーションのエントリにアクセスする動作を含むことが可能である。
本発明のさらなる態様によれば、実体のあるコンピュータ可読媒体が提供される。媒体は、信号を処理してオーディオ・コードを合成文法の構成要素として特定するための、コンピュータ可読媒体上に格納されたプログラミング命令を含むことが可能である。媒体は、合成文法の構成要素に基づき、複数のアプリケーションの1つのアプリケーションのエントリ・ポイントにアクセスするための、コンピュータ可読媒体上に格納されたプログラミング命令も含むことが可能である。
本発明の別の態様によれば、実体のあるコンピュータ媒体を製造するための方法が提供される。方法は、コンピュータ可読媒体上に、オーディオ・コードを合成文法の構成要素として特定するためのプログラミング命令を格納する動作を含むことが可能である。方法は、コンピュータ可読媒体上に、合成文法の構成要素に基づき、複数のアプリケーションの1つのアプリケーションのエントリ・ポイントにアクセスするためのプログラミング命令を格納する動作も含むことが可能である。
本発明のさらなる態様によれば、電話システムを製造するための方法が提供される。方法は、オーディオ・コードを合成文法の構成要素として特定するようにプログラミングされた少なくとも1つの信号処理デバイスを提供する動作を含むことが可能である。さらに、信号処理デバイスは、合成文法の構成要素に基づき、複数のアプリケーションの1つのアプリケーションのエントリ・ポイントにアクセスするようにプログラミングすることができる。
本発明の利点は、以下の詳細な説明を読み、図面を参照することで明白となり得る。
本発明の1つまたは複数の特定の実施形態を以下に説明する。それらの実施形態の簡潔な説明を提供するため、実際の実装のすべての特徴が、本明細書で説明されるわけではない。いずれのそのような実際の実装の開発においても、あらゆる技術的計画または設計計画の場合と同様に、実装ごとに異なる可能性があるシステム関連の制約およびビジネス関連の制約との適合など、開発者の具体的な目標を実現するため、多数の実装固有の決定が行われなければならないことを理解されたい。さらに、そのような開発作業は、複雑で時間がかかる可能性があるが、それでも、本開示の恩恵を受ける当業者には、設計、組み立て、および製造の日常的な仕事であることを理解されたい。
セルラー電話業界における顧客を求める競争が高まるにつれ、サービス・プロバイダは、音声メール・アプリケーション、ニュース・アプリケーション、および気象アプリケーションを含む様々なアプリケーションへのアクセスなどの追加のサービスを提供することにより、対応してきた。そのようなアプリケーションは、ダイヤル・トーンまたはメールボックスなどの単一のポイントからアクセス可能であり得る。様々なアプリケーションの利用しやすさ、および利便性をさらに向上させるため、様々な音声中心のインタフェースを開発して、加入者が、音声コマンドまたは音声応答を使用してアプリケーションと対話することができるようにすることが可能である。ただし、音声中心のインタフェースの利点は、アプリケーション間における共通のユーザ・インタフェースの欠如により抑えられる可能性がある。
詳細には、サービス・プロバイダによって提供される様々なアプリケーションは、複数のサードパーティ・ベンダによって構築され、かつ/またはサポートされることが可能である。サードパーティ・ベンダは、互いに積極的に競い合っていることも、単に、他のアプリケーションに気付いていない、または無関心であることも可能である。いずれにしても、サードパーティ・ベンダによって提供されるアプリケーションは、各アプリケーションが、独立型ユーザ・インタフェースを含んで、通常、孤立している。
この結果、アプリケーション間で移動することを所望する加入者は、通常、第1のアプリケーションでトランザクションを完了し、第1のアプリケーションを終了しなければならない。次に、加入者は、第2のアプリケーションを開始し、第2のアプリケーションでトランザクションを完了させ、第2のアプリケーションを終了してから、第3のアプリケーションを開始し、以下同様である。
さらに、加入者は、通常、加入者が求める機能またはコンテンツに達するのに、アプリケーションの様々なレイヤまたはスクリプトを通って移動しなければならない。例えば、ある都市に関する気象予報にアクセスするのに、加入者は、第1のアプリケーションを終了し、気象アプリケーションを開始し、都市を指定するプロンプトに応答し、所望の情報、すなわち、明日の予報を指定するプロンプトに応答し、次に、気象アプリケーションを終了してから、第1のアプリケーションに戻らなければならない可能性がある。したがって、加入者は、所望の機能またはコンテンツに達するのに、望むより頻繁にアプリケーションを終了すること、および開始すること、ならびに各アプリケーションの初めのレイヤ群を繰り返し通って移動する退屈さを負わされる可能性がある。したがって、加入者に、様々な独立のアプリケーションを提供するだけでなく、加入者が、アプリケーション間でより容易に移動することができ、かつ/またはアプリケーションからの特定のデータにより容易にアクセスすることができるようにするインタフェースも提供することが望ましい可能性がある。
本明細書で開示する技術は、複数の独立のアプリケーションで使用するための統一されたインタフェースを提供する。具体的には、開示する技術は、サポートされるアプリケーションの一束に関して容認できる応答に全体的に同等とみなされるオーディオ・コードまたはオーディオ信号(口頭の語または句、またはDTMFトーン)の一般的なリストまたは用語集の使用を可能にして、様々なアプリケーションの間で、個々にではなく、一括して移動が行われることを可能にする。詳細には、統一されたインタフェースは、ユーザが、予備的なメニューまたはオプションの迷路を通る必要なしに、アプリケーション間で自由に移動すること、またはアプリケーションからコンテンツに直接にアクセスすることを可能にする。さらに、本技術は、1組にまとめられたアプリケーションについての説明、およびその1組へのアクセスを提供するサービス(本明細書で、メイン・メニューと呼ぶ)を提供するアプリケーションの自動的な生成も可能にする。
VoiceXMLで書かれたアプリケーション群の文脈では、各アプリケーションは、少なくとも、アプリケーションを構成するドキュメントに関連する様々な文法を含む関連した文法を有する。VoiceXMLなどのプログラミング言語の文脈では、文法は、文法に関連するそれぞれの構成体つまり、ドキュメントまたはアプリケーションに関して許容できる応答または入力のリストと考えることができる。つまり、アプリケーションのドキュメントは、関連するドキュメント文法の中で定義された応答を入力として受け入れることができる。したがって、VoiceXMLまたは類似するプログラミング言語の文脈では、本技術は、ルート・レベルまたはシステム・レベルの文法を確立することによって実施することが可能であり、この文法は、それぞれのルート・レベルまたはシステム・レベルからアクセス可能な、メイン・メニューを含む各アプリケーションに関する許容できる入力を含むことが可能である。
説明するルート文法は、サポートされるアプリケーション群に関する汎用の用語集またはナビゲーション上の文法を提供するが、実際には、加入者がいつアプリケーションにアクセスしているかなどの現在の状況に基づいて、そのようなルート文法を補足することが望ましい可能性がある。例えば、状況に応じて、ルート文法だけを含むことも(いずれのアプリケーションも現在、アクセスされていない、すなわち、メイン・メニューにいる場合など)、ルート文法と並び、現在、アクセスされているアプリケーションに関するアプリケーション文法を含むことも可能な合成文法を使用することができる。合成文法は、単一の文法として、すなわち、ルート文法と、現在、アクセスされているアプリケーションのアプリケーション文法をともに含む単一の文法として実装することができる。代替として、合成文法は、同時にアクセスすることができ、かつ/または機能上、単一の文法として扱うことができる2つの別個の文法として、すなわち、ルート文法および現在のアプリケーション文法として実装してもよい。ルート文法と現在のアプリケーション文法の間で矛盾または重複が存在する場合、共通のコマンドまたは重複するコマンドのケースでは、現在のアプリケーションを優先させるなどの優先規則を使用することができる。合成文法は、ルート文法へのアクセスを維持しながら、アプリケーション文法との連続性を提供して、他のアプリケーションおよびメイン・メニューへの容易なアクセスを提供する。
さらに、当業者には理解されるとおり、サービス・プロバイダは、異なるアプリケーション・パッケージまたはアプリケーションの一束を加入者に提供することができる。したがって、前述したとおり、異なるルート文法およびメイン・メニューを各アプリケーションの束に関連付けることができる。様々なルート文法およびメイン・メニュー・アプリケーションの生成および更新は、それぞれのアプリケーション・サーバにクエリを行うように構成された統一インタフェース・サーバなどの、プロセッサ・ベースのシステム上で実行されることが可能である。このように、統一インタフェース・サーバが、適切なアプリケーション・サーバにクエリを行うことにより、適切なルート文法および/またはメイン・メニュー・アプリケーション群を構築することができる。
VoiceXMLの文脈におけるルート文法の使用は、本技術の1つの可能な実装であるが、他の実装も可能であることが当業者には認められよう。実際、本技術は、一般に、複数のアプリケーションに関するオーディオ・コードを含む用語集の使用、ならびに様々なアプリケーションの間、および内部で移動するための、そのような用語集の使用を包含する。このようにして、本技術は、他の点では独立したアプリケーション間で容易に、迅速に移動することを可能にする。
次に図面を見て、図1を最初に参照すると、符号10で全体的に示される通信システムの例が与えられている。図示した通信システム10は、関係者間の電話通信をサポートするコンポーネント、ならびに様々な関係者によって提供される、またはサポートされることが可能なアプリケーション群へのアクセスをサポートするコンポーネントを含む。例えば、通信システム10は、1つまたは複数のセルラー電話機12、PDAデバイス、およびオーディオ通信が可能な他のデバイスなどの無線デバイスのための無線サポートを含む。セルラー電話機12のような無線デバイスは、音声および/またはDTMFトーンなどのオーディオ信号を、無線インタフェースを介して電磁信号として伝送することができる初期の被変調信号に変換することができる。信号は、セル・タワー16や関連するアンテナ18などの基地トランシーバ局によって受信される。セル・タワー16は、初期の被変調信号、あるいは初期の被変調信号の増幅された、または別の形で処理されたバージョンを含むことが可能な被変調信号を、モバイル交換センタ(MSC)20に中継する。
モバイル交換センタ20は、無線システムにサービスを提供するスイッチである。モバイル交換センタ20は、適切な宛先に呼び出しを切り替え、接続を維持する機能を実行する。実際、モバイル交換センタ20の1次機能は、モバイル電話機と、別のモバイル電話機または陸線電話機などの別の電話機の間で音声パス接続を提供することである。通常のモバイル交換センタ20は、交換機能、呼び出し処理、チャネル割り当て、データ・インタフェース、追跡、ページング、呼び出しハンドオフ、料金請求、およびユーザ・データベースを制御するいくつかのデバイスを含む。
動作の一環として、モバイル交換センタ20は、中継された被変調信号、あるいは中継された被変調信号の増幅された、または別の形で処理されたバージョンを含むことが可能な被変調信号を、サービス・プロバイダによって維持される電話サーバ22に伝送することができる。被変調信号は、光ファイバ・ケーブルまたは銅線などの物理的な線を介して、または無線伝送を介して、モバイル交換センタ20から電話サーバ22に伝送することができる。例えば、被変調信号は、T1電話標準を使用するT1線を介して伝送することができる。
被変調オーディオ信号は、陸線電話機26、または他の電話装置に接続された公衆交換電話網(PSTN)24から電話サーバ22に送信することもできる。同様に、被変調オーディオ信号は、インターネットなどのネットワークに接続され、ボイスオーバーIP(VOIP)などの適切な通信プロトコルを使用するコンピュータ28から発信されることも可能である。
電話サーバ22が被変調オーディオ信号を受信すると、受信された信号が、電話呼び出しを行う試みを表すか、または利用可能なアプリケーションにアクセスする要求を表すかに基づき、異なる動作が実行されることが可能である。例えば、被変調信号は、アプリケーション、またはアプリケーションのメニューにアクセスする試みとして認識されることが可能な、語、句、および/またはDTMFトーンなどのオーディオ・コードを含むことが可能である。オーディオ・コードの認識は、隠れマルコフ・モデル(HMM)またはニューラル・ネットなどの様々な統計モデル化技術を使用するパターン認識ルーチンによって達せられることが可能である。
受信された被変調信号が、アプリケーションにアクセスする試みを表しているという認識により、1つまたは複数の適切なトークンが、ブラウザ・モジュール30に送られ、最終的に、アプリケーション・サーバ32、34、および36の1つなどのアプリケーション・サーバに送られることがもたらされることが可能である。そのトークンまたはトークン群に応答して、それぞれのアプリケーションは、セルラー電話機12、陸線電話機26、またはコンピュータ28などの発信元デバイスに後に伝送されるように、データ・ファイルをブラウザ・モジュール30に伝送することができる。データ・ファイルの形式は、要求されたデータに対応することが可能である。例えば、音声メール・アプリケーションは、要求された音声メールに対応するオーディオ・ファイルを加入者に伝送することにより、トークン、またはトークンの組み合わせに応答することができる。同様に、テキスト・メッセージング・または電子メールなどのアプリケーションは、1つまたは複数のテキスト・メッセージに対応するデータ・ファイルを伝送することにより、応答することができる。Webアクセスまたは写真アルバム・アプリケーションなどの他のアプリケーションは、マルチメディア・ファイルまたはビデオ・ファイルに対応するデータ・ファイルを伝送することにより、応答することができる。つまり、アプリケーション、要求されたデータ、および発信元デバイスの性質に基づき、適切なデータ・ファイルが加入者に戻されることが可能である。すると、加入者は、所望する場合、アプリケーションから追加の情報を要求することができる。
ブラウザ・モジュール30に送られたトークンまたはトークン群は、認識されたパターンをそれぞれのトークンまたはトークン群に関連付ける、VoiceXML実装における合成文法のような、汎用の用語集に基づいて特定することができる。認識されたパターンは、1つまたは複数のDTMFトーン、1つまたは複数の口頭の語(「削除する」または「気温」などの)、または口頭の句(「今夜は、零下になるか」などの)に対応することが可能である。さらに、1つまたは複数の認識されたパターンが、同一のトークンに対応することも可能である。例えば、「削除する」、「消去する」、および「除去する」という語に関する認識されたパターンがすべて、同一のトークンを呼び出し、その結果、アクセスされたアプリケーションから同一の応答を呼び出すことが可能である。
一般に、ブラウザ・モジュール30は、トークンまたはトークン群を受け取ることができ、受け取られたトークンまたはトークン群に基づき、アプリケーション・サーバ32、34、および36上のそれぞれアプリケーションとの対話を誘導し、調整することができる。例えば、ブラウザ・モジュール30は、株価を求める要求に対応するトークンなど、アプリケーションのデータ照会に関連する1つまたは複数のトークンを受け取ることができる。別のアプリケーションが、現在、アクティブである場合、ブラウザ・モジュール30は、適切なトークンを送信することなどにより、ユーザに見られずに、そのアクティブなアプリケーションを適切に終了して、トークン群を金融アプリケーションに提供することができる。所望のデータを含むデータ・ファイルを引き出すトークン群により、金融アプリケーションにおける関心対象の特定のドキュメントまたはルーチンに直接にアクセスが行われることが可能である。代替として、ブラウザ・モジュール30は、加入者に見られずに、予備的なドキュメントまたはメニューを通り、所望のデータを引き出すことができる関連するドキュメントまたはルーチンに達してもよい。
ブラウザ・モジュール30は、追加の株価などを求める、金融アプリケーション向けの後続のトークン群を、金融アプリケーションに引続き向けることができる。ブラウザ・モジュール30は、異なるアプリケーションに対応するトークンを受け取ると、金融アプリケーションを適切に終了して、要求されたデータを求める要求されたアプリケーションとの対話を開始することができる。一部のオーディオ・コードは、複数のアプリケーションに共通である可能性があるが(口語の語、「削除する」または「次へ」などの)、処理文字列における追加のトークン(「削除する」、「電子メール」、または「次へ」、「音声」、および「メール」などの)が、ブラウザ・モジュール30によって使用されて、どのようなアプリケーションが呼ばれているかが特定されることが可能である。さらに、ブラウザ・モジュール30は、アプリケーションと通信しつづけるかどうかを決める際に、トークン(「次へ」などの)が、音声メール・アプリケーションなどの、現在、アクセスされているアプリケーションの文脈で意味を成すかどうかも考慮に入れることができる。例えば、VoiceXMLアプリケーションの文脈で、「次へ」に関するトークンが、現在のアプリケーションに関するアプリケーション文法の一部である場合、ブラウザ・モジュール30は、そのトークンを現在のアプリケーションに向けることができる。このようにして、アプリケーションとの通信は、現在のアプリケーションのアプリケーション文法の中に存在しないトークンなどにより、新たなアプリケーションが明確に呼ばれるまで、維持されることが可能である。
前述したとおり、ブラウザ・モジュールに伝送されるトークンまたはトークン群は、認識されたパターンを適切なトークンと同等とみなす、通常、電話サーバ22上に配置される共通の用語集を参照することにより、特定されることが可能である。前述したとおり、そのような共通の用語集の一例は、VoiceXMLで書かれたアプリケーションで使用するための合成文法であり得る。その共通の用語集は、ブラウザ・モジュール30と通信して、システム10全体にわたるルート文法および/またはメイン・メニュー・アプリケーションの生成および更新を調整することができる統一インタフェース・サーバ37、または他のプロセッサ・ベースのシステムにより、部分的に、または全部が生成されることが可能である。
合成文法は、口頭の語、口頭の句、またはDTMFトーンに対応する認識されたパターンを、本明細書で説明する本技術において使用することができる意味解釈、すなわち、トークンと同等とみなすための基準を提供する。当業者には理解されるとおり、意味解釈は、単純な値(文字列などの)、属性と値のペアのフラットな集合(日、月、および年などの)、または入れ子型オブジェクトであることが可能である。このようにして、合成文法は、認識された語、句、またはトーンを、少なくとも1つのサポートされたアプリケーションによって予期される入力に変換するための機構を提供する。トークンに応答して、アプリケーション、またはアプリケーションのドキュメントは、次の音声メール・メッセージ、株価、スポーツの得点などの所望の出力を提供することができる。
例として、次に図2を参照すると、ルート文法40、および関連するアプリケーション文法およびドキュメント文法に対するルート文法の関係の図が与えられている。図2に示すとおり、ルート文法40は、それぞれのアプリケーション文法48、50、52、および53をそれぞれが有する、複数のアプリケーション、および自動的に生成されたメイン・メニュー・アプリケーションに関連することが可能である。各アプリケーション文法は、そのアプリケーションを構成するドキュメントに関するそれぞれのドキュメント文法を包含する。例えば、第1のアプリケーション文法48は、図2に示すとおり、少なくとも、第1のアプリケーションのドキュメント群に関する文法、すなわち、ドキュメント(1a)文法54およびドキュメント(1b)文法56を含むことが可能である。同様に、第2のアプリケーション文法50は、少なくともドキュメント(2a)文法58を含むことが可能であり、第3のアプリケーション文法52は、少なくともドキュメント(3a)文法60、ドキュメント(3b)文法62、およびドキュメント(3c)文法64を含むことが可能である。さらに、メイン・メニュー・アプリケーション文法53が、ドキュメント(4a)文法66のようなヘルプに関連するドキュメント文法、およびドキュメント(4b)文法68のような、チュートリアルに関連するドキュメント文法を含むことが可能である。
実際には、ブラウザ・モジュール30が、ルート文法40を生成することができる。例えば、ブラウザ・モジュール30は、それぞれのアプリケーションにクエリを行って、それぞれのアプリケーション文法48、50、および52を引き出すことができ、アプリケーション文法48、50、および52からルート文法40が生成されることが可能である。ブラウザ・モジュール30は、統一インタフェース・サーバ37などの、ブラウザ30がクエリを受けることが可能なプラットフォームにルート文法40を公開することができる。代替として、サービス・プロバイダが、アプリケーション文法48、50、および52を検査して、ルート文法の構成要素を特定し、それらの構成要素を、ルート文法40の中に公開して入れるようにブラウザ・モジュール30にサブミットすることができる。さらに、アプリケーション・プロバイダ自体、アプリケーション・プロバイダがルート文法40の中で公開されるのが適切であると考える文法要素をサブミットすることができる。
前述したとおり、本技術のルート文法40は、それぞれのアプリケーション文法48、50、および52を含むことが可能である。したがって、ルート文法40の構成要素であると認識された語、句、またはトーンを使用して、ルート文法40によって参照されるそれぞれのアプリケーションおよびドキュメントに対応するトークン、またはトークン文字列を選択することができる。トークン、またはトークン文字列を使用して、アプリケーションの介在するレイヤ、または介在するドキュメントを通って移動する必要なしに、アプリケーションの適切なレベル、または適切なドキュメントに直接にアクセスすることができる。さらに、前述したとおり、ルート文法は、アプリケーションをバンドルにグループ化することによって作成されたメイン・メニュー・アプリケーションにアクセスすることができる。
VoiceXMLは、音声中心のアプリケーション群を実装するのに使用することができる1つの言語であるが、他の標準化された言語および/または独自の言語も使用することができる。音声中心のアプリケーションが、対応するトークンを有する語、句、またはトーンを認識する、すなわち、文法を保有する限り、本技術は、適用可能である。詳細には、本技術は、適切なトークンまたはトークン群によって直接にアクセスされることが可能な複数のエントリ・ポイント、すなわち、レベル、ドキュメント、またはサブルーチンをそれぞれが保有する複数のアプリケーション間で移動するために役立つ可能性がある。
次に、図3を参照すると、本技術を使用するユーザと2つのアプリケーションの間における対話の例が与えられている。図3に示すとおり、図示した音声メール・アプリケーション72や気象アプリケーション74などのいくつかのアプリケーション70が、加入者に利用可能であり得る。VoiceXML実装において、ルート文法40を使用して、加入者が、アプリケーション70間で自由に移動できるようにすることが可能である。例えば、加入者が、最初、「私は何をすることができるか」と発声して、メイン・メニューからヘルプ・チュートリアルを引き出すことにより、バンドルの中で利用可能なサービスのリストを獲得することを所望することが可能である。
代替として、加入者は、メイン・メニュー、およびアプリケーション予備メニューを迂回することを所望することが可能である。例えば、ユーザは、「マイアミ、来週金曜日の天気」と口頭で述べて、気象アプリケーション74の気象ドキュメント再生76から応答データを引き出すことができる。加入者による言明は、気象ドキュメント再生74のドキュメント文法の構成要素である語を含むため、判定ブロック78において都市を引き出すことなどの、そうでなければ介在する工程が、迂回されることが可能である。
気象を確認したことに続き、ユーザは、音声メール・アプリケーション72におけるキューの2番目のメッセージを確認することを所望することが可能である。ユーザは、「次のメッセージ」と口頭で述べて、次のメッセージ・ドキュメント82にアクセスし、ユーザの音声メール・キューの中の2番目のメッセージを引き出すことができる。
以上の例で述べたとおり、加入者の言明は、普通、このようにアクセスされない可能性がある、VoiceXMLアプリケーションのケースにおけるドキュメントなどのアプリケーション・エントリ・ポイントに直接にアクセスするのに十分な情報を提供する、すなわち、必要なトークン群を生成する。本明細書で使用する、アプリケーション群に関するエントリ・ポイントという用語は、一般に、データ・ファイルなどの所望される応答を引き出すために、トークンまたは他の意味解釈などの適切な入力を使用してアクセスすることができるドキュメント、サブルーチン、レベル、または他のプログラミング構成体を指す。さらに、以上の例で述べたとおり、電話サーバ22などにおける合成文法40(ルート文法、ならびに、該当する場合、現在、アクセスされているアプリケーションのアプリケーション文法から成る)の実装により、ブラウザ・モジュール30が、アプリケーションを意識的に終了することをユーザに強制することなく、アプリケーション間、およびアプリケーションのドキュメント間で移動すること、または介在する複数のアプリケーション・レベル、すなわち、ドキュメント群を直線的に移動することができるようになる。
本技術の実装に関して、電話サーバ22とブラウザ・モジュール30のどちらか、または両方が、ソフトウェア、ハードウェア、またはソフトウェアとハードウェアの任意の適切な組み合わせなどを介して、本明細書で説明する技術の一部またはすべてを実施することができる信号処理装置に基づくことが可能である。例えば、電話サーバ22および/またはブラウザ・モジュール30は、以上の技術を実行する適切なソフトウェア・プログラミングを有する、汎用のコンピュータまたはサーバなどの汎用デバイスであることが可能である。代替として、電話サーバ22および/またはブラウザ・モジュール30は、以上の技術を実行する専用のプロセッサ群、ハードウェア、および/またはソフトウェアを使用してもよい。そのような専用プロセッサ群およびハードウェアの例には、本技術を実行するように特別に適合させることができるデジタル信号プロセッサ、RISCプロセッサ、または特定用途向け集積回路が含まれる。さらに、所望される場合、ブラウザ・モジュール30の機能と電話サーバ22の機能を単一のプロセッサ・ベースのシステム上で結合することもできる。1つの実装では、電話サーバ22とブラウザ・モジュール30は、ANYPATH(登録商標)電話複合体などの電話複合体内部における別々の汎用コンピュータ上に配置することができる。
本発明は、様々な変更形態および代替形態が可能であり得るが、具体的な実施形態を図面に例として示し、本明細書で詳細に説明した。しかし、本発明は、開示した特定の形態に限定されるものではないことを理解されたい。むしろ、本発明は、添付の特許請求の範囲で定義する本発明の趣旨および範囲に含まれるすべての変形形態、等価形態、および代替形態を範囲に含む。
図1は、本発明による2つ以上のアプリケーションにアクセスするように構成された通信システムの典型的な実施形態を開示する。 図2は、本発明による典型的な文法概要を開示する。 図3は、本発明による2つの典型的なアプリケーション間における移動を表す流れ図である。

Claims (10)

  1. 複数のアプリケーションの1つのアプリケーションのエントリ・ポイントに対応する、合成文法に基づいて選択されたトークンを受け取るように構成され、前記エントリ・ポイントにおいて前記それぞれのアプリケーションにアクセスするように構成された信号プロセッサ。
  2. 加入者から終了命令を受け取ることなしに、前のアプリケーションを終了するように構成された請求項1に記載の信号プロセッサ。
  3. 前記エントリ・ポイントに対応する前記それぞれのアプリケーションのレベルから応答のデータ・ファイルを受け取るように構成され、前記データ・ファイルを電話サーバに伝送するように構成された請求項1に記載の信号プロセッサ。
  4. オーディオ・コマンドと互いに関連する被変調信号を受信し、前記被変調信号を解析してルート文法の構成要素を特定し、前記構成要素に対応する前記トークンを選択し、前記トークンを信号プロセッサに伝送するように構成された電話サーバを含む請求項1に記載の信号プロセッサ。
  5. オーディオ・コマンドと互いに関連する被変調信号を受信し、前記被変調信号を解析して合成文法の構成要素を特定し、前記構成要素に対応するトークンを選択するように構成された電話サーバと、
    前記トークンを獲得し、前記トークンに基づいて複数のアプリケーションの1つのアプリケーションのエントリ・ポイントにアクセスするように構成されたブラウザ・モジュールとを含む通信システム。
  6. 対応するトークンによってアクセスされることが可能な少なくとも1つのエントリ・ポイントをそれぞれが含む前記複数のアプリケーションの少なくとも1つのアプリケーションを実行するようにそれぞれが構成された複数のアプリケーション・サーバを含む請求項5に記載の通信システム。
  7. 前記被変調信号を前記電話サーバに伝送するように構成されたモバイル交換センタを含むを含む請求項5に記載の通信システム。
  8. アプリケーションにアクセスするための方法であって、
    信号を処理して、オーディオ・コードを合成文法の構成要素として特定する動作と、
    前記合成文法の前記構成要素に基づいて前記複数のアプリケーションの1つのアプリケーションのエントリ・ポイントにアクセスする動作とを含む方法。
  9. 前記エントリ・ポイントにアクセスする動作に応答して生成されたデータ・ファイルをユーザに送信する動作を含む請求項8に記載の方法。
  10. 前記エントリ・ポイントにアクセスする動作が、前記処理された信号内で前記オーディオ・コードが特定されたというインジケータを前記それぞれのアプリケーションに伝送する動作を含む請求項8に記載の方法。
JP2005041474A 2004-02-20 2005-02-18 アプリケーション間で移動するための方法およびシステム Abandoned JP2005237009A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/783,832 US20050229185A1 (en) 2004-02-20 2004-02-20 Method and system for navigating applications

Publications (1)

Publication Number Publication Date
JP2005237009A true JP2005237009A (ja) 2005-09-02

Family

ID=34711886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005041474A Abandoned JP2005237009A (ja) 2004-02-20 2005-02-18 アプリケーション間で移動するための方法およびシステム

Country Status (5)

Country Link
US (1) US20050229185A1 (ja)
EP (1) EP1566954A3 (ja)
JP (1) JP2005237009A (ja)
KR (1) KR20060041889A (ja)
CN (1) CN1658635A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018198029A (ja) * 2017-05-25 2018-12-13 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP2020194184A (ja) * 2012-08-10 2020-12-03 エイディシーテクノロジー株式会社 音声応答装置、及び音声応答システム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7428497B2 (en) * 2003-10-06 2008-09-23 Utbk, Inc. Methods and apparatuses for pay-per-call advertising in mobile/wireless applications
US8503423B2 (en) 2007-02-02 2013-08-06 Interdigital Technology Corporation Method and apparatus for versatile MAC multiplexing in evolved HSPA
US9933914B2 (en) 2009-07-06 2018-04-03 Nokia Technologies Oy Method and apparatus of associating application state information with content and actions
EP2355537B1 (en) * 2010-01-25 2014-11-19 BlackBerry Limited Error correction for DTMF corruption on uplink
US8233951B2 (en) 2010-01-25 2012-07-31 Research In Motion Limited Error correction for DTMF corruption on uplink
US9582498B2 (en) * 2014-09-12 2017-02-28 Microsoft Technology Licensing, Llc Actions on digital document elements from voice
CN107817995B (zh) * 2016-09-12 2021-03-30 华为技术有限公司 一种后台静默启动应用的方法、装置及终端设备
US10217453B2 (en) * 2016-10-14 2019-02-26 Soundhound, Inc. Virtual assistant configured by selection of wake-up phrase

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6125347A (en) * 1993-09-29 2000-09-26 L&H Applications Usa, Inc. System for controlling multiple user application programs by spoken input
JP2002527800A (ja) * 1998-10-02 2002-08-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 会話ブラウザおよび会話システム
US6374226B1 (en) * 1999-08-06 2002-04-16 Sun Microsystems, Inc. System and method for interfacing speech recognition grammars to individual components of a computer program
US6691111B2 (en) * 2000-06-30 2004-02-10 Research In Motion Limited System and method for implementing a natural language user interface
US7085723B2 (en) * 2001-01-12 2006-08-01 International Business Machines Corporation System and method for determining utterance context in a multi-context speech application
US7203645B2 (en) * 2001-04-27 2007-04-10 Intel Corporation Speech recognition system loading different recognition engines for different applications
US6944594B2 (en) * 2001-05-30 2005-09-13 Bellsouth Intellectual Property Corporation Multi-context conversational environment system and method
US7158936B2 (en) * 2001-11-01 2007-01-02 Comverse, Inc. Method and system for providing a voice application bookmark
US7016849B2 (en) * 2002-03-25 2006-03-21 Sri International Method and apparatus for providing speech-driven routing between spoken language applications
JP4107093B2 (ja) * 2003-01-30 2008-06-25 株式会社日立製作所 対話型端末装置及び対話アプリケーション提供方法
US7783475B2 (en) * 2003-01-31 2010-08-24 Comverse, Inc. Menu-based, speech actuated system with speak-ahead capability
US7401024B2 (en) * 2003-12-02 2008-07-15 International Business Machines Corporation Automatic and usability-optimized aggregation of voice portlets into a speech portal menu

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020194184A (ja) * 2012-08-10 2020-12-03 エイディシーテクノロジー株式会社 音声応答装置、及び音声応答システム
JP2018198029A (ja) * 2017-05-25 2018-12-13 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
US20050229185A1 (en) 2005-10-13
KR20060041889A (ko) 2006-05-12
EP1566954A3 (en) 2005-08-31
EP1566954A2 (en) 2005-08-24
CN1658635A (zh) 2005-08-24

Similar Documents

Publication Publication Date Title
JP2005237009A (ja) アプリケーション間で移動するための方法およびシステム
US7609829B2 (en) Multi-platform capable inference engine and universal grammar language adapter for intelligent voice application execution
US10171660B2 (en) System and method for indexing automated telephone systems
US9202247B2 (en) System and method utilizing voice search to locate a product in stores from a phone
US9350862B2 (en) System and method for processing speech
US8064573B2 (en) Computer generated prompting
US20040006471A1 (en) Method and apparatus for preprocessing text-to-speech files in a voice XML application distribution system using industry specific, social and regional expression rules
CN100424632C (zh) 用于高级交互接口的语义对象同步理解
CN100578614C (zh) 用语音应用语言标记执行的语义对象同步理解
US6891932B2 (en) System and methodology for voice activated access to multiple data sources and voice repositories in a single session
US20110106527A1 (en) Method and Apparatus for Adapting a Voice Extensible Markup Language-enabled Voice System for Natural Speech Recognition and System Response
US8886540B2 (en) Using speech recognition results based on an unstructured language model in a mobile communication facility application
US7450698B2 (en) System and method of utilizing a hybrid semantic model for speech recognition
US20040153322A1 (en) Menu-based, speech actuated system with speak-ahead capability
US20140314227A1 (en) System and method for speech-enabled call routing
US20090030691A1 (en) Using an unstructured language model associated with an application of a mobile communication facility
EP1639422A2 (en) Behavioral adaptation engine for discerning behavioral characteristics of callers interacting with an vxml-compliant voice application
CN104050966A (zh) 终端设备的语音交互方法和使用该方法的终端设备
JP5368924B2 (ja) 自然言語ユーザインタフェースを漸進的に開発する装置及び方法
US20210136195A1 (en) Methods and systems for virtual agent to understand and detect spammers, fraud calls, and auto dialers
US8594640B2 (en) Method and system of providing an audio phone card
KR20240046508A (ko) 통화에 대한 음성 메뉴의 결정 및 시각적 디스플레이
Hunt et al. Artificial Intelligence for Customer Experience and Care
KR20020011569A (ko) 음성으로 인터넷상의 정보를 유/무선/이동 전화망을 통해제공하는 시스템 및 방법
Brkic et al. VoiceXML for Slavic languages application development

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080218

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20100129