JP2005513662A - パケットオリエンテッドネットワークを介する音声を用いた情報の交換方法 - Google Patents

パケットオリエンテッドネットワークを介する音声を用いた情報の交換方法 Download PDF

Info

Publication number
JP2005513662A
JP2005513662A JP2003555783A JP2003555783A JP2005513662A JP 2005513662 A JP2005513662 A JP 2005513662A JP 2003555783 A JP2003555783 A JP 2003555783A JP 2003555783 A JP2003555783 A JP 2003555783A JP 2005513662 A JP2005513662 A JP 2005513662A
Authority
JP
Japan
Prior art keywords
structured document
information
host computer
prx
statement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003555783A
Other languages
English (en)
Inventor
グース ステュアート
シュテファン ホルツ
ミラー ティモシー
ヴィンセント スー ウェイ−クワン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of JP2005513662A publication Critical patent/JP2005513662A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本発明は、パケットオリエンテッドネットワークを介して接続されているWWWサーバー(SRV)と、パケットオリエンテッドネットワークに接続されている情報ホスト計算機(PRX)と、該情報ホスト計算機(PRX)に接続されている音声ベースドブラウザ(WTE)とを有する、パケットオリエンテッドネットワークを介して情報を音声を用いて交換するための方法に関する。この場合、フォーマットベースドエディター(FE)によって生成されるストラクチャ化されたドキュメント(SD)がWWWサーバー(SRV)に伝送されかつそこでアクセス情報(DP)と一緒に記憶される。音声ベースドブラウザ(WTE)を介してストラクチャ化されたドキュメント(SD)をアクセスする際に、アクセス情報(DP)が存在すれば情報ホスト計算機(PRX)への転送が行われる。情報ホスト計算機(PRX)において、ストラクチャ化されたドキュメント(SD)の解析が実施される。行われた解析に従って、ストラクチャ化されたドキュメント(SD)において図形ストラクチャ化のためのステートメントが音響的な出力形態のためのステートメントに変更される。

Description

本発明は、自然の話し言葉に基づいて加入者と通信するためのデータ処理情報システムに関する。
例えば「イントラネット」等の形における、例えばWWW(World Wide Web)、ローカルネットワーク(Local Area Networks, LAN)のようなパケットオリエンテッドネットワークは数多くの使用分野においてユーザの情報交換に対する主要なソースをますます形成するようになっている。説明を簡潔にするためにこの形式の情報伝送ネットワークは以下に概念WWWを参照することにする。
どんどん大きくなっていく範囲のユーザがWWWで得られる情報を頼りにするようになっているので、これらの情報にいつでもアクセスできるようにするという要求が高まっている。このアクセスは通例、データ線路を介して1つまたは複数のWWWサーバーに接続されている作業場所計算機を使用して行われる。この計算機では、当業者には「ブラウザBrowser)」として知られている、WWWサービスにおいて使用可能である情報を表示するためないし使用可能である情報内でナビゲーションするためのソフトウェアが実行される。その際表示は主要には視覚的な出力手段によって行われる。
この形式の情報の主要構成要素はテキストフォーマットにおいて存在しているデータを形成しているが、それには更に、グラフィック、当業者には「リンク」(Link)としても知られている関連情報などに対するクロス参照指示が含まれている。これらの情報は
WWWサーバーと専門領域ではクライアントとも称される例えばブラウザの形の所属の通信端末との間で、大抵はストラクチャ化されたドキュメントの形で交換される。これとは、ユーザに対して表示すべき本来の情報の他にこれらのストラクチャに関しての計算機読み取り可能なインストラクションも含まれている、境界を設定することができる量のデータ編成の謂いである。WWWにおけるストラクチャ化されたドキュメントの交換のために今日主として、HTMLフォーマット(Hypertext Markup Language)が使用される。
HTMLフォーマットの普及のために、例えば Microsoft Corp. 社のMicrosoft Word のような数多くのソフトウェアパケットが、フォーマット化されたドキュメントをストラクチャ化されたドキュメントに対するHTMLコードに変換する可能性を提供している。その際このソフトウェアパケットによって生成されるHTMLコードはユーザによって後から編集することができる。普通はHTMLへのコード変換の特別な知識を要求しないこの形式のソフトウェアパケットを以下に、ストラクチャ化されたドキュメントに対する「フォーマットベースドエディタ」という概念で扱うことにする。
WWWにおける情報をいつでもアクセスできるようにしたいという冒頭に説明した必要性のために、使用者が目に見える出力手段を有する作業場所計算機を使用することができないという状況もますます多く増えてくる。それ故に、別のプレゼンテーション形態において、例えばオーディオフォーマットにおいて、WWWに存在している情報を従来の電話を介してアクセスしたいという要求がますます増えてきている。
音声に基づいているナビゲーションおよびWWWにおける情報伝送は、当業者にはインタラクティブ・ボイス・レスポンス(Interactive Voice Response=IVR)としても知られているインタラクティブな音声対話方式と称される。IVR方法は元はといえば、ルーチンタスクの負荷を軽減しかつ呼び出しセンターにおける待ち行列管理のためのダイアローグオリエンテッド音声システムから発展した。このためにIVR方式は一般に、音声ガイドされるメニューのインプリメンテーションを有しており、つまりここではユーザは音声手段によりまたは電話数字キーの操作によっても種々のオプション間を選択する。
IVRベースドWWWナビゲーションを実現するための標準はVoiceXML(Voice Extensible Markup Language)であり、“World Wide Web Consortium”によって標準化されて、現在の所2000年5月5日にVersion1.0で発せられている(http://www.w3.org/TR/voicexml/)。この標準により、情報の呼び出しが音声通信を使用して行われる、ストラクチャ化されたドキュメントの設計が可能になる。このような音声による通信は一方においてVoiceXMLスクリプトに含まれているテキストを音声としてユーザに送出することによって、他方においてユーザが発声する命令の処理によって行われる。
VoiceXMLを使用した音声ベースの情報の呼び出しのために、VoiceXMLフォーマットであるWWWサーバーでのストラクチャ化されたドキュメントの設計および準備は制約を受ける。これによりユーザは、このフォーマットにおいてWWWサーバーで定義されている情報に制限されており、殊にHTMLドキュメントをアクセスすることができない。つまりこの形態はIVR方式のサーバー側の支援に相当する。上に述べたように情報に対するアクセスが制限された形でしかないという欠点の他に、VoiceXMLは音声生成および音声分析に対するWWWサーバー計算出力に対する要求が非常に高くなるという欠点を有している。付加的に、情報を伝送するデータネットワークの伝送容量に著しく大きな負荷がかけられる。というのは、制御のために必要なないし出力される音声情報はデータネットワークにおいて例えばデジタル化されたオーディオ信号として伝送されるからであり、そのためにマウスクリックまたはキー操作入力を介するストラクチャ化されたドキュメントにおけるナビゲーションに比べて、伝送すべきデータ量は著しく上昇することになる。別の欠点として、大抵はHTML設計と平行して実行される、VoiceXMLフォーマットにおけるストラクチャ化されたドキュメントの設計に対するコストが比較的高いことが挙げられる。
国際特許出願WO99/46920から、従来の電話を用いる、WWWにおけるナビゲーションに対するシステムが公知である。このシステムの中心となる構成部は、モデムと電話制御されるオーディオWWWブラウザ(telephongesteuertes Audio-WWW-Browser=TAWB)とを有するホスト計算機システム(Host Computer System)である。加入者は電話網において当該モデムに配属されている呼び出し番号をダイヤルすることによってこのシステムに入る。申し込み過程が成功するとホスト計算機システムのモデムはTAWBと電話網との間のインターフェースとして働く。加入者はナビゲーションまたは制御のためのコマンドを発声せられる形態においてまたは電話数字キーの操作によるDTMF(Dual Tone Multi Frequency)信号の形態においてTAWBに伝送することができる。TAWBはコマンドを解釈し、相応のWWWドキュメントをロードしかつ含まれている情報をオーディオフォーマットに変換する。それから情報は電話網を介して電話に送信され、電話で加入者はこれら情報を聞き取ることができる。テキストデータの、オーディオ情報への変換は当業者にはTTS(Text to Speech)として公知の方法によって行われる。
USアメリカ特許明細書US6018710から、ストラクチャ化されたドキュメントをTTS方法を用いてその中に含まれている構成に関する指示(ストラクチャル・ステートメント)を特別考慮してオーディオ信号に変化することが公知である。
上に挙げた刊行物に開示されている2つの方法ないし装置は、VoiceXMLによるサーバー側の実現とは異なって、IVR方式のクライアント側の実現によって動作し、従ってユーザは任意のストラクチャ化されたドキュメントにおいて上述したような伝送容量に負荷がかかることもなしにVoiceXMLで情報を探し当てることができる。しかしクライアント側で行われる、ストラクチャ化された、事情によっては複合ストラクチャを有しているドキュメントの、音声情報への変換は、このドキュメントにおける音声手段によってナビゲーションするユーザを、変換の最中に失われる、ドキュメントの視覚的なストラクチャ化により混乱させるという欠点を有している。
本発明の課題は、ストラクチャ化されたドキュメントに対するフォーマットベースドエディターに基づいてストラクチャ化されたドキュメントを視覚的なブラウザにより並びにIVRベースドブラウザにより同時に呼び出せるようにするために格別の知識がなくてもよい、このようなストラクチャ化されたドキュメント開発を保証する方法を提供することである。
この課題の解決は請求項1ないし10の構成要件によって行われる。
本発明によれば、ストラクチャ化されたドキュメントがフォーマットベースドエディター、例えばMicrosoft Corp. 社のMicrosoft WordまたはMicrosoft Frontpageにより生成される。ストラクチャ化されたドキュメントに、アクセス情報が記憶される。これはこのドキュメントを本発明の方法に適していると特徴付ける。このアクセス情報は例えば、ドキュメントの特性を特徴付けるデータフィールドに格納されるようにするとよい。このデータフィールドにおいてアクセス情報は例えば、ブール代数、数字または英数字のフォーマットにおいて存在していてよい。ドキュメントの作成後これはパケットオリエンテッドネットワークに接続されているWWWサーバーに伝送されかつそこに記憶される。ユーザが音声ベースドブラウザ、すなわちIVR方式に従って実現されている、ストラクチャ化されたドキュメントにおけるナビゲーションのためおよびその表示のためのソフトウェアによって、このストラクチャ化されたドキュメントに、例えばストラクチャ化されたドキュメントのメモリ場所を特徴付けているアドレスを指示することでアクセスしようとすると、本発明によりアクセス情報の存在の検査が行われる。その際アクセス情報の存在は、ストラクチャ化されたドキュメントに記憶されている数字または英数字の値に依存して特徴付けられているようにすることができる。このアクセス情報が存在していれば、ホスト計算機への転送が実施され、ここでストラクチャ化されたドキュメントの解析が実施される。その際解析の対象は殊に、ストラクチャ化されたドキュメントのソースコードにあるステートメントである。ここで言うステートメントとは、ドキュメントのプレゼンテーションの制御を行うようにし、従ってこのドキュメントに含まれているユーザに向け情報の構成部分ではない、計算機読み取り可能な領域または一連の符号のことである。これらステートメントは後続のステップにおいて、ストラクチャ化されたドキュメントの図形ストラクチャ化を制御するステートメントを音響的な出力形態を支援するステートメントによって拡張するおよび/または置換することによって、IVR方式に従って動作するブラウザにプレゼンテーションされるように変更される。ソースコードのこの解析および変更は実行時間時、すなわちIVR方法に従って動作するブラウザの、WWWサーバーに記憶されているストラクチャ化されたドキュメントへのアクセス時に行われる。
本発明の方法の重要な利点は、視覚的なブラウザのためにストラクチャ化されたドキュメントの開発後このドキュメントに、IVR方式に従って動作するブラウザによってもアクセス可能であるという点に見て取れる。これにより、煩雑な2回の開発およびストラクチャ化されたドキュメントの、2つの異なっているプロトコルにおけるメインテナンスをしないでもすむことになる。
特別有利なのは、WWWサーバーに記憶されているストラクチャ化されたドキュメントの実行時の解析および変更である。こうすることで、WWWサーバーにメモリ容量を付加的に用意する必要がなくなる。
更に有利なのは、ストラクチャ化されたドキュメントの開発には、フォーマットベースドエディターによって、例えばHTMLフォーマットにおいて自動的に生成されるソースコードに関するほんの僅かな知識しか必要としないことである。
本発明の有利な実施形態は従属請求項に記載されている。
有利には情報ホスト計算機はプロキシサーバーの機能を有している。プロキシサーバー(プロキシは全権委任者、代理人を表している)により、WWWに対して直接的なアクセスを有していないシステムが間接的なアクセスを行うのが可能になる。プロキシは個々のデータパケットをWWWとローカルネットワークとの間のデータ流から取り出しかつこうして安全性の向上に貢献することができる。プロキシサーバーは、所定のサーバーへのアクセスを制限するためにも利用される。その点プロキシサーバーとしての情報ホスト計算機の構成は本発明による方法において有利である。というのは、この場合、ストラクチャ化されたドキュメントの分業処理が可能になるからである。WWWサーバーは、ストラクチャ化されたドキュメントがIVR方式に従って動作するブラウザにより呼び出される場合、リソースインテンシブな解析およびソースコードの変更をせずにすむ。従来の、視覚表示に基づいているブラウザによる呼び出しの場合、ストラクチャ化されたドキュメントは直接、情報ホスト計算機の介挿なしに、ブラウザにガイドされる。
ストラクチャ化されたドキュメントをフォーマットベースドエディターにより生成するために。ストラクチャ化されたドキュメントに組み込まれる、またはストラクチャ化されたドキュメントにおいて参照するように指示されるソフトウェアライブラリが用いられる。大抵はスクリプト環境を定義するためのファイルの形で存在しているソフトウェアライブラリをこのように使用することにより、ストラクチャ化されたドキュメントの著者は有利にも、ストラクチャ化されたドキュメントのソースコードの処理をしなくてよい。
フォーマットベースドエディターの使用によって、ソースコードの再現可能なストラクチャが保証されている。フォーマットベースドエディターはストラクチャ化されたドキュメントの著者によって定義されたフォーマットエレメントをブラウザにおけるストラクチャ化された表示のためのステートメントに変換する。この変換は、生成されたソースコードの再現可能なストラクチャを保証する定義されている動作様式によって行われる。例えば別のストラクチャ化されたドキュメント、ストラクチャ化されたドキュメントの別の領域またはロードすべきおよび出力すべきファイルへのクロス参照指示の定義の際に、IVR方法に従って動作するブラウザにおける「表示」のためのソースコードの解析および変更を可能にする慣用技術を考慮するようにすれば有利である。
本発明の実施例を以下に図面に基づいて詳細に説明する。
その際:
図1は、パケットオリエンテッドネットワークに接続されている通信端末を略示するブロック回路を示している。
図1には、IVR(Internet Voice Response)に従って動作するブラウザWTEを介してパケットオリエンテッドネットワークNW、例えばインターネットまたはローカルネットワークに接続されている通信端末装置KEが示されている。IVRに従って動作するブラウザは以下に簡単に「IVRブラウザ」WTEと称する。IVRブラウザとパケットオリエンテッドネットワークとの接続とは殊に、IVRブラウザWTEのソフトウェアが、図示されていない所謂インターネットサービスプロバイダーとのデータ交換を用意するための相応のソフトウェアおよびハードウェア構成要素を使用することができる図示されていない計算機システムにおいて動作することである。
パケットオリエンテッドネットワークNWとIVR方法に従って動作するブラウザWTEとの間の図示されていないデータパケットの交換は、図では円内数字「1」によって示されているように直接か、または図では円内数字「2」で示されているように情報ホスト計算機PRXを介挿して行われる。
パケットオリエンテッドネットワークNWに、WWWサーバー(World Wide Web)SRVが接続されている。このサーバーは実質的に、メモリMに記憶されているストラクチャ化されたドキュメントSDを管理しかつこれらをその都度のクライアントに伝送するという働きを有している。既述のように、パケットオリエンテッドネットワークNWはローカルネットワークとして実現されていてもよく、この場合WWWサーバーSRVはイントラネット情報サーバーとして動作する。
例えばIVRブラウザWTEの、その特性によりそれ自体はコネクションレスであるパケットオリエンテッドネットワークNWとの「コネクション」とは、パケットオリエンテッドネットワークNWに接続されている2つの通信端末間のデータパケットのソース(出所)ないしシンク(目的地)と考えられる。分かり易くするために以下に、「コネクション」という概念が使用される。同様に分かり易くする理由から、図中、パケットオリエンテッドネットワークNWによって交換されるデータパケットは実線で示されている。
IVRブラウザWTEは、以下に説明する音声ベースドナビゲーションを実現するためのソフトウェア層を使用することができる。ブラウザインタフェースIEを介して受信されたデータが受信され、処理されかつ音声アプリケーションSAPIに転送される。この音声アプリケーションSAPIはデータを、音声認識および合成の意味において処理する。実施例においてこのために、Microsoft 社の32ビットウィンドウズオペレーションシステム用のインタフェースアプリケーション“SAPI”(Speech Application Programing Interface)が使用される。音声アプリケーションSAPIによって処理されたデータは電話アプリケーションTAPIに転送され、ここで音声アプリケーションSAPIによって受信されたデータが通信端末KEにつなげられるように処理される。このために実施例において、Microsoft 社の32ビットウィンドウズオペレーションシステム用のインタフェースアプリケーション“TAPI”(Telephony Application Programing Interface)が使用される。パケットオリエンテッドデータの、通信端末KEへの方向において説明されたデータの処理は別の方向において相応に類似した機能でもって行われる。その際通信端末によるIVRブラウザの制御は発声されるキーワードによってまたは図示されていない、通信端末装置KEにある電話数字キーによって行われる。電話数字キーを操作すると通信端末装置KEからDTMF(Dual Tone Multifrequency)信号が送信され、これは電話アプリケーションTAPIによって受信されかつデコーディングされる。
IVRブラウザWTEは機能の仕方が例えば、Microsoft Corp. 社の“Web Telephony Engine”に相応している。これはインターネットドキュメントプール“Microsoft Developpers' Network”において殊にアドレス http://msdn.microsoft.com/library/default.asp?url=/library/es-us/htmltel/wtestartpage 6let.asp(日付データなし、2001年11月8日に関連付けられた内容)下に記載されている。通信端末装置KEを使用するユーザによりIVRブラウザWTEを制御するために、ユーザにより発声されるコマンド並びにIVRブラウザWTEに送信されるDTMF(Dual Tone Multifrequency)信号が用いられる。これらはユーザによって通信端末装置KEにおけるそれぞれの数字キーの操作によってトリガされる。
情報ホスト計算機PRXの動作様式を検討する前に、ストラクチャ化されたドキュメントの特性および情報ホスト計算機PRXによる処理の条件について説明する。
ストラクチャ化されたドキュメントSDはフォーマットベースドエディター、例えば Microsoft Corp. 社のMicrosoft WordまたはMicrosoft Frontpageを使用して生成される。ストラクチャ化されたドキュメントSDにアクセス情報が記憶される。これはストラクチャ化されたドキュメントSDをIVRブラウザWTEにおける変換および再生に適しているものとして特徴付ける。このアクセス情報は例えば、ドキュメントの特性を特徴付けるデータフィールド、いわゆる「ドキュメント・プロパティ(Document Properties)」に格納される。このデータフィールドにはアクセス情報が例えばブール代数、数字または英数字のフォーマットにおいて存在している。
ストラクチャ化されたドキュメントSDの作成後、これはHTMLフォーマットにおいて記憶され、WWWサーバーSRVに伝送されかつそのメモリMにファイルされる。
情報ホスト計算機PRXはプロキシサーバーとして実現されている。これはストラクチャ化されたドキュメントSDに含まれているアクセス情報に従って、このストラクチャ化されたドキュメントSDの内容の処理を行う。IVRブラウザWTEによって、メモリ場所を特徴付けるアドレスの指示下でストラクチャ化されたドキュメントにアクセスされると、アクセス情報の存在の検査が行われる。このアクセス情報が存在していると、情報ホスト計算機PRXへの転送が行われることになる。アクセス情報が存在していないまたはそれが設定されているパラメータに対応していなければ、情報ホスト計算機PRXによるストラクチャ化されたドキュメントSDの処理は行われず、このために図では、IVRブラウザWTEとパケットオリエンテッドネットワークNWとの直接的な「コネクション」を示す円内数字「1」によって象徴的に示されている。
次に、WWWサーバーSRVのメモリMに格納されている、この形式のアクセス情報を使用することができるストラクチャ化されたドキュメントSDを参照する。このストラクチャ化されたドキュメントSDは、IVRブラウザWTEにより要求されると円内数字「2」によって象徴的に示されている、情報ホスト計算機PRXを介挿した処理経路を介してIVRブラウザWTEのブラウザインタフェースにロードされる。
情報ホスト計算機PRXは第1および第2のHTMLクライアントHC1,HC2を使用している。これらはストラクチャ化されたドキュメントSDの受信ないし転送を行う。第1のHTMLクライアントHC1はその入力側に受信された、ストラクチャ化されたドキュメントに対する要求を第2のHTMLクライアントHC2に転送する。第2のHTMLクライアントはこれを、パケットオリエンテッドネットワークNWを介して接続されているWWWサーバーSRVに転送する。アクセス情報を有している相応のストラクチャ化されたドキュメントSDはこれに基づいてWWWサーバーから第2のHTMLクライアントHC2に送られ、そこでそれは更に解析装置ANLに送出される。
解析装置ANLはストラクチャ化されたドキュメントにおけるHTMLソースコードの構文解析をHTML−DOMプログラミングインタフェースHTMLDOM(Document Object Model)の機能性を使用して実施する。HTML−DOMプログラミングインタフェースHTMLDOMのために例えば、Microsoft Corp. 社によって開発された、COM(Component Object Model)インタフェースの原理に従ったオブジェクトオリエンテッドライブラリが使用される。これにより、複数のソフトウェアアプリケーション間の、オブジェクトオリエンテッドクライアント−サーバーベースド通信が可能になる。オブジェクトオリエンテッドHTML−DOMプログラミングインタフェースHTMLDOMの使用により、HTMLコードの構文解析に対する効率よいメソッドが可能になる。というのは、オブジェクトの使用により、HTMLコードへのストラクチャ化されたアクセスが可能になるからである。更に、この解析に対して、固定メモリ容量が必要とされない。というのは、結果生じるオブジェクトは作業メモリにおいて扱われるからである。
解析の対象は殊に、ストラクチャ化されたドキュメントのソースコードにおけるステートメントである。ステートメントという概念は、ドキュメントのプレゼンテーション制御を引き起こし、従ってこのストラクチャ化されたドキュメントSDに含まれている、ユーザに対して表示されるべき情報の構成部分ではない領域または一連の符号のことである。
解析装置ANLによって生成されるオブジェクトを使用して、変換装置TRFはフォーマットXML(Extended Markup Language)に変更されたストラクチャ化されたドキュメントSDを生成する。オブジェクトの、XMLソースコードへの変換はXML−DOMプログラミングインタフェースXMLDOMの機能性を使用して行われる。その際ライブラリファイルXSLは例えば、プログラミングインタフェースXMLDOMによって定義されるオブジェクトの拡張を可能にするいわゆる「スタイル・シート(Style Sheets)」を使用して行われる。このために、例えば「拡張スタイル言語(Extended Style Language)」の形で存在しているスクリプトの形でオブジェクトおよび/またはメソッドが定義される。
XMLソースコードの使用により、ストラクチャ化されたドキュメントSDの図形を制御する、HTMLソースコードのステートメントを、ストラクチャ化されたドキュメントがIVRブラウザWTEによって「読める」ようにする、音響的な出力形態を支援するステートメントへ拡張および/または置換することが可能になる。このライブラリベースド処理により更に、ストラクチャ化されたドキュメントSDのHTMLソースコードの、例えばVoiceXMLまたはWML(Wireless Markup Language)のような別のXML変形への簡単な変換が可能である。
HTMLソースコードの解析およびXMLソースコードへの変更は実行時、すなわちIVRブラウザの、WWWサーバーSRVに記憶されているストラクチャ化されたドキュメントSDへのアクセス時に行われる。
ストラクチャ化されたドキュメントSDのソースコードへの詳細な変更は、国内書類番号2001P21322を有する特許出願で説明されているので、ここでは、いくつか中心となる動作様式についてのみ説明された。その際フォーマットベースドエディターにおけるストラクチャ化されたドキュメントの開発者が注意しなければならないいくつかの観点も説明された。
パケットオリエンテッドネットワークに接続されている通信端末のストラクチャの概略図

Claims (11)

  1. パケットオリエンテッドネットワーク(NW)を介して接続されているWWWサーバー(SRV)と、パケットオリエンテッドネットワークに接続されている情報ホスト計算機(PRX)と、該情報ホスト計算機(PRX)に接続されている音声ベースドブラウザ(WTE)とにより、パケットオリエンテッドネットワークを介して情報を音声を用いて交換するための方法であって、
    フォーマットベースドエディター(FE)によって生成されるストラクチャ化されたドキュメント(SD)をWWWサーバー(SRV)に伝送しかつそこでアクセス情報(DP)と一緒に記憶し、
    音声ベースドブラウザ(WTE)を介してストラクチャ化されたドキュメント(SD)をアクセスする際に、前記アクセス情報(DP)が存在すれば情報ホスト計算機(PRX)への転送を行い、
    該情報ホスト計算機(PRX)において、ストラクチャ化されたドキュメント(SD)の解析を実施し、
    ストラクチャ化されたドキュメント(SD)において、図形ストラクチャ化のためのステートメントを音響的な出力形態のためのステートメントに変更する
    方法。
  2. 情報ホスト計算機(PRX)はプロキシサーバーの機能を有している
    請求項1記載の方法。
  3. ストラクチャ化されたドキュメント(SD)の生成をソフトウェアライブラリを組み込んでおよび/またはソフトウェアライブラリを参照指示して行う
    請求項1または2記載の方法。
  4. フォーマットベースドエディター(FE)によるストラクチャ化されたドキュメント(SD)の編集の際に確定される変換はストラクチャ化されたドキュメント(SD)および/またはストラクチャ化されたドキュメント内のファイルへの参照指示のために必要である
    請求項1から3までのいずれか1項記載の方法。
  5. WWWサーバー(SRV)に記憶されているストラクチャ化されたドキュメント(SD)におけるステートメントはHTMLフォーマットにおいて存在している
    請求項1から4までのいずれか1項記載の方法。
  6. ストラクチャ化されたドキュメント(SD)の、HTMLフォーマットにおいて存在しているステートメントを情報ホスト計算機(PRX)においてXMLフォーマットに従ったステートメントに変換する
    請求項5記載の方法。
  7. HTMLフォーマットのステートメントをXMLフォーマットに変換するために、解析装置(ANL)はHTMLフォーマットのステートメントをHTML−DOMプログラミングインタフェース(HTMLDOM)を使用してオブジェクトに変換する
    請求項6記載の方法。
  8. 変換装置(TRF)はオブジェクトを解析装置(ANL)と交換しかつXMLフォーマットのステートメントである該オブジェクトをXML−DOMプログラミングインタフェース(XMLDOM)を使用してXMLステートメントに基づいたストラクチャ化されたドキュメント(SD)に変換する
    請求項7記載の方法。
  9. 変換装置(TRF)によるオブジェクトの変換の際に、ライブラリファイル(XSL)を使用する
    請求項8記載の方法。
  10. ストラクチャ化されたドキュメント(SD)の呼び出しおよび/またはデータの交換のための、パケットオリエンテッドネットワークを介して接続されているWWWサーバー(SRV)と、
    前記パケットオリエンテッドネットワークに接続されていて、ストラクチャ化されたドキュメント(SD)に含まれている、図形ストラクチャ化のためのステートメントから音響的な出力形態のためのステートメントに変更するための情報ホスト計算機(PRX)と、
    該情報ホスト計算機(PRX)に接続されている音声ベースドブラウザと
    を有している、パケットオリエンテッドネットワークを介して情報を音声を用いて交換するためのシステム。
  11. 情報ホスト計算機はプロキシサーバーとして実現されている
    請求項10記載のシステム。
JP2003555783A 2001-12-20 2002-12-03 パケットオリエンテッドネットワークを介する音声を用いた情報の交換方法 Withdrawn JP2005513662A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/037,155 US20030121002A1 (en) 2001-12-20 2001-12-20 Method and system for exchanging information through speech via a packet-oriented network
PCT/EP2002/013674 WO2003055189A1 (de) 2001-12-20 2002-12-03 Verfahren zum austausch von informationen mittels sprache über ein paketorientiertes netzwerk

Publications (1)

Publication Number Publication Date
JP2005513662A true JP2005513662A (ja) 2005-05-12

Family

ID=21892731

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003555783A Withdrawn JP2005513662A (ja) 2001-12-20 2002-12-03 パケットオリエンテッドネットワークを介する音声を用いた情報の交換方法

Country Status (6)

Country Link
US (1) US20030121002A1 (ja)
EP (1) EP1457029A1 (ja)
JP (1) JP2005513662A (ja)
CN (1) CN1606862A (ja)
CA (1) CA2471133A1 (ja)
WO (1) WO2003055189A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396973B2 (en) 2004-10-22 2013-03-12 Microsoft Corporation Distributed speech service

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7406658B2 (en) * 2002-05-13 2008-07-29 International Business Machines Corporation Deriving menu-based voice markup from visual markup
FR2848312B1 (fr) * 2002-12-10 2005-08-05 France Telecom Procede et dispositif de conversion de documents hypertextes en signaux vocaux, et portail d'acces au reseau internet utilisant un tel dispositif.
US8117538B2 (en) * 2008-12-19 2012-02-14 Genesys Telecommunications Laboratories, Inc. Method for dynamically converting voice XML scripts into other compatible markup language scripts based on required modality
US10291776B2 (en) * 2015-01-06 2019-05-14 Cyara Solutions Pty Ltd Interactive voice response system crawler
US11489962B2 (en) 2015-01-06 2022-11-01 Cyara Solutions Pty Ltd System and methods for automated customer response system mapping and duplication

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5884262A (en) * 1996-03-28 1999-03-16 Bell Atlantic Network Services, Inc. Computer network audio access and conversion system
GB2317070A (en) * 1996-09-07 1998-03-11 Ibm Voice processing/internet system
US6018710A (en) * 1996-12-13 2000-01-25 Siemens Corporate Research, Inc. Web-based interactive radio environment: WIRE
US6356920B1 (en) * 1998-03-09 2002-03-12 X-Aware, Inc Dynamic, hierarchical data exchange system
WO2001052514A2 (en) * 2000-01-07 2001-07-19 Informio, Inc. Methods and apparatus for an audio web retrieval telephone system
JP3862470B2 (ja) * 2000-03-31 2006-12-27 キヤノン株式会社 データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体
JP3943830B2 (ja) * 2000-12-18 2007-07-11 株式会社東芝 文書合成方法および文書合成装置
US6801604B2 (en) * 2001-06-25 2004-10-05 International Business Machines Corporation Universal IP-based and scalable architectures across conversational applications using web services for speech and audio processing resources
US20030025732A1 (en) * 2001-07-31 2003-02-06 Prichard Scot D. Method and apparatus for providing customizable graphical user interface and screen layout

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396973B2 (en) 2004-10-22 2013-03-12 Microsoft Corporation Distributed speech service

Also Published As

Publication number Publication date
CN1606862A (zh) 2005-04-13
EP1457029A1 (de) 2004-09-15
US20030121002A1 (en) 2003-06-26
CA2471133A1 (en) 2003-07-03
WO2003055189A1 (de) 2003-07-03

Similar Documents

Publication Publication Date Title
US7308484B1 (en) Apparatus and methods for providing an audibly controlled user interface for audio-based communication devices
KR100566014B1 (ko) 매개변수화된대화정의를사용하여네트워크를통한음성대화를위한방법및장치
US20060064499A1 (en) Information retrieval system including voice browser and data conversion server
US8566103B2 (en) Multi-modal web interaction over wireless network
US7054818B2 (en) Multi-modal information retrieval system
US7382770B2 (en) Multi-modal content and automatic speech recognition in wireless telecommunication systems
US7640163B2 (en) Method and system for voice activating web pages
US6738803B1 (en) Proxy browser providing voice enabled web application audio control for telephony devices
US8032577B2 (en) Apparatus and methods for providing network-based information suitable for audio output
US6490564B1 (en) Arrangement for defining and processing voice enabled web applications using extensible markup language documents
US20030145062A1 (en) Data conversion server for voice browsing system
US8170881B2 (en) Distributed voice browser
US20060168095A1 (en) Multi-modal information delivery system
US20030088421A1 (en) Universal IP-based and scalable architectures across conversational applications using web services for speech and audio processing resources
US20050188111A1 (en) Method and system for creating pervasive computing environments
US7295984B2 (en) Systems and methods for providing voice and data interfaces to web services-based applications
JPH11510977A (ja) オーディオインターフェイスを用いた情報の取り出し方法および装置
US8448059B1 (en) Apparatus and method for providing browser audio control for voice enabled web applications
US7054421B2 (en) Enabling legacy interactive voice response units to accept multiple forms of input
JP2005513662A (ja) パケットオリエンテッドネットワークを介する音声を用いた情報の交換方法
KR100763321B1 (ko) 음성 브라우저, 음성 처리 시스템, 음성 브라우저애플리케이션 관리 방법 및 머신 판독 가능 저장 장치
KR100372007B1 (ko) 음성 포탈서비스를 위한 보이스엑스엠엘 텔레게이트웨이시스템
KR20010069793A (ko) 무선 인터넷을 위한 왑 서비스용 컨텐츠를 브이엑스엠엘기반의 컨텐츠로 변환하여 음성 정보 서비스를 제공하는방법 및 이를 위한 시스템
KR20040026935A (ko) Vxml을 이용한 교환기 관리 방법 및 시스템
JP2004096203A (ja) サービス仲介装置、方法、該方法を実行する記録媒体、及びサービス仲介システム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060207