JP2002351735A - マークアップ言語でフォーマットされたコンテンツを再設定するための方法、システム、及び装置 - Google Patents

マークアップ言語でフォーマットされたコンテンツを再設定するための方法、システム、及び装置

Info

Publication number
JP2002351735A
JP2002351735A JP2002058569A JP2002058569A JP2002351735A JP 2002351735 A JP2002351735 A JP 2002351735A JP 2002058569 A JP2002058569 A JP 2002058569A JP 2002058569 A JP2002058569 A JP 2002058569A JP 2002351735 A JP2002351735 A JP 2002351735A
Authority
JP
Japan
Prior art keywords
markup language
document
data
content
formatted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002058569A
Other languages
English (en)
Inventor
Dwayne Dames
ドウェイン・デイメス
David E Reich
デービッド・イー・ライヒ
Ji Whee Tan
ジー・ウィ・タン
Fang Wang
ファン・ワン
Lenora E Wright
レノーラ・イー・ライト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2002351735A publication Critical patent/JP2002351735A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】第1のマークアップ言語を使用してフォーマッ
トされたデータを第2の異なるマークアップ言語が使用
し得るデータに処理するための方法、システム、および
装置を提供すること。 【解決手段】本発明の方法は、指定されたドキュメント
に対応するテンプレートを識別するステップを含む、一
連のステップを伴う。指定されたドキュメントは、フォ
ーマットされたデータを含む。更に、指定されたドキュ
メントにテンプレートを適用するステップは、フォーマ
ットされたコンテンツからのデータを抽出するステップ
を含む。異なるマークアップ言語を使用して、データを
フォーマットするステップが実行される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、マークアップ言語
処理の分野に関し、詳しくいえば、或るマークアップ言
語を使用してフォーマットされたデータを別のマークア
ップ言語が使用し得るデータに処理することに関する。
【0002】
【従来の技術】マークアップ言語は、ユーザ・インター
フェースを通してデータを提示する方法をコンピュータ
が解釈する助けとなる。一般に、マークアップ言語によ
りタグの形で与えられた提示情報は、ドキュメントにお
けるフォーマットされるべき特定のデータの周囲に挿入
され得る。例えば、インターネットにおいて使用される
顕著なマークアップ言語であるハイパーテキスト・マー
クアップ言語(HTML)は、HTMLでフォーマット
されたドキュメント内に含まれたデータを表示する方法
を指定する情報をブラウザに与える。マークアップ言語
の別の例には、拡張可能マークアップ言語(eXtensible
Markup Language;XML)、HTML及びXMLの両
方をサブセットとして有する標準汎用マークアップ言語
(StandardGeneralized Markup Language;SGML)、
無線マークアップ言語(WirelessMarkup Language;WM
L)、及びハンドヘルド・マークアップ言語(Handheld
Device Markup Language;HDML)が含まれる。しか
し、一般的には、マークアップ言語は、ドキュメントに
含まれたデータの提示を定義し得る任意のセットのデー
タ仕様を含むことができる。
【0003】コンピュータ通信ネットワークが益々発展
するにつれて、新しいサービスが絶えずエンド・ユーザ
に紹介されている。そのようなサービスの1つは、コン
テンツと呼ばれるインターネットからのデータを、音声
インターフェースを介してエンド・ユーザに提供するこ
とである。例えば、ユーザは、パーソナル・ディジタル
・アシスタント(PDA)又はセル電話に実装されたブ
ラウザを通してコンテンツを見るのではなく、音声イン
ターフェースを通して処理され且つセル電話に音声の形
で配送されたコンテンツを聴き取ることができる。この
態様におけるデータの提示は、モバイル・アプリケーシ
ョンにとって有利なものになり得る。特に、音声インタ
ーフェースは、インターネット・コンテンツを得ること
に関して、直観的な手を使わない方法及び目を使わない
方法をユーザに提供する。
【0004】音声拡張可能マークアップ言語(Voice eX
tensible Markup Language、VoiceXML;音声XML
(R))は、音声インターフェースを通して提示するデ
ータをフォーマットするために使用され得るマークアッ
プ言語である。音声XML仕様が、Voice eXtensible M
arkup Language(VoiceXML(R))version 1.0,(W3C May 20
00)と題して、Linda Boyer、Peter Danielsen、Jim Fer
rans、Gerald Karam、David Ladd、Bruce Lucas、及び
Kenneth Rehor氏による論文としてVoiceXML Forum誌に
より公開された。更に、音声XML仕様のバージョン
1.0は、推薦の業界標準としてワールド・ワイド・ウ
ェブ協会(W3C)により受け入れられた。
【0005】現在インターネット上で利用可能な大量の
コンテンツは、音声XML又は他の音声指向マークアッ
プ言語フォーマットを使用してフォーマットされたもの
ではない。むしろ、ほとんどのコンテンツはHTMLを
使用してフォーマットされている。HTMLでフォーマ
ットされた既存のインターネット・コンテンツを音声イ
ンターフェース駆動のシステムが処理するためには、そ
のフォーマットされたコンテンツは音声XMLフォーマ
ット・コンテンツに変換されなければならない。別の方
法として、HTMLコンテンツが、他の適当な音声指向
マークアップ言語を使用して再フォーマットされ得る。
【0006】現在、第1のマークアップ言語でフォーマ
ットされたドキュメントを第2のマークアップ言語を使
用してフォーマットされたドキュメントに変換するため
には、「トランスコーディング」と呼ばれるプロセスが
使用され得る。本質的に、トランスコーディングは、第
1のマークアップ言語のタグを識別すること及びそれら
を第2のマークアップ言語の対応するタグでもって代用
することを含む。例えば、ドキュメントをHTMLから
音声XMLにトランスコードする場合、各HTMLタグ
が、対応する音声XMLタグでもって置換され得る。そ
こで、その結果生じたトランスコード済みのドキュメン
トが音声インターフェースを通して提示される。このよ
うに、トランスコーダは、或るマークアップ言語でフォ
ーマットされたドキュメントを別のマークアップ言語で
フォーマットされたドキュメントに変換することができ
る。
【0007】しかし、様々な形態のマークアップ言語を
トランスコードすることには不利な点がある。なお、こ
の形態とは、データの提示が関連する人の感覚に起因す
るものである。例えば、HTMLは、データの可視的提
示に関連する。音声XMLは、音声関連のデータ提示に
関連する。そのような不利な点の1つは、テキストから
音声へのコンテンツの提示における形態の変化の結果、
音声インターフェースによって無意味な音声が生成され
得るということである。詳しくいえば、視覚関連のHT
MLタグを音声関連の音声XMLタグでもって置換した
だけでは、その結果生じるドキュメントは、それが音声
インターフェースによって読み取られる時、受話者を混
乱させるものとなる場合がある。例えば、HTMLでフ
ォーマットされた表データをエンド・ユーザが見ること
ができることは明らかである。音声インターフェースに
よる処理で音声XMLを使用して、HTMLの表を認識
すること及びそれを再タグ付けすることはできるけれど
も、音声インターフェースは、一般に、わかり易い且つ
ユーザに優しい方法でその表を可聴的に提示するに適し
た方法を持たない。詳しくいえば、音声インターフェー
スは、表のエントリを行単位で、又は列単位でランダム
に提示し得るが、その行単位又は列単位の提示は受話者
を混乱させる可能性がある。従って、タグの単なる置換
は、異なるユーザ・インターフェースの問題を解決する
ものではない。
【0008】更に、トランスコーディングは、データ提
示媒体にインターフェースを適応させるのではなく、イ
ンターフェースにユーザ対話を適応させることを必要と
する。例えば、ユーザは、HTMLでフォーマットされ
た表から情報又はエントリの一部分を得ることを望むこ
とがある。しかし、HTMLでフォーマットされたドキ
ュメントを音声XMLドキュメントにトランスコードし
た後、ユーザは、音声インターフェースによって可聴的
に生成されたひどい配列の表全体を聴き取ることを強い
られることがある。そのような状況は受話者を疲労さ
せ、それによって音声インターフェースの利点を損うこ
とがある。音声インターフェースによる変換処理に適し
た構造でデータを提示することは、受話者の疲労を克服
し、更にユーザに優しい解決法を提供することができ
る。
【0009】トランスコーディングのもう1つの不利な
点は、トランスコードされたドキュメントの構造が劣っ
たものになり得ることである。例えば、音声XMLドキ
ュメントの編成構造は、各マークアップ言語の異なる形
態のため、HTMLドキュメントの構造とはかなり異な
ることがあり得る。更に、ドキュメントにおけるデータ
配置に関係なくタグを置換することは、その結果とし
て、トランスコードされたドキュメント全体を通してデ
ータの断片化を生じ得る。従って、異なる形態のマーク
アップ言語をトランスコードすることに関して、問題点
が依然として存在する。
【0010】
【発明が解決しようとする課題】本発明の目的は、第1
のマークアップ言語を使用してフォーマットされたドキ
ュメントからデータを抽出し、第2の異なるマークアッ
プ言語を使用してその抽出されたデータを提示するため
の方法及びシステムを提供することにある。
【0011】
【課題を解決するための手段】本発明は、受け取ったコ
ンテンツ・リクエストに基づいて、コンピュータ通信ネ
ットワークにおけるロケーションから第1のドキュメン
トを得ることができる。処理の後、本発明は、第2の異
なるマークアップ言語を使用してフォーマットされる第
2のドキュメントを作成することができる。従って、第
2のドキュメントは、第2の異なるマークアップ言語を
使用してフォーマットされた第1のドキュメントから抽
出されたデータを含み得る。特に、第2の異なるマーク
アップ言語は、抽出されたデータが提示されるべきフォ
ーマットを更に指定できるコンテンツ・リクエストに対
応し得る。
【0012】本発明において教示される方法は、指定さ
れたドキュメントに対応するテンプレートを識別するこ
とによって開始し得る。識別されたテンプレートは、フ
ォーマットされたコンテンツに適用され得るし、そのコ
ンテンツからデータを分析するために使用され得る。テ
ンプレートは、1つ又は複数のコンテンツ・マーカを含
み得る。そのコンテンツ・マーカは、データが見つけら
れるドキュメント内のオフセット、コンテンツ・マーカ
が指示するデータのタイプを表す識別子、及びデータ・
フィールドの長さを表す値、又は、その代わりとして、
データ・フィールドの終わりを表すもう1つにオフセッ
トを含み得る。指定されたドキュメントはフォーマット
されたコンテンツを含み得る。この方法は、指定された
ドキュメントにテンプレートを適用することを含み得
る。特に、この適用は、フォーマットされてないデータ
を、フォーマットされたコンテンツから抽出することを
含み得る。フォーマットされたコンテンツは、ハイパー
テキスト・マークアップ言語(HTML)、拡張可能マ
ークアップ言語(XML)、標準汎用マークアップ言語
(SGML)、無線マークアップ言語(WML)、及び
ハンドヘルド・マークアップ言語(HDML)又は音声
XMLでフォーマットされたコンテンツであってもよ
い。異なるマークアップ言語を使用してデータをフォー
マットする更なるステップが含まれ得る。その異なるマ
ークアップ言語は、HTML、XML、SGML、WM
L、HDML、又は音声XMLであってもよい。特に、
フォーマットすることは第2のドキュメントを生成し、
その場合、指定されたドキュメント及び第2のドキュメ
ントは異なる形態のものであってもよい。
【0013】もう1つの実施例は、コンテンツ・リクエ
ストを受けることを含み、この場合、コンテンツ・リク
エストは、指定されたドキュメントが検索されるネット
ワーク・ロケーションを指定することができる。この方
法は、指定されたドキュメントをネットワーク・ロケー
ションから検索するステップ及びユーザ・インターフェ
ースを通して第2のドキュメントを提示するステップを
含む。特に、ユーザ・インターフェースは音声インター
フェースであってよい。
【0014】データの抽出は、指定されたドキュメント
内のオフセットから、フォーマットされたコンテンツに
おけるデータを読み取ることを含み得る。オフセット
は、テンプレートにおけるコンテンツ・マーカによって
識別され得る。更に、この方法は、コンテンツ・マーカ
からデータ識別子を読み取ることを含み得る。
【0015】もう1つの実施例は、コンテンツ・コンバ
ータを形成する方法であり、それは、フォーマットされ
たコンテンツを含む1つ又は複数のドキュメント内の少
なくとも1つのデータ・ロケーションを決定することを
含む。そのデータ・ロケーションに対応する1つ又は複
数のコンテンツ・マーカを有する少なくとも1つのテン
プレートを形成するステップが含まれ得る。各テンプレ
ートは、指定されたドキュメントに対応する。更に、こ
の方法は、テンプレート・テーブルを使用してその指定
されたドキュメントにテンプレートをマップすることを
含み得る。
【0016】本発明の別の局面は、第1のマークアップ
言語でフォーマットされたドキュメントを受けるための
バッファを含み得る、データを再フォーマットするため
のシステムである。そのシステムは、ドキュメントにお
けるフォーマットされたコンテンツからデータを抽出す
るための1つ又は複数のテンプレートを含み、そのフォ
ーマットされたコンテンツは、HTML、XML、SG
ML、WML、HDML、又は音声XMLでフォーマッ
トされたコンテンツであってもよい。各テンプレート
は、少なくとも1つのドキュメントに対応する。特に、
テンプレートは、フォーマットされたコンテンツにデー
タを位置指定するための少なくとも1つのコンテンツ・
マーカを含む。更に、コンテンツ・マーカは、フォーマ
ットされたコンテンツにおけるデータを識別するための
識別子を含む。このシステムは、テンプレートを対応す
るドキュメントと関連付けるテンプレート・テーブルを
含み得る。更に、このシステムは、第2のマークアップ
言語を使用してデータをフォーマットするためのフォー
マッタを含む。特に、第2のマークアップ言語は、HT
ML、XML、SGML、WML、HDML、又は音声
XMLであってよい。更に、第1及び第2のマークアッ
プ言語は異なる形態のものであってよい。
【0017】本発明のもう1つの局面は、コンピュータ
・プログラムが記憶されているマシン可読記憶装置であ
り、そのコンピュータ・プログラムは、マシンに一連の
ステップを実行させるためのマシンによる実行可能な複
数のコード・セクションを有する。それらのステップ
は、指定されたドキュメントに対応するテンプレートを
識別するステップを含み得る。指定されたドキュメント
は、フォーマットされたコンテンツを含み得る。指定さ
れたドキュメントにテンプレートを適用する更なるステ
ップが含まれ、そのアプリケーションは、フォーマット
されたコンテンツからデータを抽出するステップを含み
得る。フォーマットされたコンテンツは、HTML、X
ML、SGML、WML、HDML、又は音声XMLで
フォーマットされたコンテンツであってよい。更に、異
なるマークアップ言語を使用してデータをフォーマット
し且つ第2のドキュメントを生成するステップが含まれ
得る。特に、指定されたドキュメント及び第2のドキュ
メントは、異なる形態のものであってもよい。異なるマ
ークアップ言語は、HTML、XML、SGML、WM
L、HDML、又は音声XMLであってよい。
【0018】マシン可読記憶装置は、コンテンツ・リク
エストを受けるステップをマシンに実行させるための更
なるコード・セクションを含み、そのコンテンツ・リク
エストは、指定されたドキュメントが検索されるネット
ワーク・ロケーションを指定し得る。更に、指定された
ドキュメントをネットワーク・ロケーションから検索す
るステップも含まれ得る。音声インターフェースのよう
なユーザ・インターフェースを通して、第2のドキュメ
ントを提示する更なるステップが更に含まれ得る。
【0019】データの抽出は、指定されたドキュメント
におけるオフセットからフォーマットされたコンテンツ
におけるデータを読み取ることを含み得る。オフセット
は、テンプレートにおけるコンテンツ・マーカによって
識別され得る。更に、コンテンツ・マーカからデータ識
別子を読み取るステップが含まれ得る。
【0020】
【発明の実施の形態】本願において開示される発明は、
あるマークアップ言語を使用してフォーマットされたコ
ンテンツを、別のマークアップ言語でもってフォーマッ
トするために、抽出するための方法及びシステムを提供
する。詳しくいえば、第1のマークアップ言語を使用し
てフォーマットされたドキュメントにおけるコンテンツ
が、第2の新たに作成されたドキュメントへの提示のた
めに抽出され得る。なお、この新たに作成されたドキュ
メントは、第2の異なるマークアップ言語を使用してフ
ォーマットされる。特に、それらのマークアップ言語
は、形態が異なっていてもよい。例えば、第1のマーク
アップ言語は、可視的なテキストの提示に関するもので
よく、第2のマークアップ言語は、音声の提示に関する
ものでもよい。実施例は、それぞれ、ハイパーテキスト
・マークアップ言語(HTML)及び音声拡張マークア
ップ言語(音声XML)を含み得る。
【0021】概していえば、本発明は、情報が抽出され
るべきウェブ・ページの選択を伴う。情報は、そのウェ
ブ・ページに対応するテンプレートを使用して抽出され
得る。テンプレートは、テンプレートが存在するウェブ
・ページをユーザがリクエストする時に、検索されるべ
きデータ構造でメモリに記憶される。従って、本発明
は、対応するテンプレートが存在するドキュメントのみ
から情報を抽出することができる。特に、データ構造
は、それらのテンプレートを、URLのようなコンピュ
ータ通信ネットワークに対応するドキュメントのロケー
ションと関連付けることができる。例えば、スポーツ・
ニュース・ウェブ・サイト、経済ニュース・ウェブ・サ
イト、現在の催し物ウェブ・サイト、又は望ましいコン
テンツを有する他の任意のウェブ・サイトのようなウェ
ブ・ページ又はドキュメントが選択され得る。選択され
た各ウェブ・ページに対して、ドキュメントに含まれた
コンテンツを抽出するためのテンプレートが形成され得
る。ドキュメントからの特定の情報が抽出されるよう
に、テンプレートがカスタマイズされ得ることは明らか
であろう。
【0022】別の方法として、ドキュメントに含まれた
如何なる情報も、ドキュメントにある全情報を含む種々
の組み合わせで抽出されるように、テンプレートがカス
タマイズされ得る。例えば、スポーツ・ニュース・ウェ
ブ・ページの場合、特定のスポーツ・イベントのスコア
のような特定の情報のロケーション又はナショナル・フ
ットボール・リーグのAFC順位表のようなリーグ順位
表が抽出のために識別され得る。同様に、テンプレート
は、ウェブ・ページに含まれるAFCゲームのスコアだ
けを戻すようにカスタマイズされ得る。テンプレートが
編集され得ること、従って、ドキュメント・フォーマッ
ト及びドキュメント・コンテンツの変化に適応し得るこ
とは明らかであろう。更に、テンプレートを含むデータ
構造が、コンピュータ通信ネットワークにおけるドキュ
メント・ロケーションの変化に適応するように編集され
得る。更に、新しいテンプレートは、コンピュータ通信
ネットワーク上に存在する任意のドキュメント用に、そ
のネットワーク上の指定されたロケーションを有するC
Cシステムに継続的に加えられ得る。
【0023】具体的にいえば、コンテンツ・コンバータ
(CC)システムは、クライアントからコンテンツ・リ
クエストを受けることができる。コンテンツ・リクエス
トはユニフォーム・リソース・ロケータ(URL)の形
のものであってもよく、リクエストされたコンテンツを
有するドキュメントを指定することができる。CCシス
テムは、コンテンツ・リクエストをコンピュータ通信ネ
ットワーク又はインターネットに送ることができる。そ
の後、CCシステムは、クライアント・リクエストに対
応してそのリクエスト・ドキュメントを受信することが
できる。特に、受信されたドキュメントは、HTML、
拡張可能マークアップ言語(XML)、HTML及びX
MLのサブセットである標準汎用マークアップ言語(S
GML)、無線マークアップ言語(WML)、及びハン
ドヘルド・マークアップ言語(HDML)、音声XM
L、又は他の任意のマークアップ言語を使用してフォー
マットされたコンテンツ含み得る。
【0024】フォーマットされたコンテンツを含むドキ
ュメントを受信すると、CCシステムは、テンプレート
・テーブル内の受信されたドキュメントと関連付けられ
たエントリを位置指定することができる。テンプレート
・テーブルはCCシステムにテンプレートのリストを含
み、各テンプレートは、URLのようなコンピュータ通
信ネットワークにおけるドキュメント・ロケーションと
関連付けられる。この方法では、テンプレート・テーブ
ルにおけるエントリは、受信されたドキュメントに対応
するテンプレートを指定することができる。指定された
テンプレートは、フォーマットされたコンテンツに適用
され得るし、そのコンテンツからデータを抽出又は分析
するために使用され得る。例えば、特定のテキストがイ
タリック体に見えるようにフォーマットされている場
合、テンプレートは、イタリック体に関係なくテキスト
を抽出することができる。特に、CCシステムは、複数
のテンプレートを含み得るし、各テンプレートは、ドキ
ュメントと関連した特定のURLに対応し得る。従っ
て、テンプレート・テーブルをアクセスすることによっ
て、CCシステムは、受信されたドキュメントに含まれ
たフォーマット済みコンテンツから未フォーマットのデ
ータを抽出するための特定のURLに対応するテンプレ
ートを識別することができる。
【0025】受信されたドキュメントから未フォーマッ
トのデータを抽出した後、CCシステムは、第2の異な
るマークアップ言語を使用してデータを再目的付けする
ことができる。詳しくいえば、CCシステムは、抽出さ
れたデータを第2の異なるマークアップ言語ドキュメン
トに適用することによって、第2の異なるマークアップ
言語ドキュメントを作成することができる。新たに作成
されたドキュメントがクライアントに提供され得る。特
に、新たに作成されたドキュメント及び受信されたドキ
ュメントは、異なる形態のものであってもよい。例え
ば、HTMLドキュメントからデータを抽出した後、C
Cシステムは、音声XMLを使用して、音声インターフ
ェースを介してエンド・ユーザに供給されるデータを再
目的付けすることができる。しかし、本発明が、受信さ
れたドキュメントから異なる形態を有するドキュメント
を作成することに限定されないことは明らかであろう。
例えば、受信されたドキュメント及びその結果生ずるド
キュメントは、それぞれ、種々のマークアップ言語のう
ちの何れかでフォーマットされ得るが、HTML、XM
L、そのHTML及びXMLのサブセットであるSGM
L、WML、HDML、音声XML、又は他の任意のマ
ークアップ言語に限定されない。この場合、受信された
ドキュメント及びその結果生ずるドキュメントは、異な
るマークアップ言語でフォーマットされる。
【0026】本発明は、CCシステムを構成する方法に
も関連する。その方法は、データを抽出するためのウェ
ブ・ページのようなドキュメントの選択を含む。フォー
マットされたコンテンツを含むこれらのドキュメント
は、データが存在するそれらのドキュメントにおけるロ
ケーションを決定するために分析され得る。例えば、U
RLのようなコンピュータ通信ネットワークの指定され
たロケーションを有するいずれのドキュメントも、デー
タが存在するそのドキュメント内のロケーションを決定
するために分析され得る。更に、指定されたドキュメン
トにおけるデータのタイプ及びそのデータ・フィールド
の長さも決定され得る。分析された各ドキュメントに対
して、対応するテンプレートが形成され得る。コンフィ
ギュレーション・ファイルと似ているテンプレートは、
ドキュメント内の決定されたデータ・ロケーションに対
応する少なくとも1つのコンテンツ・マーカを含み形成
され得る。特に、コンテンツ・マーカは、そのマーカが
指すデータのタイプ及びそのデータの長さ又は終了点に
関する情報を含み得る。ドキュメントから抽出及び分析
されるべき各データ項目は、そのドキュメントに対応す
るテンプレート内に対応するコンテンツ・マーカを持ち
得る。
【0027】テンプレートの形成の後、それらのテンプ
レートは、指定されたドキュメントにそれらのテンプレ
ートをマップし得るテンプレート・テーブルのようなデ
ータ構造に含まれ得る。テンプレート・テーブルも、テ
ンプレートをドキュメントに適合させるためのコンフィ
ギュレーション・ファイルと似たものになり得る。例え
ば、テンプレートは、URLのようなコンピュータ通信
ネットワークにおけるドキュメント・ロケーションと関
連付けられ得る。この方法では、テンプレートは、ユー
ザがリクエストしたドキュメント・ロケーションに基づ
いてテンプレート・テーブルから識別され得る。
【0028】図1は、サーバ100、CCシステム11
0、クライアント120、及びエンド・ユーザ125を
含む例示的なコンピュータ通信ネットワーク構成を示
す。情報は、サーバ110からコンピュータ通信ネット
ワーク又はインターネットを介して、エンド・ユーザに
提示するために、クライアントに供給され得る。図1に
示されたクライアント/サーバ関係の一般的な例は、プ
ロキシ・サーバ対インターネット・ウェブ・サーバ、エ
ンド・ユーザ・ワークステーション対プロキシ・サー
バ、エンド・ユーザ・ワークステーション対サービス・
プロバイダのサーバ、又はインテリジェント・ルータ対
プロキシ・サーバを含み得る。前記の例が単に説明のた
めのものであること、及び本発明が特定の開示される例
に限定されないことは勿論である。
【0029】図1に示されるように、CCシステム11
0は、クライアント120及びサーバ100の間のイン
ターフェースとして動作し得る。CCシステム110
は、C言語又は他の適当なプログラミング言語で書かれ
たコンピュータ・プログラムであってもよい。CCシス
テム110は、別個のコンポーネントであるように示さ
れているけれども、CCシステム110がサーバ10
0、プロキシ・サーバ(図示されていない)、クライア
ント120、又はそれらの任意の組み合わせ内に設けら
れ得ることは明らかであろう。更に、CCシステム11
0は、そのCCシステムが、新たに作成されたドキュメ
ントを、適当なユーザ・インターフェースを介して供給
する前に、受信したドキュメントを処理し得るように、
通信のクライアント/サーバ・パス内のどこに設けられ
てもよい。これは、そのシステムがネットワークに適合
することを必要としないように有用性を高めるが、本発
明は、むしろ、そのシステムが如何なるネットワークに
おいても働くことを可能にする。例えば、ユーザ・イン
ターフェースがクライアント120に存在する音声イン
ターフェースである場合、CCシステム110もクライ
アント120に設けられ得る。その場合、CCシステム
が、新たに作成されたドキュメントを音声インターフェ
ースに供給する前に、受信したドキュメントを処理し得
るように、システムが構成され得る。この構成は、CC
システムがドキュメントを処理すること及びエンド・ユ
ーザ125に対する提示のために音声指示されたドキュ
メントを音声インターフェースに供給することを可能に
し得る。
【0030】本発明の構成によるCCシステムが図2に
示される。CCシステムは、コンテンツ・リクエスト及
びドキュメントを受けるためのバッファ130、テンプ
レート・テーブル140、1つ又は複数のテンプレート
150、及びマークアップ言語アプリケーション160
を含み得る。
【0031】テンプレート・テーブル140は、1つ又
は複数のテンプレート150に対する参照符号を含み得
る。テンプレート・テーブル140におけるエントリ
は、ドキュメントが検索され得るネットワーク・ロケー
ション識別子を含み得る。例えば、その識別子は、ウェ
ブ・ページに対応するURLであってもよい。テンプレ
ート・テーブル140におけるエントリは、テンプレー
トが特定のドキュメントに関連付けられ得るように、対
応するテンプレート識別子又はポインタも含み得る。テ
ンプレート150は、データが見つけられるドキュメン
ト内のオフセットを表す1つ又は複数のコンテンツ・マ
ーカを含み得る。例えば、オフセットは、データが始ま
るドキュメントにおけるバイトの数又はバイトのロケー
ションであってもよい。更に、各コンテンツ・マーカ
は、そのコンテンツ・マーカが指すデータのタイプを表
す識別子も含み得る。更に、コンテンツ・マーカは、デ
ータ・フィールドの長さを表す値、或いはデータ・フィ
ールドの終わりを表す別のオフセットを含み得る。
【0032】例えば、1つの例示的テンプレート150
は、特定の天気関連のウェブ・ページに対応し得る。テ
ンプレート150は、コンテンツ・マーカがドキュメン
トにおけるデータ・フィールドに対応するようにプログ
ラムされ得る。詳しく云えば、テンプレートは、対応す
るウェブ・ページに対する都市データ・フィールドを表
すコンテンツ・マーカ及び温度データ・フィールドを表
すコンテンツ・マーカを持ち得る。コンテンツ・マーカ
において指定されたオフセットによって、CCシステム
110は、その指定されたオフセットにおいて位置指定
されたテキストを識別し得る。例えば、オフセット値
は、指定されたウェブ・ページにおけるバイト・オフセ
ットとして指定され得る。この場合、CCシステムは、
データを取り巻くマークアップ言語に関係なく、HTM
Lウェブ・ページのような受信したドキュメントから、
その都市に関する都市名及び対応する温度を抽出するこ
とができる。
【0033】1つの実施例では、テンプレートにおける
コンテンツ・マーカの順序付けは、第2マークアップ言
語を使用して新たに作成されたドキュメントにおいて最
終的に提示されるように、データの順序付けを決定する
ことができる。更に詳しくいえば、データは、それが、
受信したマークアップ言語ドキュメントから抽出された
順序で、第2マークアップ言語を使用して提示され得
る。従って、テンプレートにおけるコンテンツ・マーカ
の順序は、第2マークアップ言語を使用して提示の順序
を規定し得る。例えば、天気関連のウェブ・サイト用の
テンプレートは、第1コンテンツ・マーカが都市を指
し、第2コンテンツ・マーカが予想される毎日の高い温
度を指し、第3コンテンツ・マーカが予想される毎日の
低い温度を指すように、順序付けられたコンテンツ・マ
ーカを含むことができる。前述のデータは、受信された
ドキュメントを通して断片化され得るけれども、そのデ
ータは、コンテンツ・マーカによって指定された順序で
抽出され得るし、それによってエンド・ユーザに実用的
な提示を行うことができる。詳しく云えば、エンド・ユ
ーザが「Miami high today of X, low today of Y」を
聴き取ることができるように、音声XMLを使用してデ
ータがフォーマットされ得る。特に、コンテンツ・マー
カのタイプ、コンテンツ・マーカに含まれるオフセッ
ト、及びコンテンツ・マーカの順序付けが決定され、テ
ンプレート毎に及びウェブ・ページ毎にプログラムされ
得る。
【0034】更に、CCシステムは、テンプレート・テ
ーブルにおける各エントリに対して複数のテンプレート
を含み得る。例えば、単一のウェブ・ページが、音声X
MLでデータをフォーマットするためのテンプレート及
びHDMLでデータをフォーマットするための別のテン
プレートを持つことができる。この実施例では、コンテ
ンツ・マーカの順序付けは、クライアントがリクエスト
したデータ提示フォーマット及び相関するマークアップ
言語に依存するので、複数のテンプレートが使用され得
る。従って、音声XMLでフォーマットされたドキュメ
ントをコンテンツ・リクエストが指定し得るように、コ
ンテンツ・リクエストは、ハンドヘルド装置における提
示のためにHDMLでフォーマットされたドキュメント
を戻すことを指定し得る。この場合、CCシステムは、
受信したHTMLドキュメントをHDMLドキュメント
に変換することができる。新たなテンプレートが連続的
に更新され、CCシステムに追加され得る。
【0035】マークアップ言語アプリケーション160
は、異なるマークアップ言語を使用してフォーマットさ
れた新たなドキュメントとして提示するために、受信し
たドキュメントから抽出されたデータを再フォーマット
することができる。マークアップ言語アプリケーション
160は、抽出されたデータを適正にフォーマットする
ためにどのマークアップ言語を使用することができるか
を決定するために、受信したコンテンツ・リクエストを
翻訳処理することができる。例えば、リクエストは、抽
出されたデータが音声インターフェースによる使用のた
めにフォーマットされることを指定することができる。
従って、マークアップ言語アプリケーション160は、
音声XMLを使用して、抽出されたデータをフォーマッ
トすることができる。別の方法として、クライアント・
リクエストが、パーソナル・ディジタル・アシスタント
(PDA)による使用のためにフォーマットされたデー
タを指定する場合、マークアップ言語アプリケーション
160は、HDMLを使用して、抽出されたデータをフ
ォーマットすることができる。受信されたクライアント
・リクエストに関係なく、マークアップ言語アプリケー
ション160は、抽出されたデータをフォーマットする
ための指定されたマークアップ言語を決定するためにク
ライアント・リクエストを読み取ることができる。テン
プレート・テーブル140及び適切なテンプレート15
0を参照することによって、マークアップ言語アプリケ
ーション160は、クライアントがリクエストしたマー
クアップ言語で適正にフォーマットするために、抽出さ
れたデータ及びそのデータのタイプを決定することがで
きる。
【0036】本発明のもう1つの実施例では、テンプレ
ートにおけるコンテンツ・マーカの順序付け機能がマー
クアップ言語アプリケーション160において実現され
得る。その場合、各ドキュメントは、データを抽出する
ための単一の対応テンプレートを持ち得る。従って、新
たなマークアップ言語を使用して、提示のためのデータ
を順序付ける機能がマークアップ言語アプリケーション
160の中に形成され得る。更に詳しくいえば、マーク
アップ言語アプリケーション160は、クライアント・
リクエストのリクエストされた出力フォーマットを識別
し、テンプレートを使用して抽出されたデータのタイプ
とその出力フォーマットとを相関させ、クライアント・
リクエスト及びテンプレートにおけるコンテンツ・マー
カに従ってそのデータを新たなマークアップ言語で再フ
ォーマットすることができる。例えば、マークアップ言
語アプリケーション160は、テンプレートにおけるコ
ンテンツ・マーカを読み取り、内部ロジックを通してデ
ータの順序付けを決定することができる。
【0037】データを順序付ける方法に関係なく、テン
プレートにおける特定のコンテンツ・マーカを特定のマ
ークアップ言語タグ、コード、及びテキストと関連付け
ることができることは明らかであろう。従って、データ
提示が、テンプレート毎を基準に、従って、ドキュメン
ト毎を基準にカスタマイズされ得る。更に、特定のコン
テンツ・マーカは、エンド・ユーザの理解を高めるため
に、マークアップ言語アプリケーション160にテキス
トをデータ内に挿入させることができる。例えば、マー
クアップ言語アプリケーション160は、音声インター
フェースに「Miami, 80, 75」を云わせるために音声X
MLを生成するのではなく、エンド・ユーザが「Miami,
high today of 80, low today of 75」を聴き取ること
ができるように、テキストを挿入することができる。こ
の場合、高温度のコンテンツ・マーカが、抽出されたデ
ータ「80」の前にテキスト「high today of」を挿入さ
せ得る。低温度のコンテンツ・マーカが、抽出されたデ
ータ「75」の前にテキスト「low today of」を挿入させ
得る。
【0038】図3は、1つのマークアップ言語を使用し
てフォーマットされたドキュメントから、図1のCCシ
ステム110によって実行されるような他のマークアッ
プ言語を使用して提示するためのデータを抽出するため
のプロセスを示すフロー・チャートである。CCシステ
ム110は、ステップ200において開始し、コンテン
ツ・リクエストをクライアントから受信する。受信され
たクライアント・リクエストは、ウェブ・ページに対応
する特定のURLに対するリクエストを表すようにハイ
パーテキスト転送プロトコル(HTTP)及びTCP/
IPを使用してフォーマットされ得る。しかし、リクエ
ストは、伝統的なコンピュータ・ベースのブラウザでは
ないインターフェースによって開始され得る。例えば、
リクエストは、現在の株式相場を含むドキュメントをリ
クエストするセル電話又はPDAと共に使用する音声イ
ンターフェース又はブラウザによって開始され得る。
【0039】クライアント・リクエストは、リクエスト
された情報が受信される時のフォーマットを表す識別子
を含むことができる。例えば、音声インターフェースか
らのリクエストは、HTML又はHDMLよりもむしろ
音声XMLを使用してデータがクライアントに戻される
ことを表す識別子を含むことができる。従って、CCシ
ステム110は、ユーザがリクエストしたドキュメント
からデータを抽出すること及び音声XMLを使用してデ
ータを再フォーマットすることが必要であろうことを決
定することができる。特に、クライアント・リクエスト
がフォーマットの変更をリクエストしない場合、CCシ
ステムは、コンピュータ通信ネットワーク又はインター
ネットに対して単に透過的になり得るだけである。その
場合、情報は、CCシステムによる影響を受けずに自由
に通過することができる。ステップ200の終了後、C
Cシステムはステップ210に進む。
【0040】ステップ210において、CCシステム
は、コンピュータ通信ネットワーク又はインターネット
にコンテンツ・リクエストを送信する。特に、CCシス
テムがプロキシ・サーバ内に設けられる場合、プロキシ
・サーバはリクエストされたドキュメントに関してそれ
のキャッシュ・メモリをチェックすることができる。リ
クエストされたドキュメントがプロキシ・サーバのキャ
ッシュ・メモリにある場合、そのドキュメントは、コン
ピュータ通信ネットワーク又はインターネットを介して
リクエストを送信することなく、CCシステムに供給さ
れ得る。ステップ210の完了後、システムはステップ
220に継続する。
【0041】ステップ220において、送信されたコン
テンツ・リクエストは、サーバからコンピュータ通信ネ
ットワーク又はインターネットを介してドキュメントを
受信することによって実行され得る。例えば、CCシス
テムは、リクエストされたURLに対応するHTMLフ
ォーマットでウェブ・ページをウェブ・サーバから受信
することができる。リクエストされたドキュメントの受
信時に、CCシステムは、更なる処理のために、そのド
キュメントをCCシステムに記憶することができる。
【0042】ステップ230において、CCシステム
は、受信したドキュメントに対応するエントリを位置指
定するためにテンプレート・テーブルを調べることがで
きる。例えば、そのエントリは、受信したウェブ・ペー
ジのURLに対応し得る。更に、エントリは、受信した
ドキュメントから情報を抽出するための特定のテンプレ
ートに対応し得る。従って、CCシステムは、受信した
ドキュメントから情報を抽出するための適正なテンプレ
ートを識別することができる。
【0043】例えば、クライアント・リクエストが株式
市場に関するウェブ・ページに対する特定のURLを表
した場合、CCシステムは、そのウェブ・ページに対応
したテンプレート・テーブルにおけるエントリを位置指
定することができる。テンプレート・テーブルがウェブ
・サイト及びウェブ・ページに対するエントリを含み得
ることは明らかであろう。従って、エントリは、ドメイ
ン名及びそのドメイン名の下のページを指定することが
できる。例えば、リクエストされたウェブ・ページは、
株式関連の情報を含むHTMLドキュメントであっても
よい。その場合、対応するテンプレートは、HTMLド
キュメントにおけるデータ・フィールド及びデータ・タ
イプを識別するコンテンツ・マーカを含む。CCシステ
ムが、リクエストされたドキュメントに対応するテンプ
レートを含まない場合、CCシステムは、対応するドキ
ュメントを将来形成するために、そのリクエストされた
ドキュメントのロケーションを記憶することができる。
更に、CCシステムは、頻繁にリクエストされたドキュ
メントを決定するために、リクエストされたドキュメン
トの数をカウントしておくことができる。ステップ23
0の終了後、CCシステムはステップ240に継続する
ことができる。
【0044】ステップ240において、CCシステム
は、識別されたテンプレートを対応する受信したドキュ
メントに適用する。識別されたテンプレートに含まれた
コンテンツ・マーカを使用して、CCシステムは、受信
したドキュメントから情報を抽出することができる。詳
しく云えば、CCシステムは、抽出されるべきデータの
タイプ及びドキュメントにおけるそのデータのオフセッ
トを表し得るコンテンツ・マーカを翻訳処理することが
できる。更に、コンテンツ・マーカは、抽出されるべき
オフセットを越えるデータの量を決定する長さ値も含み
得る。オフセット及び長さは、受信したドキュメントに
おけるバイト・オフセットとして指定され得る。別の方
法として、システムは、コンテンツ・マーカが指定した
オフセットで始まるすべてのデータを抽出し、テキスト
・フィールドの終わりを表す記号に到達するまで継続す
ることができる。この場合、CCシステムは、受信した
ドキュメントから情報を抽出することができる。
【0045】CCシステムは、テンプレート・テーブル
を使用して、受信したウェブ・ページに対応するテンプ
レートを見つけることができる。CCシステムがデータ
を提示する異なる方法又は形態に適応させるために、ウ
ェブ・ページ当たり複数のテンプレートを含む場合、C
Cシステムはコンテンツ・リクエストに基づいて適正な
テンプレートを識別することができる。従って、コンテ
ンツ・リクエストが音声インターフェースを介してデー
タ提示を指定した場合、CCシステムは、音声インター
フェースを介した提示のために、受信したドキュメント
に対応する適正なテンプレートを決定することができ
る。
【0046】例えば、株式市場関連のウェブ・ページに
対応する1つの例示的なテンプレートは、「株式の名
前」と呼ばれるデータ・フィールドがマークアップ言語
ドキュメントにおけるバイト・オフセット100で始ま
ることを指定するコンテンツ・マーカを含むことができ
る。従って、CCシステムは、コンテンツ・マーカにお
いて指定された長さに対して、或いはコンテンツ・マー
カにおいて指定された終了オフセットが読み取られるま
で、バイト・オフセット100で見つかったテキストを
抽出することができる。別の方法として、CCシステム
は、テキスト・フィールドの終了及びタグの開始を表す
「<」のような、特定の演算子又は文字に達するまで、
HTMLドキュメントからデータを抽出することができ
る。組み込まれたコンテンツ・マーカにテンプレートを
この方法で適用することによって、CCシステムは、対
応するテンプレートを有する、任意のHTMLドキュメ
ント又は他のマークアップ言語ドキュメントから情報を
抽出することができる。ステップ240の終了後、CC
システムは、ステップ250に継続することができる。
【0047】ステップ250において、CCシステム
は、他のマークアップ言語を使用して、抽出されたデー
タを提示のために再フォーマットすることができる。上
記のように、提示されるべき情報の順序付けは、テンプ
レートにおけるコンテンツ・マーカの順序付けを通し
て、又はマークアップ言語アプリケーションに組み込ま
れたロジックを通して決定され得る。いずれの場合も、
マークアップ言語アプリケーションは、テンプレートに
おける特定のコンテンツ・マーカを識別することができ
る。更に、所定のマークアップ言語タグ、コード、及び
テキストが抽出されたデータに加えられるように、各タ
イプのコンテンツ・マーカを特定のアクションと関連付
けることが可能である。
【0048】例えば、情報の順序付けがコンテンツ・マ
ーカの順序付けによって決定される場合、マークアップ
言語アプリケーションは、提示するための情報を受信さ
れたドキュメントからその情報が抽出された順序で作成
することができる。テンプレートにおける第1のコンテ
ンツ・マーカが株式名を指し、第2のコンテンツ・マー
カが株価の開始値を指し、そして第3のコンテンツ・マ
ーカが現在の株価を指す場合、CCシステムは、異なる
マークアップ言語を使用してフォーマットされた新たな
ドキュメントとして、その情報をクライアントに提示す
ることができる。更に、そのデータは、コンテンツ・マ
ーカの順序付けによって又はマークアップ言語アプリケ
ーションによって指定された順序でエンド・ユーザに提
示され得る。システムは、音声インターフェースへの提
示のために、音声XMLのような適正なマークアップ言
語を使用して、抽出されたデータをフォーマットするこ
とができる。
【0049】更に、システムは、ユーザの理解を高める
ために、抽出された情報にテキストを加えることができ
る。例えば、エンド・ユーザが「株式名、100ドル、
110ドル」を聴き取る代わりに、エンド・ユーザが
「株式名、100ドルで始まり、現在110ドルで取引
中」を聴き取るように、システムがテキストを含むこと
ができる。特に、抽出された情報に挿入されたテキスト
は、株価の開始値を指示するコンテンツ・マーカが、抽
出されたデータ「100」の前に「ドルで開始」という
テキスト(open at $100)をマークアップ言語アプリケ
ーションに挿入させるように、マークアップ言語アプリ
ケーション内に記憶され得る。更に、CCシステムはデ
ータの周辺に適当な音声XMLタグを挿入することがで
きる。この方法では、CCシステムは、エンド・ユーザ
が提示された情報を容易に理解し得るように、適正にフ
ォーマットされた音声XMLを音声インターフェースに
供給することができる。
【0050】ステップ260において、CCシステム
は、再フォーマットされたデータを、新たに作成された
マークアップ言語ドキュメントの形で、クライアントに
供給する。特に、新たに作成さえたマークアップ言語ド
キュメントは、ユーザ・インターフェースを通して処理
され得る。ユーザ・インターフェースの例は、可視的に
指示されたマークアップ言語を使用して、フォーマット
されたコンテンツを表示するためのブラウザ及び可聴音
声を処理するための音声インターフェースを含み得る。
例えば、CCシステムは、音声XMLドキュメントをク
ライアントに送信することができる。特に、クライアン
ト又はプロキシ・サーバのような他のコンピュータは、
音声インターフェースを有するコンピュータであっても
よい。その場合、音声インターフェースがコンピュータ
・システムにおける音声使用可能ブラウザであるとき、
エンド・ユーザはスピーカを通してコンテンツを聴き取
ることができる。別の方法として、音声インターフェー
スからの音声出力が、通信リンクを介してエンド・ユー
ザに供給されてもよい。例えば、エンド・ユーザは、セ
ルラ電話接続を介してコンテンツを聴き取ることができ
る。任意のクライアントがリクエストした任意のマーク
アップ言語(XML、SGML、WML、又はHTML
を含むがそれらに限定されない)を使用して、クライア
ントに供給されたドキュメントをフォーマットすること
ができる。
【0051】本発明は、単に、異なるマークアップ言語
の代わりにタグを用いるのではなく、データをドキュメ
ントから抽出する。従って、そのデータは、第2のマー
クアップ言語を使用して提示のために再順序付けされ、
再フォーマットされ得る。データの再フォーマット及び
再順序付けは、リクエストされた形態に基づいて又はデ
ータを提示するユーザ・インターフェースのタイプに基
づいて実行され得る。詳しく云えば、データは、第1の
ドキュメントのフォーマットを保つのではなく、しかも
タグ代用を行うのではなく、第2のマークアップ言語を
使用して再順序付け及び再フォーマットされ得る。例え
ば、CCシステムは、音声インターフェースによる処理
のために第2のマークアップ言語を使用して、抽出され
たデータのフォーマット時に、データが提示されるべき
順序を決定すること及び明瞭するためにテキストを加え
ることができる。本発明のこの局面は、第2のマークア
ップ言語を使用して、新たに作成されたドキュメントの
構成を改良するという結果を生じ得る。
【0052】更に、本発明は、データの断片化を回避す
ることができる。新たに作成されたドキュメント全体に
おけるデータの断片化を回避することによって、エンド
・ユーザは、提示されたデータを更に容易に理解するこ
とができる。既存のテンプレートは、ドキュメント・フ
ォーマット及びドキュメント・コンテンツの変化に適応
するように更新及び編集され得るし、必要に応じて新た
なテンプレートがCCシステムに追加され得るので、C
Cシステムは適応可能なシステムである。更に、テンプ
レート・テーブルは、コンピュータ通信ネットワークに
おけるドキュメント・ロケーションの変化に適応するよ
うに更新及び編集され得る。データのロケーションがド
キュメント毎に広範囲に変わり得るので、テンプレート
の使用は、ドキュメントにおけるデータを位置指定する
複雑なロジックの必要を排除し得る。
【0053】本発明は、ハードウェア、ソフトウェア、
又は、ハードウェア及びソフトウェアの組み合わせで実
現され得る。本発明に従って、あるマークアップ言語を
使用してフォーマットされたコンテンツを別のマークア
ップ言語を使用してフォーマットされたコンテンツに変
換するための方法及びシステムが、1つのコンピュータ
・システムにおける集中態様で、或いは異なる構成要素
が複数の相互接続されたコンピュータ・システムに配置
される分散態様で実現され得る。如何なる種類のコンピ
ュータ・システム(又は、本願において開示された方法
を実行するように適応させた他の装置)にも適する。ハ
ードウェア及びソフトウェアの代表的な組み合わせは、
コンピュータ・プログラムを有する汎用コンピュータ・
システムであってもよい。そのコンピュータ・プログラ
ムは、それがロードされそして実行される時、本願にお
いて開示された方法を実行するようにコンピュータ・シ
ステムを制御する。本発明は、本願において開示された
方法の実施を可能にするすべての特徴を含み、且つコン
ピュータ・システムにロードされると、これらの方法を
実行することができるコンピュータ・プログラム製品に
おいても具体化され得る。
【0054】本願におけるコンピュータ・プログラム手
段又はコンピュータ・プログラムは、情報処理能力を有
するシステムに特定の機能を直接に実行させること、或
いは、 (a)他の言語、コード又は表記法への変換、又は (b)異なる物質形態における再現 の後に特定の機能を実行させることが意図された命令セ
ットを、任意の言語、コード又は表記法で表現したもの
を意味する。
【0055】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0056】(1)フォーマットされたコンテンツを変
換するための方法にして、前記フォーマットされたコン
テンツを含む、指定されたドキュメントに対応するテン
プレートを識別するステップと、前記指定されたドキュ
メントに前記テンプレートを適用し、前記フォーマット
されたコンテンツからデータを抽出するステップと、異
なるマークアップ言語を使用して前記データをフォーマ
ットし、第2のドキュメントを生成するステップとを含
む、方法。 (2)抽出された前記データは未フォーマット・データ
である、上記(1)に記載の方法。 (3)前記指定されたドキュメントが検索され得るネッ
トワーク・ロケーションを指定するコンテンツ・リクエ
ストを受けるステップと、前記ネットワーク・ロケーシ
ョンから前記指定されたドキュメントを検索するステッ
プとを更に含む、上記(1)に記載の方法。 (4)ユーザ・インターフェースを通して前記第2のド
キュメントを提示するステップを更に含む、上記(1)
に記載の方法。 (5)前記ユーザ・インターフェースは、音声インター
フェースである、上記(4)に記載の方法。 (6)前記データを抽出するステップは、前記指定され
たドキュメントにおける、前記テンプレート内のコンテ
ント・マーカによって指定されたオフセットから、前記
フォーマットされたコンテンツにおけるデータを読み取
るステップを含む、上記(1)に記載の方法。 (7)前記コンテンツ・マーカからデータ識別子を読み
取るステップを更に含む、上記(6)に記載の方法。 (8)前記フォーマットされたコンテンツは、ハイパー
テキスト・マークアップ言語(HTML)、拡張可能マ
ークアップ言語(eXtensible Markup Language;XM
L)、標準汎用マークアップ言語(Standard Generaliz
ed Markup Language;SGML)、無線マークアップ言
語(Wireless Markup Language;WML)、ハンドヘル
ド・マークアップ言語(Handheld Device Markup Langu
age;HDML)及び音声XML(VoiceXML)から成るグ
ループから選択されたマークアップ言語を使用してフォ
ーマットされる、上記(1)に記載の方法。 (9)前記フォーマットされたコンテンツは、ハイパー
テキスト・マークアップ言語(HTML)でフォーマッ
トされたコンテンツである、上記(1)に記載の方法。 (10)前記異なるマークアップ言語は、ハイパーテキ
スト・マークアップ言語(HTML)、拡張可能マーク
アップ言語(XML)、標準汎用マークアップ言語(S
GML)、無線マークアップ言語(WML)、ハンドヘ
ルド・マークアップ言語(HDML)及び音声XMLか
ら成るグループから選択される、上記(1)に記載の方
法。 (11)前記異なるマークアップ言語は、音声拡張可能
マークアップ言語(音声XML)である、上記(1)に
記載の方法。 (12)前記第2のドキュメント及び前記指定されたド
キュメントは、異なる形態のものである、上記(1)に
記載の方法。 (13)コンテンツ・コンバータを構成する方法にし
て、フォーマットされたコンテンツを含む、少なくとも
1つの指定されたドキュメントにおける少なくとも1つ
のデータ・ロケーションを決定するステップと、前記デ
ータ・ロケーションに対応する、1つ又は複数のコンテ
ンツ・マーカを有する少なくとも1つのテンプレートを
作成するステップと、テンプレート・テーブルを使用し
て前記テンプレートを前記指定されたドキュメントにマ
ップするステップとを含む、方法。 (14)データを再フォーマットするためのシステムに
して、第1のマークアップ言語でフォーマットされたド
キュメントを受けるためのバッファと、前記ドキュメン
トにおけるフォーマットされたコンテンツからデータを
抽出するための1つ又は複数のテンプレートであって、
その各々が少なくとも1つのドキュメントに対応するテ
ンプレートと、前記テンプレートを対応するドキュメン
トと関連付ける前記テンプレートのテーブルと、第2の
マークアップ言語を使用して前記データをフォーマット
するためのフォーマッタと、を含む、システム。 (15)前記テンプレートは、前記フォーマットされた
コンテンツにおけるデータを位置指定するための少なく
とも1つのコンテンツ・マーカを有する、上記(14)
に記載のシステム。 (16)前記コンテンツ・マーカは、前記フォーマット
されたコンテンツにおけるデータを指定するための識別
子を有する、上記(15)に記載のシステム。 (17)前記フォーマットされたコンテンツは、ハイパ
ーテキスト・マークアップ言語(HTML)、拡張可能
マークアップ言語(XML)、標準汎用マークアップ言
語(SGML)、無線マークアップ言語(WML)、ハ
ンドヘルド・マークアップ言語(HDML)及び音声X
MLから成るグループから選択されたマークアップ言語
を使用してフォーマットされる、上記(14記載のシス
テム。 (18)前記フォーマットされたコンテンツは、ハイパ
ーテキスト・マークアップ言語(HTML)でフォーマ
ットされたコンテンツである、上記(14記載のシステ
ム。 (19)前記第2のマークアップ言語は、ハイパーテキ
スト・マークアップ言語(HTML)、拡張可能マーク
アップ言語(XML)、標準汎用マークアップ言語(S
GML)、無線マークアップ言語(WML)、ハンドヘ
ルド・マークアップ言語(HDML)及び音声XMLか
ら成るグループから選択される、上記(14記載のシス
テム。 (20)前記第2のマークアップ言語は、音声拡張可能
マークアップ言語(音声XML)である、上記(14)
に記載のシステム。 (21)前記第1及び第2のマークアップ言語は、異な
る形態のものである、上記(14)に記載のシステム。 (22)コンピュータによる実行可能な複数のコード・
セクションを有するコンピュータ・プログラムを記憶し
たコンピュータ可読記憶装置にして、フォーマットされ
たコンテンツを含む、指定されたドキュメントに対応す
るテンプレートを識別するステップと、前記指定された
ドキュメントに前記テンプレートを適用し、前記フォー
マットされたコンテンツからデータを抽出するステップ
と、異なるマークアップ言語を使用して前記データをフ
ォーマットし、第2のドキュメントを生成するステップ
と、をコンピュータに実行させる、コンピュータ可読記
憶装置。 (23)前記指定されたドキュメントが検索され得るネ
ットワーク・ロケーションを指定するコンテンツ・リク
エストを受けるステップと、前記ネットワーク・ロケー
ションから前記指定されたドキュメントを検索するステ
ップとを更にコンピュータに実行させる、上記(22)
に記載のコンピュータ可読記憶装置。 (24)ユーザ・インターフェースを通して前記第2の
ドキュメントを提示するステップを更にコンピュータに
実行させる、上記(22)に記載のコンピュータ可読記
憶装置 (25)前記ユーザ・インターフェースは、音声インタ
ーフェースである、上記(24)に記載のコンピュータ
可読記憶装置。 (26)前記データを抽出するステップは、前記指定さ
れたドキュメントにおける、前記テンプレート内のコン
テンツ・マーカによって指定されたオフセットから、前
記フォーマットされたコンテンツにおけるデータを読み
取るステップを含む、上記(22)に記載のコンピュー
タ可読記憶装置。 (27)前記コンテンツ・マーカからデータ識別子を読
み取るステップを更に含む、上記(26)に記載のコン
ピュータ可読記憶装置。 (28)前記フォーマットされたコンテンツは、ハイパ
ーテキスト・マークアップ言語(HTML)、拡張可能
マークアップ言語(XML)、標準汎用マークアップ言
語(SGML)、無線マークアップ言語(WML)、ハ
ンドヘルド・マークアップ言語(HDML)及び音声X
MLから成るグループから選択されたマークアップ言語
を使用してフォーマットされる、上記(22)に記載の
コンピュータ可読記憶装置。 (29)前記フォーマットされたコンテンツは、ハイパ
ーテキスト・マークアップ言語(HTML)でフォーマ
ットされたコンテンツである、上記(22)に記載のコ
ンピュータ可読記憶装置。 (30)前記異なるマークアップ言語は、ハイパーテキ
スト・マークアップ言語(HTML)、拡張可能マーク
アップ言語(XML)、標準汎用マークアップ言語(S
GML)、無線マークアップ言語(WML)、ハンドヘ
ルド・マークアップ言語(HDML)及び音声XMLか
ら成るグループから選択される、上記(21)に記載の
コンピュータ可読記憶装置。 (31)前記異なるマークアップ言語は、音声拡張可能
マークアップ言語(音声XML)である、上記(22)
に記載のコンピュータ可読記憶装置。 (32)前記第2のドキュメント及び前記指定されたド
キュメントは、異なる形態のものである、上記(22)
に記載のコンピュータ可読記憶装置。
【図面の簡単な説明】
【図1】本発明のシステムを利用する例示的なネットワ
ーク構成を示す。
【図2】あるマークアップ言語でフォーマットされたコ
ンテンツを別のマークアップ言語を使用して、フォーマ
ットされたコンテンツに変換するための例示的なシステ
ムを示す概略図である。
【図3】あるマークアップ言語でフォーマットされたコ
ンテンツを別のマークアップ言語を使用してフォーマッ
トされたコンテンツに変換するためのプロセスを示すフ
ロー・チャートである。
【符号の説明】
100 サーバ 110 CCシステム 120 クライアント 125 エンド・ユーザ 130 バッファ 140 テンプレート・テーブル 150 テンプレート 160 マークアップ言語アプリケーション
フロントページの続き (72)発明者 ドウェイン・デイメス アメリカ合衆国33435、フロリダ州、ボイ ントン・ビーチ、リアト・ドライブ 1160 (72)発明者 デービッド・イー・ライヒ アメリカ合衆国33458、フロリダ州、ジュ ピタ、インランド・コート 6684 (72)発明者 ジー・ウィ・タン アメリカ合衆国33407、フロリダ州、ウェ スト・パーム・ビーチ、ハリテージ・ウェ イ 138 (72)発明者 ファン・ワン アメリカ合衆国75063、テキサス州、アー ビング、ウェスト・バレー・ランチ・パー クウェイ・アパートメント#2017 9833 (72)発明者 レノーラ・イー・ライト アメリカ合衆国33407、フロリダ州、ウェ スト・パーム・ビーチ、ヒース・クリク ル・サウス 4300 Fターム(参考) 5B075 ND14 ND16 NK02 NR02 NR05 5B082 GA02 GA06

Claims (32)

    【特許請求の範囲】
  1. 【請求項1】フォーマットされたコンテンツを変換する
    ための方法にして、 前記フォーマットされたコンテンツを含む、指定された
    ドキュメントに対応するテンプレートを識別するステッ
    プと、 前記指定されたドキュメントに前記テンプレートを適用
    し、前記フォーマットされたコンテンツからデータを抽
    出するステップと、 異なるマークアップ言語を使用して前記データをフォー
    マットし、第2のドキュメントを生成するステップとを
    含む、方法。
  2. 【請求項2】抽出された前記データは未フォーマット・
    データである、請求項1に記載の方法。
  3. 【請求項3】前記指定されたドキュメントが検索され得
    るネットワーク・ロケーションを指定するコンテンツ・
    リクエストを受けるステップと、 前記ネットワーク・ロケーションから前記指定されたド
    キュメントを検索するステップとを更に含む、請求項1
    に記載の方法。
  4. 【請求項4】ユーザ・インターフェースを通して前記第
    2のドキュメントを提示するステップを更に含む、請求
    項1に記載の方法。
  5. 【請求項5】前記ユーザ・インターフェースは、音声イ
    ンターフェースである、請求項4に記載の方法。
  6. 【請求項6】前記データを抽出するステップは、前記指
    定されたドキュメントにおける、前記テンプレート内の
    コンテント・マーカによって指定されたオフセットか
    ら、前記フォーマットされたコンテンツにおけるデータ
    を読み取るステップを含む、請求項1に記載の方法。
  7. 【請求項7】前記コンテンツ・マーカからデータ識別子
    を読み取るステップを更に含む、請求項6に記載の方
    法。
  8. 【請求項8】前記フォーマットされたコンテンツは、ハ
    イパーテキスト・マークアップ言語(HTML)、拡張
    可能マークアップ言語(eXtensible Markup Language;
    XML)、標準汎用マークアップ言語(Standard Gener
    alized Markup Language;SGML)、無線マークアッ
    プ言語(Wireless Markup Language;WML)、ハンド
    ヘルド・マークアップ言語(Handheld Device Markup L
    anguage;HDML)及び音声XML(VoiceXML)から成
    るグループから選択されたマークアップ言語を使用して
    フォーマットされる、請求項1に記載の方法。
  9. 【請求項9】前記フォーマットされたコンテンツは、ハ
    イパーテキスト・マークアップ言語(HTML)でフォ
    ーマットされたコンテンツである、請求項1に記載の方
    法。
  10. 【請求項10】前記異なるマークアップ言語は、ハイパ
    ーテキスト・マークアップ言語(HTML)、拡張可能
    マークアップ言語(XML)、標準汎用マークアップ言
    語(SGML)、無線マークアップ言語(WML)、ハ
    ンドヘルド・マークアップ言語(HDML)及び音声X
    MLから成るグループから選択される、請求項1に記載
    の方法。
  11. 【請求項11】前記異なるマークアップ言語は、音声拡
    張可能マークアップ言語(音声XML)である、請求項
    1に記載の方法。
  12. 【請求項12】前記第2のドキュメント及び前記指定さ
    れたドキュメントは、異なる形態のものである、請求項
    1に記載の方法。
  13. 【請求項13】コンテンツ・コンバータを構成する方法
    にして、 フォーマットされたコンテンツを含む、少なくとも1つ
    の指定されたドキュメントにおける少なくとも1つのデ
    ータ・ロケーションを決定するステップと、 前記データ・ロケーションに対応する、1つ又は複数の
    コンテンツ・マーカを有する少なくとも1つのテンプレ
    ートを作成するステップと、 テンプレート・テーブルを使用して前記テンプレートを
    前記指定されたドキュメントにマップするステップとを
    含む、方法。
  14. 【請求項14】データを再フォーマットするためのシス
    テムにして、 第1のマークアップ言語でフォーマットされたドキュメ
    ントを受けるためのバッファと、 前記ドキュメントにおけるフォーマットされたコンテン
    ツからデータを抽出するための1つ又は複数のテンプレ
    ートであって、その各々が少なくとも1つのドキュメン
    トに対応するテンプレートと、 前記テンプレートを対応するドキュメントと関連付ける
    前記テンプレートのテーブルと、 第2のマークアップ言語を使用して前記データをフォー
    マットするためのフォーマッタと、 を含む、システム。
  15. 【請求項15】前記テンプレートは、前記フォーマット
    されたコンテンツにおけるデータを位置指定するための
    少なくとも1つのコンテンツ・マーカを有する、請求項
    14に記載のシステム。
  16. 【請求項16】前記コンテンツ・マーカは、前記フォー
    マットされたコンテンツにおけるデータを指定するため
    の識別子を有する、請求項15に記載のシステム。
  17. 【請求項17】前記フォーマットされたコンテンツは、
    ハイパーテキスト・マークアップ言語(HTML)、拡
    張可能マークアップ言語(XML)、標準汎用マークア
    ップ言語(SGML)、無線マークアップ言語(WM
    L)、ハンドヘルド・マークアップ言語(HDML)及
    び音声XMLから成るグループから選択されたマークア
    ップ言語を使用してフォーマットされる、請求項14記
    載のシステム。
  18. 【請求項18】前記フォーマットされたコンテンツは、
    ハイパーテキスト・マークアップ言語(HTML)でフ
    ォーマットされたコンテンツである、請求項14記載の
    システム。
  19. 【請求項19】前記第2のマークアップ言語は、ハイパ
    ーテキスト・マークアップ言語(HTML)、拡張可能
    マークアップ言語(XML)、標準汎用マークアップ言
    語(SGML)、無線マークアップ言語(WML)、ハ
    ンドヘルド・マークアップ言語(HDML)及び音声X
    MLから成るグループから選択される、請求項14記載
    のシステム。
  20. 【請求項20】前記第2のマークアップ言語は、音声拡
    張可能マークアップ言語(音声XML)である、請求項
    14に記載のシステム。
  21. 【請求項21】前記第1及び第2のマークアップ言語
    は、異なる形態のものである、請求項14に記載のシス
    テム。
  22. 【請求項22】コンピュータによる実行可能な複数のコ
    ード・セクションを有するコンピュータ・プログラムを
    記憶したコンピュータ可読記憶装置にして、 フォーマットされたコンテンツを含む、指定されたドキ
    ュメントに対応するテンプレートを識別するステップ
    と、 前記指定されたドキュメントに前記テンプレートを適用
    し、前記フォーマットされたコンテンツからデータを抽
    出するステップと、 異なるマークアップ言語を使用して前記データをフォー
    マットし、第2のドキュメントを生成するステップと、 をコンピュータに実行させる、コンピュータ可読記憶装
    置。
  23. 【請求項23】前記指定されたドキュメントが検索され
    得るネットワーク・ロケーションを指定するコンテンツ
    ・リクエストを受けるステップと、 前記ネットワーク・ロケーションから前記指定されたド
    キュメントを検索するステップとを更にコンピュータに
    実行させる、請求項22に記載のコンピュータ可読記憶
    装置。
  24. 【請求項24】ユーザ・インターフェースを通して前記
    第2のドキュメントを提示するステップを更にコンピュ
    ータに実行させる、請求項22に記載のコンピュータ可
    読記憶装置
  25. 【請求項25】前記ユーザ・インターフェースは、音声
    インターフェースである、請求項24に記載のコンピュ
    ータ可読記憶装置。
  26. 【請求項26】前記データを抽出するステップは、前記
    指定されたドキュメントにおける、前記テンプレート内
    のコンテンツ・マーカによって指定されたオフセットか
    ら、前記フォーマットされたコンテンツにおけるデータ
    を読み取るステップを含む、請求項22に記載のコンピ
    ュータ可読記憶装置。
  27. 【請求項27】前記コンテンツ・マーカからデータ識別
    子を読み取るステップを更に含む、請求項26に記載の
    コンピュータ可読記憶装置。
  28. 【請求項28】前記フォーマットされたコンテンツは、
    ハイパーテキスト・マークアップ言語(HTML)、拡
    張可能マークアップ言語(XML)、標準汎用マークア
    ップ言語(SGML)、無線マークアップ言語(WM
    L)、ハンドヘルド・マークアップ言語(HDML)及
    び音声XMLから成るグループから選択されたマークア
    ップ言語を使用してフォーマットされる、請求項22に
    記載のコンピュータ可読記憶装置。
  29. 【請求項29】前記フォーマットされたコンテンツは、
    ハイパーテキスト・マークアップ言語(HTML)でフ
    ォーマットされたコンテンツである、請求項22に記載
    のコンピュータ可読記憶装置。
  30. 【請求項30】前記異なるマークアップ言語は、ハイパ
    ーテキスト・マークアップ言語(HTML)、拡張可能
    マークアップ言語(XML)、標準汎用マークアップ言
    語(SGML)、無線マークアップ言語(WML)、ハ
    ンドヘルド・マークアップ言語(HDML)及び音声X
    MLから成るグループから選択される、請求項21に記
    載のコンピュータ可読記憶装置。
  31. 【請求項31】前記異なるマークアップ言語は、音声拡
    張可能マークアップ言語(音声XML)である、請求項
    22に記載のコンピュータ可読記憶装置。
  32. 【請求項32】前記第2のドキュメント及び前記指定さ
    れたドキュメントは、異なる形態のものである、請求項
    22に記載のコンピュータ可読記憶装置。
JP2002058569A 2001-03-06 2002-03-05 マークアップ言語でフォーマットされたコンテンツを再設定するための方法、システム、及び装置 Pending JP2002351735A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/800330 2001-03-06
US09/800,330 US7546527B2 (en) 2001-03-06 2001-03-06 Method and apparatus for repurposing formatted content

Publications (1)

Publication Number Publication Date
JP2002351735A true JP2002351735A (ja) 2002-12-06

Family

ID=25178124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002058569A Pending JP2002351735A (ja) 2001-03-06 2002-03-05 マークアップ言語でフォーマットされたコンテンツを再設定するための方法、システム、及び装置

Country Status (2)

Country Link
US (2) US7546527B2 (ja)
JP (1) JP2002351735A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005190366A (ja) * 2003-12-26 2005-07-14 Fuji Xerox Co Ltd サービス処理装置、サービス処理システム、及び入力端末
JP2005339566A (ja) * 2004-05-28 2005-12-08 Microsoft Corp コンテンツを開始テンプレートとターゲットテンプレートとの間でマップするための方法およびシステム
KR100965820B1 (ko) * 2007-01-19 2010-06-24 삼성전자주식회사 데이터 출력을 위한 장치 및 데이터 출력 방법

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7653748B2 (en) * 2000-08-10 2010-01-26 Simplexity, Llc Systems, methods and computer program products for integrating advertising within web content
US20030028643A1 (en) * 2001-03-13 2003-02-06 Dilithium Networks, Inc. Method and apparatus for transcoding video and speech signals
WO2002082325A2 (en) * 2001-04-09 2002-10-17 Xmlcities, Inc. Method and apparatus for aggregating and dispatching information in distributed systems
US6886046B2 (en) * 2001-06-26 2005-04-26 Citrix Systems, Inc. Methods and apparatus for extendible information aggregation and presentation
US20030105880A1 (en) * 2001-12-04 2003-06-05 Koninklijke Philips Electronics N.V. Distributed processing, storage, and transmision of multimedia information
US20030125953A1 (en) * 2001-12-28 2003-07-03 Dipanshu Sharma Information retrieval system including voice browser and data conversion server
US20030145062A1 (en) * 2002-01-14 2003-07-31 Dipanshu Sharma Data conversion server for voice browsing system
WO2003063137A1 (en) * 2002-01-22 2003-07-31 V-Enable, Inc. Multi-modal information delivery system
US6928617B2 (en) * 2002-04-11 2005-08-09 International Business Machines Corporation Segmentation of views for simplified navigation on limited device
US20040034532A1 (en) * 2002-08-16 2004-02-19 Sugata Mukhopadhyay Filter architecture for rapid enablement of voice access to data repositories
US7747941B2 (en) * 2002-12-18 2010-06-29 International Business Machines Corporation Webpage generation tool and method
US7356600B2 (en) * 2002-12-20 2008-04-08 Sap Ag Enabling access to an application through a network portal
US20050091224A1 (en) * 2003-10-22 2005-04-28 Fisher James A. Collaborative web based development interface
US8683318B1 (en) * 2004-07-14 2014-03-25 American Express Travel Related Services Company, Inc. Methods and apparatus for processing markup language documents
WO2006092993A1 (ja) * 2005-02-28 2006-09-08 Matsushita Electric Industrial Co., Ltd. 字幕表示装置
US7933897B2 (en) 2005-10-12 2011-04-26 Google Inc. Entity display priority in a distributed geographic information system
US8150960B2 (en) * 2005-11-23 2012-04-03 Microsoft Corporation Event forwarding
US7933986B2 (en) * 2006-02-16 2011-04-26 Microsoft Corporation Transferring command-lines as a message
US7933964B2 (en) 2006-02-16 2011-04-26 Microsoft Corporation Shell sessions
US7616217B2 (en) * 2006-04-26 2009-11-10 Google Inc. Dynamic exploration of electronic maps
US8887040B2 (en) * 2006-08-10 2014-11-11 Qualcomm Incorporated System and method for media content delivery
US7881932B2 (en) * 2006-10-02 2011-02-01 Nuance Communications, Inc. VoiceXML language extension for natively supporting voice enrolled grammars
US8762854B2 (en) * 2007-11-07 2014-06-24 Cabot Communications Limited Systems and methods for itemising web pages for display on a screen
US20100161384A1 (en) * 2008-12-18 2010-06-24 Wells Matthew D System and Method for Presenting Content
US8176412B2 (en) * 2009-08-25 2012-05-08 International Business Machines Corporation Generating formatted documents
US20110078243A1 (en) * 2009-09-30 2011-03-31 Boopsie, Inc. Leveraging Collaborative Cloud Services to Build and Share Apps
US8286077B2 (en) * 2009-12-03 2012-10-09 Microsoft Corporation Remote batch editing of formatted text via an HTML editor
US8850306B2 (en) 2011-03-28 2014-09-30 Microsoft Corporation Techniques to create structured document templates using enhanced content controls
US9875486B2 (en) 2014-10-21 2018-01-23 Slice Technologies, Inc. Extracting product purchase information from electronic messages
US8844010B2 (en) 2011-07-19 2014-09-23 Project Slice Aggregation of emailed product order and shipping information
US9563904B2 (en) 2014-10-21 2017-02-07 Slice Technologies, Inc. Extracting product purchase information from electronic messages
US9846902B2 (en) * 2011-07-19 2017-12-19 Slice Technologies, Inc. Augmented aggregation of emailed product order and shipping information
US10049095B2 (en) * 2013-01-29 2018-08-14 Adobe Systems Incorporated In-context editing of output presentations via automatic pattern detection
US20140280254A1 (en) * 2013-03-15 2014-09-18 Feichtner Data Group, Inc. Data Acquisition System
US20140297285A1 (en) * 2013-03-28 2014-10-02 Tencent Technology (Shenzhen) Company Limited Automatic page content reading-aloud method and device thereof
US10650019B2 (en) * 2014-03-06 2020-05-12 International Business Machines Corporation Managing data conversion for user-defined data types within a database management system
CN104050281A (zh) * 2014-06-26 2014-09-17 北京思特奇信息技术股份有限公司 一种基于http协议的网页信息提取方法及装置
EP3380949B1 (en) 2015-11-25 2021-10-20 Microsoft Technology Licensing, LLC Automatic spoken dialogue script discovery
US10140105B2 (en) * 2016-03-10 2018-11-27 Wowza Media Systems, LLC Converting source code
US10447635B2 (en) 2017-05-17 2019-10-15 Slice Technologies, Inc. Filtering electronic messages
US11803883B2 (en) 2018-01-29 2023-10-31 Nielsen Consumer Llc Quality assurance for labeled training data
US11049042B2 (en) 2018-11-05 2021-06-29 Convr Inc. Systems and methods for extracting specific data from documents using machine learning
US11270213B2 (en) 2018-11-05 2022-03-08 Convr Inc. Systems and methods for extracting specific data from documents using machine learning

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01205260A (ja) * 1988-02-12 1989-08-17 Toshiba Corp 文書整形装置
US6442523B1 (en) * 1994-07-22 2002-08-27 Steven H. Siegel Method for the auditory navigation of text
US5860073A (en) * 1995-07-17 1999-01-12 Microsoft Corporation Style sheets for publishing system
JP2000500887A (ja) * 1995-09-25 2000-01-25 アドビ システムズ インコーポレイテッド 電子文書への最適アクセス
JPH09160917A (ja) 1995-12-06 1997-06-20 Dainippon Screen Mfg Co Ltd タグ付き文書作成装置及びその方法
US6055522A (en) * 1996-01-29 2000-04-25 Futuretense, Inc. Automatic page converter for dynamic content distributed publishing system
US6085186A (en) * 1996-09-20 2000-07-04 Netbot, Inc. Method and system using information written in a wrapper description language to execute query on a network
US5911776A (en) * 1996-12-18 1999-06-15 Unisys Corporation Automatic format conversion system and publishing methodology for multi-user network
US6421733B1 (en) * 1997-03-25 2002-07-16 Intel Corporation System for dynamically transcoding data transmitted between computers
US6353840B2 (en) * 1997-08-15 2002-03-05 Ricoh Company, Ltd. User-defined search template for extracting information from documents
AUPO904597A0 (en) * 1997-09-08 1997-10-02 Canon Information Systems Research Australia Pty Ltd Method for non-linear document conversion and printing
JPH11143910A (ja) 1997-11-11 1999-05-28 Nec Corp 複合オブジェクト展開方式及びコンピュータ読み取り可能な記録媒体
US6658626B1 (en) * 1998-07-31 2003-12-02 The Regents Of The University Of California User interface for displaying document comparison information
US6286043B1 (en) * 1998-08-26 2001-09-04 International Business Machines Corp. User profile management in the presence of dynamic pages using content templates
FI19992746A (fi) 1998-12-28 2000-06-28 Spyglass Inc Menetelmä ja järjestelmä elektronisen datasisällön muuntamiseksi langattomille laitteille
JP3942760B2 (ja) 1999-02-03 2007-07-11 富士通株式会社 情報収集装置
US6477565B1 (en) * 1999-06-01 2002-11-05 Yodlee.Com, Inc. Method and apparatus for restructuring of personalized data for transmission from a data network to connected and portable network appliances
US6732102B1 (en) * 1999-11-18 2004-05-04 Instaknow.Com Inc. Automated data extraction and reformatting
US20020054090A1 (en) * 2000-09-01 2002-05-09 Silva Juliana Freire Method and apparatus for creating and providing personalized access to web content and services from terminals having diverse capabilities
US20020107881A1 (en) * 2001-02-02 2002-08-08 Patel Ketan C. Markup language encapsulation
US20020116421A1 (en) * 2001-02-17 2002-08-22 Fox Harold L. Method and system for page-like display, formating and processing of computer generated information on networked computers

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005190366A (ja) * 2003-12-26 2005-07-14 Fuji Xerox Co Ltd サービス処理装置、サービス処理システム、及び入力端末
JP2005339566A (ja) * 2004-05-28 2005-12-08 Microsoft Corp コンテンツを開始テンプレートとターゲットテンプレートとの間でマップするための方法およびシステム
KR100965820B1 (ko) * 2007-01-19 2010-06-24 삼성전자주식회사 데이터 출력을 위한 장치 및 데이터 출력 방법

Also Published As

Publication number Publication date
US20020129067A1 (en) 2002-09-12
US20080313532A1 (en) 2008-12-18
US8055999B2 (en) 2011-11-08
US7546527B2 (en) 2009-06-09

Similar Documents

Publication Publication Date Title
JP2002351735A (ja) マークアップ言語でフォーマットされたコンテンツを再設定するための方法、システム、及び装置
US20080133215A1 (en) Method and system of interpreting and presenting web content using a voice browser
US20030100320A1 (en) Efficient hyperlinks for transmitted hyperlinked information
US7970874B2 (en) Targeted web page redirection
US7949681B2 (en) Aggregating content of disparate data types from disparate data sources for single point access
US20070192674A1 (en) Publishing content through RSS feeds
US20020188435A1 (en) Interface for submitting richly-formatted documents for remote processing
WO2004040481A1 (en) A system and method for providing and displaying information content
CN106547511A (zh) 一种语音播读网页信息的方法、浏览器客户端及服务器
US7149969B1 (en) Method and apparatus for content transformation for rendering data into a presentation format
US9384292B2 (en) Map service
KR20020031691A (ko) 실시간 인터넷 콘텐츠 변환 방법 및 시스템
US20030149745A1 (en) Method and apparatus for accessing information from a network data source
US20010056497A1 (en) Apparatus and method of providing instant information service for various devices
EP1384165A2 (en) Customization of output content based on device type
WO2001035235A1 (en) System and method for accessing web content using limited display devices
KR20020015198A (ko) 인터넷을 이용한 증권 정보 및/또는 뉴스의 실시간 문자및/또는 음성 서비스 방법 및 시스템
US11188706B2 (en) System and method for regionalized resolution of a network path
US20190220543A1 (en) System and method for global resolution of a network path
KR100827023B1 (ko) Rss 피드의 음성 서비스 시스템과 그 서비스 방법 및 이를 기록한 기록매체
KR20040082816A (ko) 무선 네트워크 상의 다국어 지원 방법 및 시스템
KR101450907B1 (ko) 마크업 페이지 전송 속도를 향상시킨 웹 뷰어 서버 및 그 제어방법
AU778744B2 (en) Telephone contact search software
TW200301430A (en) Information retrieval system including voice browser and data conversion server
CN106503221A (zh) 一种数据分析处理方法及装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060112

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060112

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20060112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060112

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060502

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060502

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060706

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20081024

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20081024