JP2004510253A - 能力が限られたデバイス上で用いるための電子文書の区分処理 - Google Patents

能力が限られたデバイス上で用いるための電子文書の区分処理 Download PDF

Info

Publication number
JP2004510253A
JP2004510253A JP2002531030A JP2002531030A JP2004510253A JP 2004510253 A JP2004510253 A JP 2004510253A JP 2002531030 A JP2002531030 A JP 2002531030A JP 2002531030 A JP2002531030 A JP 2002531030A JP 2004510253 A JP2004510253 A JP 2004510253A
Authority
JP
Japan
Prior art keywords
sub
document
documents
client
client device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002531030A
Other languages
English (en)
Other versions
JP2004510253A5 (ja
Inventor
ロメロ,リチャード・ディー
バーガー,アダム・エル
Original Assignee
エイゼル・テクノロジーズ・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/745,289 external-priority patent/US7613810B2/en
Priority claimed from US09/745,290 external-priority patent/US7210100B2/en
Application filed by エイゼル・テクノロジーズ・インコーポレーテッド filed Critical エイゼル・テクノロジーズ・インコーポレーテッド
Publication of JP2004510253A publication Critical patent/JP2004510253A/ja
Publication of JP2004510253A5 publication Critical patent/JP2004510253A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/142Managing session states for stateless protocols; Signalling session states; State transitions; Keeping-state mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/04Protocols specially adapted for terminals or networks with limited capabilities; specially adapted for terminal portability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/303Terminal profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content
    • H04L67/5651Reducing the amount or size of exchanged application data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/329Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control
    • H04W28/06Optimizing the usage of the radio link, e.g. header compression, information sizing, discarding information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/16Central resource management; Negotiation of resources or communication parameters, e.g. negotiating bandwidth or QoS [Quality of Service]
    • H04W28/18Negotiating wireless communication parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

クライアント・デバイス(10)上での表示のために、クライアント(10)に提供される文書(12)を含む機械読み取り可能ファイルを受信し、ファイルにおける文書(12)の各々の編成は、情報の階層として表現されており、情報の階層からサブ文書(1)を導出することを含む方法。サブ文書(1)の各々は、ハイパーテキスト送信プロトコルを用いてそれをクライアントに別個に提供可能とするフォーマットで表現されており、サブ文書(1)の少なくとも1つは、それをサブ文書(1)の別の1つにリンクすることを可能にする情報を含む。

Description

【0001】
この特許出願は、2000年10月10日に出願された米国仮特許出願第60/238,424号、および2000年9月27日に出願された第60/235,551号の出願日の利益を有する。その内容は、この言及により本願にも含まれるものとする。
(背景)
本発明は、電子文書の区分処理、変形、および視認に関する。
【0002】
人がウェブ・ページ、テキスト・ファイル、電子メール、および企業(私有会社)のデータにアクセスする際、多くの場合用いるデスクトップ・コンピュータは、そのディスプレイ画面が対角線方向で10インチよりも大きく、少なくとも28.8kbpsの通信レートを有するインターネットへの接続を用いる。通例では、電子文書はこのようなデバイスに送信し、その上でレンダリングするように設計されている。
【0003】
移動電話、手持ちデバイス(PDA)、ページャ、セット・トップ・ボックス、およびダッシュボードに取り付けたマイクロブラウザのような、インターネットが可能なデバイスは、多くの場合、画面サイズが小さめで(例えば、対角線方向で2または3インチ程度)、ワイヤレス・ネットワーク上での通信レートが比較的低く、メモリも少ない。これらのデバイスの一部は、文書のサイズが一定の限度を超えると、そのいずれの部分もレンダリングすることができなくなり、一方別のデバイスでは、規定の長さの後文書を切り捨ててしまう場合もある。電子文書(多くの場合、テキストの多くの節、複雑な画像、およびリッチ・メディア・コンテンツ(rich media content)をも含む)にアクセスすることは、これらのデバイスを用いた場合、扱い難かったり、あるいは不可能なこともあり得る。
【0004】
自動コンテンツ変換システムは、元々は大型画面のデバイスに送信しその上でレンダリングするように設計された電子文書を、移動電話のような、ディスプレイが小さく能力が劣るデバイスに送信しその上でレンダリングするように変換する。例えば、Wei−Ying Ma, Ilja Bedner, Grace Chang, Allan KuchinskyおよびHongJiang ZhangのA Framework for Adaptive Content Delivery in Heretogeneous Network Environments(異質ネットワーク環境における適応的コンテンツ配信のための枠組み) of SPIE Multimedia Computing and Networking 2000. San Jose, CA, 2000年1月を参照のこと。
(摘要)
一般に、一形態では、本発明は、クライアントに提供しクライアント・デバイス上に表示するための文書を含む機械読み取り可能ファイルを受信するステップであって、ファイル内の文書の各々の編成が情報の階層で表現されている、ステップと、情報の階層からサブ文書を導出するステップであって、サブ文書の各々を、ハイパーテキスト送信プロトコルを用いてクライアントに別個に提供することを可能にするフォーマットで表現し、サブ文書の少なくとも1つが、当該サブ文書をサブ文書の別の1つにリンクすることを可能にする情報を含む、ステップとを含む方法を特徴とする。
【0005】
本発明の実現例は、1つ以上の以下の特徴を含むことができる。前述の言語は拡張可能マークアップ言語(XML)である。前述の導出するステップは、階層を調べ、セグメントからサブ文書を組み立てることから成り、サブ文書の少なくとも一部が、各々、1つよりも多いセグメントから組み立てられる。この組み立ては、サブ文書のそれぞれのサイズのバランスを取るように作用するアルゴリズム、または階層において共通の親を有するセグメントから、サブ文書の各々を組み立てることを優先するように作用するアルゴリズム、または階層におけるノードの複製を必要としないセグメントから、サブ文書の各々を組み立てることを優先するように作用するアルゴリズムに従う。前述のファイルは、当該ファイルに関連する原始サーバから受信する。前述のファイルは、文書のセグメントを階層状に編成しない言語で表現され、サブ文書を導出するステップは、最初に、文書のセグメントを階層状に編成する言語にファイルを変換することを含む。クライアントによる要求に応じて、サブ文書を個別にクライアントに提供する。ハイパーテキスト送信プロトコルを用いてサブ文書をクライアントに提供する。クライアントは、サブ文書の別のものにリンクすることを当該クライアントに可能にする情報の内容に基づいて、サブ文書を要求する。
【0006】
文書の一部を識別し、文書の残りからは分離して表示する。この一部が現れるはずのサブ文書をクライアント・デバイスに提供する場合、グラフィカル・デバイスを埋め込み、これをユーザが起動すると、別個に表示すべき文書の一部を含むサブ文書を検索することができる。
【0007】
一般に、別の形態では、本発明は、クライアントに提供するために記憶媒体上に保持された機械読み取り可能文書であって、この文書が1組のサブ文書として編成されており、サブ文書の各々が、当該サブ文書をサブ文書の別のものにリンクすることを可能にする情報を含み、サブ文書の各々が、文書の階層的表現の一部である、文書のセグメントの集合体であり、サブ文書がほぼ同じサイズである、機械読み取り可能文書を特徴とする。本発明の実現例は、1つ以上の以下の特徴を含むことができる。サブ文書をリンクすることを可能にする情報は、URLを含む。階層的表現は、拡張可能マークアップ言語(XML)を含む。
【0008】
一般に、別の形態では、本発明は、クライアントから、クライアント・デバイス上に表示する文書の要求を受信するステップと、要求文書の全て未満を表すサブ文書を別個にクライアントに提供するステップであって、各サブ文書がそれを少なくとも1つの別のサブ文書にリンクする情報を含む、ステップと、クライアントから、他のサブ文書へのリンクの呼び出しを受信するステップと、クライアント・デバイスに別のサブ文書を別個に提供するステップとを特徴とする。
【0009】
本発明の実現例は、1つ以上の以下の特徴を含むことができる。ハイパーテキスト送信プロトコルを用いてサブ文書をクライアントに提供する。サブ文書は、本質的に同じ長さである。サブ文書は、クライアント・デバイス上において、更に切り捨てることなく、表示可能な長さを有する。
【0010】
一般に、別の形態では、本発明は、クライアント・デバイスにおいて、クライアント・デバイス上に表示するために、大きな文書のサブ文書をサーバから受信するステップと、サブ文書をクライアント・デバイス上に表示するステップと、クライアント・デバイスにおいて、大きな文書の別のサブ文書を表示させるユーザの要求を受信するステップと、サーバから、別のサブ文書をクライアント・デバイスにおいて別個に受信するステップと、別の文書をクライアント・デバイス上に表示するステップとを含み、サブ文書が実質的に同じ長さである方法を特徴とする。
【0011】
本発明の実現例は、1つ以上の以下の特徴を含むことができる。各サブ文書の全てをクライアント・デバイス上で一度に表示するか、あるいは各サブ文書の全て未満をクライアント・デバイス上で一度に表示する。一般に、別の形態では、本発明は、クライアント・デバイス上で文書のサブ文書を表示するステップと、サブ文書と共にアイコンを表示するステップと、アイコンの起動に応答して、サーバから文書の別のサブ文書を取り込み、該別のサブ文書をクライアント・デバイス上に表示するステップとを含み、サブ文書の各々が文書全体未満であり、サブ文書がほぼ同じサイズである方法を特徴とする。
【0012】
本発明の実現例は、1つ以上の以下の特徴を含むことができる。文書を構成する一連のサブ文書において、現在表示されているサブ文書の位置の指標を与える。この指標は、一連におけるサブ文書の総数と、一連における現在表示中の文書の位置とを含む。クライアント・デバイスからの文書の要求時において、文書からサブ文書を導出する。クライアント・デバイスの特性に基づいた方法で、サブ文書を導出する。クライアント・デバイスの特性は、クライアントが要求と共に提供する。この特性は、クライアント・デバイスの表示能力、およびクライアント・デバイスのメモリ制約を含む。クライアントがサーバからの文書を要求する前に、文書からサブ文書を導出する。異なる原始サーバからの異なる文書について、サブ文書を導出する。ワイヤレス通信ゲートウェイにおいて文書からサブ文書を導出する。
【0013】
一般に、別の形態では、本発明は、クライアント・デバイス上での表示のためにクライアントに提供する文書を含む機械読み取り可能ファイルを受信し、ファイルからサブ文書を導出するように構成されたネットワーク・サーバを備え、サブ文書の各々が、ハイパーテキスト送信プロトコルを用いてクライアントに別個に供給可能にするフォーマットで表現されており、サブ文書の少なくとも1つは、それをサブ文書の別の1つにリンクすることを可能にする情報を含む、装置を特徴とする。
【0014】
一般に、別の形態では、本発明は、クライアント・デバイス上での表示のためにクライアントに提供する文書を含む機械読み取り可能ファイルを受信する手段と、ファイルからサブ文書を導出する手段であって、サブ文書の各々が、ハイパーテキスト送信プロトコルを用いてクライアントに別個に供給可能にするフォーマットで表現されており、サブ文書の少なくとも1つは、それをサブ文書の別の1つにリンクすることを可能にする情報を含む、手段とを備えている装置を特徴とする。
【0015】
一般に、別の形態では、本発明は、機械読み取り可能媒体上に格納され、クライアント・デバイス上での表示のためにクライアントに提供する文書を含む機械読み取り可能ファイルを受信し、ファイルからサブ文書を導出し、サブ文書の各々が、ハイパーテキスト送信プロトコルを用いてクライアントに別個に供給可能にするフォーマットで表現されており、サブ文書の少なくとも1つが、当該1つをサブ文書の別の1つにリンクすることを可能にする情報を含むように機械を構成可能な機械読み取り可能プログラムを特徴とする。
【0016】
その他の利点および特徴は、以下の説明および特許請求の範囲から明らかとなろう。
(説明)
本発明の種々の実現例では、電子文書を区分し変換した後に、低帯域幅通信チャネルを通じて提供し、小型ディスプレイおよび/または小容量メモリを有するユーザ・デバイス上で視認する。最初に区分機構について論じ、次いで変換機構について論ずる。
(区分化)
図1に示すように、高いレベルにおいて、インターネットが可能なデバイス10(例えば、WAPが可能な移動電話)のユーザが電子文書12(例えば、ウェブ・ページ、電子メール、テキスト・ファイル、あるいは固有フォーマットまたはマークアップ言語の文書)を要求すると、URLで表現されたユーザの要求が最終的にプロキシ・サーバ14に至る。すると、プロキシ・サーバはそのURLを用いて原始サーバ(origin server)16から文書を要求する。原始サーバとは、文書を担当するインターネット上のコンピュータである。ウェブ・ページの形態で原始サーバから文書を受信した後、プロキシ・サーバは文書をサブ文書に分解(区分化)する。プロキシ・サーバは、これらサブ文書1の最初のものをウェブ・ページとしてクライアントに送信する。文書の区分化は、プロキシ・サーバ内で行う必要はなく、ネットワーク内の別の場所で行うこともできる。これについては、以下で説明する。
【0017】
図2に示すように、プロキシ・サーバからクライアントに配信されたサブ文書20の各々は、一連の中の次および前のサブ文書(各々、適用可能な場合)へのハイパーリンク22、24を含む。ハイパーリンクは、ユーザに表示される。ユーザがあるサブ文書から前方指示(または後方指示)ハイパーリンクを選択すると、この要求はプロキシ・サーバに送信され、プロキシ・サーバはこれに応答して、次の(または前の)サブ文書を送る。
【0018】
図3に示すように、区分プロセスの最初のステップは、クライアント・デバイスに許される最大文書サイズを決定する(30)ことである。クライアント−サーバ通信が、RFC2616(R. Fielding et al., RFC2616: Hypertext Transfer Protocol − HTTP/1.1, 1999年6月。**http: // www.w3.org / Protocols / rfc2616 / rfc2616. txt**)に記載されているHTTPプロトコル規格に準拠する場合、クライアントは、HTTP要求の中で送られるヘッダ情報内で、それ自体に関する情報をプロキシ・サーバに知らせる。サーバは、例えば、USER−AGENTフィールドの値を用いて、クライアント・デバイス上にインストールされているマイクロブラウザの種類を判定することができ、この情報から、公知のあらゆるデバイスの最大文書サイズを纏めた表を参照することによって、最大文書サイズを判定することができる。
【0019】
元の文書の長さをNで示すことにする。長さは、文書のサイズ(マークアップを含む)によって、バイト単位で計測することができる。クライアントが許す文書の最大許容長をMで示すことにする。クライアントが指定する最大長Mを基準とする区分アルゴリズムは、いずれも、長さNの文書から少なくとも最大個数(N/M)への区分を行わなければならない。
【0020】
区分プロセスの次のステップは、入力文書をXMLに変換する(32)ことである。XMLとはマークアップ言語であり、そのタグが文書上の階層ツリー構造を暗示する。このようなツリー構造の一例を図4に示す。HTMLを含む多くの異なるソース・フォーマットからXMLへの変換は、既存のソフトウエア・パッケージを用いることによって行うことができる。
【0021】
図4に示すように、第3ステップは、XMLツリー40をセグメントに分割する(34)手順を適用することである。各セグメントの長さはM以下である。ツリーのリーフ(leaf)42は、元の文書−テキスト・ブロック、画像などのエレメントを表す。ツリーの内部ノード44は、構造およびマークアップ情報−説を示すマーカ、テーブル、ハイパーリンク・テキスト、太字テキストの領域などを表す。区分タスクを遂行する1つの方策は、塊状ボトム−アップ・リーフ−クラスタリング・アルゴリズムを用いることである。リーフ・クラスタリング手法は、開始すると、それ自体のセグメント(図4に示す)内に各リーフを置き、次いで融合すべき隣接するセグメント対が存在しなくなるまで、繰り返しセグメントを融合する。図5は、2回の融合を行った後の同じツリーを示し、融合したセグメント50、52が残っている。
【0022】
融合動作を行う毎に、セグメント数が減って、新たに修正されたツリーが得られる。各ステップは、全ての隣接するセグメント対を考慮し、候補融合に対して規定したスコア関数に応じて最適である対を融合する。スコア関数の一例について以下で説明する。このアルゴリズムが終了すると、最終的なセグメントは、元のXMLツリーの区分を表す。
(スコア関数)
スコア関数の一例では、スコアが低い程、一層望ましい融合を表す。(この文脈では、融合の「スコア」を融合を行うコストと考えることができる。)この例では、セグメントxおよびyを融合するスコアを、次の量に関係付ける。
1.セグメントのサイズ:スコア関数は、大きなセグメントよりも、小さいセグメントを融合することを当然優先する。|x|がセグメントx内のバイト数を示すとする。全てが等しいとすると、|x|=100、|y|=150、および|z|=25の場合、優れたスコア関数ではスコア(x,y)<スコア(y,z)<スコア(x,y)となる。この判断基準の効果は、実際には、得られるセグメントのサイズのバランスを取ることである。
2.セグメントの系統的近接度:全てが等しいとすると、セグメントxおよびyが共通の親zを有する場合、これらは、祖父(または更に遠い祖先)ノードのみを通じて関係する場合よりも、望ましい融合を構成する。離れた祖先のみを通じた2つのセグメントの関係は、これらのセグメントを一緒にすることの論拠としては、近い祖先を通じた関係よりも説得力が乏しい。
3.融合が必要とするノードの複製:セグメントを、明確に形成した文書に変換する場合、内部ノードを複製しなければならない場合がある。勿論、元の文書のサブ文書に区分化する際、得られるサブ文書における冗長性を極力少なくする。
【0023】
d(x,y)は、セグメントxからセグメントyまでツリーを移動する場合に通過しなければならない最少数のノードを示し、r(x,y)は、セグメントxおよびyを融合することによって必要となるノード複製の数を示す。すると、一般的な候補スコア関数は、
【0024】
【数1】
Figure 2004510253
となり、ここで、A,BおよびCは、ユーザが設定可能な関数(例えば、実係数)である。
【0025】
例えば、
Figure 2004510253
1.Dにおける各リーフにそれ自体のセグメントを割り当てる。
【0026】
2.スコア(x,x)によって、Dにおけるあらゆる隣接セグメント対x,xのスコアを付ける。
【0027】
3.x、yを、スコア(x,y)が最少となるセグメント対とする。
【0028】
4.xおよびyを融合してサイズがMよりも大きいセグメントが生じた場合、終了する。
【0029】
5.セグメントxおよびyを融合する。
【0030】
6.ステップ1に進む。
【0031】
候補セグメント融合にスコアを付けるには、別の方策も使用可能である。
【0032】
ここに記載したアルゴリズムは、いかに区分化するか決定する際に、文書の実際の語彙内容(lexical content)を考慮していない。他の例では、各セグメント内に含まれる単語のアイデンティティを考慮し、分断(break)が情報を流れを壊さないと思われる場所を優先する。これを遂行するには、システムは、融合を考慮している2つのセグメントに含まれる単語を検査し、これらが同じトピックに関連するか否か判定を行わなければならない。このような「テキスト区分化」問題は、例えば、M. Hearst, TextTiling: Segmenting text into multi−paragraph subtopic passage(テキストの多節副論題句への区分化) Computational Linguistics 23(1) 33−65, 1997に記載されているような、自動コンピュータ・プログラムによって対処する。TextTilingは、テキスト・ソース内にデバイダを置く最適な場所を求めるように設計されたアルゴリズムである。
【0033】
図3を参照すると、次のステップは、最終ツリーのセグメントを、個々の明確に形成されたXML文書に変換する(36)ことである。これを行うには、ノードの複製が必要となる場合がある。例えば、図5では、リーフBおよびFを融合すると、子孫FおよびGを分離する効果がある。これが意味するのは、右側のツリーの第1および第2セグメントを明確に形成された文書に変換する場合、各文書はノードCのインスタンスを含まなければならないということである。言い換えると、ノードCは、1組のその結果として生じるサブ文書において複製される。ノードFおよびGが共通の親によってではなく、共通の祖父によって関係付けられている場合、複製の欠点は一層重大となる。何故なら、その場合、親ノードおよび祖父ノードの双方を双方のセグメントにおいて複製しなければならないからである。
【0034】
ソース文書に対して区分化を計算した後、プロキシ・サーバは個々のサブ文書をキャッシュまたはデータベースに格納し(38)、ユーザとの今後の相互作用を促進する。ユーザが第1サブ文書上のハイパーリンクにしたがって、シーケンス内の次のサブ文書にアクセスした場合、この要求はプロキシ・サーバに転送され、プロキシ・サーバはこれに応答して(39)、現在そのキャッシュに格納されている適切なサブ文書を送る。プロキシ・サーバが、多くの異なるクライアントからの要求を処理する役割を担っている場合、プロキシ・サーバはクライアント毎に状態を維持し(41)、クライアントが考察している文書はどれか追跡し、そして当該文書を構成するサブ文書を追跡する。以前と同様、プロキシ・サーバは、HTTPヘッダ情報を用い、このときは、クライアント・デバイスの一意の識別(例えば、IPアドレス、または移動電話の場合には電話番号)を判定し、このコードをその内部データベースにおけるキーとして用いる。データベースは、状態を各ユーザと関連付ける。このようなデータベースからのサンプル抜粋は以下のようになる。
【0035】
【表1】
Figure 2004510253
【0036】
多くのクライアント・デバイスは、XMLで書かれた分書を処理することができず、テキスト、HTML、WMLまたはHDMLのような別のマークアップ言語で書かれた文書を処理できるに過ぎない。XMLサブ文書の別のフォーマットへの変換(43)は、プロキシ・サーバにおいて入手可能ないずれかの変換器によって行うことができる。
【0037】
塊状区分アルゴリズム(前述のアルゴリズム1)は、ユーザが最初に文書を要求したときに、ソース文書毎に1回だけ実行される。ユーザがソース文書を構成するサブ文書を考察するので、プロキシ・サーバに対する計算上の負担は最少で済み、必要なことは、適切な既に格納されているサブ文書を配信することだけである。
【0038】
一旦文書のサブ文書への区分化が行われれば、元の文書にでてきた順にサブ文書を単純に提供する以外にも、種々の方法でこれを用いることが可能となる。
【0039】
例えば、図17に示すように、元のHTLM文書100は、フォーム102を含むことができる。ユーザのページとの双方向処理を感知可能とするために、このフォームをページの残りから分離し、サブ文書の1つにあるリンクとこれを置き換えると有用な場合がある。すると、ユーザは、彼のローカル・デバイス上でリンクを呼び出し、フォームを彼に提示することができる。彼がこのフォームを見たり用いることを好まない場合、このフォームを得ることすらせずに、先に論じたように、その他のサブ文書を閲覧(navigate)するように進むことができる。この目的のために、文書をサブ文書104、106、および108に区分することができ、これらは文書本体の一部、およびフォーム102の部分を表すサブ文書110、112を表す。サブ文書106の1つは、フォームへのリンク116を表すアイコン114を含む。他のリンク118、120、および122は、先に説明したように、サブ文書間での閲覧を可能にする。
(変換)
ユーザ・デバイスに提供されたサブ文書のコンテンツは、データが表す情報を使用不能にすることなく、通信し表示しなければならないデータ量を減少させるように、自動的に変換することができる。ユーザは、電子文書のこの自動変換をカスタム化することができ、その際、変換の所望の結果に関する彼らの基本設定を表現する。彼らの基本設定は格納され、後に要求文書の自動カスタム化変換において用いられる。
【0040】
例えば、あるユーザが、大きさが制限されているディスプレイ上で文書を視認する場合に、元の文書中の単語を省略させたい場合がある。他のユーザは、単語の省略が紛らわしく、省略を用いない場合に得られる長い文書を受け入れたい場合もある。これらの基本設定を表現し格納し、次いで実際の文書変換において後に制御するために用いることができる。
【0041】
最初に文書を変換するステップについて論じ、次いでユーザの基本設定を要求するプロセスについて論ずる。
(文書変換)
図1および図6に示したように、そして先に説明したように、デバイス10のユーザ6が文書12を要求すると(11)(例えば、URLをデバイス上で実行中のブラウザに入力し、ブラウザに既に格納されているブックマークから選択するか、またはブラウザ内に既にロードされているハイパーテキスト文書からリンクを選択することによって)、プロキシ・サーバは要求を受信し(18)、原始サーバから文書を取り込む(20)。原始サーバから文書を受信した後、プロキシ・サーバはクライアントの基本設定のデータベース26を参照し(24)、要求を出したユーザに対して、デバイス8のための変換プロセスに適したパラメータを決定する。次に、プロキシ・コンピュータは、文書に変換を適用し(28)、クライアント・デバイスへの送信(30)、およびその上でのレンダリング(32)のためにそれを修正する(tailor)。
【0042】
クライアント・デバイスは、HTTPヘッダ内において、それ自体の情報をプロキシ・サーバに知らせるが、HTTPヘッダは2つの関連する情報片を含むことができる。
1.デバイスの一意の識別子:例えば、Phone.comが頒布するマイクロブラウザを装備したワイヤレス・インターネット・デバイスでは、HTTPヘッダの可変X−UP−SUBNOがデバイスの一意の識別子に結び付けられている。
2.デバイス種別:例えば、HTTPヘッダの変数USER−AGENTは、デバイス上にインストールされているブラウザ・ソフトウエアの種類を記述する文字列に結び付けられている。
【0043】
文書変換を行うとき、プロキシ・コンピュータは既に一意のIDを取得してあり、これをキーとして用いて、データベースにおいてユーザに伴う1組の基本設定を調べる。
【0044】
図7は、仮想データベース24における行の一例を示す。各行40は、デバイスの電話番号でデバイスを識別する。行は、ユーザの基本設定(図7の場合4つの異なる基本設定)を、識別したデバイスと関連付ける。この場合、電話番号(例えば、移動電話の)が一意のIDであり、データベース内のレコードに対するキーとして作用する。
【0045】
データベースを調べてこのユーザに適した基本設定の値を判定した後、プロキシ・コンピュータはこれらの値を用いてその変換プロセスを導くことができる。つまり、図1および図4に示すように、変換プロセスへの入力は、ソース文書(例えば、HTML形式)および1組のユーザの基本設定の値(図6からのデータベースにおける1行)である。
【0046】
図8に示すように、文書の変換は、日付圧縮52、単語の略語化54、および画像抑制55のような一連の動作を含み、ディスプレイが小さいデバイス上でレンダリングするのに一層適した形式に元の文書を変換する。各ステップにおいて、ターゲット・デバイスに対する基本設定を用いて、変換動作を構成する。例えば、クライアントに特定的な基本設定は、単語の略語化を抑制すること、または画像抑制55を、指定サイズを超えた画像のみに適用することを示す可能性がある。
【0047】
抑制することに加えて、画像にその他の種類の変換を行い、そのサイズを縮小することもできる。例えば、画像を圧縮し、ダウンサンプルし、またはカラーから白黒に変換することもできる。
【0048】
ユーザ構成可能パラメータの一例は次を含む。
略語化(Abbreviations)
文書を表示するために必要な空間を縮小するには、単語を略語化するとよい。単語を圧縮するには数々の方策があり、長い単語の切り捨て、共通する接尾辞の省略(”national”を ”nat’l”にする)、母音の除去、またはSoundex アルゴリズム(Margaret K. OdellおよびRobert C. Russell, 米国特許第1,261,167号(1918)および第1,435,663号(1922))のような、いくらか洗練性を高めた手順を用いる。対応するユーザ構成可能パラメータは、ユーザが略語化を許したいかまたは禁じたいかを示すブール値である。略語化を許すことによって、得られる文書の長さは減少するが、文書の意味が不明になる場合もある。
画像の抑制(Suppression of images)
画面が小さい移動デバイスの多くは、ビットマップ画像をレンダリングすることができない。可能な場合でも、大きな画像をレンダリングするには、長大な送信時間が必要となる場合がある。ビットマップ画像は、低解像度の画面上でレンダリングすると、画質が低下する可能性がある。これらの理由のために、ユーザはどのビットマップ画像を彼らのデバイス上でレンダリングするか否か制御することができる。この場合の対応するユーザ構成可能パラメータは、例えば、ブール値(レンダリングするか、またはレンダリングしない)、またはソース画像に対する画像の最大容認可能サイズとすることができる。
実体圧縮(Entity compression)
変換システムは、自然言語パーザを用いて、あるクラスの文字列を検出し、短縮化した形式に書き換えることができる。例えば、パーザは日付を検出し、短縮化形式に書き換えることができるので、例えば、「December 12, 1984」は「12/12/84」となり、「February 4」は「2/4」となり、「the seventh of August」は「8/7」となる。対応するユーザ選択可能パラメータ値は、ブール値(圧縮または非圧縮)、あるいは、3つの値、圧縮せず、月/日/年フォーマットに圧縮、または日/月/年フォーマットに圧縮、から1つを取ることができる。
【0049】
同様に、変換システムは、数値量を解析し圧縮することができるので、(例えば)「seventeen」は「17」となり、「ten gigabytes」は「10GB」となる。多種多様の文書には、その他の多種多様の変換も考案可能である。
(デバイス単位の基本設定の指定および格納)
次に、デバイスのユーザから基本設定を取得し、これらの基本設定を具体的なクライアント・デバイスに関連付ける方法について、2つの例を挙げて説明する。
小型ディスプレイ・デバイスからの基本設定の入力
ユーザは、インターネット・アクセスに用いる同じ小型ディスプレイ・デバイスを用いて、プロキシ・コンピュータを訪問することによって、基本設定を入力し維持することができる。図9に示すように、プロキシ・コンピュータは、小型ディスプレイ・デバイスのユーザが検索し、彼らの基本設定に応じて記入したハイパーテキストフォームを格納する(60)ことができる。クライアント・デバイスからHTTP要求を受信すると(62)、プロキシ・コンピュータは自動的にクライアント・デバイスの一意の識別子を取得する(HTTPプロトコルを用いて)。次いで、プロキシ・コンピュータは、1組の基本設定を含むフォームをユーザに送信する(64)。クライアント・デバイスが既にデータベース内に関連するエントリを有する場合、各パラメータの現在値をそのフォーム内に表示することができる。それ以外の場合、デフォルト値を表示する。ユーザは、このフォーム上で、相応しいと見なした場合、パラメータを変更し、次いでこのフォームをプロキシ・コンピュータに返送し(66)、プロキシ・コンピュータは、更新した値をデータベース内の、当該クライアント・デバイスと関連付けたレコードに格納する。
従来のコンピュータからの基本設定の入力
あるいは、ユーザは、デスクトップまたはラップトップ・コンピュータ上で従来のウェブ・ブラウザを用いて同じURLを訪問することができる。プロキシ・コンピュータは、HTTPヘッダ情報から、どのデバイスと基本設定を関連付けるか自動的に判断することができない。ユーザは、明示的に、基本設定を設定したいデバイスの一意の識別子、例えば、電話番号を指定しなければならない。図10は、従来のHTMLを用いたデスクトップ・ウェブ・ブラウザ上で見られるフォームの一例を示す。図11は、対応のページの最初の画面を示し、これは4ラインの移動電話ディスプレイ上で見られる(ユーザは、オプションの残りを見るためには、スクロールして表示を下げなければならない)。
(種別毎の基本設定の指定および格納)
前述の説明では、ユーザは、小型画面デバイスを用いて、遠隔地に格納されている文書にアクセスする人であり、プロキシ・コンピュータ(変換を行う)は、ユーザのデバイスとインターネットとの間で全体的に仲介を行う。
【0050】
構成可能な変換が有用な別の設定は、個人または機関が、小型表示デバイス上において、それが生成した文書の外観を制御することである。このために、データの格納および送信を担当する原始サーバには、自動コンテンツ変換ソフトウエアを装備することができる(ウェブ・サーバ・ソフトウエアのモジュールまたは「プラグ・イン」を用いる)。すると、原始サーバ・ホストは、望み通りに変換ソフトウエアを構成し制御することが可能となる。
【0051】
また、原始サーバは、一旦いずれかのユーザがそのサーバから特定の種別のクライアント・デバイスのために文書を検索したなら、変換を構成する能力をコンテンツの著作者に提供することもできる。言い換えると、エンド・ユーザに変換をカスタム化する能力を提供する代わりに、コンテンツを作成した人または機関にこの能力を提供することができる。この状況は、コンテンツ提供業者が小型表示デバイス上における彼らのコンテンツの表示に対して厳格な制御を望む場合に該当する。ユーザ(個々のデバイス)の基本設定のデータベースを格納するのではなく、原始サーバは、デバイスの種別毎に、変換に対して1組のパラメータのみを格納する。したがって、ユーザから原始サーバへの情報の流れは、次のようになる。
1.ユーザが原始サーバからの文書を要求する。
2.原始サーバは、要求、およびこの要求を行ったクライアント・デバイスの種別に関する情報を受信する。
3.原始サーバは、要求された文書の処理において、当該デバイスに適した変換パラメータを調べる。
4.原始サーバは変換した文書をクライアント・デバイスに配信する。
【0052】
ステップ3に用いるデータベースにおけるエントリの一例を以下に示す。
【0053】
【表2】
Figure 2004510253
【0054】
前の章では、エンド・ユーザが基本設定を指定して格納し、単一のデバイスと関連付ける方法について説明した。この章では、コンテンツ作成者が彼らの原始サーバから配信された文書の変換を構成する方法について説明する。これら2つの状況は、互いに両立可能なものではない。エンド・ユーザが原始サーバYからの文書Xを要求すると想定する。また、エンド・ユーザが彼の変換に対して1組の基本設定を登録してあり、原始サーバ上には、当該原始サーバから配信される文書に対して、別の1組の基本設定が存在すると想定する。最初に、原始サーバにおいて基本設定に応じて文書が変換され、次いでエンド・ユーザの基本設定にしたがって変換される。この状況では、エンド・ユーザの基本設定が尊重されないこともときとしてあり得る。例えば、エンド・ユーザが単語の略語化を望まないが、原始サーバに対する基本設定が単語を略語化することを指定した場合、エンド・ユーザは、彼の基本設定には拘わらず、略語化した単語を含む文書を受信することになる。
(クライアント・デバイス上における基本設定の格納)
基本設定をデバイスと関連付ける代わりの方策は、HTTP「クッキー」状態機構を用いることである(D. KristolおよびL. Montulli, RFC2109: HTTP State Management Mechanism (HTTP状態管理機構)(1997)。 **http://www.w3.org/Protocols/rfc2109/rfc2109.txt**)。この場合、基本設定情報は、クライアント・デバイスから離れたデータベース上に格納されるのではなく、デバイス自体に格納される。この設定のデバイス単位の基本設定情報の流れは次の通りである。
1.小型表示デバイスのユーザが、プロキシ・コンピュータに、基本設定のフォーム文書の要求を提出する。フォーム文書は、プロキシ・コンピュータからデバイスに送信される。
2.ユーザは彼の基本設定を書き込み、書き込んだフォームをプロキシ・コンピュータに返送する。
3.プロキシ・コンピュータは、応答して確認文書を送り、更に、HTTPヘッダ情報内で、ユーザの基本設定を含むクッキーも送信する。例えば、クッキーとは次のようにすることもできる。
【0055】
Set−Cookie: PREFS=”abbrevs:yes images:no dates: yes ...”; path=/; expires=04−Sep−01 23:12:40 GMT
4.クライアント・デバイスはこのクッキーを永続的状態として格納する。
5.クライアント・デバイスのユーザが後にプロキシ・コンピュータからの文書を要求するとき、デバイスは、格納されている基本設定を含むクッキーもプロキシ・コンピュータに送信する。
【0056】
Cookie: PREFS=”abbrevs:yes images:no dates:yes...”;
6.このクライアントに対する基本設定を受けて、プロキシ・コンピュータは要求された文書を変換する際に、これらの基本設定を適用する。クッキーの期限が切れていたかまたは消去されていたためにクライアント・デバイスがクッキーを送信しなかった場合、プロキシ・コンピュータはデフォルトの変換を適用する。
(応用)
図12に示すように、ワイヤレス・デバイス50と「有線」インターネット53との間の通信は、ゲートウェイ52を介して行われるのが通例である。ゲートウェイ52は、有線およびワイヤレス世界の間を仲介する。例えば、WAP可能デバイスのユーザによる文書要求が、ワイヤレス・ゲートウェイに送信されると、ワイヤレス・ゲートウェイは、要求された文書を担当する(DNSプロトコルに応じて)原始サーバ54(インターネット上)に要求を転送する。
【0057】
要求された文書が、具体的にクライアント・デバイスのために設計されており、当該デバイスによって受け入れられるマークアップ言語で書かれている場合、コンテンツの変換は不要である。マークアップ言語は、HTMLの場合もあるが、WML、HDMLのようなマークアップ言語、あるいは固有言語の方が多い。個々のワイヤレス・データ・デバイスの能力は異なるので、コンテンツ作成者は、各ターゲット・マークアップ言語だけでなく、可能なあらゆるターゲット・デバイスにも、別個のバージョンを作成しなければならない。コンテンツ提供業者は、クライアント・デバイスの検出法、および当該クライアントに対して最適にフォーマットした文書を作成する方法も把握する必要がある。
【0058】
図13に示すように、自動コンテンツ変換システム70は、特定のターゲット・デバイス上のディスプレイに適したフォーマットに、文書72を自動的に圧縮しフォーマットし直すことができる。これによって、コンテンツ作成者が自由となり、コンテンツを種々のターゲット・デバイス用に作り替えることなく、コンテンツの執筆に集中することができる。コンテンツ変換システムは、従来とは異なるクライアント・デバイスからの要求を傍受し、ターゲット・デバイス78上のディスプレイ用に、要求された文書をカスタム化し、変換した文書74をクライアントに送信する。コンテンツ変換システムは、ユーザ基本設定76およびデバイスの仕様64を用いて、文書変換プロセスを導く。
【0059】
要求されたページ72が、要求を行ったクライアント・デバイスのために特定的に設計されていた場合、コンテンツ変換は不要となる。しかし、ワイヤレス・デバイス用に文書を設計するのは単純なことではない。文書は、それらデバイスが受け入れるマークアップ言語で書かれていなければならない。これは、HTMLの場合もあるが、WML、HDML、または企業固有の言語というような、その他のマークアップ言語であることの方が多い。何百もの異なるワイヤレス・データ・デバイスの能力64はそれぞれ異なるので、コンテンツ作成者は、各ターゲット・マークアップ言語だけでなく、可能なあらゆるターゲット・デバイス用に別個のバージョンを作成しなければならないという予想(prospect)に直面する。また、コンテンツ提供業者も、クライアント・デバイスの種別を検出する方法を把握し、当該クライアント用に最適にフォーマットした文書を作成する必要がある。
【0060】
システム70を用いることによって、特定のターゲット・デバイス上における最適な表示のために文書を自動的に圧縮し再フォーマットするので、コンテンツ作成者は、彼らの中核的力量−コンテンツを書く力量−に自由に集中し、種々のターゲット・デバイスのためにコンテンツを書き改める(retarget)必要はなくなる。一旦インストールされれば、コンテンツ変換システムは、標準とは異なる(non−traditional)クライアント・デバイスからの要求を傍受し、要求された文書をターゲット・デバイス上での表示のためにカスタム化し、変換した文書をクライアントに送信する。コンテンツ変換システムは、自動文書区分化を用いて、大きな文書全体を処理できないデバイスに対しては、大きな文書の配信を段階的に処理する。
【0061】
コア・コンテンツ変換コンポーネント81は、先に説明した区分プロセスを含むことができる。XMLキャッシュ・オブジェクト84は、ユーザ単位のサブ文書を区分プロセスのために格納する場所である。
【0062】
コンテンツ変換は、サーバ側の技術であり、当然クライアント−原始サーバ・チャネルにおける種々の場所、ワイヤレス・ゲートウェイから元の文書を保持する原始サーバまでのあらゆる場所に展開することができる。以下の表に、コンテンツ変換を適用可能な場所をいくつか纏めた。
【0063】
【表3】
Figure 2004510253
【0064】
図14は、5つのサブ文書に分割した入力文書(フルサイズのウェブ・ページ)の一例を示す。図15は、元のページの”Bronx−Whitestone Bridge”部分の中央に対応する、4番目のサブ文書72の最下位部分を示す。「prev」74および「next」76で示すハイパーリンク(アイコン)を起動すると、ユーザはそれぞれ3番目または5番目のサブ文書に移動する。図16は、5番目のサブ文書78の先頭を示す。これは4番目が終わったところから始まる。ユーザは、必要に応じて、サブ文書中をスクロールすることができる。実現例によっては、ユーザがサブ文書の先頭または終端までスクロールしたときに、図示のように、アイコン74、76のみを表示する。別の例では、アイコンを常時表示することも可能である。
【0065】
図15および図16では、原紙における数や単語を略語化し(「one」は「1」、「and」は「&」になっている)、曜日も短縮してある。
【0066】
各サブ文書の表示は、元の文書の見出し79の表示も含む。この見出しは、サブ文書が元の文書から作成されるときに、サブ文書に含まれる。また、表示は、サブ文書の総数87、および元の文書を構成する一連のサブ文書における現サブ文書の位置89も含む。
【0067】
別の実現例も、特許請求の範囲に該当することとする。
【0068】
例えば、ユーザ・インターフェースにおいて、ターゲット・デバイス上に広げた各サブ文書の最下位部分は、当該サブ文書が、元の文書を構成する1組のサブ文書のどこに当たるかを示すグラフィカル・ステータス・バーを含むことができる。例えば、ooxooooは、「これは7枚のサブ文書の内3番目である」ということを意味する。更に、このステータス・バーにおけるoの各々を当該サブ文書にハイパーリンクし、ユーザが文書内の異なるサブ文書にランダムにアクセスできるようにすることも可能である。これは、サブ文書毎に順に進めるよりも一層効率的とすることができる。
【図面の簡単な説明】
【図1】
図1は、文書変換および提供システムを示す。
【図2】
図2は文書を示す。
【図3】
図3はフロー図を示す。
【図4】
図4は文書階層を示す。
【図5】
図5は文書階層を示す。
【図6】
図6は、文書変換プロセスを示す。
【図7】
図7は、データベースを示す。
【図8】
図8は、文書変換システムを示す。
【図9】
図9は、基本設定を表現するプロセスを示す。
【図10】
図10は基本設定の形態を示す。
【図11】
図11は、基本設定の形態を示す。
【図12】
図12は、無線/ワイヤレス通信システムを示す。
【図13】
図13は、文書変換システムを示す。
【図14】
図14は、ウェブ・ページを示す。
【図15】
図15は、ウェブ・ページの一部の小型画面表示を示す。
【図16】
図16は、ウェブ・ページの一部の小型画面表示を示す。
【図17】
図17は、個別使用のためのサブ文書の分離を示す。

Claims (42)

  1. クライアントに提供しクライアント・デバイス上に表示するための文書を含む機械読み取り可能ファイルを受信するステップであって、前記ファイル内の文書の各々の編成が情報の階層で表現されている、ステップと、
    前記情報の階層からサブ文書を導出するステップであって、前記サブ文書の各々を、ハイパーテキスト送信プロトコルを用いて前記クライアントに別個に提供することを可能にするフォーマットで表現し、前記サブ文書の少なくとも1つが、当該サブ文書を前記サブ文書の別の1つにリンクすることを可能にする情報を含む、ステップと、
    から成る方法。
  2. 請求項1記載の方法において、前記言語が拡張可能マークアップ言語(XML)から成る、方法。
  3. 請求項1記載の方法において、前記導出するステップが、前記階層を調べ、セグメントから前記サブ文書を組み立てることから成り、前記サブ文書の少なくとも一部を、各々、1つよりも多い前記セグメントから組み立てる、方法。
  4. 請求項3記載の方法において、前記組み立てが、前記サブ文書のそれぞれのサイズのバランスを取るように作用するアルゴリズムに従う、方法。
  5. 請求項3記載の方法において、前記組み立てが、前記階層において共通の親を有するセグメントから、サブ文書の各々を組み立てることを優先するように作用するアルゴリズムに従う、方法。
  6. 請求項3記載の方法において、前記組み立てが、前記階層におけるノードの複製を必要としないセグメントから、サブ文書の各々を組み立てることを優先するように作用するアルゴリズムに従う、方法。
  7. 請求項1記載の方法において、前記ファイルに関連する原始サーバから前記ファイルを受信する、方法。
  8. 請求項7記載の方法において、前記ファイルが、前記文書のセグメントを階層状に編成しない言語で表現され、前記サブ文書を導出するステップは、最初に、前記文書のセグメントを階層状に編成する言語に、前記ファイルを変換することを含む、方法。
  9. 請求項1記載の方法であって、更に、クライアントによる要求に応じて、前記サブ文書を個別に前記クライアントに提供するステップを含む、方法。
  10. 請求項9記載の方法において、ハイパーテキスト送信プロトコルを用いて前記サブ文書をクライアントに提供する、方法。
  11. 請求項9記載の方法において、前記サブ文書の要求は、前記クライアントによって、前記サブ文書の別のものにリンクすることを当該クライアントに可能にする前記情報の内容に基づいて行われる、方法。
  12. 請求項1記載の方法であって、更に、
    前記文書の一部を識別し、前記文書の残りからは分離して表示するステップを含み、
    前記別個に表示する文書の一部は、前記部分が現れるはずのサブ文書から割愛され、前記別個に表示する文書の一部は、少なくとも1つの対応するサブ文書に含まれ、
    前記一部が現れるはずの前記サブ文書を前記クライアント・デバイスに提供する場合、グラフィカル・デバイスを埋め込み、前記ユーザが起動して、前記別個に表示すべき文書の一部を含むサブ文書を検索可能とした、方法。
  13. 原始サーバから、クライアント・デバイス上での表示のためにクライアントに提供する文書を含む機械読み取り可能ファイルを受信するステップであって、前記ファイルが、前記文書のセグメントを階層状に編成しない言語で表現されている、ステップと、
    前記文書のセグメントを階層状に編成する言語に、前記ファイルを変換するステップと、
    前記階層を調べ、前記セグメントからサブ文書を組み立てるステップであって、前記サブ文書の少なくとも一部は、各々が、1つよりも多い前記セグメントから組み立てられ、前記組み立てが、(a)前記サブ文書のそれぞれのサイズのバランスを取る、(b)前記階層において共通の親を有するセグメントから、サブ文書の各々を組み立てることを優先する、および(c)前記階層におけるノードの複製を必要としないセグメントから、サブ文書の各々を組み立てるように作用するアルゴリズムに従う、ステップと、
    ハイパーテキスト送信プロトコルを用いて、前記クライアントに個別に提供可能とするフォーマットで、前記サブ文書の各々を表現するステップであって、前記サブ文書の少なくとも1つが、前記サブ文書の別の1つに当該1つのサブ文書をリンクすることを可能にする情報を含む、ステップと、
    前記クライアントによる要求に応じて、前記サブ文書の別のものにリンクすることを当該クライアントに可能にする前記情報の内容に基づいて、前記サブ文書を前記クライアントに個々に提供するステップであって、ハイパーテキスト送信プロトコルを用いて当該提供を行う、ステップと、
    から成る方法。
  14. クライアントに提供するために記憶媒体上に保持された機械読み取り可能文書であって、該文書が1組のサブ文書として編成されており、前記サブ文書の各々が、当該サブ文書を前記サブ文書の別のものにリンクすることを可能にする情報を含み、前記サブ文書の各々が、前記文書の階層的表現の一部である、前記文書のセグメントの集合体であり、前記サブ文書がほぼ同じサイズである、機械読み取り可能文書。
  15. 請求項14記載の文書において、前記サブ文書をリンクすることを可能にする情報がURLから成る、文書。
  16. 請求項14記載の方法において、前記階層的表現が拡張可能マークアップ言語(XML)から成る、方法。
  17. クライアントから、クライアント・デバイス上に表示する文書の要求を受信するステップと、
    前記要求文書の全て未満を表すサブ文書を別個に前記クライアントに提供するステップであって、各サブ文書がそれを少なくとも1つの別のサブ文書にリンクする情報を含む、ステップと、
    前記クライアントから、前記他のサブ文書へのリンクの呼び出しを受信するステップと、
    前記クライアント・デバイスに前記別のサブ文書を別個に提供するステップと、
    から成る方法。
  18. 請求項17記載の方法において、ハイパーテキスト送信プロトコルを用いて前記サブ文書を前記クライアントに提供する、方法。
  19. 請求項17記載の方法において、前記サブ文書が本質的に同じ長さである、方法。
  20. 請求項17記載の方法において、前記サブ文書が、前記クライアント・デバイス上において、更に切り捨てることなく、表示可能な長さを有する、方法。
  21. クライアント・デバイスにおいて、該クライアント・デバイス上に表示するために、大きな文書のサブ文書をサーバから受信するステップと、
    前記サブ文書を前記クライアント・デバイス上に表示するステップと、
    前記クライアント・デバイスにおいて、前記大きな文書の別のサブ文書を表示させるユーザの要求を受信するステップと、
    前記サーバから、前記別のサブ文書を前記クライアント・デバイスにおいて別個に受信するステップと、
    前記別の文書を前記クライアント・デバイス上に表示するステップと、
    から成り、前記サブ文書が実質的に同じ長さである、方法。
  22. 請求項21記載の方法において、前記サブ文書をハイパーテキスト送信プロトコルで表現した、方法。
  23. 請求項21記載の方法において、前記ユーザの要求をURLとして表現した、方法。
  24. 請求項21記載の方法において、前記各サブ文書の全てを前記クライアント・デバイス上で一度に表示する、方法。
  25. 請求項21記載の方法において、前記各サブ文書の全て未満を前記クライアント・デバイス上で一度に表示する、方法。
  26. クライアント・デバイス上で文書のサブ文書を表示するステップと、
    前記サブ文書と共にアイコンを表示するステップと、
    前記アイコンの起動に応答して、サーバから前記文書の別のサブ文書を取り込み、該別のサブ文書を前記クライアント・デバイス上に表示するステップと、
    から成り、前記サブ文書の各々が前記文書全体未満であり、前記サブ文書がほぼ同じサイズである、方法。
  27. 請求項26記載の方法において、前記各サブ文書の一部を一度に表示する、方法。
  28. 請求項27記載の方法であって、更に、前記文書を構成する一連のサブ文書において、現在表示されているサブ文書の位置の指標を表示するステップを含む、方法。
  29. 請求項28記載の方法において、前記指標が、前記一連におけるサブ文書の総数と、前記一連における現在表示中の文書の位置とを含む、方法。
  30. 請求項1、17、または21記載の方法において、前記クライアント・デバイスからの前記文書の要求時において、前記文書から前記サブ文書を導出する、方法。
  31. 請求項30記載の方法において、前記クライアント・デバイスの特性に基づいた方法で、前記サブ文書を導出する、方法。
  32. 請求項31記載の方法において、前記クライアント・デバイスの特性は、前記クライアントが前記要求と共に提供する、方法。
  33. 請求項32記載の方法において、前記特性が、前記クライアント・デバイスの表示能力を含む、方法。
  34. 請求項1、17、または21記載の方法において、前記クライアントが前記サーバからの前記文書を要求する前に、前記文書から前記サブ文書を導出する、方法。
  35. 請求項34記載の方法において、異なる原始サーバからの異なる文書について、前記サブ文書を導出する、方法。
  36. 請求項1、17、または21記載の方法において、ワイヤレス通信ゲートウェイにおいて前記文書から前記サブ文書を導出する、方法。
  37. クライアント・デバイス上での表示のためにクライアントに提供する文書を含む機械読み取り可能ファイルを受信し、前記ファイルからサブ文書を導出するように構成されたネットワーク・サーバを備え、前記サブ文書の各々が、ハイパーテキスト送信プロトコルを用いて前記クライアントに別個に供給可能にするフォーマットで表現されており、前記サブ文書の少なくとも1つは、それを前記サブ文書の別の1つにリンクすることを可能にする情報を含む、装置。
  38. クライアント・デバイス上での表示のためにクライアントに提供する文書を含む機械読み取り可能ファイルを受信する手段と、
    前記ファイルからサブ文書を導出する手段であって、前記サブ文書の各々が、ハイパーテキスト送信プロトコルを用いて前記クライアントに別個に供給可能にするフォーマットで表現されており、前記サブ文書の少なくとも1つは、それを前記サブ文書の別の1つにリンクすることを可能にする情報を含む、手段と、
    を備えている装置。
  39. 機械読み取り可能媒体上に格納された機械読み取り可能プログラムであって、
    クライアント・デバイス上での表示のためにクライアントに提供する文書を含む機械読み取り可能ファイルを受信し、
    前記ファイルからサブ文書を導出し、前記サブ文書の各々が、ハイパーテキスト送信プロトコルを用いて前記クライアントに別個に供給可能にするフォーマットで表現されており、前記サブ文書の少なくとも1つが、当該1つを前記サブ文書の別の1つにリンクすることを可能にする情報を含む、
    ように機械を構成可能な機械読み取り可能プログラム。
  40. 請求項7記載の方法において、前記ファイルが電子文書から成る、方法。
  41. 請求項7記載の方法において、前記ファイルが電子メールから成る、方法。
  42. 請求項7記載の方法において、前記ファイルを前記原始サーバからウェブ・ページの形態で受信する、方法。
JP2002531030A 2000-09-27 2001-09-27 能力が限られたデバイス上で用いるための電子文書の区分処理 Pending JP2004510253A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US23555100P 2000-09-27 2000-09-27
US23842400P 2000-10-10 2000-10-10
US09/745,289 US7613810B2 (en) 2000-09-27 2000-12-20 Segmenting electronic documents for use on a device of limited capability
US09/745,290 US7210100B2 (en) 2000-09-27 2000-12-20 Configurable transformation of electronic documents
PCT/US2001/030465 WO2002027520A1 (en) 2000-09-27 2001-09-27 Segmenting electronic documents for use on a device of limited capability

Publications (2)

Publication Number Publication Date
JP2004510253A true JP2004510253A (ja) 2004-04-02
JP2004510253A5 JP2004510253A5 (ja) 2008-07-24

Family

ID=27499799

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2002531030A Pending JP2004510253A (ja) 2000-09-27 2001-09-27 能力が限られたデバイス上で用いるための電子文書の区分処理
JP2002531026A Pending JP2004510251A (ja) 2000-09-27 2001-09-27 電子ドキュメントの構成可能な変換方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2002531026A Pending JP2004510251A (ja) 2000-09-27 2001-09-27 電子ドキュメントの構成可能な変換方法

Country Status (6)

Country Link
EP (2) EP1330723A4 (ja)
JP (2) JP2004510253A (ja)
KR (3) KR100903528B1 (ja)
AU (2) AU2001294881A1 (ja)
CA (2) CA2423611C (ja)
WO (2) WO2002027516A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009064064A (ja) * 2007-09-04 2009-03-26 Kyocera Mita Corp 情報処理装置

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0107772D0 (en) * 2001-03-28 2001-05-16 Hewlett Packard Co Improvements relating to data delivery
RU2316048C2 (ru) 2002-08-23 2008-01-27 Эл Джи Электроникс Инк. Способ запроса/доставки электронного документа, основанный на расширяемой спецификации языка (xml)
KR100636909B1 (ko) * 2002-11-14 2006-10-19 엘지전자 주식회사 확장성 표기 언어 기반의 전자문서 버전 매김 및 버전을이용한 갱신 문서 제공 방법
KR100531842B1 (ko) * 2002-11-20 2005-12-02 엘지전자 주식회사 메시지 교정 방법 및 시스템
US20070250768A1 (en) * 2004-04-30 2007-10-25 Raiko Funakami Method, Terminal Device and Program for Dynamic Image Scaling Display in Browsing
US7603426B2 (en) 2004-06-18 2009-10-13 Microsoft Corporation Flexible context management for enumeration sessions using context exchange
KR20060082353A (ko) * 2005-01-12 2006-07-18 와이더댄 주식회사 실행가능 웹 컨텐트 제공 및 처리 시스템 및 방법
JP2007257365A (ja) * 2006-03-23 2007-10-04 Microsoft Corp データ送信管理装置、システム、方法およびプログラム
KR100817582B1 (ko) * 2006-11-29 2008-03-31 에스케이 텔레콤주식회사 모바일 웹 서비스 방법과 이를 위한 프록시 서버 및 모바일단말기
KR100905413B1 (ko) * 2007-11-06 2009-07-02 주식회사 케이티프리텔 이동 단말의 풀 브라우저에서 웹 페이지의 화면 표시영역을 조정하는 방법 및 장치
JP4739369B2 (ja) * 2008-05-15 2011-08-03 ソフトバンクモバイル株式会社 ウェブコンテンツ変換編集システム
KR101012206B1 (ko) * 2008-05-27 2011-02-08 주식회사 엘지유플러스 웹뷰어의 이미지 전송량 관리 시스템 및 그 방법
KR100873415B1 (ko) * 2008-07-15 2008-12-11 팬터로그인터액티브 주식회사 이동 통신 단말기에서 풀 브라우징 서비스를 제공하기 위한인터넷 접속 장치 및 그 방법
KR100994607B1 (ko) * 2008-09-24 2010-11-15 주식회사 엘지유플러스 마크업 페이지 중계 서버 및 그 제어방법
US8010089B2 (en) 2009-01-19 2011-08-30 Telefonaktiebolaget L M Ericsson (Publ) System and method of providing identity correlation for an over the top service in a telecommunications network
CN101996162A (zh) * 2009-08-26 2011-03-30 华为技术有限公司 电子书章节处理方法、装置及系统
US8862777B2 (en) 2011-04-01 2014-10-14 Verisign, Inc Systems, apparatus, and methods for mobile device detection
ES2442974B1 (es) * 2012-05-10 2015-03-06 Vodafone Espana Sau Dispositivo de control de planificacion, analizador de dispositivo de equipo de usuario y metodo de priorizacion de calidad de servicio que hace uso de los mismos
KR102140648B1 (ko) * 2018-12-07 2020-08-04 유병섭 한글워드파일의 웹 변환 시스템
US20240086459A1 (en) * 2022-09-09 2024-03-14 SpeedSize Ltd Adaptive Content Delivery Systems and Methods

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000020985A1 (en) * 1998-10-01 2000-04-13 Bcl Computers, Inc. Conversion of data representing a document to other formats for manipulation and display

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324427A (ja) * 1992-05-27 1993-12-07 Hitachi Ltd 文書情報圧縮装置
US6128663A (en) 1997-02-11 2000-10-03 Invention Depot, Inc. Method and apparatus for customization of information content provided to a requestor over a network using demographic information yet the user remains anonymous to the server
US6154738A (en) * 1998-03-27 2000-11-28 Call; Charles Gainor Methods and apparatus for disseminating product information via the internet using universal product codes
US6857102B1 (en) * 1998-04-07 2005-02-15 Fuji Xerox Co., Ltd. Document re-authoring systems and methods for providing device-independent access to the world wide web
US6173316B1 (en) * 1998-04-08 2001-01-09 Geoworks Corporation Wireless communication device with markup language based man-machine interface
US6278449B1 (en) * 1998-09-03 2001-08-21 Sony Corporation Apparatus and method for designating information to be retrieved over a computer network
US6226675B1 (en) * 1998-10-16 2001-05-01 Commerce One, Inc. Participant server which process documents for commerce in trading partner networks
SE524391C2 (sv) * 1998-12-28 2004-08-03 Spyglass Inc Metod och system för innehållskonvertering av elektroniska dokument för trådlösa klienter.
US6826597B1 (en) 1999-03-17 2004-11-30 Oracle International Corporation Providing clients with services that retrieve data from data sources that do not necessarily support the format required by the clients

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000020985A1 (en) * 1998-10-01 2000-04-13 Bcl Computers, Inc. Conversion of data representing a document to other formats for manipulation and display
JP2002526862A (ja) * 1998-10-01 2002-08-20 ビーシーエル コンピューターズ, インコーポレイテッド ドキュメントを表わすデータの操作および表示のための他のフォーマットへの変換

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009064064A (ja) * 2007-09-04 2009-03-26 Kyocera Mita Corp 情報処理装置

Also Published As

Publication number Publication date
CA2423611A1 (en) 2002-04-04
KR100855997B1 (ko) 2008-09-03
WO2002027520A9 (en) 2002-06-06
CA2423695A1 (en) 2002-04-04
WO2002027516A9 (en) 2003-02-20
KR20030060899A (ko) 2003-07-16
CA2423611C (en) 2011-03-08
AU2001294884A1 (en) 2002-04-08
AU2001294881A1 (en) 2002-04-08
JP2004510251A (ja) 2004-04-02
EP1320806A1 (en) 2003-06-25
KR20080067022A (ko) 2008-07-17
EP1320806A4 (en) 2007-08-15
KR20030045086A (ko) 2003-06-09
WO2002027520A1 (en) 2002-04-04
KR100903528B1 (ko) 2009-06-19
EP1330723A4 (en) 2009-04-01
WO2002027516A1 (en) 2002-04-04
EP1330723A1 (en) 2003-07-30

Similar Documents

Publication Publication Date Title
US7613810B2 (en) Segmenting electronic documents for use on a device of limited capability
US7210100B2 (en) Configurable transformation of electronic documents
JP2004510253A (ja) 能力が限られたデバイス上で用いるための電子文書の区分処理
US6925595B1 (en) Method and system for content conversion of hypertext data using data mining
KR100320980B1 (ko) 웹페이지포맷장치및방법
US7676482B2 (en) Method and apparatus for providing data from a data source to a data consumer, and for rendering data from a data provider to an interface
US6338096B1 (en) System uses kernals of micro web server for supporting HTML web browser in providing HTML data format and HTTP protocol from variety of data sources
US6272484B1 (en) Electronic document manager
EP1412867B1 (en) Device and method for converting an attachment in an e-mail for delivery to a device of limited rendering capability
US7318193B2 (en) Method and apparatus for automatic document generation based on annotation
US7574486B1 (en) Web page content translator
US6523062B1 (en) Facilitating memory constrained client devices by employing deck reduction techniques
GB2344197A (en) Content conversion of electronic documents
US20020016801A1 (en) Adaptive profile-based mobile document integration
US20020116534A1 (en) Personalized mobile device viewing system for enhanced delivery of multimedia
US20090094327A1 (en) Method and apparatus for mapping a site on a wide area network
US20020129006A1 (en) System and method for modifying a document format
US6098069A (en) Data managing method and data managing device using the same for manipulating data independently from networks
WO2000039666A1 (en) Converting content of markup data for wireless devices
WO2005121982A1 (ja) 情報提供システム、方法、プログラム、情報通信端末、および情報表示切り替えプログラム
WO2001073560A1 (fr) Systeme fournisseur de contenus
US20020091740A1 (en) Electronic publishing method and system
US6993525B1 (en) Document-database access device
JP3990671B2 (ja) 情報管理装置および情報管理方法
JP2001184277A (ja) データ閲覧装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080604

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20080630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110422

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110502

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110531

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110607

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110901