JP4248411B2 - 文書を表示するための方法、システム、コンピュータプログラムおよび記憶装置 - Google Patents

文書を表示するための方法、システム、コンピュータプログラムおよび記憶装置 Download PDF

Info

Publication number
JP4248411B2
JP4248411B2 JP2003584911A JP2003584911A JP4248411B2 JP 4248411 B2 JP4248411 B2 JP 4248411B2 JP 2003584911 A JP2003584911 A JP 2003584911A JP 2003584911 A JP2003584911 A JP 2003584911A JP 4248411 B2 JP4248411 B2 JP 4248411B2
Authority
JP
Japan
Prior art keywords
page
complexity
document
display
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003584911A
Other languages
English (en)
Other versions
JP2005522771A (ja
Inventor
スティーヴン モリス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2005522771A publication Critical patent/JP2005522771A/ja
Application granted granted Critical
Publication of JP4248411B2 publication Critical patent/JP4248411B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)
  • Digital Computer Display Output (AREA)

Description

本発明は、構造化文書を表示する方法であって、構造化文書をロードする工程と、その構造化文書を階層構造にパーズ(解剖)する工程とを含む方法に関するものである。
本発明はまた、構造化文書を表示するシステムであって、構造化文書をロードするロード手段と、その構造化文書を階層構造にパーズするパーズ手段とを含むシステムにも関するものである。
本発明はさらに、上記のような方法を実行するように設計されたプログラムコードを含む、コンピュータプログラムにも関するものである。
本発明はさらに、上記のようなコンピュータプログラムを含む記憶装置にも関するものである。
上記のような方法の一例は、米国特許第5,987,256号より知られている。この特許には、HTMLやJAVAといったオブジェクト指定言語により指定されたオブジェクトを、処理する方法が記載されている。レンダリング・プログラムを要する相対的配置に依存する他の指定言語を使用することもできる。このレンダリング・プログラムは、最小限のリソースの組を使用し、限られた処理リソースを有する対象装置で使用できるようにコードを変換する。かかる限られた処理リソースは、HTMLレンダリング・プログラム、JAVAバーチャルマシンその他のレンダリング・エンジンの記憶および実行には適さない。上記のようなオブジェクトに関するデータは、言語を指定するデータの組をまず受信する工程と、その第1のデータの組を、実際の対象である表示座標を使用する対象装置によるレンダリングに適する第2のレンダリング・プログラムに適合した、中間オブジェクト言語で記述された第2のデータの組に変換する工程とを含む処理により生成される。この第2のデータの組は、後でシン・クライアントのプラットホームにより読出しおよび実行ができるように、機械読取可能な記憶装置に記憶される。たとえばHTMLファイルを変換装置にロードする際には、上記の対象装置に関する情報がロードされる。その後、そのHTMLファイルが、HTMLタグの探索によりパーズされ、それらのタグに基づいて階層構造が生成される。この方法では、上記の対象装置のパラメータと階層構造とを用いて、対象装置のサイズおよびパレットに適合させられた階層構造に基づいて、HTMLレンダリングを行う。これにより、対象装置のスクリーン上において、HTMLコードで指定されたすべてのグラフィック・オブジェクトの座標が決定される。たとえば、段落のワードラップ、水平な線の特定位置への配置、色の選択、その他の装置固有の処理の実行が行われる。
本発明の1つの目的は、冒頭に述べた方法であって、文書のコンテンツをより柔軟に表示サイズに適合させることを可能とする方法を提供することである。
この目的を達成するため、この方法は、上記の階層構造の複雑さを計算する工程と、その階層構造をトラバースする工程と、その階層構造のトラバースされた部分の複雑さに応じて、構造化文書の一部を条件付きで表示する工程とをさらに含むことを特徴とする。
構造化文書を階層構造、たとえばドキュメント・オブジェクト・モデル(Document Object Model;DOM)のツリーにパーズすることにより、その構造化文書はより複雑でないユニットに細分化される。すると、これらのユニットの複雑さを計算することにより、このツリー構造の複雑さを計算することができる。ここで、ツリーの1つのノードの複雑さは、好ましくはそのノードのサブツリーのサイズまで含めた、そのノードのサイズの尺度である。このサイズは、たとえば、段落やテーブルといったユニットの種類や、そのユニットが必要とする文書スペースの大きさに依存し得る。ツリーをトラバースしながらかかるノードの複雑さを利用することによって、あるノードおよびそのサブツリーが表示装置上に完全に表示できるか否かが、リアルタイムで決定される。
本発明に係る方法の1つの実施形態が、請求項2に記載されている。サブツリーを伴うあるノードの複雑さを、予め決められた閾値と比較することにより、ユーザーに対して完全に表示することができる文書部分を、容易に決定することができる。この閾値は、表示装置のディスプレイの寸法に依存するものであってもよい。この閾値はまた、ユーザー設定や、たとえば使用されているフォント・サイズに依存するものであってもよい。
本発明に係る方法の1つの実施形態が、請求項3にも記載されている。別個のページに表示される文書部分の参照先を追加することにより、ユーザーは、文書全体のコンテンツの前後関係を見失わずに済む。ユーザーは、たとえばユニフォーム・リソース・ロケーター(URL)のような、別個のページに表示される文書部分を参照する一般的なユーザー・インターフェースを提供される。
本発明に係る方法の1つの実施形態が、請求項4にも記載されている。文書を、より複雑でないユニットである要素に分解することにより、各要素の特性を考慮して要素の複雑さを決定することができる。たとえば、テーブルの要素は、テーブルの外縁やセルの境界のための追加スペースを必要とするので、段落の要素よりも複雑である。このため、テーブルには段落よりも高い複雑さの数値が付与される。これらの複雑さの数値を考慮することにより、それでもある文書部分が表示装置により単一のページに表示できるか否かが、より好適に決定される。
本発明のさらなる1つの目的は、冒頭に述べたシステムであって、文書のコンテンツをより柔軟に表示サイズに適合させることを可能とするシステムを提供することである。この目的を達成するため、このシステムは、階層構造の複雑さを計算する計算手段と、その階層構造をトラバースするトラバース手段と、その階層構造のトラバースされた部分の複雑さに応じて、構造化文書の一部を条件付きで表示する表示手段とをさらに含むことを特徴とする。
本発明のさらなる1つの目的は、文書のコンテンツをより柔軟に表示サイズに適合させることを可能とする、コンピュータプログラムコードおよび記憶装置を提供することである。この目的を達成するため、このプログラムコードは、上記の本発明に係る方法を実行するように設計され、記憶装置は、本発明に係るコンピュータプログラムを含むものとされる。
以下、図面に示された実施形態を通して、本発明について説明する。
ますます多くの装置がインターネットを利用できるものとなってきており、その数は今後も増え続けることは間違いない。インターネットへのアクセスがますますユビキタス化し、このアクセスを提供する装置がますますモバイル化するにつれて、大多数の人がインターネットのコンテンツを閲覧するのに使用するディスプレイのサイズは、小さくなっていくであろう。現在、ほとんどのインターネットのコンテンツは、コンピュータのモニターのような、より大きな表示装置上において最適な見た目となるように製作されている。個人用携帯型情報端末(PDA)のスクリーンのような、モバイル装置としては比較的大きなスクリーンに表示された場合でも、コンテンツの使い易さは格段に落ちてしまうことがある。ページの複雑さ、ナビゲーションの補助、コンテンツの適合性等、多数の要因が、インターネットのコンテンツの使い易さを左右する。もっとも一般的なテーマの1つは、デザインおよび文書構造の単純さである。このことは、モバイル装置においては一層重要である。たとえば、パソコン上で駆動している典型的なブラウザーは、閲覧対象のコンテンツ用に、800×600ピクセルのウインドウ・サイズを有し得る。このサイズは、ウェブ・ブラウザーが、メニュー、ツールバーその他の部分に使用する、スクリーン上の他のスペースを除外したサイズである。現在、最高水準のモバイル装置であっても、コストおよび実用性の問題により、全体のスクリーン・サイズは320×240ピクセルに止まっている。携帯電話では、たった100ピクセル四方の表示部を持ったものさえある。より大きなスクリーン用に製作された従来のウェブ・ページを小さな装置に表示しようとすると、ページのごくわずかしかスクリーン上で一度に見ることができないので、ユーザーは問題を抱えることになる。すなわち、ユーザーは、自分がページのどの部分を見ているのかの前後関係を見失ってしまい、そのページのナビゲーションの複雑さが増す。モバイル装置では、利用し易さの要求内容が従来のデスクトップ・パソコンと極めて異なるため、このことは、モバイル装置をターゲットにしたいと望むウェブの製作者にも問題をもたらす。
ワイヤレス・アプリケーションズ・プロトコル(Wireless Applications Protocol;WAP)やIモードのような、モバイル装置のための現行のサービスは、ワールド・ワード・ウェブ・コンソーシアム(World Wide Web Consortium;W3C)により規定されているような、HTML機能の下位セットである記述言語を使用することにより、この問題を解決している。WAPの場合には、この記述言語は、ナビゲーションを改善するために用いられる追加の構造的特徴を有する、非常に異なる記述言語である(WAPにおいて、「トランプ1組(deck of cards)」に例えられるもの)。Iモードは、多くの機能を落としたHTML形式の縮小版を用いている。いずれの場合においても、コンテンツを製作し直すか、共通フォーマットでコンテンツを製作して1つ以上の装置タイプでの使用に自動的に適合させることが必要となり、誤りや不一致、メンテナンスの負担増大に繋がる。このことの全体的な結果として、コンテンツは一次的には単一の装置タイプ向きに公開される。
ウェブ・サイトのデザイナーは、HTML形式での提供が全く想定されていなかったウェブ・ページのフォーマット作成を制御するために、テーブルを頻繁に使用する。その理由としては、異なるウェブ・ブラウザー間で、一致した見た目や操作感を提供すること、ウェブ・ベースの文書よりもむしろ印刷文書に向けられた組版スタイルに準拠すること、テーブルを使用しなければ不可能な様式的効果を実現すること、または、組版スタイルに適合するように、ページ上の特定の要素をグループ化する手法を提供することが挙げられる。
図1は、BBCニュースのサイト(http://news.bbc.co.uk)を示した図である。このニュース・サイトは、レイアウトを維持するために最大で4重に入子重ねされた、11個のテーブルを用いている。この図は、ページのコンテンツの約半分を示したものであり、高解像度のパソコンのディスプレイでさえ、ページの相当部分を見るには、ユーザーはスクロール操作をしなければならない。このコンテンツは、最高水準のモバイル装置ディスプレイの大きさよりも、幅にして約3倍、高さにして約4倍大きい。かかる複雑さは高レベルのものであり、同時にウェブ・サイトにおいては非常によくあることでもある。
このレベルの複雑さは、小さな表示装置では容易に表示することはできず、そのため使い易さは大きく影響を受ける。ユーザーは、自分がページのどの部分を見ているのかの前後関係を見失ってしまい、また、自分が見たい情報を探すために、ユーザー・インターフェース上において、クリックやスクロール等のより多くの操作を行うことを強いられる。前後関係を把握させ、ユーザーのインタラクションの必要を減らすことにより、使い易さを向上させることができる。画像の拡大縮小や文章の要約といった技術は、使い易さにおける有用な補助となるが、上記に図解したようなケースでは、その文書の内在的な複雑さが、小さなディスプレイの装置における使い易さを低下させている。使い易さを向上させる1つの方法は、この内在的な複雑さを減らすことである。
図2は、概略的なテーブルのレイアウト例を示した図である。コンテナ・テーブル200は、サブテーブル202、204、206、208および210を含んでいる。サブテーブル202は、サブ・サブテーブル212および214を含んでいる。コンテナ・テーブル200の複雑さを減らすために、プロキシ・サーバが、本発明に係る方法を実行する。プロキシ・サーバは、装置がインターネットのコンテンツにアクセスすることを可能とするための、周知慣用の機構である。プロキシ・サーバは、インターネットのコンテンツの要求を受け付け、そのコンテンツを実際に含むサーバにそれらの要求を受け渡し、返されたコンテンツを要求元のクライアントに受け渡す。これは、たとえば、ファイアーウォールを介したインターネットのアクセスの提供や、クライアントへの送信前にコンテンツを適合化することに用いられる。本発明に係る方法を実行するプロキシ・サーバは、ウェブ・ページの複雑さを減らすために、たとえばHTML形式の文書を修正する。XML形式やXHTML形式等の他のフォーマットに準拠する文書も、ウェブ・ページの複雑さを減らすために修正され得る。
コンテナ・テーブル200は、ウェブ・ページ216上に表示される。たとえばサブテーブル202をメインページ216から削除することにより、ページ216の複雑さは減り、そのページはよりナビゲーティングし易くなる。ページ216の複雑さの低減は、2つの主なやり方、すなわち、各ページのコンテンツの量を減らすために、長いページにページ区切りを挿入すること、および、テーブルの複雑さに応じて、入子重ねされたテーブルを別個のページ上に置くことにより行われる。フォーマット作成のためにテーブルを使用することは、ウェブ・ページを、整然としたセクションに分割することを可能とする。これらのセクションは、もとのコンテンツに代えてこれらのセクションへのハイパーリンクを設けることにより、別個のページに配置することもできる。入子重ねされたテーブルが多く含まれるページは、入子重ねされた各テーブルがツリーの1つのノードからなっている、ツリー構造として捉えることができる。このツリーを分割することにより、ウェブ・ページのコンテンツの複雑さを制限することが可能である。
図3は、本発明に係る方法の主要な工程を概略的に示した図である。ステップS300は、プロキシ・サーバが文書を受信する開始ステップである。ステップS302では、プロキシ・サーバは、文書をパーズし、そのパーズ・ツリーを生成する。生成されたパーズ・ツリーは、ドキュメント・オブジェクト・モデル(Document Object Model;DOM)に準拠する。DOMは、ワールド・ワード・ウェブ・コンソーシアムにより開発されたプログラミング・インターフェースの仕様である。しかしながら、上記のパーズ・ツリーは、ストリーム・ベースのHTMLパーサーにより構築された、より単純なツリーであってもよい。このストリーム・ベースのHTMLパーサーは、特別のHTMLタグを探索し、それらの特別のHTMLタグに基づいて、より単純なツリーを生成する。ストリーム・ベースのパーサーは、ページを、その構成要素であるページ要素にパーズする。これらのページ要素は、1つのページの全体的な構造およびフォーマットに影響するような、そのページの個々の部分であって、単なる文章のある一塊の個々の部分ではない。段落や、テーブル、リスト、予め整形された文章、画像、フォーム、Javaのアプレットは、独立したページ要素として捉えられる。
次のステップS304では、文書中の各要素の複雑さが計算される。各ページ要素の複雑さは、その表示可能なコンテンツのサイズ、すなわちスクリーン上に実際に表示されるグラフィック要素のサイズに、そのページ要素そのものに起因する複雑さを計算に入れるための重み係数を乗じた値として計測される。たとえば、テーブルは、テーブルの外縁やセルの境界のために追加スペースを必要とするので、単純な段落よりも複雑であり、したがってその重み係数は高くされる。リストやフォーム、テーブルといったようなページ要素は、画像や、1つのリスト項目中に含まれる複数の段落等の、入子重ねされたページ要素を包含していることがある。そのため、これらの入子重ねされたテーブル要素も、それらを含んでいるページ要素の複雑さに合算される。この複雑さの値は、その文書自体の特性であり、表示装置の特性ではない。実際上は、この複雑さの値は、その文書ツリーのサイズの尺度である。なお、各ノードの「サイズ」は、そのノードのタイプによって変わり得る。以下に説明する閾値のみが、ディスプレイのサイズその他の外的因子によって変化するものである。一例として、図4に図示するようなページを考えると、上記の複雑さは以下のようにして計測される。まず、リストの複雑さの尺度(この例ではmで表す)が取得される。続いて、2つのリスト項目のそれぞれについて、追加の複雑さの因子(この例ではnで表す)が合算される。すなわち、このリストおよびその構造の複雑さの尺度は、
(m+2n)
となる。これは、リストの構造自体の複雑さのみを考慮したものである。すなわち、そのリストを周囲の文章から分離するためと、各要素を分離するために必要とされる、水平方向および垂直方向のスペースの影響のみである。リストの実際のコンテンツの複雑さは考慮されていない。リストの実際のコンテンツの複雑さは別個に計算され、リスト項目の複雑さとリストの構造の複雑さが合算されて、そのリストの全体的な複雑さの尺度が得られる。リストの構造自体の複雑さが計算された後、各リスト項目を構成するページ要素の複雑さが考慮される。ここでは、1つ目の項目は、2つの段落からなっているとする。各段落について、一定の重み係数pに、その段落中に含まれる表示可能な文章の文字数での長さを乗じた値が、複雑さとして取得される。すなわち、1つ目のリスト項目の複雑さは、全体として
p(para+para
であると考えられる。ここで、paraとparaは、それぞれ第1段落と第2段落の長さである。2つ目のリスト項目は、文章の1つの段落を含んでいるものであり、その複雑さは上記に説明したような手法で計測される。この2つ目のリスト項目は画像も含んでおり、その画像の複雑さは、重み係数iにその面積aを乗じた値として計測される。これにより、このリスト要素の複雑さの尺度は、
p(para)+ia
として与えられる。したがって、リスト全体の複雑さは、
(m+2n)+(p(para+para))+(p(para)+ia)
として計算される。
テーブルの複雑さは、そのテーブル内の全セルの複雑さの合計に、重み係数を乗じた値として計測される。その重み係数は、そのテーブルの基本重み係数tに、行の数に関する重み値wrowsと列の数に関する重み値wcolumnsとを乗じた値からなる。すなわち、
Figure 0004248411
である。
行および列に対する重み係数の値は、各テーブル間で一定である。セルのスペーシングや、パディング、外縁サイズといった、この重み係数の値に寄与する他の因子は、セルごとの設定ではなく、要素全体の一部として設定されている。したがって、これらの因子は、行および列の重み係数の値を計算する際には考慮されず、これらの重み係数は、各テーブルごとに1回計算される。
1つのテーブルの複雑さを計算する際、入子重ねされたテーブルの複雑さは考慮されない。1つのテーブルの複雑さを計算することの目的は、そのテーブルを、上記の複雑さの尺度に基づいてサブツリーに分割することにある。したがって、ツリーが分割されると、子ノードが同一のページ上に現れないこともあり、その場合はそれらの子ノードはノードの複雑さに寄与しないため、ツリーの各ノードの複雑さは、いかなる子ノードの複雑さも包含してはならない。
ステップS306では、パーズ・ツリーの1つのノードが考察対象とされ、そのパーズ・ツリーが、深さ優先でトラバースされる。次のステップS308では、現在の複雑さのカウント値に、ノードの複雑さが合算される。ステップ310では、この現在の複雑さのカウント値が、ある閾値と比較される。この閾値は、ディスプレイの解像度、フォント・サイズおよびユーザー設定といったような、多数の特に限定されない特性に依存する。現在の複雑さのカウント値が閾値より小さければ、ステップS312において、ノードすなわちページ要素は、現在のページに書き出される。現在の複雑さのカウント値が閾値より大きければ、本方法はステップS314へと進む。ステップS314では、新しいページが生成され、現在の複雑さのカウント値がリセットされる。次のステップS316では、ユニファイド・リソース・ロケーターすなわちURL等の、上記の新しいページへのハイパーリンクが、現在のすなわちもとのページに挿入され、本方法はステップS308へと進む。このときのステップS308において、考察対象となる現在のページは上記の新しいページである。ページ要素がページに書き出されると、本方法はステップS306へと進み、次のノードが考察対象とされる。トラバースすべき残りのノードがなくなると、本方法はステップS320へと進み終了する。
HTML形式のテーブルに対しては、上記の方法の進み方はわずかに異なる。1つのテーブルが適当なページに書き出される際には、文書ツリーを深さ優先でトラバースすることにより、各セルのコンテンツが一度に1セル書き出される。そのテーブルを処理する過程において、入子重ねされたテーブルに行き当たり、その入子重ねされたテーブルが現在のページに配置するには複雑すぎるものである場合には、現在のページおよびその複雑さのカウント値は、現在開かれているページのスタック上に置かれる。その入子重ねされたテーブルのために、新しいページが生成され、その新しいページへのハイパーリンクが、現在のページの現在のセルに追加される。その後、その入子重ねされたテーブルは、その新しいページに書き出される。入子重ねされたテーブルの書出しが完了すると、そのページは閉じられ、もとのページが上記のスタックからポップアップさせられて、もとのテーブルの残りの部分が書き出される。テーブルは任意の深さに入子重ねされ得るので、上記は再帰的な処理である。
擬似コードでは、適当なテーブルの書出方法は以下のようになる。
Figure 0004248411
図4は、1つのページ400に含まれるテーブルの階層構造の、分割例を示した図である。これらのテーブルは処理される順番に番号付けされており、これを見ると、テーブルの階層構造が深さ優先でトラバースされていることがわかる。このことは、HTMLソースにおいては、各テーブルが、そのテーブルに行き当たったときに書き出されるということと合致する。テーブル402と404とはいずれもかなり単純なものであり、同一のページに書き出すことができる。しかしながら、テーブル408は、現在のページ426上の入子重ねの3階層目として書き出されるには複雑すぎる。本発明に係る方法は、新しいページ424を生成し、テーブル408をそのページ424に書き出す。その際、本方法の処理は、同じページ424に書き出すのに十分単純な、テーブル410に行き当たる。テーブル410およびテーブル408の残りのセルを処理し終えると、本方法は、現在のページ424の処理を終えて前のページ426へ戻り、テーブル404の書出しを続行する。テーブル406に行き当たると、そのテーブル406は、テーブル402および404と同一のページ上に収めるのに十分単純なものである。テーブル404の処理を終えると、本方法の処理はテーブル412に行き当たる。このテーブル412は、新しいページ428を要するに足る複雑なものである。このような処理が、階層構造内の他のすべてのサブテーブルに対し続けられる。
上記の本発明に係る方法は、HTML形式のページを例に説明されている。しかしながら、本方法は、HTML形式のページに限られるものではなく、本方法の設計原理から逸脱することなく、たとえばXML、XHTML、RDFなどどいったような、W3Cにより規定されている他の階層構造に根ざした言語に基づくページに対しても、適用可能なものである。
図5は、本発明に係るシステム502を含む装置500の主要部分を概略的に示した図である。システム502は、HTML形式の文書をロードするように設計された、コンピュータ読取可能なコード506を含んでいる。このシステムはさらに、上記に説明したようにして、HTML形式の文書を文書ツリー構造にパーズするように設計された、コンピュータ読取可能なコード504を含んでいる。コンピュータ読取可能なコード508は、HTML形式の文書の複雑さを計算するように設計されている。一方、コンピュータ読取可能なコード514は、あるページ要素が、現在のページに表示されるべきか、次の新たに生成されたページに表示されるべきかを決定するため、上記の文書ツリーを深さ優先でトラバースするように設計されている。コンピュータ読取可能なコード512は、現在のページおよび新たに生成されたページを、装置500のディスプレイに表示するように設計されている。コンピュータ読取可能なコードは、ソフトウェアのバス516を介して中央演算装置510とのやりとりが可能な、汎用メモリ中に含まれている。装置500は個人用携帯型情報端末(PDA)であるが、携帯電話等、表示性能が限られた手持型の表示装置のいかなるものであってもよい。また、この装置は、セットトップ・ボックスやデジタルテレビの受像器であってもよい。装置500は、インターネット522にワイヤレス接続されている。この装置が受信する文書は、サーバ520内に包含されている。上記の装置は、インターネット522を介して、この文書にアクセスすることができる。サーバ520とインターネット522との間の接続もワイヤレスである。ただし、いずれの接続も有線接続とされてもよい。本発明にかかる方法を実行するように設計された上述のコンピュータ読取可能なコードは、インターネット522を介して装置500にダウンロードされてもよい。あるいは、かかるコードは、本発明にかかる方法を実行するように設計されたコンピュータ読取可能なコード524を含むコンパクト・ディスク518のような、コンピュータ読取可能な媒体からダウンロードされてもよい。後者の場合には、装置500は、コンパクト・ディスク・リーダー等の適当な読取装置を備えたものとされる。
BBCニュースのサイトを示した図 概略的なテーブルのレイアウト例を示した図 本発明に係る方法の主要な工程を概略的に示した図 1つのページに含まれるテーブルの階層構造の、分割例を示した図 本発明に係るシステムを含む装置の主要部分を概略的に示した図

Claims (1)

  1. 表示手段と、
    前記表示手段のスクリーンに表示するためのページ要素からなるウェブ・ページをロードするロード手段と、
    前記ロード手段からの前記ウェブ・ページをツリー構造に分析して前記ページ要素を捉える取得手段と、
    前記ツリー構造の中からページ要素を選択する選択手段と、
    前記スクリーン上に選択されたページ要素が実際に表示されるグラフィック要素のサイズに、前記選択されたページ要素そのものに起因する重み係数を乗じることにより、前記選択手段からの前記選択されたページ要素の複雑さを計算する計算手段とを有し、
    前記表示手段は、前記スクリーンの寸法に依存した閾値と、前記計算手段から得られた前記選択されたページ要素の複雑さの値とを比較して、前記複雑さの値が前記閾値より小さければ前記選択されたページ要素を前記スクリーンに表示することを特徴とするシステム。
JP2003584911A 2002-04-15 2003-03-19 文書を表示するための方法、システム、コンピュータプログラムおよび記憶装置 Expired - Lifetime JP4248411B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02076460 2002-04-15
PCT/IB2003/001013 WO2003088035A2 (en) 2002-04-15 2003-03-19 Method, system, computer program product and storage device for displaying a document

Publications (2)

Publication Number Publication Date
JP2005522771A JP2005522771A (ja) 2005-07-28
JP4248411B2 true JP4248411B2 (ja) 2009-04-02

Family

ID=29225670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003584911A Expired - Lifetime JP4248411B2 (ja) 2002-04-15 2003-03-19 文書を表示するための方法、システム、コンピュータプログラムおよび記憶装置

Country Status (7)

Country Link
US (1) US20050144555A1 (ja)
EP (1) EP1499964A2 (ja)
JP (1) JP4248411B2 (ja)
KR (1) KR20040101468A (ja)
CN (1) CN1311336C (ja)
AU (1) AU2003208545A1 (ja)
WO (1) WO2003088035A2 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080313282A1 (en) 2002-09-10 2008-12-18 Warila Bruce W User interface, operating system and architecture
US20050138033A1 (en) * 2003-12-19 2005-06-23 Nokia Corporation Methods, applications and systems for deriving content from network resources
KR20060080011A (ko) * 2005-01-04 2006-07-07 엔에이치엔(주) 사용자 단말기에 웹페이지를 제공하는 방법 및 시스템
US7814404B2 (en) * 2005-03-03 2010-10-12 Research In Motion Limited System and method for applying workflow of generic services to component based applications for devices
EP1907948B1 (en) * 2005-07-20 2011-10-19 Obigo Korea Co., Ltd. Method and arrangement in a display system
US20070045961A1 (en) * 2005-08-31 2007-03-01 Morris Robert P Method and system providing for navigation of a multi-resource user interface
US7796837B2 (en) * 2005-09-22 2010-09-14 Google Inc. Processing an image map for display on computing device
WO2007065357A1 (fr) 2005-12-05 2007-06-14 Beijing Sursen Co., Ltd Système et procédé de traitement de documents
EP1965309A4 (en) 2005-12-05 2009-04-01 Sursen Corp SYSTEM AND METHOD FOR HIERARCHISTIC PROCESSING OF DOCUMENTS
JP4802721B2 (ja) * 2006-01-13 2011-10-26 ブラザー工業株式会社 表示データ作成装置及び閲覧端末
US20070168855A1 (en) * 2006-01-17 2007-07-19 Sushma Bharat Patel Screen splitting for Web browsers
CN100452722C (zh) * 2006-02-21 2009-01-14 南京中兴软创科技有限责任公司 一种在资源树中实现对通信资源快速定位的方法
GB2442248A (en) * 2006-09-28 2008-04-02 Martin Sabry Method of adapting a page in a markup language
DE102007032812A1 (de) * 2007-07-13 2009-01-22 Siemens Ag Verfahren und Vorrichtung zum Erstellen eines Komplexitätsvektors für zumindest eines Teils einer SVG Szene, sowie Verfahren und Prüfvorrichtung zum Überprüfen einer Abspieltauglichkeit zumindest eines Teils einer SVG-Szene auf einem Gerät
US8001158B2 (en) * 2007-12-13 2011-08-16 Hewlett-Packard Development Company, L.P. Systems and processes for evaluating database complexities
US20090327213A1 (en) * 2008-06-25 2009-12-31 Microsoft Corporation Document index for handheld application navigation
DE602009000775D1 (de) 2008-07-09 2011-04-07 Research In Motion Ltd Optimierung der Lieferung von formatierten E-Mail-Nachrichten
CN102999478B (zh) * 2011-09-15 2016-08-03 北大方正集团有限公司 一种电子文档显示方法及显示处理装置
CN102779172B (zh) * 2012-06-25 2016-06-01 北京奇虎科技有限公司 一种网页中非正文文本的识别系统及方法
US9230342B1 (en) * 2012-06-26 2016-01-05 Amazon Technologies, Inc. Rapid truncation of digital content
US10241643B2 (en) * 2012-12-21 2019-03-26 Microsoft Technology Licensing, Llc Navigating content hierarchies and persisting content item collections
CN103049547B (zh) * 2012-12-27 2016-05-25 南京新与力文化传播有限公司 一种基于IDF文档格式的iOS页面处理方法
US9507520B2 (en) * 2013-12-16 2016-11-29 Microsoft Technology Licensing, Llc Touch-based reorganization of page element
US9483387B1 (en) * 2014-03-17 2016-11-01 Amazon Technologies, Inc. Tree comparison functionality for services
CN104978315A (zh) * 2014-04-02 2015-10-14 北京大学 一种本地内容的非线性呈现方法与装置
US11567721B2 (en) 2015-06-03 2023-01-31 Oracle International Corporation Determining suitable values of parameters controlling display characteristics of elements of interactive pages
CN106775200A (zh) * 2016-11-21 2017-05-31 北京小米移动软件有限公司 用户状态信息处理方法及装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5694594A (en) * 1994-11-14 1997-12-02 Chang; Daniel System for linking hypermedia data objects in accordance with associations of source and destination data objects and similarity threshold without using keywords or link-difining terms
US5867164A (en) * 1995-09-29 1999-02-02 Apple Computer, Inc. Interactive document summarization
US6023714A (en) * 1997-04-24 2000-02-08 Microsoft Corporation Method and system for dynamically adapting the layout of a document to an output device
US5987256A (en) * 1997-09-03 1999-11-16 Enreach Technology, Inc. System and process for object rendering on thin client platforms
US6857102B1 (en) * 1998-04-07 2005-02-15 Fuji Xerox Co., Ltd. Document re-authoring systems and methods for providing device-independent access to the world wide web
US6769096B1 (en) * 1998-06-24 2004-07-27 Microsoft Corporation System and method for updating a table of contents in a frameset
US6457030B1 (en) * 1999-01-29 2002-09-24 International Business Machines Corporation Systems, methods and computer program products for modifying web content for display via pervasive computing devices
US6535896B2 (en) * 1999-01-29 2003-03-18 International Business Machines Corporation Systems, methods and computer program products for tailoring web page content in hypertext markup language format for display within pervasive computing devices using extensible markup language tools
US6538673B1 (en) * 1999-08-23 2003-03-25 Divine Technology Ventures Method for extracting digests, reformatting, and automatic monitoring of structured online documents based on visual programming of document tree navigation and transformation
WO2001057611A2 (en) * 2000-02-03 2001-08-09 Bcl Computers, Inc. System and method for manipulation of content for display on devices with small display areas
GB2366037B (en) * 2000-02-24 2004-01-21 Ibm Customising an HTML document
US6556217B1 (en) * 2000-06-01 2003-04-29 Nokia Corporation System and method for content adaptation and pagination based on terminal capabilities
US20020078091A1 (en) * 2000-07-25 2002-06-20 Sonny Vu Automatic summarization of a document
US7565605B2 (en) * 2001-05-08 2009-07-21 Nokia, Inc. Reorganizing content of an electronic document
US20030093565A1 (en) * 2001-07-03 2003-05-15 Berger Adam L. System and method for converting an attachment in an e-mail for delivery to a device of limited rendering capability
US6976226B1 (en) * 2001-07-06 2005-12-13 Palm, Inc. Translating tabular data formatted for one display device to a format for display on other display devices

Also Published As

Publication number Publication date
EP1499964A2 (en) 2005-01-26
KR20040101468A (ko) 2004-12-02
CN1647035A (zh) 2005-07-27
AU2003208545A1 (en) 2003-10-27
CN1311336C (zh) 2007-04-18
AU2003208545A8 (en) 2003-10-27
JP2005522771A (ja) 2005-07-28
WO2003088035A2 (en) 2003-10-23
WO2003088035A3 (en) 2004-11-04
US20050144555A1 (en) 2005-06-30

Similar Documents

Publication Publication Date Title
JP4248411B2 (ja) 文書を表示するための方法、システム、コンピュータプログラムおよび記憶装置
US5897644A (en) Methods and apparatus for fixed canvas presentations detecting canvas specifications including aspect ratio specifications within HTML data streams
US8707164B2 (en) Integrated document viewer
US6415278B1 (en) Retrieving documents transitively linked to an initial document
US20180159955A1 (en) Management of Pre-Loaded Content
JP4290011B2 (ja) ビューワ装置及びその制御方法、プログラム
US7360166B1 (en) System, method and apparatus for selecting, displaying, managing, tracking and transferring access to content of web pages and other sources
US20070299830A1 (en) Display of search results
CA3017231A1 (en) Improved presentation of electronic information
CN105005472B (zh) 一种web上显示维吾尔文字的方法及装置
US20030229850A1 (en) Web browser
US7047487B1 (en) Methods for formatting electronic documents
CN114625996A (zh) 网页内容的分页方法、装置、电子设备及可读存储介质
Artail et al. Device-aware desktop web page transformation for rendering on handhelds
Xie et al. An adaptive web page layout structure for small devices
JP2004295294A (ja) Web対応電子機器装置、Webコンテンツの閲覧表示方法およびプログラム
Aryal Design Principles for Responsive Web
Beszteri et al. Vertical navigation of layout adapted web documents
JP2004280203A (ja) Web対応電子機器装置、ページ閲覧表示方法およびプログラム
Valliappan et al. Transforming web pages for interactive TV using XSL
JP2003288260A (ja) コンテンツの作成方法及びシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071113

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080805

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081216

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4248411

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140123

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term