JP2009104628A - 頁付けした文書内の頁付けしていないハイパーテキストの捕獲 - Google Patents

頁付けした文書内の頁付けしていないハイパーテキストの捕獲 Download PDF

Info

Publication number
JP2009104628A
JP2009104628A JP2008321351A JP2008321351A JP2009104628A JP 2009104628 A JP2009104628 A JP 2009104628A JP 2008321351 A JP2008321351 A JP 2008321351A JP 2008321351 A JP2008321351 A JP 2008321351A JP 2009104628 A JP2009104628 A JP 2009104628A
Authority
JP
Japan
Prior art keywords
document
target
markup representation
width
physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008321351A
Other languages
English (en)
Other versions
JP4805336B2 (ja
Inventor
Richard Eric Sweet
エリック スイート リチャード
Edward Royce Warren Rowe
ロイス ワーレン ロー エドワード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adobe Inc
Original Assignee
Adobe Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=25517442&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2009104628(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Adobe Systems Inc filed Critical Adobe Systems Inc
Publication of JP2009104628A publication Critical patent/JP2009104628A/ja
Application granted granted Critical
Publication of JP4805336B2 publication Critical patent/JP4805336B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/137Hierarchical processing, e.g. outlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/959Network
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】ある文書の意味論的マークアップ表現を該文書の物理的マークアップ表現へ変換させる方法及びコンピュータプログラムを提供する。
【解決手段】本発明によれば、文書内の全てのスクリーンオブジェクトをそれらの通常の寸法で表示させるのに必要な最小幅に等しい論理的最小幅を計算し、該文書の物理的マークアップ表現で少なくとも該論理的最小幅と同じ幅を持った物理的マークアップ表現を作成し、且つ該物理的マークアップ表現をターゲット幅を含むターゲット寸法へ適合させる。ターゲット寸法に適合させる場合に、該論理的最小幅に対するターゲット寸法の要素の比から派生したスケーリング係数によって該物理的マークアップ表現の幅をスケーリングする。
【選択図】 図11

Description

本発明は、便利に見るためのハイパーテキストウエブ頁を捕獲する技術に関するものである。
インターネットのワールドワイドウエブ(「ウエブ」)は、近年、文書情報を発表する一般的な手段となっている。特に、ウエブへのアクセスを有するユーザが、例えばネットスケープナビゲータ(商標)又はマイクロソフトインターネットエクスプロアラ(商標)などのハイパーテキストブラウザを使用することによってリンクされている文書の集まりを介してブラウズすることが一般的であり、その場合に、表示されている文書内のあるスクリーンオブジェクトをユーザが選択すると、別の文書の内容が検索され且つユーザに対して表示される。
ウエブ上の文書の多くは、ハイパーテキストマークアップランゲージ(HTML)として知られるマークアップ言語を使用してエンコードされている。フレーム拡張を有するHTMLバージョン3. 2は、1997年にワイリーコンピュータパブリシングによって出版されたGraham著「HTMLソースブック(HTML Sourcebook)」、第三版に記載されている。マークアップ言語は、ビデオスクリーン又はプリンタなどの表示装置上にどの様にして表示されるべきかを記述するために文書内において埋込むことの可能な一組のコード即ちタグである。HTMLは「意味論的」マークアップ言語として知られているものである。このことは、文書のある物理的特性(例えば行間隔又はフォント寸法)などを設定するためにHTMLを使用することが可能なものではあるが、多くのHTMLタグは、例えばタイトル、パラグラフ、リスト、テーブルなどの文書の論理的特徴を単に識別するに過ぎないものであることを意味している。これらの論理的特徴が表示される精密な態様は、その文書が表示される時に決定すべくブラウザソフトウエアへ任されている。
HTMLタグは、しばしば、文書又はそのコンポーネントの固定した物理的寸法を特定するものではないので、ブラウザによって表示される特定の文書の精密な様相は、しばしば、それが表示されるブラウザウインドの寸法に依存する。例えば、図1及び2は米国特許庁(1997年9月現在ユニフォームリソースロケイタ(URL)がhttp://www.uspto.gov/で特定される)のホームウエブ頁の二つのビューを示している。図2においては、ウエブブラウザウインドは図1におけるものよりも著しく小さく、且つ、理解されるように、これら二つのウインドを介して見られるウエブ頁は、例えば、タイトル30及びリスト要素40の幅に関してその全体的な様相が異なっている。
HTMLの一つの重要な特徴は、HTML文書内において外部データ資源を参照することが可能であるということである。この様な参照がHTML内において使用される一つの方法は、そのHTML文書の表示の一部として表示されるべき内容の発生源である補助文書を識別することである。例えば、HTMLタグ「IMG」は、そのIMGタグが見つけられたHTML文書の表示の一部内において特定された画像文書の内容が表示されるべきであることを特定する。同様に、HTML文書内の「FRAME(フレーム)」タグは、特定された文書の内容がそのHTML文書によって画定されるフレームセットの特定のフレーム内に表示されるべきであることを特定する。(HTML内におけるフレーム及びフレームセットの使用については後に詳細に説明する。)
HTMLは、更に、HTML文書内のハイパーテキストリンクを有することが可能であるということを特徴としている。HTML文書内のハイパーテキストリンクは、スクリーンオブジェクト(例えば、単語又はイメージ)と外部資源との間の関連性を形成する。HTML文書がブラウザによって表示されると、ユーザはそのスクリーンオブジェクトを選択することが可能であり、且つブラウザは外部資源からの内容を検索し且つ表示することによって応答する。ハイパーテキストリンクは、例えば、HREF属性を有するHTMLアンカータグでHTML文書内において特定することが可能である。
HTML内のこの様な外部参照の使用は、ワイドエリアネットワーク(WAN)上での分散型文書格納を容易なものとさせる。大型の文書を分断し且つ外部参照によって論理的に関連付けされた一組のより小さな文書として格納することが可能である。例えば、HTML文書内のグラフィックイメージを別々の文書として格納することが一般的である(例えば、GIF又はJPEGフォーマットにおいて)。又、大きなテキストの複数個のセクションを別々の文書として格納すること、及びハイパーテキストリンクを使用することによって一つのセクションから別のセクションへ移動することを容易とさせることも一般的である。
更に、一組の予め存在する文書をHTMLタグでリンクさせて一貫性のある統一体を形成することも可能である。例えば、共通の主題に関連する一組の予め存在する文書に対してハイパーテキストリンクを含むHTML文書を作成し、ユーザによってこの様な文書を体系的にレビューすることを容易なものとさせることが可能である。
HTML文書の一つの特徴は、該文書が頁付けされていないということである。即ち、HTML文書の表示された「高さ」は、それを見るために使用されるブラウザによって表示された場合に、その中に画定されるスクリーンオブジェクトの配列及び量によってのみ決定されるものであって、その文書に関連している何らの固定した頁寸法によって決定されるものではない。(尚、「頁寸法」は、例えば、用紙上に印刷された物理的な頁のことを必ずしも言及するものではなく、単に、その文書の内容が固定した寸法で一連の領域へ分割される電子的文書の特性であるに過ぎない。)表示された文書がブラウザウインドの高さに入らない場合には、ブラウザはウエブ頁がスクロールして付加的な内容を見ることを可能とさせる。図3は図2に示した同一のブラウザウインド内に表示されている米国特許庁のホームウエブ頁を示しているが、その頁は幾分スクロールされて付加的な材料を表示している点が異なっている。
最近のHTMLに対してなされた拡張によって、単一のブラウザウインド内において複数個のスクロール可能であり且つ再寸法設定可能な「フレーム」を表示させることが可能である。フレームとは、「フレームセット」として知られる特別のタイプのHTML文書によって画定される。フレームセットはウインド内のフレームの寸法及び配向状態を与える情報を与え、且つ各フレームの内容を特定する。一つのフレームの内容は、HTML文書の内容か、又は副次的なフレームセット(即ち、その内容全体がより大きなフレームセットの単一のフレーム内に表われるフレームセット)とすることが可能である。他のHTMLスクリーンオブジェクトの場合と同様に、一つのフレームの高さ又は幅は絶対的又は相対的な意味で特定することが可能である。
図4,5,6はHTMLにおけるフレームの動作を例示している。図4は二つのフレームを含むフレームセットを表示しているブラウザウインドを示している。フレーム50はスクリーンの左側にある狭い垂直の欄である。フレーム55はフレーム50の右側にあるより幅広の欄である。フレーム50はHTML文書を有しており、それはブラウザウインドの高さと同じ長さであり、一方フレーム55はブラウザウインドの高さよりも一層大きな文書を有している。図5において理解されるように、フレーム55内に含まれるHTML文書の残部を表示させるために、フレーム55はフレーム50とは独立的にスクロールさせることが可能である。
上の例において、フレーム50は115個のピクセルからなる固定した幅を有するものとして画定されており、一方フレーム55の幅はフレーム50の幅と相対的に画定されており、即ちその幅はブラウザウインドの幅からフレーム50によって使用されている115個のピクセルを差引いたものと等しいものに設定されている。図6から理解されるように、ブラウザウインドがより小さなものとされると、フレーム55はそれに従って縮小し、一方フレーム50は固定された幅に止どまる。
上に説明したように、ブラウザによって表示されるHTML文書の究極的な様相は、通常、それが表示されるブラウザウインド(又はフレーム)の寸法に依存する。一般的に、ウエブブラウザは、HTML文書から一連のスクリーンオブジェクト(例えば、単語、イメージ、リスト、フレーム又はテーブル)を抽出し、且つそれらをスクリーン上において逐次的に行毎に配置させる。一つの行が満杯となると、次のオブジェクトはそれに続く行内に配置される。このプロセスは、HTML文書内の全てのスクリーンオブジェクトが配置されるまで継続して行われる。
しかしながら、この一般的な原理は、表示されたHTML文書の幅はその中に含まれる最も幅広のスクリーンオブジェクトの最小幅よりもより小さなものとすることはできないという拘束条件によって制限される。この拘束条件下において、あるスクリーンオブジェクトの最小幅がブラウザウインドの幅よりも一層大きいものである場合には、ブラウザウインドを介して見る場合に、その文書の一部はスクリーンから外れたままであり(左又は右)、且つ典型的には、水平スクロールバーが表示されて、ユーザがその文書のビューを左又は右へシフトさせることを可能とする。
HTMLスクリーンオブジェクトは、固定されているか又は可変の何れかの幅を有することが可能である。例えば、HTML文書内のテキストの単一の単語の幅は固定されている(それを表示するためのブラウザによって選択されているフォントによって与えられる)。その幅は、その単語内のキャラクタ及びそれが表示されるフォント寸法によって決定される。同様に、HTMLテーブル内のセルの幅は、ある数のピクセルとしてその幅を明示的に特定することによって固定することが可能である。
これと対比して、可変幅スクリーンオブジェクトの幅は、それが表われるブラウザウインドの幅に依存して変化する。しかしながら、可変幅スクリーンオブジェクトであっても最小幅を有している。例えば、テキストの1個のパラグラフの幅は、通常、ブラウザウインドの寸法に従って変化するが、それは、該パラグラフ内に含まれる最も幅広の単語よりも幅狭のものとすることはできない。同様に、イメージを含むテーブルは、その幅が相対的な意味で画定されているセルを有することが可能であるが、該テーブルは、それにも拘らず、その最も幅広の行内のイメージの幅の和よりも小さいものとすることはできない。
この拘束条件を図7,8,9,10に例示してある。図7,8,9の各々において、同一のHTML文書がブラウザウインド65内に表示されている。その背後に存在するHTMLコードの一部を図10に示してある。図7及び10を参照すると、表示されている文書は上側が揃えられている2個のセルを有するテーブル80を包含しており、1個のセル85はクライエント側イメージマップを包含しており且つ他方のセル90は「US PATENT AND TRADEMARK OFFICE(米国特許庁)」という見出しと、水平線と、「New on the PTO site;米国特許庁サイトでの新しいこと)」という見出しを有する順番付けされていないリストとを包含している。図8において、ウインド65は図7におけるよりも一層幅狭であるが、スクリーン上のどのオブジェクトの最小幅よりも幅広である。従って、該文書の各線はウインド65の幅と同じに調節されており且つブラウザウインドの右側においてユーザから隠されているものは何もない。これと対比して、図9においては、ウインド65はテーブル80の最小幅よりも一層幅狭である。セル85におけるイメージマップの固定幅+セル90における最も幅広の単語の幅(「TRADEMARK」の単語)がブラウザウインド65の幅よりも一層大きいからである。従って、その文書の結果的に得られる表示幅はウインド65よりも一層幅広であり、該文書の最も右側の部分はビューから隠れることとなる。
ウエブ上の視覚的表示データの集まりは、典型的に、リンクされているHTML文書のセットとして格納されるものであるが、例えばポータブルドキュメントフォーマット(PDF)のような物理的マークアップ言語を使用して固定頁寸法を持った単一文書として格納させることも一般的であり且つ便利である。PDFはアドビシステムズ、インコーポレイテッドの出版物である「ポータブルドキュメントフォーマット参照マニュアル(Portable Document Format Reference Manual)」、アジソン・ウエズリ出版社、1993年の文献に記載されている。
Graham著「HTMLソースブック(HTML Sourcebook)」、第3版、ワイリーコンピュータパブリシング、1997年 「ポータブルドキュメントフォーマット参照マニュアル(Portable Document Format Manual)」、アジソン・ウエズリ出版社、1993年 山科 幸久、「SGMLを使用したマニュアル作成システムの紹介」、情報処理学会研究報告、社団法人情報処理学会、1997年9月19日、第97巻、第93号、25−30頁 隅 夏樹、「ホームページスーパーテクニック:Java,Movieなどであなたのホームページに華麗なる演出を!」、Mac Fan Internet、株式会社毎日コミュニケーションズ、1997年8月1日、第2回、第8号、130−133頁 特開平6−309128号公報
本発明は、以上の点に鑑みなされたものであって、上述した如き従来技術の欠点を解消し、HTMLなどの意味論的マークアップ言語で記載されている複数個のウエブ頁をPDFなどの物理的マークアップ言語で記載されている単一の頁付けした文書内へ統合させることを可能とした技術を提供することを目的とする。本発明の別の目的とするところは、頁付けした文書内における頁付けしていないハイパーテキストを捕獲する技術を提供することである。
一般的に、一つの側面においては、本発明は、一つの文書の意味論的マークアップ表現を該文書の物理的マークアップ表現へ変換する方法を提供している。本方法は、文書内の全てのスクリーンオブジェクトをそれらの通常の寸法で表示するのに必要な最小幅に等しい論理的最小幅を計算し、該文書の物理的マークアップ表現であって該論理的最小幅と少なくとも同じ幅を有する物理的マークアップ表現を作成し、且つ該物理的マークアップ表現をターゲット幅を含むターゲット寸法へ適合させ、その場合に該物理的マークアップ表現を該論理的最小幅に対する該ターゲット寸法の要素の比から派生したスケーリング係数によってスケーリングさせる。本発明の好適実施例では、以下の特徴の一つ又はそれ以上を有するものである。該物理的マークアップ表現は新しく作成した文書内に組込む。該物理的マークアップ表現は既存の文書内へ組込む。該ターゲット寸法の該要素はターゲット幅である。該物理的マークアップ表現は、各々がそれぞれの物理的幅及びそれぞれの物理的高さを持った頁を包含する頁付けした表現である。該ターゲット寸法はターゲット高さを有している。該ターゲット寸法は標準の用紙寸法である。該標準の用紙寸法は、8. 5×11インチ、8. 5×14インチ、A4、A5、11×17インチのうちの一つである。該物理的マークアップ表現の頁はターゲット寸法と同一のアスペクト比を有している。該物理的マークアップ表現の高さは、該スケーリング係数によってスケーリングされる。該物理的マークアップ表現の頁高さは該スケーリング係数によってスケーリングされる。該ターゲット寸法の要素はターゲット高さである。該物理的マークアップ表現の頁は+又は−90°だけ回転される。論理的最小幅に対するターゲット幅の比は、それが特定したスレッシュホールド未満であるか否かテストする。該文書は複数個のフレームを特定するフレームセットである。該文書は少なくとも1個のハイパーテキストリンクを包含しており、該物理的マークアップ表現はビュア内に表示され、且つ表示されたマークアップからハイパーテキストリンクがユーザによって選択される場合に外部文書がアクセスされる。該ハイパーテキストリンクはサーバ側イメージマップである。該意味論的マークアップ表現はHTMLである。該物理的マークアップ表現はPDFである。該物理的マークアップ表現がターゲット寸法へ適合された後に、該物理的マークアップ表現は、該スケーリング係数の逆数によってスケーリングされ且つその結果がビュア内に表示される。
一般的に、別の側面においては、本発明はハイパーテキストデータを表示する方法を提供している。本方法は、ビュア内において、物理的マークアップ表現で表現されており且つ少なくとも1個のハイパーテキストリンクを包含する第一文書を表示し、ハイパーテキストリンクが該表示された第一文書からユーザによって選択される場合に外部文書へアクセスし、該外部文書の意味論的マークアップ表現を物理的マークアップ表現へ変換し、且つ該外部文書の物理的マークアップ表現を該第一文書内に組込む、ことを包含している。本発明の好適実施例は、以下の特徴の一つ又はそれ以上を有している。ハイパーテキストリンクは外部文書の物理的マークアップ表現へポイントするように修正される。該ハイパーテキストリンクの元の状態が保存される。該第一文書の一部を削除する動作に応答して、該削除された部分に対してポイントするハイパーテキストリンクがその元の状態へ復帰される。該外部文書が要約されて該外部文書のダイジェストを作成し、且つ該外部文書のダイジェストは、該外部文書の物理的マークアップ表現が既に該第一文書内に組込まれているか否かを決定するためにテストされる。該外部文書は、主要文書と1個又はそれ以上の補助文書とを有している。各補助文書は要約されてそれぞれの補助文書ダイジェストを作成し、且つ各補助文書のデジタルダイジェストは、該外部文書の物理的マークアップ表現が既に該第一文書内に組込まれているか否かを決定するためにテストされる。該デジタルダイジェストは複合ダイジェストである。
一般的に、別の側面においては、本発明は、主要文書と1個又はそれ以上の補助文書とを有するデータの集まりの区別用識別子を形成する方法を提供している。本方法は、各補助文書を要約してそれぞれの補助文書ダイジェストを作成し、且つ該主要文書と全ての補助文書ダイジェストとの連結を要約することによって区別用識別子を作成することを包含している。本発明の好適実施例は以下の特徴のうちの一つ又はそれ以上を有している。デジタルダイジェストアルゴリズムが適用される。該デジタルダイジェストアルゴリズムはMD5メッセージダイジェストアルゴリズムである。
一般的に、別の側面においては、本発明は、階層的ファイルシステム上の最初の文書に対して推移的にリンクされている文書を検索する方法を提供している。本方法は、該最初の文書を検索し且つ該最初の文書からその他の文書への推移的リンクが存在しており且つ該推移的リンクが全て該最初の文書と同一のディレクトリパス内にある文書を包含しているその他の文書のみを検索することを包含している。本発明の好適実施例は以下の特徴のうちの一つ又はそれ以上を有している。該階層的ファイルシステムはネットワーク上に分散されている。該階層的ファイルシステムはインターネット上に分散されている。
一般的に、別の側面においては、本発明は、文書の意味論的マークアップ表現を該文書の物理的マークアップ表現へ変換するためのコンピュータによって読取り可能な媒体上に存在しているコンピュータプログラムであって、該コンピュータプログラムが、コンピュータをして、該文書内における全てのスクリーンオブジェクトをそれらの通常の寸法で表示させるために必要な最小幅に等しい論理的最小幅を計算させ、該文書の物理的マークアップ表現であって少なくとも該論理的最小幅と同じ幅を持った物理的マークアップ表現を作成させ、且つ該物理的マークアップ表現をターゲット幅を含むターゲット寸法へ適合させる、上記各命令を有しており、該コンピュータをして物理的マークアップ表現を適合させる命令が、コンピュータをして、該論理的最小幅に対するターゲット寸法の要素の比から派生されたスケーリング係数によって該物理的マークアップ表現の幅をスケーリングさせる命令を有しているコンピュータプログラムを提供している。本発明の好適実施例は、以下の特徴のうちの一つ又はそれ以上を有している。該プログラムは、コンピュータをして、物理的マークアップ表現を新たに作成した文書内に組込ませる命令を有している。該プログラムは、コンピュータをして、物理的マークアップ表現を既存の文書内に組込ませる命令を有している。該ターゲット寸法の該要素はターゲット幅である。該物理的マークアップ表現は、各々がそれぞれの物理的幅とそれぞれの物理的高さとを持った複数個の頁を包含する頁付けした表現である。該ターゲット寸法はターゲット高さを包含している。該ターゲット寸法は標準の用紙寸法である。該標準の用紙寸法は、8. 5×11インチ、8. 5×14インチ、A4、A5、11×17インチのうちの一つである。該物理的マークアップ表現の頁は、該ターゲット寸法と同一のアスペクト比を有している。本プログラムは、コンピュータをして、スケーリング係数によって物理的マークアップ表現の高さをスケーリングさせる命令を有している。本プログラムは、コンピュータをして、該スケーリング係数によって物理的マークアップ表現の頁高さをスケーリングさせる命令を有している。該ターゲット寸法の該要素はターゲット高さである。本プログラムは、コンピュータをして、物理的マークアップ表現の頁を+又は−90°だけ回転させる命令を有している。本プログラムは、コンピュータをして、該論理的最小幅に対するターゲット寸法の比が特定したスレッシュホールド未満であるか否かをテストさせる命令を有している。該文書は複数個のフレームを特定するフレームセットである。該文書は少なくとも1個のハイパーテキストリンクを包含しており且つ本プログラムは、コンピュータをして、ビュア内に物理的マークアップ表現を表示させ且つ表示されたマークアップからユーザによってハイパーテキストリンクが選択される場合に外部文書へアクセスさせる命令を有している。該ハイパーテキストリンクはサーバ側イメージマップである。該意味論的マークアップ表現はHTMLである。該物理的マークアップ表現はPDFである。本プログラムは、コンピュータをして、該物理的マークアップ表現をターゲット寸法へ適合させた後に、該物理的マークアップ表現を該スケーリング係数の逆数によってスケーリングさせ且つその結果をビュア内に表示させる命令を有している。本プログラムは、コンピュータをして、ビュア内において、物理的マークアップ表現で表わされており且つ少なくとも1個のハイパーテキストリンクを含む第一文書を表示させ、表示された第一文書からユーザによってハイパーテキストリンクが選択された場合に外部文書へアクセスさせ、該外部文書の意味論的マークアップ表現を物理的マークアップ表現へ変換させ、且つ該外部文書の物理的マークアップ表現を該第一文書内に組込ませる命令を有している。本プログラムは、コンピュータをして、該外部文書の物理的マークアップ表現へポイントさせるようにハイパーテキストリンクを修正させる命令を有している。本プログラムは、コンピュータをして、該ハイパーテキストリンクの元の状態を保存させる命令を有している。本プログラムは、コンピュータをして、該第一文書の一部の削除動作に応答して、該削除された部分に対してポイントしているハイパーテキストリンクをその元の状態へ回復させる命令を有している。本プログラムは、コンピュータをして、該外部文書を要約して該外部文書のダイジェストを作成させ、且つ該外部文書の物理的マークアップ表現が既に該第一文書内に組込まれているか否かを決定するために該外部文書のダイジェストをテストさせる命令を有している。該外部文書は、主要文書と1個又はそれ以上の補助文書とを有している。本プログラムは、コンピュータをして、各補助文書を要約してそれぞれの補助文書ダイジェストを作成させ且つ該外部文書の物理的マークアップ表現が既に該第一文書内に組込まれているか否かを決定するために各補助文書のデジタルダイジェストをテストさせる命令を有している。該デジタルダイジェストは複合ダイジェストである。
一般的に、別の側面においては、本発明は、主要文書と1個又はそれ以上の補助文書とを有するデータの集まりの区別用識別子を形成するためにコンピュータによって読取り可能な媒体上に存在しているコンピュータプログラムにおいて、コンピュータをして、各補助文書を要約してそれぞれの補助文書ダイジェストを作成させ且つ該主要文書と全ての補助文書ダイジェストとの連結を要約することにより区別用識別子を作成させる命令を有しているコンピュータプログラムを提供している。本プログラムは、コンピュータをして、デジタルダイジェストアルゴリズムを適用させる命令を有している。該デジタルダイジェストアルゴリズムはMD5メッセージダイジェストアルゴリズムである。
一般的に、別の側面においては、本発明は、階層的ファイルシステム上の最初の文書へ推移的にリンクされている文書を検索するためのコンピュータによって読取り可能な媒体上に存在しているコンピュータプログラムにおいて、コンピュータをして、該最初の文書を検索させ、且つ該最初の文書からその他の文書への推移的リンクが存在しており且つ該推移的リンクが全て該最初の文書と同一のディレクトリパス内に存在している文書を包含しているその他の文書のみを検索させる、命令を有しているコンピュータプログラムを提供している。本発明の好適実施例は、以下の特徴のうちの一つ又はそれ以上を有している。該階層的ファイルシステムはネットワーク上に分散されている。該階層的ファイルシステムはインターネット上に分散されている。
本発明の効果としては以下に記載する一つ又はそれ以上のものがある。HTMLなどの意味論的マークアップ言語で記載されているウエブ頁を、PDFなどの物理的マークアップ言語で記載されている単一の頁付けした文書内に統合させることが可能である。ウエブ頁は、空間的拘束条件のために情報を失うことなしに、固定した頁寸法を持ったフォーマットへ変換させることが可能である。主要文書及び関連する補助文書に対して事実上独特の単一の識別子を作成することが可能である。一つの文書へリンクされており、且つ同一のディレクトリパス内に存在する文書の全てをファイルシステムから検索することが可能である。
図11を参照すると、クライエントソフトウエアを稼動しているユーザコンピュータ100が、通信リンク102を介して、ウエブサーバ140のようなウエブサーバへ接続している。ウエブサーバは例えば頁144のようなウエブ頁を含むデータ格納部142のようなデータ格納部へリンクされている(静的又は動的)。クライエントソフトウエア(それは、1個又はそれ以上の別のプログラム、及びプラグインモジュール及びオペレーティングシステム拡張を包含することが可能)は、典型的に、モニタ104のようなディスプレイ装置上に情報を表示し且つキーボード(不図示)及びマウス106のようなカーソル位置決め装置からユーザの入力を受取る。コンピュータ100は、通常、マウス106のユーザによる移動がディスプレイ104上に表示されているカーソルグラフィックの対応した移動を発生させるようにプログラムされている。
コンピュータ100のプログラミングは、マウス106から位置情報を受取り且つそれをコンピュータ100上で稼動しているアプリケーションプログラムへ供給するインターフェース108を有している。この様なアプリケーションプログラムの中には、ウエブブラウザ110、PDFビュア120がある。又、コンピュータ100上ではウエブ頁インテグレータ135が稼動しており、それはPDFビュア120の一部とさせることが可能である。ユーザからの要求に応答して、PDFビュアは、ウエブ頁インテグレータ135に対して一つ又はそれ以上のウエブサーバ(例えばウエブサーバ140)から、ユーザによって供給されたURLによって特定される最初の文書及び該最初の文書に対して直接的に又は間接的にリンクされているその他の文書を検索させることを要求することが可能である。要求された文書が検索されると、ウエブ頁インテグレータはそれらを単一のPDF文書内へ統合させ、それは、次いで、PDFビュア120によって表示される。
PDFビュアによって表示されるPDF文書は、ウエブ頁に対するハイパーテキストリンクを有すると共に、PDF文書内の内部頁に対するハイパーリンクを有することが可能である。ユーザがPDF文書内のハイパーリンクを、例えば、マウスで選択すると、そのリンクが該PDF文書内における一つの頁に対するものである場合には、その頁がPDFビュアによって表示される。しかしながら、そのハイパーテキストリンクがウエブ頁に対するものである場合には、その頁はユーザによって設定されたモードに依存して、ブラウザによって表示されるか、又はPDF文書内へ統合され且つPDFビュアによって表示される。
図12、12a、12bはウエブ頁を単一の頁付けした文書内へ組込む方法のフローチャートであって、プログラムしたコンピュータシステムにおいて実現される場合について説明する。第一に、システムがユーザに対して既存のPDF文書の名前、又はURLとウエブ横断基準を与えるようにユーザに質問を行う(ステップ200)。ユーザがPDF文書の名前を与える場合には、その文書は「ターゲット文書」となる(ステップ210)。そのターゲット文書はPDFビュア内に表示され且つユーザ入力を待機する(ステップ220)。ユーザがURLとウエブ横断基準とを与える場合には、新たな空のPDF文書が作成される。この文書はターゲット文書となる。ターゲット文書のパラメータが設定され、それはデフォルト値又はユーザからの入力の何れかに従って、その文書内の頁のターゲット幅及びターゲット高さ(集約的に、該文書の「ターゲット寸法」)を特定する。次いで、FetchAndIncorporate(フェッチアンドインコーポレイト)ルーチンが呼出され、それは、URLによって特定された開始文書、及び該開始文書へリンクされており且つウエブ横断基準を満足するその他の文書をターゲット文書内へ組込む(ステップ230)。次いで、ターゲット文書はPDFビュアによって表示され、システムはユーザ入力を待機する(ステップ220)。
ターゲット文書の頁は、通常、それらのターゲット寸法、即ちそれらのPDFエンコーディングで特定された頁の寸法で表示される。しかしながら、ユーザの要求により、該頁をそれらの「自然の寸法」で表示させることが可能である。頁の「自然の寸法」とは、ターゲット寸法と同一のアスペクト比を有しているが、該ターゲット幅のうちの一層大きなものに等しい幅及びその頁を組込んだウエブ頁をブラウザ内において表示するのに必要な最小幅を持った寸法のことを意味している。
ユーザがハイパーテキストリンクを選択すると(ステップ235)、図12aを参照すると、そのリンクが検査されて、それが既にターゲット文書内へ組込まれている文書に対してポイントするものであるか否かを決定し(ステップ240)、且つ、そうである場合には、前に組込んだ文書に対応するターゲット文書の頁をPDFビュアで表示させる(ステップ250)。そうでない場合には、ユーザが設定可能なフラグであるIncorporate?の値をチェックし(ステップ260)且つ以下のステップのうちの一つを行う。
Incorporate?フラグがFALSE(偽)である場合には、ハイパーテキストリンクによって特定されたURLがそのURLに対応する文書を表示するための命令と共に標準のウエブブラウザプログラムへ供給される(ステップ270)。
Incorporate?フラグがTRUE(真)である場合には、FetchAndIncorporateルーチンが、URL、及びそのURLと関連する文書のみが検索されることを特定するウエブ横断基準と共に呼出される(ステップ280)。その結果、そのURLによって特定された文書に対応するターゲット文書内に1個又はそれ以上の頁が作成される。次いで、これらの頁のうちの第一のものがPDFビュアによって表示される(ステップ290)。
再度図12を参照すると、ユーザがターゲット文書内に含まれるフォームを提起することを要求すると(ステップ300)、図12aに示したように、該フォームの内容が適宜のサーバへ提供される(ステップ310)。フォームの提供に応答してサーバから受取ったウエブ文書は、ウエブブラウザ内に表示されるか(ステップ330)又はConvertToPDF手順(以下に詳細に説明する)によってターゲット文書内へ組込まれ且つIntegrate?フラグの値に従って(ステップ320)、PDFビュアによって表示される(ステップ340)。
再度図12を参照すると、ユーザがターゲット文書内のサーバ側イメージマップ上の点を選択する場合には以下のステップがとられる(ステップ350)。(サーバ側イメージマップは、ユーザがマウスなどのポインティング装置を使用して該イメージ内の任意の点を選択する場合に、そのイメージ内のその点の座標が特定したサーバへ提供され、該サーバがブラウザへ文書を送ることによって応答するようにブラウザ内に表示されるイメージのことである。)第一に、且つ図12bを参照すると、ユーザによって選択された座標は現在表示されている頁と関連している変数ScalingFactorの値によって割算される(ステップ360)。変数ScalingFactorは、存在する場合には、ターゲット文書内の頁上に入るように元のサーバ側イメージマップの寸法を減少させた量を表わす。その結果得られる座標値がサーバへ送信され(ステップ360)、且つIncortorate?フラグの値に従って(ステップ370)、該サーバによって送信された文書がウエブブラウザによって表示されるか(ステップ380)、又はターゲット文書内に組込まれ且つPDFビュアによって表示される(ステップ390)。
再度図12を参照すると、ユーザがターゲット文書から頁を削除することを要求すると(ステップ400)、図12bを参照して説明すると、その頁は削除され(ステップ410)、且つその頁に対してポイントしていた該文書内の全てのハイパーテキストリンクは外部リンクとなるべくリセットされる(ステップ420)。
ユーザの要求が処理されると、制御はステップ220へ復帰し、そこでユーザからのさらなる要求を待機する。
図13はFetchAndIncorporateルーチンのステップを示したフローチャートであり、それは、与えられたURLからターゲット文書へリンクされている文書の集まりを検索する。最初に、そのURLは未決のURLのリスト上に配置される(ステップ500)。次いで、ユーザによって特定された基準に従って、該リスト上のURLの何れかが有効であるか否かを決定するために該リストのチェックを行う(ステップ510)。
ユーザによって特定することが可能な一つのウエブ横断基準は最大深さ基準である。この基準は、FetchAndIncorporateルーチンへの反復するコール即ち呼出しの深さを制限し、従って最初に検索した文書とターゲット文書内に組込むべき後に検索した文書との間の「リンク距離」を制限する。
ユーザによって特定することの可能な別の基準は「ステイ・オン・サーバ(stay on server)」基準である。この基準がセットされると、最初に検索した文書と同一のサーバを表わすURLを有する文書のみが検索される。ユーザによって設定することの可能な別の基準は「同一パス」基準である。この基準がセットされると、最初に検索した文書と同一のファイルシステムディレクトリ(又はそのディレクトリのサブディレクトリ)を表わすURLを有する文書のみが検索される。
リスト上に有効なURLが存在する場合には、このリスト上の最初の有効なURLによって識別された文書がFetchDocルーチンを呼出すことによって検索される(ステップ520)。FetchDocルーチンは、ターゲット文書から一組の頁を返すか、又は0又はそれ以上の関連する補助文書を有するウエブサーバから検索された文書を返す。FetchDocルーチンがターゲット文書から頁を返すと(ステップ530)、このことは、要求された文書が既にターゲット文書内に組込まれていることを表わし、且つ該ルーチンはステップ560において継続して行われる。
FetchDocルーチンがウエブサーバからPDF頁を包含する文書をリターン即ち返すと、これらの頁はターゲット文書の終わりにアペンドされる(ステップ540)。
FetchDocルーチンがウエブサーバから非PDF文書(多分、関連する補助文書と共に)を返すと、ConvertToPDFルーチンが呼出される(ステップ550)。ConvertToPDFルーチンは、引数として非PDF文書及びその補助文書をとり且つターゲット文書へアペンドされる対応するPDF頁を作成する。
次に、FetchDocルーチンによって返された文書内のハイパーテキストリンクによって参照されるURLの全てが未決のURLのリストへ付加され(ステップ560)、且つ制御はステップ510へ返される。
この様に、ターゲット文書へリンクされている全ての文書及びこれらの文書にリンクされている全ての文書などが、ユーザによって特定されたウエブ横断基準に従って検索される。本明細書においては「推移的リンク」という用語を使用するが、それは二つの文書が、それらを接続する一連の1個又はそれ以上のリンクが存在していることを示すものである。
任意の時刻において、未決のURLのリストが有効なURLを包含するものではない場合には、ターゲット文書内のハイパーテキストリンクは、ターゲット文書内に組込まれた文書へリンクしているハイパーテキストリンク(本書においては「内部リンク」と呼称する)が今やウエブからの対応するHTML文書に対してではなくターゲット文書内の対応する頁に対してポイントするように修正される(ステップ570)。元のリンク情報(即ち、ウエブをベースとしたデータ資源に対してポイントしているURL)は、維持される。内部リンクが無効なものとなると(例えば、それがポイントする頁がターゲット文書から削除された場合)、元のリンク情報は、ウエブからのデータへアクセスするために使用することが可能である。
図14はFetchDocルーチンによってとられるステップを示したフローチャートである。特定されたURLは、それが既にターゲット文書の頁内に組込まれているウエブからの文書に対応するものであるか否かを判別するためにチェックされる(ステップ600)。(URLはその様に対応することが可能である。なぜならば、URLはターゲット文書の頁として前に組込まれてた文書を参照するからであり、又は以下に更に詳細に説明するように、ターゲット文書の頁内に組込んだ文書を参照するURLと等価なものとして以前に発見されていたからである。)そうである場合には、ターゲット文書からの対応する頁がリターン即ち返される(ステップ610)。
そうでない場合には、要求された文書(本書においては、「主要な文書」と呼称する)はウエブサーバから検索される(ステップ620)。主要文書がスキャンされ、且つ主要文書のディスプレイ内に含まれるべき全ての補助文書(存在する場合)のURLが注記される(ステップ630)。フレームセットではないHTML文書の場合には、該補助文書はイメージ(画像)文書を包含する場合がある。フレームセットの場合には、これらの補助文書はフレームの内容を供給する文書を包含している。
補助文書を参照する各URLに対して、該補助文書がイメージ文書である場合には、URLがターゲット文書の頁内に既に検索された文書を参照するか否かを決定する。このことは、URLをターゲット文書内に前に組込んだURL参照用イメージ文書のリストと比較することによって行われる。(URLがこのリスト上に表われる場合がある。なぜならば、それはターゲット文書内に前に組込んだイメージ文書を参照するからであるか、又は以下に更に詳細に説明するように、ターゲット文書内に前に組込んだイメージ文書を参照するURLと等価なものであることが前もって判明していたからである。)そうである場合には、対応するイメージに対する間接的なオブジェクト参照がターゲット文書から検索される(ステップ640)。そうでない場合には、URLによって識別された補助文書がウエブから検索される(ステップ640)。ウエブから検索された各補助文書に対して、インターネットエンジニアリングタスクフォースによって発表されたRFC1321文書、MD5メッセージダイジェストアルゴリズムにおいて記載されているMD5ダイジェストアルゴリズムのような非線形ダイジェスト(要約)用アルゴリズムを使用して数値的な「ダイジェスト」が作成される(ステップ650)。該文書に対してMD5を適用することによって作成されたダイジェストはMD5を異なる文書に適用することによって発生される蓋然性が極めて少ない数値である。従って、それは、その文書に対して事実上ユニークな識別用の「シグナチャ」として作用する。
イメージ文書である各補助文書に対して、該ダイジェスト値がターゲット文書の頁内に既に組込まれている文書に対するダイジェスト値と比較される。一致が見つかると、検索されたイメージ文書が廃棄され、その文書に対する間接的オブジェクト参照がターゲット文書からその代わりに検索され、且つ補助文書に対するURLが一致したイメージと関連しているURLを有する等価なクラス内に配置される(ステップ660)。オプションとして、等価クラス内のURLは、満期日付でマーク付けすることが可能であり、それは、その日付の後にそれらが等価クラスから除去されるべきであることを表わす。このことを行うことが可能であるので、時間と共に変化する蓋然性のある資源を参照するURLが「陳腐」なものとなることはない。
注意すべきことであるが、ウエブ上においては、語彙的には別個のURLが同一又は同じ内容に対してポイントするものであることは通常である。数値的ダイジェストを使用することによって、ターゲット文書内に複製の頁及びイメージを組込むことを回避することによって空間が節約される。
補助文書の全てが検索されると(ウエブから又はターゲット文書内に前に組込んだ内容に対する間接的な参照として)、補助文書の全てのダイジェストと主要文書の内容との連結に対してダイジェストアルゴリズムを適用することによって新たなダイジェストが作成される(ステップ670)。その結果得られる「複合ダイジェスト」は主要文書のダイジェストである。
単純なダイジェスト(即ち、主要文書のみの内容のダイジェスト)ではなく主要文書の複合ダイジェストを使用することは、テキスト的には同一であるが異なる内容の表示となる主要文書間の区別を行うという利点を与える。例えば、HTML文書内の補助文書は相対的参照として特定することが可能である。即ち、URLは例えばサーバ名又はディレクトリ名を特定することなしに文書名を特定することが可能である。この様な相対的参照はその参照が形成された文書と同一のサーバ上及び同一のディレクトリ内の文書に対する参照として解釈される。従って、補助文書に対する同一の相対的参照を有する二つの主要文書は、それらが異なるホスト上において見つかった場合に、実際には異なる補助文書を参照する場合がある。
テキスト的に同一の主要文書は、又、それらが異なる時間において検索される場合に観察者に対して異なった表われ方をする場合がある。なぜならば、該文書によって参照される補助文書の内容は時間と共に変化する場合があるからである。
複合ダイジェストを使用することは、主要文書とその補助文書の両方の内容を、該主要文書をこれらの頁の複製物として取扱うか否かを決定する前に、既存のターゲット文書頁と効率的に比較することを可能とする。
次いで、主要文書の複合ダイジェストをチェックして、それがターゲット文書の一つの頁又は複数個の頁として前に組込まれた何れかのウエブ文書のダイジェストに対応するか否かを判別する(ステップ680)。そうである場合には、該主要文書は廃棄され、前に組込んだウエブ文書に対応するターゲット文書の頁が返され、且つ該主要文書に対するURLが一致した前に組込んだ文書と関連しているURLを有する等価クラス内に配置される(ステップ660)。そうでない場合には、該主要文書は、それと関連する補助文書と共にリターン、即ち返される(ステップ700)。
図15はConvertToPDFルーチンのステップを示したフローチャートである。ConvertToPDFルーチンは、引数として、非PDF文書及びその補助文書をとる。最初に、主要文書がチェックされて、それがHTML文書であるか否かが判別される(ステップ800)。そうでない場合には(即ち、それが例えばイメージ文書などの何らかのその他のタイプの文書である場合)、それは通常の技術を使用してターゲット文書内に組込まれる(ステップ810)。
主要文書がHTML文書である場合には、該主要文書及び補助文書が、標準のパーシング(構文解析)技術を使用して、スクリーンオブジェクト(例えば、文書ボディ、テーブル、リスト、イメージ、パラグラフ)のパースツリー(parce tree)へ構文解析する(ステップ820)。この様な技術は、例えば、Aho及びUllman著「コンパイラ設計の原理(Principlesof Compiler Design)」、アジソン・ウエズリー出版社、1977の文献に記載されている。
次に、LayoutRegionデータ構造を作成する。LayoutRegionデータ構造は、特定のPDF文書を介しての固定幅ストライプを表わす。該LayoutRegionデータ構造は、更に、ポインタcurYを有しており、それはレイアウトが行われるべき文書内の現在の垂直位置を特定する。LayoutRegionデータ構造は、更に、それが参照するPDF頁の幅及び高さを表わす頁寸法情報を有している。LayoutRegionデータ構造は、更に、所謂「フローティングイメージ」のリストを有しており、該フローティングイメージはLayoutRegionの左側又は右側の端部における固定した垂直位置を占有すべく画定され、且つその周りに他のスクリーンオブジェクトがフロー即ち流れる。図16はテキスト840の幾つかのラインをレイアウトし且つ二つの相次ぐPDF頁860内に四つのイメージ850を配置するために使用されているレイアウト領域830を模式的に示している。
再度図15を参照すると、LayoutRegionが形成され、従ってcurYはターゲット文書の最後に存在する頁の最下部端部に対してポイントする。(慣習によって、この位置に配置された任意のPDFスクリーンオブジェクトは次続の頁の上部に表われる。)LayoutRegionの左側及び右側の範囲は、ターゲット文書内の頁の所望の幅に等しく設定される。頁高さ及び幅情報はターゲット文書の頁寸法と等しく設定される(ステップ870)。
次に、LayoutElementルーチンが呼出される。LayoutElementルーチンは引数としてHTMLスクリーンオブジェクト(例えば、フレームセット、テーブル、文書、パラグラフ、又はイメージ)、LayoutRegion及びRenderPDF?フラグをとる。LayoutElementはスクリーンオブジェクトをレイアウトするために実際に必要とされる寸法、即ち幅及び高さをリターン即ち返す。RenderPDF?がTRUE(真)である場合には、LayoutElementはそのHTMLオブジェクトに対応するターゲット文書内に内容を作成する試みを行う。このプロセスについては後に更に詳細に説明する。
LayoutElementは、最初に、主要HTML文書及びその補助文書、新たに作成されたLayoutRegion及びFALSE(偽)のRenderPDF?値の引数としての新たに作成されたパースツリーと共に呼出される(ステップ880)。RenderPDF?がFALSE(偽)であると、LayoutElementがそれらの通常の寸法でパースツリー内に特定されているスクリーンオブジェクトの全てを完全に表示するのに必要な最小幅及び高さを計算する。尚、この幅とは、パースツリーによって表わされるHTMLオブジェクトの「論理的最小幅」のことを意味している。
次いで、LayoutElementによってリターン即ち返される幅値がターゲット文書のターゲット幅と比較される(ステップ890)。返された幅値がターゲットPDF頁の幅未満であるか又は等しい場合には、可変ScalingFactorが1と等しくセットされ(ステップ900)、且つLayoutRegionにおけるcurYの値がターゲット文書の最後の頁の底部端部と等しくなるようにリセットされる(ステップ910)。
LayoutElementによって返される幅値がターゲットPDF頁の幅よりも大きい場合には、以下のステップがとられる。ScalingFactorが、返された幅値によってターゲット文書のターゲット幅を割算することによって計算される(ステップ920)。ScalingFactorが約0. 7より大きい場合には(ステップ930)、新たなLayoutRegionが作成され、頁高さ及び幅がScalingFactorによって割算されたターゲットPDF頁の頁寸法と等しくなるように定義され、curYがターゲット文書の最後の頁の底部端部に対してポイントすべく設定され、且つLayoutRegionの幅が新たに定義された頁幅と等しく設定される(ステップ940)。
ScalingFactorが約0. 7未満である場合には、LandscapeView?フラグがTRUE(真)に設定される。ターゲット文書のターゲット高さを返された幅値によって割算することにより新たなScalingFactorが再計算される。その結果得られる値が1より大きい場合には、それは1と等しく設定される。次いで、新たなLayoutRegionが作成され、その場合に頁高さ及び幅はScalingFactorによって割算された相補的頁寸法(即ち、幅に対して高さ及びその逆も又真)と等しく画定され、curYはターゲット文書の最後の頁の底部端部に対してポイントすべく設定され、且つLayoutRegionの幅は新たに画定された頁幅に設定される(ステップ950)。
(別の実施例においては、ユーザは、LandscapeView?フラグがTRUE(真)に設定されるスレッシュホールドの値を特定することが可能であり、且つ更にLandscapeView?フラグがTRUE(真)に設定されることがないように特定することも可能である。)次に、LayoutElementが再度呼出され、この時はパースツリー、新たに作成されたLayoutRegion、及びTRUE(真)のRenderPDF?値と共に呼出される。LayoutElementに対してその呼出しによって発生されたPDF頁は全てScalingFactorによってスケーリングされ、それらをターゲット文書内の頁の寸法へ変換させる。ScalingFactorは将来の参照のために各頁と共に格納される。(例えば、ユーザがPDF頁がその「自然の寸法」で表示されることを要求する場合には、PDF頁の寸法はScalingFactorによって割算されてその頁をその自然の寸法へ復帰させる。)LandscapeView?がTRUE(真)である場合には、LayoutElementに対してその呼出しによって発生されたPDF頁の各々が90°だけ回転される(ステップ960)。次いで、ConvertToPDFから抜出る(ステップ970)。
図17、17a、17bはLayoutElementルーチンによってとられるステップを示したフローチャートである。最初に、変数MinWidthはLayoutRegionの幅と等しくされ、且つポインタstartYはcurYの値が割当てられる(ステップ1000)。次いで、パースツリーによって表わされるHTMLオブジェクトのタイプが決定される。そのオブジェクトが非構造型内容オブジェクトである場合には(即ち、パラグラフ、フォーム要素、又は見出しなどの内部的構造なしで単にテキスト及びイメージからなるオブジェクトである場合)(ステップ1010)、LayoutElementは、そのオブジェクト内の最も幅広の要素の幅(即ち、最も幅広の単語又はイメージ)を決定することによってそのオブジェクトの論理的最小幅を計算し、この幅がMinWidthよりも大きい場合には、MinWidthはその幅に設定される(ステップ1020)。
RenderPDF?がTRUE(真)である場合には、そのオブジェクトをcurYによってポイントされている位置においてターゲット文書内に配置させる。(注意すべきことであるが、そのオブジェクトは、表示されると、頁上で複数本のラインをとる場合がある。例えば、該オブジェクトがテキストの一つのパラグラフである場合には、該テキストは現在のラインを一杯とさせ、且つ継続して付加的なライン一杯とさせ、各ライン上に可及的に多くの単語が配置されるように配置される。)curYによってポイントされている位置に該オブジェクトを配置させることが該オブジェクトの一部を現在の頁の終わりを超えて配置させるような場合には、curYによって表わされる位置より下側のターゲット文書内に付加的なPDF頁が存在するか否かを判別する。この様な頁が存在しない場合には、それが作成される。該オブジェクトが該付加的な頁上に完全に配置されるのに充分に小さなものである場合には、これで完了する。そうでない場合には、該オブジェクトが頁の境界を超えて配置され、可能である場合には頁の境界を超えてキャラクタ又はイメージが配置されることがないようにする。次いで、ポインタcurYがインクリメントされて、配置されたオブジェクトのすぐ下の位置に対してポイントすることとなる(ステップ1030)。
RenderPDF?の値に拘らずに、次いで、curYの値が該オブジェクトの高さによってインクリメントされる(ステップ1040)。
MinWidthの値及びcurY及びstartYの間の差がリターン即ち返され、スクリーンオブジェクトの実際の寸法を表わす(ステップ1050)。該オブジェクトがリスト又はリスト状オブジェクト(例えば、メニュー、順番付けしたリスト、又はディレクトリリスト)又は単純な文書(即ち、フレームセットではない)のボディである場合には(ステップ1060)、以下のステップがとられる。該文書のボディ内のリスト又はスクリーンオブジェクトの各要素に対して、LayoutElementルーチンが呼出され、リスト要素又は文書スクリーンオブジェクト、現在のLayoutRegion及びRenderPDF?の値を引数として呼出される。この様な各呼出しに対して、返された幅値がMinWidthより大きい場合には、MinWidthはその値に設定される(ステップ1070)。全てのこの様な要素又はスクリーンオブジェクトがこの様な態様で処理された後に、MinWidthの値及びcurYとstartYとの間の差がリターン即ち返される(ステップ1080)。
該オブジェクトがテーブルである場合には(ステップ1090)、以下のステップがとられる。図17aを参照すると、テーブル欄の幅が全体的なMinWidthに等しいように設定される(ステップ1110)。(各欄の相対幅はHTMLテーブルマークアップと共に与えられるHTMLテーブル形態情報に従って決定される。)次いで、該テーブル内の各行に対して、最初の行から開始し(ステップ1120)、その行内において開始するセルの各々が以下の如くに逐次的に処理される(左から右)。curYの現在の値及び現在の頁寸法で新たなLayoutRegionが作成されるが、左側及び右側の境界は、セルによって占有されるべき欄の左側及び右側の範囲によって決定される。次いで、引数としてセルの内容、新たなLayoutRegion及びRenderPDF?の値と共にLayoutElementが呼出される(ステップ1130)。
一つの行内のセルの全てが処理された後に、以下のステップがとられる。即ち、curYがその行のセルの最も高いものの下側の点に設定される(現在の行内において終端するものよりも大きな行範囲を有するセルを含む)。次いで、その行の幅(その行を占有する全てのセルに対するLayoutElementによって返される幅値の和として定義される)が計算され(ステップ1140)、且つ次の行の処理がステップ1130において開始される。この様にして全ての行が処理された後に(ステップ1150)、MinWidthの値が各行の幅と比較され、且つ最も幅広の行の幅がMinWidthよりも大きい場合には、MinWidthがその行の幅と等しく設定される(ステップ1160)。MinWidthの値及びcurYとstartYとの間の差が返される(ステップ1170)。
再度図17を参照すると、該オブジェクトがフレームセットである場合には、以下のステップがとられる。図17bを参照すると、トップレベルのフレームセットにおける各フレームに対して、MinWidthの値及び該フレームセット内において特定されているフレーム幅情報に基づいて、仮の幅及び位置が決定される。(例えば、トップレベルのフレームセットが水平なフレームを画定する場合には、各フレームの仮の幅はMinWidthである。トップレベルのフレームセットが垂直のフレームを画定する場合には、各フレームの仮の幅は、フレームセットにおいて特定されるように該フレームの相対幅に従ってMinWidthによって特定された幅を分割することによって決定される。)次いで、トップレベルのフレームセット内の各フレームに対して、新たなLayoutRegionが作成され、それは既存の頁寸法及び該フレームの仮の幅及び位置を有しており、curYは該フレームの上部端部に対してポイントすべく設定される(ステップ1190)。
次いで、トップレベルのフレームセットが水平のフレームを包含する場合には(ステップ1200)、以下のステップがとられる。該フレームセット内の各トップレベルのフレームに対して、最初のこの様なフレームから開始し(ステップ1210)、LayoutElementが呼出され、該フレームの内容、新たに作成されたLayoutRegion及びRenderPDF?が引数として使用される(ステップ1220)。この様な各呼出しの後に、curYの値はLayoutElementによって返された高さ値によってインクリメントされる(ステップ1230)。LayoutElementに対する呼出しによって返された幅値がMinWidthよりも大きい場合には(ステップ1240)、MinWidthはその値に設定され、curYはstartYと等しくリセットされ(ステップ1250)、且つ本プロセスは新たにステップ1190において開始する。トップレベルのフレームセットにおける全てのフレームがその様に処理された後に(ステップ1260)、MinWidthの値及びcurYとstartYとの間の差が返される(ステップ1270)。
トップレベルのフレームセットにおけるフレームが垂直のフレームである場合には(ステップ1200)、以下のステップがとられる。該フレームセットにおける各トップレベルのフレームに対して、該フレームの内容、新たに作成されたLayoutRegion及びRenderPDF?の値を引数としてLayoutElementが呼出される(ステップ1280)。各トップレベルのフレームがその様に処理された後に、これらのLayoutElementに対する呼出しの各々によって返された幅の和がテストされる(ステップ1290)。この和がMinWidthよりも大きい場合には、MinWidthが該幅の和と等しく設定され(ステップ1300)且つ本プロセスはステップ1190において新たに開始される。そうでない場合には、curYがLayoutElementに対する呼出しによって返された高さ値のうちで最も高いものによってインクリメントされ(ステップ1310)、且つMinWidthの値及びcurYとstartYとの間の差が返される(ステップ1320)。
図18−21は本方法をHTML文書に対して適用した場合の結果を例示している。図18に示したものは、2個のフレーム1410及び1420からなるHTML文書のウエブブラウザにおける表示である。フレーム1410はほぼブラウザウインド内にフィットしているが、フレーム1420はブラウザウインドの底部端部を超えて延在しており且つ図19に例示した如く、ウインド内のフレームの位置を調節するためのスライダを使用することによって見ることが可能である。図20及び21は、本方法を図18及び19に示したHTML文書に適用することによって発生される一組のPDF頁を示している。理解されるように、単一の頁上にフィットするのに充分小さなフレーム1410はフレーム1420の最初の部分と共に、頁1440上に示されている。頁1450及び1460上において、フレーム1420の残りの部分が表示されている。注意すべきことであるが、フレーム1420の幅はグラフィック1430の幅と等しく、それは該フレーム内の最も幅広の論理幅を有するスクリーンオブジェクトである。
その他の実施例も本発明の技術的範囲内のものである。例えば、本発明のステップの順番は変更することが可能である。ユーザコンピュータは単一ユーザ又はマルチユーザプラットフォームとすることが可能であり、又はそれは家庭用のテレビ、パーソナルデジタルアシスタント、インターネットサーフィング、又は特別目的アプリケーション製品などの埋込み型コンピュータとすることが可能である。ウエブ頁はワイドエリアネットワーク、ローカルエリアネットワーク、又は単一のファイルシステム上に存在することが可能である。ターゲット文書は、固定幅を持った頁付けしていない文書とすることが可能である。ターゲット文書は可変幅頁を有する頁付けした文書とすることが可能である。ウエブ頁はHTMLでコード化されることは必要ではなく、任意の意味論的マークアップ言語とすることが可能である。ターゲット文書はPDFでコード化されることは必要ではなく、任意の物理的マークアップ言語とすることが可能である。
以上、本発明の具体的実施の態様について詳細に説明したが、本発明は、これら具体例にのみ制限されるべきものではなく、本発明の技術的範囲を逸脱することなしに種々の変形が可能であることは勿論である。
従来のウエブブラウザにおいて表示されたウエブ頁のビューを示した概略図。 従来のウエブブラウザにおいて表示されたウエブ頁のビューを示した概略図。 従来のウエブブラウザにおいて表示されたウエブ頁のビューを示した概略図。 従来のウエブブラウザにおけるフレームを包含するウエブ頁のビューを示した概略図。 従来のウエブブラウザにおけるフレームを包含するウエブ頁のビューを示した概略図。 従来のウエブブラウザにおけるフレームを包含するウエブ頁のビューを示した概略図。 従来のウエブブラウザにおいて表示されたウエブ頁のビューを示した概略図。 従来のウエブブラウザにおいて表示されたウエブ頁のビューを示した概略図。 従来のウエブブラウザにおいて表示されたウエブ頁のビューを示した概略図。 図7−9において表示されたウエブ頁に対してその基礎となるHTMLコードの一部を示した説明図。 本発明に基づいてプログラムされたコンピュータシステムを示した概略ブロック図。 複数個のウエブ頁を単一の頁付けした文書へ組込む方法のフローチャートの一部を示した概略図。 複数個のウエブ頁を単一の頁付けした文書へ組込む方法のフローチャートの一部を示した概略図。 複数個のウエブ頁を単一の頁付けした文書へ組込む方法のフローチャートの一部を示した概略図。 FetchAndIncortorateルーチンのステップを示したフローチャート。 FetchDocルーチンのステップを示したフローチャート。 ConvertToPDFルーチンのステップを示したフローチャート。 LayoutRegion及び関連するPDF文書の内容の間の論理的関係を示した概略図。 LayoutElementルーチンによってとられるステップを示したフローチャートの一部を示した概略図。 LayoutElementルーチンによってとられるステップを示したフローチャートの一部を示した概略図。 LayoutElementルーチンによってとられるステップを示したフローチャートの一部を示した概略図。 従来のウエブブラウザにおいて表示されたウエブ頁のビューを示した概略図。 従来のウエブブラウザにおいて表示されたウエブ頁のビューを示した概略図。 本発明によって発生されるPDF頁を示した概略図。 本発明によって発生されるPDF頁を示した概略図。
符号の説明
100 ユーザコンピュータ
102 通信リンク
104 モニタ(ディスプレイ)
106 マウス
108 インターフェース
110 ウエブブラウザ
120 PDFビュア
135 ウエブ頁インテグレータ
140 ウエブサーバ
142 データ格納部
144 ウエブ頁

Claims (36)

  1. 文書の意味論的マークアップ表現を該文書の物理的マークアップ表現へ変換する方法において、
    ターゲット文書作成手段が、デフォルト値又はユーザ入力値によって決定されるターゲット幅を有するターゲット文書を作成し且つ格納手段内に格納するステップ、
    論理的最小幅計算手段が、前記意味論的マークアップ表現を構成している前記文書内の全てのスクリーンオブジェクトをそれらの通常の寸法で表示手段上に表示するために必要とされる最小幅に等しい論理的最小幅を計算するステップ、
    スケーリング係数計算手段が、前記論理的最小幅を前記ターゲット幅と比較して、前記ターゲット幅よりも大きい場合には、前記論理的最小幅によって前記ターゲット幅割り算してスケーリング係数を計算するステップ、
    レイアウト領域作成手段が、前記スケーリング係数が予め定めた値よりも大きい場合には、前記スケーリング係数でスケーリングされた頁寸法で新たなレイアウト領域を作成するステップ、
    配置手段が、前記レイアウト領域内に前記スクリーンオブジェクトを配置させてその際に前記文書の頁付けを行なうステップ、
    からなることを特徴とする方法。
  2. 請求項1において、更に、前記物理的マークアップ表現を新たに作成した文書内に組込むことを特徴とする方法。
  3. 請求項1において、更に、前記物理的マークアップ表現を既存の文書内に組込むことを特徴とする方法。
  4. 請求項1において、前記物理的マークアップ表現が各々がそれぞれの物理的幅とそれぞれの物理的高さとを持った頁を含む頁付けした表現であることを特徴とする方法。
  5. 請求項4において、前記ターゲット文書がターゲット高さを含んでいることを特徴とする方法。
  6. 請求項5において、前記ターゲット文書が標準の用紙寸法であることを特徴とする方法。
  7. 請求項6において、前記標準の用紙寸法が8. 5×11インチ、8. 5×14インチ、A4、A5、11×17インチのうちの一つであることを特徴とする方法。
  8. 請求項5において、前記物理的マークアップ表現の頁が前記ターゲット文書と同一のアスペクト比を有していることを特徴とする方法。
  9. 請求項4において、更に、前記スケーリング係数によって前記物理的マークアップ表現の高さをスケーリングすることを特徴とする方法。
  10. 請求項9において、前記物理的マークアップ表現の高さを前記スケーリング係数によってスケーリングする場合に、前記スケーリング係数によって前記物理的マークアップ表現の頁高さをスケーリングすることを特徴とする方法。
  11. 請求項5において、前記物理的マークアップ表現の頁を+又は−90°だけ回転させることを特徴とする方法。
  12. 請求項11において、更に、前記論理的最小幅に対する前記ターゲット幅の比が特定したスレッシュホールド未満であるか否かをテストすることを特徴とする方法。
  13. 請求項1において、前記文書が複数個のフレームを特定するフレームセットであることを特徴とする方法。
  14. 請求項1において、前記文書が少なくとも1個のハイパーテキストリンクを有しており、本方法が、更に、
    前記物理的マークアップ表現をビュア内に表示し、
    ハイパーテキストリンクが前記表示されたマークアップからユーザによって選択された場合に外部文書へアクセスする、
    上記各ステップを有することを特徴とする方法。
  15. 請求項14において、前記ハイパーテキストリンクがサーバ側イメージマップであることを特徴とする方法。
  16. 請求項1において、前記意味論的マークアップ表現がHTMLであることを特徴とする方法。
  17. 請求項1において、前記物理的マークアップ表現がPDFであることを特徴とする方法。
  18. 請求項1において、更に、
    前記スケーリング係数の逆数によって前記物理的マークアップ表現をスケーリングし、且つ
    その結果をビュア内に表示する、
    上記各ステップを有することを特徴とする方法。
  19. 文書の意味論的マークアップ表現を該文書の物理的マークアップ表現へ変換するためにコンピュータをして、
    デフォルト値又はユーザ入力値によって決定されるターゲット幅を有するターゲット文書を作成し且つ格納手段内に格納する手順、
    前記意味論的マークアップ表現を構成している前記文書内の全てのスクリーンオブジェクトをそれらの通常の寸法で表示手段上に表示するために必要とされる最小幅に等しい論理的最小幅を計算する手順、
    前記論理的最小幅を前記ターゲット幅と比較して、前記ターゲット幅よりも大きい場合には、前記論理的最小幅によって前記ターゲット幅割り算してスケーリング係数を計算する手順、
    前記スケーリング係数が予め定めた値よりも大きい場合には、前記スケーリング係数でスケーリングされた頁寸法で新たなレイアウト領域を作成する手順、
    前記レイアウト領域内に前記スクリーンオブジェクトを配置させてその際に前記文書の頁付けを行なう手順、
    を実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
  20. 請求項19において、更に、前記物理的マークアップ表現を新たに作成した文書内に組込むことを特徴とするコンピュータ読み取り可能な記録媒体。
  21. 請求項19において、更に、前記物理的マークアップ表現を既存の文書内に組込むことを特徴とするコンピュータ読み取り可能な記録媒体。
  22. 請求項19において、前記物理的マークアップ表現が各々がそれぞれの物理的幅とそれぞれの物理的高さとを持った頁を含む頁付けした表現であることを特徴とするコンピュータ読み取り可能な記録媒体。
  23. 請求項22において、前記ターゲット文書がターゲット高さを含んでいることを特徴とするコンピュータ読み取り可能な記録媒体。
  24. 請求項23において、前記ターゲット文書が標準の用紙寸法であることを特徴とするコンピュータ読み取り可能な記録媒体。
  25. 請求項24において、前記標準の用紙寸法が8. 5×11インチ、8. 5×14インチ、A4、A5、11×17インチのうちの一つであることを特徴とするコンピュータ読み取り可能な記録媒体。
  26. 請求項23において、前記物理的マークアップ表現の頁が前記ターゲット文書と同一のアスペクト比を有していることを特徴とするコンピュータ読み取り可能な記録媒体。
  27. 請求項22において、更に、前記スケーリング係数によって前記物理的マークアップ表現の高さをスケーリングすることを特徴とするコンピュータ読み取り可能な記録媒体。
  28. 請求項27において、前記物理的マークアップ表現の高さを前記スケーリング係数によってスケーリングする場合に、前記スケーリング係数によって前記物理的マークアップ表現の頁高さをスケーリングすることを特徴とするコンピュータ読み取り可能な記録媒体。
  29. 請求22において、前記物理的マークアップ表現の頁を+又は−90°だけ回転させることを特徴とするコンピュータ読み取り可能な記録媒体。
  30. 請求項29において、更に、前記論理的最小幅に対する前記ターゲット幅の比が特定したスレッシュホールド未満であるか否かをテストすることを特徴とするコンピュータ読み取り可能な記録媒体。
  31. 請求項19において、前記文書が複数個のフレームを特定するフレームセットであることを特徴とするコンピュータ読み取り可能な記録媒体。
  32. 請求項19において、前記文書が少なくとも1個のハイパーテキストリンクを有しており、前記プログラムが、更に、コンピュータをして、
    前記物理的マークアップ表現をビュア内に表示する手順、
    ハイパーテキストリンクが前記表示されたマークアップからユーザによって選択された場合に外部文書へアクセスする手順、
    を実行させることを特徴とするコンピュータ読み取り可能な記録媒体。
  33. 請求項32において、前記ハイパーテキストリンクがサーバ側イメージマップであることを特徴とするコンピュータ読み取り可能な記録媒体。
  34. 請求項19において、前記意味論的マークアップ表現がHTMLであることを特徴とするコンピュータ読み取り可能な記録媒体。
  35. 請求項19において、前記物理的マークアップ表現がPDFであることを特徴とするコンピュータ読み取り可能な記録媒体。
  36. 請求項19において、更に、前記プログラムがコンピュータをして、
    前記スケーリング係数の逆数によって前記物理的マークアップ表現をスケーリングする手順、且つ
    その結果をビュア内に表示する手順、
    を実行させることを特徴とするコンピュータ読み取り可能な記録媒体。
JP2008321351A 1997-11-14 2008-12-17 頁付けした文書内の頁付けしていないハイパーテキストの捕獲 Expired - Lifetime JP4805336B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/970743 1997-11-14
US08/970,743 US6415278B1 (en) 1997-11-14 1997-11-14 Retrieving documents transitively linked to an initial document

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP10325495A Division JPH11232267A (ja) 1997-11-14 1998-11-16 頁付けした文書内の頁付けしていないハイパーテキストの捕獲

Publications (2)

Publication Number Publication Date
JP2009104628A true JP2009104628A (ja) 2009-05-14
JP4805336B2 JP4805336B2 (ja) 2011-11-02

Family

ID=25517442

Family Applications (2)

Application Number Title Priority Date Filing Date
JP10325495A Pending JPH11232267A (ja) 1997-11-14 1998-11-16 頁付けした文書内の頁付けしていないハイパーテキストの捕獲
JP2008321351A Expired - Lifetime JP4805336B2 (ja) 1997-11-14 2008-12-17 頁付けした文書内の頁付けしていないハイパーテキストの捕獲

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP10325495A Pending JPH11232267A (ja) 1997-11-14 1998-11-16 頁付けした文書内の頁付けしていないハイパーテキストの捕獲

Country Status (6)

Country Link
US (4) US6415278B1 (ja)
EP (2) EP0917071B1 (ja)
JP (2) JPH11232267A (ja)
CA (1) CA2252181A1 (ja)
DE (1) DE69839175T2 (ja)
HK (1) HK1110664A1 (ja)

Families Citing this family (106)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6789080B1 (en) 1997-11-14 2004-09-07 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US6415278B1 (en) * 1997-11-14 2002-07-02 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US7124093B1 (en) 1997-12-22 2006-10-17 Ricoh Company, Ltd. Method, system and computer code for content based web advertising
US7257589B1 (en) * 1997-12-22 2007-08-14 Ricoh Company, Ltd. Techniques for targeting information to users
TW428146B (en) * 1999-05-05 2001-04-01 Inventec Corp Data file updating method by increment
AU5590300A (en) 1999-05-28 2001-03-19 Nokia Corporation Real-time, interactive and personalized video services
US6675351B1 (en) * 1999-06-15 2004-01-06 Sun Microsystems, Inc. Table layout for a small footprint device
US6886036B1 (en) * 1999-11-02 2005-04-26 Nokia Corporation System and method for enhanced data access efficiency using an electronic book over data networks
US7765271B1 (en) * 2000-02-03 2010-07-27 Hyland Software, Inc. System and method for scanning a document in client/server environment
AU2000223135A1 (en) * 2000-02-07 2001-08-14 4Media Group Ag Document pagination system and process
US6819339B1 (en) 2000-02-24 2004-11-16 Eric Morgan Dowling Web browser with multilevel functions
US20010049707A1 (en) 2000-02-29 2001-12-06 Tran Bao Q. Systems and methods for generating intellectual property
US20010049700A1 (en) * 2000-05-26 2001-12-06 Shinobu Ichikura Information processing apparatus, information processing method and storage medium
JP4510232B2 (ja) * 2000-05-31 2010-07-21 キヤノン株式会社 情報処理装置および情報処理方法および記憶媒体
JP4536872B2 (ja) * 2000-05-31 2010-09-01 キヤノン株式会社 情報処理装置および情報処理方法および記憶媒体
US6556217B1 (en) * 2000-06-01 2003-04-29 Nokia Corporation System and method for content adaptation and pagination based on terminal capabilities
US6654758B1 (en) * 2000-07-21 2003-11-25 Unisys Corporation Method for searching multiple file types on a CD ROM
US6938083B1 (en) * 2000-07-21 2005-08-30 Unisys Corporation Method of providing duplicate original file copies of a searched topic from multiple file types derived from the web
JP3703080B2 (ja) * 2000-07-27 2005-10-05 インターナショナル・ビジネス・マシーンズ・コーポレーション ウェブコンテンツを簡略化するための方法、システムおよび媒体
US7073122B1 (en) * 2000-09-08 2006-07-04 Sedghi Ali R Method and apparatus for extracting structured data from HTML pages
US7408657B2 (en) * 2000-09-19 2008-08-05 Fuji Xerox Co., Ltd. Image input and output system, method and recording medium having a common initiation portion
FR2814562A1 (fr) * 2000-09-22 2002-03-29 Cytale Procede pour afficher un document numerique, dispositif electronique, logiciel, publication numerique, support de donneees et procede de telechargement
US20020073149A1 (en) * 2000-10-11 2002-06-13 Young Christopher Tyler Dynamic content linking
DE10156834A1 (de) * 2000-11-21 2002-06-27 Juergen Kohn Verfahren und Vorrichtung zum Darstellen eines aus Pixeln aufgebauten Bildes
US7003551B2 (en) * 2000-11-30 2006-02-21 Bellsouth Intellectual Property Corp. Method and apparatus for minimizing storage of common attachment files in an e-mail communications server
US6948116B2 (en) * 2000-12-01 2005-09-20 International Business Machines Corporation System and method for creating a unified printable collection of hyperlinked documents
US7013309B2 (en) * 2000-12-18 2006-03-14 Siemens Corporate Research Method and apparatus for extracting anchorable information units from complex PDF documents
FR2823942A1 (fr) * 2001-04-24 2002-10-25 Koninkl Philips Electronics Nv Dispositif pour une conversion d'un format bifs textuel vers un format bifs binaire
US8392827B2 (en) * 2001-04-30 2013-03-05 International Business Machines Corporation Method for generation and assembly of web page content
US20030030840A1 (en) * 2001-08-10 2003-02-13 Parry Travis J. Direct printing from internet database
US20040205488A1 (en) * 2001-11-27 2004-10-14 Fry Randolph Allan Active web page for editing with any browser
US6862592B1 (en) * 2001-12-21 2005-03-01 Adobe Systems Incorporated Document processing in a cross-platform environment
US7213269B2 (en) 2002-02-21 2007-05-01 Adobe Systems Incorporated Application rights enabling
JP2004086845A (ja) * 2002-06-27 2004-03-18 Oki Electric Ind Co Ltd 電子文書情報拡充装置、方法及びプログラム、並びに、電子文書情報拡充プログラムを記録した記録媒体
US7356768B1 (en) 2002-11-27 2008-04-08 Adobe Systems Incorporated Using document templates to assemble a collection of documents
US7278168B1 (en) 2002-11-27 2007-10-02 Adobe Systems Incorporated Dynamic enabling of functionality in electronic document readers
US8660960B2 (en) 2002-11-27 2014-02-25 Adobe Systems Incorporated Document digest allowing selective changes to a document
JP2004303160A (ja) * 2003-04-01 2004-10-28 Oki Electric Ind Co Ltd 情報抽出装置
US7315947B2 (en) * 2003-05-20 2008-01-01 Adobe Systems Incorporated Author signatures for legal purposes
US7359963B1 (en) * 2003-06-09 2008-04-15 Microsoft Corporation System and method for maintaining and publishing web site content
US20050166137A1 (en) * 2004-01-26 2005-07-28 Bao Tran Systems and methods for analyzing documents
US20050210008A1 (en) * 2004-03-18 2005-09-22 Bao Tran Systems and methods for analyzing documents over a network
JP4424038B2 (ja) * 2004-03-31 2010-03-03 セイコーエプソン株式会社 印刷管理システムおよび印刷管理装置並びにこれらに用いるプログラム
US7461170B1 (en) * 2004-09-01 2008-12-02 Microsoft Corporation Zone-based rendering of resource addresses
US8838591B2 (en) 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US8332401B2 (en) 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US7812986B2 (en) * 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US8825682B2 (en) * 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US8385589B2 (en) * 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US9373029B2 (en) 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US8184155B2 (en) 2007-07-11 2012-05-22 Ricoh Co. Ltd. Recognition and tracking using invisible junctions
US8276088B2 (en) 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US7920759B2 (en) 2005-08-23 2011-04-05 Ricoh Co. Ltd. Triggering applications for distributed action execution and use of mixed media recognition as a control input
US10192279B1 (en) 2007-07-11 2019-01-29 Ricoh Co., Ltd. Indexed document modification sharing with mixed media reality
US8600989B2 (en) 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US8086038B2 (en) * 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
US8195659B2 (en) 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8144921B2 (en) 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US8176054B2 (en) 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US8369655B2 (en) * 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US8856108B2 (en) * 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US8521737B2 (en) 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US7970171B2 (en) 2007-01-18 2011-06-28 Ricoh Co., Ltd. Synthetic image and video generation from ground truth data
US8510283B2 (en) 2006-07-31 2013-08-13 Ricoh Co., Ltd. Automatic adaption of an image recognition system to image capture devices
US8156427B2 (en) 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US8335789B2 (en) 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US7991778B2 (en) 2005-08-23 2011-08-02 Ricoh Co., Ltd. Triggering actions with captured input in a mixed media environment
US8005831B2 (en) 2005-08-23 2011-08-23 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment with geographic location information
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US8156428B1 (en) * 2005-02-25 2012-04-10 Adobe Systems Incorporated Method and apparatus for merging digital content
US8683312B2 (en) 2005-06-16 2014-03-25 Adobe Systems Incorporated Inter-document links involving embedded documents
JP4906072B2 (ja) * 2006-05-01 2012-03-28 キヤノン株式会社 情報処理装置ならびに情報処理方法
US9020966B2 (en) 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
US8676810B2 (en) 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
US9063952B2 (en) * 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US8489987B2 (en) 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US8073263B2 (en) * 2006-07-31 2011-12-06 Ricoh Co., Ltd. Multi-classifier selection and monitoring for MMR-based image recognition
US8201076B2 (en) 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US8020089B1 (en) 2006-10-23 2011-09-13 Adobe Systems Incorporated Rendering hypertext markup language content
US8490117B1 (en) 2006-10-23 2013-07-16 Adobe Systems Incorporated Bridging script engines
US7614003B2 (en) * 2006-10-23 2009-11-03 Adobe Systems Incorporated Rendering hypertext markup language content
US7853887B2 (en) 2007-06-26 2010-12-14 Adobe Systems Incorporated Detection and preview of graphical elements within a graphic
US8161023B2 (en) * 2008-10-13 2012-04-17 Internatioanal Business Machines Corporation Inserting a PDF shared resource back into a PDF statement
US8385660B2 (en) 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
US8099397B2 (en) * 2009-08-26 2012-01-17 International Business Machines Corporation Apparatus, system, and method for improved portable document format (“PDF”) document archiving
US9049117B1 (en) * 2009-10-21 2015-06-02 Narus, Inc. System and method for collecting and processing information of an internet user via IP-web correlation
US8375285B2 (en) * 2009-12-15 2013-02-12 International Business Machines Corporation Enabling access to data files unsupported by a computing device
US20110221766A1 (en) * 2010-03-09 2011-09-15 Designmade Co., Ltd. Method for printing a captured screen of web pages
US8799260B2 (en) * 2010-12-17 2014-08-05 Yahoo! Inc. Method and system for generating web pages for topics unassociated with a dominant URL
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
US20140129927A1 (en) * 2012-11-02 2014-05-08 Tencent Technology (Shenzhen) Company Limited Page browsing method and browser
CN103793436B (zh) * 2012-11-02 2019-04-02 腾讯科技(深圳)有限公司 浏览页面的方法及浏览器
US9258126B2 (en) * 2012-12-13 2016-02-09 Xerox Corporation Method for non-repudiation of ad-hoc workflows
US9632986B2 (en) * 2013-03-14 2017-04-25 Aol Inc. Systems and methods for horizontally paginating HTML content
US10248630B2 (en) * 2014-12-22 2019-04-02 Microsoft Technology Licensing, Llc Dynamic adjustment of select elements of a document
WO2018022068A1 (en) * 2016-07-28 2018-02-01 Hewlett-Packard Development Company, L.P. Document content resizing
RU177072U1 (ru) * 2017-03-24 2018-02-07 Федеральное государственное казенное образовательное учреждение высшего образования "Волгоградская академия Министерства внутренних дел Российской Федерации" (Волгоградская академия МВД России) Устройство установления содержания документов, повреждённых механическим способом
US11055475B2 (en) * 2019-05-03 2021-07-06 Microsoft Technology Licensing, Llc Cross-browser techniques for efficient document pagination

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266702A (ja) * 1993-03-11 1994-09-22 Ricoh Co Ltd 文書処理装置
JPH07121344A (ja) * 1993-10-21 1995-05-12 Fuji Xerox Co Ltd 文書表示装置
JPH07160683A (ja) * 1993-12-13 1995-06-23 Hitachi Ltd 情報処理方法及び情報処理装置

Family Cites Families (100)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5043891A (en) * 1985-08-16 1991-08-27 Wang Laboratories, Inc. Document generation apparatus and methods
US4945475A (en) * 1986-10-30 1990-07-31 Apple Computer, Inc. Hierarchical file system to provide cataloging and retrieval of data
GB8704883D0 (en) 1987-03-03 1987-04-08 Hewlett Packard Co Secure information storage
US5228121A (en) 1989-09-29 1993-07-13 Digital Equipment Corporation Document generation using information engineering
CA2056865C (en) 1990-12-11 1999-01-05 Barbara Clapp Interactive computerized document assembly system
US5301286A (en) * 1991-01-02 1994-04-05 At&T Bell Laboratories Memory archiving indexing arrangement
JPH06301732A (ja) 1993-04-13 1994-10-28 Hitachi Ltd 文書検索処理方法
JP2620576B2 (ja) 1993-04-15 1997-06-18 インターナショナル・ビジネス・マシーンズ・コーポレイション ユーザが要求したフォントに従ってグラフィカル・ユーザ・インターフェースを調節する方法及びシステム
US5446653A (en) * 1993-05-10 1995-08-29 Aetna Casualty And Surety Company Rule based document generation system
US5367573A (en) * 1993-07-02 1994-11-22 Digital Equipment Corporation Signature data object
JPH07319924A (ja) * 1994-05-24 1995-12-08 Matsushita Electric Ind Co Ltd 手書き電子文書のインデックス付けおよび探索方法
US5694546A (en) * 1994-05-31 1997-12-02 Reisman; Richard R. System for automatic unattended electronic information transport between a server and a client by a vendor provided transport software with a manifest list
US6769009B1 (en) 1994-05-31 2004-07-27 Richard R. Reisman Method and system for selecting a personalized set of information channels
EP0804769B1 (en) * 1994-06-30 2000-02-02 International Business Machines Corporation Variable length data sequence matching method and apparatus
CA2154951C (en) * 1994-09-12 2004-05-25 John E. Warnock Method and apparatus for viewing electronic documents
KR980700752A (ko) * 1994-10-28 1998-03-30 더블유 스코트 스토네타 쥬니어 문서를 인증하고 확인하는 증명서를 제공하기 위한 디지털문서 인중시스템
US5530852A (en) 1994-12-20 1996-06-25 Sun Microsystems, Inc. Method for extracting profiles and topics from a first file written in a first markup language and generating files in different markup languages containing the profiles and topics for use in accessing data described by the profiles and topics
US5873077A (en) * 1995-01-13 1999-02-16 Ricoh Corporation Method and apparatus for searching for and retrieving documents using a facsimile machine
US6115723A (en) 1995-04-27 2000-09-05 International Business Machines Corporation System and method for converting a coordinate based document to a markup language (ML) based document
JP3338585B2 (ja) 1995-05-16 2002-10-28 富士通株式会社 プレゼンテーションデータの変換装置及び方法
US6230173B1 (en) 1995-07-17 2001-05-08 Microsoft Corporation Method for creating structured documents in a publishing system
US6209004B1 (en) 1995-09-01 2001-03-27 Taylor Microtechnology Inc. Method and system for generating and distributing document sets using a relational database
US5572643A (en) 1995-10-19 1996-11-05 Judson; David H. Web browser with dynamic display of information objects during linking
US5963966A (en) * 1995-11-08 1999-10-05 Cybernet Systems Corporation Automated capture of technical documents for electronic review and distribution
US6157649A (en) * 1995-11-17 2000-12-05 3 Com Corporation Method and system for coordination and control of data streams that terminate at different termination units using virtual tunneling
US5930813A (en) * 1995-12-21 1999-07-27 Adobe Systems Incorporated Method and system for designating objects
JP3622313B2 (ja) * 1996-01-29 2005-02-23 株式会社日立製作所 ドキュメント管理システム
US5659729A (en) * 1996-02-01 1997-08-19 Sun Microsystems, Inc. Method and system for implementing hypertext scroll attributes
US6167409A (en) * 1996-03-01 2000-12-26 Enigma Information Systems Ltd. Computer system and method for customizing context information sent with document fragments across a computer network
US5745908A (en) * 1996-03-29 1998-04-28 Systems Focus International Method for converting a word processing file containing markup language tags and conventional computer code
US5864852A (en) 1996-04-26 1999-01-26 Netscape Communications Corporation Proxy server caching mechanism that provides a file directory structure and a mapping mechanism within the file directory structure
US5764908A (en) 1996-07-12 1998-06-09 Sofmap Future Design, Inc. Network system containing program modules residing in different computers and executing commands without return results to calling modules
US5987480A (en) 1996-07-25 1999-11-16 Donohue; Michael Method and system for delivering documents customized for a particular user over the internet using imbedded dynamic content
US5892908A (en) * 1996-09-10 1999-04-06 Marketscape Method of extracting network information
US6029182A (en) 1996-10-04 2000-02-22 Canon Information Systems, Inc. System for generating a custom formatted hypertext document by using a personal profile to retrieve hierarchical documents
US5809250A (en) * 1996-10-23 1998-09-15 Intel Corporation Methods for creating and sharing replayable modules representive of Web browsing session
US6096096A (en) * 1996-12-13 2000-08-01 Silicon Graphics, Inc. Web-site delivery
US5937406A (en) * 1997-01-31 1999-08-10 Informix Software, Inc. File system interface to a database
US6026433A (en) 1997-03-17 2000-02-15 Silicon Graphics, Inc. Method of creating and editing a web site in a client-server environment using customizable web site templates
US6005945A (en) * 1997-03-20 1999-12-21 Psi Systems, Inc. System and method for dispensing postage based on telephonic or web milli-transactions
US6038573A (en) * 1997-04-04 2000-03-14 Avid Technology, Inc. News story markup language and system and process for editing and processing documents
US6081907A (en) * 1997-06-09 2000-06-27 Microsoft Corporation Data delivery system and method for delivering data and redundant information over a unidirectional network
US6308188B1 (en) * 1997-06-19 2001-10-23 International Business Machines Corporation System and method for building a web site with automated workflow
US20020107946A1 (en) * 1997-06-30 2002-08-08 Michael C. Albers Method and apparatus maintaining a to-be-visited site bookmark file
US6157917A (en) * 1997-07-11 2000-12-05 Barber; Timothy P. Bandwidth-preserving method of charging for pay-per-access information on a network
US6061700A (en) 1997-08-08 2000-05-09 International Business Machines Corporation Apparatus and method for formatting a web page
US6072461A (en) 1997-08-15 2000-06-06 Haran; Yossi Apparatus and method for facilitating document generation
US5987482A (en) * 1997-09-08 1999-11-16 International Business Machines Corporation Computer system and method of displaying hypertext documents with internal hypertext link definitions
US5991878A (en) * 1997-09-08 1999-11-23 Fmr Corp. Controlling access to information
US6192382B1 (en) * 1997-09-24 2001-02-20 Mediaone Group, Inc. Method and system for web site construction using HTML fragment caching
US6470386B1 (en) * 1997-09-26 2002-10-22 Worldcom, Inc. Integrated proxy interface for web based telecommunications management tools
US5940843A (en) 1997-10-08 1999-08-17 Multex Systems, Inc. Information delivery system and method including restriction processing
US6237011B1 (en) * 1997-10-08 2001-05-22 Caere Corporation Computer-based document management system
US6810404B1 (en) * 1997-10-08 2004-10-26 Scansoft, Inc. Computer-based document management system
US6061698A (en) 1997-10-22 2000-05-09 International Business Machines Corporation Merging tagged documents and scripts having dynamic content
US6035323A (en) * 1997-10-24 2000-03-07 Pictra, Inc. Methods and apparatuses for distributing a collection of digital media over a network with automatic generation of presentable media
US6594682B2 (en) 1997-10-28 2003-07-15 Microsoft Corporation Client-side system for scheduling delivery of web content and locally managing the web content
US6415278B1 (en) * 1997-11-14 2002-07-02 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US6263352B1 (en) * 1997-11-14 2001-07-17 Microsoft Corporation Automated web site creation using template driven generation of active server page applications
US6789080B1 (en) 1997-11-14 2004-09-07 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US6208995B1 (en) * 1997-11-24 2001-03-27 International Business Machines Corporation Web browser download of bookmark set
US6389437B2 (en) 1998-01-07 2002-05-14 Ion Systems, Inc. System for converting scrolling display to non-scrolling columnar display
US6243740B1 (en) * 1998-02-13 2001-06-05 Xerox Corporation Public interactive document
US6493758B1 (en) * 1998-09-08 2002-12-10 Microsoft Corporation Offline viewing of internet content with a mobile device
US7085997B1 (en) 1998-12-08 2006-08-01 Yodlee.Com Network-based bookmark management and web-summary system
US6605120B1 (en) * 1998-12-10 2003-08-12 International Business Machines Corporation Filter definition for distribution mechanism for filtering, formatting and reuse of web based content
US6460060B1 (en) 1999-01-26 2002-10-01 International Business Machines Corporation Method and system for searching web browser history
US6313835B1 (en) 1999-04-09 2001-11-06 Zapa Digital Arts Ltd. Simplified on-line preparation of dynamic web sites
US6237060B1 (en) 1999-04-23 2001-05-22 Sun Microsystems, Inc. Cache management techniques
US20010047375A1 (en) 1999-07-14 2001-11-29 Marcus Fest Method for selecting multiple hyperlinks
US6538673B1 (en) 1999-08-23 2003-03-25 Divine Technology Ventures Method for extracting digests, reformatting, and automatic monitoring of structured online documents based on visual programming of document tree navigation and transformation
US6449636B1 (en) 1999-09-08 2002-09-10 Nortel Networks Limited System and method for creating a dynamic data file from collected and filtered web pages
US6907463B1 (en) 1999-10-19 2005-06-14 Audiogalaxy, Inc. System and method for enabling file transfers executed in a network environment by a software program
US6351755B1 (en) 1999-11-02 2002-02-26 Alta Vista Company System and method for associating an extensible set of data with documents downloaded by a web crawler
US6441996B1 (en) * 1999-11-03 2002-08-27 Jin-Sheng Weng Device for cleaning magnetic head of a disk drive
US6864904B1 (en) * 1999-12-06 2005-03-08 Girafa.Com Inc. Framework for providing visual context to www hyperlinks
US7103566B2 (en) 2000-02-23 2006-09-05 Lucent Technologies Inc. Applications of executable shopping lists
US7099950B2 (en) * 2000-03-13 2006-08-29 At&T Corp. Method and apparatus for using XML for both a protocol layer and application layer
US20010054020A1 (en) * 2000-03-22 2001-12-20 Barth Brian E. Method and apparatus for dynamic information connection engine
US20010047326A1 (en) 2000-03-14 2001-11-29 Broadbent David F. Interface system for a mortgage loan originator compliance engine
US6681255B1 (en) * 2000-04-19 2004-01-20 Icplanet Corporation Regulating rates of requests by a spider engine to web sites by creating instances of a timing module
US20020065851A1 (en) * 2000-06-02 2002-05-30 Watson Emerson C. System and method for creating a website
US7152058B2 (en) 2000-07-13 2006-12-19 Biap Systems, Inc. Apparatus for and method of selectively retrieving information and enabling its subsequent display
US6990633B1 (en) * 2000-07-28 2006-01-24 Seiko Epson Corporation Providing a network-based personalized newspaper with personalized content and layout
WO2002010988A2 (en) * 2000-07-31 2002-02-07 Starkey James A Method and apparatus for generating web pages from templates
US7152203B2 (en) 2000-09-11 2006-12-19 Appeon Corporation Independent update and assembly of web page elements
US20020103828A1 (en) * 2001-01-26 2002-08-01 Abb Automation Inc. System and method for world wide web based mapping of multiple system name spaces
US6925594B2 (en) * 2001-02-28 2005-08-02 International Business Machines Corporation Saving selected hyperlinks for retrieval of the hyperlinked documents upon selection of a finished reading button in a web browser
US20040030741A1 (en) * 2001-04-02 2004-02-12 Wolton Richard Ernest Method and apparatus for search, visual navigation, analysis and retrieval of information from networks with remote notification and content delivery
US20020152245A1 (en) * 2001-04-05 2002-10-17 Mccaskey Jeffrey Web publication of newspaper content
US20020178190A1 (en) * 2001-05-22 2002-11-28 Allison Pope Systems and methods for integrating mainframe and client-server data into automatically generated business correspondence
US20020188633A1 (en) * 2001-06-06 2002-12-12 Craig Davis Generating HTML using templates and cached files
US20020198962A1 (en) 2001-06-21 2002-12-26 Horn Frederic A. Method, system, and computer program product for distributing a stored URL and web document set
JP2003108475A (ja) * 2001-09-27 2003-04-11 Brother Ind Ltd 通信システム、通信装置、およびコンピュータプログラム
US7447990B2 (en) * 2002-01-03 2008-11-04 International Business Machines Corporation Method for creating a reusable list, saving it in a clipboard, and accessing a current document version by selecting a hyperlink on the list
US20030135824A1 (en) * 2002-01-15 2003-07-17 International Business Machines Corporation System for delayed viewing of selected documents hyperlinked to hypertext documents received at a user interactive receiving display station in a computer controlled communication network
US7610339B2 (en) * 2002-03-04 2009-10-27 Datawitness Online Ltd. Internet-based communications verification system
US7689899B2 (en) 2002-03-06 2010-03-30 Ge Corporate Financial Services, Inc. Methods and systems for generating documents
US7900147B2 (en) 2002-07-22 2011-03-01 International Business Machines Corporation System and method for enabling disconnected web access
US20050091340A1 (en) * 2003-10-01 2005-04-28 International Business Machines Corporation Processing interactive content offline

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266702A (ja) * 1993-03-11 1994-09-22 Ricoh Co Ltd 文書処理装置
JPH07121344A (ja) * 1993-10-21 1995-05-12 Fuji Xerox Co Ltd 文書表示装置
JPH07160683A (ja) * 1993-12-13 1995-06-23 Hitachi Ltd 情報処理方法及び情報処理装置

Also Published As

Publication number Publication date
US20080252912A1 (en) 2008-10-16
US6415278B1 (en) 2002-07-02
US8005843B2 (en) 2011-08-23
EP0917071A3 (en) 2001-02-28
EP0917071B1 (en) 2008-02-27
HK1110664A1 (en) 2008-07-18
US20020073074A1 (en) 2002-06-13
EP1821222A3 (en) 2007-12-12
EP1821222B1 (en) 2011-05-18
US6567799B2 (en) 2003-05-20
DE69839175D1 (de) 2008-04-10
US7937409B2 (en) 2011-05-03
EP0917071A2 (en) 1999-05-19
JPH11232267A (ja) 1999-08-27
DE69839175T2 (de) 2009-02-26
US20080222091A1 (en) 2008-09-11
EP1821222A2 (en) 2007-08-22
JP4805336B2 (ja) 2011-11-02
CA2252181A1 (en) 1999-05-14

Similar Documents

Publication Publication Date Title
JP4805336B2 (ja) 頁付けした文書内の頁付けしていないハイパーテキストの捕獲
US7401067B2 (en) Retrieving documents transitively linked to an initial document
US5983244A (en) Indicating when clickable image link on a hypertext image map of a computer web browser has been traversed
US6209007B1 (en) Web internet screen customizing system
CA2838153C (en) Displaying compact and expanded data items
JP3703080B2 (ja) ウェブコンテンツを簡略化するための方法、システムおよび媒体
KR101121070B1 (ko) 큰 오브젝트를 작은 디스플레이 위에 표현
JP4248411B2 (ja) 文書を表示するための方法、システム、コンピュータプログラムおよび記憶装置
US20060015821A1 (en) Document display system
US20140052778A1 (en) Method and apparatus for mapping a site on a wide area network
US20080033996A1 (en) Techniques for approximating the visual layout of a web page and determining the portion of the page containing the significant content
EP1667038A2 (en) System and method for customization of search results
US20190073342A1 (en) Presentation of electronic information
US20110191328A1 (en) System and method for extracting representative media content from an online document
JP2009510650A (ja) 動的に集約された文書のための調和構成を備えたマルチフォームデザイン
JP2006114012A (ja) 電子文書への最適アクセス
Blekas et al. Use of RSS feeds for content adaptation in mobile web browsing
US7096423B2 (en) Layout-based page capture
CA2452269A1 (en) Method and system for standard bookmark classification of web sites
US20130124954A1 (en) Method and Apparatus for Merging Digital Content
US11500912B2 (en) Search engine UI systems and processes
US20020091735A1 (en) Method and apparatus for locating geographically classified establishment information
Christel et al. SVG for navigating digital news video
Grabowski The Web Publisher’s Illustrated Quick Reference: Covers HTML 3.2 and VRML 2.0
Li et al. Multi-resolution Mechanism for SVG

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090609

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090909

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090914

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091007

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091013

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091109

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100406

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100705

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100708

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100803

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100806

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100906

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110422

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110506

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110712

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110810

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140819

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140819

Year of fee payment: 3

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term