JP2002544595A - リンクされる文書の階層構成の中の文書を表現するデータファイルの修正 - Google Patents

リンクされる文書の階層構成の中の文書を表現するデータファイルの修正

Info

Publication number
JP2002544595A
JP2002544595A JP2000616541A JP2000616541A JP2002544595A JP 2002544595 A JP2002544595 A JP 2002544595A JP 2000616541 A JP2000616541 A JP 2000616541A JP 2000616541 A JP2000616541 A JP 2000616541A JP 2002544595 A JP2002544595 A JP 2002544595A
Authority
JP
Japan
Prior art keywords
document
data file
linked
data
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000616541A
Other languages
English (en)
Inventor
ジェルバート、リチャード
Original Assignee
アーゴウ インターラクティブ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB9910682.5A external-priority patent/GB9910682D0/en
Priority claimed from GBGB9910679.1A external-priority patent/GB9910679D0/en
Priority claimed from GBGB9910683.3A external-priority patent/GB9910683D0/en
Priority claimed from GBGB9910685.8A external-priority patent/GB9910685D0/en
Priority claimed from GBGB9910684.1A external-priority patent/GB9910684D0/en
Application filed by アーゴウ インターラクティブ リミテッド filed Critical アーゴウ インターラクティブ リミテッド
Publication of JP2002544595A publication Critical patent/JP2002544595A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 文書の階層構成の中の他の文書へのハイパテキストリンク(118,120)を含む文書を処理するためのデータ処理システム。アクセスされている目的文書で探索して、階層構成の中で目的文書より上位の一つ以上のリンクされた文書の中に存在するコンポーネント(124,126)を捜す。このような重複コンポーネントが識別された場合、それらは目的文書から除去される。重複コンポーネントを避けることにより、伝送帯域幅、所要処理、および文書にアクセスする装置に対するディスプレイ要求条件が低減される。

Description

【発明の詳細な説明】
【0001】 本発明はデータ処理システムに関するものである。更に詳しくは本発明は、文
書を表し、その文書または別の文書の中のリンクロケーションを指定するリンク
データアイテムを含むデータファイルを処理するためのデータ処理システムに関
するものである。
【0002】 文書のリンク階層構成形式でデータ表現を与えることは知られている。これは
、ワールドワイドウェブのページ内容を考えることができる一つの方法である。
各ページは通常、文書の階層構成の中の別のページへの一つ以上のハイパテキス
トリンクを含む。階層構成の最上部には通常、「ホーム」ページが見出される。
このホームページの下には、通常しだいに、より特定となる題目についての情報
を与えるディレクトリ/サブディレクトリ型の構造に従って配置された、それ以
上のページの選択されたものがあるのが普通である。この型の階層構成配置は、
関心のある情報を見出すために階層構成を上下してナビゲーションするユーザは
充分に理解している。
【0003】 ワールドワイドウェブを介したアクセスに利用できる既存の資料の圧倒的な大
多数は、従来のパソコンを使用してディスプレイし、操作する意図で作成された
。移動電話のような異なる型の装置を介したアクセスにこの既存の資料を利用で
きるようにすることが望ましい。これの問題は、互いに異なる型の装置がより低
いディスプレイ機能と、より低い通信帯域幅機能をそなえることがあり、その結
果、互いに異なる型の装置が既存の資料を正しくディスプレイし、操作すること
に苦闘することである。
【0004】 一つの側面から見ると本発明は、文書を表現するデータファイルであって、前
記文書または別の文書の中のリンクされたロケーションを指定する少なくとも一
つのリンクデータアイテムを含むデータファイルを処理する方法であって、 (i)リンクデータアイテムによってリンクされる文書の階層構成の中の目的
文書にアクセスするステップと、 (ii)前記階層構成で前記目的文書より上位にあり、リンクデータアイテム
によって前記目的にリンクされた一つ以上のリンクされた文書を探索することに
より、前記階層構成で前記目的文書より上位にある前記一つ以上のリンクされた
文書の中にすでに存在する前記目的文書の重複コンポーネントを識別するステッ
プと、 (iii)前記目的文書から前記重複コンポーネントの少なくとも一つを除去
するステップと を含むデータファイル処理方法を提供する。
【0005】 本発明は、文書の階層構成の中のかなりの量の資料が重複しているのが普通で
あることを認める。高分解能のディスプレイおよび大きな通信帯域幅機能をそな
えた従来のコンピュータシステムでは、このような重複資料の付加的なオーバヘ
ッドはあまり問題とはならない。しかし、能力の低いシステムでは、重複資料は
処理、帯域幅、およびディスプレイのかなりのオーバヘッドとなり、性能が低下
することがあり得る。本発明はこの問題に対処するため、文書の階層構成の中で
より上位に存在すると検出された重複コンポーネントを識別し、除去する。この
ようにして、文書の階層構成の中の適切なレベルに進むことによりユーザは所要
コンポーネントにアクセスすることができるが、階層構成の中の2以上のレベル
でコンポーネントを表示することによるオーバヘッドは除去することができる。
ユーザは文書の階層構成を横切って必要な情報を見出すことになれているので、
重複アイテムの除去により、使用可能性はあまり低下せず、逆に装置が階層構成
の中のより小さい文書にアクセスし、操作することが可能となり応答性の増大で
補われて余りある。
【0006】 重複コンポーネントは多数の異なる形をとり得る。しかし、本発明は、重複コ
ンポーネントを捜す前記探索が、 重複したリンクデータアイテムと、 重複したグラフィカルデータアイテムと、 重複したテキストデータアイテム の一つ以上を捜すことを含む実施例で特に有用である。
【0007】 これらの型の重複コンポーネントはしばしば生じ、全体としてシステムの使用
可能性にあまり衝撃を与えることなく除去できることが見出された。
【0008】 文書の階層構成は種々の異なる仕方で定義することができる。しかし、一好適
実施例では、前記文書はそれぞれが対応するユニバーサルリソース識別子をそな
えるインタネットウェブページであり、前記文書の階層構成は前記ユニバーサル
リソース識別子によって定義される階層構成に従う。
【0009】 インタネットウェブサイトは通常、ユニバーサルリソース識別子に基づく階層
構成に従って作成者により構成される。したがって、この同じ階層構成に基づい
て重複コンポーネントを除去することで、階層構成の中で特定のコンポーネント
は最初に現れるという直感的性質によって良好な性質を生じることが見出される
ことが多い。
【0010】 代案として、文書の前記階層構成はセションの中でユーザが前記文書にアクセ
スする順番に従い、前記セションの中で早くアクセスされた文書は前記セション
の中で後でアクセスされた文書より前記階層構成で、より上位に配置される。
【0011】 階層構成を定義するこのようなセションに基づくアプローチは、ユーザによる
アクセスのパターンに、より適している。セションは、あるタスクを遂行するた
めのユーザのシステムに対する交互作用によって制限されると考えてもよい。特
に、多数のユーザはしばしば訪れる自身の、ブックマークされたページを持って
いる。これらの、ブックマークされたページはユニバーサルリソース識別子の階
層構成の最上部になくてもよく、ウェブサイトを通って移動するとき、そのユー
ザに対する最も頻繁なスタート点となる。階層構成を確立するためにセションに
基づくアプローチを採用することにより、この使用パターンが認識され、またユ
ニバーサルリソース識別子の階層構成の最上部からスタートしなくてもユーザが
捜しているコンポーネントを素早く見出すことができる可能性が高まる。
【0012】 セションに基づく階層構成の最上部は種々の異なる仕方で選択することができ
る。好適実施例では、前記階層構成はその最上位の文書として、 前記セションの中でアクセスされた最初の文書と、 前記セションの中で所定の先行周期中にアクセスされた最初の文書と、 前記セションの中で所定の数の、前にアクセスされた文書の中のアクセスされ
た最初の文書と の一つを使用する。
【0013】 セションに基づく階層構成の最上部を定義する上記仕方は各々、特定の環境で
利点をそなえており、ユーザがセションに基づく階層構成を定義する特定の仕方
を選択することを許してもよい。
【0014】 文書の階層構成の中の共通の重複コンポーネントは、文書の階層構成の中の種
々の点へのリンクを表現するボタンを与えるナビゲーションバー(bar)であ
る。同じナビゲーションバーをウェブサイトのすべてのページに示すのが普通で
ある。ナビゲーションバーはかなりのグラフィカルな内容を含むことが多く、こ
れは処理と帯域幅の負荷となり、機能の制限されたディスプレイ装置には不利で
ある。したがって、ナビゲーションバー等の中で重複アイテムを除去することが
望ましい。しかし、ユーザがサイトを通して素早く、直感的にナビゲーションで
きることを維持するために、好適実施例は階層構成の中で一つ上位の文書への一
つ以上のアップリンクと、階層構成の中で最上位の文書へのホームリンクを付加
する。
【0015】 ページにこれらのリンクの一方または両方を付加することに伴う処理と帯域幅
のオーバヘッドは、達成される使用可能性の利点で補われて余りある。
【0016】 リンクデータアイテムは種々の形式を取り得るが、本発明はリンクデータアイ
テムがハイパテキストリンクである実施例に特に適していることが理解されよう
。同様に、本発明はスタンドアロンシステムで使用することができるが、コンピ
ュータネットワークを介してソースコンピュータサーバからデータファイルを検
索する実施例で特に有用である。このような実施例では、ソースコンピュータサ
ーバとデータファイルを要求するクライアントコンピュータとの間のコンピュー
タネットワークの中に配置された代理サーバは、クライアントコンピュータ自体
にかなりの余分な負担をかけることなく、アクセスと、探索と、除去のステップ
を遂行する処理と記憶の機能を提供できることが多い。しかし、移動無線装置の
ようなクライアントコンピュータ装置の処理能力が向上するにつれて、アクセス
と、探索と、除去のステップをクライアントコンピュータ自体で遂行することが
ますます可能となる。クライアントコンピュータは、文書に対してもともと想定
された機能とは異なる機能をそなえてもよい。すなわち、文書はディスプレイに
依存しないものであってよい。
【0017】 もう一つの側面から見ると本発明は、文書を表現するデータファイルであって
、前記文書または別の文書の中のリンクされたロケーションを指定する少なくと
も一つのリンクデータアイテムを含むデータファイルを処理する装置であって、 (i)リンクデータアイテムによってリンクされる文書の階層構成の中の目的
文書にアクセスするステップと、 (ii)前記階層構成で前記目的文書より上位にあり、リンクデータアイテム
によって前記目的にリンクされた一つ以上のリンクされた文書で探索することに
より、前記階層構成で前記目的文書より上位にある前記一つ以上のリンクされた
文書の中にすでに存在する前記目標文書の重複コンポーネントを識別するステッ
プと、 (iii)前記目的文書から前記重複コンポーネントの少なくとも一つを除去
するステップと を遂行するための処理論理を含むデータファイル処理装置を提供する。
【0018】 次に、付図を参照して本発明の一実施例を説明する。これは例に過ぎない。
【0019】 図1はコンピュータネットワーク2を示す。コンピュータネットワーク2は、
その中でHTMLデータファイルの形式のインタネットウェブページがソースサ
ーバ4とクライアントコンピュータ6、8との間で伝送されるインタネットの一
部とすることができる。代理サーバ10はソースサーバ4とクライアントコンピ
ュータ6、8との間に配置される。クライアントコンピュータは、普通のデスク
トップコンピュータ6とすることができ、それに対してインタネットウェブペー
ジが主として設計され、意図されている。クライアントコンピュータは、無線リ
ンク12を介してコンピュータネットワーク2に接続されたインタネット可能な
移動電話機8の形式であってもよい。
【0020】 移動電話機8は代理サーバ10を介して接続され、代理サーバ10はクライア
ントコンピュータとしての移動電話機8からのリンクが完全なデスクトップコン
ピュータ6に比べて小さくて機能の低いディスプレイをそなえた装置へのもので
あるということを(たとえば、ユーザIDおよびパスワードの詳細を介して)検
出してもよい。したがって、代理サーバ10はソースサーバ4からフェッチされ
たインタネットウェブページに対して付加的な処理ステップを遂行することがで
き、その後、インタネットウェブページは移動電話機8に送られる。したがって
、インタネットウェブページは移動電話機8に、より有用な形でディスプレイさ
れるようにできる。理解されるように、移動電話機8の処理能力がより高く、無
線帯域幅が充分である場合には、完全なインタネットウェブページを移動電話機
8に送信することができ、移動電話機8はそれらのページのそれ自身の処理を行
うことにより、その、より小さなディスプレイ出力でのディスプレイに、より適
した形式にしてもよい。
【0021】 図2はソース文書14を表現するデータファイルをリンクカテゴライザ16が
処理して、カテゴリデータが付加された出力文書18を生成する様子を示す概略
図である。理解されるように、リンクカテゴライザ16は通常、カテゴリデータ
を文書に付加する機能を遂行するために書かれたソフトウェアを実行する汎用コ
ンピュータの形を取る。リンクカテゴライザ16は、ソース文書14の中の識別
されたキーワードを適切なカテゴリにマッピングすることを可能とするカテゴリ
ツーキーワード(category−to−keyword)データベース20
を使用する。カテゴリツーキーワードデータベース20は、各カテゴリデータが
それに対応するキーワードをそなえ、スコア値がキーワード毎に対応する階層構
成データベースの形とすることができる。リンクカテゴライザ16はユーザツー
カテゴリ(user−to−category)データベース22も使用する。
ユーザツーカテゴリデータベース22により、リンクカテゴライザは他の機能、
たとえばユーザが特に関心をもっていることが知られているデータを除去または
付加する仕方でのソース文書の修正を遂行することができる。
【0022】 図3は通常、HTML文書の中に埋め込まれるリンクデータアイテム24を示
す。リンクデータアイテム24はユニバーサルリソース識別子26およびディス
プレイテキスト28を含む。ディスプレイテキスト28が存在する場合には、こ
れは文書の中のハイパテキストリンクとしてディスプレイされるものである。デ
ィスプレイテキスト28が存在しない場合には、ユニバーサルリソース識別子2
6がディスプレイされる。
【0023】 リンクデータアイテム24を処理して、すべての句読点を除去し、これをスペ
ースに置き換えることにより、リンクデータアイテム24の中のキーワードが識
別される。次に、結果として得られるキーワード30のストリームをキーワード
ツーカテゴリマッチングデータベース20に入力することができる。代理サーバ
10がキーワードの分析を実時間で充分に早く行えるようにするリレーショナル
データベースとしてカテゴリツーキーワードデータベース20を構成することが
できる。
【0024】 図4はカテゴリデータベース20の階層構成の性質を示す。特に、”Tran
sport”のようなカテゴリは、”Car”、”Motorcycle”、”
Bicycle”、”Lorry”、および”Van”のような、ある個数のサ
ブカテゴリに分解することができる。これらのサブカテゴリは各々、図示するよ
うに更に分解することができる。階層構成は、要求された分析の程度と、処理と
データ記憶の要求条件および非常に特殊なカテゴリ分類が実際に正しい可能性と
の兼ね合いによって色々な深さを採り得る。
【0025】 図5はカテゴリツーキーワードデータベース20の中の特定のカテゴリデータ
エントリの概略図である。この場合、カテゴリデータ32は、各々対応するスコ
ア値36をそなえる一連のキーワード34に対応する。リンクデータアイテム2
4をそなえたキーワード30がキーワード34と照合され、カテゴリデータエン
トリ32の一致毎のスコア値36が加算される。スコアが最高のカテゴリデータ
エントリ32が一致するものと見なされる。
【0026】 図2に戻って、最良の一致を生じるカテゴリデータエントリ32が識別される
と、分析されたリンクデータアイテム24に対応して文書18にメタタグの形の
カテゴリデータ38が挿入される。カテゴリデータ18はこのように、リンクデ
ータアイテム24が関連する主題の表現を与える。この情報は、代理サーバ10
が遂行する他のプロセスに対して非常に有用である。特に、代理サーバ10は各
ハイパテキストリンクの前にグラフィカルアイテムを自動的に挿入して、関心の
あるリンクをより早く認識するのを助けてもよい。代理サーバ10は、ユーザに
適していない、またはユーザに望ましくないことがわかっているカテゴリを除去
することもできる。たとえば、ユーザツーカテゴリデータベース22内で読者が
自動車(car)に関する情報を希望しないことがわかっている場合である。代
理サーバ10は、ハイパテキスト文書を見ながらユーザがたどるリンクのカテゴ
リに関する情報を記録し、ユーザの関心のあるプロファイルをアセンブルして、
多分ユーザが関心がある他の資料、たとえば、標的を定めた広告をユーザに提供
することもできる。このようなユーザのプロファイル情報を材料とするもう一つ
の用途は、ユーザの関心に関連する情報のプリフェッチである。プリフェッチを
使用して代理サーバ10は、ユーザが要求する前にユーザが多分見たがる情報を
自動的に収集して記憶してもよい。その後、ユーザがこの情報を要求すれば、よ
り素早くこの情報を渡すことができる。ユーザがこの情報を要求しなければ、こ
の情報を廃棄することができる。
【0027】 図6は、10個のハイパテキストリンクを含むもとのウェブページ80を、ユ
ーザが希望しない、または希望する可能性が低いと検出されたハイパテキストリ
ンクの除去により、より小さなディスプレイウィンドウ84を使用するディスプ
レイにより適するページ82に修正する様子を示す。これは、各リンクに対応す
るカテゴリデータ38をユーザツーカテゴリデータベース22に記憶されている
ユーザプリフアレンスデータと比較することにより行われる。ユーザツーカテゴ
リデータベース22は、ユーザが関心を持たず、ディスプレイを希望しないリン
クのカテゴリをユーザが指定することにより得られるプリフアレンスデータを含
むことができる。その代わりに、またはそれに加えて、ユーザがたどるリンクの
カテゴリの記録を保持している代理サーバ10が、たとえば、関心のあるカテゴ
リを動的にユーザプロファイリングすることにより、ユーザツーカテゴリデータ
ベース22を自動的に次第に作り上げることができる。このようにして、ユーザ
がほとんど関心がないと述べられるか、またはそのように観測されたカテゴリは
ページ82から除去して、限られた帯域幅およびディスプレイリソースをより良
く使用することができる。この種の内容フィルタリングは資料をブロックするた
めに使用してもよい。たとえば、子供が適切でない資料にアクセスできないよう
にすることを親が望む場合である。
【0028】 図7はカテゴリデータをソース文書に追加するステップを示す流れ図である。
ステップ52で、ソースサーバ4からネットワークリンクを介してソース文書が
フェッチされる。ステップ54で代理サーバ10はソース文書を処理することに
より、その中のリンクデータアイテム24を識別して、それらのリンクデータア
イテム24の中のキーワードデータを分離する。ステップ56および58で代理
サーバはリンクデータアイテム24の中で識別されたキーワードに一連の規則を
適用することにより、適正なカテゴリ分類を行うのに充分なほどキーワードが特
定のものであるか判定する。適用される規則の一例は次の通りである。 1)最初にすべてがニート(neat−きちんとしている)である、すなわち
、すべてが、「ニート」と呼ばれる状態で初期設定される。 2)テキストの長さが10より大きく、かつ長さ対スペースの比が10:1よ
り大きい場合には、それはニートでないと判定される。 3)テキストが「娯楽」である場合には、ニートであると判定される。 4)テキストが「画像」の後に数字が付いたものである場合には、ニートでな
いと判定される。 5)テキストの長さが4キャラマタより短い場合には、ニートでないと判定さ
れる。 6)アンダスコア個数がスペース個数を超える場合には、ニートでないと判定
される。 7)テキストが”http://”と一緒にある場合には、ニートでないと判
定される。 8)テキストが引用符で囲まれている場合には、ニートでないと判定される。 9)テキストが”image map”と一緒にある場合には、ニートでない
と判定される。 10)テキストが”default”である場合には、ニートでないと判定さ
れる。 更に、特定の地理的な位置に対して付加し得る付加的な規則がある。たとえば
、 11)テキストが”Island”を含む場合には、ニートであると判定され
る。 12)テキストが”Kanagawa−Ken”を含む場合には、ニートであ
ると判定される。
【0029】 これらの両方とも(そして特定の規則のいくつかも)「サイトに特有の規則」
のようなカテゴリに付加してもよい。
【0030】 充分な情報が存在する場合には、処理はステップ60に進む。充分な情報が存
在しない場合には、代理サーバ10はリンクデータアイテム24によって識別さ
れるターゲットロケーションのタイトルデータをフェッチして、そのタイトルデ
ータから付加的なキーワードを得る。リンクデータアイテムが示す文書全体をフ
ェッチする必要はない。これは、リンクデータアイテムが指し示す文書全体をフ
ェッチし、分析するスパイダリングと対照的である。
【0031】 ステップ60で、代理のサーバ/リンクカテゴライザ16はカテゴリツーキー
ワードデータベース20の中で識別されたキーワードを捜し出し、可能な各カテ
ゴリのスコアを記録する。ステップ62で、スコアが最高のカテゴリがリンクデ
ータアイテム24に対応するように選択される。ステップ64で、ステップ62
で選択されたカテゴリを表すメタデータタグがリンクデータアイテム24に対応
して文書に挿入される。
【0032】 図8は文書のグラフィカルデータの内容を修正するためのシステムの概略図で
ある。ソース文書40がインタネットリンクを介してソースサーバ4からアクセ
スされる。ソース文書40はインタネットウェブページを表現するHTML文書
の形になっている。ソース文書40はそのソースグラフィカルデータの内容の一
部としてGIFファイル、JPEGファイル、およびビットマップファイルを含
んでもよい。ソース文書40は、上記の処理によって付加されるようなリンクデ
ータアイテム24を分類するカテゴリデータ38を含む。
【0033】 グラフィカルアイコンアロケータ42はソース文書40を受け、ソースグラフ
ィカルデータアイテムの全部またはいくつかを除去する。次に、グラフィカルア
イコンアロケータ42はカテゴリツーアイコンデータベース44にアクセスし、
そこでソース文書40の中に埋め込まれたカテゴリデータ38を使用して、ソー
ス文書40の中の各リンクデータアイテム24に対応するのに適したアイコンが
識別される。カテゴリツーアイコンデータベース44から出力グラフィカルデー
タアイテムが識別されると、このアイコン46を表すデータがメタタグとして出
力文書48に挿入される。出力グラフィカルデータアイテム46を表すデータは
単に既知のディスプレイ装置8に組み込まれたアイコンに対する識別子であって
もよいし、またはその代わりに、これがディスプレイ装置8の中に既に埋め込ま
れることなしにアイコンの出現を指定するに充分な情報を与えるデータであって
もよい。
【0034】 理解されるように、グラフィカルアイコンアロケータ42は通常、代理サーバ
10のような汎用コンピュータ上で動作するソフトウェアの形をとる。クライア
ントコンピュータ8の処理能力が充分で、充分な帯域幅が得られる場合には、ソ
ース文書40をそっくりそのままクライアントコンピュータ8に送信して、図6
に示される処理全体をクライアントコンピュータ8の中で行ってもよい。
【0035】 図9は、移動電話機8の小さなLCDディスプレイのような小さな低分解能デ
ィスプレイ装置50を示す。図7の左側部分には、ソースページからのグラフィ
カルデータをすべて除去した一連のハイパテキストリンクを示す、テキストだけ
のウェブページが示されている。このようなディスプレイの使用可能性は、ユー
ザがページのグラフィカルデータの内容からかなりの情報を得ているようなもと
のソース文書40と比べて劣っている。
【0036】 本発明を使用して、ページの中のリンクをカテゴリ分類した後、各リンクに適
切なアイコンを対応させることができる。これらのアイコンを移動電話機8に組
み込んで、これらのアイコンをそっくりそのままクライアントコンピュータに送
信する必要がないようにもできる。組み込まれた特定のアイコンを表すコードは
単に、出力文書48の中のデータ46として付加することができる。
【0037】 図10はグラフィカルデータアイテムの処理を示す流れ図である。ステップ6
6で、代理サーバ10はソース文書40をフェッチする。ステップ68で、代理
サーバ/グラフィカルアイコンアロケータ42はソース文書40からすべての非
テキストデータを除去する。ステップ70で、グラフィカルアイコンアロケータ
42はカテゴリツーアイコンデータベース44を使用して、カテゴリデータ38
をリンクデータアイテム24に対応させるべきアイコンにマッピングする。ステ
ップ72で、データを表すアイコンがメタタグ46として出力文書48の中に挿
入される。ステップ74で、テキストデータおよび対応するアイコンデータを含
む、結果として得られる出力文書48がクライアントコンピュータ8に送信され
る。ステップ76で、クライアントコンピュータ8は受信した文書を処理し、リ
ンクデータアイテムの次に、対応するアイコンの付いたテキストをディスプレイ
する。アイコンはクライアントコンピュータ8自身の中の組込みアイコンとする
ことができる。
【0038】 図11は、著者が従来のパソコンを使用して表示し操作されることを想定した
インタネットウェブページの形式のソース文書78を示す。文書78の中には、
大きな画像ファイルへのハイパテキストリンクの形式のリンクデータアイテム8
0がある。フル画像ファイルの小さなサムネール(thumbnail)表現8
2も示されている。従来のパソコンでユーザがこのウェブページ78にアクセス
すると、リンク80のディスプレイテキストと組み合わされたサムネール表現8
2は、ユーザが作成されたリンクを理解するのに充分な情報を与える。しかし、
ウェブページ78が、グラフィカルデータが除去された修正されたページ84を
生じるように修正されると、リンク80に対応する初期ディスプレイテキスト8
6は充分でないので、ユーザは作成された接続を適正に理解することができない
【0039】 システムはウェブページ78の中のリンクを識別し、各リンクに対応する初期
ディスプレイテキストに対するテストを行うことにより、不充分な読みやすさを
示す特性を判定する。図11に示された初期ディスプレイテキスト86の場合に
は、これはワードの中に余りに多くのキャラクタを含むテスト、またはワードの
中間に小文字の後に大文字を含むテストに不合格となる。初期ディスプレイテキ
スト86が充分に読みやすくないと識別されると、リンクが関連するページのタ
イトル88がアクセスされ、このタイトルが初期ディスプレイテキスト86の代
わりにもう一つのテキストとして使用される。タイトル88はそれ自体その読み
やすさの評価を受け、それがこの判定に合格した場合のみ、初期ディスプレイテ
キスト86の代わりとしてとどまる。もう一つのテキスト88が読みやすさのテ
ストに不合格となった場合には、リンク80に対して初期ディスプレイテキスト
が戻される。
【0040】 上記の手法はコンピュータソフトウェアのシステムを使用する。コンピュータ
ソフトウェアのシステムを介して、ユーザは読みたいハイパテキスト文書をフェ
ッチすることを要求される。通常、これは中間「代理サーバ」の形となっている
が、スタンドアロンモードの動作も想定されている。記憶ロケーションから読者
に転送されるとき、システムはハイパテキストページを処理する。ハイパテキス
ト文書の中のリンクを識別した後、ハイパテキストリンクのテキスト部分(すな
わち、リンクされた文書に進むためにユーザが選択するテキスト)がチェックさ
れて、読みやすいか調べられる。これは多数の方法で行うことができる。これら
の方法には下記の方法が含まれる(が、下記の方法に限定されない)。 ・アンダスコア個数がスペース個数より多い。 ・テキストはあるキャラクタ数の長さより短い。 ・テキストはあるキャラクタ数の長さより長い。 ・ワード当たりの平均キャラクタ数がある限界より大きい。 ・同じワードの中で小文字の後に大文字があるワードをテキストが含む(たと
えば、gooSE)。 ・辞書の中に無いワードをテキストが含む。
【0041】 上記の組み合わせを使用して、読みやすさの点でリンクのスコアをつけること
ができる。スコアが閾値より大きい場合には、テキストの代わりが捜し求められ
る。これは多数の方法で行うことができる。これらの方法には下記の方法が含ま
れる(が、下記の方法に限定されない)。 ・リンクされたハイパテキスト文書をフェッチし、その文書のタイトル(存在
すれば)または文書の中のテキストの第一行を検索すること。 ・テキストを辞書からの別のテキスト(代理サーバに結合されたファイルに記
憶されている、たとえば、もう一つのテキストマッピングに対するキーワード)
に置き換えること。 ・現在の文書のタイトル(存在すれば)に置き換えること。 ・そのファイル型の接尾辞を除去したファイル名を使用すること。
【0042】 初期ディスプレイテキストを置き換えるべきもう一つのテキストが初期ディス
プレイテキストより読みやすくないと思われる場合には、初期ディスプレイテキ
ストはその場所に保持され、置換を行わないか、または代わりの置換が使用され
る。
【0043】 図12はリンクに対応するディスプレイテキストの読みやすさを改善する手法
を示す流れ図を示す。
【0044】 ステップ90で、アクセスされるべきページが遠隔コンピュータサーバからフ
ェッチされる。ステップ92で、フェッチされたページで探して、リンクデータ
アイテム(ハイパテキストリンク)を検出し、これらのリンクに対応する初期デ
ィスプレイテキストを判定する。ステップ94で、上記の読みやすさの規則は各
リンクの初期ディスプレイテキストに適用される。ステップ96で、初期ディス
プレイテキストが読みやすさの規則に合格するか否かについての判定が行われる
。初期ディスプレイテキストが読みやすさの規則に合格した場合には、プロセス
はステップ98に進み、そこで出力ページが生成される。
【0045】 ステップ96で初期ディスプレイテキストが読みやすさの規則に合格しない場
合には、ステップ100を使用して、テキストを、たとえば、上記の置き換えを
使用することにより、リンクアイテムデータに基づいて得られる、もう一つのテ
キストに置き換える。これらの置換候補を適用し、ステップ102および104
により各置換候補をテストして、読みやすさのテストに合格するか否か判定する
。ステップ104で読みやすさのテストに合格すると、ステップ98で、置換候
補をもう一つのテキストとして使用してリンクデータアイテムの中の初期ディス
プレイテキストを置換し、このもう一つのテキストを含む出力ページが生成され
る。置換候補テキストが読みやすさのテストに合格しない場合には、ステップ1
06ですべての候補がなくなったと判定されない限り、次の置換候補テキストが
試みられる。ステップ106ですべての候補がなくなったと判定された場合には
、ステップ108は初期ディスプレイテキストに戻り、ステップ98でこの初期
ディスプレイテキストを使用して出力ページが作成される。
【0046】 図13は、ある初期ディスプレイテキストを修正して、より読みやすい形式に
する仕方を示す概略図である。例Aでは、数字とアンダスコアキャラクタを含み
、所定の長さを超えるファイル名は、それが示すページのタイトルに置き換えら
れる。例Bでは、短か過ぎて有用でない初期ディスプレイテキストは、リンクに
対応し、上記のように求められるカテゴリデータに置き換えられる。例Cでは、
長過ぎて移動電話機に有用にディスプレイできない初期ディスプレイテキストは
、初期の、より長いテキストから選択されたキーワードを使用するテキストに置
き換えられる。最後に、例Dでは、ファイル名がファイル名からそのファイルタ
イプのサフィックスを除いたものに置き換えられる。
【0047】 前に説明したように、リンクデータアイテムに対応するディスプレイテキスト
の読みやすさを改善する上記の処理は、すぐれた処理を使用する代理サーバとそ
の代理サーバの記憶機能、またはクライアント装置自体に基づいて遂行してもよ
いことは理解されよう。クライアント装置の機能が向上するにつれて、より多く
の処理をクライアント装置で行い、特定の代理サーバを通して接続を行う必要を
なくすのが当然であろう。
【0048】 図14は、文書の階層構成の形式のインタネットウェブサイトの概略図である
。各ページは、ディレクトリ/サブディレクトリ構造に類似した形式の対応する
ユニバーサルリソース識別子110をそなえている。図示する階層構成は会社の
ホームページ112で始まり、それぞれのハイパテキストリンク118および1
20を介してプロダクトページ114およびサポートページ116に進む。ハイ
パテキストリンク118および120はホームページリンク122とともに、ウ
ェブサイトのすべてのページに現れるナビゲーションバーを形成する。会社ロゴ
124および標準フッタテキスト126もウェブサイトのすべてのページに現れ
る。
【0049】 プロダクトページ114は更に二つのハイパテキストリンク128および13
0を含む。ハイパテキストリンク128および130はそれぞれページ132お
よび134を指し、ページ132および134は小売り(retail)と卸し
(wholesale)のプロダクトの詳細を示す。ページ112、114、1
16、132、および134は各々、それ自身の特有のテキストをも含む。
【0050】 処理と帯域幅のリソースおよびディスプレイ装置リソースが限定されていると
き、会社ロゴ124とフッタテキスト126のようなアイテムを繰り返し送信し
、処理し、ディスプレイすることがかなりのオーバヘッドとなる。ユーザがペー
ジ112でサイトに入ると、ユーザは最初サポートページに進む機会が与えられ
る。しかしながらユーザがプロダクトページ114に進んだ場合には、ユーザが
サポートに関心を持っていないと仮定するのは妥当である。したがって、ホーム
ページ112だけでなくプロダクトページ114にもサポートページ116への
リンク120をディスプレイするのは無駄である。
【0051】 図15は図14に示されたウェブサイトを示すが、このときは階層構成で下の
繰り返しのコンポーネントは除去される、すなわち、この配置では階層構成を下
降するとき最初に遭遇したときはコンポーネントが現れるが、その後は除去され
る。たとえば、会社ロゴ124はホームページ112に現れるが、階層構成で下
のどのページにも現れない。同様に、フッタテキスト126はホームページ11
2にだけ現れ、それより下のページからは除去された。ナビゲーションバーを形
成するリンク118、120、および122はホームページ112にだけ現れる
。より下のページでは、リンク136が付加され、階層構成の最上位ページへの
リンクが行われる。現在のページより上に最上位ページでないページがある場合
には、アップリンク138も付加される。
【0052】 図15からわかるように、ホームページ112より下のページの内容が著しく
減らされたので、それらのページはより早くクライアントコンピュータに送信す
ることができ、そのクライアントコンピュータで都合よく、素早く操作すること
ができる。それにもかかわらず、図14に示されたもとのウェブサイトの内容の
すべては、ウェブサイトの中のある点で図15に示された修正されたウェブサイ
トの中に存在する。
【0053】 図16は、セション階層構成と比べてユニバーサルなリソース識別子に基づい
てウェブサイトが階層構成にどのように入れられるかを示す概略図である。図1
6の左側に、ユニバーサルリソース識別子から求められる階層構成が示されてい
る。各ノードの隣の文字は特有のページを示す。図示された階層構成の中の垂直
位置は階層構成の中の位置を表す。各ノードの隣の数字は、ユーザセションの間
にページにアクセスする順番を表す。ユニバーサルリソース識別子に基づく階層
構成で、ページaは階層構成の最上部にあり、ページeは中心の近くにある。ユ
ニバーサルリソース識別子と比べて、図16の右側部分に示されたセション階層
構成は、アクセスされるべき最初のページが階層構成の中で、より高く配置され
る階層構成を示す。したがって、アクセスされる最初のページ(たとえば、ブッ
クマークにより)がページeであったので、これが階層構成の最上部にある。ユ
ーザは次に数字で示される順番にウェブサイト全体を横切ってもよい。ページは
これらの数字に従ってセション階層構成の中で配置され、同じ水平レベルにある
ページは階層構成の中の同じ位置を示す。
【0054】 ハイパテキスト文書は読者によりある順序で見られ、各ページの中の「リンク
」を選択することにより次々に動かされる。ある情報が前の方のページで示され
、読者によって無視された場合には、読者はそれに関心を持っていないと考える
のが妥当である。また、多くの現代的なハイパテキスト文書システム(ときに「
ウェブサイト」と呼ばれる)は階層構成形式で設計される。ウェブサイトのセク
ションをリストするページ、および各サブセクションをリストする、より多くの
ページの後に、実際の内容を含むページが続いてもよい。履歴トラッキング情報
が記録されていない場合には、上記のような階層構成またはユーザの読書の履歴
トラッキングを用いて、読者が既にどのページを読んだはずであるかをシステム
が予測するのを助けることができる。
【0055】 本手法はコンピュータソフトウェアのシステムを使用する。このシステムを通
してユーザは読みたいハイパテキスト文書をフェッチするように要求される。代
表的には、これは中間の「代理サーバ」の形になっているが、動作のスタンドア
ロンモードも想定することができる。システムは、ハイパテキストページが記憶
ロケーションから読者に転送されるときハイパテキストページを処理し、パーツ
を除去し、見出したものを記録し、他のタスクを遂行する。
【0056】 ハイパテキスト文書がユーザにより要求された後、システムにより精査される
と、システムは文書のユニホームリソース識別子(URI)に基づいて、ページ
が存在する階層構成を調べる。このURI、または使用されているハイパテキス
トシステムに適したある類似の情報がページを一義的に表し、そのページが存在
する階層構成についてのある情報を提供すべきである。システムは、階層構成の
中の要求されたページより上にある各ページ(ときに「親」ページと呼ばれる)
をフェッチし、各ページの情報の個別ユニットを記録する。システムは、他のペ
ージへのリンクを記録するだけでもよいが、画像とフットノートの一方または両
方のような他の情報の部分も想定されている。読者の活動を記録中である場合に
は、現在の文書の親ページの代わりに、既に見たページを考えてもよい。
【0057】 各ページの情報ユニットを記録すると、親ページに存在するそれらのユニット
が、読者が要求したものから除去される。現在のページに一つ以上の新しいリン
クを付加して、読者が使用したければ、リンクが含んでいるページに戻る機会が
得られるようにする。
【0058】 この手順の利点は、重要な情報を除去することがなく、またハイパテキストの
著者が特別な準備をする必要なしで各文書を管理しやすいサイズに小さくできる
、ということである。これは、技術的に制限され、このような著者がそのために
書く大多数の読者とは非常に異なっている小さな装置の場合に重要である。
【0059】 読者が見るページの履歴とともに動作するようにシステムが構成される場合に
は、リンク除去の一部と考えられる最も古いページは、見られた最初のページ、
ある時間、たとえば、10分の間に見られた最初のページ、または最後からN番
目のページ、多分最後から10番目のページとしてもよい。システムは現在のペ
ージの最初に見られたページの後のどのページも考えない(もちろん、現在のペ
ージを前のページとして扱わない)。これにより、ユーザが前のページに「戻っ
た」場合には、ユーザは前のページのすべてのリンクを失うことはない。
【0060】 図17は上記のプロセスを示す流れ図である。ステップ140で、目的文書が
アクセスされる。ステップ142で、その目的文書を構成するコンポーネントが
、階層構成で目的文書より高位の文書にあることが知られているコンポーネント
と比較される。階層構成でより高位のコンポーネントの内容は、既にフェッチさ
れていない場合にはユニバーサルリソース識別子に基づいてそれらのページをフ
ェッチすることにより判定してもよいし、または前に説明したようにユーザセシ
ョンに基づいて判定してもよい。
【0061】 ステップ144で、階層構成で、より高位の文書の中に存在する重複コンポー
ネントであることがわかった目的文書の中のアイテムが除去される。ステップ1
46で、階層構成の最上部へのハイパテキストリンクおよび多分階層構成の一段
上へのハイパテキストリンクも付加される。ステップ148で、出力ページが生
成される。
【0062】 図18は、移動電話機のような、クライアントデータ処理装置の概略図である
。クライアント装置150は代表的には、中央処理ユニット152、リードオン
リーメモリ154、ランダムアクセスメモリ156、ディスプレイドライバ15
8、ディスプレイ160、通信インタフェース160、およびアンテナ162を
含む。中央処理ユニット152、リードオンリーメモリ154、ランダムアクセ
スメモリ156、ディスプレイドライバ158、および通信インタフェース16
0は共通バス164を介して接続される。リードオンリーメモリ154は、処理
がクライアントに基づく上記の処理を実行するために中央処理ユニット152を
制御するためのコンピュータプログラムを保持するコンピュータプログラム記憶
装置を形成してもよい。ランダムアクセスメモリ156は作業用記憶領域として
使用される。ディスプレイ160は通常のパソコンと比べてサイズと分解能が低
下してもよい。たとえば、ディスプレイ160は今日の移動電話機に通常見られ
る低分解能のLCD画面であってもよいし、小さなディスプレイ自体であっても
よい。図示した通信インタフェース160はアンテナ162を介して代理サーバ
10にリンクされる無線インタフェースである。
【図面の簡単な説明】
【図1】 コンピュータネットワークの概略図である。
【図2】 文書を表すデータファイルにカテゴリ分類データを追加するためのシステムの
概略図である。
【図3】 リンクデータアイテムと、それに対応するキーワードを示す図である。
【図4】 階層構成のカテゴリデータベースの概略図である。
【図5】 カテゴリデータエントリを示す図である。
【図6】 カテゴリデータを使用してどのようにウェブページを修正して、ユーザが希望
しない、またはあまり希望しないことがわかっているリンクをフィルタアウトす
るかを示す図である。
【図7】 文書へのカテゴリデータの追加を示す流れ図である。
【図8】 文書に出力グラフィカルデータを追加するためのシステムの概略図である。
【図9】 カテゴリデータによるアイコン前後の文書を示す低分解能ディスプレイ装置を
示す図である。
【図10】 文書の中のリンクデータに対応する出力グラフィカルデータアイテムの追加を
示す流れ図である。
【図11】 リンクデータアイテムに対応するディスプレイテキストをより読みやすい形式
とする修正を示す概略図である。
【図12】 ディスプレイテキストを修正して、より読みやすい形式とするプロセスを示す
流れ図である。
【図13】 遂行することができるテキスト修正の種々の例を示す図である。
【図14】 重複構成要素を含む文書の修正されていない階層構成を示す図である。
【図15】 重複構成要素を除去した図14の階層構成の修正された形式を示す図である。
【図16】 ユニバーサルリソース識別子に基づく階層構成とセションに基づく階層構成と
の間の比較を示す図である。
【図17】 階層構成の中の重複構成要素を除去するためのプロセスを示す流れ図である。
【図18】 クライアントコンピュータとして動作することができるデータ処理装置の概略
図である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/30 419 G06F 17/30 419B (31)優先権主張番号 9910679.1 (32)優先日 平成11年5月7日(1999.5.7) (33)優先権主張国 イギリス(GB) (31)優先権主張番号 9910682.5 (32)優先日 平成11年5月7日(1999.5.7) (33)優先権主張国 イギリス(GB) (31)優先権主張番号 9910685.8 (32)優先日 平成11年5月7日(1999.5.7) (33)優先権主張国 イギリス(GB) (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),JP,US

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 文書を表現するデータファイルであって、前記文書または別
    の文書の中のリンクされたロケーションを指定する少なくとも一つのリンクデー
    タアイテムを含むデータファイルを処理する方法であって、 (i)リンクデータアイテムによってリンクされる文書の階層構成の中の目的
    文書にアクセスするステップと、 (ii)前記階層構成で前記目的文書より上位にあり、リンクデータアイテム
    によって前記目的にリンクされた一つ以上のリンクされた文書で探索することに
    より、前記階層構成で前記目的文書より上位にある前記一つ以上のリンクされた
    文書の中にやはり存在する前記目的文書の重複コンポーネントを識別するステッ
    プと、 (iii)前記目的文書から前記重複コンポーネントの少なくとも一つを除去
    するステップと を含むデータファイル処理方法。
  2. 【請求項2】 重複コンポーネントを捜す前記探索は、 重複したリンクデータアイテムと、 重複したグラフィカルデータアイテムと、 重複したテキストデータアイテム の一つ以上を捜すことを含む、請求項1記載のデータファイル処理方法。
  3. 【請求項3】 前記文書はそれぞれが対応するユニバーサルリソース識別子
    をそなえるインタネットウェブページであり、前記文書の階層構成は前記ユニバ
    ーサルリソース識別子によって定義される階層構成に従う、請求項1および2の
    いずれか一つの請求項記載のデータファイル処理方法。
  4. 【請求項4】 文書の前記階層構成はセションの中でユーザが前記文書にア
    クセスする順番に従い、前記セションの中で早くアクセスされた文書は前記セシ
    ョンの中で後でアクセスされた文書より前記階層構成で、より上位に配置される
    、請求項1および2のいずれか一つの請求項記載のデータファイル処理方法。
  5. 【請求項5】 前記階層構成はその最上位の文書として、 前記セションの中でアクセスされた第一の文書と、 前記セションの中の所定の先行周期の中でアクセスされた第一の文書と、 前記セションの中の所定の数の、前にアクセスされた文書の中のアクセスされ
    た第一の文書と の一つを使用する、請求項4記載のデータファイル処理方法。
  6. 【請求項6】 前記階層構成の中で一つ上位の文書の中のリンクされたロケ
    ーションを指定するアップリンクデータアイテムを前記目的文書に付加するステ
    ップを更に含む、先行請求項のいずれか一つの請求項記載のデータファイル処理
    方法。
  7. 【請求項7】 前記階層構成の中で最上位の文書の中のリンクされたロケー
    ションを指定するホームリンクデータアイテムを前記目的文書に付加するステッ
    プを更に含む、先行請求項のいずれか一つの請求項記載のデータファイル処理方
    法。
  8. 【請求項8】 前記リンクデータアイテムがハイパテキストリンクである、
    先行請求項のいずれか一つの請求項記載のデータファイル処理方法。
  9. 【請求項9】 前記データファイルがソースコンピュータサーバからコンピ
    ュータネットワークを介して検索される、先行請求項のいずれか一つの請求項記
    載のデータファイル処理方法。
  10. 【請求項10】 前記アクセスと、探索と、除去のステップが、前記ソース
    コンピュータサーバと前記データファイルを要求するクライアントコンピュータ
    との間の前記コンピュータネットワークの中に配置された代理サーバによって遂
    行される、請求項9記載のデータファイル処理方法。
  11. 【請求項11】 前記アクセスと、探索と、除去のステップが、前記ソース
    コンピュータサーバから前記データファイルを要求するクライアントコンピュー
    タによって遂行される、請求項9記載のデータファイル処理方法。
  12. 【請求項12】 前記クライアントコンピュータは、前記文書に対して想定
    されているディスプレイのディスプレイ機能とは異なるユーザディスプレイをそ
    なえている、すなわち前記文書がディスプレイインデペンデントである、請求項
    10および11のいずれか一つの請求項記載のデータファイル処理方法。
  13. 【請求項13】 前記クライアントコンピュータが無線装置である、請求項
    12記載のデータファイル処理方法。
  14. 【請求項14】 文書を表現するデータファイルであって、前記文書または
    別の文書の中のリンクされたロケーションを指定する少なくとも一つのリンクデ
    ータアイテムを含むデータファイルを処理する装置であって、 (i)リンクデータアイテムによってリンクされる文書の階層構成の中の目的
    文書にアクセスするステップと、 (ii)前記階層構成で前記目的文書より上位にあり、リンクデータアイテム
    によって前記目的にリンクされた一つ以上のリンクされた文書で探索することに
    より、前記階層構成で前記目的文書より上位にある前記一つ以上のリンクされた
    文書の中にやはり存在する前記目的文書の重複コンポーネントを識別するステッ
    プと、 (iii)前記目的文書から前記重複コンポーネントの少なくとも一つを除去
    するステップと を遂行するための処理論理を含むデータファイル処理装置。
  15. 【請求項15】 前記データファイルがソースコンピュータサーバからコン
    ピュータネットワークを介して検索される、請求項14記載のデータファイル処
    理装置。
  16. 【請求項16】 前記処理論理が前記ソースコンピュータサーバと前記デー
    タファイルを要求するクライアントコンピュータとの間の前記コンピュータネッ
    トワークの中に配置された代理サーバの一部である、請求項15記載のデータフ
    ァイル処理装置。
  17. 【請求項17】 前記処理論理が、前記ソースコンピュータサーバから前記
    データファイルを要求するクライアントコンピュータの一部である、請求項15
    記載のデータファイル処理装置。
  18. 【請求項18】 請求項1から13のいずれか一つの請求項記載のデータフ
    ァイル処理方法を遂行するためにデータ処理装置を制御するためのコンピュータ
    プログラムを記憶するコンピュータプログラム記憶媒体。
JP2000616541A 1999-05-07 2000-04-19 リンクされる文書の階層構成の中の文書を表現するデータファイルの修正 Pending JP2002544595A (ja)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
GBGB9910682.5A GB9910682D0 (en) 1999-05-07 1999-05-07 Data processing apparatus
GB9910684.1 1999-05-07
GBGB9910679.1A GB9910679D0 (en) 1999-05-07 1999-05-07 Data processing apparatus
GBGB9910683.3A GB9910683D0 (en) 1999-05-07 1999-05-07 Data processing apparatus
GB9910682.5 1999-05-07
GB9910683.3 1999-05-07
GBGB9910685.8A GB9910685D0 (en) 1999-05-07 1999-05-07 Data processing apparatus
GBGB9910684.1A GB9910684D0 (en) 1999-05-07 1999-05-07 Data processing apparatus
GB9910679.1 1999-05-07
GB9910685.8 1999-05-07
PCT/GB2000/001532 WO2000068830A2 (en) 1999-05-07 2000-04-19 Modifying a data file representing a document within a linked hierarchy of documents

Publications (1)

Publication Number Publication Date
JP2002544595A true JP2002544595A (ja) 2002-12-24

Family

ID=27517503

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2000616541A Pending JP2002544595A (ja) 1999-05-07 2000-04-19 リンクされる文書の階層構成の中の文書を表現するデータファイルの修正
JP2000616543A Pending JP2002544597A (ja) 1999-05-07 2000-04-19 リンクデータアイテムに対するディスプレイテキスト修正
JP2000616542A Pending JP2002544596A (ja) 1999-05-07 2000-04-19 文書内のグラフィカルデータ

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2000616543A Pending JP2002544597A (ja) 1999-05-07 2000-04-19 リンクデータアイテムに対するディスプレイテキスト修正
JP2000616542A Pending JP2002544596A (ja) 1999-05-07 2000-04-19 文書内のグラフィカルデータ

Country Status (4)

Country Link
US (3) US20020059335A1 (ja)
EP (3) EP1145145A2 (ja)
JP (3) JP2002544595A (ja)
WO (4) WO2000068830A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269262A (ja) * 2007-04-19 2008-11-06 Canon Inc 印刷データ処理装置、印刷データ処理方法及びプログラム
JP2015505397A (ja) * 2011-12-08 2015-02-19 グーグル インコーポレイテッド モバイルコンピューティングデバイス上の後続表示用にプレイスページデータをプリフェッチするための方法および装置

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6763496B1 (en) * 1999-03-31 2004-07-13 Microsoft Corporation Method for promoting contextual information to display pages containing hyperlinks
US7191400B1 (en) * 2000-02-03 2007-03-13 Stanford University Methods for generating and viewing hyperlinked pages
US6721749B1 (en) 2000-07-06 2004-04-13 Microsoft Corporation Populating a data warehouse using a pipeline approach
US6834297B1 (en) 2000-10-06 2004-12-21 Redline Networks, Inc. Web resource transfer acceleration system and method
US7249196B1 (en) 2000-10-06 2007-07-24 Juniper Networks, Inc. Web page source file transfer system and method
WO2002046948A1 (en) * 2000-12-06 2002-06-13 Adjectivity, Inc. Method, system and computer program for enhanced access to content over a network
KR100800404B1 (ko) * 2000-12-21 2008-02-04 엘지전자 주식회사 이동통신망을 통한 링크 메뉴 제공 및 생성방법
US20020083089A1 (en) * 2000-12-27 2002-06-27 Piccionelli Gregory A. Method and apparatus for generating linking means and updating text files on a wide area network
US20020099745A1 (en) * 2001-01-23 2002-07-25 Neo-Core, L.L.C. Method and system for storing a flattened structured data document
US6971060B1 (en) * 2001-02-09 2005-11-29 Openwave Systems Inc. Signal-processing based approach to translation of web pages into wireless pages
US6978266B2 (en) 2001-05-07 2005-12-20 Microsoft Corporation Determining a rating for a collection of documents
US7266765B2 (en) * 2001-08-31 2007-09-04 Fuji Xerox Co., Ltd. Detection and processing of annotated anchors
US7127503B2 (en) 2001-10-10 2006-10-24 Juniper Networks, Inc. Computer networking system, device, and method for improved speed in web page rendering
GB2382962A (en) * 2001-12-07 2003-06-11 Altio Ltd Data routing without using an address
US20030128236A1 (en) * 2002-01-10 2003-07-10 Chen Meng Chang Method and system for a self-adaptive personal view agent
US7284195B2 (en) * 2002-01-31 2007-10-16 International Business Machines Corporation Structure and method for linking within a website
US20030204522A1 (en) * 2002-04-23 2003-10-30 International Business Machines Corporation Autofoldering process in content management
US20050149853A1 (en) * 2002-04-24 2005-07-07 Fujitsu Limited Document display program and method
US20040044958A1 (en) * 2002-08-27 2004-03-04 Wolf John P. Systems and methods for inserting a metadata tag in a document
US7472168B2 (en) 2002-10-10 2008-12-30 Mobui Inc. Method for dynamically assigning and displaying character shortcuts on a computing device display
US7792827B2 (en) * 2002-12-31 2010-09-07 International Business Machines Corporation Temporal link analysis of linked entities
US7266568B1 (en) 2003-04-11 2007-09-04 Ricoh Company, Ltd. Techniques for storing multimedia information with source documents
US7206773B2 (en) 2003-04-11 2007-04-17 Ricoh Company, Ltd Techniques for accessing information captured during a presentation using a paper document handout for the presentation
US7664733B2 (en) 2003-04-11 2010-02-16 Ricoh Company, Ltd. Techniques for performing operations on a source symbolic document
US7421498B2 (en) * 2003-08-25 2008-09-02 Microsoft Corporation Method and system for URL based filtering of electronic communications and web pages
US7444403B1 (en) 2003-11-25 2008-10-28 Microsoft Corporation Detecting sexually predatory content in an electronic communication
US7540051B2 (en) * 2004-08-20 2009-06-02 Spatial Systems, Inc. Mapping web sites based on significance of contact and category
US7769773B1 (en) * 2004-08-31 2010-08-03 Adobe Systems Incorporated Relevant rule inspector for hierarchical documents
US7610400B2 (en) 2004-11-23 2009-10-27 Juniper Networks, Inc. Rule-based networking device
WO2006062421A2 (en) * 2004-12-10 2006-06-15 S.L.I. Systems, Inc. Information display method and system
DE602004011799T2 (de) 2004-12-24 2009-02-05 Research In Motion Ltd., Waterloo Auf Netzwerk basierte Anpassung von Inhalten für ein elektronisches Mobilgerät
US20060143282A1 (en) * 2004-12-27 2006-06-29 Brown Michael K Tailoring content for mobile electronic device based on network
US7562085B2 (en) * 2005-05-24 2009-07-14 Palo Alto Research Center Incorporated Systems and methods for displaying linked information in a sorted context
US7552398B2 (en) * 2005-05-24 2009-06-23 Palo Alto Research Center Incorporated Systems and methods for semantically zooming information
US7516422B2 (en) * 2005-07-21 2009-04-07 International Business Machines Corporation Graphical display of hierarchical hardlinks to files in a file system
US10380231B2 (en) * 2006-05-24 2019-08-13 International Business Machines Corporation System and method for dynamic organization of information sets
US7912829B1 (en) 2006-10-04 2011-03-22 Google Inc. Content reference page
US7979785B1 (en) 2006-10-04 2011-07-12 Google Inc. Recognizing table of contents in an image sequence
US8782551B1 (en) 2006-10-04 2014-07-15 Google Inc. Adjusting margins in book page images
US9319360B2 (en) 2007-11-01 2016-04-19 Google Inc. Systems and methods for prefetching relevant information for responsive mobile email applications
US8726165B1 (en) 2007-11-01 2014-05-13 Google Inc. Methods for auto-completing contact entry on mobile devices
US9241063B2 (en) 2007-11-01 2016-01-19 Google Inc. Methods for responding to an email message by call from a mobile device
US8676901B1 (en) * 2007-11-01 2014-03-18 Google Inc. Methods for transcoding attachments for mobile devices
US20090119678A1 (en) 2007-11-02 2009-05-07 Jimmy Shih Systems and methods for supporting downloadable applications on a portable client device
US20100281073A1 (en) * 2009-04-29 2010-11-04 Cloutier Robert P Sequence preserving method for transferring and sharing images
US20100285781A1 (en) * 2009-05-11 2010-11-11 Microsoft Corporation Deploying learning management systems to mobile communications devices
TW201101117A (en) * 2009-06-26 2011-01-01 Ibm Handheld device, method and computer program product for user selecting control unit of application program
US9494931B2 (en) * 2009-09-23 2016-11-15 Fisher-Rosemount Systems, Inc. Dynamic hyperlinks for process control systems
EP2471012A2 (en) * 2009-09-29 2012-07-04 Simplygen Ltd. System and method for modifying a webpage
US20110219294A1 (en) * 2010-03-04 2011-09-08 Skiff, Inc. System And Method For Automatic Continuation Marks In An Electronic Publication
EP2555120A4 (en) * 2010-03-31 2016-04-06 Rakuten Inc INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING, INFORMATION PROCESSING AND STORAGE MEDIUM
JP2011215785A (ja) * 2010-03-31 2011-10-27 Nifty Corp 変換処理装置
US9069550B2 (en) * 2010-11-29 2015-06-30 International Business Machines Corporation System and method for adjusting inactivity timeout settings on a display device
JP2013089130A (ja) * 2011-10-20 2013-05-13 Sony Corp 情報処理装置、情報処理方法、プログラム、及び記録媒体
US10073827B2 (en) * 2012-06-07 2018-09-11 Robert Kevin Houston Method and system to generate a process flow diagram
AU2012216550B2 (en) * 2012-08-30 2016-02-04 Canon Kabushiki Kaisha Cloud assisted rendering
US20140075312A1 (en) * 2012-09-12 2014-03-13 International Business Machines Corporation Considering user needs when presenting context-sensitive information
US9390088B2 (en) 2013-04-22 2016-07-12 International Business Machines Corporation Ensuring access to long-term stored electronic documents
US10402472B2 (en) * 2014-07-30 2019-09-03 Bluebeam, Inc. Optimized rendering of shared documents on client devices with document raster representations
TWI536798B (zh) * 2014-08-11 2016-06-01 虹光精密工業股份有限公司 影像分檔方法
FI20165327A (fi) * 2016-04-15 2017-10-16 Copla Oy Dokumenttiautomaatio
US10198160B2 (en) * 2016-06-02 2019-02-05 Ricoh Company, Ltd. Approach for processing audio data at network sites
US10732940B2 (en) 2018-04-27 2020-08-04 EMC IP Holding Company LLC Enterprise services framework for presentation layer management
US10740537B2 (en) * 2018-11-01 2020-08-11 Dell Products L.P. Enterprise form dependency visualization and management
US11150923B2 (en) * 2019-09-16 2021-10-19 Samsung Electronics Co., Ltd. Electronic apparatus and method for providing manual thereof
CN112632920B (zh) * 2020-11-16 2021-11-23 腾讯科技(深圳)有限公司 一种链接处理方法、链接处理装置、终端设备及存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870552A (en) * 1995-03-28 1999-02-09 America Online, Inc. Method and apparatus for publishing hypermedia documents over wide area networks
US5727159A (en) * 1996-04-10 1998-03-10 Kikinis; Dan System in which a Proxy-Server translates information received from the Internet into a form/format readily usable by low power portable computers
US6223188B1 (en) * 1996-04-10 2001-04-24 Sun Microsystems, Inc. Presentation of link information as an aid to hypermedia navigation
US5918013A (en) * 1996-06-03 1999-06-29 Webtv Networks, Inc. Method of transcoding documents in a network environment using a proxy server
US6952799B2 (en) * 1996-06-17 2005-10-04 British Telecommunications User interface for network browser including pre-processor for links embedded in hypermedia documents
GB2314433A (en) * 1996-06-22 1997-12-24 Xerox Corp Finding and modifying strings of a regular language in a text
JPH10105550A (ja) * 1996-10-02 1998-04-24 Matsushita Electric Ind Co Ltd ハイパーテキスト文書作成装置
US5944791A (en) * 1996-10-04 1999-08-31 Contigo Software Llc Collaborative web browser
US6282511B1 (en) * 1996-12-04 2001-08-28 At&T Voiced interface with hyperlinked information
US5801691A (en) * 1996-12-31 1998-09-01 International Business Machines Corporation Method and apparatus for mobile device screen reformatting utilizing hypertext
US5986654A (en) * 1997-05-29 1999-11-16 Oracle Corporation System and method for rendering on-screen iconic buttons with dynamic textual link
US6470307B1 (en) * 1997-06-23 2002-10-22 National Research Council Of Canada Method and apparatus for automatically identifying keywords within a document
US6672775B1 (en) * 1997-08-01 2004-01-06 International Business Machines Corporation Cross-machine web page download and storage
US6405049B2 (en) * 1997-08-05 2002-06-11 Symbol Technologies, Inc. Portable data terminal and cradle
US6081815A (en) * 1997-10-06 2000-06-27 Motorola, Inc. Method for processing a hyperlink formatted message to make it compatible with an alphanumeric messaging device
US6253229B1 (en) * 1997-11-19 2001-06-26 International Business Machines Corporation Hotspots only interfaces to links in hypertext document pages in network display stations
US6275829B1 (en) * 1997-11-25 2001-08-14 Microsoft Corporation Representing a graphic image on a web page with a thumbnail-sized image
GB9800900D0 (en) * 1998-01-17 1998-03-11 Philips Electronics Nv Graphic image generation and coding
US6092074A (en) * 1998-02-10 2000-07-18 Connect Innovations, Inc. Dynamic insertion and updating of hypertext links for internet servers
US5987233A (en) * 1998-03-16 1999-11-16 Skycache Inc. Comprehensive global information network broadcasting system and implementation thereof
US6300947B1 (en) * 1998-07-06 2001-10-09 International Business Machines Corporation Display screen and window size related web page adaptation system
US6344851B1 (en) * 1998-11-30 2002-02-05 Northern Telecom Limited Method and system for website overview
US6763496B1 (en) * 1999-03-31 2004-07-13 Microsoft Corporation Method for promoting contextual information to display pages containing hyperlinks
US6547830B1 (en) * 1999-08-13 2003-04-15 Pixo, Inc. Methods and apparatuses for display and traversing of links in page character array
US6651091B1 (en) * 1999-12-02 2003-11-18 International Business Machines Corporation System for precluding repetitive accessing of Web pages in a sequence of linked Web pages accessed from the World Wide Web through searching
US6598072B1 (en) * 1999-12-02 2003-07-22 International Business Machines Corporation System for precluding repetitive accessing of web pages in a sequence of linked web pages accessed from the world wide web through a web browser at a web receiving display station
US20020099829A1 (en) * 2000-11-27 2002-07-25 Richards Kenneth W. Filter proxy system and method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269262A (ja) * 2007-04-19 2008-11-06 Canon Inc 印刷データ処理装置、印刷データ処理方法及びプログラム
JP2015505397A (ja) * 2011-12-08 2015-02-19 グーグル インコーポレイテッド モバイルコンピューティングデバイス上の後続表示用にプレイスページデータをプリフェッチするための方法および装置

Also Published As

Publication number Publication date
WO2000068831A2 (en) 2000-11-16
US20020059335A1 (en) 2002-05-16
EP1145146A2 (en) 2001-10-17
WO2000068830A3 (en) 2001-05-17
WO2000068832A3 (en) 2001-08-02
JP2002544596A (ja) 2002-12-24
EP1145145A2 (en) 2001-10-17
US20020059333A1 (en) 2002-05-16
WO2000068833A2 (en) 2000-11-16
WO2000068830A2 (en) 2000-11-16
EP1145147A2 (en) 2001-10-17
WO2000068831A3 (en) 2001-08-02
WO2000068833A3 (en) 2001-08-02
JP2002544597A (ja) 2002-12-24
WO2000068832A2 (en) 2000-11-16
US20020059334A1 (en) 2002-05-16

Similar Documents

Publication Publication Date Title
JP2002544595A (ja) リンクされる文書の階層構成の中の文書を表現するデータファイルの修正
JP4648455B2 (ja) 個人化検索方法および個人化検索システム
US7606794B2 (en) Active Abstracts
KR100330620B1 (ko) 클라이언트 컴퓨터, 클라이언트 컴퓨터용 문서 관리 시스템 및 브라우징 방법
US8307275B2 (en) Document-based information and uniform resource locator (URL) management
US20040267815A1 (en) Searchable personal browsing history
US6460060B1 (en) Method and system for searching web browser history
US20070198741A1 (en) Accessing information
JP2008547119A (ja) サーチ結果を提供するためのシステムおよび方法
US20100169756A1 (en) Automated bookmarking
JP4430598B2 (ja) 情報共有システムおよび情報共有方法
WO2007139290A1 (en) Method and apparatus for using tab corresponding to query to provide additional information
KR100672278B1 (ko) 웹 브라우저의 즐겨찾기 리스트를 이용한 개인화 검색 방법및 검색 서버
JP2004206492A (ja) ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置
KR20030051577A (ko) 검색사이트의 검색결과 표시방법
KR20040048199A (ko) 검색 결과와 상응하는 상세 정보를 이용한 웹 화면 변경방법 및 시스템
JP5416023B2 (ja) 閲覧端末及び方法
KR100822106B1 (ko) 북마크전용서버를 이용한 북마크 추가 및 링크 방법과 그시스템
JP2003099457A (ja) コンテンツ表示方法及びその表示システム並びにその表示プログラム
KR100819756B1 (ko) 온라인 멀티미디어 콘텐츠 제공 시스템
JP2002163294A (ja) ホームページ検索方法、ホームページ閲覧用端末、ホームページ検索サーバ、ホームページ検索プログラムを記録した記録媒体
JP2003016107A (ja) 情報検索装置、情報検索方法、情報検索プログラム、及び情報検索プログラムを格納した記録媒体
KR20070114089A (ko) 배경음악 제공방법