JP2007507179A

JP2007507179A - コンテンツのページ中の特徴を抑制する方法およびシステム

Info

Publication number: JP2007507179A
Application number: JP2006528201A
Authority: JP
Inventors: シーゲル、ヒリアード; ベゾス、ジェフレイ
Original assignee: アマゾンドットコムインコーポレイテッド
Priority date: 2003-09-23
Filing date: 2004-09-23
Publication date: 2007-03-22
Anticipated expiration: 2024-09-23
Also published as: JP4692903B2; EP1678658A4; CA2538854C; EP1678658A2; US7149353B2; CA2538854A1; WO2005032031A2; WO2005032031A3; US20050063615A1

Abstract

コンテンツのページの画像中の１つ以上の特徴の抑制は、ページ画像を取得すること（１２３）と、抑制されるべきである（１２６）、または、抑制されるべきでないページ画像中の１つ以上の特徴を識別すること（１２４）と、抑制されるべきでない特徴の画像のみを含む置換ページ画像を準備すること（１２８）とによって、実現される。置換ページ画像を準備することは、ブランク画像を発生させることと、位置およびサイズ情報を使用して、非抑制特徴の画像をオリジナルページ画像からブランク画像にコピーすることとを含む。他の実施形態において、置換ページ画像を準備することは、抑制されるべきでない特徴の外側のオリジナルページ画像から画像情報を除去し、または、オリジナルページ画像から抑制されるべき特徴を識別して除去することを含む。
【選択図】図７

Description

発明の分野

本発明はコンテンツの電子ライブラリ中のコンテンツのページを準備および処理するシステムおよび方法に向けられている。

発明の背景

情報エイジは人々が読むコンテンツの爆発的な増加を生み出した。このコンテンツは、本、雑誌、新聞、ニューズレター、マニュアル、ガイド、リファレンス、記事、レポート、およびドキュメント等のような伝統的な媒体を含み、これらは、印刷物とともに、先に言及したワークがデジタル形態で提供されている電子媒体で存在する。インターネットは、ポータブルドキュメントおよびｅブックのような、ドキュメントダウンロードの形態で、コンテンツのより広い公表さえも可能にしている。

人々が出会うコンテンツの広大な海原がある場合、人が何かを読み、忘れられないフレーズまたは主題を後に思い出すが、フレーズまたは主題の正確な源を覚えていないことは稀ではない。人はフレーズまたは主題を発見しようとして最近読んだアイテムを得ようとするが、このような方法でこれらのアイテムをサーチすることは単調退屈で、時間を浪費し、無益となることがある。人は単に、１セットの本中のあるいは人が所有し、読み、またはさもなければ気付いている他のコンテンツ中の特定の主題をリサーチしようともする。

これとは別に、さまざまなサーチエンジンがインターネット上で利用可能なウェブページをカタログ化しようとしている。しかしながら、莫大な量のコンテンツがインターネット上で電子的に公開されているので、読み手が最近読んだ特定の源中でのフレーズまたは主題に対するインターネット全体のサーチは、干し草の山で針を発見することに似ていることがある。読み手は、サーチエンジンにより提供されるサーチ結果のページを苦労して進まなければならず、ついには、所望の源の位置を探し当てることができないかもしれない。さらに、所望の源は最初の場所においてインターネット上で公開されていないかもしれず、したがって、このタイプのサーチに含まれないだろう。

公衆ライブラリカタログの電子サーチも知られているが、そのようなサーチは出版目録情報およびライブラリコンテンツを記述する他のメタ情報に限定されている。公衆ライブラリコンテンツのフルテキストサーチは使用可能ではなく、仮に使用可能でも、サーチはユーザにとって興味のない源からの結果を生成させるかもしれない。

必要とされているものは、ユーザが個人化し、電子的にサーチすることができるコンテンツのライブラリを提供するシステムおよび方法であり、ユーザのパーソナル化ライブラリ中の指定されたサーチ用語の位置が報告される。テキスト、絵、および位置が探し当てられたサーチ用語の周りの他の特徴のいくつかあるいは全部の画像がユーザによる即座のレビューのために提供され、このようなコンテンツをユーザに提供するために許されている許可と一致していることが望ましい。制限されているコンテンツは抑制される。本発明はこれらの必要性および現在存在している他の欠点を取り扱う。

発明の概要

本発明は、コンテンツのページをユーザに表示する前に、抑制されるべき１つ以上の特徴を有するコンテンツのページを準備して処理するシステムおよび方法を提供する。ある実施形態においては、コンテンツのページのデジタル画像とページ画像中のテキストに対応する電子的にサーチ可能なテキストとからなる電子的にサーチ可能なライブラリに本発明を組み込むことができる。ページ画像はページ画像データベース中に記憶される一方、対応しているテキストはテキストサーチ可能なデータベース中に記憶される。

１つの観点において、本発明は、ページ画像中の１つ以上の特徴を抑制する方法を提供する。これらに制限されないが、著作権制限または他の制限制約を含んでいるさまざまな理由で、絵、グラフィックス、数、数式、名前、日付等のような特徴が抑制される。１つの実施形態において、最初にコンテンツのページの画像を取得し、抑制されるべきである、または、抑制されるべきでないページ画像中の１つ以上の特徴を識別することにより、ページ画像中の特徴抑制が実現される。それから、抑制されるべきでない（したがって、抑制されるべき特徴を除く）特徴の画像のみを含む置換ページ画像を準備する。抑制基準または非抑制基準のどちらかを満たす、ページ画像中の特徴に対する位置およびサイズ情報を使用して、置換ページ画像を準備できる。例えば、ブランク画像を発生させて、位置とサイズ情報を使用して、非抑制特徴の１つ以上の画像をオリジナルページ画像からブランク（置換）画像にコピーすることによって、置換ページ画像を準備できる。このことは、オリジナルページ画像中の非抑制特徴の位置に対応する位置で、非抑制特徴に対するピクセル情報をオリジナルページ画像から置換ページ画像にコピーすることを必然的にともなう。

他の実施形態において、置換ページ画像は、抑制されるべきでない特徴の外側のオリジナルページ画像から画像情報を除去することによって、準備される。代わりに、抑制されるべき特徴を識別してから、オリジナルページ画像から除去して、置換ページ画像を生成させてもよい。少なくとも、置換ページ画像には、特徴抑制の前のオリジナルページ画像中のバックグラウンド情報をシミュレートするバックグラウンド画像情報も含まれる。例えば、オリジナルページ画像中の１以上の位置からのバックグラウンドピクセル情報は、置換ページ画像中の対応する位置で複製され、置換ページ画像の残りにより補間されて置換ページ画像に対するバックグラウンド画像情報が生成される。

本発明の他の観点は、サーチの結果としてコンテンツのページの画像をユーザに提供するコンピュータシステムである。コンピュータシステムは、データベースサーバと通信するサーチサーバを含んでいる。データベースサーバは、（１）コンテンツのページの画像を含んでいるページ画像データベースと、（２）テキストとテキストを含むページ画像データベース中のページ画像を識別する情報とを含んでいるテキストサーチ可能データベースとを含む、コンテンツのライブラリで構成されている。サーチサーバはコンピュータ実行命令で構成され、コンピュータ実行命令は、サーチサーバが、ユーザサーチに基づいてページ画像データベースからページ画像を検索し、抑制されるべき、または、抑制されるべきでないページ画像中の１つ以上の特徴を識別し、抑制されるべきでない識別された特徴の画像のみを含む置換ページ画像を準備し、置換ページ画像をユーザに提供できるようにする。

本発明のさらに他の観点は、アクセスルールを含むアクセス権利データベースである。アクセスルールは、ユーザに提供されるページ画像中のコンテンツを制限する役割をする。ここで説明されている特徴抑制方法を使用して、アクセスルールによって課せられたアクセス制限を実行し、ページ画像の一部がユーザに表示される前に、ページ画像の一部を閲覧から抑制する。例えば、１つ以上のアクセスルールは、ページ画像中でユーザに表示されるコンテンツの量を制限できる。代わりに、または、これに加えて、アクセスルールは、時間フレームに対してユーザに対して提供されるコンテンツの総量を定めることもできる。アクセスルールは、コンテンツ特有の情報またはコンテンツのユーザ所有権に基づいて、ユーザに提供されるべきコンテンツの量も定めることができる。ユーザが、コンテンツを所有している状況において、より多いコンテンツの量、またはコンテンツのすべてを閲覧のためにユーザに提供できる。さらに、ユーザの位置またはコンテンツがユーザに提供されるべき時間に基づいて適用されるように異なるアクセスルールが書かれてもよい。ここで説明している特徴抑制方法は、非画像ファイル中に記憶されたコンテンツのページにも適用できる。

本発明の先の観点とそれに伴う利点の多くは、添付図面を考慮に入れて、以下の詳細な説明を参照することにより本発明がより理解されるにしたがって、さらに容易に理解されるようになるであろう。

好ましい実施形態の詳細な説明

図１は、本発明の実施形態を実行する１つの環境を図示している。示された環境には、複数の個人ユーザにより個人化することができる電子的にサーチ可能なコンテンツのライブラリを備えたライブラリコンテンツサーチシステム１００が含まれる。その環境には、個人ユーザがサーチシステム１００と通信するのに使用できるコンピュータシステム１０２およびＰＤＡ１０４のような、さまざまな電子ユーザデバイスも含まれる。図１中で示されている環境において、ユーザデバイス１０２と１０４は、インターネット１０６のような１つ以上のコンピュータネットワークによって、サーチシステム１００と通信する。インターネットによる通信のためのプロトコルと構成要素は、コンピュータネットワーク通信の当業者によく知られている。ローカル的な有線または無線のコンピュータネットワーク接続によって、ユーザデバイス１０２および１０４とサーチシステム１００との間の通信も可能になる。

図１中に図示されたサーチシステム１００は、通信リンクによって、例えば１つ以上のコンピュータネットワークまたはダイレクト接続を使用して相互に接続されているいくつかのコンピュータシステムを具備している分散コンピュータ環境で動作する。しかしながら、システム１００は、図１中に図示されたものより構成要素の数がより少ないまたは多いコンピュータシステムにおいて等しく動作できることを当業者は正しく認識するだろう。したがって、図１中のサーチシステムの図は、本発明の範囲を制限するものではなく、例示的なものとして理解されるべきである。

図示されているようにサーチシステム１００には、サーチサーバ１０８とデータベースサーバ１１０とバックエンドインターフェイス１１２とが含まれている。サーバ１０８と１１０のそれぞれを以下でより詳細に説明する。バックエンドインターフェイス１１２によって、サーチシステム１００のオペレータは、サーバ１０８と１１０の動作を必要に応じて、監視して調整できる。

簡単に説明すると、サーチサーバ１０８は、一般的に、デバイス１０２と１０４のようなさまざまなユーザデバイスとのフロントエンドユーザ通信を行い、データベースサーバ１１０と協同してバックエンドサーチングサービスを提供する役割を果たす。サーチサーバ１０８によって提供されるフロントエンド通信は、さまざまなユーザデバイス１０２、１０４から受信された情報とサーチ問い合わせとに応答して、おそらくハイパーテキスト送信プロトコルを使用して、ウェブページとして編成される、テキストおよび／またはグラフィックスを発生させることを含めることができる。サーチサーバ１０８は、一般的に、データベースサーバ１１０中のデータベースのサーチを行う役割も果たしている。以下に説明するように、データベースサーバ１１０は、サーチサーバ１０８がユーザのサーチ問い合わせに応答するのに使用するデータベースを管理する。

１つの適切なインプリメンテーションにおいて、サーチシステム１００によって、ユーザがインデックスをレビューできるようになる。インデックスは、データベースサーバ１１０に記憶されているデータベースのコンテンツの一般ライブラリをカタログ化する。このコンテンツの一般ライブラリには、本、雑誌、新聞、ニューズレター、マニュアル、ガイド、リファレンス、記事、レポート、およびドキュメント等を含む、（これらに制限されない）さまざまな形態の出版物が含まれていてもよい。一般ライブラリからのコンテンツをユーザがレビューし、選択するのを容易にするために、さまざまなメタデータを一般ライブラリのコンテンツに関係付けしてもよい。このメタデータには、タイトル、著者、題目、要約、発行者、発行日および発行所、発行タイプ、および特徴等のような内的属性が含まれていてもよい。売れ行きの評判、ユーザレビュー、発行者のプロモーション活動、関連メディア、イベント等のような外的属性も、コンテンツに関係付けしてもよい。これらの属性の１つ以上にしたがって、一般ライブラリをカタログ化するインデックスを編成して、ユーザに提示することができる。

ユーザは、そのユーザ向けの個人化されたライブラリ中に含めるべき、またはさもなければこのライブラリ中で関係付けるべきコンテンツを、コンテンツのこの一般的なインデックスから選択してもよい。ユーザの個人化されたライブラリ、すなわち「パーソナルライブラリ」のコンテンツは、すべての点において電子式にサーチ可能である。したがって、ユーザは、指定した用語（例えば、ワード、フレーズ、グラフィックス、チャート、写真、または他のテキスト対象または他の非テキスト対象）について、コンテンツのフルテキストをサーチすることができる。ユーザに許されるアクセス権利と許可とによって、サーチ結果は、指定された用語が見いだされるフルテキストコンテンツの一部または、すべてを含むことがあり、あるいは、含まないことがある。例えばウェブページ、ポータブルドキュメント画像、ラスターベース画像、ベクトルベース画像等の形態でユーザに表示するために、サーチ用語を含んでいるコンテンツの１ページ以上の画像がサーチサーバ１０８により、ユーザデバイス１０２と１０４とに配信される。コンテンツの画像は、これらに限定されないが、.ｊｐｇ、.ｇｉｆ、および／または、.ｔｉｆフォーマットを含む何らかの使用可能な画像タイプで記憶されて配信される。ここで後に説明するように、画像ディスプレイ中で見いだされるようにサーチ用語をユーザデバイス１０２と１０４とにより、強調することもできる。

ユーザのパーソナルライブラリ中に含めるコンテンツの選択は、さまざまな方法で行うことができる。例えば、ユーザが、自分のパーソナルライブラリ中に含めることを望んでいるコンテンツを積極的に識別する方法で、ユーザは、コンテンツの一般ライブラリからコンテンツを手動で選択することができる。ユーザの行為に基づいたコンテンツの自動選択も実行できる。例えば、ユーザが特定のコンテンツの購入のために選択する毎に、ユーザのパーソナルライブラリにそのコンテンツを自動的に追加することができる。同様に１つ以上の源から受信された購入履歴を使用して、ユーザのパーソナルライブラリにコンテンツを自動的に追加することができる。

以下で説明するように、パーソナルライブラリによって、ユーザはコンテンツの特定のセットを定めてサーチできる。サーチアルゴリズムが作用するコンテンツの領域が制限されているので、サーチの実行の前に、ユーザがパーソナルライブラリを設定することが好ましい。他の状況では、サーチ問い合わせの提示または実行でリアルタイムに、または、ユーザに提示するサーチ結果の範囲を定めるために幾分より広範なライブラリ上でサーチを実行した後に、パーソナルライブラリを設定してもよい。

図２は、図１中に示されているライブラリコンテンツサーチサービス１００の動作の役割を果たす、ある例示的なコンピュータの構成要素を図示している。例えば、サーチサーバ１０８の一般的な管理と動作に対して実行可能なプログラム命令を提供するオペレーティングシステム１１４を含んでいる、サーチサーバ１０８が示されている。サーチサーバ１０８は、サーチエンジン１１５を実行するためのコンピュータプログラム命令をさらに含んでいる。サーチエンジン１１５は、データベースサーバ１１０と協同して動作し、ユーザのサーチ問い合わせに応答する。オペレーティングシステム１１４に対する適切なインプレメンテーションとサーチエンジン１１５に対するアルゴリズムが知られており、または、商業上使用可能である。また、当業者によって、特にこの開示の観点において容易に実行される。

図２中に図示されるとおり、データベースサーバ１１０には、ページ画像データベース１１６とテキストサーチ可能データベース１１８とアクセス権利データベース１２０とが含まれる。データベースサーバ１１０は、サーチエンジン１１５からサーチ命令を受信して、ページ画像データベース１１６および／またはテキストサーチ可能データベース１１８からサーチ結果を返信するように構成されている。アクセス権利データベース１２０によって、サーチサーバ１０８は、サーチ結果としてユーザに表示できるコンテンツの範囲と性質とを制御できるようになる。例えば、ユーザは、ユーザがすでに所有している、本のようなコンテンツのページの全体的な画像の閲覧を許可されてもよい。ユーザが非所有のコンテンツに対して、ユーザは、サーチによって位置が捜し当てられたページ画像の選択された一部分のみの閲覧を許可されてもよく、ページ画像の残りの部分は抑制される。サーチサーバ１０８とデータベースサーバ１１０は、サーバの動作のためにプログラム命令を記憶して実行するメモリとメインプロセッサとを一般的に使用することを当業者は認識するだろう。データベースサーバ１１０には、データベース１１６と１１８と１２０とを管理して更新し、サーチエンジン１１５から受信されたサーチ命令に応答する実行可能なプログラム命令がさらに含まれている。

便宜性を意図して、ここの説明の大部分は、本のコンテンツをサーチする状況に関して提供されているが、読みとってユーザに表示できるコンテンツの他の形態を含んでいるライブラリのサーチにも、ここの説明が適用できることをよく理解すべきである。本、雑誌、および新聞のようなコンテンツの特定のタイプのここでの参照は、実例のみであり、本発明の一般的なアプリケーションを制限する役割を果すものではない。

説明したように、ユーザによりコンテンツのライブラリを個人化して、ユーザにより手動または自動で選択されたようなコンテンツのみを１つ以上のユーザの行為の結果として含めるようにしてもよい。ユーザが選択して自分のパーソナルライブラリ中に含めることができるコンテンツを提供するために、コンテンツの一般ライブラリを（要求されるものではないが）最初に作成することが適切である。ここで説明した１つのインプリメンテーションでは、コンテンツのライブラリには、コンテンツのページの画像とともにコンテンツのテキストサーチ可能な形態の双方が含まれている。ページ画像はページ画像データベース１１６中に記憶されているが、ページ画像に対応するサーチ可能テキストは、テキストサーチ可能データベース１１８中に記憶されている。さらなるインプリメンテーションによって、ユーザが、ユーザのパーソナルライブラリに特有なページ画像をアップロードして記憶することが可能になる。許されるときには、ユーザは、他のユーザによる選択のために、アップロードされたコンテンツをコンテンツの一般ライブラリに追加することもできる。

図３には、コンテンツのページを準備してデータベース１１６と１１８中に記憶できるプロセス１２２の１つの実施形態が示されている。ブロック１２３で示されているように、（その中から異なるユーザのパーソナルライブラリを定めることができる）一般ライブラリ中に、または、ユーザのパーソナルライブラリ中に含められるべきコンテンツの各ページに対して、コンテンツの各ページの画像を取得する。印刷されたページをスキャンして電子画像フォーマットにし、電子テキストを電子画像フォーマット画像に変換し、以前にメモリ中に記憶されたページ画像を検索する等のような技術的に知られている方法を使用して、画像の取得を実行できる。

ブロック１２４に示されているように、コンテンツの各ページに対して、テキストとページ上の各ワードの位置およびサイズとを識別するのに必要な光学式文字認識（ＯＣＲ）のような認識ルーチンをページ画像上で実行する。「ワード」は、１つ以上の文字、数字、または記号の何らかの集まりを含み、単独であってもよく、あるいは写真またはグラッフィクスのような非テキスト対象と関係付けられてもよいことも理解すべきである。ＯＣＲルーチンは、電子文書処理の業界でよく知られており、ここではさらなる説明を必要としない。ブロック１２５で示されているように、各ページ画像から獲得された結果的なテキストと、位置およびサイズ情報は、テキストサーチ可能データベース１１８中に記憶されることが好ましい。

好ましくは、フルテキストのサーチ用に最適化されたデータ構造を使用して、テキストサーチ可能データベース１１８を所望どおり編成できる。１つの適切な実施形態において、テキストサーチ可能データベース１１８中の各ワードは、特定のワードが見いだされたページ画像データベース１１６中の画像に対応する、各ワードに関連したコンテンツ識別番号（例えば、ＳＫＵ番号）とページ番号とを有する。さらに、各ページ画像番号に関連して、テキストサーチ可能データベース１１８には、それぞれのページ画像上で見いだされるテキストの位置とサイズ（および、おそらくはテキストに関連した非テキスト対象）を識別する情報が含まれていることが好ましい。１つのインプリメンテーションにおいて、位置およびサイズ情報が「４組のもの」として記録され、これはテキストが特定のページ画像上に現れたときの、テキストのＸおよびＹの位置、テキストの幅と高さとを示す４つの数を含んでいる。この情報のすべてをテキストサーチ可能データベース１１８中に密にエンコードして、要求される記憶スペースを減少させてもよい。

ライブラリの所有者が、コンテンツを記憶し、再生して配信する有効な権利を獲得したコンテンツのみを含むように、コンテンツの一般ライブラリまたはコンテンツのパーソナルライブラリを構成してもよい。例えば、本で見いだされるようなある特徴を記憶して再生する権利を本の所有者に許すが、例えば、著作権または契約上の理由で、本の中の１つ以上の他の特徴の再生を制限する状況が生じるかもしれない。このような特徴は、例えば、写真、グラフィックス、チャート、名前、番号、日付、慣用表現、数式、絵、および他のテキスト対象または非テキスト対象、あるいはこれらの一部を含んでいてもよい。ページ画像上の特徴は、ページ画像上のサイズ、フォント、および／または位置のような特性によっても識別できる。したがって、同一テキストを有するが、ページ画像上の異なる場所で位置が捜し当てられるような類似性を特徴が有していても、特徴は抑制に対して異なって取り扱われてもよい。この方法では、本発明のインプレメンテーションは、例えば、位置が捜し当てられたサーチ用語に隣接して位置付けされた特徴以外の、ページ画像上のすべての特徴を抑制してもよい。ケースがとりうるどのような理由に対しても、本発明はプロセスを提供し、このプロセスにより、ページ画像中の特徴を識別して抑制できるので、ページ画像がユーザに（例えば、サーチの結果として）表示されるときに、ページ画像の非抑制特徴のみが表示される。

図３中の決定ブロック１２６で、プロセス１２２は、ページ画像に対して、抑制されるべき１つ以上の特徴をページが有するか否かを決定する。特徴が抑制される必要がない場合、ブロック１２７に示されるように、後の検索のために、初めに取得されたページ画像が、ページ画像データベース１１６中に記憶される。

一方、ページ画像中の１つ以上の特徴が抑制されるべきである場合、ブロック１２８で示されているように、抑制されるべき特徴を省略した置換画像を準備するために、プロセス１２２はページ画像中の非抑制特徴を抽出することに進む。この点における特徴抽出の１つの例を、図４から図６を参照して説明する。その後、ブロック１２７で示されるように、初めに取得されたページ画像の代わりに、結果的な置換ページ画像がページ画像データベース１１６中に記憶される。ある状況では、以前に抑制された特徴を含む、より多くのまたはすべての初期ページを再生する権利を後に受信するのを見越して、初期ページ画像を別に記憶してもよい。代わりに、非抑制特徴が除去されているが、（抑制特徴を含む）他のすべてが残っている、ページ画像の「ネガティブ」バージョンを記憶することが許されてもよい。この代替ケースにおいて、ページ画像の「ポジティブ」と「ネガティブ」バージョンとの両方を合成することによって、初期ページ画像を復元できる。

ページ画像中の特徴を識別した後、１つ以上の抑制基準（または非抑制基準）を使用して、抑制されるべき（または、抑制されるべきでない）特徴を指定するのを助けてもよい。例えば、ユーザが開始したサーチの状況では、非抑制基準には、サーチ問い合わせにおいてユーザにより使用されているサーチ用語を含んでもよい。したがって、サーチ用語と一致するテキストのような特徴は、抑制されないように指定される。サーチ用語に対してある近接内にあるテキストのような隣接した特徴も、非抑制用に指定されてもよい。隣接していることは、この点に関して、例えば、ワードの数、またはサーチ用語からの距離で測定してもよい。抑制基準または非抑制基準は、数式中のすべての数を、または、レシピとして識別されたテキストのブロック中のすべての数を抑制するように指定するような、コンテンツ特有であってよく、このような例を以下でさらに説明する。さらに、抑制（または非抑制）基準を満たすページ画像中の特徴に対する位置およびサイズ情報の決定は、非抑制特徴のみを含む置換ページ画像を準備するときに役立つ。抑制（または非抑制）基準を使用して、写真または絵のような非テキスト対象を識別して指定もできる。非テキスト対象は、これに関連したテキストを有してもよく、非テキスト対象は、対象の関連したテキストを参照することによって、抑制（または非抑制）基準を満たす。例えば、抑制基準は、ある源に属するすべての写真が抑制されるべきであることを要求してもよい。したがって、抑制基準を満たす属性テキストを有する写真は抑制されるべきであると指定されて、写真を抑制する目的のために写真に対する位置およびサイズ情報が獲得される。

図４から図６は、ページ画像中の特徴（ここでは、絵）を抑制できる、１つの例示的なプロセスを図示している。図４は、テキスト１３８と絵１４０とを含むページ画像１３６を図示している。このプロセスにおける最初の作業は、ページ画像１３６上の各非抑制特徴（ここでは、各ワード）とともに、各非抑制特徴の位置とサイズとを識別することである。都合がいいことに、ワードが非抑制特徴である場合に、図３中のブロック１２４について以前に説明したＯＣＲプロセスの一部分として、この最初の作業を達成できる。この点に関し、ＯＣＲ近似も使用でき、これは、各ワードの各文字を個別に正確に認識する一般的なＯＣＲに対して、より高速であることが多く、リアルタイムで実行することができる。ＯＣＲ近似は、ワードの位置と大きさとを戻すが、必ずとも個々の文字のそれぞれを正確に認識する必要がない。図５では、ページ画像１３６が図示されており、参照番号１４２によって示されている各ワードを囲っているボックスにより表されているように、ページ上の各ワードの位置が捜し当てられ、識別されている。参照番号１４４で示されたワードの位置も捜し当てられて識別されているが、ワード１４４は、ワードのバックグラウンドが絵１４０の小部分を含んでいるので、ここでは別に着目されている。

図６に移ると、ブランク画像を発生させて、それから、参照番号１４６により一般的に示されているように、ピクセル情報のようなそれぞれ識別されたワードに対する情報をオリジナルページ画像１３６から置換画像１４５にコピーすることによって、ページ画像１３６に対する置換ページ画像１４５が準備される。各ワードがオリジナル画像１３６で見いだされるそれぞれの対応する位置において、ワードは置換画像１４５上に配置される。図５中のワードを囲んでいるボックス中に含められる各ワードに対するピクセル情報のみを「カット」し、置換画像１４５中にピクセル情報を「ペースト」することによって、オリジナル画像１３６中の絵１４０が抑制される。参照番号１４８が示すように、ワード画像１４４に対するピクセル情報が置換画像１４５にコピーされるとき、ワード１４８の後ろの絵の小部分は、置換画像１４５中で目に見えるままであるが、全体として絵１４０は認識できない。望むのであれば、文字の後ろのバックグラウンドを除去するために、技術的に知られているアルゴリズムをワード画像１４４にも適用できる。任意のケースにおいて、ワード１４８の後ろの絵１４０の量は、オリジナル絵１４０の小部分のみを表している。代替実施形態において、絵を抑制する置換画像は、例えば図５に示されているようなオリジナルページ画像１３６中のワードを最初に識別し、それから、識別されたワードに対応しないページ画像中のすべてのピクセル情報（すなわち、識別されたワードを囲む「ボックス」の外）を「消去」または除去することによって準備される。結果は、置換ページ画像であり、これは、非抑制ワード画像をカットして新しい（置換）ページ画像にペーストした結果と同じに見える。同様に、特徴抑制は、絵１４０のような、オリジナル画像１３６中で抑制されるべき特徴を識別して、（おそらく、例えば、ワード画像１４４のような、非抑制特徴とのオーバーラップが生じる場合を除いて）抑制されるべき特徴に対応するピクセル情報を除去し、ページ画像中の非抑制特徴の後ろを残すことが必要とされる。

いくつかのケースにおいて、置換画像１４５中で再生されることが望まれるバックグラウンドのテクスチャまたは色を、オリジナルページ画像１３６が有してもよい。オリジナル画像１３６のものと類似したバックグラウンドを備える置換画像１４５を準備する１つの適切な方法は、オリジナルページ画像１３６の１つ以上のコーナーにおける１つ以上のピクセルを調べて、置換ページ１４５のそれぞれのコーナーにおいて、これらのピクセルの色と輝度とを複製することである。各コーナーからの色および輝度を、ページの中心に対して内側に補間して、オリジナル画像１３６のバックグラウンドをシミュレートする置換ページ１４５に対するバックグラウンドを完成できる。上記の代替実施形態において、「ボックス」の外側のピクセル情報が「消去」される場合、ピクセル情報は、フォアグラウンドピクセル情報とバックグラウンドピクセル情報との間で区別され、フォアグラウンドピクセル情報のみが消去され、その場所にバックバックグラウンド情報を残す。さらなる代替実施形態は、抑制されるべき特徴が識別され、それらの特徴に対するピクセル情報が（例えば、ピクセル情報をバックグラウンドピクセル情報で置換することによって）「消去」され、その場所に非抑制特徴を残すものである。

含められるコンテンツのタイプと課せられる制限とによって、特徴の抑制は変わる。例えば、レシピ本の発行者によって、レシピに対する材料のリストをユーザに示すが、材料の量は示さないことが可能になる。ＯＣＲ技術を使用して、例えば「５」と「五」のような数を識別して抑制するとともに、上記で説明した特徴抑制の方法を使用すると、一部分を識別して抑制できる。ユーザが、材料リスト（および、おそらく料理指示）を見れるようにすることによって、ユーザは所望のレシピを見ることが可能になる。それから、例えば、電子ダウンロードまたは印刷されたレシピ本の購入によって、ユーザは全体のレシピを取得しようとする。数および／または数式がテキストの中心的に影響を及ぼす特徴である技術論文またはテキストの発行者によって、同様の手順が使用されてもよい。数および数式が抑制されるが、ユーザは、周囲のテキストを見る機会が与えられ、同時に、影響を及ぼす数または数式を見るために、テキストを購入するように勧められる。本質的に、本発明によって、ページ画像データベース１１６中に記憶される、および／またはユーザに示される、ページ画像からの異なるクラスの情報を抑制させることが可能になる。図４から図６に図示されているとおり、絵の抑制は、まさに抑制できる情報のクラスの１つの例である。

ページ画像が最初に取得された後であって、ページ画像がユーザに表示される前の何らかの段階で、特徴の抑制を実行できる。図３に示されているプロセス１２２は、置換ページ画像がページ画像データベース１１６中に記憶される前の特徴の抑制を図示している。置換ページ画像は、各ユーザに対して個々に特徴抑制プロセスを実行させることなく、検索し、複数のユーザに即座に表示するのに使用可能である。したがって、図３は、ページ画像が示されるべきユーザ間で区別しない「汎用的な」特徴の抑制を図示している。

代わりに、例えば、ページ画像データベース１１６からページ画像を検索した後に、最初のページ画像上または以前準備された置換ページ画像上で、動的に特徴抑制を実行できる。ユーザが閲覧のためにサーチ結果を選択するとき、動的な特徴抑制をリアルタイムで実行できる。選択されたサーチ結果に対応する１つのページ画像または複数のページ画像をページ画像データベース１１６から検索し、ここで説明される１つ以上の特徴抑制方法を検索されたページ画像上で実行して、見るためにユーザに配信される特徴抑制画像を生成させる。動的な特徴抑制によって、ライブラリコンテンツサーチシステム１００がユーザと、彼らのそれぞれの権利との間を区別して、ページ画像データベース１１６中のコンテンツにアクセスできるようになる。アクセス権利データベース１２０には、アクセス基準に基づいて異なるアクセス制限を定めるアクセスルールが含まれてもよい。アクセス基準とは、特定のユーザのシークアクセス、ユーザが見たい特定のコンテンツ、ユーザが見たいコンテンツの時間および／または位置、コンテンツのユーザ所有権、およびユーザによって提示される特別な認証のようなものである。後者については、ユーザから受信されるコンテンツを見る認証は、技術的に知られている、認証の有効性を確認する認証方法にしたがってもよい。このような認証は、認証されたユーザに異なって適用されるアクセスルールとなり、そうでなくて許可されるものよりも多い量のコンテンツに対してアクセスが可能になる。例えば、生徒が、特定の講義の間、本のコンテンツを閲覧するための認証を受信してもよく、講義が終了した後に、認証は失効することになる。通常、抑制されるコンテンツを見る認証をユーザが受信して提示できる他の状況は、この開示の観点において容易に認識できる。

図７に移ると、ページ画像データベース１１６中とテキストサーチ可能データベース１１８中とに記憶されているような、コンテンツの一般ライブラリから選択されるコンテンツのパーソナルライブラリを、ユーザが設定または更新できるプロセス１５０を説明している。プロセス１５０の最初のステップ１５２のように、ユーザは、コンテンツを一般ライブラリから選択して、ユーザのパーソナルライブラリ中にこのコンテンツ（または、それに対する電子リンク）を含める。例のみとして、図７中で説明されているコンテンツは本の形態であるが、本発明は他のコンテンツの形態にも適用する。これまでに説明したように、１つの実施形態では、パーソナルライブラリに対するコンテンツのユーザ選択は、ユーザが一般ライブラリ中のコンテンツのインデックスをレビューして、特定のコンテンツ（この例では、本）を手動で選択して、ユーザのパーソナルライブラリ中に含めることを可能にすることによって達成される。ブロック１５２での各選択に対して、プロセス１５０は、ユーザが本を所有するか否かを決定ブロック１５４で決定する。ユーザが本を所有していない場合、特定の本はユーザにより所有されていないとして識別されて、ブロック１５８で示すように、ユーザのパーソナルライブラリに追加される。パーソナルライブラリ中の本に関連した電子フラグにより、ユーザのパーソナルライブラリ中の本の非所有権が示される。

決定ブロック１５４に戻ると、自分が本を所有することをユーザが示す場合、プロセス１５０は、ユーザの所有権を確認しようとする。参照番号１６０で示すように、本を販売するエンティティによってパーソナルライブラリサーチサービスが提供される状況では、実際にユーザが本を所有していることを確認するために、エンティティは、ユーザに対するその購入情報をレビューしてもよい。パーソナルライブラリサーチサービスは、ユーザに対する購入記録を確認できる、他の書籍販売業者とのパートナー契約があってもよい。ユーザが本を所有しているか否かをユーザに問い合わせることなく、ブロック１５２において、ユーザにより選択された本に対して、ユーザの購入記録のレビューをさらに自動的に実行してもよい。代わりに、購入のための本のユーザの選択は、ユーザのパーソナルライブラリに本を自動的に追加するように機能できる。あらゆる点において、本のユーザの購入が確認された場合、プロセス１５０は進み、ブロック１５８で示しているように、ユーザのパーソナルライブラリに本を追加する。フラグをパーソナルライブラリ中の本に関係付けて、本の所有権が確認されたことを示してもよい。

所有権の確認のために購入記録または他のデータ源を参照することによって、本の所有権が確認できない場合、ブロック１６２で示すように、プロセス１５０は、本の所有権を確認するために、ユーザがさらなるステップを受けるように依頼してもよい。例えば、ユーザは、選択された本の購入を証明する受領書のコピーを提示するように依頼されるかもしれない。代わりに、または、これに加えて、本の所有権を確認するために、ユーザは、選択された本から１以上のページの画像を提供するように依頼されるかもしれない。ある状況では、ユーザが本を購入した当事者を示すだけ十分であり、パーソナルライブラリサーチサービスのプロバイダは、実際に本が購入されたことを、識別された販売人に個々に確認できる。パーソナルライブラリに対して選択されたコンテンツの所有権の決定は、本発明に重要または必要でないが、サーチでユーザに表示されるコンテンツの量および範囲が、設定されたコンテンツの所有権にしたがって制限される状況において役立つ。

これまでに述べてきたように、データベースサーバ１１０には、アクセス権利データベース１２０が含まれている。アクセス権利データベース１２０は、サーチの結果としてユーザに表示されるコンテンツの範囲および性質を制御する。アクセス権利データベース１２０には、アクセスルールが含まれている。アクセスルールは、適用可能であると決定されたときに、ユーザに示されるページ画像中のコンテンツを制限する役割をする。コンテンツの閲覧の制限を各個人ユーザ（またはユーザのグループ、またはタイプ）に対して設定でき、これらには限定されないが、下記のものの内の１つ以上が含まれてよい。任意の所定のページ、タイトル、またはコンテンツの集まりに対してユーザに示せるコンテンツ量（例えば、割合）制限、任意の所定のタイトルまたはコンテンツの集まりに対してユーザに示せるページの総数制限、コンテンツのタイプに基づくコンテンツの量制限、コンテンツ特有の制限と無関係にユーザに示せるページの総数制限、および任意の所定のサーチ結果に対してユーザに示せるページの総数制限。ユーザによって行われるすべてのサーチに対して、サーチ毎のベースで、または全体としてこれらの制限を課すことができる。特定期間にわたって、これらの制限を課すこともできる。例えば、３０日間、または３０日サイクルで１０日間、またはユーザの一生にわたるような、指定された時間フレーム中で、コンテンツの所定ページの指定された割合より多くユーザが見れないように、アクセスルールは書かれてもよい。ライブラリコンテンツサーチシステム１００は、ユーザ確認手順を実行して、アクセス権利データベース１２０中のアクセス制限を回避する複数のアカウントをユーザが設定するのを禁止する。サーチシステム１００がセットアップされて、サーチの結果としてのみ位置が捜し当てられたコンテンツをユーザが閲覧できるようにしてもよい。言い換えると、（位置が捜し当てられたページに対する文脈を与えるために、サーチで位置が捜し当てられたページに隣接する１以上のページをブラウジングできるが）ユーザは、例えば、ブラウジングモードで任意のページをアクセスして閲覧することが許されない。これらのような制限を実行するために、サーチシステム１００は、各ユーザに対してユーザ活動を追跡するように構成され、これは、ユーザが閲覧したページ画像（またはその一部）の識別とユーザがページ画像を閲覧した時間フレームとを含んでいる。

アクセス権利データベース１２０中のアクセスルールは、問題のコンテンツのタイプのようなコンテンツ特有の情報に依存して、各個人ユーザ（またはユーザのグループ）に異なって適用できるようにさらに構成されていてもよい。例えば、コンテンツのテーブルおよびコンテンツのインデックスの制限のない閲覧を可能にするが、コンテンツそのものの本体の閲覧に、より厳密な制限を課すようにアクセスルールが書かれてもよい。

ユーザに表示するためにコンテンツを生成させるときに、コンテンツに対するユーザのアクセスを制御するアクセスルールがどれかを決定する要因としての役割を、ユーザの位置が果たすこともできる。例えば、教室の中にいる生徒が、授業中に使用されているコンテンツの本体全体をアクセスできるようにする一方、同じ生徒が、自宅ではコンテンツの制限された一部分を閲覧できるだけであるように、異なるアクセスルールが書かれてもよい。例えば、コンピュータ接続のドメインを使用してユーザ位置を決定してもよい。同様に、例えば、異なる日にち、または１日の異なる時間において、コンテンツがユーザに提供されるべき時間に基づいて異なって適用されるようにアクセスルールは書かれてもよい。一度、ページ画像の一部がユーザに表示されると、新規なページ画像を閲覧するのに他の制限を課すことなく、ユーザがページ画像のその一部を閲覧するためにいつでも戻れるように、アクセスルールを準備してアクセス権利データベース１２０中に記憶することもできる。

本発明によって提供される特徴抑制方法を使用して、アクセス権利データベース１２０中のアクセスルールによって課せられたアクセス制限が実行できる。例えば、ルールが適用させることが決定されたときに、ユーザに表示されるべきページ画像中のコンテンツの量がルールによって制限されるように、アクセスルールが書かれてもよい。ユーザに表示されるべきでないページ画像の部分の特徴が、抑制のために指定される。代わりに、ユーザに示されるべきページ画像の部分の特徴が、抑制されるべきでないと指定される。ここで説明している特徴抑制方法の１つ以上を使用して、非抑制特徴を含んで、抑制特徴を省く置換ページ画像を発生させてユーザに提供してもよい。

ユーザのパーソナルライブラリは、一般ライブラリ中に記憶されている実際のコンテンツを複製する必要はない。むしろ、各ユーザのパーソナルライブラリは、ユーザが一般ライブラリから選択して自分のパーソナルライブラリ中に含めるコンテンツのリストからなっていてもよい。コンテンツのパーソナルリストは、データベースサーバ１１０中に記憶されている実際のコンテンツにリンクできる。データベースサーバ１１０中のコンテンツの実際のコピーの数を制限して、ユーザのパーソナルライブラリがそのコンテンツにリンクができるようにすることによって、パーソナルライブラリサーチサービスを実行するために要求される記憶スペースの量が減少する。さらに、パーソナルライブラリを定めるために公的にユーザがアクセス可能なコンテンツの一般ライブラリを提供すると、ユーザがコンテンツをスキャンし、パーソナルライブラリに対してコンテンツのサーチ可能な電子コピーを作成する負担に加えて、そのようなことが必要である場合に、コンテンツのコピーを生成させるために法的許可を獲得する負担が減少され、または除去される。

パーソナルライブラリを設定し、および／または、更新するユーザは、例えば、ユーザによって提供された１つ以上のサーチ用語と一致するテキストを有するコンテンツに対して、パーソナルライブラリを電子式にサーチできる。この方法で行われるサーチは、（１）ユーザのパーソナルライブラリ中の特定のコンテンツにユーザのサーチを制限することと、（２）ユーザのパーソナルライブラリ中のコンテンツの本体全体を含むフルテキストサーチを行い、これは、コンテンツに関連した出版目録および要約のデータまたはメタデータのみを含んでいるサーチよりもさらに包括的であることと、（３）サーチから結果的に得られるコンテンツの実際の画像または画像の一部分を、ユーザによる即座なレビューのために生成させることとを含む、かなりの利点を有する。さらなる利点はこの開示から明らかである。

パーソナルライブラリ中のコンテンツをサーチして閲覧するプロセス１７０の１つの実施形態を、図８を参照して、さらに図９から図１２を参照して説明する。図８におけるブロック１７２で、ユーザは、ユーザのパーソナルライブラリ中のコンテンツの指定されたテキストに対してサーチを開始する。ウェブベースのインプリメンテーションにおいて、パーソナルライブラリをサーチするためにユーザに提供されるウェブページの１つの例が図９で図示されている。

図９では、ユーザがサーチエントリーボックス２０２中に１つ以上のサーチ用語を入力できるウェブページを表示している、ブラウザプログラム２００が図示されている。サーチサーバ１０８によってウェブページが発生されて、インターネットによって、ユーザのコンピュータデバイス１０２および１０４に配信することができる。ユーザは、望みのサーチ用語を入力し、ポインティングデバイス、キーボードまたは、他の入力デバイスを使用して、例えば、参照番号２０４で識別された「進む」ボタンをクリックすることによって、サーチを開始する。図９中のウェブページには、「インデックス」リンク２０６および「頻繁にアクセスされたタイトル」リンク２０８のような、他のハイパーテキストリンクが含まれている。双方ともさらなる情報を提供して、図示されていない１つ以上のウェブページにアセンブルできる。例えば、インデックスリンク２０６をクリックすると、ユーザに対するウェブページがユーザに生成される。ウェブページは、ユーザのパーソナルライブラリ中に現在含められているすべてのコンテンツに対する出版目録データをリストアップする。頻繁にアクセスされたタイトルリンク２０８によって、例えば、ユーザが最も頻繁にアクセスしたコンテンツのリストが生成される。

サーチサーバ１０８によって、ログインおよびログアウトルーチンが使用され、パーソナルライブラリに対する安全なアクセスをユーザに提供してもよい。（例えば、パスワードを使用して）パーソナルライブラリに対するアクセスを要求しているユーザを確認するのに適切なルーチンは、技術的によく知られている。図９から図１２において、ユーザは、すでにログインしていると仮定されている。ログアウトリンク２１０が図示されており、開始されるときに、ログアウトリンク２１０は、ユーザがユーザの現在のセッションを中止して、ユーザアカウントからログアウトできるようにする。

図８に戻ると、ブロック１７４で、サーチサーバ１０８は、ユーザの指定されたサーチ用語を受信し、テキストサーチ可能データベース１１８のサーチを開始して、サーチ問い合わせのテキストを含んでいるユーザのパーソナルライブラリ中のコンテンツのページを識別する。これまでに着目したように、テキストサーチ可能データベース１１８は、サーチ用語が見いだすことができるページ画像データベース１１６中の対応する画像を識別する情報を含むように構成するのが好ましい。したがって、指定された用語に対してユーザがサーチを行う時、テキストサーチ可能データベース１１８は、指定されたテキストを含んでいるユーザのパーソナルライブラリ中の特定のコンテンツを識別するだけではなく、ページ画像データベース１１６の対応するページ画像も識別する。

ブロック１７６で示すように、ブロック１７４で実行されたユーザのサーチ結果がユーザに表示される。図１０は、ブラウザプログラム２００を図示しており、ブラウザプログラム２００は、参照番号２１２で、「スフィンクスの謎」のサンプルフレーズに対するサーチ結果が示されているウェブページを表示している。サーチ結果２１２は、さまざまな異なるフォーマットで表示されてもよい。例のみとして、図１０中のサーチ結果２１２には、参照番号２１４で示しているように、タイトルと著者のリストが含まれており、加えて、参照番号２１６で示しているように、（ブックカバーのような）コンテンツのサムネイル画像または、その一部が含まれている。再度説明すると、ユーザのパーソナルライブラリ中に含めるべく、ユーザによって選択されたコンテンツのサーチからサーチ結果２１２を発生させる。ユーザのパーソナルライブラリ中に多くのサーチ「ヒット」がある場合、サーチサーバ１０８はプログラム命令を実行し、このプログラム命令は、どのページが最も関連があるかのような予め定められた基準にしたがってユーザに表示するために、ヒットを分析して「ベストな」ページをランク付けする。例えば、関連性の尺度には、どのページが最もヒットされ、それらのタイトルでどのページがヒットされ、どのページが最も売れているテキストから引き出されているか等を含む。

図８に戻ると、ブロック１７８で、例えば、タイトルおよび／またはページ数によって識別されたサーチ結果において、ユーザは、さらなるレビューのために特定のコンテンツを選択できる。サーチサーバ１０８は、ユーザ選択のコンテンツの画像をユーザに直ちに表示できる。しかしながら、図８で示される実施形態において、ブロック１８０で、サーチサーバ１０８は、最初に、データベースサーバ１１０中のアクセス権利データベース１２０をレビューして、サーチ結果中にリストアップされたコンテンツをどのくらいユーザに表示できるのかを制御する何らかのアクセスルールがあるか否かを決定する。以前に説明したように、アクセス権利データベース１２０は、ユーザが、例えば、標準の出版目録情報を越えて、ライブラリ中のコンテンツをアクセスして閲覧するユーザの能力を制御するルールに対する貯蔵庫である。

例えば、これまでに着目したように、ユーザによって所有されていないコンテンツと対照的に、ユーザによってすでに所有されているコンテンツに対するユーザのアクセスを制御するように異なるルールが書かれてもよい。サーチ結果で識別されたユーザ所有のコンテンツに対して、ユーザのサーチ用語の位置が捜し当てられたページの前にくる、または後に続くページ画像を含んでいる、そのコンテンツの本体全体をアクセスすることがユーザに許されてもよい。例えば、これには、ユーザが購入した製品の動作マニュアルが含まれる。

ユーザが所有していないコンテンツに対して、アクセス権利データベース１２０中の１つ以上のルールが、ユーザに表示できる位置が捜し当てられたサーチ用語を囲むコンテンツの量を制限する役割を果たす。例えば、図１１はブラウザプログラム２００を図示しており、ブラウザプログラム２００は、図１０中に示されるような、ユーザに以前通信されたサーチ結果における特定のタイトルに対するウェブページを表示している。参照番号２２０で示されているサーチ結果のタイトルは、例えば、サーチ結果２１２中のものの内いずれであってもよい。

図１１は選択された結果タイトル２２０からのサンプルページ画像２２２を図示している。ページ画像２２２は、この例では、結果タイトル２２０からの「ページ１７」の画像であるが、オリジナルページ画像のコンテンツのすべてを含んでいない。コンテンツのこの編集、すなわち抑制は、結果タイトル２２０の実際のコンテンツに対して制限されたアクセス権利をユーザが持つ環境の結果とすることができる。この例では、図１０に示されているフレーズ「スフィンクスの謎」に対するサーチに基づいて、結果として得られたページ画像２２２は実際のページを示しており、実際のページではフレーズ「スフィンクスの謎」が見いだされているとともに、サーチ用語に先行するおよび続くワードの数が制限されている。ページ数を除く、ページ画像２２２上の他のすべてのワードおよび特徴が抑制されている。位置が捜し当てられたサーチ用語に先行するおよび続くワードの数は、ユーザの好みとユーザに対して特定のコンテンツを制御するアクセスルールとにしたがって変化してもよい。この例では、９つのワードがフレーズ「スフィンクスの謎」に先行しておよび続いて示されている。他の環境では、アクセス権利データベース１２０中のアクセスルールは、ユーザが図１１の「ページ１７」（すなわち、ページ画像２２２）のより広い部分または「ページ１７」の画像全体さえも閲覧できるようにしてもよい。先に説明したような特徴抑制の方法は、アクセス権利データベース中のアクセスルールにしたがって、表示されるべきページ画像中のコンテンツを抑制するのに使用される。

要するに、図８に戻ると、ユーザがサーチ結果２１２から特定のコンテンツを選択し（ブロック１７８）、コンテンツに対するアクセス権利が考慮された（ブロック１８０）後、サーチ用語に対応するテキストを有する１以上のページの画像がページ画像データベースから検索される（ブロック１８２）。ユーザに許されたアクセス権利に基づいて、検索されたページ画像の一部または全部がユーザに表示される（ブロック１８４）。

オプション的に、ブロック１８６に示されているように、ユーザにより指定されたサーチ用語はユーザに表示されるページ画像中で強調されてもよい。プロセスが提供され、それにより、表示のためにページ画像をユーザに配信するのに必要な時間とリソースを減少させる方法でサーチ用語が強調される。

サーチサーバ１０８においてサーチ用語を強調させてページ画像２２２をフォーマットして、強調させたページ２２２をユーザに配信する以外に、ページ画像２２２はすぐにユーザに配信されてもよい。同時に、サーチサーバ１０８はページ画像２２２上のサーチ用語の位置とサイズ（先に説明したようにテキストサーチ可能データベース１１８中で使用可能な情報）を決定し、その情報をユーザに配信する。ユーザデバイス１０２、１０４はプログラム命令をローカル的に実行して、ページ画像２２２上に視覚インジケータを置き、サーチ用語の位置を強調させてもよい。視覚インジケータはサーチ用語の次に置かれるアイコン、またはサーチ用語の下に置かれるアンダーラインであってもよい。代わりに、視覚インジケータは、表示されるサーチ用語のフォントの変化であってもよい。好ましい実施形態では、視覚インジケータはサーチ用語とオーバーレイする透明色の１つ以上のブロックにより提供され、したがって、ページ画像２２２が表示されるときに色付き強調２２４（図１２）の効果を生み出す。後者の好ましい実施形態では、ユーザデバイス１０２、１０４がページ画像２２２上に強調２２４を生成させるように、ユーザデバイス１０２、１０４はＤＨＴＭＬレイヤーリングまたはジャバスクリプト技術を使用するように命令されてもよい。ユーザデバイス１０２、１０４にサーチ用語上の色強調を準備させてオーバーレイさせることにより、（強調に関して）サーチサーバ１０８がユーザデバイス１０２、１０４に通信する必要がある唯一の情報は、強調させるべき各ワードに対する数的な「４組のもの」である。先に着目したように、４組のものは、特定のページ画像上のワードのＸおよびＹ位置とともに幅および高さを記述する１セットの４つの数である。他の実施形態では、サーチ用語のＸおよびＹ位置のみが通信され、標準濃度の強調がサーチ用語に対して層状に重ねられる。サーチサーバ１０８がユーザデバイス１０２、１０４に通信する必要がある情報の量を最小にすると、サーチサーバ１０８からユーザデバイス１０２、１０４に通信するのにかかる時間の量が減少する。

ユーザのパーソナルライブラリは、望まれるように、フィクション作品およびノンフィクション作品のような、作品のクラスに分割することもでき、このようなクラス内で、ミステリー、アドベンチャー、歴史、参考書などのようなサブクラスに再分割することもできる。作品のクラスおよびサブクラスはユーザにより予め規定されても、またはカスタマイズされてもよい。ユーザのパーソナルライブラリ中の本の特定のクラスまたはサブクラスに対するサーチを制限することにより、ユーザにより実行されるサーチはさらに焦点が合い、ユーザに役立つ。例えば、医学生はパーソナル「医学」ライブラリを規定し、学生のパーソナルライブラリ中の医学テキストのフルテキストサーチが行われる。さらに、「関連」テキストを識別するアルゴリズムを使用して、パーソナルライブラリに対するコンテンツのユーザ選択を助け、特定のクラス中に厳しく区分されないが、ユーザがサーチを望むクラスに関連するコンテンツを含めてもよい。「関連テキスト」アルゴリズムは技術的に知られており、あるワードの辞書定義および類義語を使用して、例えば、関連コンテンツを識別して、サーチされるパーソナル化ライブラリ中に含めてもよい。

パーソナルライブラリの概念は一人の人から（「ユーザ」を構成する）小グループの人々に拡張してもよく、小グループの人々は互いに知り合いで、彼らが所有するコンテンツをプールするために選択をする。このタイプの小グループは同じアパートに住んでいるまたは同じ団体などの家族または人々から構成されていてもよい。グループ中の各人はグループのパーソナルライブラリに含めるべきコンテンツを決定することができる。コンテンツの単一のサーチ可能なセットがグループに提供される。サーチ結果はグループ中で本を所有している人および現在その本を占有している人を報告するように構成されていてもよい。

ここでの「テキスト」をサーチする説明は、絵、写真などのような非テキスト対象をサーチすることも同様に含めるように拡張してもよい。これは、問題の対象に関係するまたはさもなければ問題の対象を説明している、可視または隠されたテキストおよび／またはメタデータのようなデータをサーチすることにより達成することができる。テキストサーチ可能データベース１１８は、問題のページ画像中の対象を示す位置およびサイズ情報を持つ、可視または隠されたテキストあるいはメタデータのようなものを含むように構成することができる。

さらに、テキストファイルのような非画像ファイル中に記憶されているコンテンツのページに対しても本発明が適用できることを、当業者は先の説明から理解するであろう。例えば、先に説明したように、レシピ本の発行者はレシピに対する材料リストがユーザに示されるようにするが、材料の量は示されないようにできる。レシピ本のページはテキストファイルで具体化されてもよく、おそらくはテキストサーチ可能データベース１１８中に記憶される。本発明により提供される特徴抑制方法は、レシピを含むページ上で使用して、「５」および「五」のような数字とともに一部分をページから識別して抑制することができる。（非テキスト対象とともにテキストファイル中のテキストを含む）特徴の抑制は、コンテンツのオリジナルページを取り出し、抑制されるべきではない識別された特徴のみを含む、コンテンツの置換ページを準備することにより達成することができる。

この例では、ユーザが材料リスト（およびおそらく料理指示）を見ることができるようにすると、ユーザは所望のレシピを識別できる。ユーザは、例えば電子ダウンロードまたは印刷されたレシピ本の購入により、レシピ全体を取得しようする。例えば、数字および／または数式がテキストの中心的に影響を及ぼす特徴である技術論文またはテキストの発行者により、同様な手順を使用することができる。数字および数式は抑制されるが、ユーザには周囲のテキストを閲覧する機会が与えられ、同時にユーザは影響を及ぼす数字および数式を閲覧するためにオリジナルテキストを購入するように誘われる。しかしながら、購入前には、ユーザは、抑制されるべきでない特徴が示されている置換ページを閲覧することが制限される。

本発明の好ましい実施形態を図示し、上で説明したが、本発明の精神および範囲を逸脱することなく、さまざまな変更をできることが理解されるであろう。したがって、本発明の範囲は特許請求の範囲およびそれに均等なものから決定されるべきである。

図１は、本発明の１つの例示的な実施形態を実行する環境を示している描画図である。図２は、図１に示されている実施形態を実行するあるコンピュータの構成要素の配置を図示しているブロック図である。図３は、コンテンツの画像を準備して、ページ画像データベース中に画像を記憶させるとともに、コンテンツのテキストを準備してテキストサーチ可能データベース中に記憶させる、プロセスの１つの実施形態を記載しているフロー図である。図４は、テキストおよび絵を備えたコンテンツのページの例の説明である。図５は、ボックス中に示された識別されたテキストを備えた、図４中に示されているページを図示している。図６は、図５中で識別されたテキストの画像が置換ページにコピーされ、配置され、その後に図４中に示されているオリジナルページ中の絵を効果的に抑制している置換ページを図示している。図７は、ユーザがユーザのパーソナルライブラリ中に含めるべきコンテンツを選択して加えることが可能になる、プロセスの１つの実施形態を記載しているフロー図である。図８は、ユーザのパーソナルライブラリ中のコンテンツをサーチして表示するプロセスの１つの実施形態を記載しているフロー図である。図９は、サーチ入力フィールドをユーザに示している例示的なウェブページを備えたブラウザプログラムを図示している。図１０は、サンプルサーチの結果を示している例示的なウェブページを備えたブラウザプログラムを図示している。図１１は、選択されたサーチ結果からのページの画像を示している例示的なウェブページを備えたブラウザプログラムを図示している。本発明にしたがって、サーチ結果が強調されている、図１１中で示されているようなウェブページを備えたブラウザプログラム図示している。

Claims

コンテンツのページ画像中の１つ以上の特徴を抑制する方法において、
（ａ）コンテンツのページ画像を取得することと、
（ｂ）抑制されるべきである、または、抑制されるべきでないページ画像中の１つ以上の特徴を識別することと、
（ｃ）抑制されるべきでないと識別された特徴の画像のみを含む置換ページ画像を準備することとを含む方法。
コンテンツのページ画像を取得することは、コンテンツのページをスキャンして電子画像フォーマットにすることを含む請求項１記載の方法。
コンテンツのページ画像を取得することは、電子テキストを電子画像フォーマットに変換することを含む請求項１記載の方法。
コンテンツのページ画像を取得することは、以前にメモリ中に記憶されたページ画像を検索することを含む請求項１記載の方法。
抑制されるべきでない特徴を識別することは、非抑制基準を満たすページ画像中の特徴に対する位置およびサイズ情報を決定することを含む請求項１記載の方法。
非抑制基準は、ページ画像中のテキストを識別する請求項５記載の方法。
非抑制基準は、１つ以上の指定された用語と一致するテキストを識別する請求項６記載の方法。
非抑制基準は、非テキスト対象を識別する請求項５記載の方法。
非テキスト対象はこれに関連したテキストを有し、非抑制基準は、対象の関連テキストを参照することによって、非テキスト対象を識別する請求項８記載の方法。
置換ページ画像を準備することは、ブランク画像を発生させることと、位置およびサイズ情報を使用して、非抑制特徴の１つ以上の画像をオリジナルページ画像からブランク画像にコピーすることとを含む請求項５記載の方法。
非抑制特徴の画像をコピーすることは、オリジナルページ画像中の非抑制特徴の位置に対応する１以上の位置で、非抑制特徴に対するピクセル情報をオリジナルページ画像から置換ページ画像にコピーすることを含む請求項１０記載方法。
オリジナルページ画像中のバックグラウンド情報をシミュレートするバックグラウンド画像情報を置換ページ画像中に含めることを含む請求項５記載の方法。
オリジナルページ画像のバックグラウンドから置換ページ画像のバックグラウンドにピクセル情報を複製することによって、バックグラウンド画像情報を置換ページ画像中に含める請求項１２記載の方法。
オリジナルページ画像中の１以上の位置からのバックグラウンドピクセル情報を置換ページ画像中の対応する位置で複製し、置換ページ画像の残りにより補間して置換ページ画像に対するバックグラウンド画像情報を生成させる請求項１３記載の方法。
置換ページ画像を準備することは、抑制されるべきでない特徴に対応しない画像情報をオリジナルページ画像から除去することを含む請求項１記載の方法。
置換ページ画像を準備することは、抑制されるべき特徴に対応する画像情報をオリジナルページ画像から除去することを含む請求項１記載の方法。
抑制されるべき特徴を識別することは、抑制基準を満たすページ画像中の特徴に対する位置およびサイズ情報を決定することを含む請求項１記載の方法。
抑制基準は、ページ画像中のテキストを識別する請求項１７記載の方法。
抑制基準は、１つ以上の指定された用語と一致しないテキストを識別する請求項１８記載の方法。
抑制基準は、非テキスト対象を識別する請求項１７記載の方法。
非テキスト対象はこれに関連したテキストを有し、抑制基準は、対象の関連テキストを参照することによって、非テキスト対象を識別する請求項２０記載の方法。
オリジナルページ画像のバックグラウンドから置換ページ画像のバックグラウンドにピクセル情報を複製することによって、バックグラウンド画像情報を置換ページ画像中に含めることをさらに含む請求項１記載の方法。
フォアグラウンドピクセル情報をバックグラウンドピクセル情報と区別し、抑制されるべき特徴に対応するフォアグラウンドピクセル情報を置換ページ画像から除去することによって、バックグラウンド画像情報を置換ページ画像中に含めることをさらに含む請求項１記載の方法。
後の検索のためにページ画像データベース中に置換画像を記憶することをさらに含む請求項１記載の方法。
記憶された置換画像は、検索されるときに、（１）抑制されるべきである、または、抑制されるべきでない、検索されたページ画像中の１つ以上の特徴を識別することと、（２）抑制されるべきでないと識別された特徴の画像のみを含む置換ページ画像を準備することとによって、さらに特徴抑制を受けるオリジナルページ画像を構成する請求項２４記載の方法。
置換ページ画像中に含めることができるコンテンツの量を制限するアクセスルールを参照することと、アクセスルールにしたがってページ画像中に残すことができるページ画像中の特徴に対する情報を決定することとをさらに含む請求項１記載の方法。
ページ画像中に残すことができる特徴に対する情報を決定することは、特徴の位置およびサイズ情報を決定することを含む請求項２６記載の方法。
置換ページ画像を準備することは、ブランク画像を発生させ、位置およびサイズ情報を使用して、オリジナルページ画像中と同一の位置で置換ページ画像中に残すことができる特徴に対するピクセル情報をコピーする請求項２７記載の方法。
アクセスルールは、置換ページ画像中に含めることができる総量を規定する請求項２６記載の方法。
アクセスルールは、置換ページ画像中に含めることができるコンテンツの割合を規定する請求項２６記載の方法。
アクセスルールは、コンテンツ特定情報に基づいてコンテンツの量を規定する請求項２６記載の方法。
アクセスルールは、コンテンツ所有権に基づいてコンテンツの量を規定する請求項２６記載の方法。
ユーザの位置に基づいて、異なるアクセスルールを参照することをさらに含む請求項２６記載の方法。
置換ページ画像がユーザに提供されるべき時間に基づいて、異なるアクセスルールを参照することを含む請求項２６記載の方法。
サーチ結果として、コンテンツのページ画像をユーザに提供するコンピュータシステムにおいて、
データベースサーバと通信するサーチサーバを具備し、データベースサーバは、（１）コンテンツのページ画像を含むページ画像データベースと、（２）テキストとテキストを含むページ画像データベース中のページ画像を識別する情報とを含むテキストサーチ可能データベースとを含んでいる、コンテンツライブラリで構成され、サーチサーバは、サーチサーバが、ユーザサーチに基づいてページ画像データベースからページ画像を検索し、抑制されるべきである、または、抑制されるべきでないページ画像中の１つ以上の特徴を識別し、抑制されるべきでないと識別された特徴の画像のみを含む置換ページ画像を準備して置換ページ画像をユーザに提供できるようにするコンピュータ実行命令で構成されているコンピュータシステム。
ユーザに提供される置換ページ画像中のコンテンツの量を制限するアクセスルールを有するデータサーバ中のアクセス権利データベースをさらに具備する請求項３５記載のコンピュータシステム。
サーチサーバは、抑制されるべきである、または、抑制されるべきでないページ画像中の特徴に対する位置およびサイズ情報を決定するようにさらに構成されている請求項３５記載のコンピュータシステム。
サーチサーバは、ブランク画像を発生させることと、位置およびサイズ情報を使用して、非抑制特徴の１つ以上の画像をオリジナルページ画像からブランク画像にコピーすることとによって、置換ページ画像を準備する請求項３７記載のコンピュータシステム。
サーチサーバは、オリジナルページ画像中の非抑制特徴の位置に対応する１以上の位置で、非抑制特徴に対するピクセル情報をオリジナルページ画像から置換ページ画像にコピーすることによって、非抑制特徴の画像をコピーする請求項３８記載のコンピュータシステム。
サーチサーバは、抑制されるべきでない特徴に対応しない画像情報をオリジナルページ画像から除去することによって、置換ページ画像を準備する請求項３５記載のコンピュータシステム。
サーチサーバは、抑制されるべきである特徴に対応する画像情報をオリジナルページ画像から除去することによって、置換ページ画像を準備する請求項３５記載のコンピュータシステム。
サーチサーバは、オリジナルページ画像中のバックグラウンド情報をシミュレートするバックグラウンド画像情報を置換ページ画像中に含めるようにさらに構成されている請求項３５記載のコンピュータシステム。
サーチサーバは、フォアグラウンドピクセル情報をバックグラウンドピクセル情報と区別することと、抑制されるべき特徴に対応するフォアグラウンドピクセル情報を置換ページ画像から除去することとによって、バックグラウンド画像情報を置換ページ画像中に含めるようにさらに構成されている請求項３５記載のコンピュータシステム。
サーチサーバは、後の検索のためにページ画像データベース中に置換ページ画像を記憶するようにさらに構成されている請求項３５記載のコンピュータシステム。
サーチサーバは、検索された置換ページ画像が、さらに特徴抑制を受けるオリジナルページ画像であるかのように、検索された置換ページ画像に作用するようにさらに構成されている請求項４４記載のコンピュータシステム。
コンテンツのページ中の１つ以上の特徴を抑制する方法において、
（ａ）コンテンツのページを取得することと、
（ｂ）抑制されるべきである、または抑制されるべきでないページ中の１つ以上の特徴を識別することと、
（ｃ）抑制されるべきでないと識別された特徴のみを含む置換ページを準備することとを含む方法。
抑制されるべきでない特徴を識別することは、非抑制基準を満たすページ中の１つ以上の特徴を決定することを含む請求項４６記載の方法。
非抑制基準は、ページ画像中のテキストを識別する請求項４７記載の方法。
非抑制基準は、非テキスト対象を識別する請求項４７記載の方法。
非テキスト対象はこれに関連したテキストを有し、非抑制基準は、対象の関連テキストを参照することによって、非テキスト対象を識別する請求項４９記載の方法。
置換ページを準備することは、ブランクページを発生させ、１つ以上の非抑制特徴をオリジナルページからブランクページにコピーすることを含む請求項４７記載の方法。
置換ページを準備することは、抑制されるべきでない特徴に対応しない特徴をオリジナルページから除去することを含む請求項４６記載の方法。
置換ページを準備することは、抑制されるべき特徴に対応する特徴をオリジナルページから除去することを含む請求項４６記載の方法。
抑制されるべき特徴を識別することは、抑制基準を満たすページ中の１つ以上の特徴を決定することを含む請求項４６記載の方法。
抑制基準は、ページ中のテキストを識別する請求項５４記載の方法。
抑制基準は、非テキスト対象を識別する請求項５４記載の方法。
非テキスト対象はこれに関連したテキストを有し、抑制基準は、対象の関連テキストを参照することによって、非テキスト対象を識別する請求項５６記載の方法。
置換ページ中に含むことができるコンテンツの量を制限するアクセスルールを参照することと、アクセスルールにしたがってページ中に残すことができる、ページ中の特徴を識別する情報を決定することとをさらに含む請求項４６記載の方法。