JP2007507179A - コンテンツのページ中の特徴を抑制する方法およびシステム - Google Patents

コンテンツのページ中の特徴を抑制する方法およびシステム Download PDF

Info

Publication number
JP2007507179A
JP2007507179A JP2006528201A JP2006528201A JP2007507179A JP 2007507179 A JP2007507179 A JP 2007507179A JP 2006528201 A JP2006528201 A JP 2006528201A JP 2006528201 A JP2006528201 A JP 2006528201A JP 2007507179 A JP2007507179 A JP 2007507179A
Authority
JP
Japan
Prior art keywords
page image
image
content
features
suppressed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006528201A
Other languages
English (en)
Other versions
JP4692903B2 (ja
Inventor
シーゲル、ヒリアード
ベゾス、ジェフレイ
Original Assignee
アマゾン ドット コム インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アマゾン ドット コム インコーポレイテッド filed Critical アマゾン ドット コム インコーポレイテッド
Publication of JP2007507179A publication Critical patent/JP2007507179A/ja
Application granted granted Critical
Publication of JP4692903B2 publication Critical patent/JP4692903B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimiles In General (AREA)

Abstract

コンテンツのページの画像中の1つ以上の特徴の抑制は、ページ画像を取得すること(123)と、抑制されるべきである(126)、または、抑制されるべきでないページ画像中の1つ以上の特徴を識別すること(124)と、抑制されるべきでない特徴の画像のみを含む置換ページ画像を準備すること(128)とによって、実現される。置換ページ画像を準備することは、ブランク画像を発生させることと、位置およびサイズ情報を使用して、非抑制特徴の画像をオリジナルページ画像からブランク画像にコピーすることとを含む。他の実施形態において、置換ページ画像を準備することは、抑制されるべきでない特徴の外側のオリジナルページ画像から画像情報を除去し、または、オリジナルページ画像から抑制されるべき特徴を識別して除去することを含む。
【選択図】 図7

Description

発明の分野
本発明はコンテンツの電子ライブラリ中のコンテンツのページを準備および処理するシステムおよび方法に向けられている。
発明の背景
情報エイジは人々が読むコンテンツの爆発的な増加を生み出した。このコンテンツは、本、雑誌、新聞、ニューズレター、マニュアル、ガイド、リファレンス、記事、レポート、およびドキュメント等のような伝統的な媒体を含み、これらは、印刷物とともに、先に言及したワークがデジタル形態で提供されている電子媒体で存在する。インターネットは、ポータブルドキュメントおよびeブックのような、ドキュメントダウンロードの形態で、コンテンツのより広い公表さえも可能にしている。
人々が出会うコンテンツの広大な海原がある場合、人が何かを読み、忘れられないフレーズまたは主題を後に思い出すが、フレーズまたは主題の正確な源を覚えていないことは稀ではない。人はフレーズまたは主題を発見しようとして最近読んだアイテムを得ようとするが、このような方法でこれらのアイテムをサーチすることは単調退屈で、時間を浪費し、無益となることがある。人は単に、1セットの本中のあるいは人が所有し、読み、またはさもなければ気付いている他のコンテンツ中の特定の主題をリサーチしようともする。
これとは別に、さまざまなサーチエンジンがインターネット上で利用可能なウェブページをカタログ化しようとしている。しかしながら、莫大な量のコンテンツがインターネット上で電子的に公開されているので、読み手が最近読んだ特定の源中でのフレーズまたは主題に対するインターネット全体のサーチは、干し草の山で針を発見することに似ていることがある。読み手は、サーチエンジンにより提供されるサーチ結果のページを苦労して進まなければならず、ついには、所望の源の位置を探し当てることができないかもしれない。さらに、所望の源は最初の場所においてインターネット上で公開されていないかもしれず、したがって、このタイプのサーチに含まれないだろう。
公衆ライブラリカタログの電子サーチも知られているが、そのようなサーチは出版目録情報およびライブラリコンテンツを記述する他のメタ情報に限定されている。公衆ライブラリコンテンツのフルテキストサーチは使用可能ではなく、仮に使用可能でも、サーチはユーザにとって興味のない源からの結果を生成させるかもしれない。
必要とされているものは、ユーザが個人化し、電子的にサーチすることができるコンテンツのライブラリを提供するシステムおよび方法であり、ユーザのパーソナル化ライブラリ中の指定されたサーチ用語の位置が報告される。テキスト、絵、および位置が探し当てられたサーチ用語の周りの他の特徴のいくつかあるいは全部の画像がユーザによる即座のレビューのために提供され、このようなコンテンツをユーザに提供するために許されている許可と一致していることが望ましい。制限されているコンテンツは抑制される。本発明はこれらの必要性および現在存在している他の欠点を取り扱う。
発明の概要
本発明は、コンテンツのページをユーザに表示する前に、抑制されるべき1つ以上の特徴を有するコンテンツのページを準備して処理するシステムおよび方法を提供する。ある実施形態においては、コンテンツのページのデジタル画像とページ画像中のテキストに対応する電子的にサーチ可能なテキストとからなる電子的にサーチ可能なライブラリに本発明を組み込むことができる。ページ画像はページ画像データベース中に記憶される一方、対応しているテキストはテキストサーチ可能なデータベース中に記憶される。
1つの観点において、本発明は、ページ画像中の1つ以上の特徴を抑制する方法を提供する。これらに制限されないが、著作権制限または他の制限制約を含んでいるさまざまな理由で、絵、グラフィックス、数、数式、名前、日付等のような特徴が抑制される。1つの実施形態において、最初にコンテンツのページの画像を取得し、抑制されるべきである、または、抑制されるべきでないページ画像中の1つ以上の特徴を識別することにより、ページ画像中の特徴抑制が実現される。それから、抑制されるべきでない(したがって、抑制されるべき特徴を除く)特徴の画像のみを含む置換ページ画像を準備する。抑制基準または非抑制基準のどちらかを満たす、ページ画像中の特徴に対する位置およびサイズ情報を使用して、置換ページ画像を準備できる。例えば、ブランク画像を発生させて、位置とサイズ情報を使用して、非抑制特徴の1つ以上の画像をオリジナルページ画像からブランク(置換)画像にコピーすることによって、置換ページ画像を準備できる。このことは、オリジナルページ画像中の非抑制特徴の位置に対応する位置で、非抑制特徴に対するピクセル情報をオリジナルページ画像から置換ページ画像にコピーすることを必然的にともなう。
他の実施形態において、置換ページ画像は、抑制されるべきでない特徴の外側のオリジナルページ画像から画像情報を除去することによって、準備される。代わりに、抑制されるべき特徴を識別してから、オリジナルページ画像から除去して、置換ページ画像を生成させてもよい。少なくとも、置換ページ画像には、特徴抑制の前のオリジナルページ画像中のバックグラウンド情報をシミュレートするバックグラウンド画像情報も含まれる。例えば、オリジナルページ画像中の1以上の位置からのバックグラウンドピクセル情報は、置換ページ画像中の対応する位置で複製され、置換ページ画像の残りにより補間されて置換ページ画像に対するバックグラウンド画像情報が生成される。
本発明の他の観点は、サーチの結果としてコンテンツのページの画像をユーザに提供するコンピュータシステムである。コンピュータシステムは、データベースサーバと通信するサーチサーバを含んでいる。データベースサーバは、(1)コンテンツのページの画像を含んでいるページ画像データベースと、(2)テキストとテキストを含むページ画像データベース中のページ画像を識別する情報とを含んでいるテキストサーチ可能データベースとを含む、コンテンツのライブラリで構成されている。サーチサーバはコンピュータ実行命令で構成され、コンピュータ実行命令は、サーチサーバが、ユーザサーチに基づいてページ画像データベースからページ画像を検索し、抑制されるべき、または、抑制されるべきでないページ画像中の1つ以上の特徴を識別し、抑制されるべきでない識別された特徴の画像のみを含む置換ページ画像を準備し、置換ページ画像をユーザに提供できるようにする。
本発明のさらに他の観点は、アクセスルールを含むアクセス権利データベースである。アクセスルールは、ユーザに提供されるページ画像中のコンテンツを制限する役割をする。ここで説明されている特徴抑制方法を使用して、アクセスルールによって課せられたアクセス制限を実行し、ページ画像の一部がユーザに表示される前に、ページ画像の一部を閲覧から抑制する。例えば、1つ以上のアクセスルールは、ページ画像中でユーザに表示されるコンテンツの量を制限できる。代わりに、または、これに加えて、アクセスルールは、時間フレームに対してユーザに対して提供されるコンテンツの総量を定めることもできる。アクセスルールは、コンテンツ特有の情報またはコンテンツのユーザ所有権に基づいて、ユーザに提供されるべきコンテンツの量も定めることができる。ユーザが、コンテンツを所有している状況において、より多いコンテンツの量、またはコンテンツのすべてを閲覧のためにユーザに提供できる。さらに、ユーザの位置またはコンテンツがユーザに提供されるべき時間に基づいて適用されるように異なるアクセスルールが書かれてもよい。ここで説明している特徴抑制方法は、非画像ファイル中に記憶されたコンテンツのページにも適用できる。
本発明の先の観点とそれに伴う利点の多くは、添付図面を考慮に入れて、以下の詳細な説明を参照することにより本発明がより理解されるにしたがって、さらに容易に理解されるようになるであろう。
好ましい実施形態の詳細な説明
図1は、本発明の実施形態を実行する1つの環境を図示している。示された環境には、複数の個人ユーザにより個人化することができる電子的にサーチ可能なコンテンツのライブラリを備えたライブラリコンテンツサーチシステム100が含まれる。その環境には、個人ユーザがサーチシステム100と通信するのに使用できるコンピュータシステム102およびPDA104のような、さまざまな電子ユーザデバイスも含まれる。図1中で示されている環境において、ユーザデバイス102と104は、インターネット106のような1つ以上のコンピュータネットワークによって、サーチシステム100と通信する。インターネットによる通信のためのプロトコルと構成要素は、コンピュータネットワーク通信の当業者によく知られている。ローカル的な有線または無線のコンピュータネットワーク接続によって、ユーザデバイス102および104とサーチシステム100との間の通信も可能になる。
図1中に図示されたサーチシステム100は、通信リンクによって、例えば1つ以上のコンピュータネットワークまたはダイレクト接続を使用して相互に接続されているいくつかのコンピュータシステムを具備している分散コンピュータ環境で動作する。しかしながら、システム100は、図1中に図示されたものより構成要素の数がより少ないまたは多いコンピュータシステムにおいて等しく動作できることを当業者は正しく認識するだろう。したがって、図1中のサーチシステムの図は、本発明の範囲を制限するものではなく、例示的なものとして理解されるべきである。
図示されているようにサーチシステム100には、サーチサーバ108とデータベースサーバ110とバックエンドインターフェイス112とが含まれている。サーバ108と110のそれぞれを以下でより詳細に説明する。バックエンドインターフェイス112によって、サーチシステム100のオペレータは、サーバ108と110の動作を必要に応じて、監視して調整できる。
簡単に説明すると、サーチサーバ108は、一般的に、デバイス102と104のようなさまざまなユーザデバイスとのフロントエンドユーザ通信を行い、データベースサーバ110と協同してバックエンドサーチングサービスを提供する役割を果たす。サーチサーバ108によって提供されるフロントエンド通信は、さまざまなユーザデバイス102、104から受信された情報とサーチ問い合わせとに応答して、おそらくハイパーテキスト送信プロトコルを使用して、ウェブページとして編成される、テキストおよび/またはグラフィックスを発生させることを含めることができる。サーチサーバ108は、一般的に、データベースサーバ110中のデータベースのサーチを行う役割も果たしている。以下に説明するように、データベースサーバ110は、サーチサーバ108がユーザのサーチ問い合わせに応答するのに使用するデータベースを管理する。
1つの適切なインプリメンテーションにおいて、サーチシステム100によって、ユーザがインデックスをレビューできるようになる。インデックスは、データベースサーバ110に記憶されているデータベースのコンテンツの一般ライブラリをカタログ化する。このコンテンツの一般ライブラリには、本、雑誌、新聞、ニューズレター、マニュアル、ガイド、リファレンス、記事、レポート、およびドキュメント等を含む、(これらに制限されない)さまざまな形態の出版物が含まれていてもよい。一般ライブラリからのコンテンツをユーザがレビューし、選択するのを容易にするために、さまざまなメタデータを一般ライブラリのコンテンツに関係付けしてもよい。このメタデータには、タイトル、著者、題目、要約、発行者、発行日および発行所、発行タイプ、および特徴等のような内的属性が含まれていてもよい。売れ行きの評判、ユーザレビュー、発行者のプロモーション活動、関連メディア、イベント等のような外的属性も、コンテンツに関係付けしてもよい。これらの属性の1つ以上にしたがって、一般ライブラリをカタログ化するインデックスを編成して、ユーザに提示することができる。
ユーザは、そのユーザ向けの個人化されたライブラリ中に含めるべき、またはさもなければこのライブラリ中で関係付けるべきコンテンツを、コンテンツのこの一般的なインデックスから選択してもよい。ユーザの個人化されたライブラリ、すなわち「パーソナルライブラリ」のコンテンツは、すべての点において電子式にサーチ可能である。したがって、ユーザは、指定した用語(例えば、ワード、フレーズ、グラフィックス、チャート、写真、または他のテキスト対象または他の非テキスト対象)について、コンテンツのフルテキストをサーチすることができる。ユーザに許されるアクセス権利と許可とによって、サーチ結果は、指定された用語が見いだされるフルテキストコンテンツの一部または、すべてを含むことがあり、あるいは、含まないことがある。例えばウェブページ、ポータブルドキュメント画像、ラスターベース画像、ベクトルベース画像等の形態でユーザに表示するために、サーチ用語を含んでいるコンテンツの1ページ以上の画像がサーチサーバ108により、ユーザデバイス102と104とに配信される。コンテンツの画像は、これらに限定されないが、.jpg、.gif、および/または、.tifフォーマットを含む何らかの使用可能な画像タイプで記憶されて配信される。ここで後に説明するように、画像ディスプレイ中で見いだされるようにサーチ用語をユーザデバイス102と104とにより、強調することもできる。
ユーザのパーソナルライブラリ中に含めるコンテンツの選択は、さまざまな方法で行うことができる。例えば、ユーザが、自分のパーソナルライブラリ中に含めることを望んでいるコンテンツを積極的に識別する方法で、ユーザは、コンテンツの一般ライブラリからコンテンツを手動で選択することができる。ユーザの行為に基づいたコンテンツの自動選択も実行できる。例えば、ユーザが特定のコンテンツの購入のために選択する毎に、ユーザのパーソナルライブラリにそのコンテンツを自動的に追加することができる。同様に1つ以上の源から受信された購入履歴を使用して、ユーザのパーソナルライブラリにコンテンツを自動的に追加することができる。
以下で説明するように、パーソナルライブラリによって、ユーザはコンテンツの特定のセットを定めてサーチできる。サーチアルゴリズムが作用するコンテンツの領域が制限されているので、サーチの実行の前に、ユーザがパーソナルライブラリを設定することが好ましい。他の状況では、サーチ問い合わせの提示または実行でリアルタイムに、または、ユーザに提示するサーチ結果の範囲を定めるために幾分より広範なライブラリ上でサーチを実行した後に、パーソナルライブラリを設定してもよい。
図2は、図1中に示されているライブラリコンテンツサーチサービス100の動作の役割を果たす、ある例示的なコンピュータの構成要素を図示している。例えば、サーチサーバ108の一般的な管理と動作に対して実行可能なプログラム命令を提供するオペレーティングシステム114を含んでいる、サーチサーバ108が示されている。サーチサーバ108は、サーチエンジン115を実行するためのコンピュータプログラム命令をさらに含んでいる。サーチエンジン115は、データベースサーバ110と協同して動作し、ユーザのサーチ問い合わせに応答する。オペレーティングシステム114に対する適切なインプレメンテーションとサーチエンジン115に対するアルゴリズムが知られており、または、商業上使用可能である。また、当業者によって、特にこの開示の観点において容易に実行される。
図2中に図示されるとおり、データベースサーバ110には、ページ画像データベース116とテキストサーチ可能データベース118とアクセス権利データベース120とが含まれる。データベースサーバ110は、サーチエンジン115からサーチ命令を受信して、ページ画像データベース116および/またはテキストサーチ可能データベース118からサーチ結果を返信するように構成されている。アクセス権利データベース120によって、サーチサーバ108は、サーチ結果としてユーザに表示できるコンテンツの範囲と性質とを制御できるようになる。例えば、ユーザは、ユーザがすでに所有している、本のようなコンテンツのページの全体的な画像の閲覧を許可されてもよい。ユーザが非所有のコンテンツに対して、ユーザは、サーチによって位置が捜し当てられたページ画像の選択された一部分のみの閲覧を許可されてもよく、ページ画像の残りの部分は抑制される。サーチサーバ108とデータベースサーバ110は、サーバの動作のためにプログラム命令を記憶して実行するメモリとメインプロセッサとを一般的に使用することを当業者は認識するだろう。データベースサーバ110には、データベース116と118と120とを管理して更新し、サーチエンジン115から受信されたサーチ命令に応答する実行可能なプログラム命令がさらに含まれている。
便宜性を意図して、ここの説明の大部分は、本のコンテンツをサーチする状況に関して提供されているが、読みとってユーザに表示できるコンテンツの他の形態を含んでいるライブラリのサーチにも、ここの説明が適用できることをよく理解すべきである。本、雑誌、および新聞のようなコンテンツの特定のタイプのここでの参照は、実例のみであり、本発明の一般的なアプリケーションを制限する役割を果すものではない。
説明したように、ユーザによりコンテンツのライブラリを個人化して、ユーザにより手動または自動で選択されたようなコンテンツのみを1つ以上のユーザの行為の結果として含めるようにしてもよい。ユーザが選択して自分のパーソナルライブラリ中に含めることができるコンテンツを提供するために、コンテンツの一般ライブラリを(要求されるものではないが)最初に作成することが適切である。ここで説明した1つのインプリメンテーションでは、コンテンツのライブラリには、コンテンツのページの画像とともにコンテンツのテキストサーチ可能な形態の双方が含まれている。ページ画像はページ画像データベース116中に記憶されているが、ページ画像に対応するサーチ可能テキストは、テキストサーチ可能データベース118中に記憶されている。さらなるインプリメンテーションによって、ユーザが、ユーザのパーソナルライブラリに特有なページ画像をアップロードして記憶することが可能になる。許されるときには、ユーザは、他のユーザによる選択のために、アップロードされたコンテンツをコンテンツの一般ライブラリに追加することもできる。
図3には、コンテンツのページを準備してデータベース116と118中に記憶できるプロセス122の1つの実施形態が示されている。ブロック123で示されているように、(その中から異なるユーザのパーソナルライブラリを定めることができる)一般ライブラリ中に、または、ユーザのパーソナルライブラリ中に含められるべきコンテンツの各ページに対して、コンテンツの各ページの画像を取得する。印刷されたページをスキャンして電子画像フォーマットにし、電子テキストを電子画像フォーマット画像に変換し、以前にメモリ中に記憶されたページ画像を検索する等のような技術的に知られている方法を使用して、画像の取得を実行できる。
ブロック124に示されているように、コンテンツの各ページに対して、テキストとページ上の各ワードの位置およびサイズとを識別するのに必要な光学式文字認識(OCR)のような認識ルーチンをページ画像上で実行する。「ワード」は、1つ以上の文字、数字、または記号の何らかの集まりを含み、単独であってもよく、あるいは写真またはグラッフィクスのような非テキスト対象と関係付けられてもよいことも理解すべきである。OCRルーチンは、電子文書処理の業界でよく知られており、ここではさらなる説明を必要としない。ブロック125で示されているように、各ページ画像から獲得された結果的なテキストと、位置およびサイズ情報は、テキストサーチ可能データベース118中に記憶されることが好ましい。
好ましくは、フルテキストのサーチ用に最適化されたデータ構造を使用して、テキストサーチ可能データベース118を所望どおり編成できる。1つの適切な実施形態において、テキストサーチ可能データベース118中の各ワードは、特定のワードが見いだされたページ画像データベース116中の画像に対応する、各ワードに関連したコンテンツ識別番号(例えば、SKU番号)とページ番号とを有する。さらに、各ページ画像番号に関連して、テキストサーチ可能データベース118には、それぞれのページ画像上で見いだされるテキストの位置とサイズ(および、おそらくはテキストに関連した非テキスト対象)を識別する情報が含まれていることが好ましい。1つのインプリメンテーションにおいて、位置およびサイズ情報が「4組のもの」として記録され、これはテキストが特定のページ画像上に現れたときの、テキストのXおよびYの位置、テキストの幅と高さとを示す4つの数を含んでいる。この情報のすべてをテキストサーチ可能データベース118中に密にエンコードして、要求される記憶スペースを減少させてもよい。
ライブラリの所有者が、コンテンツを記憶し、再生して配信する有効な権利を獲得したコンテンツのみを含むように、コンテンツの一般ライブラリまたはコンテンツのパーソナルライブラリを構成してもよい。例えば、本で見いだされるようなある特徴を記憶して再生する権利を本の所有者に許すが、例えば、著作権または契約上の理由で、本の中の1つ以上の他の特徴の再生を制限する状況が生じるかもしれない。このような特徴は、例えば、写真、グラフィックス、チャート、名前、番号、日付、慣用表現、数式、絵、および他のテキスト対象または非テキスト対象、あるいはこれらの一部を含んでいてもよい。ページ画像上の特徴は、ページ画像上のサイズ、フォント、および/または位置のような特性によっても識別できる。したがって、同一テキストを有するが、ページ画像上の異なる場所で位置が捜し当てられるような類似性を特徴が有していても、特徴は抑制に対して異なって取り扱われてもよい。この方法では、本発明のインプレメンテーションは、例えば、位置が捜し当てられたサーチ用語に隣接して位置付けされた特徴以外の、ページ画像上のすべての特徴を抑制してもよい。ケースがとりうるどのような理由に対しても、本発明はプロセスを提供し、このプロセスにより、ページ画像中の特徴を識別して抑制できるので、ページ画像がユーザに(例えば、サーチの結果として)表示されるときに、ページ画像の非抑制特徴のみが表示される。
図3中の決定ブロック126で、プロセス122は、ページ画像に対して、抑制されるべき1つ以上の特徴をページが有するか否かを決定する。特徴が抑制される必要がない場合、ブロック127に示されるように、後の検索のために、初めに取得されたページ画像が、ページ画像データベース116中に記憶される。
一方、ページ画像中の1つ以上の特徴が抑制されるべきである場合、ブロック128で示されているように、抑制されるべき特徴を省略した置換画像を準備するために、プロセス122はページ画像中の非抑制特徴を抽出することに進む。この点における特徴抽出の1つの例を、図4から図6を参照して説明する。その後、ブロック127で示されるように、初めに取得されたページ画像の代わりに、結果的な置換ページ画像がページ画像データベース116中に記憶される。ある状況では、以前に抑制された特徴を含む、より多くのまたはすべての初期ページを再生する権利を後に受信するのを見越して、初期ページ画像を別に記憶してもよい。代わりに、非抑制特徴が除去されているが、(抑制特徴を含む)他のすべてが残っている、ページ画像の「ネガティブ」バージョンを記憶することが許されてもよい。この代替ケースにおいて、ページ画像の「ポジティブ」と「ネガティブ」バージョンとの両方を合成することによって、初期ページ画像を復元できる。
ページ画像中の特徴を識別した後、1つ以上の抑制基準(または非抑制基準)を使用して、抑制されるべき(または、抑制されるべきでない)特徴を指定するのを助けてもよい。例えば、ユーザが開始したサーチの状況では、非抑制基準には、サーチ問い合わせにおいてユーザにより使用されているサーチ用語を含んでもよい。したがって、サーチ用語と一致するテキストのような特徴は、抑制されないように指定される。サーチ用語に対してある近接内にあるテキストのような隣接した特徴も、非抑制用に指定されてもよい。隣接していることは、この点に関して、例えば、ワードの数、またはサーチ用語からの距離で測定してもよい。抑制基準または非抑制基準は、数式中のすべての数を、または、レシピとして識別されたテキストのブロック中のすべての数を抑制するように指定するような、コンテンツ特有であってよく、このような例を以下でさらに説明する。さらに、抑制(または非抑制)基準を満たすページ画像中の特徴に対する位置およびサイズ情報の決定は、非抑制特徴のみを含む置換ページ画像を準備するときに役立つ。抑制(または非抑制)基準を使用して、写真または絵のような非テキスト対象を識別して指定もできる。非テキスト対象は、これに関連したテキストを有してもよく、非テキスト対象は、対象の関連したテキストを参照することによって、抑制(または非抑制)基準を満たす。例えば、抑制基準は、ある源に属するすべての写真が抑制されるべきであることを要求してもよい。したがって、抑制基準を満たす属性テキストを有する写真は抑制されるべきであると指定されて、写真を抑制する目的のために写真に対する位置およびサイズ情報が獲得される。
図4から図6は、ページ画像中の特徴(ここでは、絵)を抑制できる、1つの例示的なプロセスを図示している。図4は、テキスト138と絵140とを含むページ画像136を図示している。このプロセスにおける最初の作業は、ページ画像136上の各非抑制特徴(ここでは、各ワード)とともに、各非抑制特徴の位置とサイズとを識別することである。都合がいいことに、ワードが非抑制特徴である場合に、図3中のブロック124について以前に説明したOCRプロセスの一部分として、この最初の作業を達成できる。この点に関し、OCR近似も使用でき、これは、各ワードの各文字を個別に正確に認識する一般的なOCRに対して、より高速であることが多く、リアルタイムで実行することができる。OCR近似は、ワードの位置と大きさとを戻すが、必ずとも個々の文字のそれぞれを正確に認識する必要がない。図5では、ページ画像136が図示されており、参照番号142によって示されている各ワードを囲っているボックスにより表されているように、ページ上の各ワードの位置が捜し当てられ、識別されている。参照番号144で示されたワードの位置も捜し当てられて識別されているが、ワード144は、ワードのバックグラウンドが絵140の小部分を含んでいるので、ここでは別に着目されている。
図6に移ると、ブランク画像を発生させて、それから、参照番号146により一般的に示されているように、ピクセル情報のようなそれぞれ識別されたワードに対する情報をオリジナルページ画像136から置換画像145にコピーすることによって、ページ画像136に対する置換ページ画像145が準備される。各ワードがオリジナル画像136で見いだされるそれぞれの対応する位置において、ワードは置換画像145上に配置される。図5中のワードを囲んでいるボックス中に含められる各ワードに対するピクセル情報のみを「カット」し、置換画像145中にピクセル情報を「ペースト」することによって、オリジナル画像136中の絵140が抑制される。参照番号148が示すように、ワード画像144に対するピクセル情報が置換画像145にコピーされるとき、ワード148の後ろの絵の小部分は、置換画像145中で目に見えるままであるが、全体として絵140は認識できない。望むのであれば、文字の後ろのバックグラウンドを除去するために、技術的に知られているアルゴリズムをワード画像144にも適用できる。任意のケースにおいて、ワード148の後ろの絵140の量は、オリジナル絵140の小部分のみを表している。代替実施形態において、絵を抑制する置換画像は、例えば図5に示されているようなオリジナルページ画像136中のワードを最初に識別し、それから、識別されたワードに対応しないページ画像中のすべてのピクセル情報(すなわち、識別されたワードを囲む「ボックス」の外)を「消去」または除去することによって準備される。結果は、置換ページ画像であり、これは、非抑制ワード画像をカットして新しい(置換)ページ画像にペーストした結果と同じに見える。同様に、特徴抑制は、絵140のような、オリジナル画像136中で抑制されるべき特徴を識別して、(おそらく、例えば、ワード画像144のような、非抑制特徴とのオーバーラップが生じる場合を除いて)抑制されるべき特徴に対応するピクセル情報を除去し、ページ画像中の非抑制特徴の後ろを残すことが必要とされる。
いくつかのケースにおいて、置換画像145中で再生されることが望まれるバックグラウンドのテクスチャまたは色を、オリジナルページ画像136が有してもよい。オリジナル画像136のものと類似したバックグラウンドを備える置換画像145を準備する1つの適切な方法は、オリジナルページ画像136の1つ以上のコーナーにおける1つ以上のピクセルを調べて、置換ページ145のそれぞれのコーナーにおいて、これらのピクセルの色と輝度とを複製することである。各コーナーからの色および輝度を、ページの中心に対して内側に補間して、オリジナル画像136のバックグラウンドをシミュレートする置換ページ145に対するバックグラウンドを完成できる。上記の代替実施形態において、「ボックス」の外側のピクセル情報が「消去」される場合、ピクセル情報は、フォアグラウンドピクセル情報とバックグラウンドピクセル情報との間で区別され、フォアグラウンドピクセル情報のみが消去され、その場所にバックバックグラウンド情報を残す。さらなる代替実施形態は、抑制されるべき特徴が識別され、それらの特徴に対するピクセル情報が(例えば、ピクセル情報をバックグラウンドピクセル情報で置換することによって)「消去」され、その場所に非抑制特徴を残すものである。
含められるコンテンツのタイプと課せられる制限とによって、特徴の抑制は変わる。例えば、レシピ本の発行者によって、レシピに対する材料のリストをユーザに示すが、材料の量は示さないことが可能になる。OCR技術を使用して、例えば「5」と「五」のような数を識別して抑制するとともに、上記で説明した特徴抑制の方法を使用すると、一部分を識別して抑制できる。ユーザが、材料リスト(および、おそらく料理指示)を見れるようにすることによって、ユーザは所望のレシピを見ることが可能になる。それから、例えば、電子ダウンロードまたは印刷されたレシピ本の購入によって、ユーザは全体のレシピを取得しようとする。数および/または数式がテキストの中心的に影響を及ぼす特徴である技術論文またはテキストの発行者によって、同様の手順が使用されてもよい。数および数式が抑制されるが、ユーザは、周囲のテキストを見る機会が与えられ、同時に、影響を及ぼす数または数式を見るために、テキストを購入するように勧められる。本質的に、本発明によって、ページ画像データベース116中に記憶される、および/またはユーザに示される、ページ画像からの異なるクラスの情報を抑制させることが可能になる。図4から図6に図示されているとおり、絵の抑制は、まさに抑制できる情報のクラスの1つの例である。
ページ画像が最初に取得された後であって、ページ画像がユーザに表示される前の何らかの段階で、特徴の抑制を実行できる。図3に示されているプロセス122は、置換ページ画像がページ画像データベース116中に記憶される前の特徴の抑制を図示している。置換ページ画像は、各ユーザに対して個々に特徴抑制プロセスを実行させることなく、検索し、複数のユーザに即座に表示するのに使用可能である。したがって、図3は、ページ画像が示されるべきユーザ間で区別しない「汎用的な」特徴の抑制を図示している。
代わりに、例えば、ページ画像データベース116からページ画像を検索した後に、最初のページ画像上または以前準備された置換ページ画像上で、動的に特徴抑制を実行できる。ユーザが閲覧のためにサーチ結果を選択するとき、動的な特徴抑制をリアルタイムで実行できる。選択されたサーチ結果に対応する1つのページ画像または複数のページ画像をページ画像データベース116から検索し、ここで説明される1つ以上の特徴抑制方法を検索されたページ画像上で実行して、見るためにユーザに配信される特徴抑制画像を生成させる。動的な特徴抑制によって、ライブラリコンテンツサーチシステム100がユーザと、彼らのそれぞれの権利との間を区別して、ページ画像データベース116中のコンテンツにアクセスできるようになる。アクセス権利データベース120には、アクセス基準に基づいて異なるアクセス制限を定めるアクセスルールが含まれてもよい。アクセス基準とは、特定のユーザのシークアクセス、ユーザが見たい特定のコンテンツ、ユーザが見たいコンテンツの時間および/または位置、コンテンツのユーザ所有権、およびユーザによって提示される特別な認証のようなものである。後者については、ユーザから受信されるコンテンツを見る認証は、技術的に知られている、認証の有効性を確認する認証方法にしたがってもよい。このような認証は、認証されたユーザに異なって適用されるアクセスルールとなり、そうでなくて許可されるものよりも多い量のコンテンツに対してアクセスが可能になる。例えば、生徒が、特定の講義の間、本のコンテンツを閲覧するための認証を受信してもよく、講義が終了した後に、認証は失効することになる。通常、抑制されるコンテンツを見る認証をユーザが受信して提示できる他の状況は、この開示の観点において容易に認識できる。
図7に移ると、ページ画像データベース116中とテキストサーチ可能データベース118中とに記憶されているような、コンテンツの一般ライブラリから選択されるコンテンツのパーソナルライブラリを、ユーザが設定または更新できるプロセス150を説明している。プロセス150の最初のステップ152のように、ユーザは、コンテンツを一般ライブラリから選択して、ユーザのパーソナルライブラリ中にこのコンテンツ(または、それに対する電子リンク)を含める。例のみとして、図7中で説明されているコンテンツは本の形態であるが、本発明は他のコンテンツの形態にも適用する。これまでに説明したように、1つの実施形態では、パーソナルライブラリに対するコンテンツのユーザ選択は、ユーザが一般ライブラリ中のコンテンツのインデックスをレビューして、特定のコンテンツ(この例では、本)を手動で選択して、ユーザのパーソナルライブラリ中に含めることを可能にすることによって達成される。ブロック152での各選択に対して、プロセス150は、ユーザが本を所有するか否かを決定ブロック154で決定する。ユーザが本を所有していない場合、特定の本はユーザにより所有されていないとして識別されて、ブロック158で示すように、ユーザのパーソナルライブラリに追加される。パーソナルライブラリ中の本に関連した電子フラグにより、ユーザのパーソナルライブラリ中の本の非所有権が示される。
決定ブロック154に戻ると、自分が本を所有することをユーザが示す場合、プロセス150は、ユーザの所有権を確認しようとする。参照番号160で示すように、本を販売するエンティティによってパーソナルライブラリサーチサービスが提供される状況では、実際にユーザが本を所有していることを確認するために、エンティティは、ユーザに対するその購入情報をレビューしてもよい。パーソナルライブラリサーチサービスは、ユーザに対する購入記録を確認できる、他の書籍販売業者とのパートナー契約があってもよい。ユーザが本を所有しているか否かをユーザに問い合わせることなく、ブロック152において、ユーザにより選択された本に対して、ユーザの購入記録のレビューをさらに自動的に実行してもよい。代わりに、購入のための本のユーザの選択は、ユーザのパーソナルライブラリに本を自動的に追加するように機能できる。あらゆる点において、本のユーザの購入が確認された場合、プロセス150は進み、ブロック158で示しているように、ユーザのパーソナルライブラリに本を追加する。フラグをパーソナルライブラリ中の本に関係付けて、本の所有権が確認されたことを示してもよい。
所有権の確認のために購入記録または他のデータ源を参照することによって、本の所有権が確認できない場合、ブロック162で示すように、プロセス150は、本の所有権を確認するために、ユーザがさらなるステップを受けるように依頼してもよい。例えば、ユーザは、選択された本の購入を証明する受領書のコピーを提示するように依頼されるかもしれない。代わりに、または、これに加えて、本の所有権を確認するために、ユーザは、選択された本から1以上のページの画像を提供するように依頼されるかもしれない。ある状況では、ユーザが本を購入した当事者を示すだけ十分であり、パーソナルライブラリサーチサービスのプロバイダは、実際に本が購入されたことを、識別された販売人に個々に確認できる。パーソナルライブラリに対して選択されたコンテンツの所有権の決定は、本発明に重要または必要でないが、サーチでユーザに表示されるコンテンツの量および範囲が、設定されたコンテンツの所有権にしたがって制限される状況において役立つ。
これまでに述べてきたように、データベースサーバ110には、アクセス権利データベース120が含まれている。アクセス権利データベース120は、サーチの結果としてユーザに表示されるコンテンツの範囲および性質を制御する。アクセス権利データベース120には、アクセスルールが含まれている。アクセスルールは、適用可能であると決定されたときに、ユーザに示されるページ画像中のコンテンツを制限する役割をする。コンテンツの閲覧の制限を各個人ユーザ(またはユーザのグループ、またはタイプ)に対して設定でき、これらには限定されないが、下記のものの内の1つ以上が含まれてよい。任意の所定のページ、タイトル、またはコンテンツの集まりに対してユーザに示せるコンテンツ量(例えば、割合)制限、任意の所定のタイトルまたはコンテンツの集まりに対してユーザに示せるページの総数制限、コンテンツのタイプに基づくコンテンツの量制限、コンテンツ特有の制限と無関係にユーザに示せるページの総数制限、および任意の所定のサーチ結果に対してユーザに示せるページの総数制限。ユーザによって行われるすべてのサーチに対して、サーチ毎のベースで、または全体としてこれらの制限を課すことができる。特定期間にわたって、これらの制限を課すこともできる。例えば、30日間、または30日サイクルで10日間、またはユーザの一生にわたるような、指定された時間フレーム中で、コンテンツの所定ページの指定された割合より多くユーザが見れないように、アクセスルールは書かれてもよい。ライブラリコンテンツサーチシステム100は、ユーザ確認手順を実行して、アクセス権利データベース120中のアクセス制限を回避する複数のアカウントをユーザが設定するのを禁止する。サーチシステム100がセットアップされて、サーチの結果としてのみ位置が捜し当てられたコンテンツをユーザが閲覧できるようにしてもよい。言い換えると、(位置が捜し当てられたページに対する文脈を与えるために、サーチで位置が捜し当てられたページに隣接する1以上のページをブラウジングできるが)ユーザは、例えば、ブラウジングモードで任意のページをアクセスして閲覧することが許されない。これらのような制限を実行するために、サーチシステム100は、各ユーザに対してユーザ活動を追跡するように構成され、これは、ユーザが閲覧したページ画像(またはその一部)の識別とユーザがページ画像を閲覧した時間フレームとを含んでいる。
アクセス権利データベース120中のアクセスルールは、問題のコンテンツのタイプのようなコンテンツ特有の情報に依存して、各個人ユーザ(またはユーザのグループ)に異なって適用できるようにさらに構成されていてもよい。例えば、コンテンツのテーブルおよびコンテンツのインデックスの制限のない閲覧を可能にするが、コンテンツそのものの本体の閲覧に、より厳密な制限を課すようにアクセスルールが書かれてもよい。
ユーザに表示するためにコンテンツを生成させるときに、コンテンツに対するユーザのアクセスを制御するアクセスルールがどれかを決定する要因としての役割を、ユーザの位置が果たすこともできる。例えば、教室の中にいる生徒が、授業中に使用されているコンテンツの本体全体をアクセスできるようにする一方、同じ生徒が、自宅ではコンテンツの制限された一部分を閲覧できるだけであるように、異なるアクセスルールが書かれてもよい。例えば、コンピュータ接続のドメインを使用してユーザ位置を決定してもよい。同様に、例えば、異なる日にち、または1日の異なる時間において、コンテンツがユーザに提供されるべき時間に基づいて異なって適用されるようにアクセスルールは書かれてもよい。一度、ページ画像の一部がユーザに表示されると、新規なページ画像を閲覧するのに他の制限を課すことなく、ユーザがページ画像のその一部を閲覧するためにいつでも戻れるように、アクセスルールを準備してアクセス権利データベース120中に記憶することもできる。
本発明によって提供される特徴抑制方法を使用して、アクセス権利データベース120中のアクセスルールによって課せられたアクセス制限が実行できる。例えば、ルールが適用させることが決定されたときに、ユーザに表示されるべきページ画像中のコンテンツの量がルールによって制限されるように、アクセスルールが書かれてもよい。ユーザに表示されるべきでないページ画像の部分の特徴が、抑制のために指定される。代わりに、ユーザに示されるべきページ画像の部分の特徴が、抑制されるべきでないと指定される。ここで説明している特徴抑制方法の1つ以上を使用して、非抑制特徴を含んで、抑制特徴を省く置換ページ画像を発生させてユーザに提供してもよい。
ユーザのパーソナルライブラリは、一般ライブラリ中に記憶されている実際のコンテンツを複製する必要はない。むしろ、各ユーザのパーソナルライブラリは、ユーザが一般ライブラリから選択して自分のパーソナルライブラリ中に含めるコンテンツのリストからなっていてもよい。コンテンツのパーソナルリストは、データベースサーバ110中に記憶されている実際のコンテンツにリンクできる。データベースサーバ110中のコンテンツの実際のコピーの数を制限して、ユーザのパーソナルライブラリがそのコンテンツにリンクができるようにすることによって、パーソナルライブラリサーチサービスを実行するために要求される記憶スペースの量が減少する。さらに、パーソナルライブラリを定めるために公的にユーザがアクセス可能なコンテンツの一般ライブラリを提供すると、ユーザがコンテンツをスキャンし、パーソナルライブラリに対してコンテンツのサーチ可能な電子コピーを作成する負担に加えて、そのようなことが必要である場合に、コンテンツのコピーを生成させるために法的許可を獲得する負担が減少され、または除去される。
パーソナルライブラリを設定し、および/または、更新するユーザは、例えば、ユーザによって提供された1つ以上のサーチ用語と一致するテキストを有するコンテンツに対して、パーソナルライブラリを電子式にサーチできる。この方法で行われるサーチは、(1)ユーザのパーソナルライブラリ中の特定のコンテンツにユーザのサーチを制限することと、(2)ユーザのパーソナルライブラリ中のコンテンツの本体全体を含むフルテキストサーチを行い、これは、コンテンツに関連した出版目録および要約のデータまたはメタデータのみを含んでいるサーチよりもさらに包括的であることと、(3)サーチから結果的に得られるコンテンツの実際の画像または画像の一部分を、ユーザによる即座なレビューのために生成させることとを含む、かなりの利点を有する。さらなる利点はこの開示から明らかである。
パーソナルライブラリ中のコンテンツをサーチして閲覧するプロセス170の1つの実施形態を、図8を参照して、さらに図9から図12を参照して説明する。図8におけるブロック172で、ユーザは、ユーザのパーソナルライブラリ中のコンテンツの指定されたテキストに対してサーチを開始する。ウェブベースのインプリメンテーションにおいて、パーソナルライブラリをサーチするためにユーザに提供されるウェブページの1つの例が図9で図示されている。
図9では、ユーザがサーチエントリーボックス202中に1つ以上のサーチ用語を入力できるウェブページを表示している、ブラウザプログラム200が図示されている。サーチサーバ108によってウェブページが発生されて、インターネットによって、ユーザのコンピュータデバイス102および104に配信することができる。ユーザは、望みのサーチ用語を入力し、ポインティングデバイス、キーボードまたは、他の入力デバイスを使用して、例えば、参照番号204で識別された「進む」ボタンをクリックすることによって、サーチを開始する。図9中のウェブページには、「インデックス」リンク206および「頻繁にアクセスされたタイトル」リンク208のような、他のハイパーテキストリンクが含まれている。双方ともさらなる情報を提供して、図示されていない1つ以上のウェブページにアセンブルできる。例えば、インデックスリンク206をクリックすると、ユーザに対するウェブページがユーザに生成される。ウェブページは、ユーザのパーソナルライブラリ中に現在含められているすべてのコンテンツに対する出版目録データをリストアップする。頻繁にアクセスされたタイトルリンク208によって、例えば、ユーザが最も頻繁にアクセスしたコンテンツのリストが生成される。
サーチサーバ108によって、ログインおよびログアウトルーチンが使用され、パーソナルライブラリに対する安全なアクセスをユーザに提供してもよい。(例えば、パスワードを使用して)パーソナルライブラリに対するアクセスを要求しているユーザを確認するのに適切なルーチンは、技術的によく知られている。図9から図12において、ユーザは、すでにログインしていると仮定されている。ログアウトリンク210が図示されており、開始されるときに、ログアウトリンク210は、ユーザがユーザの現在のセッションを中止して、ユーザアカウントからログアウトできるようにする。
図8に戻ると、ブロック174で、サーチサーバ108は、ユーザの指定されたサーチ用語を受信し、テキストサーチ可能データベース118のサーチを開始して、サーチ問い合わせのテキストを含んでいるユーザのパーソナルライブラリ中のコンテンツのページを識別する。これまでに着目したように、テキストサーチ可能データベース118は、サーチ用語が見いだすことができるページ画像データベース116中の対応する画像を識別する情報を含むように構成するのが好ましい。したがって、指定された用語に対してユーザがサーチを行う時、テキストサーチ可能データベース118は、指定されたテキストを含んでいるユーザのパーソナルライブラリ中の特定のコンテンツを識別するだけではなく、ページ画像データベース116の対応するページ画像も識別する。
ブロック176で示すように、ブロック174で実行されたユーザのサーチ結果がユーザに表示される。図10は、ブラウザプログラム200を図示しており、ブラウザプログラム200は、参照番号212で、「スフィンクスの謎」のサンプルフレーズに対するサーチ結果が示されているウェブページを表示している。サーチ結果212は、さまざまな異なるフォーマットで表示されてもよい。例のみとして、図10中のサーチ結果212には、参照番号214で示しているように、タイトルと著者のリストが含まれており、加えて、参照番号216で示しているように、(ブックカバーのような)コンテンツのサムネイル画像または、その一部が含まれている。再度説明すると、ユーザのパーソナルライブラリ中に含めるべく、ユーザによって選択されたコンテンツのサーチからサーチ結果212を発生させる。ユーザのパーソナルライブラリ中に多くのサーチ「ヒット」がある場合、サーチサーバ108はプログラム命令を実行し、このプログラム命令は、どのページが最も関連があるかのような予め定められた基準にしたがってユーザに表示するために、ヒットを分析して「ベストな」ページをランク付けする。例えば、関連性の尺度には、どのページが最もヒットされ、それらのタイトルでどのページがヒットされ、どのページが最も売れているテキストから引き出されているか等を含む。
図8に戻ると、ブロック178で、例えば、タイトルおよび/またはページ数によって識別されたサーチ結果において、ユーザは、さらなるレビューのために特定のコンテンツを選択できる。サーチサーバ108は、ユーザ選択のコンテンツの画像をユーザに直ちに表示できる。しかしながら、図8で示される実施形態において、ブロック180で、サーチサーバ108は、最初に、データベースサーバ110中のアクセス権利データベース120をレビューして、サーチ結果中にリストアップされたコンテンツをどのくらいユーザに表示できるのかを制御する何らかのアクセスルールがあるか否かを決定する。以前に説明したように、アクセス権利データベース120は、ユーザが、例えば、標準の出版目録情報を越えて、ライブラリ中のコンテンツをアクセスして閲覧するユーザの能力を制御するルールに対する貯蔵庫である。
例えば、これまでに着目したように、ユーザによって所有されていないコンテンツと対照的に、ユーザによってすでに所有されているコンテンツに対するユーザのアクセスを制御するように異なるルールが書かれてもよい。サーチ結果で識別されたユーザ所有のコンテンツに対して、ユーザのサーチ用語の位置が捜し当てられたページの前にくる、または後に続くページ画像を含んでいる、そのコンテンツの本体全体をアクセスすることがユーザに許されてもよい。例えば、これには、ユーザが購入した製品の動作マニュアルが含まれる。
ユーザが所有していないコンテンツに対して、アクセス権利データベース120中の1つ以上のルールが、ユーザに表示できる位置が捜し当てられたサーチ用語を囲むコンテンツの量を制限する役割を果たす。例えば、図11はブラウザプログラム200を図示しており、ブラウザプログラム200は、図10中に示されるような、ユーザに以前通信されたサーチ結果における特定のタイトルに対するウェブページを表示している。参照番号220で示されているサーチ結果のタイトルは、例えば、サーチ結果212中のものの内いずれであってもよい。
図11は選択された結果タイトル220からのサンプルページ画像222を図示している。ページ画像222は、この例では、結果タイトル220からの「ページ17」の画像であるが、オリジナルページ画像のコンテンツのすべてを含んでいない。コンテンツのこの編集、すなわち抑制は、結果タイトル220の実際のコンテンツに対して制限されたアクセス権利をユーザが持つ環境の結果とすることができる。この例では、図10に示されているフレーズ「スフィンクスの謎」に対するサーチに基づいて、結果として得られたページ画像222は実際のページを示しており、実際のページではフレーズ「スフィンクスの謎」が見いだされているとともに、サーチ用語に先行するおよび続くワードの数が制限されている。ページ数を除く、ページ画像222上の他のすべてのワードおよび特徴が抑制されている。位置が捜し当てられたサーチ用語に先行するおよび続くワードの数は、ユーザの好みとユーザに対して特定のコンテンツを制御するアクセスルールとにしたがって変化してもよい。この例では、9つのワードがフレーズ「スフィンクスの謎」に先行しておよび続いて示されている。他の環境では、アクセス権利データベース120中のアクセスルールは、ユーザが図11の「ページ17」(すなわち、ページ画像222)のより広い部分または「ページ17」の画像全体さえも閲覧できるようにしてもよい。先に説明したような特徴抑制の方法は、アクセス権利データベース中のアクセスルールにしたがって、表示されるべきページ画像中のコンテンツを抑制するのに使用される。
要するに、図8に戻ると、ユーザがサーチ結果212から特定のコンテンツを選択し(ブロック178)、コンテンツに対するアクセス権利が考慮された(ブロック180)後、サーチ用語に対応するテキストを有する1以上のページの画像がページ画像データベースから検索される(ブロック182)。ユーザに許されたアクセス権利に基づいて、検索されたページ画像の一部または全部がユーザに表示される(ブロック184)。
オプション的に、ブロック186に示されているように、ユーザにより指定されたサーチ用語はユーザに表示されるページ画像中で強調されてもよい。プロセスが提供され、それにより、表示のためにページ画像をユーザに配信するのに必要な時間とリソースを減少させる方法でサーチ用語が強調される。
サーチサーバ108においてサーチ用語を強調させてページ画像222をフォーマットして、強調させたページ222をユーザに配信する以外に、ページ画像222はすぐにユーザに配信されてもよい。同時に、サーチサーバ108はページ画像222上のサーチ用語の位置とサイズ(先に説明したようにテキストサーチ可能データベース118中で使用可能な情報)を決定し、その情報をユーザに配信する。ユーザデバイス102、104はプログラム命令をローカル的に実行して、ページ画像222上に視覚インジケータを置き、サーチ用語の位置を強調させてもよい。視覚インジケータはサーチ用語の次に置かれるアイコン、またはサーチ用語の下に置かれるアンダーラインであってもよい。代わりに、視覚インジケータは、表示されるサーチ用語のフォントの変化であってもよい。好ましい実施形態では、視覚インジケータはサーチ用語とオーバーレイする透明色の1つ以上のブロックにより提供され、したがって、ページ画像222が表示されるときに色付き強調224(図12)の効果を生み出す。後者の好ましい実施形態では、ユーザデバイス102、104がページ画像222上に強調224を生成させるように、ユーザデバイス102、104はDHTMLレイヤーリングまたはジャバスクリプト技術を使用するように命令されてもよい。ユーザデバイス102、104にサーチ用語上の色強調を準備させてオーバーレイさせることにより、(強調に関して)サーチサーバ108がユーザデバイス102、104に通信する必要がある唯一の情報は、強調させるべき各ワードに対する数的な「4組のもの」である。先に着目したように、4組のものは、特定のページ画像上のワードのXおよびY位置とともに幅および高さを記述する1セットの4つの数である。他の実施形態では、サーチ用語のXおよびY位置のみが通信され、標準濃度の強調がサーチ用語に対して層状に重ねられる。サーチサーバ108がユーザデバイス102、104に通信する必要がある情報の量を最小にすると、サーチサーバ108からユーザデバイス102、104に通信するのにかかる時間の量が減少する。
ユーザのパーソナルライブラリは、望まれるように、フィクション作品およびノンフィクション作品のような、作品のクラスに分割することもでき、このようなクラス内で、ミステリー、アドベンチャー、歴史、参考書などのようなサブクラスに再分割することもできる。作品のクラスおよびサブクラスはユーザにより予め規定されても、またはカスタマイズされてもよい。ユーザのパーソナルライブラリ中の本の特定のクラスまたはサブクラスに対するサーチを制限することにより、ユーザにより実行されるサーチはさらに焦点が合い、ユーザに役立つ。例えば、医学生はパーソナル「医学」ライブラリを規定し、学生のパーソナルライブラリ中の医学テキストのフルテキストサーチが行われる。さらに、「関連」テキストを識別するアルゴリズムを使用して、パーソナルライブラリに対するコンテンツのユーザ選択を助け、特定のクラス中に厳しく区分されないが、ユーザがサーチを望むクラスに関連するコンテンツを含めてもよい。「関連テキスト」アルゴリズムは技術的に知られており、あるワードの辞書定義および類義語を使用して、例えば、関連コンテンツを識別して、サーチされるパーソナル化ライブラリ中に含めてもよい。
パーソナルライブラリの概念は一人の人から(「ユーザ」を構成する)小グループの人々に拡張してもよく、小グループの人々は互いに知り合いで、彼らが所有するコンテンツをプールするために選択をする。このタイプの小グループは同じアパートに住んでいるまたは同じ団体などの家族または人々から構成されていてもよい。グループ中の各人はグループのパーソナルライブラリに含めるべきコンテンツを決定することができる。コンテンツの単一のサーチ可能なセットがグループに提供される。サーチ結果はグループ中で本を所有している人および現在その本を占有している人を報告するように構成されていてもよい。
ここでの「テキスト」をサーチする説明は、絵、写真などのような非テキスト対象をサーチすることも同様に含めるように拡張してもよい。これは、問題の対象に関係するまたはさもなければ問題の対象を説明している、可視または隠されたテキストおよび/またはメタデータのようなデータをサーチすることにより達成することができる。テキストサーチ可能データベース118は、問題のページ画像中の対象を示す位置およびサイズ情報を持つ、可視または隠されたテキストあるいはメタデータのようなものを含むように構成することができる。
さらに、テキストファイルのような非画像ファイル中に記憶されているコンテンツのページに対しても本発明が適用できることを、当業者は先の説明から理解するであろう。例えば、先に説明したように、レシピ本の発行者はレシピに対する材料リストがユーザに示されるようにするが、材料の量は示されないようにできる。レシピ本のページはテキストファイルで具体化されてもよく、おそらくはテキストサーチ可能データベース118中に記憶される。本発明により提供される特徴抑制方法は、レシピを含むページ上で使用して、「5」および「五」のような数字とともに一部分をページから識別して抑制することができる。(非テキスト対象とともにテキストファイル中のテキストを含む)特徴の抑制は、コンテンツのオリジナルページを取り出し、抑制されるべきではない識別された特徴のみを含む、コンテンツの置換ページを準備することにより達成することができる。
この例では、ユーザが材料リスト(およびおそらく料理指示)を見ることができるようにすると、ユーザは所望のレシピを識別できる。ユーザは、例えば電子ダウンロードまたは印刷されたレシピ本の購入により、レシピ全体を取得しようする。例えば、数字および/または数式がテキストの中心的に影響を及ぼす特徴である技術論文またはテキストの発行者により、同様な手順を使用することができる。数字および数式は抑制されるが、ユーザには周囲のテキストを閲覧する機会が与えられ、同時にユーザは影響を及ぼす数字および数式を閲覧するためにオリジナルテキストを購入するように誘われる。しかしながら、購入前には、ユーザは、抑制されるべきでない特徴が示されている置換ページを閲覧することが制限される。
本発明の好ましい実施形態を図示し、上で説明したが、本発明の精神および範囲を逸脱することなく、さまざまな変更をできることが理解されるであろう。したがって、本発明の範囲は特許請求の範囲およびそれに均等なものから決定されるべきである。
図1は、本発明の1つの例示的な実施形態を実行する環境を示している描画図である。 図2は、図1に示されている実施形態を実行するあるコンピュータの構成要素の配置を図示しているブロック図である。 図3は、コンテンツの画像を準備して、ページ画像データベース中に画像を記憶させるとともに、コンテンツのテキストを準備してテキストサーチ可能データベース中に記憶させる、プロセスの1つの実施形態を記載しているフロー図である。 図4は、テキストおよび絵を備えたコンテンツのページの例の説明である。 図5は、ボックス中に示された識別されたテキストを備えた、図4中に示されているページを図示している。 図6は、図5中で識別されたテキストの画像が置換ページにコピーされ、配置され、その後に図4中に示されているオリジナルページ中の絵を効果的に抑制している置換ページを図示している。 図7は、ユーザがユーザのパーソナルライブラリ中に含めるべきコンテンツを選択して加えることが可能になる、プロセスの1つの実施形態を記載しているフロー図である。 図8は、ユーザのパーソナルライブラリ中のコンテンツをサーチして表示するプロセスの1つの実施形態を記載しているフロー図である。 図9は、サーチ入力フィールドをユーザに示している例示的なウェブページを備えたブラウザプログラムを図示している。 図10は、サンプルサーチの結果を示している例示的なウェブページを備えたブラウザプログラムを図示している。 図11は、選択されたサーチ結果からのページの画像を示している例示的なウェブページを備えたブラウザプログラムを図示している。 本発明にしたがって、サーチ結果が強調されている、図11中で示されているようなウェブページを備えたブラウザプログラム図示している。

Claims (58)

  1. コンテンツのページ画像中の1つ以上の特徴を抑制する方法において、
    (a)コンテンツのページ画像を取得することと、
    (b)抑制されるべきである、または、抑制されるべきでないページ画像中の1つ以上の特徴を識別することと、
    (c)抑制されるべきでないと識別された特徴の画像のみを含む置換ページ画像を準備することとを含む方法。
  2. コンテンツのページ画像を取得することは、コンテンツのページをスキャンして電子画像フォーマットにすることを含む請求項1記載の方法。
  3. コンテンツのページ画像を取得することは、電子テキストを電子画像フォーマットに変換することを含む請求項1記載の方法。
  4. コンテンツのページ画像を取得することは、以前にメモリ中に記憶されたページ画像を検索することを含む請求項1記載の方法。
  5. 抑制されるべきでない特徴を識別することは、非抑制基準を満たすページ画像中の特徴に対する位置およびサイズ情報を決定することを含む請求項1記載の方法。
  6. 非抑制基準は、ページ画像中のテキストを識別する請求項5記載の方法。
  7. 非抑制基準は、1つ以上の指定された用語と一致するテキストを識別する請求項6記載の方法。
  8. 非抑制基準は、非テキスト対象を識別する請求項5記載の方法。
  9. 非テキスト対象はこれに関連したテキストを有し、非抑制基準は、対象の関連テキストを参照することによって、非テキスト対象を識別する請求項8記載の方法。
  10. 置換ページ画像を準備することは、ブランク画像を発生させることと、位置およびサイズ情報を使用して、非抑制特徴の1つ以上の画像をオリジナルページ画像からブランク画像にコピーすることとを含む請求項5記載の方法。
  11. 非抑制特徴の画像をコピーすることは、オリジナルページ画像中の非抑制特徴の位置に対応する1以上の位置で、非抑制特徴に対するピクセル情報をオリジナルページ画像から置換ページ画像にコピーすることを含む請求項10記載方法。
  12. オリジナルページ画像中のバックグラウンド情報をシミュレートするバックグラウンド画像情報を置換ページ画像中に含めることを含む請求項5記載の方法。
  13. オリジナルページ画像のバックグラウンドから置換ページ画像のバックグラウンドにピクセル情報を複製することによって、バックグラウンド画像情報を置換ページ画像中に含める請求項12記載の方法。
  14. オリジナルページ画像中の1以上の位置からのバックグラウンドピクセル情報を置換ページ画像中の対応する位置で複製し、置換ページ画像の残りにより補間して置換ページ画像に対するバックグラウンド画像情報を生成させる請求項13記載の方法。
  15. 置換ページ画像を準備することは、抑制されるべきでない特徴に対応しない画像情報をオリジナルページ画像から除去することを含む請求項1記載の方法。
  16. 置換ページ画像を準備することは、抑制されるべき特徴に対応する画像情報をオリジナルページ画像から除去することを含む請求項1記載の方法。
  17. 抑制されるべき特徴を識別することは、抑制基準を満たすページ画像中の特徴に対する位置およびサイズ情報を決定することを含む請求項1記載の方法。
  18. 抑制基準は、ページ画像中のテキストを識別する請求項17記載の方法。
  19. 抑制基準は、1つ以上の指定された用語と一致しないテキストを識別する請求項18記載の方法。
  20. 抑制基準は、非テキスト対象を識別する請求項17記載の方法。
  21. 非テキスト対象はこれに関連したテキストを有し、抑制基準は、対象の関連テキストを参照することによって、非テキスト対象を識別する請求項20記載の方法。
  22. オリジナルページ画像のバックグラウンドから置換ページ画像のバックグラウンドにピクセル情報を複製することによって、バックグラウンド画像情報を置換ページ画像中に含めることをさらに含む請求項1記載の方法。
  23. フォアグラウンドピクセル情報をバックグラウンドピクセル情報と区別し、抑制されるべき特徴に対応するフォアグラウンドピクセル情報を置換ページ画像から除去することによって、バックグラウンド画像情報を置換ページ画像中に含めることをさらに含む請求項1記載の方法。
  24. 後の検索のためにページ画像データベース中に置換画像を記憶することをさらに含む請求項1記載の方法。
  25. 記憶された置換画像は、検索されるときに、(1)抑制されるべきである、または、抑制されるべきでない、検索されたページ画像中の1つ以上の特徴を識別することと、(2)抑制されるべきでないと識別された特徴の画像のみを含む置換ページ画像を準備することとによって、さらに特徴抑制を受けるオリジナルページ画像を構成する請求項24記載の方法。
  26. 置換ページ画像中に含めることができるコンテンツの量を制限するアクセスルールを参照することと、アクセスルールにしたがってページ画像中に残すことができるページ画像中の特徴に対する情報を決定することとをさらに含む請求項1記載の方法。
  27. ページ画像中に残すことができる特徴に対する情報を決定することは、特徴の位置およびサイズ情報を決定することを含む請求項26記載の方法。
  28. 置換ページ画像を準備することは、ブランク画像を発生させ、位置およびサイズ情報を使用して、オリジナルページ画像中と同一の位置で置換ページ画像中に残すことができる特徴に対するピクセル情報をコピーする請求項27記載の方法。
  29. アクセスルールは、置換ページ画像中に含めることができる総量を規定する請求項26記載の方法。
  30. アクセスルールは、置換ページ画像中に含めることができるコンテンツの割合を規定する請求項26記載の方法。
  31. アクセスルールは、コンテンツ特定情報に基づいてコンテンツの量を規定する請求項26記載の方法。
  32. アクセスルールは、コンテンツ所有権に基づいてコンテンツの量を規定する請求項26記載の方法。
  33. ユーザの位置に基づいて、異なるアクセスルールを参照することをさらに含む請求項26記載の方法。
  34. 置換ページ画像がユーザに提供されるべき時間に基づいて、異なるアクセスルールを参照することを含む請求項26記載の方法。
  35. サーチ結果として、コンテンツのページ画像をユーザに提供するコンピュータシステムにおいて、
    データベースサーバと通信するサーチサーバを具備し、データベースサーバは、(1)コンテンツのページ画像を含むページ画像データベースと、(2)テキストとテキストを含むページ画像データベース中のページ画像を識別する情報とを含むテキストサーチ可能データベースとを含んでいる、コンテンツライブラリで構成され、サーチサーバは、サーチサーバが、ユーザサーチに基づいてページ画像データベースからページ画像を検索し、抑制されるべきである、または、抑制されるべきでないページ画像中の1つ以上の特徴を識別し、抑制されるべきでないと識別された特徴の画像のみを含む置換ページ画像を準備して置換ページ画像をユーザに提供できるようにするコンピュータ実行命令で構成されているコンピュータシステム。
  36. ユーザに提供される置換ページ画像中のコンテンツの量を制限するアクセスルールを有するデータサーバ中のアクセス権利データベースをさらに具備する請求項35記載のコンピュータシステム。
  37. サーチサーバは、抑制されるべきである、または、抑制されるべきでないページ画像中の特徴に対する位置およびサイズ情報を決定するようにさらに構成されている請求項35記載のコンピュータシステム。
  38. サーチサーバは、ブランク画像を発生させることと、位置およびサイズ情報を使用して、非抑制特徴の1つ以上の画像をオリジナルページ画像からブランク画像にコピーすることとによって、置換ページ画像を準備する請求項37記載のコンピュータシステム。
  39. サーチサーバは、オリジナルページ画像中の非抑制特徴の位置に対応する1以上の位置で、非抑制特徴に対するピクセル情報をオリジナルページ画像から置換ページ画像にコピーすることによって、非抑制特徴の画像をコピーする請求項38記載のコンピュータシステム。
  40. サーチサーバは、抑制されるべきでない特徴に対応しない画像情報をオリジナルページ画像から除去することによって、置換ページ画像を準備する請求項35記載のコンピュータシステム。
  41. サーチサーバは、抑制されるべきである特徴に対応する画像情報をオリジナルページ画像から除去することによって、置換ページ画像を準備する請求項35記載のコンピュータシステム。
  42. サーチサーバは、オリジナルページ画像中のバックグラウンド情報をシミュレートするバックグラウンド画像情報を置換ページ画像中に含めるようにさらに構成されている請求項35記載のコンピュータシステム。
  43. サーチサーバは、フォアグラウンドピクセル情報をバックグラウンドピクセル情報と区別することと、抑制されるべき特徴に対応するフォアグラウンドピクセル情報を置換ページ画像から除去することとによって、バックグラウンド画像情報を置換ページ画像中に含めるようにさらに構成されている請求項35記載のコンピュータシステム。
  44. サーチサーバは、後の検索のためにページ画像データベース中に置換ページ画像を記憶するようにさらに構成されている請求項35記載のコンピュータシステム。
  45. サーチサーバは、検索された置換ページ画像が、さらに特徴抑制を受けるオリジナルページ画像であるかのように、検索された置換ページ画像に作用するようにさらに構成されている請求項44記載のコンピュータシステム。
  46. コンテンツのページ中の1つ以上の特徴を抑制する方法において、
    (a)コンテンツのページを取得することと、
    (b)抑制されるべきである、または抑制されるべきでないページ中の1つ以上の特徴を識別することと、
    (c)抑制されるべきでないと識別された特徴のみを含む置換ページを準備することとを含む方法。
  47. 抑制されるべきでない特徴を識別することは、非抑制基準を満たすページ中の1つ以上の特徴を決定することを含む請求項46記載の方法。
  48. 非抑制基準は、ページ画像中のテキストを識別する請求項47記載の方法。
  49. 非抑制基準は、非テキスト対象を識別する請求項47記載の方法。
  50. 非テキスト対象はこれに関連したテキストを有し、非抑制基準は、対象の関連テキストを参照することによって、非テキスト対象を識別する請求項49記載の方法。
  51. 置換ページを準備することは、ブランクページを発生させ、1つ以上の非抑制特徴をオリジナルページからブランクページにコピーすることを含む請求項47記載の方法。
  52. 置換ページを準備することは、抑制されるべきでない特徴に対応しない特徴をオリジナルページから除去することを含む請求項46記載の方法。
  53. 置換ページを準備することは、抑制されるべき特徴に対応する特徴をオリジナルページから除去することを含む請求項46記載の方法。
  54. 抑制されるべき特徴を識別することは、抑制基準を満たすページ中の1つ以上の特徴を決定することを含む請求項46記載の方法。
  55. 抑制基準は、ページ中のテキストを識別する請求項54記載の方法。
  56. 抑制基準は、非テキスト対象を識別する請求項54記載の方法。
  57. 非テキスト対象はこれに関連したテキストを有し、抑制基準は、対象の関連テキストを参照することによって、非テキスト対象を識別する請求項56記載の方法。
  58. 置換ページ中に含むことができるコンテンツの量を制限するアクセスルールを参照することと、アクセスルールにしたがってページ中に残すことができる、ページ中の特徴を識別する情報を決定することとをさらに含む請求項46記載の方法。
JP2006528201A 2003-09-23 2004-09-23 コンテンツのページ中の特徴を抑制する方法およびシステム Active JP4692903B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/668,690 US7149353B2 (en) 2003-09-23 2003-09-23 Method and system for suppression of features in digital images of content
US10/668,690 2003-09-23
PCT/US2004/031358 WO2005032031A2 (en) 2003-09-23 2004-09-23 Method and system for suppression of features in pages of content

Publications (2)

Publication Number Publication Date
JP2007507179A true JP2007507179A (ja) 2007-03-22
JP4692903B2 JP4692903B2 (ja) 2011-06-01

Family

ID=34313541

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006528201A Active JP4692903B2 (ja) 2003-09-23 2004-09-23 コンテンツのページ中の特徴を抑制する方法およびシステム

Country Status (5)

Country Link
US (1) US7149353B2 (ja)
EP (1) EP1678658A4 (ja)
JP (1) JP4692903B2 (ja)
CA (1) CA2538854C (ja)
WO (1) WO2005032031A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014063481A (ja) * 2012-08-30 2014-04-10 Canon Inc クラウドにより支援されるレンダリング

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7133879B1 (en) * 2001-12-28 2006-11-07 Cogentmedicine, Inc. Personalized library interface for providing data to a user
JP4082591B2 (ja) * 2003-05-20 2008-04-30 インターナショナル・ビジネス・マシーンズ・コーポレーション データ編集装置及びプログラム
US7496560B2 (en) * 2003-09-23 2009-02-24 Amazon Technologies, Inc. Personalized searchable library with highlighting capabilities
WO2005031526A2 (en) * 2003-09-23 2005-04-07 Amazon.Com, Inc. Personalized searchable library based on user ownership
US7149353B2 (en) * 2003-09-23 2006-12-12 Amazon.Com, Inc. Method and system for suppression of features in digital images of content
US7627152B2 (en) * 2003-11-26 2009-12-01 Ge Medical Systems Information Technologies, Inc. Image-based indicia obfuscation system and method
US7302116B2 (en) * 2004-02-12 2007-11-27 Xerox Corporation Method and apparatus for reduced size image
US20050210048A1 (en) * 2004-03-18 2005-09-22 Zenodata Corporation Automated posting systems and methods
US20050283840A1 (en) * 2004-06-18 2005-12-22 Daniel Le Metayer Method for the automatic analysis of security requirements of information technology system
JP4385873B2 (ja) * 2004-07-09 2009-12-16 カシオ計算機株式会社 電子カメラおよびプログラム
US20060048051A1 (en) * 2004-08-25 2006-03-02 Research In Motion Limited Method for rendering formatted content on a mobile device
US7702137B2 (en) 2004-11-10 2010-04-20 M2S, Inc. Anatomical visualization and measurement system
US9583141B2 (en) * 2005-07-01 2017-02-28 Invention Science Fund I, Llc Implementing audio substitution options in media works
US20080052104A1 (en) * 2005-07-01 2008-02-28 Searete Llc Group content substitution in media works
US20080086380A1 (en) * 2005-07-01 2008-04-10 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Alteration of promotional content in media works
US20070266049A1 (en) * 2005-07-01 2007-11-15 Searete Llc, A Limited Liability Corportion Of The State Of Delaware Implementation of media content alteration
US20070067850A1 (en) * 2005-09-21 2007-03-22 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Multiple versions of electronic communications
US10853570B2 (en) 2005-10-06 2020-12-01 TeraDact Solutions, Inc. Redaction engine for electronic documents with multiple types, formats and/or categories
US11769010B2 (en) * 2005-10-06 2023-09-26 Celcorp, Inc. Document management workflow for redacted documents
US8949154B2 (en) 2005-10-07 2015-02-03 Google Inc. Content feed user interface with gallery display of same-type items
US8190997B2 (en) * 2005-10-07 2012-05-29 Google Inc. Personalized content feed suggestions page
US20070080475A1 (en) * 2005-10-11 2007-04-12 Wang Hui L Manufacturing method for EVA foam body
US8571320B2 (en) * 2005-12-12 2013-10-29 Core Wireless Licensing S.A.R.L. Method and apparatus for pictorial identification of a communication event
US20070220118A1 (en) * 2006-03-15 2007-09-20 Loyer Douglas E Systems, Methods, and Apparatus for Delivering Randomly Accessible Audio and Video Media
US20070226321A1 (en) * 2006-03-23 2007-09-27 R R Donnelley & Sons Company Image based document access and related systems, methods, and devices
US7788272B2 (en) * 2006-08-04 2010-08-31 Xerox Corporation Document catalog system
US8230361B2 (en) 2006-09-28 2012-07-24 Google Inc. Content feed user interface
US8645497B2 (en) * 2006-09-28 2014-02-04 Google Inc. Bookmark-based access to content feeds
US8694607B2 (en) * 2006-10-06 2014-04-08 Google Inc. Recursive subscriptions to content feeds
JP4752726B2 (ja) * 2006-10-31 2011-08-17 富士ゼロックス株式会社 画像処理装置、画像処理システム、及び画像処理プログラム
US8219374B1 (en) * 2007-02-21 2012-07-10 University Of Central Florida Research Foundation, Inc. Symbolic switch/linear circuit simulator systems and methods
US7702633B2 (en) 2007-03-05 2010-04-20 Microsoft Corporation Previews providing viewable regions for protected electronic documents
US7987516B2 (en) * 2007-05-17 2011-07-26 International Business Machines Corporation Software application access method and system
US8060634B1 (en) 2007-09-26 2011-11-15 Google Inc. Determining and displaying a count of unread items in content feeds
US10025871B2 (en) 2007-09-27 2018-07-17 Google Llc Setting and displaying a read status for items in content feeds
US8533078B2 (en) 2007-12-21 2013-09-10 Celcorp, Inc. Virtual redaction service
US10977614B2 (en) 2008-05-16 2021-04-13 TeraDact Solutions, Inc. Point of scan/copy redaction
KR101500736B1 (ko) * 2008-07-04 2015-03-09 주식회사 엘지유플러스 인터넷 서비스 시스템 및 방법
US8725751B1 (en) * 2008-08-28 2014-05-13 Trend Micro Incorporated Method and apparatus for blocking or blurring unwanted images
US8255820B2 (en) 2009-06-09 2012-08-28 Skiff, Llc Electronic paper display device event tracking
JP5598232B2 (ja) * 2010-10-04 2014-10-01 ソニー株式会社 情報処理装置、情報処理システムおよび情報処理方法
US8904304B2 (en) 2012-06-25 2014-12-02 Barnesandnoble.Com Llc Creation and exposure of embedded secondary content data relevant to a primary content page of an electronic book
US20150339394A1 (en) * 2014-05-20 2015-11-26 Tasty Time, Inc. Extracting Online Recipes, and Arranging and Generating a Cookbook
US20160216859A1 (en) * 2015-01-23 2016-07-28 Kobo Incorporated Creating a list of items from selections of content within an e-book
KR101713197B1 (ko) * 2015-04-01 2017-03-09 주식회사 씨케이앤비 서버 컴퓨팅 장치 및 이를 이용한 콘텐츠 인식 기반의 영상 검색 시스템
CN104978580B (zh) * 2015-06-15 2018-05-04 国网山东省电力公司电力科学研究院 一种用于无人机巡检输电线路的绝缘子识别方法
PL3188036T3 (pl) * 2015-12-30 2019-09-30 Legalxtract Aps Sposób i układ do zapewniania wypisu dokumentu
JP6797610B2 (ja) * 2016-08-31 2020-12-09 キヤノン株式会社 装置、方法、及びプログラム
JP6259962B1 (ja) * 2017-03-30 2018-01-10 株式会社オプティム 遠隔作業支援システム、遠隔作業支援方法およびプログラム
US11698890B2 (en) 2018-07-04 2023-07-11 Monday.com Ltd. System and method for generating a column-oriented data structure repository for columns of single data types
US11317162B2 (en) * 2019-09-26 2022-04-26 Dish Network L.L.C. Method and system for navigating at a client device selected features on a non-dynamic image page from an elastic voice cloud server in communication with a third-party search service
US11775890B2 (en) 2019-11-18 2023-10-03 Monday.Com Digital processing systems and methods for map-based data organization in collaborative work systems
US11829953B1 (en) 2020-05-01 2023-11-28 Monday.com Ltd. Digital processing systems and methods for managing sprints using linked electronic boards
EP4143732A1 (en) 2020-05-01 2023-03-08 Monday.com Ltd. Digital processing systems and methods for enhanced collaborative workflow and networking systems, methods, and devices
US11663300B2 (en) * 2020-10-09 2023-05-30 Capital One Services, Llc Systems and methods for localized file transfer with file degradation
CN112632329A (zh) * 2020-12-18 2021-04-09 咪咕互动娱乐有限公司 视频提取方法、装置、电子设备及存储介质
US11481288B2 (en) 2021-01-14 2022-10-25 Monday.com Ltd. Digital processing systems and methods for historical review of specific document edits in collaborative work systems
US11741071B1 (en) 2022-12-28 2023-08-29 Monday.com Ltd. Digital processing systems and methods for navigating and viewing displayed content
US11886683B1 (en) 2022-12-30 2024-01-30 Monday.com Ltd Digital processing systems and methods for presenting board graphics
US11893381B1 (en) 2023-02-21 2024-02-06 Monday.com Ltd Digital processing systems and methods for reducing file bundle sizes

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232938A (ja) * 1996-12-17 1998-09-02 Honda Motor Co Ltd 画像認識法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5821929A (en) * 1994-11-30 1998-10-13 Canon Kabushiki Kaisha Image processing method and apparatus
JP3504054B2 (ja) * 1995-07-17 2004-03-08 株式会社東芝 文書処理装置および文書処理方法
US6562077B2 (en) * 1997-11-14 2003-05-13 Xerox Corporation Sorting image segments into clusters based on a distance measurement
US6385614B1 (en) * 1998-01-14 2002-05-07 Netlibrary Inc. Electronic bookshelf with multi-user features
US6353831B1 (en) * 1998-11-02 2002-03-05 Survivors Of The Shoah Visual History Foundation Digital library system
US6809741B1 (en) * 1999-06-09 2004-10-26 International Business Machines Corporation Automatic color contrast adjuster
US6449636B1 (en) * 1999-09-08 2002-09-10 Nortel Networks Limited System and method for creating a dynamic data file from collected and filtered web pages
US6496802B1 (en) * 2000-01-07 2002-12-17 Mp3.Com, Inc. System and method for providing access to electronic works
US6961905B1 (en) * 2000-06-23 2005-11-01 Microsoft Corporation Method and system for modifying an image on a web page
US6782144B2 (en) * 2001-03-12 2004-08-24 Multiscan Corp. Document scanner, system and method
TWI253568B (en) * 2001-07-11 2006-04-21 Ulead Systems Inc System and method for filtering out network pornography films
US20030126267A1 (en) * 2001-12-27 2003-07-03 Koninklijke Philips Electronics N.V. Method and apparatus for preventing access to inappropriate content over a network based on audio or visual content
US7149353B2 (en) * 2003-09-23 2006-12-12 Amazon.Com, Inc. Method and system for suppression of features in digital images of content

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232938A (ja) * 1996-12-17 1998-09-02 Honda Motor Co Ltd 画像認識法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014063481A (ja) * 2012-08-30 2014-04-10 Canon Inc クラウドにより支援されるレンダリング

Also Published As

Publication number Publication date
JP4692903B2 (ja) 2011-06-01
EP1678658A4 (en) 2007-10-31
CA2538854C (en) 2014-05-13
EP1678658A2 (en) 2006-07-12
US7149353B2 (en) 2006-12-12
CA2538854A1 (en) 2005-04-07
WO2005032031A2 (en) 2005-04-07
WO2005032031A3 (en) 2005-06-16
US20050063615A1 (en) 2005-03-24

Similar Documents

Publication Publication Date Title
JP4692903B2 (ja) コンテンツのページ中の特徴を抑制する方法およびシステム
JP5323880B2 (ja) 対応する物理的なテキストのユーザ所有権に基づく、強調能力とテキストの電子画像に対するアクセスとを有するパーソナル化サーチ可能ライブラリ
US7542625B2 (en) Method and system for access to electronic version of a physical work based on user ownership of the physical work
US7496560B2 (en) Personalized searchable library with highlighting capabilities
Pomerantz Metadata
Foulonneau et al. Metadata for digital resources: implementation, systems design and interoperability
US8285082B2 (en) Automatic identification of digital content related to a block of text, such as a blog entry
Duff et al. Use of historical documents in a digital world: comparisons with original materials and microfiche
US20130346874A1 (en) User configurable electronic textbook
KR102463120B1 (ko) 문서 다운로드시 사용자 맞춤형 파일명 생성 기능을 제공하는 특허 문서 검색 서버 및 이를 이용한 특허 문서 검색 방법
JP2003108796A (ja) 文書販売システム
Moeller Enhancing access to rare journals: Cover images and contents in the online catalog
Sanders et al. level analytics for journal aggregators
Kowaleski 2020 Medieval Object Assignment and Instructions
Whalen Developing a rights metadata dictionary for digital surrogates
Smith English Broadside Ballad Archive: http://ebba. english. ucsb. edu
Keating et al. A Digital Edition of a Spanish 18th Century Account Book: User Driven Digitisation
Zawadzki The methodological problems of creating a digital thematic repository of historical cartographic and textual sources. Case study
KR20010105106A (ko) 사이버개인서재구축방법 및 사이버개인서재구축시스템
Kichuk Using Consistent Naming Conventions for Library Electronic Resources
Hurley et al. Making of America II Testbed Project
Ammerman OpenBU: Institutional Repository Procedures Manual

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100720

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100727

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100917

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110120

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110125

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20110204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140304

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4692903

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250