JP2006107495A - イメージキャプチャー装置を使った文書検索技術 - Google Patents

イメージキャプチャー装置を使った文書検索技術 Download PDF

Info

Publication number
JP2006107495A
JP2006107495A JP2005282740A JP2005282740A JP2006107495A JP 2006107495 A JP2006107495 A JP 2006107495A JP 2005282740 A JP2005282740 A JP 2005282740A JP 2005282740 A JP2005282740 A JP 2005282740A JP 2006107495 A JP2006107495 A JP 2006107495A
Authority
JP
Japan
Prior art keywords
image
search
search query
text
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005282740A
Other languages
English (en)
Other versions
JP4851763B2 (ja
Inventor
Daja Phillips
フィリップス ダージャ
Piasoru Kurt
ピアソル カート
Wolf Gregg
ウォルフ グレッグ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2006107495A publication Critical patent/JP2006107495A/ja
Application granted granted Critical
Publication of JP4851763B2 publication Critical patent/JP4851763B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

【課題】 イメージキャプチャー装置を使って取り込んだ画像に基づいて電子文書を検索する。
【解決手段】 イメージキャプチャー装置を使ってユーザーが取り込んだ一つまたは複数の画像が検索クエリーに合致する一つまたは複数の文書を取得すべく文書の集合を検索するために使用される。検索によって取得されたその一つまたは複数の文書が次いでユーザーまたは他の何らかの受領者に与えられうる。
【選択図】 図1

Description

本発明は文書検索技術に関するものであり、より詳細にはイメージキャプチャー装置を使って取り込まれた画像に基づいて電子文書を検索する技術に関するものである。
カメラ、カメラ付き携帯電話などのイメージキャプチャー装置の使用は近年広範な使用を見るに至っている。たとえば、携帯電話付属のカメラは世界の多くの地域でありふれたものになりつつある。カメラ付き携帯電話のようなイメージキャプチャー装置はまた、相当な記憶容量、強力な生産性ソフトウェアを走らせる機能、無線ネットワーク機能などをもつ独自の強力なコンピューティング・エンジンになりつつある。そのようなイメージキャプチャー装置の存在および勃興は、情報入力および文書検索の新たな応用を示唆している。
本発明の実施により、イメージキャプチャー装置を使って取り込んだ画像に基づいて電子文書を検索するための技術が与えられる。イメージキャプチャー装置の例としては、カメラ(フィルム・カメラおよびデジタル・カメラの両方)、携帯電話、個人情報端末(PDA:personal data assistant)、ラップトップパソコン、その他の携帯機器でカメラ等のイメージキャプチャー機能を備えたものや、スキャナなどがある。イメージキャプチャー装置を使ってユーザーが取り込んだ一つまたは複数の画像は、電子文書の集合を検索して、取り込んだ画像に対応する一つまたは複数の電子文書を取得するのに使われる。そしてその一つまたは複数の取得された電子文書はユーザーまたは他の何らかの受領者に与えられうる。
本発明のある実施形態によると、電子文書を検索するための技術が提供される。イメージキャプチャー装置を使って取り込まれた画像が受信される。その受信された画像の内容が抽出される。その抽出された内容に基づいて検索クエリーが形成され、その検索クエリーを満たす第一の電子文書を同定するために複数の電子文書が検索される。
本発明の別の実施形態によると、電子文書を検索するための技術が提供される。イメージキャプチャー装置を使って取り込まれた第一の画像が受信される。その第一の画像の内容が抽出される。その第一の画像の抽出された内容に基づいて検索クエリーが形成され、その検索クエリーを満たす一つまたは複数の電子文書を含む電子文書の第一の集合を同定するために検索が実行される。前記電子文書の第一の集合が所定数の電子文書を含んでいるかどうかが決定される。前記電子文書の第一の集合が前記所定数の電子文書を含んでいない場合には第二の画像が要求される。その第二の画像の内容が抽出される。その第二の画像の抽出内容に基づいて検索クエリーが形成される。その第二の画像の抽出内容に基づく検索クエリーを満たす一つまたは複数の電子文書を含む電子文書の第二の集合を同定するために検索が実行される。
本発明のさらに別の実施形態によると、電子文書を検索するための以下のような技術が提供される。イメージキャプチャー装置を使って取り込まれた第一の画像が受信される。その第一の画像の内容が抽出される。その第一の画像の抽出された内容に基づいて検索クエリーが形成される。その第一の画像の抽出内容に基づいて形成された検索クエリーを使って検索が実行される。(a)検索によって少なくとも一つの電子文書も同定されなかった場合には別の画像が要求される。(b)別の画像が受信される。(c)前記別の画像の内容が抽出される。(d)前記別の画像の抽出内容に基づいて検索クエリーが形成される。(e)前記別の画像の抽出内容に基づいて形成された前記検索クエリーを使って検索が実行される。検索によって前記検索クエリーを満たす電子文書が少なくとも一つ同定されるまで(a)(b)(c)(d)(e)が繰り返される。
本発明のさらに別の実施形態によると、電子文書を検索するための以下のような技術が提供される。イメージキャプチャー装置を使って取り込まれた画像が受信される。画像処理技術を使ってその画像から複数のテキスト・パターンが抽出される。前記複数のテキスト・パターンからテキスト・パターンの部分集合が選択される。その際、前記複数のテキスト・パターンのうち少なくとも一つのテキスト・パターンは該部分集合に含まれないものとする。前記テキスト・パターンの部分集合に基づいて検索クエリーが形成される。その検索クエリーを満たす第一の電子文書を同定するために複数の電子文書が検索される。
本発明のさらに別の実施形態によると、電子文書を検索するための以下のような技術が提供される。イメージキャプチャー装置を使って取り込まれた画像が受信される。画像処理技術を使ってその画像から複数のテキスト・パターンが抽出される。前記複数のテキスト・パターンからテキスト・パターンの第一の部分集合が選択される。その際、前記複数のテキスト・パターンのうち少なくとも一つのテキスト・パターンは該第一の部分集合に含まれないものとする。前記テキスト・パターンの第一の部分集合に基づいて検索クエリーが形成される。その検索クエリーを満たす第一の電子文書を同定するために複数の電子文書が検索される。前記テキスト・パターンの第一の部分集合に基づいて形成された前記検索クエリーを使って検索が実行される。前記テキスト・パターンの第一の部分集合を使って実行した検索によって少なくとも一つの電子文書も同定されなかった場合には前記複数のテキスト・パターンからテキスト・パターンの第二の部分集合が選択される。前記テキスト・パターンの第二の部分集合に基づいて検索クエリーが形成される。前記テキスト・パターンの第二の部分集合に基づいて形成された検索クエリーを使って検索が実行される。
上記のことならびに本発明の他の特徴、実施形態および利点は以下の明細、特許請求の範囲および付属の図面を参照することによってより明らかとなるであろう。
以下の記述において、説明の目的のため、本発明の深い理解を与えるための特定の詳細が述べられるが、本発明がそうした特定の詳細なしでも実践できることは明らかであろう。
本発明の実施により、イメージキャプチャー装置を使って取り込んだ画像に基づいて電子文書を検索するための技術が与えられる。イメージキャプチャー装置の例としては、カメラ(フィルム・カメラおよびデジタル・カメラの両方)、携帯電話、個人情報端末(PDA:personal data assistant)、ラップトップパソコン等の機器にイメージキャプチャー装置を備えたもの、スキャナなどがある。一般に、イメージキャプチャー装置は画像を取り込む機能のあるいかなる装置であってもよい。イメージキャプチャー装置を使ってユーザーが取り込んだ一つまたは複数の画像は、電子的に保存されている文書(「電子文書」)の集合を検索して取り込んだ画像に対応する一つまたは複数の電子文書を取得するのに使われる。そして取り込み画像に対するその一つまたは複数の取得された文書はユーザーまたは他の何らかの受領者に与えられうる。
図1は、本発明の実施形態を組み込みうるシステム100の概略的なブロック図である。図1は本発明を組み込んだ実施形態を単に解説するものであって、特許請求の範囲において述べられている本発明の範囲を限定するものではない。通常の技量をもった当業者であれば他の変形、修正、代替を認識することであろう。
ユーザーはイメージキャプチャー装置102を画像104を取り込むのに使うことができる。図1に示したように、そのユーザーは紙の文書106のページ(またはページの部分)の画像104を取り込むことができる。紙の文書は紙媒体上に印刷されたいかなる文書であってもよい。イメージキャプチャー装置102の例としては、カメラ、イメージキャプチャー機能のある携帯電話などがある。取り込まれた画像は紙の文書の全内容でもよいし、その一部分でもよい。景色や物体などの像といった他の種類の画像もイメージキャプチャー装置102を使って取り込み、本発明の思想に従って使うことができることは明らかであろう。
ある実施形態では、イメージキャプチャー装置102は画像104を処理して、画像104に基づく検索クエリーを形成し、この検索クエリーを検索エンジン108に送信する。そして、検索エンジン108を使って該検索クエリーを満たす一つまたは複数の電子文書をみつけるべく検索を実行するよう構成することができる。前記検索クエリーは通信ネットワーク110を通じて検索エンジンに送信されてもよい。別の実施形態では、処理の一部は別のサーバー105またはシステムによって実行されてもよい。たとえば、図1に示したように、イメージキャプチャー装置102は画像104をサーバー105またはシステムに通信ネットワーク110を通じて送信してもよい。この場合、サーバー105またはシステムは、送信された画像104を処理して、該画像104に基づく検索クエリーを形成し、検索エンジン108を使って該検索クエリーを満たす一つまたは複数の電子文書をみつけるべく検索を実行するよう構成することもできる。
通信ネットワーク110は、ローカルエリアネットワーク(LAN:local area network)、広域ネットワーク(WAN:wide area network)、無線ネットワーク、イントラネット、インターネット、私設ネットワーク、公共ネットワーク、交換ネットワーク(switched network)その他いかなる好適な通信ネットワークでもよい。通信ネットワーク110は多くの相互接続されたシステムおよび通信リンクを含むことができ、有線リンク、光学リンク、衛星その他の無線通信リンク、波動リンク(wave propagation link)その他いかなる情報通信機構でもよい。通信ネットワーク110を通じた情報通信を助けるためにさまざまな通信プロトコルを使うことができ、その中にはTCP/IPプロトコル、HTTPプロトコル、拡張マークアップ言語(XML:extensible markup language)、無線アプリケーションプロトコル(WAP:wireless application protocol)、業界標準団体によって開発途上の諸プロトコル、販売元固有の諸プロトコル、カスタマイズされた諸プロトコル、などが含まれる。画像の伝送は、JPEG、GIF、PNG、TIFF、JPEG2000など多数ある標準ファイルフォーマットのうちのいずれで行ってもよい。
たとえば、ある実施形態では、通信ネットワーク110は無線ネットワークでよい。ユーザーはイメージキャプチャー装置の一例である携帯電話に備えられたイメージキャプチャー機能の1つであるカメラを使って画像104を取り込み、その画像を処理して検索クエリーを形成し、その検索クエリーを検索エンジン108に(あるいは検索エンジンのサービスを提供するサーバー105に)前記無線ネットワークを通じて送信する。いくつかの実施形態では、イメージキャプチャー装置102(例えば、カメラ付き携帯電話)によって取り込まれた複数の画像がサーバー105に送信されうる。
検索実行のためには、一つまたは複数の検索エンジン108を利用しうる。検索エンジン108はイメージキャプチャー装置102から、あるいはサーバー105から検索クエリーを受信し、該検索クエリーを満たす一つまたは複数の電子文書を同定すべく電子文書112の集合を検索することができる。検索は一つまたは複数の検索エンジン108が共同して行ってもよい。検索エンジン108は、該検索エンジンが直接、あるいは通信ネットワーク110を介してアクセスできる電子文書を検索するように構成されていてもよい。たとえば、検索エンジンは、コンテンツ提供者によって提供され、インターネットを通じて利用可能な文書(たとえばウェブページ)を検索するよう構成することができる。検索された文書はまた、企業、事務所、学校、政府機関などの組織のために作成され、保存されている文書を含んでいてもよい。検索エンジンの例としては、グーグル(商標)検索エンジン、事業所や企業などの組織によって提供される検索エンジン、ヤフー(商標)検索エンジンその他がある。
電子文書112の集合から一つまたは複数の電子文書が検索エンジン108によって検索クエリーを満たす、あるいは合致すると同定されると、次いで当該ユーザーまたは他の何らかの受領者に提供される。ある実施形態では、検索によって得られた電子文書114は、その検索の入力として使われた画像を取り込むのに使われたイメージキャプチャー装置に送信されうる。たとえば、図1に示すように、検索エンジンによって同定された電子文書114は無線ネットワークでイメージキャプチャー装置102に送信されうる。得られた電子文書114は次いで当該ユーザーに、イメージキャプチャー装置102の上で実行されるアプリケーション(たとえば、ブラウザ、ワープロソフト)を介して表示部等から出力されることができる。
検索によって取得される電子文書114はまた、当該イメージキャプチャー装置以外の何らかの目的地116に向けて送信することによってユーザーへ提供することもできる。たとえば、取得された文書は電子メールによってそのユーザーの受信箱または電子メールアドレスに送信されることができる。同様にして、取得された電子文書114をユーザーに提供するためには、文書送達先116を利用して、さまざまな目的地や配信ルートを使用することができる。検索された文書をユーザーに送信するのは、ウェブページ、HTMLフォーマット、アドビPDFファイル、マイクロソフトワード文書など異なるさまざまなフォーマットで行ってよい。取得された電子文書114はまた、他の人物、システム、アプリケーションなどといった他の受領者に提供されることもできる。
図2は、本発明のある実施形態に基づく、イメージキャプチャー装置102で取り込まれた画像に基づいて電子文書を検索する方法を描いた概略的なフローチャートである。図2に描かれている方法は、プロセッサ、ハードウェアモジュールまたはその組み合わせによって実行されるソフトウェアコードモジュールまたは命令によって実行することができる。図2に描かれているフローチャート200は本発明のある実施形態を単に解説するものであって、本発明の範囲を限定することを意図したものではない。図2に描かれている方法は、異なる実装上の制約下で機能するよう改変することができる。
図2に描かれているように、このフローチャートの処理は、イメージキャプチャー装置102で取り込まれた画像を受信する、あるいは取得することで開始される(ステップ202)。画像の解像度や品質はその画像の取り込みに使われたイメージキャプチャー装置および画像取り込みされた対象物の解像度や品質によって変わりうる。画像の取り込みにはさまざまなイメージキャプチャー装置を使うことができる。
次いで、一つまたは複数の画像処理技術を適用することによって取り込まれた画像の内容(またはその一部)が抽出される(ステップ204)。抽出された内容はテキスト・パターン(たとえば単語、フレーズ)、画像オブジェクト、その他のオブジェクトを含みうる。ある実施形態では、光学的文字認識(OCR:optical character recognition)技術を使って取り込まれた画像から文字が抽出される。
次いで、ステップ204で抽出された内容からテキスト・パターンの集合が決定される(ステップ206)。テキスト・パターンは単語やフレーズなどである。ある実施形態では、当該画像の内容から抽出された各テキスト行がテキスト・パターンとして扱われる。テキスト・パターンを決定するためにはさまざまな技術が用いられうる。ある実施形態では、ステップ204で受け取ったOCR結果に対して単語フィルタが適用されて、語彙集(たとえば英語の辞書)にない文字や単語や記号が排除される。この方法により、句読点や読み取れない記号、無効な単語などがステップ204で抽出されていても排除、すなわちフィルタ除去される。ステップ206では、ステップ204で抽出されたテキスト・パターンからテキスト/パターンの集合を作成する。いくつかの実施形態では、ステップ204および206はテキスト・パターンが取り込まれた画像から抽出される単一のステップに組み合わされてもよい。
次いで、ステップ206で決定されたテキスト・パターンの集合に基づいて検索クエリーが形成される(ステップ208)。ある実施形態では、検索クエリーは206で決定されたテキスト・パターンの結合により形成される。たとえば、テキスト・パターンはブール演算子and(すなわち、集合の交わりの演算)を使って結合されて形成される。このようにステップ208では、検索エンジン108に適したように検索クエリーが形成される。他の実施形態では、のちにさらに詳細に記載するように、検索クエリーに206で得られたテキスト・パターンの部分集合を取り込むこともできる。
次いで、ステップ208で形成された検索クエリーを使って、その検索クエリーを満たす電子文書を同定すべく検索が行われる(ステップ210)。複数のテキスト・パターンを結合することによって形成される検索クエリーについて、ある文書がその検索クエリーを満たすとは、全部のテキスト・パターンを含んでいるということである。ある電子文書が検索クエリーを満たすとは、その検索クエリーの条件を全部満たすということである。検索クエリーを使ってステップ210で検索を実行するのには、一つまたは複数の検索エンジン108を使うことができる。検索の実行には、グーグル(商標)などのようなさまざまな異なる種類の検索エンジンを使うことができる。検索対象とされる文書の集合は使用する検索エンジンによっても変わりうる。ステップ210において決定される文書の集合は一つまたは複数の電子文書を含んでいることもある。あるいはまた、検索された電子文書の集合内の文書で検索クエリーを満たすものがなければなんらの文書も返されないこともある。
次いで、ステップ210における検索から得られた文書の集合が受領者に提供される(ステップ212)。受領者は人間、システム、アプリケーションその他の実体でありうる。文書の集合を受領者に提供するためにはさまざまな技術を用いることができる。たとえば、文書の集合はステップ202で受信した画像の取り込みに使われたイメージキャプチャー装置のユーザーにイメージキャプチャー装置やその他の情報処理装置を介して伝達(提示)されることができる。取得された文書の集合をユーザーに提供するためにはさまざまな異なる技術を使うことができる。ある実施形態では、取得された文書は検索の入力として使われた画像の取り込みにユーザーによって使われたイメージキャプチャー装置に送信されてもよい。それで取得された電子文書が当該イメージキャプチャー装置の上で実行されるアプリケーション(たとえば、ブラウザ、ワープロソフトなど)を使っているユーザーに提供されうる。取得された文書の集合はまた、当該イメージキャプチャー装置以外の何らかの目的地に文書送達先116に基づいて文書を届ける(送信する)ことによってユーザーに提供されてもよい。たとえば、取得された文書の集合を含む電子メールがユーザーの受信箱または電子メールアドレスに送信されるのでもよい。検索によって取得された文書を提供するためには、さまざまな他の目的地や配送ルートを文書送達先116に基づいて使用することができる。目的地や配送技術をユーザーが文書送達先116にて設定できるようになっていてもよい。
図2に描かれている処理は、画像受信に際して自動的に実行されるようになっていてもよい。ある実施形態では、イメージキャプチャー装置102は、画像を取り込んでその画像を後続の処理を実行するサーバー105に送信するのに使うことができる。サーバー105はその画像を処理し、検索クエリーを形成し、その検索クエリーを満たす文書を同定すべく検索エンジン108を利用するよう構成されていることもできる。他の実施形態では、イメージキャプチャー装置は図2に描かれている処理ステップの一部または全部を実行するのに十分な演算機能を有していることもある。たとえば、画像を取り込むことに加えて、イメージキャプチャー装置102は予め備えているOCR技術を適用して画像から画像内容を抽出し、テキスト・パターンの集合を決定し、検索クエリーを該テキスト・パターンに基づいて形成し、そして該検索クエリーを満たす電子文書をみつけるべく検索エンジンを利用する。検索エンジンによって同定された電子文書は次いで、当該イメージキャプチャー装置または文書送達先116に基づいて他の何らかの目的地に送信されることができる。したがって、イメージキャプチャー装置の処理能力いかんによって、図2に描かれている処理はイメージキャプチャー装置もしくはサーバーまたはその両方によって実行されうるのである。
図2に描かれている処理は次の例によって例解できる。図3に示す画像300が検索の入力として受信されたとする。画像300は、携帯電話のカメラのようなイメージキャプチャー装置を使って取り込まれるなどしたデジタル化された画像である。図3から見て取れるように、画像300は低品質であり、若干の単語を拾うことができるのみである。画像300にOCRを適用したときの出力はたとえば次のようになるだろう。
~,~.r~.....Camera phones can
~"~....be channels for viral
,~,:.....marketing,where~,~,.~
consumers convert
~,,,,~.....their friends to new
OCR出力に単語フィルタを適用すると、各行は次のようなフレーズ(テキスト・パターン)を獲得することができる。
“Camera phones can”
“be channels for viral”
“marketing where”
“consumers convert”
“their friends to new”
すると検索クエリーが全テキスト・パターン(テキスト・パターンの集合)を結合して形成される。検索クエリーはたとえば次のようになる。
“Camera phones can”AND“be channels for viral”AND“marketing where”AND“consumers convert”AND“their friends to new”
次いでこの検索クエリーが、該検索クエリーを満たす電子文書の集合を取得すべくグーグル(商標)などの検索エンジンに提供される。次いで取得された電子文書の組がユーザーに提供される。
ある場合には検索クエリーを適用することによって文書が一つも取得できないということもありうる。これは検索条件を含む文書が検索対象とされた文書の集成(つまり、検索対象の検索データベース等)に含まれていなかった場合に起こりうる。その他には、検索のために与えられた画像があまりに低品質でその画像からテキスト・パターンが正確に抽出できないような場合、抽出されたテキスト・パターンが不正確で、そのため不正確な検索クエリーを生じることになりうる。画像品質の悪さや画像から内容を抽出するのに使われる画像処理技術の不十分さによって起こりうる誤りを補償するため、フィードバックループを設け、適合する文書をみつける可能性を高めるためにユーザーが検索のための追加情報を提供できるようにしてもよい。
図4は、本発明のある実施形態に基づく、フィードバックループを含む、取り込まれた画像に基づいて電子文書を検索する方法を描いた概略的なフローチャート400である。図4で描かれている方法は、プロセッサ、ハードウェアモジュールまたはその組み合わせによって実行されるソフトウェアコードモジュールまたは命令によって実行することができる。図4に描かれているフローチャート400は本発明のある実施形態を単に解説するものであって、本発明の範囲を限定することを意図したものではない。本発明の範囲内には他の変形、修正、代替もある。図4に描かれている方法は、異なる実装上の制約下で機能するよう改変することができる。図4で描かれている処理は、イメージキャプチャー装置102もしくはサーバー105またはその両方が検索エンジン108を使って実行することができる。
図4に描かれているように、処理は取り込まれた画像を受信する、あるいは取得することで開始される(ステップ402)。次いで、OCR技術のような一つまたは複数の画像処理技術を取り込まれた画像に適用することによって取り込まれた画像の内容(またはその一部)が抽出される(ステップ404)。次いで、ステップ404で抽出された内容からテキスト・パターンの集合が決定される(ステップ406)。次いで、406で決定されたテキスト・パターンに基づいて検索クエリーが形成される(ステップ408)。次いで、408で形成された検索クエリーを使って検索が行われる(ステップ410)。図4のステップ402、404、406、408、410において描かれている処理は、前述した図2のステップ202、204、206、208、210において描かれている処理と同様である。
検索クエリーを使った検索を走らせることによって電子文書の集合が取得されたのち、その検索の結果として少なくとも一つの文書(すなわち、その検索クエリーについての少なくとも一つのヒット)が取得されたかどうかの検査がなされる(ステップ412)。412において少なくとも一つの文書が取得された文書の集合内に含まれていると判定されたら、取得された文書が次いで受領者に提供されることができる(ステップ414)。受領者は人間、システム、アプリケーションその他の実体でありうる。文書の集合を受領者に提供するためにはさまざまな技術を用いることができる。たとえば、文書の集合は402で受信した画像の取り込みに使われたイメージキャプチャー装置のユーザーにイメージキャプチャー装置やその他の情報処理装置を介して伝達(提示)されることができる。その文書の集合をそのユーザーに提供するためにはさまざまな技術を使うことができる。
他方、ステップ412において、その検索でただ一つの電子文書も取得されなかったと判定された場合、ユーザーは検索の入力として使われる別の画像を提供するよう求められる(ステップ416)。別の画像の取得後(ステップ418)、処理は次いで、418で取得した新しい画像を用いてステップ404から続けられる。そして新たに取得された画像から形成された検索クエリーに基づく新たな検索が実行される。このようにして、ユーザーが検索のための追加の画像を提供することができるフィードバックループが設けられる。フィードバックループは検索によって少なくとも一つの電子文書が同定されるまで反復される。
追加の画像はもとの画像と同じ内容のものであってもよいし、異なる内容のものであってもよい。このような構成により、同定しうる電子文書を獲得することが容易となる。たとえば、第一の画像が紙の文書として印刷された文章のページの一部であった場合、提供される第二の画像は、その文章の別の部分の画像でもよいし、第一の画像と同じ部分だが第一の画像よりも画質がよくなるように取り込まれたものであってもよい。
上述したように、ある場合には検索クエリーの適用から取得される文書の集合が複数の文書(すなわち、複数ヒット)を含んでいることも可能である。これは、取得された集合がいくつかの文書を含んでいる場合には特に、ユーザーにとって不都合でありうる。取得される電子文書の数を減らすために使うことのできる追加情報をユーザーが与えることができるようにするフィードバックループを設けることができる。
図5は、本発明のある実施形態に基づく、取得される文書数を減らすためのフィードバックループを含む、取り込まれた画像に基づいて電子文書を検索する方法を描いた概略的なフローチャート500である。図5で描かれている方法は、プロセッサ、ハードウェアモジュールまたはその組み合わせによって実行されるソフトウェアコードモジュールまたは命令によって実行することができる。図5に描かれているフローチャート500は本発明のある実施形態を単に解説するものであって、本発明の範囲を限定することを意図したものではない。本発明の範囲内には他の変形、修正、代替もある。図5に描かれている方法は、異なる実装上の制約下で機能するよう改変することができる。図5で描かれている処理は、イメージキャプチャー装置102もしくはサーバー105またはその両方が検索エンジン108を使って実行することができる。
図5に描かれているように、処理は取り込まれた画像を受信する、あるいは取得することで開始される(ステップ502)。次いで、OCR技術のような一つまたは複数の画像処理技術を取り込まれた画像に適用することによって取り込まれた画像の内容(またはその一部)が抽出される(ステップ504)。次いで、ステップ504で抽出された内容からテキスト・パターンの集合が決定される(ステップ506)。次いで、506で決定されたテキスト・パターンに基づいて検索クエリーが形成される(ステップ508)。次いで、508で形成された検索クエリーを使って検索が行われる(ステップ510)。図5のステップ502、504、506、508、510において描かれている処理は、前述した図2のステップ202、204、206、208、210において描かれている処理と同様である。
検索クエリーを使った検索から電子文書の集合が取得されたのち、その取得された電子文書の集合に含まれている文書がちょうど一つ(すなわち、その検索クエリーについてぴったり一つのヒット)であるかどうかの検査がなされる(ステップ512)。ステップ512においてただ一つの文書が検索によって返されたと判定されたら、その一つの文書が次いで受領者に提供される(ステップ514)。受領者は人間、システム、アプリケーションその他の実体でありうる。その電子文書を受領者に提供するためにはさまざまな技術を用いることができる。たとえば、その文書は502で受信した画像の取り込みに使われたイメージキャプチャー装置のユーザーにイメージキャプチャー装置やその他の情報処理装置を介して伝達(提示)されることができる。その電子文書をそのユーザーに提供するためにはさまざまな技術を使うことができる。
他方、ステップ512において、その検索に反応して複数の電子文書が取得されたと判定された場合、ユーザーは、取得される文書の数を減らすための検索のための入力として使われる別の画像を提供するよう求められる(ステップ516)。別の画像の取得後(ステップ518)、処理は次いで、518で取得した新しい画像を用いてステップ504から続けられる。506では新しい画像からのテキスト・パターンが得られる。508では新たに得た画像に基づいて新たな検索クエリーが形成される。ある実施形態では、508で、先に適用された検索クエリーが516で取得された画像から抽出されたテキスト・パターンを用いて増長される(あるいは、先の画像と新しい画像から抽出されたテキスト・パターンの何らかの組み合わせを使って検索クエリーが形成される)。このようにして、新しい、潜在的により精密な検索クエリーが508において形成される。増長された検索クエリーは次いで510で実行される。この処理は、新たに増長された検索クエリーの条件に適合して検索される電子文書がただ一つになるまで反復される。508において、別の実施形態では、新しい検索クエリーは518で新たに受信した画像から抽出されるテキスト・パターンのみに基づいて(すなわち、先の検索パターンは使わずに)形成される。そして508で形成された新しい検索クエリーが510で実行される。
このようにして、取得される文書の集合に含まれる電子文書の数を絞り込むため、追加の画像という形でユーザーが追加情報を提供することができるフィードバックループが設けられる。追加の画像は先の画像と異なる内容の画像であってもよいし、同じ内容のものであってさえもよい。たとえば、最初の画像が紙に印刷された文章のページの一部であった場合、提供される第二の画像は、その記事の別の部分の画像でもよい。上述した図5に描かれているフローチャート500では、ステップ512で実行される検査には1文書(1ヒット)という閾値が用いられている。別の実施形態では、検査は何らかの所定の閾値を使って実行すればよく、閾値はユーザーが設定できるようになっていてもよい。このように、適宜に増長や除くキーワードなどを設定された検索クエリーを用いて、取得される文書の集合に含まれる電子文書の数を所定の閾値を使って絞込みを行うことができる。
検索を実行するためにさまざまな検索エンジンを使うことができる。しかし、多くの検索エンジンは、一つの検索クエリーにおいて一度に使うことのできる語やパターンの数を制限している。たとえば、グーグル(商標)はクエリーにおける検索語の数を10で打ち切っている。これは、この検索エンジン108が用いるデータベースから一意的にある文書を同定するにはその数で十分であると判断しているためである。上述したように、十分な解像度の画像からはいくつかのテキスト・パターン(たとえば11以上)が抽出されうる。しかし、検索エンジンがクエリー中の語数を制限しているとすると、検索クエリーにおいて抽出されたテキスト・パターンのすべてを使うことはできないこともありうる。この状況を救うため、いくつかのパターン/語選択技術を使って検索に使われるテキスト・パターンの部分集合を選択することができる。さらに、たとえ検索クエリーにおける語数に制限がないとしても、検索の精度と信頼性を向上させるような語を選択するために前記選択技術を使うことができる。選択技術はまた、取得される文書の集合に含まれる文書の数を減らすのにも使われうる。
図6は、本発明のある実施形態に基づく、抽出されたテキスト・パターンの部分集合を使う、取り込まれた画像に基づいて電子文書を検索する方法を描いた概略的なフローチャート600である。図6で描かれている方法は、プロセッサ、ハードウェアモジュールまたはその組み合わせによって実行されるソフトウェアコードモジュールまたは命令によって実行することができる。図6に描かれているフローチャート600は本発明のある実施形態を単に解説するものであって、本発明の範囲を限定することを意図したものではない。本発明の範囲内には他の変形、修正、代替もある。図6に描かれている方法は、異なる実装上の制約下で機能するよう改変することができる。図6で描かれている処理は、イメージキャプチャー装置もしくはサーバーまたはその両方が検索エンジンを使って実行することができる。
図6に描かれているように、処理は取り込まれた画像を受信する、あるいは取得することで開始される(ステップ602)。次いで、OCR技術のような一つまたは複数の画像処理技術を取り込まれた画像に適用することによって取り込まれた画像の内容(またはその一部)が抽出される(ステップ604)。次いで、ステップ604で抽出された内容からテキスト・パターンの集合が決定される(ステップ606)。
次いで、ステップ606で決定されたテキスト・パターンの集合からテキスト・パターンの部分集合が選択される(ステップ608)。その部分集合に含まれるテキスト・パターンの数は、ステップ606において決定されるテキスト・パターンの数より少ないものとする(すなわち、ステップ606で決定されたテキスト・パターンの集合に、この部分集合に含まれないテキスト・パターンが少なくとも一つ含まれている)。ステップ608で部分集合に含めるテキスト・パターンを選出するのにはさまざまな異なる技術が使われうる。部分集合に含めるテキスト・パターンはテキスト・パターンの、あるいはそれに関連付けられたさまざまな属性に基づいて選択することができる。第一の技法では、部分集合に含めるテキスト・パターンはステップ606で決定されたテキスト・パターンの集合から無作為に選ばれる。別の技法では、テキスト・パターンはその長さに基づいて選ばれる。たとえば、より長いテキスト・パターンがより短いテキスト・パターンよりも優先して選ばれるなどである。部分集合に含めるテキスト・パターンを選ぶのに幾何学パターンが使われることもある。
別の技法では、テキスト・パターンはそのテキスト・パターンに関連付けられた信頼度データに基づいて選ばれる。この実施形態では、ステップ604で適用される画像処理技術(たとえばOCRエンジン)は抽出されたテキスト・パターンのそれぞれに信頼度データを関連付けるよう構成されうる。このテキスト・パターンの信頼度データとは、テキスト・パターンを抽出するのに用いられた画像処理技術がそのテキスト・パターンの内容に関して正しい結論に達している可能性の尺度である。テキスト・パターンに割り当てられる信頼度データにはさまざまな要因が影響する。たとえば、画像処理プログラムは、画像データにきわめてノイズが多かったと気づいてその画像データから抽出されたそのテキスト・パターンの信頼度を下げるということもありうる。別の例としては、画像処理技術が、あるテキスト・パターンに含まれる文字のうちに数字の1と視覚的に区別しにくいことで悪名高い小文字のl(英小文字のエル)が含まれていることに気づいてそのテキスト・パターンに関連付けられた信頼度データが下げられることもありうる。信頼度データに基づくと、608で決定される部分集合には、認識時の信頼度データが高いテキスト・パターンが最初に取り入れられる。このように、テキスト・パターン毎に信頼度データがOCR処理時に付与され、各々のテキスト・パターンには信頼度データが対応付けられる。この信頼度データの高低により、テキスト・パターンの認識の程度を把握することができる。
次いで、ステップ608で決定されたテキスト・パターンの部分集合に基づいて検索クエリーが形成される(ステップ610)。ある実施形態では、検索クエリーは608で決定されたテキスト・パターンを結合することによって形成される。次いで、610で形成された検索クエリーを満たす電子文書を同定すべく検索エンジン108を用いて検索が行われる(ステップ612)。
その検索から取得された電子文書の集合に含まれている文書がちょうど一つ(すなわち、その検索クエリーについてぴったり一つのヒット)(この数はユーザーが設定できる)であるかどうか、あるいは検索で取得された文書がなかった(すなわち、検索で該当するものがなかった)かどうかの検査がなされる(ステップ614)。ステップ614においてただ一つの文書が取得された文書の集合に含まれていると判定されたら、その一つの文書が次いで受領者に提供されて(ステップ616)処理は終了する。受領者は人間、システム、アプリケーションその他の実体でありうる。その電子文書を受領者に提供するためにはさまざまな技術を用いることができる。たとえば、その文書は502で受信した画像の取り込みに使われたイメージキャプチャー装置のユーザーにイメージキャプチャー装置やその他の情報処理装置を介して伝達(提示)されることができる。その電子文書をそのユーザーに提供するためにはさまざまな技術を使うことができる。
他方、ステップ614において、その検索によって複数の電子文書が取得されたか、あるいは取得された文書がなかったと判定された場合、処理はステップ608から続けられ、ここで606で決定されたテキスト・パターンの集合からテキスト・パターンの別の部分集合が決定される。新たに選択された部分集合のテキスト・パターンは先に選択された部分集合のテキスト・パターンと異なっていてもよい(しかし、両部分集合の間に重なりがあってもよい)。たとえば、処理の初回パスで信頼度データの最も高いテキスト・パターンが選択され、次に二回目のパスで信頼度データの高低に基づく次のテキスト・パターンの集合が選択されるのでもよい。他のさまざまな選択技術もまた使うことができる。このように信頼度データの高低に基づいて、さまざまな信頼度データの高低を織り交ぜながら、または信頼度データを高い順に選択して、テキスト・パターンを集合を選択するようにしてもよい。
処理は次いで608において決定された部分集合を使ってステップ610に進む。このようにして、606において決定されたテキスト・パターンの集合から選ばれるテキスト・パターンを使って検索が反復的に実行されうる。各反復はテキスト・パターンの異なる部分集合を検索に使ってもよい。そのような反復的な手法にはいくつかの利点があり、そのうちには該当が得られなかったり得られた該当が多すぎたりする場合に画像を撮影しなおさなければならない回数を減らすことが含まれる。この処理は、検索クエリーに反応して返される電子文書がちょうど一つになるまで反復される。
本発明の個別の実施形態においては、図6で描かれている処理は、画像内容から抽出されたテキスト・パターンの数が、検索を実行するのに使われる検索エンジンによって検索クエリー中に許される語数を超えている場合にのみ、実行するようにできる。たとえば、ステップ608より前に抽出されたテキスト・パターンの数が検索エンジンによって許される検索語数を超えているかどうかを判定する検査を行うようにすることができる。この実施形態では、テキスト・パターンの部分集合の選択が行われるのは、抽出されたテキスト・パターンの数が許容される検索語数を越えていると判定した際のみとできる。そうでない場合には抽出されたテキスト・パターンをすべて検索クエリーに使えばよい。このような構成により、検索エンジンに適合した検索クエリーを形成することができる。
図1に示し、上で述べたように、検索を実行するにはいくつかの検索エンジンが利用できる。そのいくつかの利用可能な検索エンジンのうちから検索を実行するために使われる一つまたは複数の検索エンジンを決定するには、さまざまな技術を用いることができる。図7は、本発明のある実施形態に基づく、選択された一つまたは複数の検索エンジンを使う、取り込まれた画像に基づいて電子文書を検索する方法を描いた概略的なフローチャート700である。図7で描かれている方法は、プロセッサ、ハードウェアモジュールまたはその組み合わせによって実行されるソフトウェアコードモジュールまたは命令によって実行することができる。図7に描かれているフローチャート700は本発明のある実施形態を単に解説するものであって、本発明の範囲を限定することを意図したものではない。本発明の範囲内には他の変形、修正、代替もある。図7に描かれている方法は、異なる実装上の制約下で機能するよう改変することができる。図7で描かれている処理は、イメージキャプチャー装置102もしくはサーバー105またはその両方が検索エンジン108を使って実行することができる。
図7に描かれているように、処理は取り込まれた画像を受信する、あるいは取得することで開始される(ステップ702)。次いで、OCR技術のような一つまたは複数の画像処理技術を取り込まれた画像に適用することによって取り込まれた画像の内容(またはその一部)が抽出される(ステップ704)。次いで、ステップ704で抽出された内容からテキスト・パターンの集合が決定される(ステップ706)。次いで、706で決定されたテキスト・パターンまたは該テキスト・パターンの部分集合を使って検索クエリーが形成される(ステップ708)。
次いで検索を実行するために、検索エンジン(または複数の検索エンジン)が選択される(ステップ710)。その検索エンジンは、検索を実行するために利用可能な複数の検索エンジンから選択することができる。どの検索エンジンを使うかを決定するのにはさまざまな基準を用いることができる。ある実施形態では、ユーザーの位置(たとえば地理的な位置)、すなわち、イメージキャプチャー装置102に備えられたGPS機能や基地局による測量を利用して使うべき検索エンジンが自動的に選択されてもよい。たとえば、当該ユーザーの位置に最も近い検索エンジンはより遠方に隔たった検索エンジンよりも好ましいであろう。このようにして、その場所の検索エンジンによって提供されるその場所の文書が他の文書よりも優先的に当該ユーザーに提供されうる。
別の実施形態では、利用可能な検索エンジンの一覧がユーザーに対して提示され、そこでユーザーが使うべき一つまたは複数の検索エンジンを選択してもよい。検索エンジンサーバーを検出するのには、マルチキャストドメイン名サービス(DNS:Domain Name Service)、ユニバーサル・プラグアンドプレイ(UPnP:Universal Plug and Play)などさまざまな技術を使うことができる。こうした技術は無線ネットワーク法を用いて実装することもできるし、セキュリティで保護された仕方で実装することもできる。
別の実施形態では、検索に使われるべき一つまたは複数の検索エンジンをユーザーが指定することができる。さらに別の実施形態では、検索に伴うコストに基づいて選択されることもできる。たとえば、最も安価な検索を行う検索エンジンが選ばれるようにできる。検索を行う検索エンジンを選択するのには他のさまざまな基準を使うこともできる。
検索エンジンの選択は、実行する検索や検索される文書の背景に基づいて行うこともできる。たとえば、文書が企業や事務所、政府機関などの組織に関係するものである場合、ステップ710ではその組織によって提供される検索エンジンが選択されるようにしてもよい。
ステップ708で形成される検索クエリーが次にステップ710で決定される検索エンジンに送信される(ステップ712)。ステップ708で形成された検索クエリーを使ってステップ710で決定された検索エンジンにより検索が実行される(ステップ714)。次いでその検索の結果が検索エンジンから受領者に送信される(ステップ716)。受領者は人間、システム、アプリケーションその他の実体でありうる。たとえば、検索結果は702で受信した画像の取り込みに使われたイメージキャプチャー装置のユーザーにイメージキャプチャー装置やその他の情報処理装置を介して伝達(提示)されることができる。その検索結果をそのユーザーに提供するためにはさまざまな技術を使うことができる。検索によって取得された文書は、その検索のための入力をなした画像を取り込むのにユーザーが使ったイメージキャプチャー装置に伝達されるのでもよい。検索によって取得された一つまたは複数の文書はまた別の目的地に届けられてもよい。
ある実施形態では、検索エンジンは多重的な方法で選択され、使用されてもよい。たとえば、処理の初回パスでは第一の検索エンジンが選択され、続く二回目のパスでは第二の検索エンジンが選択される、などというようにしてもよい。この方法では、いくつかの検索エンジンを検索を実行するのに使うことができる。そうすればさまざまな検索エンジンからの検索結果をまとめてユーザーに提供することができる。この方法では、ある検索エンジンがアクセスできなかった電子文書が別の検索エンジンによって検索されることもありうる。この技法は、ある検索エンジンから満足の行く検索結果が得られず、別の検索エンジンを使うことが必要となった場合にも使うことができる。検索の結果として単一の文書を選ぶ必要があるのに複数の検索エンジンが候補となる文書を挙げた場合には、ある検索エンジンの文書を別の検索エンジンからの文書より優先して選択するために検索エンジンの優先順位を利用するようにしてもよい。このような構成により、検索エンジンを適切に選択することが可能となり、所望の検索結果を取得することができる。
図7に描かれている上述した処理は、次の例によって例解できる。ショッピングモールにいるユーザーを考える。ある店にはいったときにユーザーはその店で売っている品物のパンフレットを目にする。ユーザーはそのパンフレットのあるページの写真をイメージキャプチャー装置102で撮ることができる。イメージキャプチャー装置102やサーバー105はユーザーの位置および写真が撮られた場所に基づいて、その店によって提供される検索エンジンが使用する検索エンジン108として選択されうる(すなわち、地理的にユーザーに最も近い検索エンジンが選択される)。取り込まれた画像はイメージキャプチャー装置102から無線でその店の検索エンジン108を使う、その店によって提供されるサーバーに送信されることができる。すると、その店の検索エンジン108はそのパンフレットの電子的なコピーを(あるいは価格表などのような、その品物に関係したなんらかの文書を)検索して取得し、その電子的コピーをユーザーが利用しているイメージキャプチャー装置102に無線ネットワークを介して送信する。
別の例として、病院で、待合室にいる人に健康に関連した情報を提供するよう構成することも可能である。病院としては、ユーザーによって提供される画像に反応してユーザーに健康関連の文書を提供するよう構成されている検索エンジンを提供することができる。画像とはたとえば病院に用意されている何らかの文献のものでもよい。企業では、その企業によって使われている文書管理システムによって蓄えられている電子文書への認証のある検索アクセスを従業員に提供して、文書またはその一部の画像の受信に反応して文書を取得できるようにしてもよい。
図8は、本発明の実施形態を実践するのに使いうるコンピュータシステム800の概略的なブロック図である。図8に示したように、コンピュータシステム800はプロセッサ802を含んでおり、該802がいくつかの周辺機器とバス・サブシステム804を通じて通信している。これらの周辺機器には、メモリ・サブシステム808およびファイル記憶サブシステム810からなる記憶サブシステム806、ユーザーインターフェース入力機器812、ユーザーインターフェース出力機器814、そしてネットワークインターフェース・サブシステム816が含まれうる。
バス・サブシステム804は、コンピュータシステム800のさまざまなコンポーネントおよびサブシステムが互いに意図したように通信できるようにする機構を提供する。バス・サブシステム804は概略的に単一のバスとして示されているが、バス・サブシステムの他の実施形態では複数のバスを使うこともできる。
ネットワークインターフェース・サブシステム816は、さまざまなサーバー、検索エンジン、ネットワーク、イメージキャプチャー装置を含む他のコンピュータシステムとのインターフェースを提供する。ネットワークインターフェース・サブシステム816は他のシステムからデータを受信したり、コンピュータシステム800から他のシステムにデータを送信したりするためのインターフェースとしてはたらく。
ユーザーインターフェース入力機器には、キーボード、マウス・トラックボール・タッチパッド・グラフィックタブレットのようなポインティングデバイス、スキャナ、バーコードリーダー、ディスプレイに組み込まれたタッチパネル、音声認識システム・マイクのようなオーディオ入力機器、その他の入力機器が含まれうる。一般に、「入力機器」という語を用いるのは、コンピュータシステム800に情報を入力するためのあらゆる可能な種類の機器および機構を含むことが意図されている。
ユーザーインターフェース出力機器814には、ディスプレイ・サブシステム、プリンタ、ファクス機、またオーディオ出力機器のような非視覚的出力装置などが含まれうる。ディスプレイ・サブシステムとしては陰極線管(CRT:cathode ray tube)、液晶表示装置(LCD:liquid crystal display)や投射型ディスプレイのようなフラットパネルデバイスなどがある。一般に、「出力機器」という語を用いるのは、コンピュータシステム800からの情報を出力するためのあらゆる可能な種類の機器および機構を含むことが意図されている。本発明の思想に基づくユーザーインターフェースはユーザーインターフェース出力機器814によって表示されうる。
記憶サブシステム806は、本発明の機能を提供する基本プログラムおよびデータ構造体を保存するよう構成されうる。本発明の機能を提供するソフトウェアコードモジュールまたは命令は記憶サブシステム806に保存されうる。これらのソフトウェアコードモジュールまたは命令はプロセッサ(単数または複数)802によって実行されうる。記憶サブシステム806はまた、本発明に従って使われるデータを保存する貯蔵所となることができる。記憶サブシステム806はメモリ・サブシステム808およびファイル/ディスク記憶サブシステム810を有しうる。
メモリ・サブシステム808は、プログラム実行中に命令およびデータを記憶するためのメインのランダムアクセスメモリ(RAM:random access memory)818ならびに固定命令が保存される読み出し専用メモリ(ROM:read only memory)820を含むいくつかのメモリを含みうる。ファイル記憶サブシステムはプログラムおよびデータファイルのための固定的な(不揮発性の)記憶を提供するもので、ハードディスクドライブ、フロッピー(登録商標)ディスクドライブおよび付随の取り外し可能メディア、コンパクトディスクを使った読み出し専用メモリ(CD-ROM:Compact Disk Read Only Memory)ドライブ、光ドライブ、取り外し可能メディアカートリッジ、その他の記憶媒体を含みうる。
コンピュータシステム800は、パソコン、携帯型コンピュータ、ワークステーション、ネットワークコンピュータ、携帯電話、PDA、メインフレーム、キオスク端末、カメラ、イメージキャプチャー装置、その他いかなるデータ処理システムをも含むさまざまな種類のものでありうる。コンピュータおよびネットワークの絶えず変化する性質上、図8に描かれているコンピュータシステム800の記述は本コンピュータシステムの好ましい実施形態を解説する目的のための特定の例としてのみ意図されている。図8に描いたシステムより多くの、あるいは少ないコンポーネントからなる他の多くの構成も可能である。
本発明のある実施形態によれば、サービスプロバイダが、ユーザーが利用するイメージキャプチャー装置102によって送信される画像に反応して電子文書の検索に使える検索サービスを提供することができる。サービスプロバイダは、ユーザー側から画像を受信し、その画像を処理し、その画像に基づく検索を実行し、検索によってみつかった電子文書をユーザーに送信するよう構成されているサーバーを提供することができる。サービスプロバイダによって提供される検索サービスを使う上で、ユーザーに課金するようにしてもよい。さまざまな課金構造を採用することができる。たとえば、ある実施形態では、検索によってみつかり、ユーザーによってダウンロードされる各電子文書に対して課金されてもよい。文書ダウンロードの一環として広告その他のマーケティング材料も提供されるようにしてもよい。検索サービスの一環として、検索サービスプロバイダは通常はユーザーがアクセスできない電子文書へのアクセスを提供するようにしてもよい。
本発明の特定の実施形態について説明してきたが、さまざまな修正、変更、代替構造、等価物もまた本発明の範囲に包摂されている。たとえば、上に記載された本発明の実施形態はテキスト・パターンを使って検索を実行している。代替的な実施形態では、取り込んだ画像内に含まれる画像、取り込んだ画像内のオブジェクト(たとえばマルチメディアオブジェクト)など取り込んだ画像の他の内容も検索を実行するのに使われうる。記載されている発明はある特定のデータ処理環境内での動作に制限されるものではなく、複数のデータ処理環境内において自由に動作するものである。
加えて、本発明は特定の一連の処理およびステップを用いて説明してきたが、当業者には、本発明の範囲が記載されている一連の処理およびステップに限定されるものでないことは明らかであろう。たとえば、図2、4、5、6、7で描かれている処理のさまざまな組み合わせが本発明の異なる実施形態において使用されうる。
さらに、本発明は特定のハードウェアおよびソフトウェアの組み合わせを使って説明してきたが、ハードウェアおよびソフトウェアの他の組み合わせもまた本発明の範囲内であることは認識しておくべきである。本発明はハードウェアのみでも、ソフトウェアのみでも、それらの組み合わせを用いてでも実装することができる。
このように、明細および図面は限定としてではなく、解説的なものと見なされるべきものである。これに対する追加、削減、削除、その他の修正および変更が特許請求の範囲において述べられている本発明のより広い精神および範囲から逸脱することなくなされうることは明らかであろう。
本発明のある実施形態を組み込みうるシステムの概略的なブロック図である。 本発明のある実施形態に基づく、取り込まれた画像に基づいて電子文書を検索する方法を描いた概略的なフローチャートである。 本発明のある実施形態に基づく文書検索の入力として使われうる、イメージキャプチャー装置によって取り込まれた画像の例である。 本発明のある実施形態に基づく、フィードバックループを含む、取り込まれた画像に基づいて電子文書を検索する方法を描いた概略的なフローチャートである。 本発明のある実施形態に基づく、取得される文書数を減らすためのフィードバックループを含む、取り込まれた画像に基づいて電子文書を検索する方法を描いた概略的なフローチャートである。 本発明のある実施形態に基づく、抽出されたテキスト・パターンの部分集合を使う、取り込まれた画像に基づいて電子文書を検索する方法を描いた概略的なフローチャートである。 本発明のある実施形態に基づく、選択された検索エンジンを使う、取り込まれた画像に基づいて電子文書を検索する方法を描いた概略的なフローチャートである。 本発明の実施形態を実践するのに使いうるコンピュータシステムの概略的なブロック図である。
符号の説明
102 イメージキャプチャー装置
104 画像
105 サーバー
106 紙の文書
108 検索エンジン
110 通信ネットワーク
112 電子文書
114 検索された電子文書
116 文書送達先
800 コンピュータシステム
802 プロセッサ
804 バス・サブシステム
806 記憶サブシステム
808 メモリ・サブシステム
810 ファイル記憶サブシステム
812 ユーザーインターフェース入力機器
814 ユーザーインターフェース出力機器
816 ネットワークインターフェース

Claims (24)

  1. イメージキャプチャー装置を使って取り込まれた画像を受信し、
    前記画像の内容を抽出し、
    前記抽出内容に基づいて検索クエリーを形成し、
    前記検索クエリーを満たす第一の電子文書を同定するために複数の電子文書を検索する、
    ことを含むことを特徴とする、電子文書を取得する方法。
  2. 請求項1記載の方法であって、
    前記画像の内容の抽出が、
    当該画像の内容を抽出するために画像処理技術を使用することと、
    前記内容からテキスト・パターンの集合を決定することとを含み、
    検索クエリーの形成が、該検索クエリーを形成するために前記テキスト・パターンの集合中の一つまたは複数のテキスト・パターンを使うことを含む、
    ことを特徴とする方法。
  3. 請求項2記載の方法であって、
    当該画像の内容を抽出するために画像処理技術を使用することが、当該画像の内容を抽出するために光学式文字認識を使用することを含み、
    前記内容からテキスト・パターンの集合を決定することが、テキスト・パターンの集合を同定するために抽出された内容にフィルタを適用することを含む、
    ことを特徴とする方法。
  4. 請求項2記載の方法であって、検索クエリーを形成するために前記テキスト・パターンの集合中の一つまたは複数のテキスト・パターンを使うことが、該検索クエリーを形成するためにテキスト・パターンの集合中の一つまたは複数のテキスト・パターンを結合することを含む、ことを特徴とする方法。
  5. 請求項1記載の方法であって、前記第一の電子文書を前記イメージキャプチャー装置に送信することをさらに含むことを特徴とする方法。
  6. 請求項5記載の方法であって、前記イメージキャプチャー装置がカメラ付き携帯電話であり、前記第一の電子文書が無線ネットワークを通じて前記携帯電話に送信されることを特徴とする方法。
  7. 検索を実行するための第一の検索エンジンを決定することをさらに含む請求項1記載の方法であって、前記複数の電子文書を検索することが、該第一の検索エンジンを使って前記複数の文書を検索することであることを特徴とする方法。
  8. 請求項7記載の方法であって、第一の検索エンジンを決定することが、
    当該画像を取り込んだイメージキャプチャー装置のユーザーの位置を決定し、
    前記ユーザーの前記位置に最も近く位置する検索エンジンを前記第一の検索エンジンとして選択することを含む、
    ことを特徴とする方法。
  9. イメージキャプチャー装置を使って取り込まれた第一の画像を受信し、
    前記第一の画像の内容を抽出し、
    前記第一の画像の抽出内容に基づいて検索クエリーを形成し、
    前記検索クエリーを満たす一つまたは複数の電子文書を含む電子文書の第一の集合を同定するために検索を実行し、
    前記電子文書の第一の集合が所定数の電子文書を含んでいるかどうかを決定し、
    前記電子文書の第一の集合が前記所定数の電子文書を含んでいない場合には第二の画像を要求し、
    前記第二の画像の内容を抽出し、
    前記第二の画像の抽出内容に基づいて検索クエリーを形成し、
    前記第二の画像の抽出内容に基づく検索クエリーを満たす一つまたは複数の電子文書を含む電子文書の第二の集合を同定するために検索を実行する、
    ことを含むことを特徴とする、電子文書を取得する方法。
  10. イメージキャプチャー装置を使って取り込まれた第一の画像を受信し、
    前記第一の画像の内容を抽出し、
    前記第一の画像の抽出内容に基づいて検索クエリーを形成し、
    前記第一の画像の抽出内容に基づいて形成された検索クエリーを使って検索を実行し、
    (a)検索によって少なくとも一つの電子文書が同定されなかった場合には別の画像を要求し、
    (b)別の画像を受信し、
    (c)前記別の画像の内容を抽出し、
    (d)前記別の画像の抽出内容に基づいて検索クエリーを形成し、
    (e)前記別の画像の抽出内容に基づいて形成された前記検索クエリーを使って検索を実行し、
    検索によって前記検索クエリーを満たす電子文書が少なくとも一つ同定されるまで(a)(b)(c)(d)(e)を繰り返す、
    ことを含むことを特徴とする、電子文書を取得する方法。
  11. イメージキャプチャー装置を使って取り込まれた画像を受信し、
    画像処理技術を使って前記画像から複数のテキスト・パターンを抽出し、
    前記複数のテキスト・パターンからテキスト・パターンの部分集合を選択し、その際、前記複数のテキスト・パターンは前記部分集合に含まれないテキスト・パターンを少なくとも一つ含むものとし、
    前記テキスト・パターンの部分集合に基づいて検索クエリーを形成し、
    前記検索クエリーを満たす第一の電子文書を同定するために複数の電子文書を検索する、
    ことを含むことを特徴とする、電子文書を取得する方法。
  12. 請求項11記載の方法であって、テキスト・パターンの部分集合の選択が、前記複数のテキスト・パターン中の各テキスト・パターンに関連付けられている属性に基づいて該部分集合を選択することであることを特徴とする方法。
  13. 請求項12記載の方法であって、該部分集合の選択が、前記複数のテキスト・パターンから前記画像処理技術によってテキスト・パターンに関連付けられている信頼度データに基づいて前記部分集合に含めるべきテキスト・パターンを選択することを含むことを特徴とする方法。
  14. イメージキャプチャー装置を使って取り込まれた画像を受信し、
    画像処理技術を使って前記画像から複数のテキスト・パターンを抽出し、
    前記複数のテキスト・パターンからテキスト・パターンの第一の部分集合を選択し、その際、前記複数のテキスト・パターンは前記第一の部分集合に含まれないテキスト・パターンを少なくとも一つ含むものとし、
    前記テキスト・パターンの第一の部分集合に基づいて検索クエリーを形成し、
    前記検索クエリーを満たす第一の電子文書を同定するために複数の電子文書を検索し、
    前記テキスト・パターンの第一の部分集合に基づいて形成された前記検索クエリーを使って検索を実行し、
    前記テキスト・パターンの第一の部分集合を使って実行した検索によって少なくとも一つの電子文書が同定されなかった場合には前記複数のテキスト・パターンからテキスト・パターンの第二の部分集合を選択し、
    前記テキスト・パターンの第二の部分集合に基づいて検索クエリーを形成し、
    前記テキスト・パターンの第二の部分集合に基づいて形成された検索クエリーを使って検索を実行する、
    ことを含むことを特徴とする、電子文書を取得する方法。
  15. イメージキャプチャー装置を使って取り込まれた画像を保存するよう構成されたメモリと、
    前記画像の内容を抽出し、
    前記抽出内容に基づいて検索クエリーを形成し、
    前記検索クエリーを満たす第一の電子文書を同定するために複数の電子文書を検索する、
    よう構成された、前記メモリに結合されたプロセッサとを有する、
    ことを特徴とする、電子文書を取得するシステム。
  16. 請求項15記載のシステムであって、
    前記プロセッサが、前記画像の内容の抽出を、
    当該画像の内容を抽出するために画像処理技術を使用することと、
    前記内容からテキスト・パターンの集合を決定することとによって行うよう構成されており、
    前記プロセッサが、検索クエリーの形成を、該検索クエリーを形成するためにテキスト・パターンの集合中の一つまたは複数のテキスト・パターンを使うことによって行うよう構成されている、
    ことを特徴とするシステム。
  17. 請求項16記載のシステムであって、
    当該画像の内容を抽出するために画像処理技術を使用することが、当該画像の内容を抽出するために光学式文字認識を使用することを含み、
    前記内容からテキスト・パターンの集合を決定することが、テキスト・パターンの集合を同定するために抽出された内容にフィルタを適用することを含む、
    ことを特徴とするシステム。
  18. 請求項16記載のシステムであって、検索クエリーを形成するためにテキスト・パターンの集合中の一つまたは複数のテキスト・パターンを使うことが、該検索クエリーを形成するためにテキスト・パターンの集合中の一つまたは複数のテキスト・パターンを結合することを含む、ことを特徴とするシステム。
  19. 請求項15記載の方法であって、前記プロセッサが、前記第一の電子文書を前記イメージキャプチャー装置に送信するよう構成されていることを特徴とするシステム。
  20. 電子文書を取得するためにデータプロセッサを制御する複数の命令を保存しているコンピュータ可読媒体であって、該複数の命令が、
    前記データプロセッサをして、イメージキャプチャー装置を使って取り込まれた画像を受信させる命令と、
    前記データプロセッサをして、前記画像の内容を抽出させる命令と、
    前記データプロセッサをして、前記抽出内容に基づいて検索クエリーを形成させる命令と、
    前記データプロセッサをして、前記検索クエリーを満たす第一の電子文書を同定するために複数の電子文書を検索させる命令とを、
    含むことを特徴とする媒体。
  21. イメージキャプチャー装置を使って取り込まれた画像を保存するよう構成されたメモリと、
    前記第一の画像の内容を抽出し、
    前記第一の画像の抽出内容に基づいて検索クエリーを形成し、
    前記検索クエリーを満たす一つまたは複数の電子文書を含む電子文書の第一の集合を同定するために検索を実行し、
    前記電子文書の第一の集合が所定数の電子文書を含んでいるかどうかを決定し、
    前記電子文書の第一の集合が前記所定数の電子文書を含んでいない場合には第二の画像を要求し、
    前記第二の画像の内容を抽出し、
    前記第二の画像の抽出内容に基づいて検索クエリーを形成し、
    前記第二の画像の抽出内容に基づく検索クエリーを満たす一つまたは複数の電子文書を含む電子文書の第二の集合を同定するために検索を実行する、
    よう構成された、前記メモリに結合されたプロセッサとを有する、
    ことを特徴とする、電子文書を取得するシステム。
  22. イメージキャプチャー装置を使って取り込まれた第一の画像を保存するよう構成されたメモリと、
    前記第一の画像の内容を抽出し、
    前記第一の画像の抽出内容に基づいて検索クエリーを形成し、
    前記第一の画像の抽出内容に基づいて形成された検索クエリーを使って検索を実行し、
    (a)検索によって少なくとも一つの電子文書が同定されなかった場合には別の画像を要求し、
    (b)別の画像を受信し、
    (c)前記別の画像の内容を抽出し、
    (d)前記別の画像の抽出内容に基づいて検索クエリーを形成し、
    (e)前記別の画像の抽出内容に基づいて形成された前記検索クエリーを使って検索を実行し、
    検索によって前記検索クエリーを満たす電子文書が少なくとも一つ同定されるまで(a)(b)(c)(d)(e)を繰り返す、
    よう構成された、前記メモリに結合されたプロセッサとを有する、
    ことを特徴とする、電子文書を取得するシステム。
  23. イメージキャプチャー装置を使って取り込まれた画像を保存するよう構成されたメモリと、
    画像処理技術を使って前記画像から複数のテキスト・パターンを抽出し、
    前記複数のテキスト・パターンからテキスト・パターンの部分集合を選択し、その際、前記複数のテキスト・パターンは前記部分集合に含まれないテキスト・パターンを少なくとも一つ含むものとし、
    前記テキスト・パターンの部分集合に基づいて検索クエリーを形成し、
    前記検索クエリーを満たす第一の電子文書を同定するために複数の電子文書を検索する、
    よう構成された、前記メモリに結合されたプロセッサとを有する、
    ことを特徴とする、電子文書を取得するシステム。
  24. イメージキャプチャー装置を使って取り込まれた画像を保存するよう構成されたメモリと、
    画像処理技術を使って前記画像から複数のテキスト・パターンを抽出し、
    前記複数のテキスト・パターンからテキスト・パターンの第一の部分集合を選択し、その際、前記複数のテキスト・パターンは前記第一の部分集合に含まれないテキスト・パターンを少なくとも一つ含むものとし、
    前記テキスト・パターンの第一の部分集合に基づいて検索クエリーを形成し、
    前記検索クエリーを満たす第一の電子文書を同定するために複数の電子文書を検索し、
    前記テキスト・パターンの第一の部分集合に基づいて形成された前記検索クエリーを使って検索を実行し、
    前記テキスト・パターンの第一の部分集合を使って実行した検索によって少なくとも一つの電子文書が同定されなかった場合には前記複数のテキスト・パターンからテキスト・パターンの第二の部分集合を選択し、
    前記テキスト・パターンの第二の部分集合に基づいて検索クエリーを形成し、
    前記テキスト・パターンの第二の部分集合に基づいて形成された検索クエリーを使って検索を実行する、
    よう構成された、前記メモリに結合されたプロセッサとを有する、
    ことを特徴とする、電子文書を取得するシステム。
JP2005282740A 2004-10-01 2005-09-28 イメージキャプチャー装置を使った文書検索技術 Active JP4851763B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/957,080 2004-10-01
US10/957,080 US8489583B2 (en) 2004-10-01 2004-10-01 Techniques for retrieving documents using an image capture device

Publications (2)

Publication Number Publication Date
JP2006107495A true JP2006107495A (ja) 2006-04-20
JP4851763B2 JP4851763B2 (ja) 2012-01-11

Family

ID=36182067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005282740A Active JP4851763B2 (ja) 2004-10-01 2005-09-28 イメージキャプチャー装置を使った文書検索技術

Country Status (2)

Country Link
US (2) US8489583B2 (ja)
JP (1) JP4851763B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009540404A (ja) * 2006-06-06 2009-11-19 エクスビブリオ ベースローテン フェンノートシャップ 取り込まれたレンダリングテキストに基づくコンテキスト動的広告
JP2015064901A (ja) * 2009-08-07 2015-04-09 グーグル インコーポレイテッド 視覚クエリに応答するためのアーキテクチャ
CN105898857A (zh) * 2009-06-23 2016-08-24 北京三星通信技术研究有限公司 一种数据同步方法和系统
US10318995B2 (en) 2004-04-01 2019-06-11 Google Llc Contextual dynamic advertising based upon captured rendered text

Families Citing this family (202)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7467137B1 (en) 1994-09-02 2008-12-16 Wolfe Mark A System and method for information retrieval employing a preloading procedure
US7966078B2 (en) 1999-02-01 2011-06-21 Steven Hoffberg Network media appliance system and method
US7430003B2 (en) * 2002-08-23 2008-09-30 Candid Color Systems, Inc. Digital camera/computer synchronization method
US8819039B2 (en) 2002-12-31 2014-08-26 Ebay Inc. Method and system to generate a listing in a network-based commerce system
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US8799303B2 (en) * 2004-02-15 2014-08-05 Google Inc. Establishing an interactive environment for rendered documents
US20060041484A1 (en) 2004-04-01 2006-02-23 King Martin T Methods and systems for initiating application processes by data capture from rendered documents
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US8621349B2 (en) 2004-04-01 2013-12-31 Google Inc. Publishing techniques for adding value to a rendered document
US7894670B2 (en) * 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US20100185538A1 (en) * 2004-04-01 2010-07-22 Exbiblio B.V. Content access with handheld document data capture devices
US20080313172A1 (en) * 2004-12-03 2008-12-18 King Martin T Determining actions involving captured information and electronic content associated with rendered documents
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US8081849B2 (en) 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US8146156B2 (en) * 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
WO2008028674A2 (en) 2006-09-08 2008-03-13 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
US8793162B2 (en) * 2004-04-01 2014-07-29 Google Inc. Adding information or functionality to a rendered document via association with an electronic counterpart
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US9460346B2 (en) 2004-04-19 2016-10-04 Google Inc. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
US20100092095A1 (en) * 2008-10-14 2010-04-15 Exbiblio B.V. Data gathering in digital and rendered document environments
US20070005490A1 (en) * 2004-08-31 2007-01-04 Gopalakrishnan Kumar C Methods and System for Distributed E-commerce
US7873911B2 (en) * 2004-08-31 2011-01-18 Gopalakrishnan Kumar C Methods for providing information services related to visual imagery
US20060230073A1 (en) * 2004-08-31 2006-10-12 Gopalakrishnan Kumar C Information Services for Real World Augmentation
US8370323B2 (en) 2004-08-31 2013-02-05 Intel Corporation Providing information services related to multimodal inputs
US7551780B2 (en) * 2005-08-23 2009-06-23 Ricoh Co., Ltd. System and method for using individualized mixed document
US8195659B2 (en) * 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US8838591B2 (en) * 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US8176054B2 (en) 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US8184155B2 (en) * 2007-07-11 2012-05-22 Ricoh Co. Ltd. Recognition and tracking using invisible junctions
US8276088B2 (en) * 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US8369655B2 (en) * 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US8949287B2 (en) * 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US8086038B2 (en) * 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
US7672543B2 (en) * 2005-08-23 2010-03-02 Ricoh Co., Ltd. Triggering applications based on a captured text in a mixed media environment
US7702673B2 (en) * 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US7669148B2 (en) * 2005-08-23 2010-02-23 Ricoh Co., Ltd. System and methods for portable device for mixed media system
US7812986B2 (en) * 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US8856108B2 (en) * 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US7970171B2 (en) * 2007-01-18 2011-06-28 Ricoh Co., Ltd. Synthetic image and video generation from ground truth data
US9405751B2 (en) * 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US8825682B2 (en) 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US7920759B2 (en) * 2005-08-23 2011-04-05 Ricoh Co. Ltd. Triggering applications for distributed action execution and use of mixed media recognition as a control input
US8600989B2 (en) * 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US9171202B2 (en) * 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US8144921B2 (en) * 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US8156427B2 (en) * 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US8989431B1 (en) 2007-07-11 2015-03-24 Ricoh Co., Ltd. Ad hoc paper-based networking with mixed media reality
US9373029B2 (en) * 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US8510283B2 (en) * 2006-07-31 2013-08-13 Ricoh Co., Ltd. Automatic adaption of an image recognition system to image capture devices
US8335789B2 (en) * 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US7639387B2 (en) * 2005-08-23 2009-12-29 Ricoh Co., Ltd. Authoring tools using a mixed media environment
US8005831B2 (en) * 2005-08-23 2011-08-23 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment with geographic location information
US7885955B2 (en) * 2005-08-23 2011-02-08 Ricoh Co. Ltd. Shared document annotation
US7991778B2 (en) * 2005-08-23 2011-08-02 Ricoh Co., Ltd. Triggering actions with captured input in a mixed media environment
US8489583B2 (en) * 2004-10-01 2013-07-16 Ricoh Company, Ltd. Techniques for retrieving documents using an image capture device
US9384619B2 (en) * 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US7587412B2 (en) * 2005-08-23 2009-09-08 Ricoh Company, Ltd. Mixed media reality brokerage network and methods of use
US8385589B2 (en) 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US8332401B2 (en) * 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US7917554B2 (en) * 2005-08-23 2011-03-29 Ricoh Co. Ltd. Visibly-perceptible hot spots in documents
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US8521737B2 (en) * 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US20110075228A1 (en) * 2004-12-03 2011-03-31 King Martin T Scanner having connected and unconnected operational behaviors
JP2006260481A (ja) * 2005-03-18 2006-09-28 Canon Inc 文書管理装置及びその制御方法、コンピュータプログラム、記憶媒体
US7882447B2 (en) 2005-03-30 2011-02-01 Ebay Inc. Method and system to determine area on a user interface
US7353034B2 (en) 2005-04-04 2008-04-01 X One, Inc. Location sharing and tracking using mobile phones or other wireless devices
US20070011171A1 (en) * 2005-07-08 2007-01-11 Nurminen Jukka K System and method for operation control functionality
US7769772B2 (en) * 2005-08-23 2010-08-03 Ricoh Co., Ltd. Mixed media reality brokerage network with layout-independent recognition
US8849821B2 (en) * 2005-11-04 2014-09-30 Nokia Corporation Scalable visual search system simplifying access to network and device functionality
US20070226321A1 (en) * 2006-03-23 2007-09-27 R R Donnelley & Sons Company Image based document access and related systems, methods, and devices
JP2008009572A (ja) * 2006-06-27 2008-01-17 Fuji Xerox Co Ltd ドキュメント処理システム、ドキュメント処理方法及びプログラム
US20080022216A1 (en) * 2006-07-21 2008-01-24 Duval John J Method and system for obtaining primary search terms for use in conducting an internet search
US9176984B2 (en) * 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US8073263B2 (en) * 2006-07-31 2011-12-06 Ricoh Co., Ltd. Multi-classifier selection and monitoring for MMR-based image recognition
US8676810B2 (en) * 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
US9020966B2 (en) * 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
US8489987B2 (en) * 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US8201076B2 (en) * 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US9063952B2 (en) * 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US20080104067A1 (en) * 2006-10-27 2008-05-01 Motorola, Inc. Location based large format document display
MX2009004990A (es) * 2006-11-08 2010-02-08 Cryptometrics Inc Sistema y metodo para el procesamiento de imagen paralela.
US20080154612A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Local storage and use of search results for voice-enabled mobile communications devices
US20080154608A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. On a mobile device tracking use of search results delivered to the mobile device
US20080153465A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Voice search-enabled mobile device
US20080154870A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Collection and use of side information in voice-mediated mobile search
US20090046320A1 (en) * 2007-08-19 2009-02-19 Xsights Media Ltd. Method and apparatus for forwarding media...
US20090094289A1 (en) * 2007-10-05 2009-04-09 Nokia Corporation Method, apparatus and computer program product for multiple buffering for search application
US20100030872A1 (en) * 2008-08-04 2010-02-04 Serge Caleca System for remote processing, printing, and uploading of digital images to a remote server via wireless connections
US8520979B2 (en) 2008-08-19 2013-08-27 Digimarc Corporation Methods and systems for content processing
US8447669B2 (en) 2008-08-26 2013-05-21 Visa U.S.A. Inc. System and method for implementing financial assistance programs
WO2010048336A1 (en) * 2008-10-21 2010-04-29 Financial Finesse, Inc. Method and system for personalized education
WO2010096193A2 (en) 2009-02-18 2010-08-26 Exbiblio B.V. Identifying a document by performing spectral analysis on the contents of the document
WO2010105246A2 (en) 2009-03-12 2010-09-16 Exbiblio B.V. Accessing resources based on capturing information from a rendered document
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
US8385660B2 (en) * 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
US8670597B2 (en) 2009-08-07 2014-03-11 Google Inc. Facial recognition with social network aiding
US9087059B2 (en) * 2009-08-07 2015-07-21 Google Inc. User interface for presenting search results for multiple regions of a visual query
EP2341450A1 (en) * 2009-08-21 2011-07-06 Mikko Kalervo Väänänen Method and means for data searching and language translation
CA2773006C (en) * 2009-09-02 2016-10-18 Image Holdings Method and system for displaying, managing and selling digital images
CA2774353C (en) 2009-09-16 2016-01-26 Image Holdings Method and system of displaying, managing and selling images in an event photography environment
US8301512B2 (en) 2009-10-23 2012-10-30 Ebay Inc. Product identification using multiple services
US8175617B2 (en) 2009-10-28 2012-05-08 Digimarc Corporation Sensor-based mobile search, related methods and systems
US9183224B2 (en) * 2009-12-02 2015-11-10 Google Inc. Identifying matching canonical documents in response to a visual query
US8977639B2 (en) * 2009-12-02 2015-03-10 Google Inc. Actionable search results for visual queries
US9176986B2 (en) 2009-12-02 2015-11-03 Google Inc. Generating a combination of a visual query and matching canonical document
US8805079B2 (en) 2009-12-02 2014-08-12 Google Inc. Identifying matching canonical documents in response to a visual query and in accordance with geographic information
US8811742B2 (en) 2009-12-02 2014-08-19 Google Inc. Identifying matching canonical documents consistent with visual query structural information
US20110128288A1 (en) * 2009-12-02 2011-06-02 David Petrou Region of Interest Selector for Visual Queries
US9405772B2 (en) * 2009-12-02 2016-08-02 Google Inc. Actionable search results for street view visual queries
US9852156B2 (en) 2009-12-03 2017-12-26 Google Inc. Hybrid use of location sensor data and visual query to return local listings for visual query
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
US9158983B2 (en) 2010-07-08 2015-10-13 E-Image Data Corporation Microform word search method and apparatus
US8645359B2 (en) * 2010-09-30 2014-02-04 Microsoft Corporation Providing associations between objects and individuals associated with relevant media items
WO2012048158A1 (en) * 2010-10-06 2012-04-12 Planet Data Solutions System and method for indexing electronic discovery data
WO2012054786A1 (en) 2010-10-20 2012-04-26 Playspan Inc. Flexible monetization service apparatuses, methods and systems
CN103493069A (zh) * 2010-12-01 2014-01-01 谷歌公司 响应于视觉查询识别匹配的规范文档
US20120170914A1 (en) 2011-01-04 2012-07-05 Sony Dadc Us Inc. Logging events in media files
US10204327B2 (en) 2011-02-05 2019-02-12 Visa International Service Association Merchant-consumer bridging platform apparatuses, methods and systems
WO2012109628A2 (en) 2011-02-10 2012-08-16 Visa International Service Assocation Electronic coupon issuance and redemption apparatuses, methods and systems
CN106803175B (zh) 2011-02-16 2021-07-30 维萨国际服务协会 快拍移动支付装置,方法和系统
US10586227B2 (en) 2011-02-16 2020-03-10 Visa International Service Association Snap mobile payment apparatuses, methods and systems
US10223691B2 (en) 2011-02-22 2019-03-05 Visa International Service Association Universal electronic payment apparatuses, methods and systems
AU2012223415B2 (en) 2011-02-28 2017-05-18 Visa International Service Association Secure anonymous transaction apparatuses, methods and systems
US9996838B2 (en) 2011-03-04 2018-06-12 Visa International Service Association Cloud service facilitator apparatuses, methods and systems
WO2012155081A1 (en) 2011-05-11 2012-11-15 Visa International Service Association Electronic receipt manager apparatuses, methods and systems
CN102779140B (zh) * 2011-05-13 2015-09-02 富士通株式会社 一种关键词获取方法及装置
SG195079A1 (en) 2011-06-03 2013-12-30 Visa Int Service Ass Virtual wallet card selection apparatuses, methods and systems
EP2533141A1 (en) 2011-06-07 2012-12-12 Amadeus S.A.S. A personal information display system and associated method
US10121129B2 (en) 2011-07-05 2018-11-06 Visa International Service Association Electronic wallet checkout platform apparatuses, methods and systems
US9355393B2 (en) 2011-08-18 2016-05-31 Visa International Service Association Multi-directional wallet connector apparatuses, methods and systems
US9582598B2 (en) 2011-07-05 2017-02-28 Visa International Service Association Hybrid applications utilizing distributed models and views apparatuses, methods and systems
US8635201B2 (en) * 2011-07-14 2014-01-21 Nuance Communications, Inc. Methods and apparatus for employing a user's location in providing information to the user
US10438176B2 (en) 2011-07-17 2019-10-08 Visa International Service Association Multiple merchant payment processor platform apparatuses, methods and systems
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
US10825001B2 (en) 2011-08-18 2020-11-03 Visa International Service Association Multi-directional wallet connector apparatuses, methods and systems
US9710807B2 (en) 2011-08-18 2017-07-18 Visa International Service Association Third-party value added wallet features and interfaces apparatuses, methods and systems
US10242358B2 (en) 2011-08-18 2019-03-26 Visa International Service Association Remote decoupled application persistent state apparatuses, methods and systems
US10318941B2 (en) 2011-12-13 2019-06-11 Visa International Service Association Payment platform interface widget generation apparatuses, methods and systems
EP2742599A4 (en) * 2011-09-13 2016-01-13 Sony Corp REGISTRATION OF EVENTS IN MEDIA FILES INCLUDING FRAME MATCHING
US9117225B2 (en) 2011-09-16 2015-08-25 Visa International Service Association Apparatuses, methods and systems for transforming user infrastructure requests inputs to infrastructure design product and infrastructure allocation outputs
US10223730B2 (en) 2011-09-23 2019-03-05 Visa International Service Association E-wallet store injection search apparatuses, methods and systems
US10096022B2 (en) 2011-12-13 2018-10-09 Visa International Service Association Dynamic widget generator apparatuses, methods and systems
US9953378B2 (en) 2012-04-27 2018-04-24 Visa International Service Association Social checkout widget generation and integration apparatuses, methods and systems
US10223710B2 (en) 2013-01-04 2019-03-05 Visa International Service Association Wearable intelligent vision device apparatuses, methods and systems
US10262148B2 (en) 2012-01-09 2019-04-16 Visa International Service Association Secure dynamic page content and layouts apparatuses, methods and systems
US11308227B2 (en) 2012-01-09 2022-04-19 Visa International Service Association Secure dynamic page content and layouts apparatuses, methods and systems
AU2013214801B2 (en) 2012-02-02 2018-06-21 Visa International Service Association Multi-source, multi-dimensional, cross-entity, multimedia database platform apparatuses, methods and systems
US20130254701A1 (en) * 2012-03-21 2013-09-26 Google Inc. Unlocking digital content using image recognition
CA2868192A1 (en) * 2012-03-23 2013-09-26 Digital Retail Apps., Inc. System and method for facilitating secure self payment transactions of retail goods
US8620021B2 (en) 2012-03-29 2013-12-31 Digimarc Corporation Image-related methods and arrangements
US9218526B2 (en) * 2012-05-24 2015-12-22 HJ Laboratories, LLC Apparatus and method to detect a paper document using one or more sensors
US9298784B1 (en) * 2012-07-17 2016-03-29 Amazon Technologies, Inc. Searching inside items
JP6139829B2 (ja) * 2012-07-20 2017-05-31 キヤノン株式会社 情報処理装置およびその制御方法、プログラム
US8935246B2 (en) 2012-08-08 2015-01-13 Google Inc. Identifying textual terms in response to a visual query
JP5869987B2 (ja) * 2012-08-24 2016-02-24 富士フイルム株式会社 物品照合装置および物品照合方法並びに物品照合プログラム
WO2014036212A1 (en) 2012-08-29 2014-03-06 Northwestern University Water detoxification by a substrate-bound catecholamine adsorbent
US10210273B2 (en) * 2012-08-31 2019-02-19 Hewlett-Packard Development Company, L.P. Active regions of an image with accessible links
US9235643B2 (en) * 2012-11-21 2016-01-12 Diwan Software Limited Method and system for generating search results from a user-selected area
US9740768B2 (en) * 2013-01-15 2017-08-22 Tata Consultancy Services Limited Intelligent system and method for processing data to provide recognition and extraction of an informative segment
WO2014154457A1 (en) * 2013-03-29 2014-10-02 Alcatel Lucent Systems and methods for context based scanning
US9818150B2 (en) 2013-04-05 2017-11-14 Digimarc Corporation Imagery and annotations
US9521550B2 (en) 2013-12-20 2016-12-13 March Networks Corporation Remote configuration of digital video surveillance system elements
WO2015112870A1 (en) 2014-01-25 2015-07-30 Cloudpin Inc. Systems and methods for location-based content sharing using unique identifiers
US9311639B2 (en) 2014-02-11 2016-04-12 Digimarc Corporation Methods, apparatus and arrangements for device to device communication
US10909410B2 (en) 2014-03-21 2021-02-02 Arturo Geigel Mapping an image associated with a narrative to a conceptual domain
US10878039B2 (en) 2014-09-22 2020-12-29 International Business Machines Corporation Creating knowledge base of similar systems from plurality of systems
US10152540B2 (en) * 2014-10-10 2018-12-11 Qualcomm Incorporated Linking thumbnail of image to web page
US20160171106A1 (en) * 2014-12-11 2016-06-16 Microsoft Corporation Webpage content storage and review
US11216468B2 (en) 2015-02-08 2022-01-04 Visa International Service Association Converged merchant processing apparatuses, methods and systems
US20180068108A1 (en) * 2015-02-18 2018-03-08 Os-New Horizons Personal Computing Solutions Ltd. A MOBILE DEVICE AND SYSTEMS TO SECURELY REMOTELY ACCESS, MANAGE AND STORE AN ENTERPRISE'S DATA, USING EMPLOYEES SMART ADD-ONs AND MOBILE DEVICES
US20170220581A1 (en) * 2016-02-02 2017-08-03 Microsoft Technology Licensing, Llc. Content Item and Source Detection System
US10102206B2 (en) 2016-03-31 2018-10-16 Dropbox, Inc. Intelligently identifying and presenting digital documents
US10331732B1 (en) * 2016-12-16 2019-06-25 National Technology & Engineering Solutions Of Sandia, Llc Information searching system
CN109117428B (zh) * 2017-06-26 2020-12-08 北京嘀嘀无限科技发展有限公司 数据存储方法及其装置、数据查询方法及其装置
US10922426B2 (en) 2017-09-29 2021-02-16 Dropbox, Inc. Managing content item collections
US11222162B2 (en) 2017-09-29 2022-01-11 Dropbox, Inc. Managing content item collections
US10592595B2 (en) 2017-09-29 2020-03-17 Dropbox, Inc. Maintaining multiple versions of a collection of content items
US11038973B2 (en) 2017-10-19 2021-06-15 Dropbox, Inc. Contact event feeds and activity updates
US10783400B2 (en) 2018-04-06 2020-09-22 Dropbox, Inc. Generating searchable text for documents portrayed in a repository of digital images utilizing orientation and text prediction neural networks
CN108664900B (zh) * 2018-04-20 2022-05-27 上海掌门科技有限公司 一种用于识别文字作品异同的方法与设备
US11100160B2 (en) 2018-07-31 2021-08-24 International Business Machines Corporation Intelligent image note processing
WO2020051160A1 (en) * 2018-09-03 2020-03-12 Cyberlab Llc Spatial transaction protocol
CN111143898B (zh) * 2018-11-05 2022-06-14 瑞昱半导体股份有限公司 可插拔存储器装置数据保护方法
CN110609896B (zh) * 2019-07-19 2022-03-22 中国人民解放军国防科技大学 基于二次解码的军事想定文本事件信息抽取方法及装置
CN110443171B (zh) * 2019-07-25 2022-11-29 腾讯科技(武汉)有限公司 视频文件的分类方法、装置、存储介质及终端
US11303464B2 (en) * 2019-12-05 2022-04-12 Microsoft Technology Licensing, Llc Associating content items with images captured of meeting content
CN112200268A (zh) * 2020-11-04 2021-01-08 福州大学 一种基于编码器-解码器框架的图像描述方法
CN113780381B (zh) * 2021-08-28 2022-07-01 特斯联科技集团有限公司 一种人工智能漏水检测方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11203310A (ja) * 1998-01-13 1999-07-30 Ntt Data Corp 検索式作成方法及び装置
JP2001265811A (ja) * 2000-03-22 2001-09-28 Toshiba Corp 画像検索システムおよび画像検索方法
JP2002073682A (ja) * 2000-08-24 2002-03-12 Nec Corp 情報検索サービス装置及びその方法、インターネット対応の利用者端末装置及びその使用方法
JP2002314704A (ja) * 2001-04-17 2002-10-25 Koujiro Omoto データセンタシステムおよび文字入力方法
JP2003150624A (ja) * 2001-11-12 2003-05-23 Mitsubishi Electric Corp 情報抽出装置および情報抽出方法
JP2003256308A (ja) * 2002-03-01 2003-09-12 Nippon Telegr & Teleph Corp <Ntt> コンテンツ配信制御システムと方法およびコンテンツ配信サービス受付制御装置ならびにプログラムと記録媒体
JP2004038367A (ja) * 2002-07-01 2004-02-05 Nec Corp カメラ付き携帯電話を用いたインタネットホームページ接続システムおよびマーケティング情報収集システムとその方法

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5392447A (en) 1992-01-10 1995-02-21 Eastman Kodak Compay Image-based electronic pocket organizer with integral scanning unit
US5664111A (en) 1994-02-16 1997-09-02 Honicorp, Inc. Computerized, multimedia, network, real time, interactive marketing and transactional system
US5694546A (en) 1994-05-31 1997-12-02 Reisman; Richard R. System for automatic unattended electronic information transport between a server and a client by a vendor provided transport software with a manifest list
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US5806005A (en) 1996-05-10 1998-09-08 Ricoh Company, Ltd. Wireless image transfer from a digital still video camera to a networked computer
US6078914A (en) 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
US6009459A (en) 1997-01-10 1999-12-28 Microsoft Corporation Intelligent automatic searching for resources in a distributed environment
JP3634099B2 (ja) 1997-02-17 2005-03-30 株式会社リコー 文書情報管理システム,媒体用紙情報作成装置および文書情報管理装置
US6025780A (en) 1997-07-25 2000-02-15 Checkpoint Systems, Inc. RFID tags which are virtually activated and/or deactivated and apparatus and methods of using same in an electronic security system
US5970483A (en) * 1997-07-25 1999-10-19 Claritech Corporation Apparatus and methodology for submitting search queries
JP2000016545A (ja) 1998-06-25 2000-01-18 Toyobo Co Ltd 高温物搬送用コンベア
US6338059B1 (en) * 1998-12-17 2002-01-08 International Business Machines Corporation Hyperlinked search interface for distributed database
US6643652B2 (en) 2000-01-14 2003-11-04 Saba Software, Inc. Method and apparatus for managing data exchange among systems in a network
US6785670B1 (en) * 2000-03-16 2004-08-31 International Business Machines Corporation Automatically initiating an internet-based search from within a displayed document
EP1662064A1 (en) 2000-04-24 2006-05-31 Hunter Douglas Inc. Compressible structural panel
US6457047B1 (en) 2000-05-08 2002-09-24 Verity, Inc. Application caching system and method
US6671684B1 (en) * 2000-09-01 2003-12-30 Ricoh Co., Ltd. Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document
US20020102966A1 (en) * 2000-11-06 2002-08-01 Lev Tsvi H. Object identification method for portable devices
IL155821A0 (en) * 2000-11-17 2003-12-23 Weitman Jacob Applications for mobile digital camera that distinguish between text and image-information in an image
US6687697B2 (en) * 2001-07-30 2004-02-03 Microsoft Corporation System and method for improved string matching under noisy channel conditions
US7251689B2 (en) 2002-03-27 2007-07-31 International Business Machines Corporation Managing storage resources in decentralized networks
AU2003282943A1 (en) * 2002-10-11 2004-05-04 Digimarc Corporation Systems and methods for recognition of individuals using multiple biometric searches
US7236632B2 (en) 2003-04-11 2007-06-26 Ricoh Company, Ltd. Automated techniques for comparing contents of images
JP2004348591A (ja) * 2003-05-23 2004-12-09 Canon Inc 文書検索方法及び装置
US20040260680A1 (en) * 2003-06-19 2004-12-23 International Business Machines Corporation Personalized indexing and searching for information in a distributed data processing system
US7493322B2 (en) * 2003-10-15 2009-02-17 Xerox Corporation System and method for computing a measure of similarity between documents
US7475061B2 (en) 2004-01-15 2009-01-06 Microsoft Corporation Image-based document indexing and retrieval
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US7565139B2 (en) * 2004-02-20 2009-07-21 Google Inc. Image-based search engine for mobile phones with camera
US8421872B2 (en) * 2004-02-20 2013-04-16 Google Inc. Image base inquiry system for search engines for mobile telephones with integrated camera
US7779355B1 (en) * 2004-03-30 2010-08-17 Ricoh Company, Ltd. Techniques for using paper documents as media templates
US7289806B2 (en) 2004-03-30 2007-10-30 Intel Corporation Method and apparatus for context enabled search
US20050289182A1 (en) * 2004-06-15 2005-12-29 Sand Hill Systems Inc. Document management system with enhanced intelligent document recognition capabilities
US7487072B2 (en) * 2004-08-04 2009-02-03 International Business Machines Corporation Method and system for querying multimedia data where adjusting the conversion of the current portion of the multimedia data signal based on the comparing at least one set of confidence values to the threshold
US8489583B2 (en) * 2004-10-01 2013-07-16 Ricoh Company, Ltd. Techniques for retrieving documents using an image capture device
US8335789B2 (en) 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US8332401B2 (en) 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8600989B2 (en) 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US8521737B2 (en) 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11203310A (ja) * 1998-01-13 1999-07-30 Ntt Data Corp 検索式作成方法及び装置
JP2001265811A (ja) * 2000-03-22 2001-09-28 Toshiba Corp 画像検索システムおよび画像検索方法
JP2002073682A (ja) * 2000-08-24 2002-03-12 Nec Corp 情報検索サービス装置及びその方法、インターネット対応の利用者端末装置及びその使用方法
JP2002314704A (ja) * 2001-04-17 2002-10-25 Koujiro Omoto データセンタシステムおよび文字入力方法
JP2003150624A (ja) * 2001-11-12 2003-05-23 Mitsubishi Electric Corp 情報抽出装置および情報抽出方法
JP2003256308A (ja) * 2002-03-01 2003-09-12 Nippon Telegr & Teleph Corp <Ntt> コンテンツ配信制御システムと方法およびコンテンツ配信サービス受付制御装置ならびにプログラムと記録媒体
JP2004038367A (ja) * 2002-07-01 2004-02-05 Nec Corp カメラ付き携帯電話を用いたインタネットホームページ接続システムおよびマーケティング情報収集システムとその方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10318995B2 (en) 2004-04-01 2019-06-11 Google Llc Contextual dynamic advertising based upon captured rendered text
JP2009540404A (ja) * 2006-06-06 2009-11-19 エクスビブリオ ベースローテン フェンノートシャップ 取り込まれたレンダリングテキストに基づくコンテキスト動的広告
JP2014041620A (ja) * 2006-06-06 2014-03-06 Google Inc 取り込まれたレンダリングテキストに基づくコンテキスト動的広告
CN105898857A (zh) * 2009-06-23 2016-08-24 北京三星通信技术研究有限公司 一种数据同步方法和系统
JP2015064901A (ja) * 2009-08-07 2015-04-09 グーグル インコーポレイテッド 視覚クエリに応答するためのアーキテクチャ
US10534808B2 (en) 2009-08-07 2020-01-14 Google Llc Architecture for responding to visual query

Also Published As

Publication number Publication date
JP4851763B2 (ja) 2012-01-11
US20110218018A1 (en) 2011-09-08
US8489583B2 (en) 2013-07-16
US20060085477A1 (en) 2006-04-20

Similar Documents

Publication Publication Date Title
JP4851763B2 (ja) イメージキャプチャー装置を使った文書検索技術
US8989431B1 (en) Ad hoc paper-based networking with mixed media reality
US9530050B1 (en) Document annotation sharing
US7812986B2 (en) System and methods for use of voice mail and email in a mixed media environment
US8005831B2 (en) System and methods for creation and use of a mixed media environment with geographic location information
US7920759B2 (en) Triggering applications for distributed action execution and use of mixed media recognition as a control input
US7991778B2 (en) Triggering actions with captured input in a mixed media environment
US7669148B2 (en) System and methods for portable device for mixed media system
US7639387B2 (en) Authoring tools using a mixed media environment
US8335789B2 (en) Method and system for document fingerprint matching in a mixed media environment
US8332401B2 (en) Method and system for position-based image matching in a mixed media environment
US8195659B2 (en) Integration and use of mixed media documents
US8838591B2 (en) Embedding hot spots in electronic documents
US7885955B2 (en) Shared document annotation
US20070050360A1 (en) Triggering applications based on a captured text in a mixed media environment
JP2015165395A (ja) 書式自動記入用携帯装置、書式自動記入用命令を記憶する非一時的コンピュータ可読記憶媒体、及び書式自動記入方法
US20060262352A1 (en) Method and system for image matching in a mixed media environment
US20070050712A1 (en) Visibly-Perceptible Hot Spots in Documents
US20060285772A1 (en) System and methods for creation and use of a mixed media environment
US20060262976A1 (en) Method and System for Multi-Tier Image Matching in a Mixed Media Environment
US20070047819A1 (en) Data organization and access for mixed media document system
WO2005048188A2 (en) Method and apparatus for capturing paper-based information on a mobile computing device
EP1917638A1 (en) System and methods for creation and use of a mixed media environment
JP2007082238A (ja) 個人情報端末とインタフェースを取る方法及び通信機器
WO2007023991A1 (en) Embedding hot spots in electronic documents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080825

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110401

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110726

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110803

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110927

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111021

R150 Certificate of patent or registration of utility model

Ref document number: 4851763

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3