JP2009022009A - 書類セキュリティ又は注釈のためのインビジブルジャンクション特徴の認識 - Google Patents

書類セキュリティ又は注釈のためのインビジブルジャンクション特徴の認識 Download PDF

Info

Publication number
JP2009022009A
JP2009022009A JP2008180794A JP2008180794A JP2009022009A JP 2009022009 A JP2009022009 A JP 2009022009A JP 2008180794 A JP2008180794 A JP 2008180794A JP 2008180794 A JP2008180794 A JP 2008180794A JP 2009022009 A JP2009022009 A JP 2009022009A
Authority
JP
Japan
Prior art keywords
document
feature
electronic document
image
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008180794A
Other languages
English (en)
Other versions
JP5095535B2 (ja
Inventor
Jonathan J Hull
ジェー ハル ジョナサン
Berna Erol
エロール ベルナ
Shigeharu Uda
茂晴 宇田
Ke Qifa
コォ チィファ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2009022009A publication Critical patent/JP2009022009A/ja
Application granted granted Critical
Publication of JP5095535B2 publication Critical patent/JP5095535B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Abstract

【課題】 画像ベースの書類パッチ認識用のインビジブルジャンクションを用いるシステムで、従来技術の欠点を克服すること。
【解決手段】 本発明は、電子書類のページ毎に固有の局所的特徴群であるインビジブルジャンクションを使用し、捕捉した画像を電子書類の一部と照合する。本発明は、画像捕捉装置、特徴量抽出及び認識システム、及びデータベースを含む。電子書類が印刷される場合、特徴量抽出及び認識システムは、書類ページの画像を捕捉する。捕捉した画像中の特徴は、抽出され、索引付けされ、データベースに格納される。所与の問い合わせ画像に関し、問い合わせ画像中の特徴が抽出され、データベースに格納済みの画像と比較され、その問い合わせ画像を確認する。本発明の特徴量抽出及び認識システムは、複合機に統合される。このことにより、特徴量抽出及び認識システムが、他のモジュールと共に用いられ、セキュリティ及び注釈用途を提供することが可能になる。
【選択図】 図1

Description

本発明はパッチ認識(patch recognition)の技法に関連する。具体的には、本発明は画像ベース書類パッチ認識に関するインビジブルジャンクション(invisible junction)と呼ばれる新たな特徴を使用するシステム及び方法に関連する。より具体的には、本発明はインビジブルジャンクションを使って書類セキュリティ及び注釈機能を提供するシステム及び方法に関連する。
かつてコンピュータ及び電子書類はデスクトップ環境での使用に制限されていた。デスクトップ環境では、電子書類はコンピュータによりプリンタに出力され、紙で印刷されていた。プリンタ及びコピーは、私用及び商用のオフィス環境で、パーソナルコンピュータを伴う家庭環境で及び書類印刷や出版サービス環境で使用される。電子書類が紙で印刷されると、これら2種類の書類の取り扱いは殆ど独立である。印刷及び複写技術は、静的な印刷媒体(即ち、紙書類)とインタラクティブな仮想世界(virtual world of interactivity)との間のギャップを埋めることができておらず、その仮想世界は、ディジタル通信、ネットワーキング、情報提供、広告、娯楽及び電子商取引等のようなものをふくむ。
ここ数年にわたる小型携帯コンピュータ装置及びパーソナル電子装置(例えば、パーソナルディジタルアシスタント(PDA)装置、携帯電話機(例えば、カメラ付き携帯電話機)及びディジタルカメラ等)の出現及び普及は、電子的に読取可能且つ検索可能な形式にすることで、及びインタラクティブなマルチメディア機能を導入することで、書類の概念を電子形式を含むように拡張し、これらは従来の印刷媒体では例を見ないものである。
一方の電子書類の世界と他方の紙書類の世界の間を橋渡しする際、従来技術には問題がある。電子的にアクセス可能な仮想マルチメディアの世界と紙媒体の物理的な世界との間にはギャップがある。特に、印刷された書類を使って、その紙書類の生成元の電子書類にアクセスすること又はそれを発見することさえ、非常に困難である及び/又は演算負担が大きい。印刷された書類に対応する電子書類を特定及び発見する際の主な障害は、カメラで捕らえられている画像パッチの認識である。印刷書類の画像を捕捉することは、カメラ付き携帯電話の普及と共に些細なことになりつつあるが、そのような低解像度画像を使って電子書類を取り出す技法は確立してない。
言い換えれば、カメラが見ている書類ページをデータベースから効率的に特定し、認識されたページでカメラが見ている地点をピンポイントで正確に特定し、認識された書類ページにおける画像のフレームボックスを推定する方法は確立してない。この認識作業は、次のような事項により更に困難になる:1)入力画像は、眺めている書類ページの小さな一部分であること;2)互いに同様に見える多数の書類ページがデータベースに存在すること;3)携帯カメラは様々な表示状態を有し、その表示状態は、手の動きに起因して紙及びカメラの動きに関して様々な表示角度及び距離を含むこと;4)照明の変化に起因して顕著な光度変動が起こること;及び5)ユーザが紙を手で持っている場合、平坦でない幾何学的な歪みがあるかもしれないこと等である。
従来いくつかの試みがあるが、それらはいくつもの欠点を有する。例えば、一般的なSIFT(Scale Invariant Feature Transform)は、テキスト書類には適していない。SIFTキーポイントは、スケール空間中の極値から選択される。より具体的には、全てのスケール及び画像位置が、スケール空間内の局所的な最大値に関してスキャンされ、それらの局所的な最大値がキーポイント候補になる。これは文字の識別におけるSIFTを貧弱なものにしてしまい、SIFTは適切でなくなり、ノイズの多い環境で反復的になる。他の従来法は、テキストブロックの幾何学的特徴に焦点を当てるが、それらはアジアの言語や象形文字の言語には適切でない。
従来技術の1つの問題は、利用可能な僅かな認識タイプしか識別力が無く、文字や画像とテキストの組み合わせに関して貧弱にしか機能しないことである。例えば、画像及び文字の混ざった画像で処理するときに、光学文字認識の精度はかなり減少する。これは、部分的には、全てのテキスト書類の幾何学的配置に何らかの規則性のあることに起因する。しばしば従来の認識法は、ランキングと共に又はランキングを伴わずに多数の合致候補を返し、その候補は多くの誤った肯定的な合致を与える。
高品質スキャナ又は複合機(MFP:Multifunction Peripheral)が書類の画像を捕捉するために使用される場合であっても、書類のデータベースから書類又は書類内の位置を特定することは精度に欠け、計算集約的になる。多くの場合、合致結果が作られない。捕捉された画像に近い合致を見つける従来技術のシステムの機能は、重複、走査又は他の処理を妨げるこのような書類セキュリティ処理がMFPに追加されていない1つの理由である。
従来技術の更なる別の問題は、紙及びコンピュータ装置の組み合わせを使用しながら、仮想世界と効率的にインターフェースをとる方法が確立されていないことである。コンピュータ画面に単独で表示可能な及びマウス型のコントローラやキーボード等と共に使用される、ツールバー、ボタン及び他のインターフェースのような様々な手段が存在する。しかしながら、紙又は有形媒体及び電子書類と共に同時に機能するインターフェースは未だ無い。特に、従来技術は、紙書類を用いて電子書類に注釈を追加する機構を有していない。
本発明の課題は、画像ベースの書類パッチ認識用のインビジブルジャンクションを用いるシステムで、従来技術の欠点を克服することである。
本システムは有利である。なぜなら、本システムは画像パッチのインビジブルジャンクションを用いて、関連する電子書類、ページ、見ている場所及び見ている領域を特定及び抽出するからである。本システムは有利である。なぜなら、本システムは西洋の及び東洋の言語双方で非常に高速に動作し、文字及び画像成分の混ざった画像を処理するからである。本発明は、電子書類のページ毎に固有の局所的な特徴群であるインビジブルジャンクションを利用して、捕捉した画像と電子書類の一部分とを照合する。一実施例では、本発明によるシステムは、画像捕捉装置、特徴量抽出及び認識システム、及びデータベースを含む。特徴量抽出及び認識システムは、特徴量抽出部、特徴量インデキシング部、特徴量検索部及び幾何学的推定部を更に有する。電子書類が印刷される場合、特徴量抽出及び認識システムは、例えば印刷捕捉ソフトウエアにより、書類ページの画像を捕捉する。その後、捕捉した画像中の特徴は、抽出され、索引付けされ、データベースに格納される。所与の問い合わせ画像(query image)−通常的には、ウェブカム(web-cam)のような低解像度の画像捕捉装置で捕捉された何らかの書類ページの小さなパッチ−に関し、問い合わせ画像中の特徴が抽出され、データベースに格納済みの画像と比較され、その問い合わせ画像を確認する。ある実施例では、MFPによる前ページのスキャンが問い合わせ画像として用いられる。
特徴量抽出及び認識システムは、有利なことに、幾何学的な推定を利用して、問い合わせ結果を、単一の又は少数の合致候補に減らす。一実施例では、特徴量抽出及び認識システムは、2つの別個の幾何学的推定を利用して、照合する候補を格付け及び確認する。本発明は、特徴量抽出、特徴量インデキシング、特徴量検索及び幾何学低推定を行う方法も含む。
本発明は、書類セキュリティ及び書類注釈にインビジブルジャンクション認識を使用する方法も含む。捕捉した書類の画像は、携帯電話カメラ、ウェブカメラ又はMFPでのスキャンで捕捉することで受信される。次に、捕捉した画像で特徴量抽出が実行され、抽出された特徴が書類検索を実行するために使用される。合致書類が検索されない場合、書類は通常通り処理される。しかし、合致書類が検出された場合、この方法は、合致書類に関連するセキュリティ処理が存在するか否か、及び存在する場合には捕捉した画像がセキュリティ処理に従って処理されるかを決定する。同様に、インビジブルジャンクション認識は書類注釈にも使用可能である。書類を照合するために、ユーザは、捕捉した書類に対応する電子書類の注釈を作るために実行される命令を更新及び処理するように促される。
上記の特徴及び利点は全てを包含するものではなく、特に、多くの追加的な特徴及び利点が、明細書及び図面の観点から、当該技術分野で通常の知識を有する者に明らかになるであろう。更に、本願で使用されている言葉は、原則として、説明や理解を促すように選ばれており、発明事項の範囲を限定する意図ではないことに留意すべきである。
本発明は非限定的な実施例により添付図面と共に以下で説明され、図中、同様な要素を指すために同様な番号が使用される。
画像ベース書類パッチ認識のインビジブルジャンクションと言及される新規な特徴を利用するシステムが説明される。以下の説明では、説明の目的で多くの具体的詳細が説明され、本発明の十分な理解を図っている。しかしながら、本発明はそのような具体的詳細によらずに実施できることは当業者に明らかであろう。また、本発明を曖昧にすることを避けるため、構造や装置はブロック図形式で示される。
本明細書における「一実施例」又は「実施例」は、その実施例に関して説明される特定の特質、構造又は特徴が、本発明の少なくとも1つの実施例に含まれることを意味する。本明細書の様々な場所で「一実施例」なる用語が使用されていることは、全て同じ実施例であることを必ずしも意味しているわけではない。
以下の詳細な説明の一部は、コンピュータメモリ内のデータビットを処理するアルゴリズム及び記号表現で与えられる。これらのアルゴリズムの説明及び表現は、データ処理技術分野の当業者が他の当業者に彼らの仕事内容を最も効率的に伝えるのに使用される手段である。ここで、アルゴリズムは一般に所望の結果に導く首尾一貫した一連のステップと考えられる。そのステップは物理量の物理的処理を必要とするものである。必須ではないが、通常それらの物理量は、格納、転送、結合、比較その他の処理を施すことの可能な電気的な又は磁気的な信号の形態をとる。原則的な一般的な用法の観点から、ビット、値、エレメント、シンボル、キャラクタ、期間、数等としてそれらの信号に言及することが折に触れて便利なことが分かる。
しかしながら、これらの及び類似の用語の全ては、適切な物理量に関連しており且つそれらの量に付された便宜的なラベルにすぎないことに留意を要する。特に断りのない限り、以下の説明から明らかなように、本説明を通じて、「処理」、「演算」、「計算」、「決定」又は「表示」等のような用語を用いる説明は、コンピュータシステム又は同様な電子コンピュータ装置の動作や処理に関連し、その動作や処理は、コンピュータシステムのレジスタ及びメモリの中で物理的な(電子的な)量として表現されるデータを、コンピュータシステムメモリやレジスタその他の情報ストレージ、伝送又は表示装置の中で物理量として同様に表現される他のデータに変換及び処理することが、理解されるであろう。
本発明はここで説明される処理を実行する装置にも関連している。その装置は、必要な目的に応じて特別に構築されてもよいし、コンピュータに格納されているコンピュータプログラムによって選択的にアクティブにされる又は再構成される汎用コンピュータで構築されてもよい。そのようなコンピュータプログラムはコンピュータ読取可能な記憶媒体に格納されてもよく、その記憶媒体は、フロッピディスク、光ディスク、CD-ROM、磁気光ディスク、リードオンリメモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁気又は光カード等の如何なるタイプのディスクを含んでもよいし、或いはそれぞれコンピュータシステムバスに結合されて電子的な命令を格納するのに適した如何なるタイプの媒体を含んでもよい。
最後に、ここで説明されるアルゴリズム及び表示は、特定のコンピュータその他の装置のどれにも固有に関連するものではない。様々な汎用システムがここで教示するものによるプログラムと共に使用されてよく、或いは、必要な方法ステップを実行するように、よりいっそう特化した装置を構築することが便利なことが分かるかもしれない。これら様々なシステムに必要な構造は以下の説明から明らかになるであろう。更に、本発明は特定のプログラミング言語のどれにも依存しない。ここで説明される本発明の教示内容を実現するのに様々なプログラミング言語が使用されてよいことが分かるであろう。
システム概要
図1を参照するに、新たな特徴を使用する本発明のシステムの例100が示され、その新たな特徴は、画像ベース書類パッチ認識のインビジブルジャンクション(invisible junction)と言及される。本発明はインビジブルジャンクションを使用し、インビジブルジャンクションは、図5A−5Dを参照しながら以下で説明されるようなローカル(局所的)な一群の特徴であり、捕捉した画像を電子書類の一部分と照合するためのものである。本実施例では、システム100は、画像捕捉装置106、特徴量抽出及び認識システム108、並びにデータベース110を有し、印刷された又は紙の書類102の一部の画像を捕捉し、対応する電子書類、ページ、見ている場所及び見ている領域を抽出する。紙書類102の元の領域104と電子表現112との間の関連付け(対応関係)は、線114で示されている。図1は、ある紙書類102の小さなパッチ104のようなクエリ画像(問い合わせ画像)を画像捕捉装置106で捕捉するシステム100の具体例を示す。特徴量抽出及び認識システム108は、問い合わせ画像中の特徴を抽出し、データベース110に格納済みの画像とそれらを比較し、電子表現112を同定する。
画像捕捉装置106は当該技術分野で既知の如何なる既存のタイプのものでもよい。例えば、問い合わせ部分を処理する場合、画像捕捉装置106は、ウェブカメラでもよいし、携帯電話に備わるカメラでもよいし、或いはディジタルカメラでもよい。本発明は、低解像度の画像捕捉装置で動作可能なので、特に有利である。画像捕捉装置106は、特徴量抽出及び認識システム108と通信するように結合されている。この通信は有線ネットワークを介してもよいし或いは無線ネットワークを介してもよい。
モデル画像が索引付け(インデキシング)される別の例では、画像捕捉装置106は、印刷書類を生成するソフトウエアや複合機のスキャナである。例えば、そのような実施例の場合、画像捕捉装置106は印刷捕捉ソフトウエアでもよい。これらの実施例はコンピュータ(図示せず)により出力又は印刷される書類を索引付けするのに使用される。
特徴量抽出及び認識システム108は、特徴量抽出、索引付け及びインビジブルジャンクションの検索に関する機能を実行する。特徴量抽出及び認識システム108は、特徴量抽出部310、特徴量インデキシング部312、特徴量検索部314及び幾何学的推定部316を、図2−4を参照しながら詳細に後述されるように更に有する。特徴量抽出及び認識システム108は、画像捕捉装置106に結合され、画像パッチ又は紙書類のモデル画像、紙書類の画像を受信する。特徴量抽出及び認識システム108は、データベース110に結合され、書類ページ及び電子書類の特徴記述又は電子書類に至るためのインデックスを格納する。特徴量抽出及び認識システム108は更にデータベース110にも結合され、検索の際に電子書類へのインデックス又は電子書類を検索する。特徴量抽出及び認識システム108は電子書類、ページ、見ている地点及び見ている領域等の検索されたものを、ユーザインターフェースで表示するために他のコンピュータシステムへ出力する。
データベース110は通常のタイプのものであり、インデックス、電子書類、特徴記述及び他の情報(索引付けプロセス及び検索プロセスで使用される他の情報)を格納する。データベースはデータベースの連体でもよい。一実施例では、データベース110は複合機内に設けられる。
本発明によるシステム100は、多数の利益をもたらす点で特に優れている。第1に、本発明は新たな特徴を使用し、その特徴はインビジブルジャンクションと呼ばれ、対応する電子書類、ページ、見ている場所及び見ている領域を特定及び検索することを可能にする。インビジブルジャンクションは、ノイズや表示状態によらない独立性や安定性をもたらし;問い合わせ画像及びモデル画像双方で反復可能であり;強い識別性をもたらし;低次元である。第2に、本発明は10000ページのデータベースで毎秒ほぼ4フレームという非常に速い速度で認識及び検索を行う。この認識及び検索は、リアルタイムのインタラクティブなアプリケーションに充分なほど速い。第3に本発明は、認識及び検索の際、カメラ付き携帯電話で取得されるような低品質の入力画像を利用できる。言い換えれば、画像の回転、スケール変更及び噛み合わせ(occlusions)によらず、検索は正確に行われる。第4に、本発明は東洋の及び西洋の言語の双方で認識及び検索を実行できる。第5に、本発明は、文字及び図形画像双方を含む入力画像について、テキストから画像に至るどの部分ででも、認識及び検索を実行できる。
システム実施例
図2を参照するに、本発明の一実施例により構築された特徴量抽出及び認識システム108の機能ブロック図が示されている。特徴量抽出及び認識システム108は、好ましくは、制御部250、ディスプレイ装置210、入力装置212、カーソル制御部214、通信装置216及び1つ以上の入力/出力(I/O)装置218を有する。
制御部250は、算術論理演算部、マイクロプロセッサ、汎用コンピュータ又は他の情報機器を有し、ディスプレイ装置210に電子表示信号を提供するように備えている。一実施例では、制御部250はグラフィックユーザインターフェース(GUI)を有する汎用コンピュータを有し、例えば、そのGUIはウインドウズ(登録商標)又はユニックス(登録商標)ベースのオペレーティングシステムのようなオペレーティングシステム上で動作するジャバ(Java(登録商標))で書かれたプログラムによって生成されてもよい。一実施例では、1つ以上のアプリケーションプログラムが制御部250によって実行され、そのアプリケーションプログラムは、限定ではないが、描画アプリケーション、ワードプロセシングアプリケーション、電子メールアプリケーション、財務アプリケーション及びウェブブラウザアプリケーション等を含む。
更に図2を参照するに、制御部250はプロセッサ202、メインメモリ204及びデータストレージ装置206を含むように示され、それら全てはシステムバス208に通信可能に結合されている。
プロセッサ202は、データ信号を処理し、様々なコンピュータアーキテクチャを備えていてもよく、コンピュータアーキテクチャは、複合命令セットコンピュータ(CISC)アーキテクチャ、縮小命令セットコンピュータ(RISC)アーキテクチャ又は組み合わせの命令セットを実現するアーキテクチャを含んでよい。図2には1つのプロセッサしか図示されていないが、複数のプロセッサが含まれてもよい。
メインメモリ204は、プロセッサ202で実行されてもよい命令及び/又はデータを格納する。命令及び/又はデータは、本願で説明される技法の全部又は何らかの一部分を実行するコードを有する。メインメモリ204は、ダイナミックランダムアクセスメモリ(RAM)装置、スタティックランダムアクセスメモリ(SRAM)装置、又は当該技術分野で既知の他のメモリ装置でもよい。メモリ204は図3に関連して更に詳細に説明される。
データストレージ装置206は、プロセッサ202用のデータ及び命令を格納し、1つ以上の装置を有する。1つ以上の装置は、ハードディスクドライブ、フロッピディスクドライブ、CD-ROM装置、DVD-ROM装置、DVD-RAM装置、DVD-RW装置、フラッシュメモリ装置又は当該技術分野で既知の他の大容量ストレージ装置等を含む。一実施例では、データストレージ装置206はデータベース110を含む。別の実施例では、データベースは特徴量抽出及び認識システム108に通信装置216及び信号線220(通常のネットワークを表す)を介して結合される。
システムバス208は、制御部250の中で情報及びデータを通信するための共有バスを表す。システムバス208は1つ以上のバスを表現し、その1つ以上のバスは、工業規格アーキテクチャ(ISA)バス、ペリフェラルコンポーネント相互接続(PCI)バス、ユニバーサルシリアルバス(USB)又は同様な機能を備えた当該技術分野で既知の他のバスを含む。システムバス208を介して制御部250に結合される追加的なコンポーネントは、ディスプレイ装置210、入力装置212、カーソル制御部214、通信装置216及びI/Oデバイス218を含む。
ディスプレイ装置210は、上述したような電子画像及びデータを表示するように用意された如何なる装置を表現してもよい。一実施例では、ディスプレイ装置210は、液晶ディスプレイ(LCD)及び発光ダイオード(LED)であり、ステータスフィードバック、動作設定及び他の情報をユーザに与える。他の実施例では、ディスプレイ装置210は、例えば陰極線管(CRT)でもよいし、或いは表示装置、画面又はモニタを備えた同様な他の如何なるものでもよい。一実施例では、ディスプレイ装置210はタッチスクリーンを備え、及び/又はディジタイザを含み、接触式で感知する透明パネルがディスプレイ装置210の画面をカバーしている。
一実施例では入力装置212はキーパッドである。キーパッドはQWERTYキーパッド、キーのパッド、又はタッチスクリーン上でそのように表現されたものでもよい。カーソル制御部214はユーザ入力装置を表現し、位置データだけでなくコマンド選択内容もプロセッサ202に伝送するように備えられる。カーソル制御部214は、マウス、トラックボール、スタイラス、ペン、タッチスクリーン、カーソル指示キー、又はカーソルを動かす他の手段を含んでもよい。
通信装置216は、制御部250をネットワーク220に結合し、ネットワークは複数の処理システムを含み、一実施例ではネットワークコントローラである。処理システムのネットワークは、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)(例えば、インターネット)及び/又は他の何らかの相互接続されたデータ経路(そのデータ経路で複数の装置が通信可能である)を含んでもよい。制御部250は、ネットワークのような他のシステムに対する他の通常の接続も有し、当業者に理解されるようなTCP/IP、http、https及びSMTPのような標準的なネットワークプロトコルを使ってファイル(メディアオブジェクト)を分配する。
1つ以上のI/Oデバイス218はバス208に結合される。これらのI/Oデバイスは他のシステム(図示せず)の一部分でもよい。例えば、I/Oデバイス218は、書類の画像を捕捉する画像スキャナを含んでもよい。I/Oデバイス218も書類を生成するプリンタを含んでもよい。I/Oデバイス218はオーディオ入力/出力装置を備え、マイクロホンを介して音声入力を受信し、スピーカを介して音声出力を送信してもよい。一実施例では、オーディオ装置は汎用のものでもよいし、汎用コンピュータシステム内で使用するように設計されたオーディオアドイン/拡張カードでもよい。選択的に、I/Oオーディオ装置は、1つ以上のアナログディジタル変換機又はディジタルアナログ変換器、及び/又は1つ以上のディジタル信号プロセッサを含み、オーディオ処理を行ってもよい。
特徴量抽出及び認識システム108は、本発明の精神及び範囲から逸脱せずに、図2に示されるものより多い又は少ない要素を含んでよいことが、当業者に明らかであろう。例えば、特徴量抽出及び認識システム108は、追加的なメモリ(例えば、第1又は第2レベルキャッシュ)又は1つ以上の特定用途向け集積回路(ASIC)を含んでもよい。更に、特徴量抽出及び認識システム108は、単独のバス208ではなく、複数のデータバスを含んでもよい。複数のバスは、特徴量抽出及び認識システム108の構成要素間の及び構成要素からの画像データを高速に転送することを可能にし、例えば、ディスプレイ装置へのユーザインターフェース情報の同時データ転送を可能にする。同様に、追加的な入力/出力装置218は制御部250に結合され、制御部はRFIDタグリーダ、ディジタルスチル若しくはビデオカメラ又は他の装置(制御部250に電子データをダウンロードする及び/又は取得するように備わっていてもいなくてもよい)を含む。1つ以上の要素は、キーボード及びカーソル制御部212のように省略されてもよい。
図3は特徴量抽出及び認識システム108のメモリユニット204の一例を示すブロック図である。メモリユニット204は、好ましくは、オペレーティングシステム302、アプリケーション304、制御モジュール306、ブラウザ308、特徴量抽出部310、特徴量インデキシング部312、特徴量検索部314、幾何学的推定部316、ビデオトラッカ320、用紙トラッカ322、認識部324、ドリフトコレクタ326、ユーザインターフェースモジュール328、セキュリティモジュール330、注釈モジュール332及びパッチマップモジュール334を有する。当業者は、メモリ204がバッファを含み、そのバッファは索引付け及び検索プロセスの際にデータ及び他の情報を一時的に格納することを認識するであろう。上述したように、メモリユニット204は、プロセッサ202で実行される命令及び/又はデータを格納する。命令及び/又はデータは、本願で説明される技法の全部又は何れかを実行するコードを有する。これらのモジュール302-334はバス208によりプロセッサ202に結合され、システム100と通信及び協働する。本発明はコンピュータのメモリユニット204の一部分として又はモジュールとして説明されるが、そのモジュール又は一部分は、永続的なデータストレージ装置206のような他の媒体に格納されてもよいし、クライアント/サーバ環境の場合のような複数のコンピュータを有するネットワーク220の中で分散されてもよいことを、当業者は認識するであろう。
オペレーティングシステム302は、好ましくは、カスタムオペレーティングシステムであり、アプリケーションインターフェースを介してユーザはそこにアクセス可能である。代替例では、オペレーティングシステム302は、ウインドウズ(登録商標)、ソラリス(登録商標)又はリナックス(登録商標)ベースのオペレーティングシステムのような通常のタイプのものでよい。
メモリユニット204は、1つ以上のアプリケーションプログラム304を含み、そのアプリケーションプログラムは、限定ではないが、描画アプリケーション、ワードプロセシングアプリケーション、電子メールアプリケーション、財務アプリケーション及びウェブブラウザアプリケーション等を含む。一実施例では、アプリケーション304は特にメモリ204の他のモジュール又はユニットに固有の機能を使用し、印刷された用紙及び対応する電子書類間のリンクをユーザが設定及び確認できるようにすることで、電子書類及び紙書類間のギャップを埋める(橋渡しを行う)。より具体的には、アプリケーション304は用紙からの電子データにアクセスし、及び電子データを用紙上の特定の場所に付随させ/埋め込み、ユーザが、上記の処理用のツールとしてのカメラを使って、その用紙からの電子データを後で検索できるようにする。例えば、あるアプリケーション304は、ユーザが単にウェブカムを指示し、指示された用紙の画像を捕捉したことに応答して、印刷された用紙の電子ファイル(マイクロソフトワード、アドビPDF等)を検索する。他のアプリケーション例304は、紙ベースのフォトwiki(paper-based photo-wiki)であり、物理的な用紙マップ上の所望の場所にカメラを単に指示することで、ユーザが撮影した像を用紙マップ上の特定の場所に付ける。これらには他の多くのアプリケーション304があり、そのアプリケーションは、例えば、書類データベースにアクセス又はブラウズする新規なユーザインターフェース、ディジタルペン及び用紙、マップナビゲータ、コピー機及びスキャナのセキュリティ、カメラゲーム、著作権保護用の重複検出等である。
制御モジュール306は、メモリ204の他のモジュールを制御するのに使用される。制御モジュール306は、アプリケーション304、ブラウザ308、特徴量抽出部310、特徴量インデキシング部312、特徴量検索部314及び幾何学的推定部316の制御を行い且つそれらとの通信を行うように合わせられている。制御モジュール306の動作は、図4及び6−9に関する以下の説明から明らかになるであろう。制御モジュール306はメモリ204の別個のモジュールとして示されているが、当業者は、別の実施例での制御モジュール306が他のモジュール310-316でのルーチンとして分散されてよいことを認識するであろう。
ブラウザ308は、マイクロソフト(登録商標)のインターネットエクスプローラ又はモジリアのファイヤフォックスのような通常のタイプのものでよい。ウェブブラウザはソフトウエアアプリケーションであり、そのソフトウエアアプリケーションは、文字、画像及び他の情報(典型的には、ローカルエリアネットワーク又はワールドワイドウェブのウェブサイトのウェブページにある)と共にユーザが表示及びやりとりすることを可能にする。
特徴量抽出部310は、紙書類のスキャンした画像及び元の電子書類からインビジブルジャンクション特徴を取り出すソフトウエア及びルーチンである。一実施例では、特徴量抽出部310は、元の電子書類の受信に関連する入力機能と、特徴量記述を特徴量インデキシング部312に与える出力機能とを含む。他の実施例では、特徴量抽出部310は、紙書類の画像を受けるように結合された入力を含み、特徴記述を特徴量検索部314に与える。更に別の実施例では、特徴量抽出部310は、ロケーション判定モジュール、サイズ判定モジュール、方向判定モジュール及び記述子生成モジュールを含み、これらを組み合わせることで特徴量記述を生成する。特徴量抽出部310の動作は、図5A−6を参照しながら以下で詳細に説明される。特徴量抽出部310は、特徴量インデキシング部312及び特徴量検索部314と通信するように結合される。
特徴量インデキシング部312は、インビジブルジャンクション特徴記述子の1つ以上のインデックスを生成し、それらをデータベース110に格納するためのソフトウエア及びルーチンである。一実施例では、特徴量インデキシング部312は量子化ツリーを使って特徴記述を索引付けする。特徴量インデキシング部312は、特徴量抽出部310の出力に結合され、インビジブルジャンクション特徴記述子を受ける。特徴量インデキシング部312はデータベース110に結合される。特徴量インデキシング部312の動作は、図7A及び7Bを参照しながら以下で詳細に説明される。
特徴量検索部314は、紙書類のインビジブルジャンクション特徴記述子からクエリ(query)を作成し、データベース110と通信し、データベース110の中で合致する電子書類の表示領域、場所及び書類を検索するソフトウエア及びルーチンである。特徴量検索部314は、特徴量抽出部310の出力に結合されてインビジブルジャンクション特徴記述子を受信し、データベース110に結合され問い合わせを実行して結果を受信する。可能性のある照合する書類、場所及び表示領域は、特徴量検索部314により出力される。特徴量検索部314の動作は図8を参照しながら以下で詳細に説明される。
幾何学的推定部316は、特徴量検索部314から出力された候補書類を分類し、ある幾何学的制約に合う特徴点を最大数含む書類を選択するソフトウエア及びルーチンである。幾何学的推定部316は、特徴量検索部314と通信するように適合させられ、入力画像パッチに合う視野、ポイント及び書類を与える出力を有する。幾何学的推定部316の動作は図9Aを参照しながら以下で詳細に説明される。
本発明は、入力クエリ画像に基づいて、見ている場所及び見ている領域を認識及び追跡する機能も有する。書類、見ている場所及び見ている領域を指す情報を生成することに加えて、本発明はその情報を元の電子書類と合併し、新たなユーザインターフェースを生成し、その新たなユーザインターフェースは、ユーザに正確な情報を与え、電子書類の中で非常に具体的な場所を結び付け(リンクさせ)、注釈の付加等の動作や動作の制御に備える。この認識及び追跡機能は、ビデオトラッカ320、用紙トラッカ322、認識部324及びドリフトコレクタ326によって用意される。制御モジュール306は、ビデオトラッカ320、用紙トラッカ322、認識部324及びドリフトコレクタ326の動作を図10Cの状態図に合わせて制御する。代替実施例では、認識及び追跡モジュールのような他のモジュール(図示せず)が、制御モジュール306の代わりに使用されてもよいことを当業者は認識するであろう。この機能は図10A,10Cを参照しながら以下で詳細に説明される。
ビデオトラッカ320は、ビデオフレーム間の投影変換等を行う、カメラ動作を追跡するソフトウエア及びルーチンである。ビデオトラッカ320は第1ビデオフレームを基準フレーム(リファレンスフレーム)として使用し、カメラの動きを示す情報を出力する。本質的には、ビデオトラッカ320はフレーム間でのカメラの相対的な動き提供する。ビデオトラッカ320は、特徴量検索部314と通信するよう適合させられ、特徴記述子を受信し、生成されたカメラ動作情報をもたらす出力を有する。ビデオトラッカ320の動作は、図10A,10Cを参照しながら以下で詳細に説明される。
用紙トラッカ322は、用紙の位置に関するカメラの動きを追跡するソフトウエア及びルーチンである。用紙トラッカ322は紙面を基準フレームとして使用し、その紙面に対するカメラ位置を示す情報を出力する。その情報は、用紙に関して動くビデオトラッカ320からの情報を変換するのに使用可能である(相対的な又は局所的な座標空間からグローバルな座標空間への変換)。用紙トラッカ322は、特徴量検索部314と通信するように適合させられ、特徴記述子を受信し、用紙位置情報を与えるように出力する。用紙トラッカ322の動作は、図10A,10Cを参照しながら以下で詳細に説明される。
認識部324は、書類のページ、場所及び表示領域、現在のビデオフレーム等を認識し、用紙及びビデオフレーム間のリンクをイニシャライズするソフトウエア及びルーチンである。認識部324は、特徴量検索部314、ビデオトラッカ及び用紙トラッカ322と通信するよう適合させられる。認識部324は、現在のビデオフレーム、用紙とビデオフレームとの間のリンクを用紙トラッカ322に与える。認識部324の動作は、図10A,10Cを参照しながら以下で詳細に説明される。
ドリフトコレクタ326は、用紙及びビデオフレーム間のリンクを修正するソフトウエア及びルーチンである。ドリフトコレクタ326は、用紙トラッカ322と通信するよう適合させられ、書類のページ、場所及び表示領域がその用紙に関して適切に整合していることを確認するために、信号を送信する。ドリフトコレクタ326は、その情報を用紙トラッカ322に与える。ドリフトコレクタ326の動作は、図10A,10Cを参照しながら以下で詳細に説明される。
ユーザインターフェースモジュール328は、図10A−10K及び図15−19Hを参照しながら以下で詳細に図示及び説明されるユーザインターフェースを生成するソフトウエア及びルーチンである。一実施例では、ユーザインターフェースモジュール328は、ビデオトラッカ320、用紙トラッカ322、認識部324及びドリフトコレクタ326と共に動作し、ユーザへの視覚的なフィードバックを生成し、表示領域及びカメラの見ている場所を示す。他の実施例では、ユーザインターフェースモジュール328はこれらの要素と共に機能し、カメラ位置を決定し、そのカメラ位置の変化を制御手段として使用し、3次元モデルとのインターフェースをとり及び3次元ナビゲーションを行う。他の実施例でのユーザインターフェースモジュール328の動作は、図15乃至19Hを参照しながら詳細に説明される。
本発明は更に、書類セキュリティ及び書類注釈にインビジブルジャンクション認識を使用する機能を含む。一実施例では、メモリユニット204は、セキュリティモジュール330、注釈モジュール332及びパッチマップモジュール334を含む。これらのモジュール330、332、334は、図11を参照しながら以下に説明される同じ名前のモジュールと機能的に同じである。書類セキュリティ機能はセキュリティモジュール330により提供される。セキュリティモジュール330は、図11−19を参照しながら以下に説明されるセキュリティ処理を実施するソフトウエア及びルーチンである。書類注釈機能は注釈モジュール332により提供される。注釈モジュール332は、図11−19を参照しながら以下に説明される注釈処理を実施するソフトウエア及びルーチンである。一実施例では、書類セキュリティ機能はパッチマップを生成及び利用する。パッチマップモジュール334は、図11−19を参照しながら以下に説明されるパッチマップを生成及び利用するソフトウエア及びルーチンである。制御モジュール306は、セキュリティモジュール330、注釈モジュール332及びパッチマップモジュール334の処理も制御する。
図4を参照するに、本発明の一実施例による特徴量抽出及び認識システム108の機能的なフローが示されている。特徴量抽出及び認識システム108は、2つの動作モードを有し;第1モードでは、オリジナルの電子書類が表示及び入力され、その入力からのインビジブルジャンクション特徴に関して、特徴インデックスが格納され;第2モードでは、画像パッチが入力され、特徴記述が作成され、その特徴記述を使って、対応する書類、場所及び表示領域を検索して出力する。説明の簡明化を図るため、他の実施例で上記の同じ又は同様な機能を有する要素について、同様な番号が使用される。システム108のこの第2の例は、特徴量抽出部310、特徴量インデキシング部312、特徴量検索部314及び幾何学的推定部316を含む。
図4は、特徴量抽出部310、特徴量インデキシング部312、特徴量検索部314及び幾何学的推定部316間の情報の流れを示す。特に、2つの動作モードが別個の組み合わせ420,430と共に示されている。例えば、第1モードは二重線420の経路と共に示され、元の電子書類402が表示され、信号線420を介して特徴量抽出部310に入力される。特徴量抽出部310は、その書類402のインビジブルジャンクションの特徴記述子を信号線420を介して特徴量インデキシング部312に出力し、特徴量インデキシング部312はインデックスを生成し、それらをデータベース110に格納する。第2モードは単一の線430の経路と共に示され、ビデオデータ又はビデオフレームのパッチ404が、信号線430を介して特徴量抽出部310に入力される。特徴量抽出部310は、そのビデオフレーム404内のインビジブルジャンクションの特徴記述子を、信号線430を介して特徴量検索部314に出力する。特徴量検索部314は、特徴記述子を用いて信号線430を介してデータベース110に問い合わせを行い、合致する特徴を有する書類のリストを信号線430を介して幾何学的推定部316に出力する。幾何学的推定部316は、幾何学的な制約を適用し、合致する書類、場所及び表示領域406を選択する。
インビジブルジャンクション特徴量
本発明は、書類パッチ認識に関する新たな特徴群を作成及び使用する。書類表現及び検索に使用される特徴点は、書類ページに存在する固有の骨組の分岐合流点(ジャンクション)である。これらのジャンクションは目に見えないので、即ち、テキスト書類の空白スペース内にある又は一様な色の領域内にあるので、我々はそれらを「インビジブルジャンクション」又は「インビジブルジャンクション特徴」と言及している。インビジブルジャンクション特徴には、4つの主要な成分がある:
ロケーション:特徴点の座標(x,y)。書類ページの左上隅を原点とする。
方向:隣接する画素を使って各特徴点の記述を計算する際、各特徴点について、局所的な座標系を設定するために使用される。
スケール:特徴の大きさ。
説明:特徴の内容。
特徴の内容は、これらの主要な成分(キーファクタ)全てによって決定されるので、それらを安定的に反復可能に持つことは重要である。認識を行うため、記述子(特徴記述)も識別可能でなければならない。
特徴量抽出
図5A乃至5D及び図6を参照するに、特徴量抽出を行うプロセスの一例が示されている。プロセスは書類を受信すること602で始まる。一実施例では、特徴量抽出部310が、電子書類402の理想的なモデルを受信する602。別の実施例では、特徴量抽出部310は、ビデオフレーム又はウェブカメラ画像のような印刷された書類404の捕捉画像を受信する602。
本プロセスは次に、1つ以上のインビジブルジャンクションの場所を判定するステップに進む(604)。一実施例では、特徴量抽出部310は、テキスト書類の骨組みの分岐合流点で特徴を検出する。本実施例に関し、図5A及び5Bに示されるように、特徴量抽出部310は、入力画像を2値化し、2値画像に距離変換を適用する。入力画像501の例の場合、入力画像501を2値化したもの502及び2値化されたものの距離変換503が、図5Aに示されている。次の骨組み(スケルトン)504は、距離変換によるラベルフィールドの境界として検出される。スケルトン504は代替的に、距離フィールドの尾根線(ridge line)でもよい。例えば図5Aの入力例に関し、距離変換503及びスケルトン504が図5Bに示されている。この特徴は、図5Bに示されるようなジャンクション点506として検出される。ジャンクション点506は、代替的に、距離変換フィールドの(2Dにおける)極大値又はスケルトン504での極大値でもよい。インビジブルジャンクションを利用することは、それらが安定的で反復可能なので特に有利である。文字書類は、テキスト中に大抵は高周波の画像成分(high frequency image content)を含み、その画像成分は容易に汚染され、テキストを劣化させずに選別することは困難である。これに対して、テキストページ中の白色空間は殆ど安定的であり、周波数領域で殆どDCである成分を含む。白色空間中のノイズは、特徴的な場所に影響を及ぼさずに容易に選別できる。テキストの内容は最終的には分類に使用されるので、距離変換フィールドは、望まれているテキストの場所に依存するが、インビジブルジャンクション点506の場所は、各ジャンクション付近のテキストは通常同じように汚れるので、ノイズに対して堅牢(ロバスト的)である。
プロセスは、次に、そのインビジブルジャンクションについてジャンクションのサイズ又はスケールを判定する606。一実施例では、各特徴点506での距離変換値は、特徴点506に固有である。従って特徴点506のスケールは、因子αを乗算したような距離値として割り当てられる。図5Cで拡大図512に示されるように、この例の場合、αは2に等しいように選択される。円510の内側の内容(円は、特徴点506を中心とし、スケールに等しい半径を有する円である)は、カメラの面内回転及びズーム(又は、カメラの光軸が紙に垂直な場合、紙書類までの距離)に対して不変である。この特徴は局所的(ローカル)なので、即ち、円は小さいので、この特徴も、用紙に対するカメラの視野角の変化(面外回転)に対して堅牢である。言い換えれば、全体的な投影歪みが全体的に(画像全体として)生じても、そのような投影歪みは局所的には非常に小さく、最終的な特徴記述子に及ぶ影響は、広範囲に亘るカメラの面外回転に関して無視できる。位置と同様に、インビジブルジャンクションのスケールも安定的で反復可能である。スケールは、スケルトンに基づいて計算され、それ故に安定的になる。しかしながら、位置及び方向と比較すると、スケールは、大抵テキスト付近の変化の影響を受ける。一実施例では、この影響は、特徴記述子を計算する際に、距離に逆比例する重み(ウエイト)を適用することで軽減される。
次に、プロセスはインビジブルジャンクション506の向きを判定する608。一実施例では、各特徴点506には局所的な向きが割り当てられている。各特徴点506に関する2次元局所的座標系は、特徴点を原点とし、局所的な向きをx軸とするように決定される。特徴記述子は、この局所的な座標系に基づいて計算される。局所的な向きを導出するため、特徴量抽出部310は、特徴点506を中心とし、その特徴スケールで決定される半径の円511を計算する。円511は、いくつかの位置でスケルトンと交わる。最も長い距離を有する2つの位置が、この特徴の局所的な向きを決める。同様な距離の位置ペアが2つあった場合、特徴量抽出部310は、より水平方向に近いものを選択する。図5Dは特徴方向の判定例を示す。特徴点506を中心として特徴スケールに等しい半径を有する円511は、スケルトン504と3つの点A,B及びCと交わる。2つの点A,Bが最も長い距離を有し、従って特徴方向は、線分ABの向きに割り当てられる。局所的な向きは、よりノイズに敏感であり、いくつかの向きは異常値にさえなるかもしれないので、特徴量抽出部310は、よりグローバルな向き(global orientation)を利用する。特に、局所的な方向を伴う特徴点は、問い合わせ画像についてグローバルな向きを表明している。この表明(投票)は、局所的な特徴方向の数を360ビン(各ビンにつき1度)にわたって計数することで行われる。向きのヒストグラムの大勢は、グローバル方向として選択される。投票の後、全特徴点は、選択されたグローバルな向きに一致した向きに割り当て直される。一実施例では、ヒストグラムについて数を数える際、特徴量抽出部310はソフトスプリット法を使用し、ノイズで乱される場合でもヒストグラムが円滑に変化することを保証する。
テキストパッチの場合、グローバル方向は安定的である。なぜなら他のほとんどの非テキスト書類についても正しい書類方向が存在するからである。本発明は、純粋に局所的な方向と純粋にグローバルな方向との間でトレードオフを行うように調整を行う。具体的には、各特徴点について、特徴量抽出部310は近隣から向きを収集し(同じ画像中の全ての特徴点からのものと比較しながら)、方向を決定する。これは、日本語や中国語のような言語で、書類ページが縦及び横の文字列双方を含むかもしれない問題を解決する。
ジャンクションの向きはスケルトンによって決定され、スケルトンは上述したように安定的であり、従ってジャンクションの向きも安定的になる。この点、従来のSIFTと対照的であり、SIFTの場合、局所的な方向は、特徴点周辺の画素の階調度又は輝度変化(gradient)によって決定されている。階調度の方向はノイズを増幅し、それ故に特徴点をノイズに敏感にしてしまうことが良く知られている。本願の局所的な方向は、スケルトンから導出され、それよりも充分に安定的である。グローバル投票ステップは、特徴点を更に安定的なものにする。なぜなら、カメラは平坦なページを見ていること、及びそのようなページは不可視の骨組(インビジブルスケルトン)の中で何らかの支配的な方向を有すること、という性質を活用しているからである。
次に、プロセスはインビジブルジャンクションに関する記述子又は特徴記述を作成する610。図5Eも参照するに、場所、スケール及び方向が或る特徴についていったん決定されると、特徴量抽出部310は各特徴点506について二次元座標枠516を割り当て、その座標枠516内で記述子518を算出する。各々の特徴について、特徴量抽出部310は、特徴スケールの2倍に等しいエッジ長さの正方形を算出する。この正方形は4×4のセルに分割される。代替実施例では、特徴量抽出部310は、これらのセルを構築するために同心円を利用することができる。各セルの中で、特徴量抽出部310は、8つのビン(即ち、8つの方向)を有する重み付けされた階調度方向のヒストグラムを累積する。特徴記述子は、そのような方向ヒストグラムの連結であり、128次元の特徴ベクトルになる。特徴ベクトルは、線形な輝度変化に対処できるように正規化される。
一実施例では、特徴量抽出部310は、主成分分析(PCA)を用いる次元低減法を適用し、最初の14次元を確保する。これはその特徴の識別力を減らすかもしれないが、ノイズを減らすことに寄与する。本実施例では、中心付近のセルは殆ど空白なので、次元の削減は更に有意義である。目下の例では各クラスについて唯1つのプロトタイプしか存在しないことを考えると、有利なことに、これは、固有に低次元の特徴点をもたらす。本発明の記述子は、識別可能であって反復可能な点で、特に有利である。この反復可能性は、特徴の場所、方向及びスケールの反復可能性の結果である。理解できるように、各特徴点の中身は、テキスト文書中の3つ以上の言葉からの画素を含む。異なる言葉からのこれらの中身(コンテンツ)は、或る特殊なレイアウトで共に配置され、その識別子を非常に顕著にする。なぜなら、そのような特徴点にとって、同じレイアウトで共に配置された同様な言葉と、他の場所で重複する機会はめったにないからである。量子化(4×4セルおよび8方向)も特徴記述子をノイズに対して堅牢にする。
最後にプロセスは書類中に更に多くのインビジブルジャンクションが有るか否かを確認する612。存在した場合、本方法は未処理のジャンクションを選択し、それを処理するためにステップ604に続く。それ以上のインビジブルジャンクションが無かった場合、書類の処理は完了し、終了する。
特徴量インデキシング
上述したように、特徴量インデキシング部312は、インビジブルジャンクション特徴記述子の1つ以上のインデックスを生成し、それらをデータベース110に格納する。モデル画像各々について、特徴量インデキシング部312は、特徴点を取り出し、それらをデータベース110に格納する。特徴量インデキシング部312は、各特徴点に関連するメタデータも格納し、メタデータは、その特徴点を含む書類ページの固有のID、特徴記述子、スケール、方向及び場所(x,y)を含む。高速なリアルタイムの照合及び検索を可能にするため、特徴量インデキシング部312は、効率的な格納及びデータベースからの効率的な検索に備えてこれらのデータを索引付けする。
図7Aを参照するに、本発明による特徴量インデキシングを行う方法例が示されている。プロセスは量子化ツリーを作成することで始まる702。一実施例では、量子化ツリーは、階層的なクラスタリングを行って一群のトレーニング特徴(トレーニングセット)によって慣らされる。そのトレーニングセットはK個のクラスタに再帰的に分割される。K個の分岐(ブランチ)及びL個のレベルを伴う量子化ツリーの場合、K個のリーフノードが有り、即ちボキャブラリ(vocabulary)サイズはKである。特徴をクラスタリングする場合、特徴量インデキシング部312は、複数のランダム初期化と共にk-meansアルゴリズムを使用する。ツリーの各ノードにおいて、特徴量インデキシング部312は、そのノードに属する点(ポイント)によって与えられるクラスタ中心を記録する。量子化ツリーの各ノードは、用語−頻度−逆−書類−頻度(term-frequency-inverse-document-frequency)を使って、あるノードにも関連付けられる。量子化ツリーは、階層的な方法で特徴空間を区分けする。いったん量子化ツリーが作成されると、それはデータベース110に格納される704。次に、特徴点が特徴量抽出部310から検索され又は受信され706、ツリーを押し下げ、データベースに加えられる708。ツリーの各レベルにて、特徴点は、その特徴点に最も近いクラスタ中心を伴うブランチを選択する。特徴点がリーフノードに達すると、その特徴点に関するエントリがそのリーフノードのヒットリストに挿入され、その特徴点の座標(x,y)及びページIDを記録する。そのページIDがヒットリスト中に既に存在していた場合、特徴量インデキシング部312はその座標を既存のエントリに付随させ、ヒットリストにおけるそのページIDの出現頻度をインクリメントする。特徴点は2つのクラスタ間の境界にある又は境界近傍にあるかもしれないので、特徴量インデキシング部312は、特徴点を量子化ツリーに押し込む際にソフトスプリット(soft split)を使用する。しかしながら、これは、そのような特徴点によってヒットするリーフノード数を多数にしてしまう。トレードオフとして、特徴量インデキシング部312は、特徴点を、最も近いk個(目下の例の場合、k=2)のリーフノードだけに挿入する。
代替実施例では、特徴量インデキシング部312は、元の特徴記述子を格納しない。いったん特徴量インデキシング部312が特徴空間を量子化すると、特徴量インデキシング部312は、量子化空間内にあるセルのインデックスで特徴記述子を近似する。各特徴について、特徴量インデキシング部312は書類ページIDのみを格納し、書類ページIDは、その特徴に加えて、書類ページ内の特徴の座標も含む。従って、必要な格納スペースは顕著に減少する。
図7Bを参照するに、特徴量インデキシングを行う本発明による別の方法例が示されている。本実施例では、特徴量インデキシング部312は通常のk-dツリーを使用して、特徴点を組織化する722。他の実施例では、通常のk-dツリーは、高速ディスクI/O用に拡張されたk-dツリーに修正されてもよい。k-dツリーは、特徴点を複数のセルに分割し、各セルは1つ以上の特徴点(実際には、特徴点を指すポインタ)を含んでいる。k-最近接サーチ(k-nearest neighbor search)を行う際、ツリーを逆に辿ることがしばしば必要になる。特徴量インデキシング部312は、ツリーの深度優先線形化(depth-first linearization)を利用して、特徴点を順序付ける;逆に辿る際に、メモリ/ディスクの場所が保存される方法で行われる。その結果として、キャッシュミス率が減り(その特徴がメインメモリ内に或る場合、キャッシュはCPUキャッシュでもよいし、或いは特徴が外部ハードディスクドライブ内にある場合、キャッシュはメモリキャッシュでもよい)、速度性能が向上する。そして、特徴量インデキシング部312はPCAを利用して、特徴の次元を減らし、或いはより正確には、有用な次元数を発見する。我々のデータが本来的に低次元であったとしても、その低次元の空間は、結果のk-dツリーが良好にバランスをとるように推定される必要がある。そのような次元削減の有用性は、低次元の要請に合うだけでなく、空間分割が最も効率的になるような方法で特徴次元をも要求する。言い換えれば、殆どのエネルギを伴う次元が先ず削減されるような方法で空間削減が要求され726、システム108はあるk-dツリーに至ることができ、そのツリーは、バランスがとれているだけでなく、安定的なセル境界を伴うものでもある(即ち、ノイズが小さければ、特徴が属すべきセル内を乱さない。)。
特徴量検索及び幾何学的推定
図8を参照するに、本発明による特徴量検索の方法例が示されている。
図7Aに関して説明された第1の例に従って索引付け(インデキシング)が行われる場合、特徴量検索部314は、問い合わせ画像の中で検出された特徴点を量子化に至るまで送信し、リーフノードでヒットリストを収集する。これは、各候補ページについての座標(x,y)のリストと共に書類ページ候補のテーブルを生成する。これは更なる処理に備えて幾何学的推定部316に送信可能である。
図7Bでのインデキシングの代替例では、検索プロセスは、特徴量検索部314が特徴量抽出部310から特徴記述子を受信することで始まる802。特徴量検索部314は、局所的な特徴量に基づいてパターン認識を実行する。特徴量検索部314はあるページ書類を探し、そのページ書類の特徴点は、所与の問い合わせ画像パッチの特徴点に最良に対応するものである。その対応関係を確立するため(即ち、認識するため)、特徴量検索部314は、所与の画像の中で各特徴点を認識する。より具体的には、特徴量検索部314は、問い合わせ画像におけるk個の最近接の(kNN: k nearest neighbors)特徴点を求めてデータベース110を探す。データベース中のそのような点全体の集まりは、複数の群(セット)に分割され806、ある群中の点は同じ書類ページIDを共有する(IDは、その特徴点を伴うメタデータとしてデータベースに記録される)。書類ページの候補各々について、特徴量検索部314は、一群の特徴対応物を生成する。そのような多くの対応物は飛び値になることに留意を要する(各問い合わせ点に関し、最近接のk個の中で高々1つの真の対応物しか存在しないからである。)。
当業者は、様々なkの値が使用可能なことを認識するであろう。一実施例では、k=10である。他の値のkが、問い合わせ時間を短縮するために使用されてもよい。代替方法は、問い合わせ特徴と現在の近辺との間の距離もモニタする。その距離に大きな飛躍があった場合、特徴量検索部314は、k<10個の近辺に戻り、その場合の近隣はおそらくは飛び値になる(即ち、真の対応物はおそらく現在のk<10個の点の中にある。)。
更に別の実施例では、特徴量検索部314は、ツリー交差(tree intersection)を用いるスコアリングを行う。問い合わせ画像の各々について、特徴量検索部314は、問い合わせの点が通過するパスを与えるツリー表現を有する。特徴量検索部314は、候補ページ各々について同様なツリーを構築する。問い合わせ画像とモデル画像の類似性は、2つのツリーの交差に基づいて算出される。その後にツリー交差がランキングされる。
図9Aは、幾何学的推定を行う本発明による第1の方法例のフローチャートである。全ての候補ページの身元が特徴量検索部314で確認されると、候補は幾何学的推定部316に伝送され、書類ページ候補全ての身元を格付け(ランキング)し、最終的な問い合わせ結果を生成する。各候補書類ページが持っている特徴点の数を利用して、候補書類を分類することで、幾何学的推定部316は処理を始める902。幾何学的推定部316は、幾何学的な制約を使ってその候補をランキングする。例えば、幾何学的推定部316はある書類を選択し、その書類は、入力された画像面の幾何学的制約に合う特徴点を最多数含んでいる。従って、紙面とカメラ画像面との間に或る変換が存在する。最終的に、幾何学的推定部316は合致する書類の身元、ページ、ポイント及び表示領域を出力する906。
図9B及び9D双方を参照しながら、幾何学的推定を行う本発明による第2の方法例が説明される。図9Bは方法のステップを示し、図9Dは画像面956、紙面952及びそれらの間の変換の様子を示す。本方法は、特徴量検索部314で確認された候補ページの身元を受けることから始まり、幾何学的推定部316は、各候補ページの特徴点数に基づいて候補書類ページを分類する910。幾何学的推定部316は、基本的には、幾何学的制約を使って或る書類を取得し、その書類は、その幾何学的制約にある特徴点を最多数含んでいる。図9Dに示されるように、幾何学的制約の具体例は、書類ページが紙面952であるということに起因し、紙面952とカメラ画像面956との間で投影変換がなされる。投影変換は8つの独立したパラメータを含み且つ投影変換は非線形変換なので、その推定は不変的(安定的)ではなく、飛び値が除去されなければ高価になる。そこで、幾何学的推定部316は、変換後の推定と共にその飛び値を除去する912。例えば、ランダムサンプルコンセンサス(RANSAC)アルゴリズムを使用して、(投影変換の現実的な近似である)アフィン変換を推定し、特徴対応物に関する飛び値を検出する。一実施例では、幾何学的推定部316もRANSACにより推定されたアフィン変換について有効性検査を実行する。例えば、アフィン変換は、一般的なフルランクの3×3行列(最終行は、[0,0,1]である)であり、目下のコンフィギュレーションに関しては物理的に無効な変換も含む。より具体的には、そのアフィン変換の左上の2×2サブマトリクスは、回転α、スケールλ1及びλ2及び他の回転φに分解可能である:
本発明によれば、回転、スケール、スキュー(歪み)(比率λ12)及び変換(アフィン変換Hの第3列)に拘束されなければならないように、幾何学的推定部316は制約を強制する。例えば、書類ページの範囲外にすることはこの変換では不可能である。
アフィン変換が推定され、飛び値が除去されると912、幾何学的推定部316は、投影変換に対する非飛び値(飛び値でないもの)を使ってそのアフィン変換を洗練する914。幾何学的推定部316は、アフィン変換による初期化を伴う非線形最適化(Levenberg-Marquardt最適化法等)を利用して、最良の候補書類を特定する。投影変換は(及びアフィン変換も)用紙に対するカメラの向き及び画像スケールの推定を与えるので、幾何学的推定部316は、その向き及びスケールに強制し916、特徴検出段階での各特徴による投票で決まった向き及びスケールに合わせる。特徴量抽出による幾何学的制約を使って最良の候補を選択することは、誤判定を減らし、場合によってはそれをゼロにする。
更に別の実施例では、投影変換に対する非飛び値を使ってアフィン変換を洗練するステップ914は、ある近い合致が発見された場合に終了してもよい。幾何学的推定部316は、充分な非飛び値の支援と共に有効な幾何学的変換をもたらす書類ページを特定する。これは、更に、精度に大きな影響を及ぼさずに本発明の認識法の実効性を高める。
図9Cは、幾何学的推定を行う本発明による第3の方法例のフローチャートである。この例は、2つの別個の幾何学的推定を利用し、パフォーマンスを向上させるためそれらの動作は並列的に行われる。プロセスは、特徴量検索部314で確認された候補ページの身元を受けることから始まり、各候補ページの特徴点数に基づいて候補書類ページを分類する920。候補ページの分類されたリストが、2つの別々の幾何学的推定用に用意される。第1の幾何学的推定は、幾何学的制約と共に特徴検出を行いながら候補ページをランキングする922。例えば、特徴検出による回転又は方向及びスケールの属性が、この幾何学的推定に強制される。第2の幾何学的推定は、図9Bに関して上述したような幾何学的制約と共に投影変換を用いて候補ページをランキングする924。例えば、投影変換におけるカメラの表示領域及び見ている場所の属性が、この第2の幾何学的推定に強制される。当業者は、これら2つの幾何学的推定が同時に又は連続的に実行されてもよいことを認識するであろう。2つのページランキングはその後に確認され又は調和させられる926。例えば、確認又は有効化は、その特徴が物理的に有意義であること及び特徴が特徴量抽出部310で推定されたスケール及び方向と一致していることを要する。1つの再ランキングされた候補リストが生成されるように、2つの幾何学的推定結果が有効化されると、幾何学的推定部316は、書類の身元、ページ、ポイント及び表示領域を出力する。
認識及びトラッキング
ユーザが紙書類上でカメラを動かす場合、例えば、電子データ又は他の注釈が紙の位置に関連付けられているホットスポットを求めて走査する際、本発明は各ビデオフレームについてフレッシュクエリ(fresh query)を発行する必要がない。その代わりに、本発明は、紙面上のカメラの見ている場所に加えて、現在のフレームのIDを推察するために過去の認識結果も利用する。これを行うため、本発明はカメラを追跡し、画像処理される書類ページに関する動きを推察する。カメラの3次元的動きを直接的に推定するのは現実的でない。なぜなら、3次元のカメラの動きのパラメータの中に不明なものがいくつも存在するからである(例えば、面外回転と並進との関係、ズームイン/ズームアウトと用紙への/用紙からの動きとの関係等が曖昧になる。)。この問題を回避するため、本発明は、紙面でカメラの見ている二次元的な場所を直接的に追跡し、時間的な冗長性を用いてカメラの運動状態を推定する。カメラの見ている2次元的な場所を追跡することは、ビデオフレームにおける特徴点を追跡し、その後にビデオフレーム間で平面的な動き(投影変換)を推定することで実現される。更に、現在のフレームの認識に備えて過去の結果を利用することに加えて、本発明は、過去の認識結果が利用可能でなかった場合、追跡を行うことで、フレッシュ認識に関する複数フレームからの情報を蓄積している。
図10Aを参照しながら、認識及び追跡を組み合わせた本発明による方法例が説明される。プロセスは、書類ページを認識することから始まる1002。この初期認識ステップ1002は、図9A−9Cを参照しながら上述した認識法の何れを用いて実行されてもよい。特徴量抽出及び認識システム108は、書類ページを認識すると、問い合わせ画像及び結果の書類ページを登録することで、カメラの見ている場所を追跡する。言い換えれば、特徴量抽出及び認識システム108は、先ず過去に検索したページを使って、問い合わせ画像を「認識(recognize)」しようと試みる。更に、特徴量抽出及び認識システム108は、フレーム追跡及び認識を組み合わせる。認識は初期化として機能し、ドリフトコレクタ326は連続的なビデオフレームを追跡する。
次に、本発明のプロセスは、カメラのモードを推定する1004。この例では、特徴量抽出及び認識システム108は、追跡する時間、認識する時間、追跡に備えてドリフトを修正する時間を判定するために状態マシンを維持する。状態マシンは、図10Cに示され、以下で更に詳しく説明される。カメラのモードの変更は、状態遷移を引き起こす。特徴量抽出及び認識システム108は、ビデオカメラの動的なモードを推定し、以下の状態を有するように定義される:
ホバーリング:カメラはほとんど静止しており、紙書類を見ている;
スキャニング:並進及び/又は回転を行うことでカメラが書類を走査している;
ズーミング:カメラが書類ページに向かって動いている又は書類ページから遠ざかっている;及び
急変:カメラが別の書類ページに動いている。
モードが推定されると1004、特徴量抽出及び認識システム108は追跡の現在状態を判定する1006。本発明は追跡に5つの異なる状態を用意する。書類が認識される第1状態があり、ビデオトラッカ320、用紙トラッカ322、認識部324又はドリフトコーディネータ326の何れかがアクティブである残りの4つの状態がある。トラッキングの現状及びカメラモードに依存して、追跡状態、認識状態、用紙追跡状態又はドリフト修正状態の中で本プロセスは遷移する。次に、本発明による方法は、推定されたカメラモード及び判定された状態に基づいて、ビデオフレームを処理する1008。
ビデオトラッカ320、用紙トラッカ322、認識部324又はドリフトコレクタ326により用意された情報は、グラフィカルユーザインターフェースを生成又は修正するために使用可能である1010。このグラフィカルユーザインターフェースは、電子書類の表現と共に合成可能である。一実施例では、グラフィカルユーザインターフェースは、表示領域の複数の視覚的なインデックス1022,1024、画像捕捉装置106で捕捉された各フレームから生成された遷移経路の視覚的な指示1026等を含む。グラフィカルユーザインターフェースのこれらの成分1022,1024,1026は、認識される電子書類1020の画像上で重ねられてもよい。認識及び追跡を組み合わせた本発明による方法で生成されたユーザインターフェース例は、図10Bに示されている。グラフィカルユーザインターフェースを修正するステップ1010は、そのステップが選択的であることを表す波線と共に図10Aに示されていることに留意すべきである。認識及び追跡で生成された情報は、デスクトップコンピュータで使用するための注釈ツールやユーザ入力制御装置を含む多種多様なアプリケーションに使用可能であり、当業者は、グラフィカルユーザインターフェースを生成及び提供することが、認識及び追跡法を結合した本発明の単なる一例に過ぎないことを認識するであろう。
いったんグラフィカルユーザインターフェースが修正、生成又は表示されると1010、本発明方法は、処理する追加的な入力画像フレームの有無を確認する1012。存在していれば、本方法は次の画像フレームを取り出し、ステップ1004に戻り、ステップ1004,1006,1008及び1010を次の画像フレームについて実行する。処理する追加的な入力画像フレームが無ければ、本方法は完了し、終了する。
図10Cも参照するに、本発明による認識及び追跡を行うのに使用されるプロセスの状態図が示されている。プロセスは状態1-1052から始まり、ビデオトラッカ320が、基準フレームである第1ビデオフレームと共にビデオフレームにおける(投影変換としての)カメラの動きを追跡する。カメラモードがホバーリングモードでない限り、本発明のプロセスは状態1-1052に留まる。しかしながら、カメラモードがホバーリングモードに変わると、本発明のプロセスは状態2-1054に遷移する。状態2-1054では、認識部324が動作している。認識部324は、現在のビデオフレームを認識し、用紙及び入力ビデオフレーム間のリンクを初期化する。認識が失敗すると、本発明のプロセスは状態1-1052に戻る。一方、認識が成功すると、本発明のプロセスは状態3-1056に遷移する。なぜなら、用紙及びビデオフレーム間のリンクは確立されており且つ以後のフレームは用紙トラッカ322で処理されるからである。状態3-1056では、用紙トラッカ322は、基準フレームとして機能する紙面と共に、その用紙に対するカメラの動きを追跡する。用紙トラッカ322も周期的なタイマで動作する。周期的なタイマの時間が経過すると、本発明のプロセスは、状態3-1056から状態4-1058に遷移する。状態4-1058では、ドリフトコレクタ326が用紙トラッカ322のドリフト補正を行う。これは、画像及び用紙の間の整合性が維持されることを保証する。ドリフト補正が完了すると、本発明のプロセスは状態3-1056に戻り、以後のフレームは用紙トラッカ322によって処理される。用紙の追跡(トラッキング)が成功している限り、本発明方法は、ドリフト補正用の状態4-1058との間で周期的な遷移を行いながら、状態3-1056に留まる。しかしながら、用紙トラッキングが失敗すると、本発明方法は、状態1-1052に戻り、以後のフレームはビデオトラッカ320により処理される。
特徴点はビデオクリップの中で複数回現れるかもしれないことに留意すべきである。追跡を行うことで、本発明は同じ特徴点のこれらの例を関連付け、それらを一緒に使ってそのような特徴点に関するkNN(最近接のk個)を抽出する。代替実施例では、例えば、本発明は、時間的に統合することで高解像度を処理でき、或いは最良の解像度又は抽出用の視野角を伴うインスタンスを単に選択することさえ可能である。認識される所与の新しいフレームの場合、多くの特徴点が既に自身のIDを持っており、それ故に過去のフレーム内に最近接のk個がある。その結果、本発明はビデオフレームにわたって特徴点を単に追跡することで、多くのkNN抽出の多くを削減できる。
図10D−10Kを参照するに、認識及び追跡を組み合わせることで生成される本発明によるユーザインターフェース例が図示されている。この例の場合、用意されるユーザインターフェースは、スマートフォンのような携帯用コンピュータ装置に用意される。このディスプレイフォーマットは、単なる例示としてしか使用されないこと、及びグラフィカルユーザインターフェースの構成要素は多様な他の構成で使用されてもよいことを、当業者は認識するであろう。更に、特定の色、フォーマット、形状及び形態等の視覚的な表現は、例示としてのみ示され、他の視覚的な表現がいくつでも使用されてよい。図10D−10Kの説明を通じて、同じ又は同様な機能を備えた同様な要素を示すために、同様な参照番号が使用される。
図10Dは、通常のフォーマットと共にラベル1052を有するウインドウを含むグラフィカルユーザインターフェース例を示す。ウインドウ1050の中には、認識及び追跡GUIを示す表示領域1054がある。表示領域1054は、選択可能な開始ボタン1056、及び表示領域1054のウインドウを閉じるためのボタン1058を含む。開始ボタン1056が選択されると、GUIは図10Eに示されるような表示に更新される。
図10Eは、第1入力画像を示す表示領域1054と共にGUIを示す。言い換えれば、GUIは問い合わせ画像を表示し、問い合わせ画像はカメラ又は入力装置106により捕捉されている。図10EのGUIが表示された後、本方法は図10FのGUIを示すように遷移する。
図10Fは、認識に成功した後の表示領域1054と共にGUIを示す。いったん認識が成功すると、GUIは表示領域1054にて、システム108により認識された電子書類の完全なパス名1060を示す。GUIのボタン1056は、ストップボタン1056であるように修正されている。図10FのGUIが表示された後、本方法は図10GのGUIを示すように遷移する。
図10Gは、表示領域1054にて、元の電子書類の表現を示すGUIを示す。この表現物の上に重なっているのは、本発明により認識されるようなカメラの表示ウインドウ1062及び複数のカメラの見ている場所1064である。これは、用紙トラッカ322の動作中に示されるインターフェースである。電子書類中の地点と用紙上の地点との非常に詳細な整合性に起因して、特にその関係をユーザに示すように用意された視覚的なフィードバックに起因して、この表示は特に有利である。
図10Hは、表示領域1054で通常的には認識できない明確でない(blurry)画像を示すGUIを示す。本発明の認識及び追跡プロセスが短期間の間なされた後、入力画像における冗長性は、認識を可能にする。図10IはGUIを示し、そのGUIは、表示ウインドウ1062及びカメラの視点1064を重ねた表示領域1054に示される電子書類の表現を含む。この例でカメラの視点1064,1066は、(基礎出願では)緑色の正方形で表現されている。これらの緑の四角の位置1064,1066は、カメラが追跡した結果の軌跡を表す。処理される冗長データを伴う多数のフレームに起因して、本発明は、有利なことに、当初は認識できなかった画像を、短時間の後に認識可能にする。例えば、ほんの数秒以内に、当初は認識されなかった画像が、認識可能な画像に変換可能であり、本発明による視覚的表現を伴って作成されたGUIは図10Iに示されている。
図10Jは、始めは認識でない画像の別の例を示す。この例は、本発明による認識及び追跡の方法が、テキストコンテンツ及び図形コンテンツ双方を含む画像について、どのように特に優れているかを示す。当初認識できない画像は、特徴量抽出及び特徴量検索を実行するには少なすぎるテキストを含んでいる。図10Kも参照するに、GUIは合成された認識及び追跡の結果を示す。表示領域1062は、当初認識できないが、いったん画像フレームが認識されると、本発明のトラッキングは、そのGUIがカメラの視点の追跡を示すようにできる。この追跡(トラッキング)は、入力画像がデータベースの中で多数ヒットする際の曖昧さの問題を解決するだけでなく、トラッキングは最終出力が一意になるようにコンテキストキューを用意する。画像は当初認識できないが、いったん画像がその書類を識別する程度に充分な量の文字を持つようになると、カメラの相対的な動きが画像の中で捕捉され、カメラの視点1064,1066の軌跡として示されるように、表示ウインドウ1062の位置に対する修正を与える。表示ウインドウが、ほとんど文字を含まないかつての認識できないポイントから、かなりの量の文字を含む地点に図10Kに示されるように動くと、ほとんど文字を含まない地点は認識可能になる。これは、文字と図形画像が混ざっている書類の場合に特に有利である。
セキュリティ及び注釈アプリケーション
図11を参照しながら、複合機1100に統合された本発明の特定の実施例が説明される。特に、特徴量抽出及び認識システム108は、セキュリティ及び注釈用の他のモジュールと共に複合機1100に統合され、固有のアプリケーション群を提供することができる。統合された本発明の実施例は複合機1100に関して以下で説明されるが、この複合機1100は、ローエンドの複合機デスクトップポインタから、ハイエンドのもの、商用グレードのもの、複合コピー機、又はそれらの如何なる組み合わせに至るまで、如何なる構成でもよいことを、当業者は認識するであろう。他の実施例では、固有のアプリケーションの一部又は全ては、複合機1100と協働して動作する外部の機能抽出及び認識システム108により実行されてもよい。
一実施例では、複合機1100は、スキャナ1102、プリンタ1104、ファクシミリモジュール1106、プロセッサ/コントローラ1108、入力/出力装置1110、データベース1112、特徴量抽出及び認識システム108、通信装置216、データベース更新部1114、セキュリティモジュール1116、注釈モジュール1118及びパッチマップモジュール1120を有する。これらの構成要素を参照して説明されたものと同じ又は同様な機能を備えた構成要素を指すために、同様な参照番号が使用される。スキャナ1102、プリンタ1104、ファクシミリモジュール1106、プロセッサ/コントローラ1108、入力/出力装置1110、通信装置216及びデータベース1112は、ハイエンドの市販の複写機の通常の構成要素と機能的に同様であり、従ってそれらは詳細には説明されない。
スキャナ1102は、通常の様々な画像捕捉装置の何れかである。
プリンタ1104は、印刷エンジン及び用紙処理手段を備えた通常の様々なものの何れかである。
ファクシミリモジュール1106は、通常のハードウエア又はソフトウエアであり、プロセッサ/コントローラ1108及び通信装置216と協働して、ファクシミリメッセージを送受信する。
プロセッサ/コントローラ1108は、図2に関して上述したプロセッサ202と同様である。
入力/出力装置1110は、図2に関して説明した装置210,212,214の機能を含み、一実施例では、複写機に見受けられるキーパッド入力及び表示出力機能を有する。
通信装置216は、図2を参照しながら説明済みである。一実施例では、通信装置216は、複合機1100を信号線1052を介してネットワーク(図示せず)に結合する。
図11は、データベース110,1112の2つの代替例を示す。何れの例でも、データベース110,1112は、不揮発性データストレージを表し、好ましくは、電子書類、特徴インデックス及び特徴記述子等の以前に説明されたようなものを含むデータを格納する。更に別の実施例では、データベース110,1112は混合メディアリアリティ(MMR: Mixed Media Reality)書類を格納し、これについては、“System and Method for Creation and Use of a Mixed Media Environment”と題する西暦2006年7月31日付け米国特許出願第11/461,017号に開示されており、その内容は本願のリファレンスに組み入れられる。第1実施例の場合、データベース1112は複合機1100の中に含まれる。波線で示される第2実施例の場合、データベース110は、信号線1052及び通信装置216によって複合機1100に結合され、データベース110は複合機1100の外部にある。特徴量抽出及び認識システム108、データベース更新部1114、セキュリティモジュール1116、注釈モジュール1118及びパッチマップモジュール1120で生成される様々な他の情報をデータベース110,1112は格納してもよいことを、当業者は認識するであろう。残りの説明の部分の中で本発明はデータベース1112を使用するように説明されるが、データベース1112又はデータベース110はこれらのアプリケーションに使用可能であることが理解されるべきである。
特徴量抽出及び認識システム108の機能は図1−10に関して上述した機能を有する。特徴量抽出及び認識システム108は、プロセッサ/コントローラ1108により制御され、データベース更新部1114、セキュリティモジュール1116、注釈モジュール1118及びパッチマップモジュール1120と協働し、これについては図12−19を参照しながら以下で説明される。
データベース更新部1114は、プロセッサ/コントローラ1108で動作し、図12を参照しながら後述される機能を提供するソフトウエア及びルーチンである。データベース更新部1114は、特徴量抽出及び認識システム108、スキャナ1102、入力/出力装置1110、データベース1112及びプロセッサ/コントローラ1108と通信するように適合させられる。データベース更新部1114は、特徴量抽出及び認識システム108の機能を使って、スキャン済みの書類を確認し、データベース1112内のエントリを更新する。例えば一実施例では、データベース更新部1114は、情報を受信してデータベース1112に格納し、特徴量抽出及び認識システム108を使って、データベース1112内に格納済みの対応する電子書類が有るか否かを判定し、受信した情報とデータベース1112内で認識された情報との対応関係を作成する。
セキュリティモジュール1116は、書類にセキュリティをもたらすようにプロセッサ/コントローラ1108で動作するソフトウエア及びルーチンである。より具体的には、複合機1100の機能が、ユーザのスキャンした書類を複写又は送信するのに使用できるか否かを、セキュリティモジュール1116は制御する。セキュリティモジュール1116は、スキャナ1102、プロセッサ/コントローラ1108、入力/出力装置1110、データベース1112及び特徴量抽出及び認識システム108と通信するように構成される。データベース1112内に対応する電子書類が格納されているか否か、及び書類が関連するセキュリティプロトコルを持っているか否かを、セキュリティモジュール1116は入力画像から判定する。持っていれば、セキュリティモジュール1116は、プロセッサ/コントローラ1108でルーチンを実行し、関連するセキュリティプロトコルを実行する。セキュリティモジュール1116の動作は、図12を参照しながら以下で詳細に説明される。
注釈モジュール1118は、プロセッサ/コントローラ1108で動作し、データベース1112に格納された電子書類に注釈を付けるソフトウエアエンティティである。注釈モジュール1118は複合機の一部として説明されているが、注釈モジュール1118は、携帯電話機、パーソナルコンピュータ又はデータベース110に関連するサーバのような他の装置で動作してもよいことに留意すべきである。注釈モジュール1118は、スキャナ1102、プロセッサ/コントローラ1108、入力/出力装置1110、特徴量抽出及び認識システム108及びデータベース1112と通信するように構成される。注釈モジュール1118の動作は、図13を参照しながら以下で詳細に説明される。
図12を参照しながら、書類セキュリティの一部にインビジブルジャンクション認識を使う本発明による方法が説明される。プロセスは、書類又は書類の一部の画像をスキャンすることから始まる1202。次に、複合機1100は、特徴量抽出及び認識システム108を使用して、特徴量抽出及び特徴量検索を実行する1204。上述したように、これは、認識された電子書類に関する情報又は認識できなかったことの指示を生成する。このステップの一実施例は、図15−19を参照しながら以下に詳細に説明される。インビジブルジャンクション特徴検出は、画像の回転に対して高度の耐性を提供する点に留意すべきである。例えば、捕捉した画像で45°の回転になるまで、対応する合致書類を見つけることができる。従って、一実施例では、特徴量抽出及び検索は、スキャンされた画像に対して異なる回転方向で複数回実行される。例えば、捕捉又はスキャンされた画像は1回以上90°回転され、各方向で特徴量抽出及び検索が実行される。この代替実施例は、データベースに対して4つの比較(各方向で1回)を実行し、全ての可能な照合が見つかることを確保する。当業者は、90°が一例のみとして用いられており、高いセキュリティが必要な場合に、2〜nの異なる回転で如何なる数の比較が実行されてもよいことを認識するであろう。次に、本方法は、認識された特徴が電子書類と合致するか否かを判定する1206。特徴量抽出及び認識システム108が、合致する電子書類を特定できなかった場合、本プロセスは次のプロセスに続き、通常行うように、入力されたスキャンされた画像を処理する1208。例えば、その通常の処理は、コピーを作成すること、ファクシミリメッセージを送ること、スキャン画像を電子メールで送ること等を含み、或いは複合機1100で実行される他の通常の機能のどれを含んでもよい。極度に高度なセキュリティ環境の場合、この通常の処理は、複合機1100の機能をディセーブルにすること、入力/出力装置1110でユーザに或るメッセージを表示することを含んでもよく、その或るメッセージは、スキャンした画像が電子的対応物を持っていないこと及び/又は認識できなかったこと等を示す。
しかしながら、特徴量抽出及び認識システム108が合致する書類を特定できた場合、プロセスは、スキャンした画像に付随するセキュリティ処理を確認するステップに続く1210。一実施例では、データベース1112は、索引付けされデータベース1112に格納された画像各々について、セキュリティ処理を含む。関連するセキュリティ処理が確認されると1210、そのセキュリティ処理が検索され、スキャンされた画像は、その検索されたセキュリティ処理を用いて処理される1212。ステップ1212では複合機1100によってセキュリティ処理がいくつでも実行されてよいことを、当業者は理解するであろう。以下のセキュリティ処理は例示として用意されており、複合機1100が行うプロセスを限定するものではない。更に、セキュリティ処理の各々は、更なるセキュリティ及び機能に関する他の処理と共に結合されてもよい。
第1のセキュリティ処理では、セキュリティモジュール1116は、入力/出力装置1110がユーザのパスワードを求める要求を出力するようにする。入力/出力装置1110はユーザからパスワードを受信し、複合機1100の機能にアクセスするために入力されるようなユーザのIDに対応するものに対して、パスワードを確認する。また、パスワードは書類のパスワードでもよく、書類を印刷することを許可されたユーザの識別番号でもよい。入力されたパスワードが、データベース1112に格納されている情報に一致していた場合、プロセッサ/コントローラ1108は、スキャン画像の印刷出力がプリンタから生成されるようにする。一方、入力されたパスワードが合致していなかった場合、複合機1100は如何なる書類も出力しないであろう。このことは、パスワードを備えた特定の者又は許可されたユーザのみが、スキャン書類のコピーを作成できることを保証する。或いは、ユーザのアクセスコードが、パスワードの代わりに使用されてもよい。その場合、書類のコピーすることを認められたユーザだけが、それを行い得る。ユーザの身元は、複合機1100へのアクセス権を得るのに使用されたアクセスコードによって確認される。
第2のセキュリティ処理では、セキュリティモジュール1116は、認識された書類が印刷されたことを示す記録をデータベース1112に格納し、プリンタ1104が書類を出力するようにする。このセキュリティ処理の下では、セキュリティモジュール1116は、時間、コピー数、出力方法、画像又は電子書類が出力を生成するために使用されたか否か、及び出力の受信者等を記録してもよい。ユーザがアクセスコードを入力することを複合機1100が要求する場合、アクセスコードもデータベース1112に記録されてよい。
第3のセキュリティ処理では、セキュリティモジュール1116は、コピーを複合機1100により出力することを控える又は妨げる。セキュリティモジュール1116は更に、制限された書類又は機密書類をコピーしていること及びその動作が許可されていないことをユーザに警告するプロンプトを複合機1100で提示又は表示する。この場合、書類はアクセスに際し高度に制限され、コピーされることは許容されない。セキュリティモジュール1116は、処理を自ら拘束する。更に、第3のセキュリティ処理は、複合機1100のディスプレイを介してユーザにプロンプトを送信し、機密書類をコピーしていることをユーザに通知してもよい。ディスプレイは更に、コピー処理を完了する許可を得る方法についての追加的な指示を提供してもよい。例えば、コピーが許可される前に、ユーザは電話番号を提供されてもよく、パスワード、ユーザ識別番号又は他の情報を入力するように伝えられてもよい。
第4のセキュリティ処理では、セキュリティモジュール1116は或る通知を生成し、その通知を例えばファクシミリ又は電子メールで管理者又はアドミニストレータに送信する。この第4のセキュリティ処理の変更では、通知は電子書類の所有者に送信される。一実施例では、通知を生成することに加えて、書類は要求時に複合機1100により出力される。別の実施例では、複合機1100により書類が出力されず、通知のみが生成される。この通知は、認識された書類がコピーされていることを示してもよい。或いは、通知は、その書類をコピーしようとした試みがなされたことを示してもよい。この場合、セキュリティモジュール1116はプロセッサ/コントローラ1108と共に協働し、メッセージを生成する。メッセージは、ファクシミリで送信される場合、ファクシミリモジュール1106で送信され、電子メール又はインスタントメッセージのように電子的に送信される場合、通信装置216で送信される。書類のアドミニストレータに送信されても所有者に送信されても、通知メッセージは、コピーを試みた人若しくはコピーを行った人、時間、場所又は装置を含んでもよい。更に他の実施例では、警告メッセージは複合機1100により生成され、通知が生成及び送信されたことを示すためにユーザに提示されてもよい。
第5のセキュリティ処理では、セキュリティモジュール1116は、複数のユーザが単独の書類にアクセスして注釈を行う協働的な環境で動作する。この環境では、セキュリティモジュール1116は、プロセッサ/コントローラ1108と協働し、入力メッセージが次の1)〜4)に対応するか否かを判定する:1)入力されスキャンされた画像が生成されて以来、更新されている書類;2)非常に長い書類の1ページ又は一部分;3)データベース1112に格納されている元の電子書類;又は4)かつてコピーされた又は印刷されたバージョンの書類。これらの例のどれにおいても、セキュリティモジュール1116は、スキャンした書類とは異なる書類を出力できる。例えば、書類の更新されたバージョンが出力されてもよいし、書類全体が出力されてもよいし、元の古い電子情報から生成された完全なコピーが出力されてもよいし、或いは以前にコピーした又は印刷されたバージョンが出力されてもよい。
第6のセキュリティ処理では、セキュリティモジュール1116は複合機1100と協働し、書類の自動編集又は支援編集を実行する。ユーザは書類をコピーすることを試みてもよい。セキュリティ処理が編集であると決定されると、セキュリティモジュール1116は、捕捉した画像で追加的な処理を実行し、ユーザが受信又はコピーすることを許可されていない書類の部分を決定する。例えば、編集のために特定の線、言葉又は二次元領域が特定されてもよい。編集に特定された領域は、印刷が生じるときに白又は黒で消すことで、書類から削除されてもよい。一実施例では、編集は自動的であり、スキャンされた画像又はその対応する電子バージョンが、編集に特定された領域を削除する命令と共にプリンタ1104に与えられる。プリンタ1104は、機密書類の編集バージョンを生成及び出力する。第2実施例では、編集はユーザの身元に基づく。セキュリティモジュール1116は、入力/出力装置1110がユーザからの識別コード又はセキュリティコードの要求を表示するようにする。この識別又はセキュリティコードは、ユーザが最初に複合機1100と相互作用し始めたときに、ユーザから無意識に捕捉されてもよい。複合機1100は、ユーザからコード入力を受信し、それをセキュリティモジュール1116に与える。セキュリティモジュール1116はデータベース1112に対して入力コードを比較し、書類のどの部分が編集されるかを判定する。例えば、ユーザのセキュリティレベルに依存して、書類から編集される内容量が変化してもよい。編集された書類は、第1実施例で前述したようにプリンタ1104に与えられる。この第2実施例は、複合機1100が書類の受信のセキュリティレベルについてユーザに促すように変更されてもよい。プリンタ1104に与えられる出力は、複合機のユーザにより入力されたセキュリティレベル又はコードに従って編集される。第3実施例では、編集は支援される。セキュリティモジュール1116は、入力/出力装置1110が機密書類の異なる領域又は部分についてセキュリティ設定を表示するようにし、どの領域が出力から編集されるかを選択するようにユーザに促す。ユーザからの入力に基づいて、編集された書類が生成され、出力のためにプリンタ1104に与えられる。セキュリティモジュール1116が編集ではなくハイライトを行うように同様に処理してもよいことを、当業者は認識するであろう。例えば、書類の特定の部分がハイライトに特定されてもよい。セキュリティモジュール1116は、プリンタ1104がユーザの身元、書類の受信者、ユーザのセキュリティ許可、受信者のセキュリティ許可等のような如何なる数の要因に依存してハイライトされた特定の部分のある書類を出力するようにしてもよい。第4実施例では、編集は通知に基づく。書類の機密部分が特定されると、セキュリティモジュール1116は、その書類をコピー又は送信する試みがあったことを機密書類の所有者に通知してもよい。書類の所有者は、その部分が自動的に編集されるように設定を行ってもよく、印刷されるが所有者に通知されるように設定を行ってもよく、出力する許可の要求が所有者に送信されて所有者の応答に基づいて編集又は印刷の許可が行われるように設定を行ってもよい。所有者が機密書類を指示したという設定に基づいて、所有者に通知して書類を編集して又は編集せず、機密書類を出力することで、セキュリティモジュール1116は捕捉された画像を処理する。この実施例の変形版では、機密書類の所有者に自動的に通知するのではなく、セキュリティモジュール1116は、書類の所有者から編集部分を出力する許可を要求するつもりがあるか否かに関して、入力/出力装置1110でユーザにプロンプトを提示する。ユーザからの応答に基づいて、書類が編集形式で印刷される、或いは書類の全体を印刷する許可を要求するメッセージが書類の所有者に送信される。
第7のセキュリティ処理では、セキュリティモジュール1116は相違機能を実行することができる。例えば相違機能は、書類が原作者の元の作品であると名乗られたときに盗作を自動的に検出するために使用されてもよい。このセキュリティ処理では、セキュリティモジュール1116は、書類のデータベース1112と捕捉した画像とを比較し、存在する内容と類似性を有する捕捉した画像の部分を決定する。一実施例では、内容量が閾値より大きい場合にのみ通知が生成されるように、閾値又は割合がユーザにより通知されてもよい。このセキュリティ処理が前述の他のセキュリティ処理と組み合わせられ、かなりの重複する内容が検出されたときに様々な異なる動作を実行可能であることを、当業者は認識するであろう。
上記のセキュリティ処理は主にコピーに関して議論されているが、セキュリティ処理は複合機1100で実行される如何なる機能に適用されてもよいことを、当業者は理解するであろう。例えば、セキュリティ処理は、複合機1100による入力画像のファクシミリ伝送に応用されてもよいし、複合機1100による入力画像の電子メールやインスタントメッセージングのような電子的な伝送に応用されてもよい。
書類セキュリティを行うときに存在する1つの特定の問題は、特徴量抽出及び書類検索処理がデータベース1112に格納された書類と照合することができることを確保することにある。特に、ユーザは、機密書類の一部のみをコピーすることを試みることで、セキュリティシステムを避けることを試みるかもしれない。例えば、ユーザは、認識システムをだますことを試みてセキュリティ制限を有する第2書類(又はその一部)の前又は周辺に、セキュリティ制限のない第1書類を置くことを試みるかもしれない。基本的に、このシステムはセキュリティ制限のある第2書類のごく一部を認識できないという希望を持ちつつ、第2書類のごく一部が抽出されて第1書類の前に置かれる。同様に、ユーザがセキュリティシステムをだますことを試みるかもしれない他の方法は、「身代金の手紙(ransom note)」の作成と同様に、書類を切断してコピー機の圧盤(platen)にこの部分を再配置することで、異なる書類の部分を抽出してこれらの異なる部分の集合を作ることである。図15−19を参照しながら以下に説明されるように、本発明は、有利なことに、データベース1112と比較を実行する前に、スキャンされた画像を小さい領域に分割するパッチマップを生成する固有の認識方法を含む。これらの方法及びパッチマップの使用は、特に有利である。なぜなら、前述のだます方法が試みられたときに、安全な書類のごく一部であっても検出する方法を提供するからである。更に、パッチマップの使用は、認識速度、認識精度又は計算コストを保証できる前処理又は後処理で補われてもよい。
図15を参照しながら、書類セキュリティに適した特徴量抽出及び書類検索方法が詳細に説明される。一実施例では、図15に示される方法は図12のステップ1204(特徴量抽出及び検索の実行)に対応する。前述のように、図15の方法が始まる前に、画像は前のステップ1202で捕捉される。次に、方法は、捕捉した画像でインビジブルジャンクション特徴量抽出を実行すること1504により始まる。このプロセスは、図5A−5Eに関して前述したプロセスと同様である。その方法が使用されてもよく、捕捉した画像からインビジブルジャンクション特徴を抽出する同様の方法が使用されてもよい。インビジブルジャンクション特徴が捕捉した画像から抽出されると、その方法は、捕捉した画像のインビジブルジャンクション特徴を前処理すること1506で続く。前処理1506の例は、図18を参照しながら以下に詳細に説明される。画像の前処理は、パッチパップ(例えば図16の1610)を生成するため又は書類の照合に使用される何らかの数のパラメータを調整することで照合する書類を見つけるために使用されるクエリを変更することを含む。本発明の1つの利点は、インビジブルジャンクションの使用のため、書類のごく一部であっても認識機能が非常に正確である点にある。従って、認識プロセスは、書類の領域の選択された部分のみを使用して認識を実行することで最適化可能である。前処理が完了すると、その方法は、パッチマップを生成すること1508で続く。本実施例では、本発明は、有利なことに、捕捉した画像をセルの格子に分割する。これらの各セルは書類検索を実行するために使用される。データベース1112に対して各セルを適用した結果は、対応するセルの配列を有するパッチマップを生成する。対応する格子セルに合致する書類のリストが各セル内にある。このプロセスは、図16及び17を参照しながら以下に詳細に説明され、図16及び図17を参照しながら十分に理解可能である。パッチマップが生成されると1508、本発明の方法は、後処理1510と共にパッチマップを使用し、捕捉した画像又はその一部がデータベース1112に格納された電子書類に対応するか否か、及び何らかのセキュリティ制限を有するか否かを特定する。この後処理1510は、図19を参照しながら以下に詳細に説明され、図19を参照しながら十分に理解可能である。
図16を参照しながら、パッチマップ1610を生成する方法が説明される。図16は、パッチマップ1610を生成する本発明によるプロセスを示す機能図である。そのプロセスは、紙書類(図示せず)をスキャンして捕捉した画像1602を生成することで始まる。捕捉した画像1602は、インビジブルジャンクション特徴を抽出してスケルトン1604(図5C及び5Bの504)を生成するように処理される。このプロセスは、図5B及び5Cに関して前述したため、ここで説明は繰り返し行われない。捕捉した画像1602の微細加工処理を提供するために、本発明は、有利なことに、スケルトン1604をパッチ又はセルの格子1606に分割する。図16に示される一実施例では、セルの格子1606は所与のサイズの複数の重複しないセルを含む。セルの格子1606はスケルトン1604の全領域をカバーするものとして図示されているが、代替実施例では、MMRデータベース1608に対して適用されていないセル間の部分からのデータを用いて、セルの領域はスケルトン1604の全体領域より小さい部分をカバーしてもよいことを、当業者は認識するであろう。他の実施例では、セルの格子1606は、所定のサイズの複数の重複するセルを有する。本発明は、特に有利であることを当業者は認識するであろう。なぜなら、格子1606のセルの大きさはユーザにより制御可能であるからである。例えば、セルのサイズは可変でもよく、セルのサイズはセル毎に所定数のジャンクション点を要求することで指定されてもよい。いずれの場合でも、セルのサイズの制御は、ユーザ初期設定、テストデータの処理、所望の計算速度、所望の精度又は当業者に理解される他の要因に基づいて行われてもよい。次に、各セルのインビジブルジャンクション特徴は、安全な書類のMMRデータベース1608のクエリを生成するために使用される。MMRデータベース1608に問い合わせた結果は、候補書類のリスト及び各パッチ又はセルで特徴に合致する書類内のX-Y座標である。一実施例では、候補書類のリストに追加される前に、クエリで戻された書類で幾何学検証が実行される。クエリは、格子1606のセル毎にMMRデータベース1608に対して生成及び適用される。これは、パッチマップ1610のセル毎に候補書類の対応するリストを生成する。格子1606の全てのセルが対応するリストを生成するために処理されると、パッチマップ1610の生成が終了する。代替実施例では、格子1606の全てのセルがMMRデータベース1608に対して適用される必要がないことを当業者は認識するであろう。例えば、格子1606の1つおきのセル、又はセルの1つおきの行又は列、若しくは格子1606のセルの特定の部分が、パッチマップ1610を生成するために処理されてもよい。パッチマップを生成するために生成されるセルの数が大きくなるほど、安全なコンテンツのセキュリティ及び検出確率が良くなることを、当業者は認識するであろう。
図17を参照しながら、パッチマップ1610例を示す。パッチマップ例1610は、セル1702の格子又は配列を含む。各セル1702は候補書類のリストを含む。図示の実施例では、リスト1704の候補書類毎に、書類を具体的に特定する情報が与えられる。例えば、リスト1704の書類毎に、書類識別番号、ページ、ページでのX及びY座標についての位置が与えられる。図17に示されるように、特定のセル1704は、複数の書類を含むリスト1704を有する。そのリストは更に、他の情報(注釈、ホットスポット、リスト1704の記入領域に関する他の情報等)を含んでもよい。
図18を参照しながら、パッチマップ1610の生成の前にインビジブルジャンクション特徴を前処理する方法例が説明される。一実施例では、インビジブルジャンクション特徴は、クエリを生成する前に前処理される1506。インビジブルジャンクション特徴は、MMRデータベース1608のクエリを生成するために使用されるデータが変更可能なように、特に低減可能なように、前処理され1506、クエリが格子1606の全てのセルではなく、選択した数の格子セルからデータを利用する。データを前処理することで、パッチマップ1610を生成するために必要な時間が低減可能である。ある場合には、クエリ結果の精度及び網羅性も改善可能である。本発明のインビジブルジャンクションアルゴリズムが使用されたときに、小さいセル又はパッチからの書類の識別の信頼性は非常に高いため、パッチマップ1610が生成されるときに、格子セルの数は低減可能である。例えば、格子1606のセルにインビジブルジャンクションが存在しない最も簡単な場合、そのセルについてMMRデータベース1608に対してクエリは生成及び提示される必要がない。図18を参照しながら、前処理方法1506は、ユーザ初期設定についての情報を受信すること1802で始まる。例えば、システムアドミニストレータは、特定の複合機1100の性能に基づいて初期設定を定めてもよい。このような初期設定は、セルの選択された一部のみがパッチマップ1610を生成するために使用されることを示してもよい。初期設定情報は、例えば行又は列の数を指定することで又は個々のセル毎に初期設定サイズを示すことで、画像毎のセル数を含んでもよい。次に、方法は、格子1608のセルのパラメータ(サイズ及び位置等)を設定するために使用可能な情報のために、捕捉した画像1602又はスケルトン1604を処理する1804。前処理方法は、書類についての情報を受信する1806。最後に、ステップ1802、1804及び1806からの情報を使用して、セキュリティモジュール1116は、セルパラメータを設定してMMRデータベース1608に問い合わせる際に使用される格子セルの一部を選択することで、前処理を実行する1808。一実施例では、初期設定サイズがセルに使用され、MMRデータベース1608に対して問い合わせられるセルが特徴の密度に基づいて決定される。例えば、所定の数nのジャンクション点より大きい何らかのセルがクエリを作るために使用される。第2実施例では、MMRデータベース1608に対して問い合わせられるセルは特徴検出に基づいて決定される。例えば、テキスト、画像及びグラフィックの領域があることをページ画像分割アルゴリズムが決定すると、ページ画像分割アルゴリズム等と共に、捕捉した画像の処理1804が使用可能であり、テキスト領域の格子セルのみがインビジブルジャンクション特徴でクエリを作るために使用されることを示す。グラフィック及び画像に対応する領域の格子セルは無視可能であり、これらの格子セルにクエリは生成されない。このため、パッチマップ1610を生成する性能が改善する。テキスト検出のような簡単な形式の特徴検出がページ画像分割アルゴリズムの代わりに使用可能であることを、当業者は認識するであろう。第3実施例では、MMRデータベース1608に対して問い合わせられるセルは、ランダムな選択に基づいて決定される。例えば、特定の格子セルは、格子セルが指定の一群の特徴を有するようにインテリジェントに推定されてもよく、ランダムに選択されてもよい。本実施例は、ほとんど精度を損なわずに、パッチマップ1610を生成するために必要な計算時間をかなり低減可能であるため、特に有利である。第4実施例では、MMRデータベース1608に対してクエリが行われるセルは、セル位置に基づいて決定される。例えば、ページのセル及び指定位置は、クエリを作るために使用可能である。一実施例では、セルの位置はセキュリティアプリケーションにより与えられる。セキュリティアプリケーションは、例えば各ページの右下隅の格子セルを問い合わせるフォーム照合アプリケーション(forms matching application)でもよい。特定のフォームが認識される他の場合、予め印刷されて重要でない(non-sensitive)そのフォームの領域のセルは、クエリが生成されることを必要としないが、重要な情報を含むことがわかっているフォームの他の領域はクエリを生成することが保証され得る。
図19を参照しながら、パッチマップ1610を生成した後処理方法例1510が説明される。一実施例では、後処理1510はパッチマップ1610を使用して実行され、書類の照合及び対応するセキュリティ処理を生成する。後処理は、基本的にパッチマップ1610が安全な書類のかなりの部分を含むか否かを決定する。プロセスはパッチマップ1610にアクセス1902することで始まる。後処理方法は、照合に必要なセル数の閾値を受信する1904。一実施例では、その方法は、書類を参照する格子セル数を集約することで、最善の書類の照合を決定する。言い換えれば、その方法は、書類毎に格子セルの「投票(vote)」を数える。書類を参照する格子セルの数が所定の閾値を超えると、その書類の一部が入力画像になり、その書類が最も合致する可能性が高いものとして選択される。ステップ1904において、このプロセスに使用される閾値が受信される。次に、後処理1510は、パッチマップ1610で参照された書類を決定する1906。基本的に、このステップは、パッチマップ1610で各セルにより参照された書類を数えることを必要とする。後処理方法は、パッチマップ1610で参照された書類の近さを比較する1908。例えば、その方法は、書類毎の「投票」となると共に、同じ書類の「投票」となる他の格子セルに近い格子セル数を数える。これは、孤立した格子セルで誤った合致(ヒット)に対してある程度の耐性を与える。投票の数が閾値を超えると、その書類のかなりの部分は入力画像になる。ステップ1904、1906及び1908で、その方法は書類毎の投票の合計を数え続けることがわかる。最後に、その方法は照合の指示を出力する1910。照合の指示は、前述のステップで捕捉した画像に含まれると決定された書類のリストである。単一の最善の合致する書類を出力するのではなく、複数の書類を有する照合の指示を出力し、その複数の書類の全てが入力画像に含まれる部分を有する。単一の書類ではなく複数の書類のリストは、安全な書類の比較的ごく一部が含まれる何らかのだます試みが特定されることを確保する。
図13を参照しながら、データベース更新及び書類処理の一部にインビジブルジャンクション認識を使用する本発明による方法例が説明される。本発明は混合メディアリアリティ(MMR: Mixed Media Reality)に関連して説明されるが、ここで説明される方法は、データベース1112に対して必要とされるかもしれない又は望まれるかもしれない如何なるタイプの更新にも適用可能であることを、当業者は認識するであろう。本方法は図12に関して説明されたものと同様なステップと共に始まり、画像をスキャニングし1202、特徴量抽出及び特徴量検索を行い1204、特定され認識された特徴が電子書類に合致しているか否かを判定する1206。合致する電子書類が認識されなかった場合、本方法はステップ1208に進み、書類は通常通りに処理される。これは、入力/出力装置1110を用いて、ユーザにより要求されるような入力画像を処理することを要する。
しかしながら、合致する電子書類が認識された場合、本方法は、処理及び更新する指示をユーザに促す1302。一実施例では、データベース更新部1114は、入力/出力装置1110が、処理及び更新する指示を求める要求を表示するようにする。そしてユーザは入力/出力装置1110を使って応答し、処理及び更新する指示を与える。指示する処理の具体例は、例えば:1)スキャンした画像を合致する電子書類に関連付けること;2)メタデータを付加し、それを合致する電子書類に関連付けること;3)新たな独立したMMR(混合メディアリアリティ)書類を作成すること;4)スキャンした画像のインデックスを生成し、それをデータベース1112に格納すること;及び5)付加的な情報を受信/検索し、それを合致する電子書類に関連付けることである。処理及び更新する指示をユーザがいったん入力すると、本方法は入力されたユーザの指示に従ってデータベース1112を更新する1304。データベース1112が更新されると、入力されたユーザの指示に従ってスキャンされた画像が処理され、プロセスは完了し、終了する。
図14を参照しながら、混合メディアリアリティデータベース注釈及び書類処理の一部にインビジブルジャンクション認識を使用する本発明による方法例が説明される。本方法は、図12を参照しながら説明されたものと同様なステップから始まり、即ち、画像をスキャンし1202、特徴量抽出及び検索を実行し1204、特定され認識された特徴が電子書類に合致するか否かを確認する1206/1402。本実施例での発明は、MMR(混合メディアリアリティ)の観点から説明されるが、如何なる電子書類に一般化されてもよい。より具体的には、判定するステップは、印刷書類の一部の表現を含むMMR(混合メディアリアリティ)書類、アクション又は第2のメディア、インデックス若しくはホットスポット、及び書類全体の電子表現等の確認でもよい。合致する書類が認識されなかった場合、本方法はステップ1208に進み、書類は通常通り処理される。これは、入力/出力装置1110を用いて、ユーザにより要求されるような入力画像を処理することを要する。
合致するMMR(混合メディアリアリティ)が認識された場合、本方法は、処理及び更新する指示をユーザに促す1402。一実施例では、注釈モジュール1118は、入力/出力装置1110が、処理及び更新する指示を求める要求を表示するようにする。そしてユーザは入力/出力装置1110を使って応答し、処理及び更新する指示を与える。更に、ユーザは、テキスト、音声、ビデオ又は他の情報のような如何なるタイプの注釈を入力してもよく、他の情報は、複合機1100に結合された入力/出力装置1110により捕捉される。注釈モジュール1118が携帯電話の一部に含まれるような実施例の場合、利用可能なタイプの注釈は、携帯電話の入力/出力の能力に制限される。次に、注釈モジュール1118は、処理する指示及び注釈をユーザから受信する1406。注釈モジュール1118はその後にユーザの入力した指示に従ってデータベース1112を更新する1408。一実施例では、注釈情報はMMR(混合メディアリアリティ)書類に付けられる。いったんデータベース1112が更新されると、ユーザの入力した指示に従って、スキャンした画像が処理され1410、プロセスは完了し、終了する。
パッチマップの用途及び用法
パッチマップ1610が多数の他の用途又は用法も有することを、当業者は認識するであろう。
例えば、パッチマップ1610は、出版社が広告を行うために使用されてもよい。通常のマスメディアの印刷物は、長い書類の要約である部分(例えば段落)を含んだ形式の広告を有する。その部分は、ユーザが広告をコピーすることを試みたときに、前述のパッチマップ1610が非常に長い長さの対応する電子書類にその部分をマッピングすることで認識されるように、広告に挿入可能である。全体の書類を読むため又は取得するため、ユーザはそれを購入しなければならない。本発明のパッチマップでは、ユーザが複合機1100で書類の部分をスキャンすると、複合機のディスプレイは、ユーザが全体の書類又は記事を購入したいか否かを問い合わせるプロンプトを備える。ユーザが全体の記事を購入したい場合、複合機1100を介してコード又は識別番号が入力され、ユーザに書類が印刷される。バックグラウンドでは、特徴量抽出認識システム108が、記事のコストを請求する支払いシステムを支援してもよい。例えば、現在インターネットで提供されているようなニュースクリッピングサービス、金融分析又は様々な記事が、この方法で与えられてもよい。
本発明のパッチマップ1610を使用する他の例は、書類チケットを自動的に生成することである。特定のユーザがデータベース1112に電子書類を格納した場合、その書類は、通常の方法で複合機1110により印刷可能である。その書類の印刷バージョンは、任意の方法で書類チケットを生成するために使用可能である。例えば、書類の所有者がコピーを有しており他人と共同作業しているとき、所有者は、本願で「書類チケット(document ticket)」と称される印刷書類の何らかのページの一部を分離し、書類の電子バージョンにアクセスする物理的な鍵として使用するためにそれを他のユーザに与えることができる。インビジブルジャンクション技法は、優れた特徴量抽出並びに書類識別及び検索機能を提供するため、小さい2”×2”の書類の一部であっても、対応する電子書類を特定するのに十分である。更に、パッチマップ1610は8.5”×11”の画像について16ほどのセルを与えるため、パッチマップ1610及び紙の一部は、「書類チケット」を単にスキャンすることにより、受信者がそれに関連付けられた何らかのホットスポット(hotspot)で元の書類を検索可能にするのに十分な情報量を与える。
以上、本発明の実施例の説明が例示及び記述の観点からなされてきた。説明が網羅的なものであることを意図してはおらず、説明された厳密な形式に本発明を限定する意図でもない。多くの修正及び変形が上記の教示内容に照らして可能である。本発明はこの詳細な説明によっては限定されず、本願の特許請求の範囲によって規定される。当業者に理解されるように、本発明は、その本質的特徴又は精神から逸脱せずに、他の特定の形態に具現化されてもよい。同様に、モジュール、ルーチン、特徴、属性、方法及び他の性質に関する特手の名称や区分けは、必須でも重要でもなく、本発明又はその特徴を実現する手段は、別の名称、区分け及び/又は形式をとってもよい。更に、当業者に明白なように、モジュール、ルーチン、特徴、属性、方法及び他の本発明の性質は、ソフトウエア、ハードウエア若しくはファームウエアによって、又はそれらの如何なる組み合わせによって実現されてもよい。例えばモジュールであるコンポーネントがソフトウエアとして実現される場合はいつでも、そのコンポーネントは、スタンドアローンプログラムとして、大規模なプログラムの一部分として、複数の別々のプログラムとして、静的に又は動的にリンクしたライブラリとして、カーネルローダブルモジュールとして、デバイスドライバとして実現されてもよいし、及び/又は、コンピュータプログラミングの技術分野の当業者にとって現在既知の若しくは将来既知になる何らかの他の方法で実現されてもよい。更に、本発明は、何らかの特定のプログラミング言語で実現されることに限定されず、何らかの特定のオペレーティングシステムや環境で実現されることにも限定されない。従って、本発明の開示内容は例示的であり、本発明の範囲を限定するものでもなく、本発明は特許請求の範囲の記載によって規定される。
本願は、2007年7月11日に出願された”Invisible Junction Feature Recognition For Document Security Or Annotation”という題の米国仮特許出願No.60/949,232の35U.S.C.§119(e)の優先権を主張し、この全内容を援用する。
特徴量抽出及び認識を行う本発明によるシステムの機能を示す図である。 本発明の一実施例により構築されたシステム例のブロック図である。 本発明の第2実施例により構築された図2のシステム例のメモリに関するブロック図である。 本発明による図1の特徴量抽出及び認識システム例のブロック図である。 ある画像例で実行される本発明の一実施例による特徴量抽出ステップの図式表現を示す図である。 ある画像例で実行される本発明の一実施例による特徴量抽出ステップの図式表現を示す図である。 ある画像例で実行される本発明の一実施例による特徴量抽出ステップの図式表現を示す図である。 ある画像例で実行される本発明の一実施例による特徴量抽出ステップの図式表現を示す図である。 ある画像例で実行される本発明の一実施例による特徴量抽出ステップの図式表現を示す図である。 特徴量抽出を行う本発明による方法例のフローチャートである。 特徴量インデキシングを行う本発明による方法例のフローチャートである。 特徴量インデキシングを行う本発明による別の方法例のフローチャートである。 本発明による特徴量検索方法例のフローチャートである。 幾何学的推定を行う本発明による第1の方法例のフローチャートである。 幾何学的推定を行う本発明による第2の方法例のフローチャートである。 幾何学的推定を行う本発明による第3の方法例のフローチャートである。 紙面、画像面及びクエリを示す幾何学的な制約例を示す図である。 認識及び追跡を組み合わせた本発明による方法例のフローチャートである。 認識及び追跡を組み合わせた本発明による方法例により作成されたユーザインターフェースを示す図である。 認識及び追跡を組み合わせた本発明による方法例で使用されるプロセスの状態図である。 認識及び追跡を組み合わせることで生成される本発明によるユーザインターフェースの他の例を示す図である。 認識及び追跡を組み合わせることで生成される本発明によるユーザインターフェースの他の例を示す図である。 認識及び追跡を組み合わせることで生成される本発明によるユーザインターフェースの他の例を示す図である。 認識及び追跡を組み合わせることで生成される本発明によるユーザインターフェースの他の例を示す図である。 認識及び追跡を組み合わせることで生成される本発明によるユーザインターフェースの他の例を示す図である。 認識及び追跡を組み合わせることで生成される本発明によるユーザインターフェースの他の例を示す図である。 認識及び追跡を組み合わせることで生成される本発明によるユーザインターフェースの他の例を示す図である。 認識及び追跡を組み合わせることで生成される本発明によるユーザインターフェースの他の例を示す図である。 特徴量抽出及び認識を行う本発明によるシステム例を含む複合機の機能ブロック図である。 書類セキュリティにインビジブルジャンクション認識を使用する本発明による第1の方法例のフローチャートである。 データベース更新及び書類処理の一部にインビジブルジャンクション認識を使用する本発明による方法例のフローチャートである。 混合メディアリアリティデータベース注釈及び書類処理の一部にインビジブルジャンクション認識を使用する本発明による方法例のフローチャートである。 書類セキュリティのために特徴量抽出及び検索を行う本発明による方法例のフローチャートである。 パッチマップを生成する本発明によるプロセスの機能を示す図である。 本発明によるパッチマップを示す図である。 パッチマップの生成の前の前処理を行う本発明による方法例のフローチャートである。 パッチマップの生成の後の後処理を行う本発明による方法例のフローチャートである。
符号の説明
100 システム
102 印刷された又は紙の書類
104 紙書類の元の領域
106 画像捕捉装置
108 特徴量抽出及び認識システム
110 データベース
112 電子表現
114 対応関係を表す線
204 メモリユニット
210 ディスプレイ装置
212 入力装置
214 カーソル制御部
216 通信装置
218 入力/出力(I/O)装置
250 制御部
302 オペレーティングシステム
304 アプリケーション
306 制御モジュール
308 ブラウザ
310 特徴量抽出部
312 特徴量インデキシング部
314 特徴量検索部
316 幾何学的推定部
320 ビデオトラッカ
322 用紙トラッカ
324 認識部
326 ドリフトコレクタ
328 ユーザインターフェースモジュール
1100 複合機
1102 スキャナ
1104 プリンタ
1106 ファクシミリモジュール
1108 プロセッサ/コントローラ
1110 入力/出力装置
1112 データベース
1114 データベース更新部
1116 セキュリティモジュール
1118 注釈モジュール
1120 パッチマップモジュール

Claims (17)

  1. インビジブルジャンクション特徴を使用してアクションを実行する方法であって、
    入力画像を受信するステップと、
    インビジブルジャンクションを使用して前記入力画像に対応する電子書類を認識するステップと、
    前記認識された電子書類に関してキュリティ処理を実行することで、前記認識された電子書類に関してアクションを実行するステップと
    を有する方法。
  2. 前記アクションを実行するステップは、
    前記電子書類に関連するセキュリティ処理を決定するステップと、
    前記セキュリティ処理に従ってスキャンされた画像を処理するステップと
    を有する、請求項1に記載の方法。
  3. 前記アクションを実行するステップは、
    パスワードを要求するステップと、
    ユーザから入力を受信するステップと、
    前記ユーザからの前記入力と前記電子書類のパスワードとを比較するステップと、
    前記ユーザからの前記入力が前記電子書類の前記パスワードと合致する場合に、前記スキャンされた画像を処理するステップと
    を有する、請求項1に記載の方法。
  4. スキャンされた画像を処理するステップは、
    前記スキャンされた画像のコピーを出力するステップと、
    前記電子書類を印刷するステップと、
    ファクシミリメッセージとして前記スキャンされた画像のコピーを送信するステップと、
    ファクシミリメッセージの一部として前記電子書類を送信するステップと、
    前記スキャンされた画像のコピーを電子メールで送信するステップと、
    前記電子書類を電子メールで送信するステップと、
    前記スキャンされた画像を含むメッセージを送信するステップと、
    前記電子書類を含むメッセージを送信するステップと
    を含むグループから選択されたものを有する、請求項1に記載の方法。
  5. 前記アクションを実行するステップは、行われるアクションを示す記録を格納するステップを有し、
    前記記録は、時間、出力されたコピー数、出力のタイプ、受信者、及び画像又は書類が作用したか否かを含むグループから選択されたものを有する、請求項1に記載の方法。
  6. 前記アクションを実行するステップは、前記スキャンされた画像又は電子書類の出力を妨げるステップを有する、請求項1に記載の方法。
  7. 前記アクションを実行するステップは、前記電子書類及び行われるアクションを示す通知を生成して送信するステップを有する、請求項1に記載の方法。
  8. 前記アクションを実行するステップは、前記電子書類を印刷するステップを有し、
    前記入力画像は、前記入力スキャン画像が生成されて以来更新されている書類と、長い書類のページ又は一部と、前記書類の前にコピー又は印刷されたバージョンとを含むグループから選択されたものであり、
    前記電子書類は、前記電子書類の更新バージョンと、元の電子書類と、全体の電子書類とを含むグループから選択されたものである、請求項1に記載の方法。
  9. 前記アクションは、前記電子書類に関するエントリでデータベースを更新することを含み、
    前記データベースを更新することは、
    命令を更新するようにユーザに促すことと、
    前記ユーザから更新命令を受信することと、
    前記受信した更新命令に従って前記データベースを更新することと
    を含む、請求項1に記載の方法。
  10. 前記アクションは、前記電子書類に注釈を追加することを含み、
    前記注釈を追加することは、
    命令を処理するようにユーザに促すことと、
    前記ユーザから処理命令を受信することと、
    前記ユーザから注釈を受信することと、
    前記受信した処理命令に従って前記入力画像及び前記注釈を処理することと
    を含む、請求項1に記載の方法。
  11. インビジブルジャンクションを使用して前記入力画像に対応する前記電子書類を認識するステップは、パッチマップを生成するステップを有する、請求項1に記載の方法。
  12. 前記パッチマップを生成するステップは、
    複数のセルを有する格子を規定するステップと、
    前記格子のセルのインビジブルジャンクション特徴を使用してクエリを生成するステップと、
    前記クエリをデータベースに適用し、候補書類のリストを生成するステップと、
    前記候補書類のリストを有する対応するパッチマップでセルを規定するステップと
    を有する、請求項11に記載の方法。
  13. インビジブルジャンクションを使用して前記入力画像に対応する前記電子書類を認識するステップは、パッチマップの生成の前にインビジブルジャンクション特徴を前処理するステップを有する、請求項1に記載の方法。
  14. インビジブルジャンクションを使用して前記入力画像に対応する前記電子書類を認識するステップは、前記入力画像に含まれる相当な部分を少なくとも1つの安全な書類で判定するためにパッチマップを使用して後処理するステップを有する、請求項1に記載の方法。
  15. インビジブルジャンクション特徴を使用してアクションを実行するシステムであって、
    入力及び出力を有し、入力画像からインビジブルジャンクション特徴記述子を使用して電子書類を特定する認識部であり、前記認識部の前記入力は前記入力画像を受信するように結合され、前記認識部の前記出力は前記電子書類についての情報を提供する認識部と、
    入力及び出力を有し、前記電子書類でセキュリティ処理を実行するセキュリティモジュールであり、前記セキュリティモジュールの前記入力は前記電子書類についての情報を受信するように前記認識部の前記出力に結合されるセキュリティモジュールと
    を有するシステム。
  16. 前記セキュリティ処理は、
    前記アクションを実行するためのパスワードを要求することと、
    印刷を妨げることと、
    前記アクションの記録を格納することと、
    前記アクションの通知を生成して送信することと
    を含むグループから選択されたものである、請求項15に記載のシステム。
  17. 前記認識部は、パッチマップを生成して使用する、請求項15に記載のシステム。
JP2008180794A 2007-07-11 2008-07-10 画像処理方法、画像処理システム、画像処理装置及びプログラム Expired - Fee Related JP5095535B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US94923207P 2007-07-11 2007-07-11
US60/949,232 2007-07-11
US12/059,583 2008-03-31
US12/059,583 US9373029B2 (en) 2007-07-11 2008-03-31 Invisible junction feature recognition for document security or annotation

Publications (2)

Publication Number Publication Date
JP2009022009A true JP2009022009A (ja) 2009-01-29
JP5095535B2 JP5095535B2 (ja) 2012-12-12

Family

ID=39767047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008180794A Expired - Fee Related JP5095535B2 (ja) 2007-07-11 2008-07-10 画像処理方法、画像処理システム、画像処理装置及びプログラム

Country Status (3)

Country Link
US (1) US9373029B2 (ja)
EP (1) EP2015225B1 (ja)
JP (1) JP5095535B2 (ja)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7885987B1 (en) * 2001-08-28 2011-02-08 Lee Eugene M Computer-implemented method and system for managing attributes of intellectual property documents, optionally including organization thereof
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US8989431B1 (en) 2007-07-11 2015-03-24 Ricoh Co., Ltd. Ad hoc paper-based networking with mixed media reality
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US8144921B2 (en) * 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US8489987B2 (en) 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US9063952B2 (en) 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US20090259932A1 (en) * 2008-04-14 2009-10-15 International Business Machines Corporation User-selectable hide option for a user interface, which is not persisted, and which is not dependent upon intra-document controls
US8286068B2 (en) * 2008-04-25 2012-10-09 Microsoft Corporation Linking digital and paper documents
JP5121557B2 (ja) * 2008-05-12 2013-01-16 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
US8139860B2 (en) * 2008-07-31 2012-03-20 Fuji Xerox Co., Ltd. Retrieving and sharing electronic documents using paper
US20100033753A1 (en) * 2008-08-06 2010-02-11 Kenneth Stephenson System and method for selective redaction of scanned documents
US20100042430A1 (en) * 2008-08-12 2010-02-18 Irody Inc System and method for collecting and authenticating medication consumption
JP2010178047A (ja) * 2009-01-29 2010-08-12 Brother Ind Ltd 画像処理装置およびプログラム
JP4826637B2 (ja) * 2009-01-29 2011-11-30 ブラザー工業株式会社 画像処理装置およびプログラム
US8943033B2 (en) 2009-01-30 2015-01-27 International Business Machines Corporation System and method for avoiding duplication of effort in drafting documents
US8949260B2 (en) 2009-10-09 2015-02-03 Ricoh Co., Ltd. Method and apparatus for secure and oblivious document matching
US9132352B1 (en) 2010-06-24 2015-09-15 Gregory S. Rabin Interactive system and method for rendering an object
KR101788598B1 (ko) * 2010-09-01 2017-11-15 엘지전자 주식회사 이동 단말기 및 그의 정보보안 설정방법
US8503769B2 (en) 2010-12-28 2013-08-06 Microsoft Corporation Matching text to images
WO2012106261A1 (en) * 2011-01-31 2012-08-09 Dolby Laboratories Licensing Corporation Systems and methods for restoring color and non-color related integrity in an image
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
WO2013067092A1 (en) * 2011-11-04 2013-05-10 Document Security Systems, Inc. System and method for dynamic generation of embedded security features in a document
US9483794B2 (en) * 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9660993B2 (en) * 2012-10-25 2017-05-23 Facebook, Inc. Event reporting and handling
US11250203B2 (en) 2013-08-12 2022-02-15 Microsoft Technology Licensing, Llc Browsing images via mined hyperlinked text snippets
CN104156694B (zh) * 2014-07-18 2019-03-19 百度在线网络技术(北京)有限公司 一种用于识别图像中的目标对象的方法与设备
JP2016127475A (ja) * 2015-01-06 2016-07-11 株式会社リコー 画像処理システム、画像処理方法、及びプログラム
CN104917649B (zh) * 2015-06-05 2021-09-24 重庆智韬信息技术中心 对通信数据反向安全审计的方法
US10931848B2 (en) 2015-06-08 2021-02-23 Docsolid Llc Adding a graphical symbol to a print stream for a document file
US10623601B2 (en) * 2015-06-08 2020-04-14 Docsolid Llc Inserting a graphical symbol into a print stream for a document file that does not include the graphical symbol
US9984471B2 (en) * 2016-07-26 2018-05-29 Intuit Inc. Label and field identification without optical character recognition (OCR)
US10853651B2 (en) * 2016-10-26 2020-12-01 Htc Corporation Virtual reality interaction method, apparatus and system
JP6799354B2 (ja) * 2016-10-26 2020-12-16 キヤノン株式会社 画像処理装置、画像処理装置の制御方法、及びプログラム
EP3373205B1 (en) * 2017-03-09 2020-12-23 Ricoh Company, Ltd. Image forming apparatus
WO2019113576A1 (en) * 2017-12-10 2019-06-13 Walmart Apollo, Llc Systems and methods for automated classification of regulatory reports
RU2668717C1 (ru) * 2017-12-13 2018-10-02 Общество с ограниченной ответственностью "Аби Продакшн" Генерация разметки изображений документов для обучающей выборки
WO2020068945A1 (en) * 2018-09-26 2020-04-02 Leverton Holding Llc Named entity recognition with convolutional networks
CN110059272B (zh) * 2018-11-02 2023-08-15 创新先进技术有限公司 一种页面特征识别方法和装置
US11462037B2 (en) 2019-01-11 2022-10-04 Walmart Apollo, Llc System and method for automated analysis of electronic travel data
US10594899B1 (en) * 2019-02-15 2020-03-17 Kyocera Document Solutions Inc. Methods and system for generating a confidential document
JP7259468B2 (ja) * 2019-03-25 2023-04-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11030446B2 (en) * 2019-06-11 2021-06-08 Open Text Sa Ulc System and method for separation and classification of unstructured documents
CN111008955B (zh) * 2019-11-06 2023-05-26 重庆邮电大学 多尺度图像块匹配的快速复制粘贴篡改检测方法
US11270155B2 (en) * 2019-11-26 2022-03-08 Dash Hudson Duplicate image detection based on image content
US11822599B2 (en) * 2020-12-16 2023-11-21 International Business Machines Corporation Visualization resonance for collaborative discourse
EP4273779A4 (en) * 2020-12-29 2024-04-17 Designovel TEXT AND DESIGN MATCHING METHOD AND RELATED DEVICE
US11550934B2 (en) * 2021-03-16 2023-01-10 Check Point Software Technologies, Ltd. Systems and methods for the efficient detection of improperly redacted electronic documents
CN113761231B (zh) * 2021-09-07 2022-07-12 浙江传媒学院 一种基于文本字符特征的文本数据归属描述及生成方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09134372A (ja) * 1995-09-05 1997-05-20 Ricoh Co Ltd 文書検索方法及び装置
WO2007023994A1 (en) * 2005-08-23 2007-03-01 Ricoh Company, Ltd. System and methods for creation and use of a mixed media environment
JP2007174270A (ja) * 2005-12-22 2007-07-05 Canon Inc 画像処理装置、画像処理方法、記憶媒体、プログラム

Family Cites Families (485)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1915993A (en) * 1931-04-27 1933-06-27 Gen Electric Statistical machine
US4759075A (en) 1983-03-14 1988-07-19 Ana Tech Corporation Method and apparatus for vectorizing documents and symbol recognition
JPH01144171A (ja) 1987-11-30 1989-06-06 Toshiba Corp 電子ファイリング装置
JPH01144165A (ja) * 1987-11-30 1989-06-06 Toshiba Corp 電子ファイリング装置
US5035302A (en) * 1989-03-03 1991-07-30 Otis Elevator Company "Artificial Intelligence" based learning system predicting "Peak-Period" times for elevator dispatching
JP2795719B2 (ja) 1990-03-07 1998-09-10 富士通株式会社 認識距離の差に基づく最良優先探索処理方法
US5077805A (en) 1990-05-07 1991-12-31 Eastman Kodak Company Hybrid feature-based and template matching optical character recognition system
US5109439A (en) * 1990-06-12 1992-04-28 Horst Froessl Mass document storage and retrieval system
KR0176448B1 (ko) 1991-07-19 1999-05-01 강진구 이미지 코딩 방법 및 장치
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5392447A (en) * 1992-01-10 1995-02-21 Eastman Kodak Compay Image-based electronic pocket organizer with integral scanning unit
US6678864B1 (en) 1992-02-25 2004-01-13 Irving Tsai Method and apparatus for linking designated portions of a received document image with an electronic address
US6574375B1 (en) * 1992-04-06 2003-06-03 Ricoh Company, Ltd. Method for detecting inverted text images on a digital scanning device
US5432864A (en) * 1992-10-05 1995-07-11 Daozheng Lu Identification card verification system
US5579471A (en) 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
US5493689A (en) * 1993-03-01 1996-02-20 International Business Machines Corporation System for configuring an event driven interface including control blocks defining good loop locations in a memory which represent detection of a characteristic pattern
US5848184A (en) 1993-03-15 1998-12-08 Unisys Corporation Document page analyzer and method
US5546502A (en) 1993-03-19 1996-08-13 Ricoh Company, Ltd. Automatic invocation of computational resources without user intervention
DE69425824T2 (de) 1993-06-22 2001-04-05 Omron Tateisi Electronics Co Bildprozessor mit kopierer
US5553217A (en) 1993-09-23 1996-09-03 Ricoh Company, Ltd. Document layout using tiling
US5664111A (en) 1994-02-16 1997-09-02 Honicorp, Inc. Computerized, multimedia, network, real time, interactive marketing and transactional system
US6947571B1 (en) 1999-05-19 2005-09-20 Digimarc Corporation Cell phones with optical capabilities, and related applications
JPH07319691A (ja) 1994-03-29 1995-12-08 Toshiba Corp 資源保護装置、特権保護装置、ソフトウェア利用法制御装置、及びソフトウェア利用法制御システム
US5465353A (en) 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
EP0811946A3 (en) 1994-04-15 1998-01-14 Canon Kabushiki Kaisha Image pre-processor for character recognition system
US6164534A (en) * 1996-04-04 2000-12-26 Rathus; Spencer A. Method and apparatus for accessing electronic data via a familiar printed medium
US6866196B1 (en) 1994-05-25 2005-03-15 Spencer A. Rathus Method and apparatus for accessing electronic data via a familiar printed medium
US5694546A (en) 1994-05-31 1997-12-02 Reisman; Richard R. System for automatic unattended electronic information transport between a server and a client by a vendor provided transport software with a manifest list
DE69525401T2 (de) 1994-09-12 2002-11-21 Adobe Systems Inc Verfahren und Gerät zur Identifikation von Wörtern, die in einem portablen elektronischen Dokument beschrieben sind
US5555556A (en) * 1994-09-30 1996-09-10 Xerox Corporation Method and apparatus for document segmentation by background analysis
US6804332B1 (en) 1994-09-30 2004-10-12 Wildfire Communications, Inc. Network based knowledgeable assistant
US6415307B2 (en) 1994-10-24 2002-07-02 P2I Limited Publication file conversion and display
US5907835A (en) 1994-11-18 1999-05-25 Canon Kabushiki Kaisha Electronic filing system using different application program for processing drawing commands for printing
US6460036B1 (en) 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
JPH08297669A (ja) 1994-12-27 1996-11-12 Internatl Business Mach Corp <Ibm> 複合ドキュメント内の複数のパートを自動的にリンクするシステムおよび方法
US5873077A (en) * 1995-01-13 1999-02-16 Ricoh Corporation Method and apparatus for searching for and retrieving documents using a facsimile machine
JPH096961A (ja) 1995-06-16 1997-01-10 Sony Corp 領域分割処理装置および方法
US7051086B2 (en) * 1995-07-27 2006-05-23 Digimarc Corporation Method of linking on-line data to printed documents
US5842194A (en) 1995-07-28 1998-11-24 Mitsubishi Denki Kabushiki Kaisha Method of recognizing images of faces or general images using fuzzy combination of multiple resolutions
US5793371A (en) 1995-08-04 1998-08-11 Sun Microsystems, Inc. Method and apparatus for geometric compression of three-dimensional graphics data
US5764277A (en) 1995-11-08 1998-06-09 Bell Communications Research, Inc. Group-of-block based video signal combining for multipoint continuous presence video conferencing
US5706097A (en) 1995-11-13 1998-01-06 Eastman Kodak Company Index print with a digital recording medium containing still images, motion sequences, and sound sequences
US5889886A (en) 1995-11-28 1999-03-30 Xerox Corporation Method and apparatus for detecting running text in an image
US20010013546A1 (en) 1996-01-09 2001-08-16 Ross William Leslie Identification system
US5832474A (en) 1996-02-26 1998-11-03 Matsushita Electric Industrial Co., Ltd. Document search and retrieval system with partial match searching of user-drawn annotations
US5757953A (en) * 1996-02-29 1998-05-26 Eastman Kodak Company Automated method and system for region decomposition in digital radiographic images
US5933823A (en) 1996-03-01 1999-08-03 Ricoh Company Limited Image database browsing and query using texture analysis
US5754772A (en) 1996-03-26 1998-05-19 Unisys Corporation Transaction service independent HTTP server-to-transaction gateway
US5918012A (en) 1996-03-29 1999-06-29 British Telecommunications Public Limited Company Hyperlinking time-based data files
US5933525A (en) 1996-04-10 1999-08-03 Bbn Corporation Language-independent and segmentation-free optical character recognition system and method
US5806005A (en) 1996-05-10 1998-09-08 Ricoh Company, Ltd. Wireless image transfer from a digital still video camera to a networked computer
WO1997046975A1 (en) 1996-06-04 1997-12-11 Muncey Grant J Techniques for creating and modifying 3d models and correlating such models with 2d pictures
US6430307B1 (en) 1996-06-18 2002-08-06 Matsushita Electric Industrial Co., Ltd. Feature extraction system and face image recognition system
US5956468A (en) 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
US6104834A (en) 1996-08-01 2000-08-15 Ricoh Company Limited Matching CCITT compressed document images
US6353822B1 (en) 1996-08-22 2002-03-05 Massachusetts Institute Of Technology Program-listing appendix
US6819783B2 (en) 1996-09-04 2004-11-16 Centerframe, Llc Obtaining person-specific images in a public venue
US5899999A (en) * 1996-10-16 1999-05-04 Microsoft Corporation Iterative convolution filter particularly suited for use in an image classification and retrieval system
US6345109B1 (en) 1996-12-05 2002-02-05 Matsushita Electric Industrial Co., Ltd. Face recognition-matching system effective to images obtained in different imaging conditions
JP2815045B2 (ja) 1996-12-16 1998-10-27 日本電気株式会社 画像特徴抽出装置,画像特徴解析装置,および画像照合システム
US5937110A (en) 1996-12-20 1999-08-10 Xerox Corporation Parallel propagating embedded binary sequences for characterizing objects in N-dimensional address space
US7437351B2 (en) * 1997-01-10 2008-10-14 Google Inc. Method for searching media
US5892843A (en) * 1997-01-21 1999-04-06 Matsushita Electric Industrial Co., Ltd. Title, caption and photo extraction from scanned document images
JP3634099B2 (ja) 1997-02-17 2005-03-30 株式会社リコー 文書情報管理システム,媒体用紙情報作成装置および文書情報管理装置
US6006240A (en) 1997-03-31 1999-12-21 Xerox Corporation Cell identification in table analysis
JP2002501644A (ja) 1997-05-07 2002-01-15 ネオメディア テクノロジーズ,インク. スキャナ強化遠隔制御ユニットおよびオンライン資源に自動的にリンクするためのシステム
CA2307129A1 (en) 1997-06-03 1998-12-10 Stephen Bide Portable navigation system comprising direction detector, position detector and database
US6025780A (en) 1997-07-25 2000-02-15 Checkpoint Systems, Inc. RFID tags which are virtually activated and/or deactivated and apparatus and methods of using same in an electronic security system
US6121969A (en) 1997-07-29 2000-09-19 The Regents Of The University Of California Visual navigation in perceptual databases
JPH1153168A (ja) 1997-08-07 1999-02-26 Matsushita Graphic Commun Syst Inc 音声情報付文書作成装置及びこれを用いた方法
AUPO960197A0 (en) 1997-10-03 1997-10-30 Canon Information Systems Research Australia Pty Ltd Multi-media editing method and apparatus
US6035055A (en) * 1997-11-03 2000-03-07 Hewlett-Packard Company Digital image management system in a distributed data access network system
US6026411A (en) 1997-11-06 2000-02-15 International Business Machines Corporation Method, apparatus, and computer program product for generating an image index and for internet searching and querying by image colors
US6415278B1 (en) 1997-11-14 2002-07-02 Adobe Systems Incorporated Retrieving documents transitively linked to an initial document
US5999664A (en) 1997-11-14 1999-12-07 Xerox Corporation System for searching a corpus of document images by user specified document layout components
US6562077B2 (en) 1997-11-14 2003-05-13 Xerox Corporation Sorting image segments into clusters based on a distance measurement
US6574644B2 (en) * 1997-11-26 2003-06-03 Siemens Corporate Research, Inc Automatic capturing of hyperlink specifications for multimedia documents
US6138129A (en) 1997-12-16 2000-10-24 World One Telecom, Ltd. Method and apparatus for providing automated searching and linking of electronic documents
JP4183311B2 (ja) 1997-12-22 2008-11-19 株式会社リコー 文書の注釈方法、注釈装置および記録媒体
US6804659B1 (en) 2000-01-14 2004-10-12 Ricoh Company Ltd. Content based web advertising
US7124093B1 (en) * 1997-12-22 2006-10-17 Ricoh Company, Ltd. Method, system and computer code for content based web advertising
WO1999034319A1 (en) 1997-12-29 1999-07-08 Cornell Research Foundation, Inc. Image subregion querying using color correlograms
US6990221B2 (en) 1998-02-07 2006-01-24 Biodiscovery, Inc. Automated DNA array image segmentation and analysis
DE69942901D1 (de) * 1998-04-02 2010-12-16 Canon Kk Einrichtung und Verfahren zum Suchen von Bildern
US6393142B1 (en) * 1998-04-22 2002-05-21 At&T Corp. Method and apparatus for adaptive stripe based patch matching for depth estimation
US6337683B1 (en) * 1998-05-13 2002-01-08 Imove Inc. Panoramic movies which simulate movement through multidimensional space
US6504571B1 (en) * 1998-05-18 2003-01-07 International Business Machines Corporation System and methods for querying digital image archives using recorded parameters
AU4196299A (en) 1998-05-23 1999-12-13 Eolas Technologies, Incorporated Identification of features of multi-dimensional image data in hypermedia systems
US6253201B1 (en) 1998-06-23 2001-06-26 Philips Electronics North America Corporation Scalable solution for image retrieval
US6345274B1 (en) 1998-06-29 2002-02-05 Eastman Kodak Company Method and computer program product for subjective image content similarity-based retrieval
JP2002521752A (ja) 1998-07-24 2002-07-16 ジャーグ コーポレーション オブジェクト検索を実行するための分散コンピュータ・データベースシステム及びその方法
US6223171B1 (en) * 1998-08-25 2001-04-24 Microsoft Corporation What-if index analysis utility for database systems
US7039856B2 (en) 1998-09-30 2006-05-02 Ricoh Co., Ltd. Automatic document classification using text and images
US6964374B1 (en) 1998-10-02 2005-11-15 Lucent Technologies Inc. Retrieval and manipulation of electronically stored information via pointers embedded in the associated printed material
US6470095B2 (en) 1998-10-13 2002-10-22 Xerox Corporation Automatic extraction of text regions and region borders for an electronic work surface
US6445834B1 (en) 1998-10-19 2002-09-03 Sony Corporation Modular image query system
US6192157B1 (en) * 1998-10-27 2001-02-20 Hewlett-Packard Company Modifications of postscript adaptive data compression (ADC) for 3 plane, 8 bit color images, JPEG lossy compression, and variable Q factors
JP3754849B2 (ja) 1998-10-30 2006-03-15 キヤノン株式会社 データ通信装置及び制御方法及び記憶媒体及び画像印刷システム
US6363381B1 (en) * 1998-11-03 2002-03-26 Ricoh Co., Ltd. Compressed document matching
JP4058181B2 (ja) 1998-11-25 2008-03-05 キヤノン株式会社 周辺機器装置及びその制御方法及び記憶媒体
US6301386B1 (en) 1998-12-09 2001-10-09 Ncr Corporation Methods and apparatus for gray image based text identification
US6449639B1 (en) 1998-12-23 2002-09-10 Doxio, Inc. Method and system for client-less viewing of scalable documents displayed using internet imaging protocol commands
US6411953B1 (en) * 1999-01-25 2002-06-25 Lucent Technologies Inc. Retrieval and matching of color patterns based on a predetermined vocabulary and grammar
US6448979B1 (en) 1999-01-25 2002-09-10 Airclic, Inc. Printed medium activated interactive communication of multimedia information, including advertising
US6922699B2 (en) 1999-01-26 2005-07-26 Xerox Corporation System and method for quantitatively representing data objects in vector space
US6892238B2 (en) 1999-01-27 2005-05-10 International Business Machines Corporation Aggregating and analyzing information about content requested in an e-commerce web environment to determine conversion rates
US6071501A (en) 1999-02-05 2000-06-06 The Procter & Gamble Company Photostable UV protection compositions
US20010037454A1 (en) 2000-05-01 2001-11-01 Botti John T. Computer networked system and method of digital file management and authentication
CN1423786A (zh) 1999-03-02 2003-06-11 奎克斯塔投资公司 包含一种会员购买机会的行销系统内的电子商务交易
US6404925B1 (en) * 1999-03-11 2002-06-11 Fuji Xerox Co., Ltd. Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition
JP3902904B2 (ja) 1999-03-23 2007-04-11 キヤノン株式会社 情報提示装置、方法、カメラ制御装置、方法及びコンピュータ読み取り可能な記憶媒体
US6658151B2 (en) * 1999-04-08 2003-12-02 Ricoh Co., Ltd. Extracting information from symbolically compressed document images
US6625311B1 (en) 1999-04-09 2003-09-23 The Board Of Regents Of The University Of Nebraska Methodology for data structure characterization, indexing, storage and retrieval
US7281199B1 (en) 1999-04-14 2007-10-09 Verizon Corporate Services Group Inc. Methods and systems for selection of multimedia presentations
US6791605B1 (en) * 1999-05-07 2004-09-14 Eastman Kodak Company Image capture and printing device
US6397213B1 (en) * 1999-05-12 2002-05-28 Ricoh Company Ltd. Search and retrieval using document decomposition
US7406214B2 (en) 1999-05-19 2008-07-29 Digimarc Corporation Methods and devices employing optical sensors and/or steganography
US7206820B1 (en) * 2000-03-18 2007-04-17 Digimarc Corporation System for linking from object to remote resource
US6693649B1 (en) 1999-05-27 2004-02-17 International Business Machines Corporation System and method for unifying hotspots subject to non-linear transformation and interpolation in heterogeneous media representations
US6411724B1 (en) 1999-07-02 2002-06-25 Koninklijke Philips Electronics N.V. Using meta-descriptors to represent multimedia information
US6628412B1 (en) 1999-08-05 2003-09-30 Hewlett-Packard Development Company, L.P. Methods of document management and automated document tracking, and a document management system
US6408257B1 (en) * 1999-08-31 2002-06-18 Xerox Corporation Augmented-reality display method and system
US6732915B1 (en) * 1999-09-10 2004-05-11 Fuji Xerox Co., Ltd. Systems and methods for controlling a presentation using physical objects
US6859802B1 (en) 1999-09-13 2005-02-22 Microsoft Corporation Image retrieval based on relevance feedback
US6751343B1 (en) * 1999-09-20 2004-06-15 Ut-Battelle, Llc Method for indexing and retrieving manufacturing-specific digital imagery based on image content
US6799201B1 (en) 2000-09-19 2004-09-28 Motorola, Inc. Remotely configurable multimedia entertainment and information system for vehicles
EP1089214A3 (en) 1999-09-30 2005-01-26 Matsushita Electric Industrial Co., Ltd. Apparatus and method for image recognition
US7134095B1 (en) 1999-10-20 2006-11-07 Gateway, Inc. Simulated three-dimensional navigational menu system
US6874420B2 (en) 1999-10-22 2005-04-05 Cc1, Inc. System and method for register mark recognition
US6594383B1 (en) 1999-11-16 2003-07-15 International Business Machines Corporation Method and apparatus for indexing and retrieving images from an images database based on a color query
KR100353798B1 (ko) 1999-12-01 2002-09-26 주식회사 코난테크놀로지 영상 객체 모양 정보 추출 방법 및 그를 이용한 내용기반 이미지 검색 시스템 및 그 방법
US7458014B1 (en) 1999-12-07 2008-11-25 Microsoft Corporation Computer user interface architecture wherein both content and user interface are composed of documents with links
US7185274B1 (en) * 1999-12-07 2007-02-27 Microsoft Corporation Computer user interface architecture wherein users interact with both content and user interface by activating links
US6820111B1 (en) 1999-12-07 2004-11-16 Microsoft Corporation Computer user interface architecture that saves a user's non-linear navigation history and intelligently maintains that history
JP2001177712A (ja) * 1999-12-15 2001-06-29 Fuji Xerox Co Ltd 画像処理装置および被画像形成媒体
US6643652B2 (en) * 2000-01-14 2003-11-04 Saba Software, Inc. Method and apparatus for managing data exchange among systems in a network
JP2001211359A (ja) 2000-01-25 2001-08-03 Olympus Optical Co Ltd 電子カメラ
US20010042030A1 (en) 2000-02-15 2001-11-15 Sadao Ito Information providing system for providing information about parts
AU2001238354A1 (en) 2000-02-18 2001-08-27 The University Of Maryland Methods for the electronic annotation, retrieval, and use of electronic images
JP2001230916A (ja) 2000-02-18 2001-08-24 Ricoh Co Ltd ファイルシステム
US6766363B1 (en) * 2000-02-28 2004-07-20 Barpoint.Com, Inc. System and method of linking items in audio, visual, and printed media to related information stored on an electronic network using a mobile device
GB2359953B (en) 2000-03-03 2004-02-11 Hewlett Packard Co Improvements relating to image capture systems
US6859909B1 (en) * 2000-03-07 2005-02-22 Microsoft Corporation System and method for annotating web-based documents
US6470094B1 (en) 2000-03-14 2002-10-22 Intel Corporation Generalized text localization in images
US7079157B2 (en) 2000-03-17 2006-07-18 Sun Microsystems, Inc. Matching the edges of multiple overlapping screen images
US6865302B2 (en) * 2000-03-16 2005-03-08 The Regents Of The University Of California Perception-based image retrieval
JP4088014B2 (ja) 2000-03-22 2008-05-21 株式会社東芝 画像検索システムおよび画像検索方法
JP4409035B2 (ja) 2000-03-22 2010-02-03 本田技研工業株式会社 画像処理装置、特異箇所検出方法、及び特異箇所検出プログラムを記録した記録媒体
DE60119418T2 (de) 2000-03-22 2007-05-24 Kabushiki Kaisha Toshiba, Kawasaki Gesichtsbildaufnehmendes Erkennungsgerät und Passüberprüfungsgerät
WO2001071558A1 (fr) 2000-03-23 2001-09-27 Mitsubishi Denki Kabushiki Kaisha Systeme et procede d'extraction/de distribution d'images
JP3842006B2 (ja) * 2000-03-30 2006-11-08 グローリー工業株式会社 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
EP1662064A1 (en) 2000-04-24 2006-05-31 Hunter Douglas Inc. Compressible structural panel
US7003734B1 (en) 2000-05-05 2006-02-21 Point Roll, Inc. Method and system for creating and displaying images including pop-up images on a visual display
EP1295490A4 (en) 2000-05-08 2005-10-12 Qwest Comm Int Inc METHOD AND SYSTEM FOR POSITION-BASED MESSAGE TRANSMISSION
US7034864B2 (en) 2000-05-19 2006-04-25 Canon Kabushiki Kaisha Image display apparatus, image display system, and image display method
US20010049700A1 (en) 2000-05-26 2001-12-06 Shinobu Ichikura Information processing apparatus, information processing method and storage medium
GB2364590B (en) 2000-07-07 2004-06-02 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
AU2001283004A1 (en) 2000-07-24 2002-02-05 Vivcom, Inc. System and method for indexing, searching, identifying, and editing portions of electronic multimedia files
US6903707B2 (en) 2000-08-09 2005-06-07 Information Decision Technologies, Llc Method for using a motorized camera mount for tracking in augmented reality
FR2812957B1 (fr) * 2000-08-14 2003-01-31 Cit Alcatel Procede de memorisation de donnees dans un fichier multimedia utilisant des bases de temps relatives
US7523411B2 (en) 2000-08-22 2009-04-21 Bruce Carlin Network-linked interactive three-dimensional composition and display of saleable objects in situ in viewer-selected scenes for purposes of object promotion and procurement, and generation of object advertisements
US7062722B1 (en) 2000-08-22 2006-06-13 Bruce Carlin Network-linked interactive three-dimensional composition and display of saleable objects in situ in viewer-selected scenes for purposes of promotion and procurement
US6671684B1 (en) 2000-09-01 2003-12-30 Ricoh Co., Ltd. Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document
JP2002068179A (ja) 2000-09-04 2002-03-08 Toppan Printing Co Ltd 密封紙容器用包装材料
US6405172B1 (en) * 2000-09-09 2002-06-11 Mailcode Inc. Voice-enabled directory look-up based on recognized spoken initial characters
US20020038430A1 (en) 2000-09-13 2002-03-28 Charles Edwards System and method of data collection, processing, analysis, and annotation for monitoring cyber-threats and the notification thereof to subscribers
AU2001294704A1 (en) * 2000-09-25 2002-04-08 Databites, Inc. System and method for automatic retrieval of structured online documents
US6940491B2 (en) 2000-10-27 2005-09-06 International Business Machines Corporation Method and system for generating hyperlinked physical copies of hyperlinked electronic documents
JP2002132547A (ja) * 2000-10-27 2002-05-10 Fuji Xerox Co Ltd 電子情報管理サーバ、電子情報管理クライアントおよび電子情報管理方法ならびに電子情報管理プログラムを記録したコンピュータ読み取り可能な記録媒体
US6970860B1 (en) 2000-10-30 2005-11-29 Microsoft Corporation Semi-automatic annotation of multimedia objects
US7680324B2 (en) 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
US20020102966A1 (en) 2000-11-06 2002-08-01 Lev Tsvi H. Object identification method for portable devices
US6963358B2 (en) 2000-11-10 2005-11-08 Dropfire, Inc. Wireless digital camera adapter and systems and methods related thereto and for use with such an adapter
IL155821A0 (en) * 2000-11-17 2003-12-23 Weitman Jacob Applications for mobile digital camera that distinguish between text and image-information in an image
US6958821B1 (en) 2000-11-21 2005-10-25 Eastman Kodak Company Analyzing images to determine third party product materials corresponding to the analyzed images
US7253919B2 (en) 2000-11-30 2007-08-07 Ricoh Co., Ltd. Printer with embedded retrieval and publishing interface
US20020069418A1 (en) 2000-12-06 2002-06-06 Ashwin Philips Network-enabled audio/video player
US7013309B2 (en) 2000-12-18 2006-03-14 Siemens Corporate Research Method and apparatus for extracting anchorable information units from complex PDF documents
US7596691B2 (en) 2000-12-19 2009-09-29 Fuji Xerox Co., Ltd. Internet facsimile and control method thereof and communication instruction terminal
US7007243B2 (en) 2000-12-20 2006-02-28 Eastman Kodak Company Method and apparatus for producing digital images with embedded image capture location icons
US7092953B1 (en) 2000-12-28 2006-08-15 Rightlsline, Inc. Apparatus and methods for intellectual property database navigation
US6826316B2 (en) 2001-01-24 2004-11-30 Eastman Kodak Company System and method for determining image similarity
JP2002229955A (ja) 2001-02-02 2002-08-16 Matsushita Electric Ind Co Ltd 情報端末装置及び認証システム
US7013289B2 (en) 2001-02-21 2006-03-14 Michel Horn Global electronic commerce system
JP4181310B2 (ja) 2001-03-07 2008-11-12 昌和 鈴木 数式認識装置および数式認識方法
US7366979B2 (en) 2001-03-09 2008-04-29 Copernicus Investments, Llc Method and apparatus for annotating a document
US7231381B2 (en) 2001-03-13 2007-06-12 Microsoft Corporation Media content search engine incorporating text content and user log mining
US7711547B2 (en) 2001-03-16 2010-05-04 Meaningful Machines, L.L.C. Word association method and apparatus
US7392287B2 (en) 2001-03-27 2008-06-24 Hemisphere Ii Investment Lp Method and apparatus for sharing information using a handheld device
US7200271B2 (en) 2001-03-29 2007-04-03 The Boeing Company Method, computer program product, and system for performing automated text recognition and text search within a graphic file
US6999204B2 (en) 2001-04-05 2006-02-14 Global 360, Inc. Document processing using color marking
US6910097B1 (en) 2001-04-09 2005-06-21 Netlogic Microsystems, Inc. Classless interdomain routing using binary content addressable memory
US6690828B2 (en) 2001-04-09 2004-02-10 Gary Elliott Meyers Method for representing and comparing digital images
WO2002084590A1 (en) * 2001-04-11 2002-10-24 Applied Minds, Inc. Knowledge web
JP2002318578A (ja) 2001-04-20 2002-10-31 Mitsubishi Electric Corp 画像表示方法
US20020176628A1 (en) * 2001-05-22 2002-11-28 Starkweather Gary K. Document imaging and indexing system
US20020194264A1 (en) 2001-05-31 2002-12-19 Pioneer Corporation Digital information distribution apparatus and method
US20020198789A1 (en) 2001-06-22 2002-12-26 Sony Corp. And Sony Music Entertainment, Inc. Apparatus and method for identifying and purchasing music
US20040238621A1 (en) 2001-07-10 2004-12-02 American Express Travel Related Services Company, Inc. Method and system for fingerprint biometrics on a fob
EP1276314B1 (en) 2001-07-13 2007-11-14 Hewlett-Packard Company Spot color application in printer device
US6903752B2 (en) * 2001-07-16 2005-06-07 Information Decision Technologies, Llc Method to view unseen atmospheric phenomenon using augmented reality
US7188085B2 (en) * 2001-07-20 2007-03-06 International Business Machines Corporation Method and system for delivering encrypted content with associated geographical-based advertisements
US6996291B2 (en) 2001-08-06 2006-02-07 Mitutoyo Corporation Systems and methods for correlating images in an image correlation system with reduced computational loads
JP4617621B2 (ja) * 2001-08-07 2011-01-26 コニカミノルタホールディングス株式会社 印刷制御装置、及びその課金方法
CN1303818C (zh) 2001-09-12 2007-03-07 皇家飞利浦电子股份有限公司 运动估计和/或补偿
US7187476B2 (en) 2001-10-01 2007-03-06 Canon Kabushiki Kaisha Image processing apparatus and method, computer program, and recording medium
US7068309B2 (en) 2001-10-09 2006-06-27 Microsoft Corp. Image exchange with image annotation
US20030069932A1 (en) 2001-10-10 2003-04-10 Hall John M. System and method for providing transmission notification
US6925475B2 (en) * 2001-10-12 2005-08-02 Commissariat A L'energie Atomique Process and apparatus for management of multimedia databases
US7150021B1 (en) 2001-10-12 2006-12-12 Palau Acquisition Corporation (Delaware) Method and system to allocate resources within an interconnect device according to a resource allocation table
JP3886769B2 (ja) 2001-10-26 2007-02-28 富士通株式会社 補正画像生成装置および補正画像生成プログラム
US20030122922A1 (en) * 2001-11-26 2003-07-03 Saffer Kevin D. Video e-mail system and associated method
US7099508B2 (en) * 2001-11-29 2006-08-29 Kabushiki Kaisha Toshiba Document identification device, document definition method and document identification method
US6931603B2 (en) * 2001-11-29 2005-08-16 International Business Machines Corporation Method and system for appending information to graphical files stored in specific graphical file formats
US7322514B2 (en) 2001-11-30 2008-01-29 International Barcode Corporation Method for identifying and authenticating goods using codes, barcodes and radio frequency identification
US20040013302A1 (en) 2001-12-04 2004-01-22 Yue Ma Document classification and labeling using layout graph matching
US7308486B2 (en) * 2001-12-06 2007-12-11 Accenture Global Services Gmbh Mobile guide communications system
JP3821367B2 (ja) 2001-12-11 2006-09-13 ソニー株式会社 チャット提供システム、情報処理装置および方法、並びにプログラム
US7142699B2 (en) 2001-12-14 2006-11-28 Siemens Corporate Research, Inc. Fingerprint matching using ridge feature maps
US20030112930A1 (en) * 2001-12-18 2003-06-19 Bosik Barry S. Call management system responsive to network presence
US7475242B2 (en) 2001-12-18 2009-01-06 Hewlett-Packard Development Company, L.P. Controlling the distribution of information
US7268906B2 (en) 2002-01-07 2007-09-11 Xerox Corporation Systems and methods for authenticating and verifying documents
US7035467B2 (en) 2002-01-09 2006-04-25 Eastman Kodak Company Method and system for processing images for themed imaging services
US7239747B2 (en) 2002-01-24 2007-07-03 Chatterbox Systems, Inc. Method and system for locating position in printed texts and delivering multimedia information
US7139004B2 (en) 2002-01-25 2006-11-21 Xerox Corporation Method and apparatus to convert bitmapped images for use in a structured text/graphics editor
US7137064B2 (en) 2002-02-02 2006-11-14 International Business Machines Corporation System and method for facilitating document imaging requests
US7362354B2 (en) 2002-02-12 2008-04-22 Hewlett-Packard Development Company, L.P. Method and system for assessing the photo quality of a captured image in a digital still camera
JP2003256475A (ja) 2002-03-05 2003-09-12 Fujitsu Ltd 画像データ管理装置およびコンピュータプログラム
US7167574B2 (en) * 2002-03-14 2007-01-23 Seiko Epson Corporation Method and apparatus for content-based image copy detection
US20030179230A1 (en) 2002-03-25 2003-09-25 Gerry Seidman Method and apparatus for providing remote peer-to-peer collaborative user interfaces
US7251689B2 (en) 2002-03-27 2007-07-31 International Business Machines Corporation Managing storage resources in decentralized networks
US7421153B1 (en) 2002-04-05 2008-09-02 Bank Of America Corporation Image and data processing system
US6793334B2 (en) 2002-04-11 2004-09-21 Hewlett-Packard Development Company, L.P. Barcode printing module
US7043474B2 (en) 2002-04-15 2006-05-09 International Business Machines Corporation System and method for measuring image similarity based on semantic meaning
US6979904B2 (en) 2002-04-19 2005-12-27 Micron Technology, Inc. Integrated circuit package having reduced interconnects
US20040036679A1 (en) * 2002-05-02 2004-02-26 Emerson Harry E. Computer system providing a visual indication when typing in caps lock mode
JP4202677B2 (ja) 2002-05-09 2008-12-24 株式会社東芝 アイデア抽出支援方法とアイデア抽出支援用のコンピュータプログラム
US20030229857A1 (en) 2002-06-05 2003-12-11 Fuji Xerox Co., Ltd. Apparatus, method, and computer program product for document manipulation which embeds information in document data
US7240279B1 (en) 2002-06-19 2007-07-03 Microsoft Corporation XML patterns language
EP1378886A1 (en) 2002-07-02 2004-01-07 Ubicall Communications en abrégé "UbiCall" S.A. Speech recognition device
EP1388805B1 (en) 2002-07-15 2008-12-17 Samsung Electronics Co., Ltd. Apparatus and method for retrieving face images using combined components descriptors
US6781694B2 (en) 2002-07-16 2004-08-24 Mitutoyo Corporation Two-dimensional scale structures and method usable in an absolute position transducer
JP4190819B2 (ja) 2002-07-17 2008-12-03 Juki株式会社 電子部品実装装置及び画像認識方法の選択方法
JP3876783B2 (ja) 2002-07-19 2007-02-07 株式会社デンソーウェーブ 情報コード読取方法
CA2397424A1 (en) * 2002-08-09 2004-02-09 Mohammed Lamine Kherfi Content-based image retrieval using positive and negative examples
WO2004034236A2 (en) * 2002-10-11 2004-04-22 Digimarc Corporation Systems and methods for recognition of individuals using multiple biometric searches
US7249123B2 (en) 2002-10-31 2007-07-24 International Business Machines Corporation System and method for building social networks based on activity around shared virtual objects
US6810328B2 (en) 2002-11-23 2004-10-26 Alpine Electronics, Inc Navigation method and system for indicating area-specific traffic information
WO2004063884A2 (en) 2003-01-09 2004-07-29 Evolution Robotics, Inc. Computer and vision-based augmented interaction in the use of printed media
US20040139391A1 (en) * 2003-01-15 2004-07-15 Xerox Corporation Integration of handwritten annotations into an electronic original
US20040143644A1 (en) * 2003-01-21 2004-07-22 Nec Laboratories America, Inc. Meta-search engine architecture
US7360694B2 (en) 2003-01-23 2008-04-22 Mastercard International Incorporated System and method for secure telephone and computer transactions using voice authentication
US7272258B2 (en) 2003-01-29 2007-09-18 Ricoh Co., Ltd. Reformatting documents using document analysis information
US7787655B1 (en) 2003-02-27 2010-08-31 Adobe Systems Incorporated Sub-pixel image registration
US7310769B1 (en) 2003-03-12 2007-12-18 Adobe Systems Incorporated Text encoding using dummy font
US20060206335A1 (en) 2003-03-17 2006-09-14 Eric Thelen Method for remote control of an audio device
GB2399983A (en) 2003-03-24 2004-09-29 Canon Kk Picture storage and retrieval system for telecommunication system
JP4100210B2 (ja) 2003-03-24 2008-06-11 富士ゼロックス株式会社 画像処理装置
US7882113B2 (en) * 2003-03-28 2011-02-01 International Business Machines Corporation Method, apparatus, and system for formatting time data to improve processing in a sort utility
US7206773B2 (en) 2003-04-11 2007-04-17 Ricoh Company, Ltd Techniques for accessing information captured during a presentation using a paper document handout for the presentation
US7236632B2 (en) * 2003-04-11 2007-06-26 Ricoh Company, Ltd. Automated techniques for comparing contents of images
WO2004097759A1 (en) 2003-04-25 2004-11-11 Apple Computer, Inc. Method and system for network-based purchase and distribution of media
US7570791B2 (en) 2003-04-25 2009-08-04 Medtronic Navigation, Inc. Method and apparatus for performing 2D to 3D registration
JP2004348706A (ja) 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
WO2005001628A2 (en) * 2003-06-06 2005-01-06 Neomedia Technologies, Inc. Automatic access of internet content with a camera-enabled cell phone
JP2005010854A (ja) 2003-06-16 2005-01-13 Sony Computer Entertainment Inc 情報提示方法および装置
JP4356371B2 (ja) 2003-06-18 2009-11-04 富士ゼロックス株式会社 情報処理装置
US20040260680A1 (en) 2003-06-19 2004-12-23 International Business Machines Corporation Personalized indexing and searching for information in a distributed data processing system
US20040260625A1 (en) 2003-06-20 2004-12-23 Yoshinori Usami Digital photo print order acceptance method and digital image management method
US7310779B2 (en) 2003-06-26 2007-12-18 International Business Machines Corporation Method for creating and selecting active regions on physical documents
US7274822B2 (en) 2003-06-30 2007-09-25 Microsoft Corporation Face annotation for photo management
US7156311B2 (en) 2003-07-16 2007-01-02 Scanbuy, Inc. System and method for decoding and analyzing barcodes using a mobile device
JP4322169B2 (ja) * 2003-07-16 2009-08-26 株式会社リコー 文書処理システム、文書処理方法、文書処理プログラム
US7446895B2 (en) 2003-07-18 2008-11-04 Sharp Laboratories Of America, Inc. Print content system and method for providing document control
US7620254B2 (en) 2003-08-07 2009-11-17 Trident Microsystems (Far East) Ltd. Apparatus and method for motion-vector-aided interpolation of a pixel of an intermediate image of an image sequence
JP2005070416A (ja) 2003-08-25 2005-03-17 Fujitsu Ten Ltd 楽曲情報の更新システム、楽曲情報の送信装置、楽曲情報の更新機能を有する端末装置、並びに楽曲情報の更新方法、楽曲情報の送信方法、端末装置の楽曲情報更新方法
US7305435B2 (en) 2003-08-25 2007-12-04 Nokia Corporation Internet access via smartphone camera
US7843313B2 (en) * 2003-09-05 2010-11-30 Honeywell International Inc. Distributed stand-off verification and face recognition systems (FRS)
WO2005029353A1 (ja) * 2003-09-18 2005-03-31 Fujitsu Limited 注釈管理システム、注釈管理方法、文書変換サーバ、文書変換プログラム、電子文書付加プログラム
US20050069291A1 (en) 2003-09-25 2005-03-31 Voss James S. Systems and methods for locating a video file
JP2005100274A (ja) 2003-09-26 2005-04-14 Mazda Motor Corp 情報提供システム、情報検索装置及び情報提供方法
US7882139B2 (en) 2003-09-29 2011-02-01 Xunlei Networking Technologies, Ltd Content oriented index and search method and system
JP4345426B2 (ja) 2003-10-07 2009-10-14 ソニー株式会社 画像照合方法、プログラム、および画像照合装置
US8156248B2 (en) 2003-10-09 2012-04-10 International Business Machines Corporation Image distribution for dynamic server pages
US20050080693A1 (en) * 2003-10-14 2005-04-14 Foss Sheldon H. Point-of-sale customer identification system
US7493322B2 (en) 2003-10-15 2009-02-17 Xerox Corporation System and method for computing a measure of similarity between documents
US7379627B2 (en) 2003-10-20 2008-05-27 Microsoft Corporation Integrated solution to digital image similarity searching
US7512286B2 (en) * 2003-10-27 2009-03-31 Hewlett-Packard Development Company, L.P. Assessing image quality
US7519565B2 (en) 2003-11-03 2009-04-14 Cloudmark, Inc. Methods and apparatuses for classifying electronic documents
US7373109B2 (en) 2003-11-04 2008-05-13 Nokia Corporation System and method for registering attendance of entities associated with content creation
US20050108406A1 (en) 2003-11-07 2005-05-19 Dynalab Inc. System and method for dynamically generating a customized menu page
US7912291B2 (en) 2003-11-10 2011-03-22 Ricoh Co., Ltd Features for retrieval and similarity matching of documents from the JPEG 2000-compressed domain
JP2005157931A (ja) 2003-11-28 2005-06-16 Ricoh Co Ltd 画像検索装置、画像検索方法、プログラム及び記憶媒体
US7937340B2 (en) * 2003-12-03 2011-05-03 Microsoft Corporation Automated satisfaction measurement for web search
GB0328326D0 (en) 2003-12-05 2004-01-07 British Telecomm Image processing
US20050160258A1 (en) 2003-12-11 2005-07-21 Bioobservation Systems Limited Detecting objectionable content in displayed images
US7359532B2 (en) 2003-12-11 2008-04-15 Intel Corporation Fingerprint minutiae matching using scoring techniques
US20050185225A1 (en) 2003-12-12 2005-08-25 Brawn Dennis E. Methods and apparatus for imaging documents
US7480334B2 (en) * 2003-12-23 2009-01-20 Genesis Microchip Inc. Temporal motion vector filtering
US7376270B2 (en) 2003-12-29 2008-05-20 Canon Kabushiki Kaisha Detecting human faces and detecting red eyes
US7734729B2 (en) 2003-12-31 2010-06-08 Amazon Technologies, Inc. System and method for obtaining information relating to an item of commerce using a portable imaging device
US7475061B2 (en) 2004-01-15 2009-01-06 Microsoft Corporation Image-based document indexing and retrieval
US7872669B2 (en) 2004-01-22 2011-01-18 Massachusetts Institute Of Technology Photo-based mobile deixis system and related techniques
US8615487B2 (en) 2004-01-23 2013-12-24 Garrison Gomez System and method to store and retrieve identifier associated information content
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US20050169511A1 (en) 2004-01-30 2005-08-04 Cummins-Allison Corp. Document processing system using primary and secondary pictorial image comparison
US7310676B2 (en) 2004-02-09 2007-12-18 Proxpro, Inc. Method and computer system for matching mobile device users for business and social networking
GB2411532B (en) 2004-02-11 2010-04-28 British Broadcasting Corp Position determination
US20060122983A1 (en) * 2004-12-03 2006-06-08 King Martin T Locating electronic instances of documents based on rendered instances, document fragment digest generation, and digest based document fragment determination
US20060053097A1 (en) 2004-04-01 2006-03-09 King Martin T Searching and accessing documents on private networks for use with captures from rendered documents
US20060041605A1 (en) 2004-04-01 2006-02-23 King Martin T Determining actions involving captured information and electronic content associated with rendered documents
US20060104515A1 (en) 2004-07-19 2006-05-18 King Martin T Automatic modification of WEB pages
US7197502B2 (en) 2004-02-18 2007-03-27 Friendly Polynomials, Inc. Machine-implemented activity management system using asynchronously shared activity data objects and journal data items
US7751805B2 (en) 2004-02-20 2010-07-06 Google Inc. Mobile image-based information retrieval system
US8421872B2 (en) 2004-02-20 2013-04-16 Google Inc. Image base inquiry system for search engines for mobile telephones with integrated camera
US7565139B2 (en) * 2004-02-20 2009-07-21 Google Inc. Image-based search engine for mobile phones with camera
US7421387B2 (en) 2004-02-24 2008-09-02 General Motors Corporation Dynamic N-best algorithm to reduce recognition errors
JP4504702B2 (ja) 2004-02-25 2010-07-14 株式会社リコー 文書処理装置、文書処理方法、および文書処理プログラム
US7386789B2 (en) 2004-02-27 2008-06-10 Hewlett-Packard Development Company, L.P. Method for determining logical components of a document
US8788492B2 (en) 2004-03-15 2014-07-22 Yahoo!, Inc. Search system and methods with integration of user annotations from a trust network
JP2005266198A (ja) 2004-03-18 2005-09-29 Pioneer Electronic Corp 音響情報再生装置および音楽データのキーワード作成方法
US7831387B2 (en) 2004-03-23 2010-11-09 Google Inc. Visually-oriented driving directions in digital mapping system
JP4152340B2 (ja) 2004-03-26 2008-09-17 富士フイルム株式会社 画像処理システムおよびその方法
US7725508B2 (en) 2004-03-31 2010-05-25 Google Inc. Methods and systems for information capture and retrieval
US20100013615A1 (en) * 2004-03-31 2010-01-21 Carnegie Mellon University Obstacle detection having enhanced classification
US20080059419A1 (en) 2004-03-31 2008-03-06 David Benjamin Auerbach Systems and methods for providing search results
US20070300142A1 (en) 2005-04-01 2007-12-27 King Martin T Contextual dynamic advertising based upon captured rendered text
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US7707218B2 (en) 2004-04-16 2010-04-27 Mobot, Inc. Mobile query system and method based on visual cues
US20050240381A1 (en) 2004-04-26 2005-10-27 Pjm Interconnection, Llc. Systems and methods for analysis of a commodity transmission network
US7664339B2 (en) 2004-05-03 2010-02-16 Jacek Turski Image processing method for object recognition and dynamic scene understanding
US7499588B2 (en) 2004-05-20 2009-03-03 Microsoft Corporation Low resolution OCR for camera acquired documents
US8423634B2 (en) 2004-05-24 2013-04-16 Neustar, Inc. System and method for determining cost of website performance
JP2005348055A (ja) 2004-06-02 2005-12-15 Toshiba Corp ユーザプロファイル編集装置及びユーザプロファイル編集方法並びにプログラム
US7150399B2 (en) 2004-06-09 2006-12-19 Ricoh Co., Ltd. Embedding barcode data in an auxiliary field of an image file
US20050289182A1 (en) 2004-06-15 2005-12-29 Sand Hill Systems Inc. Document management system with enhanced intelligent document recognition capabilities
US7746376B2 (en) * 2004-06-16 2010-06-29 Felipe Mendoza Method and apparatus for accessing multi-dimensional mapping and information
US7263472B2 (en) 2004-06-28 2007-08-28 Mitsubishi Electric Research Laboratories, Inc. Hidden markov model based object tracking and similarity metrics
US20050289447A1 (en) 2004-06-29 2005-12-29 The Boeing Company Systems and methods for generating and storing referential links in a database
WO2006022977A2 (en) 2004-07-23 2006-03-02 Digimarc Corporation Facial database methods and systems
CN100377171C (zh) 2004-08-13 2008-03-26 富士通株式会社 生成劣化字符图像的方法和装置
CN100373399C (zh) * 2004-08-18 2008-03-05 富士通株式会社 建立劣化字典的方法和装置
US7890871B2 (en) 2004-08-26 2011-02-15 Redlands Technology, Llc System and method for dynamically generating, maintaining, and growing an online social network
US20060043188A1 (en) * 2004-08-27 2006-03-02 Gregg Kricorissian Imaging method and apparatus for object identification
US20060080286A1 (en) 2004-08-31 2006-04-13 Flashpoint Technology, Inc. System and method for storing and accessing images based on position data associated therewith
US20060070120A1 (en) * 2004-09-02 2006-03-30 Brother Kogyo Kabushiki Kaisha File transmitting device and multi function device
US8108386B2 (en) 2004-09-07 2012-01-31 Stuart Robert O More efficient search algorithm (MESA) using alpha omega search strategy
GB0419882D0 (en) 2004-09-08 2004-10-13 Bamford Excavators Ltd Calculation module
US20070118794A1 (en) 2004-09-08 2007-05-24 Josef Hollander Shared annotation system and method
US20060074828A1 (en) * 2004-09-14 2006-04-06 Heumann John M Methods and apparatus for detecting temporal process variation and for managing and predicting performance of automatic classifiers
JP4371965B2 (ja) 2004-09-14 2009-11-25 キヤノン株式会社 画像処理装置、画像処理方法
US8965145B2 (en) 2006-07-31 2015-02-24 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US8176054B2 (en) 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US8989431B1 (en) 2007-07-11 2015-03-24 Ricoh Co., Ltd. Ad hoc paper-based networking with mixed media reality
US9495385B2 (en) 2004-10-01 2016-11-15 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US8856108B2 (en) 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US8332401B2 (en) 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US8385589B2 (en) 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US8276088B2 (en) 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US7551780B2 (en) 2005-08-23 2009-06-23 Ricoh Co., Ltd. System and method for using individualized mixed document
US8600989B2 (en) 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US8838591B2 (en) 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US8369655B2 (en) 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US7812986B2 (en) 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US8335789B2 (en) 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US7669148B2 (en) 2005-08-23 2010-02-23 Ricoh Co., Ltd. System and methods for portable device for mixed media system
US8489583B2 (en) * 2004-10-01 2013-07-16 Ricoh Company, Ltd. Techniques for retrieving documents using an image capture device
US8521737B2 (en) 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8825682B2 (en) 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US7333963B2 (en) 2004-10-07 2008-02-19 Bernard Widrow Cognitive memory and auto-associative neural network based search engine for computer and network located images and photographs
US20060079214A1 (en) 2004-10-12 2006-04-13 Nokia Corporation Method and apparatus for showing wireless mobile device data content on an external viewer
US7138905B2 (en) * 2004-11-18 2006-11-21 Honeywell International Inc. Controlled environment thermal image detection system and methods regarding same
JP4681863B2 (ja) 2004-11-30 2011-05-11 キヤノン株式会社 画像処理装置、および、その制御方法
US20060119880A1 (en) 2004-12-02 2006-06-08 Dandekar Shree A Local photo printing
US7263205B2 (en) 2004-12-06 2007-08-28 Dspv, Ltd. System and method of generic symbol recognition and user authentication using a communication device with imaging capabilities
US7689655B2 (en) 2004-12-06 2010-03-30 Aol Inc. Managing and collaborating with digital content using a dynamic user interface
US20060140475A1 (en) * 2004-12-15 2006-06-29 Chin Frances M Network support for corrupting images captured at a prohibited location
US8230326B2 (en) 2004-12-17 2012-07-24 International Business Machines Corporation Method for associating annotations with document families
US7409362B2 (en) 2004-12-23 2008-08-05 Diamond Review, Inc. Vendor-driven, social-network enabled review system and method with flexible syndication
KR100608596B1 (ko) 2004-12-28 2006-08-03 삼성전자주식회사 얼굴 검출을 기반으로 하는 휴대용 영상 촬영 기기 및영상 촬영 방법
US7698270B2 (en) * 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
US7545985B2 (en) 2005-01-04 2009-06-09 Microsoft Corporation Method and system for learning-based quality assessment of images
JP4455357B2 (ja) 2005-01-28 2010-04-21 キヤノン株式会社 情報処理装置及び情報処理方法
JP2006215756A (ja) 2005-02-02 2006-08-17 Dainippon Ink & Chem Inc 画像処理装置および画像処理方法ならびにそのプログラム
JP2006229465A (ja) 2005-02-16 2006-08-31 Matsushita Electric Ind Co Ltd 監視装置、監視方法、監視用プログラム
JP4428250B2 (ja) 2005-02-17 2010-03-10 セイコーエプソン株式会社 ネットワークに接続された印刷装置の印刷進行状況監視制御
US20060190812A1 (en) 2005-02-22 2006-08-24 Geovector Corporation Imaging systems including hyperlink associations
US7567262B1 (en) 2005-02-25 2009-07-28 IDV Solutions LLC Hybrid graphics for interactive reporting
US7644078B2 (en) * 2005-02-28 2010-01-05 Gm Global Technology Operations, Inc. System and method for mining of temporal data
US20060200480A1 (en) 2005-03-01 2006-09-07 Harris David N System and method for using product identifiers
WO2006092957A1 (ja) 2005-03-01 2006-09-08 Osaka Prefecture University Public Corporation 文書・画像検索方法とそのプログラム、文書・画像登録装置および検索装置
KR100679044B1 (ko) 2005-03-07 2007-02-06 삼성전자주식회사 사용자 적응형 음성 인식 방법 및 장치
US20060218225A1 (en) 2005-03-28 2006-09-28 Hee Voon George H Device for sharing social network information among users over a network
US7546524B1 (en) 2005-03-30 2009-06-09 Amazon Technologies, Inc. Electronic input device, system, and method using human-comprehensible content to automatically correlate an annotation of a paper document with a digital version of the document
US7765231B2 (en) 2005-04-08 2010-07-27 Rathus Spencer A System and method for accessing electronic data via an image search engine
WO2006110873A2 (en) 2005-04-12 2006-10-19 Accoona Corp. Apparatuses, methods and systems to identify, generate, and aggregate qualified sales and marketing leads for distribution via an online competitive bidding system
US7403642B2 (en) 2005-04-21 2008-07-22 Microsoft Corporation Efficient propagation for face annotation
JP2006305176A (ja) 2005-04-28 2006-11-09 Nintendo Co Ltd ゲームプログラムおよびゲーム装置
US7519200B2 (en) 2005-05-09 2009-04-14 Like.Com System and method for enabling the use of captured images through recognition
US7747642B2 (en) 2005-05-09 2010-06-29 Trend Micro Incorporated Matching engine for querying relevant documents
US7809722B2 (en) 2005-05-09 2010-10-05 Like.Com System and method for enabling search and retrieval from image files based on recognized information
US7809192B2 (en) 2005-05-09 2010-10-05 Like.Com System and method for recognizing objects from images and identifying relevancy amongst images and information
US7450760B2 (en) 2005-05-18 2008-11-11 Scanr, Inc. System and method for capturing and processing business data
US20070006129A1 (en) 2005-06-01 2007-01-04 Opasmedia Oy Forming of a data retrieval, searching from a data retrieval system, and a data retrieval system
US7676767B2 (en) 2005-06-15 2010-03-09 Microsoft Corporation Peel back user interface to show hidden functions
WO2006138525A2 (en) 2005-06-16 2006-12-28 Strider Labs System and method for recognition in 2d images using 3d class models
KR100754656B1 (ko) 2005-06-20 2007-09-03 삼성전자주식회사 이미지와 관련한 정보를 사용자에게 제공하는 방법 및시스템과 이를 위한 이동통신단말기
US20060294049A1 (en) 2005-06-27 2006-12-28 Microsoft Corporation Back-off mechanism for search
US7702681B2 (en) 2005-06-29 2010-04-20 Microsoft Corporation Query-by-image search and retrieval system
US7623711B2 (en) * 2005-06-30 2009-11-24 Ricoh Co., Ltd. White space graphs and trees for content-adaptive scaling of document images
WO2007004519A1 (ja) 2005-06-30 2007-01-11 Olympus Corporation 検索システム及び検索方法
US8249344B2 (en) 2005-07-01 2012-08-21 Microsoft Corporation Grammatical parsing of document visual structures
WO2007009180A1 (en) 2005-07-19 2007-01-25 Direct Tv Pty Ltd Presentation content management and creation systems and methods
TW200705299A (en) 2005-07-21 2007-02-01 Yu-Chung Chu Method and system for consumer photograph based advertisement and information distribution
JP2007034847A (ja) * 2005-07-28 2007-02-08 Canon Inc 検索装置及び検索方法
US20070041642A1 (en) 2005-08-18 2007-02-22 Romanoff Harris G Post-ocr image segmentation into spatially separated text zones
GB2445688A (en) 2005-09-01 2008-07-16 Zvi Haim Lev System and method for reliable content access using a cellular/wireless device with imaging capabilities
JP4775700B2 (ja) 2005-09-05 2011-09-21 カシオ計算機株式会社 画像処理装置及び画像処理方法
US20080009268A1 (en) 2005-09-14 2008-01-10 Jorey Ramer Authorized mobile content search results
US7457825B2 (en) 2005-09-21 2008-11-25 Microsoft Corporation Generating search requests from multimodal queries
US8599832B2 (en) 2005-09-28 2013-12-03 Ingenio Llc Methods and apparatuses to connect people for real time communications via voice over internet protocol (VOIP)
US7801893B2 (en) 2005-09-30 2010-09-21 Iac Search & Media, Inc. Similarity detection and clustering of images
GB2430735A (en) 2005-09-30 2007-04-04 Sony Uk Ltd Object detection
US8849821B2 (en) 2005-11-04 2014-09-30 Nokia Corporation Scalable visual search system simplifying access to network and device functionality
JP4753072B2 (ja) 2005-11-14 2011-08-17 独立行政法人産業技術総合研究所 映像内の複数広告看板の認識方法
US7663671B2 (en) * 2005-11-22 2010-02-16 Eastman Kodak Company Location based image classification with map segmentation
US8326037B1 (en) 2005-11-23 2012-12-04 Matrox Electronic Systems, Ltd. Methods and apparatus for locating an object in an image
US8212832B2 (en) 2005-12-08 2012-07-03 Ati Technologies Ulc Method and apparatus with dynamic graphics surface memory allocation
US20100005485A1 (en) 2005-12-19 2010-01-07 Agency For Science, Technology And Research Annotation of video footage and personalised video generation
EP1966761A2 (en) 2005-12-22 2008-09-10 Philips Intellectual Property & Standards GmbH Adaptive point-based elastic image registration
US7761436B2 (en) 2006-01-03 2010-07-20 Yahoo! Inc. Apparatus and method for controlling content access based on shared annotations for annotated users in a folksonomy scheme
US7725451B2 (en) 2006-01-23 2010-05-25 Microsoft Corporation Generating clusters of images for search results
GB2434933B (en) 2006-02-01 2009-06-03 Motorola Inc Apparatus and method for image labelling
US7463270B2 (en) 2006-02-10 2008-12-09 Microsoft Corporation Physical-virtual interpolation
JP2007264992A (ja) 2006-03-28 2007-10-11 Konica Minolta Holdings Inc 文書検索装置、文書検索方法、および文書検索プログラム
US7647331B2 (en) 2006-03-28 2010-01-12 Microsoft Corporation Detecting duplicate images using hash code grouping
US8554690B2 (en) 2006-03-31 2013-10-08 Ricoh Company, Ltd. Techniques for using media keys
JP4864508B2 (ja) * 2006-03-31 2012-02-01 富士通株式会社 情報検索プログラム、情報検索方法および情報検索装置
US7860317B2 (en) 2006-04-04 2010-12-28 Microsoft Corporation Generating search results based on duplicate image detection
US7668405B2 (en) 2006-04-07 2010-02-23 Eastman Kodak Company Forming connections between image collections
US7672508B2 (en) 2006-04-11 2010-03-02 Sony Corporation Image classification based on a mixture of elliptical color models
JP4191241B2 (ja) 2006-04-19 2008-12-03 パナソニック株式会社 視覚処理装置、視覚処理方法、プログラム、表示装置および集積回路
US20070276845A1 (en) 2006-05-12 2007-11-29 Tele Atlas North America, Inc. Locality indexes and method for indexing localities
US20080010273A1 (en) 2006-06-12 2008-01-10 Metacarta, Inc. Systems and methods for hierarchical organization and presentation of geographic search results
US8201076B2 (en) 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US9063952B2 (en) 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US8676810B2 (en) 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
US9020966B2 (en) 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
US7946491B2 (en) * 2006-08-03 2011-05-24 Nokia Corporation Method, apparatus, and computer program product for providing a camera barcode reader
US8838560B2 (en) * 2006-08-25 2014-09-16 Covario, Inc. System and method for measuring the effectiveness of an on-line advertisement campaign
US7774431B2 (en) 2006-09-05 2010-08-10 Gloto Real time collaborative on-line multimedia albums
JP2008064885A (ja) 2006-09-05 2008-03-21 Honda Motor Co Ltd 音声認識装置、音声認識方法、及び音声認識プログラム
US20080071929A1 (en) 2006-09-18 2008-03-20 Yann Emmanuel Motte Methods and apparatus for selection of information and web page generation
US7752534B2 (en) 2006-09-19 2010-07-06 International Business Machines Corporation Method and apparatus for customizing the display of multidimensional data
US7766241B2 (en) * 2006-09-29 2010-08-03 Konica Minolta Systems Laboratory, Inc. Barcode for two-way verification of a document
US9361943B2 (en) 2006-11-07 2016-06-07 The Board Of Trustees Of The Leland Stanford Jr. University System and method for tagging objects in a panoramic video and associating functions and indexing panoramic images with same
US9436779B2 (en) 2006-11-17 2016-09-06 Oracle International Corporation Techniques of efficient XML query using combination of XML table index and path/value index
JP4426563B2 (ja) 2006-12-25 2010-03-03 大日本印刷株式会社 情報提供システム
US7900847B2 (en) 2007-01-18 2011-03-08 Target Brands, Inc. Barcodes with graphical elements
US8347206B2 (en) 2007-03-15 2013-01-01 Microsoft Corporation Interactive image tagging
US20080267504A1 (en) 2007-04-24 2008-10-30 Nokia Corporation Method, device and computer program product for integrating code-based and optical character recognition technologies into a mobile visual search
WO2008141429A1 (en) 2007-05-17 2008-11-27 Fat Free Mobile Inc. Method and system for generating an aggregate website search database using smart indexes for searching
US7882177B2 (en) 2007-08-06 2011-02-01 Yahoo! Inc. Employing pixel density to detect a spam image
US20090059922A1 (en) 2007-08-30 2009-03-05 Barry Appelman Systems and Methods for Multicast Communication
US8788589B2 (en) 2007-10-12 2014-07-22 Watchitoo, Inc. System and method for coordinating simultaneous edits of shared digital data
US8540158B2 (en) 2007-12-12 2013-09-24 Yiwu Lei Document verification using dynamic document identification framework
US7801845B1 (en) 2007-12-21 2010-09-21 Amazon Technologies, Inc. Creating forums associated with a search string
US10402833B2 (en) 2008-03-05 2019-09-03 Ebay Inc. Method and apparatus for social network qualification systems
US8321406B2 (en) 2008-03-31 2012-11-27 Google Inc. Media object query submission and response
US8107740B2 (en) 2008-08-15 2012-01-31 Honeywell International Inc. Apparatus and method for efficient indexing and querying of images in security systems and other systems
US8520979B2 (en) 2008-08-19 2013-08-27 Digimarc Corporation Methods and systems for content processing
WO2010028169A2 (en) 2008-09-05 2010-03-11 Fotonauts, Inc. Reverse tagging of images in system for managing and sharing digital images
US8255394B2 (en) 2009-06-01 2012-08-28 International Business Machines Corporation Apparatus, system, and method for efficient content indexing of streaming XML document content
US8385660B2 (en) 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
US8271529B2 (en) 2009-08-10 2012-09-18 Yuheng Qiu Location-based and time control-based interactive information group and distribution platform
US8229929B2 (en) 2010-01-06 2012-07-24 International Business Machines Corporation Cross-domain clusterability evaluation for cross-guided data clustering based on alignment between data domains
US8949252B2 (en) 2010-03-29 2015-02-03 Ebay Inc. Product category optimization for image similarity searching of image-based listings in a network-based publication system
US8386336B1 (en) 2011-03-30 2013-02-26 Amazon Technologies, Inc. Customized solicitations of product suggestions and product recommendations
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09134372A (ja) * 1995-09-05 1997-05-20 Ricoh Co Ltd 文書検索方法及び装置
WO2007023994A1 (en) * 2005-08-23 2007-03-01 Ricoh Company, Ltd. System and methods for creation and use of a mixed media environment
JP2007174270A (ja) * 2005-12-22 2007-07-05 Canon Inc 画像処理装置、画像処理方法、記憶媒体、プログラム

Also Published As

Publication number Publication date
EP2015225A1 (en) 2009-01-14
US9373029B2 (en) 2016-06-21
JP5095535B2 (ja) 2012-12-12
EP2015225B1 (en) 2012-10-10
US20090016615A1 (en) 2009-01-15

Similar Documents

Publication Publication Date Title
JP5095535B2 (ja) 画像処理方法、画像処理システム、画像処理装置及びプログラム
JP5181888B2 (ja) グラフィカルユーザインターフェースを生成する方法及びシステム
JP5181887B2 (ja) 電子書類を照合するシステム及び照合方法
JP5181886B2 (ja) 電子書類の検索方法、検索システム及びコンピュータプログラム
JP5095534B2 (ja) ジャンクションを生成するシステム及び方法
US7639387B2 (en) Authoring tools using a mixed media environment
US7917554B2 (en) Visibly-perceptible hot spots in documents
US9405751B2 (en) Database for mixed media document system
US8949287B2 (en) Embedding hot spots in imaged documents
US7702673B2 (en) System and methods for creation and use of a mixed media environment
US9171202B2 (en) Data organization and access for mixed media document system
US8521737B2 (en) Method and system for multi-tier image matching in a mixed media environment
US7669148B2 (en) System and methods for portable device for mixed media system
US7812986B2 (en) System and methods for use of voice mail and email in a mixed media environment
US7885955B2 (en) Shared document annotation
CN101297318B (zh) 用于混合介质文档系统的数据组织和访问
EP1917636B1 (en) Method and system for image matching in a mixed media environment
US20060285172A1 (en) Method And System For Document Fingerprint Matching In A Mixed Media Environment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120821

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120919

R150 Certificate of patent or registration of utility model

Ref document number: 5095535

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150928

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees