JP5050075B2 - 画像判別方法 - Google Patents
画像判別方法 Download PDFInfo
- Publication number
- JP5050075B2 JP5050075B2 JP2010091143A JP2010091143A JP5050075B2 JP 5050075 B2 JP5050075 B2 JP 5050075B2 JP 2010091143 A JP2010091143 A JP 2010091143A JP 2010091143 A JP2010091143 A JP 2010091143A JP 5050075 B2 JP5050075 B2 JP 5050075B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- images
- matching
- group
- input image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/97—Determining parameters from multiple pictures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Discrimination (AREA)
Description
(課題を解決するための手段)
1つ以上の捕捉装置から取得された1つ以上の画像を含む候補画像群が、捕捉装置から取得された入力画像における関心領域が含んでいるプレゼンテーション情報に合致する画像を含んでいるか否かを判別するためにデータ処理システムが実行する画像判別方法であって、
前記候補画像群に属する1つ以上の画像を、画像を取得した捕捉装置の種別毎の集合に分類するステップと、
前記入力画像の種別と前記候補画像群の種別と複数の画像比較方法との間の所定の対応関係を利用して、前記1つ以上の捕捉装置から取得された前記候補画像群及び前記入力画像に対応する複数の画像比較方法を特定するステップと、
特定された前記複数の画像比較方法各々の信頼性スコアを算出し、最高の信頼性スコアを有する画像比較方法を用いて、前記取得された候補画像群が前記プレゼンテーション情報に合致する画像を含んでいるか否かを判別するステップと
を有し、前記複数の画像比較方法は、
画像中のエッジ分布に基づくエッジヒストグラムを利用して画像を照合する技法、
画素の色彩及び輝度の分布により表現された画像レイアウトを利用して画像を照合する技法、
光学文字認識により抽出されたテキストを利用して画像を照合する技法、及び
画像中の文字列の分布及び長さにより表現されたライン属性を利用して画像を照合する方法
を少なくとも含む群から選択された技法である、画像判別方法である。
表B
SCIは、候補画像の集合を表し、
Sは、分割画像を表し、
NSは、非分割画像を表し、
Oは、OCR可能を表し、
NOは、OCR不可能を表し、
EHは、エッジヒストグラム照合技術を表し、
LMは、レイアウト照合技術を表し、
OCRSは、OCR文字列照合技術を表し、
LPは、ライン属性照合技術を表す。
このセクションは、本発明の実施例により、入力画像に対して合致する画像を識別するために実行される処理の簡単な例を説明する。これらの例は本発明の実施例による単なる例示に過ぎず、特許請求の範囲に記載されるような本発明の範囲を制限することを意味するものではない。
この例では、入力画像はプレゼンテーションレコーダから取得され、候補画像群は記号情報捕捉装置から取得される(或いは、候補画像群はプレゼンテーションレコーダから取得され、入力画像が記号情報捕捉装置から得られるようにすることも可能である。)概して、プレゼンテーションレコーダ及び記号情報捕捉装置から取得される画像は、(表Aに示されるように)区分された画像である。更に、画像はOCR可能であってその処理はリアルタイムで実行されるべきものであるとする。これらの条件から、エッジヒストグラム照合技術(EH)及びレイアウト照合技術(LM)が表Bから選択される。更に、レイアウト照合技術(LM)に先立ってエッジヒストグラム照合技術(EH)が適用されるように発見法が規定されているものとする。照合プロセスに関する擬似コードは以下のように与えられる。
この例では、入力画像はスキャナから得られ、候補画像群はプレゼンテーションレコーダ又は記号情報捕捉装置から取得される(或いは、候補画像群がスキャナから取得され、入力画像が記号情報捕捉装置又はプレゼンテーションレコーダから取得されるようにすることも可能である。)。概して、スキャナから得られる画像は非区分的である。それにもかかわらず、そのような画像から関心のある領域を区分けすることは、区分法を適用する事後処理により容易に行なわれることが可能である。これらの画像は一般にOCR可能である。更に、処理はリアルタイムで実行されるべきであることを想定する。これらの条件の下に、OCR文字列照合技術(OCRS)及びエッジヒストグラム照合技術(EH)が選択される。更に、OCR文字列照合技術(OCRS)が、エッジヒストグラム照合技術(EH)を適用する前に適用されるように発見法が規定されていることを想定する。その理由は、画像は捕捉時に区分化されないので、区分化後処理がエラーになり、エッジヒストグラム照合技術(EH)が正確な結果として生成されない虞があるからである。OCR文字列照合技術(OCRS)が最初に実行され、OCR文字列照合技術(OCRS)が合致する画像を発見するのに失敗した場合にのみエッジヒストグラム照合技術(EH)が適用される。エッジヒストグラム照合技術(EH)を適用するために、画像は区分けされる必要がある。照合プロセスのための擬似コードは以下のように与えられる。
この例では、入力画像はビデオレコーダ又はディジタルカメラを用いて取得され、候補画像群はビデオレコーダ、ディジタルカメラ、プレゼンテーションレコーダ又は記号情報捕捉装置から取得される(或いは、候補画像群がビデオレコーダ又はディジタルカメラを用いて取得され、入力画像がビデオレコーダ、ディジタルカメラ、プレゼンテーションレコーダ又は記号情報捕捉装置から取得されるようにすることも可能である。)。画像はOCR可能であるものとする。ビデオレコーダ又はディジタルカメラから取得された画像は一般的には非区分的画像であり、スキュー、不鮮明な動き等の属性を有し、それらの属性は、エッジヒストグラム照合技術(EH)及びレイアウト照合技術(LM)の正確な利用を困難にする虞がある。従って、OCR文字列照合技術(OCRS)及びライン属性照合技術(LP)が使用される。場合によっては、OCR文字列照合技術(OCRS)も充分な結果を与えないかもしれない。例えば、文字列長(Iinput)<Th4(ここで、Th4は何らかのユーザの定義した閾値であり、文字列長は画像から抽出される文字数である)ならば、ライン属性照合技術(LP)が使用される。Th4の閾値は、どの照合技術を使用するかを決定する発見法の一部として規定される。或いは、Th4の閾値は、適合性閾値の一部として規定されることも可能である。照合プロセスの擬似コードは以下のように与えられる。
このセクションは、本発明に使用されるいくつかの画像照合技術の概説を与える。
ヒストグラムは画像の特徴を表現するために当該技術分野で一般的に使用され、画像中の端部又はエッジ(edge)はその画像の内容を表現するのに重要な特徴を構成する。エッジヒストグラム特徴ベクトルは、局所的な(ローカルな)、全域的な(グローバルな)、及び/又は準グローバルなエッジ内容及び/又は画像中のエッジ分布を表現する。エッジは、対角的、垂直的及び水平的なものを含む多数の種類のものとすることが可能である。2つの画像の間のエッジヒストグラム距離は、それらの対応するエッジヒストグラム特徴ベクトル同士の間の距離を見出すことで算出される。これらの距離は、差分絶対値の和又は二乗差分の和を利用することを含む様々な手法で発見されることが可能である。入力画像のIinputと候補画像の集合{S}中の画像各々との間の距離は、エッジヒストグラム差分に基づいて算出されることが可能である。Iinputに対して最小の距離を有する{S}中の画像は、合致する画像Imatchであると宣言される。Iinputに対するImatchの距離は、MinDistance(最小距離)と呼ばれる。適合信頼性スコアCmも算出される(そのような算出例は以下に説明される。)。また、メタデータもエッジヒストグラム照合技術により出力される。例えば、メタデータは入力画像中の「エッジ数」を含み得る。
画像のレイアウトは、画素の色彩及び強度が画像中でどのように分布しているかを大凡表現する。一般に、画像の各色彩チャネルは、画像のレイアウトを算出するために平均化フィルタにより空間的にダウンサンプルされる。画像がグレイスケール又は白黒であるならば、輝度チャネルのみが考察される。2つの画像レイアウト間の相違は、各色彩チャネルの対応する各レイアウト位置の間の差分の絶対値を加算することによって見出される。入力画像Iinput及び候補画像群{S}中の画像の間の差分は、これらのレイアウト差分に基づいて算出されることが可能である。Iinputに対して最小距離を有する{S}中の画像は、合致する画像Imatchであるとして宣言される。Iinputに対するImatchの差分は最小距離MinDistanceと呼ばれる。また、適合性信頼性スコアCmも算出される(そのような計算例は上記に説明されている。)。また、メタデータもレイアウト照合技術によって出力されることが可能である。
2つの画像の類似性はそれらのテキスト内容に基づいて算出されることが可能である。ある画像のテキスト内容は、光文字認識(OCR)を用いることによって取得されることが可能である。OCRは文献にて周知であり、画像にOCRを実行する商用パッケージが存在する。スライド画像(即ち、スライドプレゼンテーション情報を含む画像)が既知のソースから取得されるならば、例えばパワーポイントファイル又はHTMLページから取得されるならば、そのパワーポイントファイルやHTMLページの構文(シンタックス)をデコードすることによって、そのファイルを形成するテキストを抽出することが可能である。テキストが抽出されると、入力画像Iinput及び候補画像群{S}中の画像の間の距離が、その抽出されたテキスト間の編集距離(edit distance)に基づいて算出されることが可能である。Iinputに対して最小の距離を有する{S}中の画像は、合致する画像Imatchであると宣言される。Iinputに対するImatchの差分はMinDistanceと呼ばれる。また、適合性信頼性スコアCmも上述したように算出されることが可能である。また、OCR文字列照合技術によってメタデータも出力されることが可能である。例えば、そのメタデータは、その画像から抽出されたキャラクタ数(文字列長)を含むことが可能である。
カラー画像中のテキストを分割し且つ2進化するための様々なグローバルな及びローカルな閾値法は、(1)O.D.Trier and A.Jain,“Goal−Directed Evaluation of Binarization Methods”,IEEE Transactions on Pattern Analysis and Machine Intelligence,pp.1191−1201,1995(2)N.Otsu,“A threshold selection method from graylevel histograms”,IEEE Transactions on Systems,Man and Cybernetics,pp.62−66,1979及び(3)R.Lienhart and A.Wernicke,“Localizing and Segemeting Text in Images,Videos and Webpages”,IEEE Transactions on CSVT,pp.256−268,2002等に説明されており、これらの内容は本願の参考に供される。
画像が2進化された後に、歪又はスキューが修正され、OCRが実行され、2つのスライド画像間の類似性スコアを見出すために、テキスト出力を用いて文字列照合が実行される。異なる装置から捕捉されたスライド画像からのOCR結果は、異なる精度になり得る。例えば、ディジタルカメラから抽出されたテキスト出力は、一般に、OCRしたスクリーン投影出力から得られたものよりも低い精度である。スライド照合が有益であると予測される多くのアプリケーションでは、ある捕捉ソースが他のものよりも多くの信頼性を有し、あるソースから得られたOCR結果はグランドトルス(ground truth)に近接する傾向にある。これは文字列照合を行なう際に考慮され、より信頼性のあるソースから得られた文字列はグランドトルス文字列として分類される。各スライドについて取得されたキャラクタは先ず連結される。そして、2つの文字列間の類似性スコアが次のようにして算出される。
ライン属性は、画像中の文字列の量、分布及び長さを表現する。入力画像Iinput及び候補画像群{S}中の各画像の間の距離は、2つのライン属性間で算出される距離に基づいて算出されることが可能である。Iinputに対する最小の距離を有する{S}中の画像は、合致する画像Imatchであるとして宣言される。Iinputに対するImatchの距離はMinDistanceと呼ばれる。適合性信頼性スコアCmも上述したように算出される。また、ライン属性照合技術によってメタデータも出力される。例えば、メタデータは、画像中の最長の行の長さを含む。
(第1項)
入力画像の関心のある領域に含まれるプレゼンテーション情報に合致する内容を含む画像を第1の画像群が含んでいるか否かを判別する、コンピュータで実行される方法であって:
前記入力画像及び前記第1の画像群中の画像が第1の特徴を有するか否かを判別するステップ;
前記入力画像及び前記第1の画像群中の画像が第2の特徴を有するか否かを判別するステップ;
前記入力画像及び前記第1の画像群中の画像が前記第1の特徴及び前記第2の特徴を有するか否かに基づいて、複数の比較法の中から第1群の比較法を識別するステップ;
前記第1群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記第1の画像群中の画像の内容を比較するステップ;及び
比較結果に基づいて、前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有する画像を前記第1の画像群が含むか否かを判別するステップ;
より成ることを特徴とする方法。
前記関心のある領域が、前記入力画像の一部に相当する
ことを特徴とする第1項記載の方法。
前記入力画像及び前記第1の画像群中の画像が第1の特徴を有するか否かを判別するステップが、前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するステップより成り;及び
前記入力画像及び前記第1の画像群中の画像が第2の特徴を有するか否かを判別するステップが、前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されているか否かを判別するステップより成る;
ことを特徴とする第1項記載の方法。
前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するステップが、前記入力画像及び候補画像群中の画像がセグメント化されるか否かを示す情報を受信するステップより成る
ことを特徴とする第3項記載の方法。
前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するステップが:
前記入力画像及び前記第1の画像群中の画像を捕捉するために使用される1以上の捕捉装置を識別するステップ;及び
前記1以上の捕捉装置に基づいて、前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するステップ;
より成ることを特徴とする第3項記載の方法。
更に:
複数の捕捉装置を識別する情報を格納するステップ;及び
前記複数の捕捉装置内の捕捉装置の各々について、捕捉装置によって捕捉された画像がセグメント化されるか否かを示す情報を格納するステップ;
より成ることを特徴とする第5項記載の方法。
前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するステップが:
前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するために、前記入力画像及び前記第1の画像群中の画像を処理するステップより成る
ことを特徴とする第3項記載の方法。
前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されているか否かを判別するステップが、前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されるか否かを示す情報を受信するステップより成る
ことを特徴とする第3項記載の方法。
前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されているか否かを判別するステップが:
前記入力画像及び前記第1の画像群中の画像を捕捉するために使用される1以上の捕捉装置を識別するステップ;及び
前記1以上の捕捉装置に基づいて、前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されているか否かを判別するステップ;
より成ることを特徴とする第3項記載の方法。
前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されているか否かを判別するステップが、認識されることの可能なテキストから構成されているか否かを判別するために、前記入力画像及び前記第1の画像群中の画像を処理するステップより成る
ことを特徴とする第3項記載の方法。
更に:
前記入力画像及び前記第1の画像群中の画像が前記第1の特徴及び前記第2の特徴を有するか否かに基づいて選択されるように、複数の比較法の中から1以上の比較法を識別する第1情報を格納するステップより成る
ことを特徴とする第3項記載の方法。
複数の比較法の中から第1群の比較法を識別するステップが:
前記複数の比較法の中の比較法が、前記第1群の比較法に含まれるか否かを判別するために前記第1情報を使用するステップより成る
ことを特徴とする第11項記載の方法。
更に:
時間的制約を示す情報を受信するステップ;及び
前記第1群の比較法の中から前記時間的制約を満たす第2群の比較法を識別するステップ;
より成り、前記第1群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記第1の画像群中の画像の内容を比較するステップが、前記第2群の比較法に含まれる比較法を利用するステップより成る
ことを特徴とする第3項記載の方法。
前記第1群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記第1の画像群中の画像の内容を比較するステップが:
前記第1群の比較法内の比較法が適用される順序を決定するステップ;及び
前記第1群の比較法の中から1以上の比較法を、決定した順序で適用するステップ;
より成ることを特徴とする第3項記載の方法。
前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有する画像を前記第1の画像群が含むか否かを判別するステップが:
前記第1群の比較法内の前記1以上の比較法中の比較法の各々について、比較法の信頼性スコアと、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含むものとして、前記第1の画像群から前記比較法によって識別された合致する画像とを受信するステップ;
前記1以上の比較法に関する前記信頼性スコアに基づいて、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として、前記1以上の比較法によって識別された複数の合致する画像から、ある画像を識別するステップ;
より成ることを特徴とする第3項記載の方法。
前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として識別された複数の合致する画像中の画像が、最高の信頼性スコアを有する比較法によって識別された合致する画像である
ことを特徴とする第15項記載の方法。
前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有する画像を前記第1の画像群が含むか否かを判別するステップが:
前記第1群の比較法における前記1以上の比較法の中の比較法の各々について、
比較法に関する信頼性スコアと、
前記第1の画像群の中から、前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有するものとして、比較法によって識別された合致する画像と、
前記第1の画像群中の画像の各々に関する距離値であって、前記入力画像の関心のある領域に含まれるプレゼンテーション情報及び前記第1の画像群中の画像の内容の間の適合性の接近度の測定値を示すところの距離値と、
を受信するステップ;及び
1以上の比較法に関する前記信頼性スコア及び前記距離値に基づいて、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として、前記1以上の比較法によって識別された複数の合致する画像から、ある画像を識別するステップ;
より成ることを特徴とする第3項記載の方法。
入力画像の関心のある領域に含まれるプレゼンテーション情報に合致する内容を含む画像を複数の画像が含んでいるか否かを判別する、コンピュータで実行される方法であって、前記複数の画像は1以上の種類の捕捉装置によって捕捉された画像を含み、当該方法は:
前記複数の画像中の画像の各々について、画像を捕捉するのに使用された捕捉装置の種類を判別するステップ;
1種類の捕捉装置によって捕捉された画像の全てが1つの集合に分類されるように、画像を捕捉するのに使用された捕捉装置の種別に基づいて、前記複数の画像中の画像を複数の集合に分類するステップ;
前記複数の集合中の集合の各々について、
前記入力画像及び前記集合中の画像が第1の特徴を有するか否かを判別し、
前記入力画像及び前記集合中の画像が第2の特徴を有するか否かを判別し、
前記入力画像及び前記集合中の画像が前記第1の特徴及び前記第2の特徴を有するか否かに基づいて、複数の比較法の中から一群の比較法を識別し、
前記一群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記集合中の画像の内容を比較し、
前記1以上の比較法中の比較法の各々について、比較法の信頼性スコアと、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含むものとして、前記画像群から前記比較法によって識別された合致する画像とを受信し、
前記1以上の比較法に関する信頼性スコアに基づいて、集合に関する集合信頼性スコアを判別し、及び
前記1以上の比較法によって識別された複数の合致する画像から、最高の信頼性スコアを有する比較法によって、前記集合に関する合致する画像として識別される合致する画像を判別するステップ;並びに
複数の集合に関する前記集合信頼性スコアに基づいて、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像を、複数の画像が含むか否かを判別するステップ;
より成ることを特徴とする方法。
前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像を、複数の画像が含むか否かを判別するステップが:
最高の集合信頼性スコアを有する集合の合致する画像を、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として識別するステップより成る
ことを特徴とする第18項記載の方法。
前記入力画像及び前記集合中の画像が第1の特徴を有するか否かを判別することが、前記入力画像及び前記集合中の画像がセグメントされるか否かを判別することより成り;
前記入力画像及び前記集合中の画像が第2の特徴を有するか否かを判別することが、前記入力画像及び前記集合中の画像が、認識されることの可能なテキストを有するか否かを判別することより成る;
ことを特徴とする第18項記載の方法。
入力画像の関心のある領域に含まれるプレゼンテーション情報に合致する内容を含む画像を第1の画像群が含んでいるか否かを判別するデータ処理システムであって:
プロセッサ;
前記プロセッサに接続されたメモリ;
より成り、前記メモリは前記プロセッサにより実行するための複数のコードモジュールを格納するよう構成され、前記複数のコードモジュールは:
前記入力画像及び前記第1の画像群中の画像が第1の特徴を有するか否かを判別するコードモジュール;
前記入力画像及び前記第1の画像群中の画像が第2の特徴を有するか否かを判別するコードモジュール;
前記入力画像及び前記第1の画像群中の画像が前記第1の特徴及び前記第2の特徴を有するか否かに基づいて、複数の比較法の中から第1群の比較法を識別するコードモジュール;
前記第1群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記第1の画像群中の画像の内容を比較するコードモジュール;及び
比較結果に基づいて、前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有する画像を前記第1の画像群が含むか否かを判別するコードモジュール;
より成ることを特徴とするデータ処理システム。
前記関心のある領域が、前記入力画像の一部に相当する
ことを特徴とする第21項記載のシステム。
前記入力画像及び前記第1の画像群中の画像が第1の特徴を有するか否かを判別するコードモジュールが、前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するコードモジュールより成り;及び
前記入力画像及び前記第1の画像群中の画像が第2の特徴を有するか否かを判別するコードモジュールが、前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されているか否かを判別するコードモジュールより成る;
ことを特徴とする第21項記載のシステム。
前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するコードモジュールが、前記入力画像及び候補画像群中の画像がセグメント化されるか否かを示す情報を受信するコードモジュールより成る
ことを特徴とする第23項記載のシステム。
前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するコードモジュールが:
前記入力画像及び前記第1の画像群中の画像を捕捉するために使用される1以上の捕捉装置を識別するコードモジュール;及び
前記1以上の捕捉装置に基づいて、前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するコードモジュール;
より成ることを特徴とする第23項記載のシステム。
前記メモリが、複数の捕捉装置を識別する情報を格納し、且つ前記複数の捕捉装置内の捕捉装置の各々について、捕捉装置によって捕捉された画像がセグメント化されるか否かを示す情報を格納するよう構成される
ことを特徴とする第25項記載のシステム。
前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するコードモジュールが:
前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するために、前記入力画像及び前記第1の画像群中の画像を処理するコードモジュールより成る
ことを特徴とする第23項記載のシステム。
前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されているか否かを判別するコードモジュールが、前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されるか否かを示す情報を受信するコードモジュールより成る
ことを特徴とする第23項記載のシステム。
前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されているか否かを判別するコードモジュールが:
前記入力画像及び前記第1の画像群中の画像を捕捉するために使用される1以上の捕捉装置を識別するコードモジュール;及び
前記1以上の捕捉装置に基づいて、前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されているか否かを判別するコードモジュール;
より成ることを特徴とする第23項記載のシステム。
前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されているか否かを判別するコードモジュールが、認識されることの可能なテキストから構成されているか否かを判別するために、前記入力画像及び前記第1の画像群中の画像を処理するコードモジュールより成る
ことを特徴とする第23項記載のシステム。
前記入力画像及び前記第1の画像群中の画像が前記第1の特徴及び前記第2の特徴を有するか否かに基づいて選択されるように、複数の比較法の中から1以上の比較法を識別する第1情報を格納するように前記メモリが構成される
ことを特徴とする第23項記載のシステム。
複数の比較法の中から第1群の比較法を識別するコードモジュールが:
前記複数の比較法の中の比較法が、前記第1群の比較法に含まれるか否かを判別するために前記第1情報を使用するコードモジュールより成る
ことを特徴とする第31項記載のシステム。
複数のコードモジュールが、更に:
時間的制約を示す情報を受信するコードモジュール;及び
前記第1群の比較法の中から前記時間的制約を満たす第2群の比較法を識別するコードモジュール;
より成り、前記第1群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記第1の画像群中の画像の内容を比較するコードモジュールが、前記第2群の比較法に含まれる比較法を利用するコードモジュールより成る
ことを特徴とする第23項記載のシステム。
前記第1群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記第1の画像群中の画像の内容を比較するコードモジュールが:
前記第1群の比較法内の比較法が適用される順序を決定するコードモジュール;及び
前記第1群の比較法の中から1以上の比較法を、決定した順序で適用するコードモジュール;
より成ることを特徴とする第23項記載のシステム。
前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有する画像を前記第1の画像群が含むか否かを判別するコードモジュールが:
前記第1群の比較法内の前記1以上の比較法中の比較法の各々について、比較法の信頼性スコアと、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含むものとして、前記第1の画像群から前記比較法によって識別された合致する画像とを受信するコードモジュール;
前記1以上の比較法に関する前記信頼性スコアに基づいて、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として、前記1以上の比較法によって識別された複数の合致する画像から、ある画像を識別するコードモジュール;
より成ることを特徴とする第23項記載のシステム。
前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として識別された複数の合致する画像中の画像が、最高の信頼性スコアを有する比較法によって識別された合致する画像である
ことを特徴とする第35項記載のシステム。
前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有する画像を前記第1の画像群が含むか否かを判別するコードモジュールが:
前記第1群の比較法における前記1以上の比較法の中の比較法の各々について、
比較法に関する信頼性スコアと、
前記第1の画像群の中から、前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有するものとして、比較法によって識別された合致する画像と、
前記第1の画像群中の画像の各々に関する距離値であって、前記入力画像の関心のある領域に含まれるプレゼンテーション情報及び前記第1の画像群中の画像の内容の間の適合性の接近度の測定値を示すところの距離値と、
を受信するコードモジュール;及び
1以上の比較法に関する前記信頼性スコア及び前記距離値に基づいて、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として、前記1以上の比較法によって識別された複数の合致する画像から、ある画像を識別するコードモジュール;
より成ることを特徴とする第23項記載のシステム。
入力画像の関心のある領域に含まれるプレゼンテーション情報に合致する内容を含む画像を複数の画像が含んでいるか否かを判別するコンピュータシステムであって、前記複数の画像は1以上の種類の捕捉装置によって捕捉された画像を含み、当該コンピュータシステムは:
プロセッサ;及び
前記プロセッサに接続されたメモリ;
より成り、前記メモリは前記プロセッサによって実行するための複数のコードモジュールを格納するよう構成され、前記複数のコードモジュールは:
前記複数の画像中の画像の各々について、画像を捕捉するのに使用された捕捉装置の種類を判別するコードモジュール;
1種類の捕捉装置によって捕捉された画像の全てが1つの集合に分類されるように、画像を捕捉するのに使用された捕捉装置の種別に基づいて、前記複数の画像中の画像を複数の集合に分類するコードモジュール;
前記複数の集合中の集合の各々について、
前記入力画像及び前記集合中の画像が第1の特徴を有するか否かを判別し、
前記入力画像及び前記集合中の画像が第2の特徴を有するか否かを判別し、
前記入力画像及び前記集合中の画像が前記第1の特徴及び前記第2の特徴を有するか否かに基づいて、複数の比較法の中から一群の比較法を識別し、
前記一群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記集合中の画像の内容を比較し、
前記1以上の比較法中の比較法の各々について、比較法の信頼性スコアと、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含むものとして、前記画像群から前記比較法によって識別された合致する画像とを受信し、
前記1以上の比較法に関する信頼性スコアに基づいて、集合に関する集合信頼性スコアを判別し、
前記1以上の比較法によって識別された複数の合致する画像から、最高の信頼性スコアを有する比較法によって、前記集合に関する合致する画像として識別される合致する画像を判別するコードモジュール;並びに
複数の集合に関する前記集合信頼性スコアに基づいて、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像を、複数の画像が含むか否かを判別するコードモジュール;
より成ることを特徴とするコンピュータシステム。
前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像を、複数の画像が含むか否かを判別するコードモジュールが:
最高の集合信頼性スコアを有する集合の合致する画像を、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として識別するコードモジュールより成る
ことを特徴とする第38項記載のシステム。
前記入力画像及び前記集合中の画像が第1の特徴を有するか否かを判別することが、前記入力画像及び前記集合中の画像がセグメントされるか否かを判別することより成り;
前記入力画像及び前記集合中の画像が第2の特徴を有するか否かを判別することが、前記入力画像及び前記集合中の画像が、認識されることの可能なテキストを有するか否かを判別することより成る;
ことを特徴とする第38項記載のシステム。
入力画像の関心のある領域に含まれるプレゼンテーション情報に合致する内容を含む画像を第1の画像群が含んでいるか否かを判別する、コンピュータ読み取り可能な媒体に格納されるコンピュータプログラムプロダクトであって:
前記入力画像及び前記第1の画像群中の画像が第1の特徴を有するか否かを判別するコード;
前記入力画像及び前記第1の画像群中の画像が第2の特徴を有するか否かを判別するコード;
前記入力画像及び前記第1の画像群中の画像が前記第1の特徴及び前記第2の特徴を有するか否かに基づいて、複数の比較法の中から第1群の比較法を識別するコード;
前記第1群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記第1の画像群中の画像の内容を比較するコード;及び
比較結果に基づいて、前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有する画像を前記第1の画像群が含むか否かを判別するコード;
より成ることを特徴とするコンピュータプログラムプロダクト。
前記関心のある領域が、前記入力画像の一部に相当する
ことを特徴とする第41項記載のコンピュータプログラムプロダクト。
前記入力画像及び前記第1の画像群中の画像が第1の特徴を有するか否かを判別するコードが、前記入力画像及び前記第1の画像群中の画像がセグメント化されるか否かを判別するコードより成り;及び
前記入力画像及び前記第1の画像群中の画像が第2の特徴を有するか否かを判別するコードが、前記入力画像及び前記第1の画像群中の画像が、認識されることの可能なテキストから構成されているか否かを判別するコードより成る;
ことを特徴とする第41項記載のコンピュータプログラムプロダクト。
更に:
前記入力画像及び前記第1の画像群中の画像が前記第1の特徴及び前記第2の特徴を有するか否かに基づいて選択されるように、複数の比較法の中から1以上の比較法を識別する第1情報を格納するコードより成る
ことを特徴とする第43項記載のコンピュータプログラムプロダクト。
複数の比較法の中から第1群の比較法を識別するコードが:
前記複数の比較法の中の比較法が、前記第1群の比較法に含まれるか否かを判別するために前記第1情報を使用するコードより成る
ことを特徴とする第44項記載のコンピュータプログラムプロダクト。
更に:
時間的制約を示す情報を受信するコード;及び
前記第1群の比較法の中から前記時間的制約を満たす第2群の比較法を識別するコード;
より成り、前記第1群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記第1の画像群中の画像の内容を比較するコードが、前記第2群の比較法に含まれる比較法を利用するコードより成る
ことを特徴とする第43項記載のコンピュータプログラムプロダクト。
前記第1群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記第1の画像群中の画像の内容を比較するコードが:
前記第1群の比較法内の比較法が適用される順序を決定するコード;及び
前記第1群の比較法の中から1以上の比較法を、決定した順序で適用するコード;
より成ることを特徴とする第43項記載のコンピュータプログラムプロダクト。
前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有する画像を前記第1の画像群が含むか否かを判別するコードが:
前記第1群の比較法内の前記1以上の比較法中の比較法の各々について、比較法の信頼性スコアと、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含むものとして、前記第1の画像群から前記比較法によって識別された合致する画像とを受信するコード;
前記1以上の比較法に関する前記信頼性スコアに基づいて、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として、前記1以上の比較法によって識別された複数の合致する画像から、ある画像を識別するコード;
より成ることを特徴とする第43項記載のコンピュータプログラムプロダクト。
前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として識別された複数の合致する画像中の画像が、最高の信頼性スコアを有する比較法によって識別された合致する画像である
ことを特徴とする第48項記載のコンピュータプログラムプロダクト。
前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有する画像を前記第1の画像群が含むか否かを判別するコードが:
前記第1群の比較法における前記1以上の比較法の中の比較法の各々について、
比較法に関する信頼性スコアと、
前記第1の画像群の中から、前記入力画像の関心のある領域内で前記プレゼンテーション情報に合致する内容を有するものとして、比較法によって識別された合致する画像と、
前記第1の画像群中の画像の各々に関する距離値であって、前記入力画像の関心のある領域に含まれるプレゼンテーション情報及び前記第1の画像群中の画像の内容の間の適合性の接近度の測定値を示すところの距離値と、
を受信するコード;及び
1以上の比較法に関する前記信頼性スコア及び前記距離値に基づいて、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として、前記1以上の比較法によって識別された複数の合致する画像から、ある画像を識別するコード;
より成ることを特徴とする第43項記載のコンピュータプログラムプロダクト。
入力画像の関心のある領域に含まれるプレゼンテーション情報に合致する内容を含む画像を複数の画像が含んでいるか否かを判別する、コンピュータ読み取り可能な媒体に格納されるコンピュータプログラムプロダクトであって、前記複数の画像は1以上の種類の捕捉装置によって捕捉された画像を含み、当該コンピュータプログラムプロダクトは:
前記複数の画像中の画像の各々について、画像を捕捉するのに使用された捕捉装置の種類を判別するコード;
1種類の捕捉装置によって捕捉された画像の全てが1つの集合に分類されるように、画像を捕捉するのに使用された捕捉装置の種別に基づいて、前記複数の画像中の画像を複数の集合に分類するコード;
前記複数の集合中の集合の各々について、
前記入力画像及び前記集合中の画像が第1の特徴を有するか否かを判別し、
前記入力画像及び前記集合中の画像が第2の特徴を有するか否かを判別し、
前記入力画像及び前記集合中の画像が前記第1の特徴及び前記第2の特徴を有するか否かに基づいて、複数の比較法の中から一群の比較法を識別し、
前記一群の比較法内の1以上の比較法を用いて前記入力画像の内容及び前記集合中の画像の内容を比較し、
前記1以上の比較法中の比較法の各々について、比較法の信頼性スコアと、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含むものとして、前記画像群から前記比較法によって識別された合致する画像とを受信し、
前記1以上の比較法に関する信頼性スコアに基づいて、集合に関する集合信頼性スコアを判別し、及び
前記1以上の比較法によって識別された複数の合致する画像から、最高の信頼性スコアを有する比較法によって、前記集合に関する合致する画像として識別される合致する画像を判別するコード;並びに
複数の集合に関する前記集合信頼性スコアに基づいて、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像を、複数の画像が含むか否かを判別するコード;
より成ることを特徴とするコンピュータプログラムプロダクト。
前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像を、複数の画像が含むか否かを判別するコードが:
最高の集合信頼性スコアを有する集合の合致する画像を、前記入力画像中の関心のある領域内の前記プレゼンテーション情報に合致する内容を含む画像として識別するコードより成る
ことを特徴とする第51項記載のコンピュータプログラムプロダクト。
前記入力画像及び前記集合中の画像が第1の特徴を有するか否かを判別することが、前記入力画像及び前記集合中の画像がセグメントされるか否かを判別することより成り;
前記入力画像及び前記集合中の画像が第2の特徴を有するか否かを判別することが、前記入力画像及び前記集合中の画像が、認識されることの可能なテキストを有するか否かを判別することより成る;
ことを特徴とする第51項記載のコンピュータプログラムプロダクト。
150 入力画像
152 関心のある領域
200 データ処理システム
202 プロセッサ
204 バスサブシステム
206 格納サブシステム
208 メモリサブシステム
210 ファイル格納サブシステム
212 ユーザインターフェース入力装置
214 ユーザインターフェース出力装置
216 ネットワークインターフェース
402 画像分類モジュール
404 セレクタ及び照合モジュール
406 評価モジュール
Claims (1)
- 1つ以上の捕捉装置から取得された1つ以上の画像を含む候補画像群が、捕捉装置から取得された入力画像における関心領域が含んでいるプレゼンテーション情報に合致する画像を含んでいるか否かを判別するためにデータ処理システムが実行する画像判別方法であって、
前記候補画像群に属する1つ以上の画像を、画像を取得した捕捉装置の種別毎の集合に分類するステップと、
前記入力画像の種別と前記候補画像群の種別と複数の画像比較方法との間の所定の対応関係を利用して、前記1つ以上の捕捉装置から取得された前記候補画像群及び前記入力画像に対応する複数の画像比較方法を特定するステップと、
特定された前記複数の画像比較方法各々の信頼性スコアを算出し、最高の信頼性スコアを有する画像比較方法を用いて、前記取得された候補画像群が前記プレゼンテーション情報に合致する画像を含んでいるか否かを判別するステップと
を有し、前記複数の画像比較方法は、
画像中のエッジ分布に基づくエッジヒストグラムを利用して画像を照合する技法、
画素の色彩及び輝度の分布により表現された画像レイアウトを利用して画像を照合する技法、
光学文字認識により抽出されたテキストを利用して画像を照合する技法、及び
画像中の文字列の分布及び長さにより表現されたライン属性を利用して画像を照合する方法
を少なくとも含む群から選択された技法である、画像判別方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/412,757 US7236632B2 (en) | 2003-04-11 | 2003-04-11 | Automated techniques for comparing contents of images |
US412757 | 2003-04-11 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004114025A Division JP4516778B2 (ja) | 2003-04-11 | 2004-04-08 | データ処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010205277A JP2010205277A (ja) | 2010-09-16 |
JP5050075B2 true JP5050075B2 (ja) | 2012-10-17 |
Family
ID=33131279
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004114025A Expired - Fee Related JP4516778B2 (ja) | 2003-04-11 | 2004-04-08 | データ処理システム |
JP2010091143A Expired - Fee Related JP5050075B2 (ja) | 2003-04-11 | 2010-04-12 | 画像判別方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004114025A Expired - Fee Related JP4516778B2 (ja) | 2003-04-11 | 2004-04-08 | データ処理システム |
Country Status (2)
Country | Link |
---|---|
US (2) | US7236632B2 (ja) |
JP (2) | JP4516778B2 (ja) |
Families Citing this family (173)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6954197B2 (en) * | 2002-11-15 | 2005-10-11 | Smart Technologies Inc. | Size/scale and orientation determination of a pointer in a camera-based touch system |
JP4112968B2 (ja) | 2002-12-26 | 2008-07-02 | 富士通株式会社 | ビデオテキスト処理装置 |
US7266568B1 (en) | 2003-04-11 | 2007-09-04 | Ricoh Company, Ltd. | Techniques for storing multimedia information with source documents |
US7664733B2 (en) * | 2003-04-11 | 2010-02-16 | Ricoh Company, Ltd. | Techniques for performing operations on a source symbolic document |
US7206773B2 (en) * | 2003-04-11 | 2007-04-17 | Ricoh Company, Ltd | Techniques for accessing information captured during a presentation using a paper document handout for the presentation |
US7236632B2 (en) * | 2003-04-11 | 2007-06-26 | Ricoh Company, Ltd. | Automated techniques for comparing contents of images |
CN100382096C (zh) * | 2003-08-20 | 2008-04-16 | 奥西-技术有限公司 | 文档扫描设备及方法 |
EP1661064B1 (en) * | 2003-08-20 | 2007-03-07 | Océ-Technologies B.V. | Document scanner |
US7372991B2 (en) * | 2003-09-26 | 2008-05-13 | Seiko Epson Corporation | Method and apparatus for summarizing and indexing the contents of an audio-visual presentation |
US8904267B2 (en) * | 2003-10-14 | 2014-12-02 | International Business Machines Corporation | Retrieving slide show content from presentation documents |
US7355593B2 (en) * | 2004-01-02 | 2008-04-08 | Smart Technologies, Inc. | Pointer tracking across multiple overlapping coordinate input sub-regions defining a generally contiguous input region |
US8886727B1 (en) * | 2004-01-27 | 2014-11-11 | Sonicwall, Inc. | Message distribution control |
US8775436B1 (en) * | 2004-03-19 | 2014-07-08 | Google Inc. | Image selection for news search |
US7641108B2 (en) * | 2004-04-02 | 2010-01-05 | K-Nfb Reading Technology, Inc. | Device and method to assist user in conducting a transaction with a machine |
US7840033B2 (en) * | 2004-04-02 | 2010-11-23 | K-Nfb Reading Technology, Inc. | Text stitching from multiple images |
US7788258B1 (en) * | 2004-06-21 | 2010-08-31 | Google Inc. | Automatic determination of whether a document includes an image gallery |
US9171202B2 (en) * | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US7639387B2 (en) * | 2005-08-23 | 2009-12-29 | Ricoh Co., Ltd. | Authoring tools using a mixed media environment |
US7970171B2 (en) * | 2007-01-18 | 2011-06-28 | Ricoh Co., Ltd. | Synthetic image and video generation from ground truth data |
US7551780B2 (en) * | 2005-08-23 | 2009-06-23 | Ricoh Co., Ltd. | System and method for using individualized mixed document |
US9373029B2 (en) * | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US8600989B2 (en) * | 2004-10-01 | 2013-12-03 | Ricoh Co., Ltd. | Method and system for image matching in a mixed media environment |
US8489583B2 (en) * | 2004-10-01 | 2013-07-16 | Ricoh Company, Ltd. | Techniques for retrieving documents using an image capture device |
US7587412B2 (en) | 2005-08-23 | 2009-09-08 | Ricoh Company, Ltd. | Mixed media reality brokerage network and methods of use |
US8156116B2 (en) | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US8949287B2 (en) * | 2005-08-23 | 2015-02-03 | Ricoh Co., Ltd. | Embedding hot spots in imaged documents |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US7920759B2 (en) * | 2005-08-23 | 2011-04-05 | Ricoh Co. Ltd. | Triggering applications for distributed action execution and use of mixed media recognition as a control input |
US7669148B2 (en) * | 2005-08-23 | 2010-02-23 | Ricoh Co., Ltd. | System and methods for portable device for mixed media system |
US7991778B2 (en) * | 2005-08-23 | 2011-08-02 | Ricoh Co., Ltd. | Triggering actions with captured input in a mixed media environment |
US8144921B2 (en) * | 2007-07-11 | 2012-03-27 | Ricoh Co., Ltd. | Information retrieval using invisible junctions and geometric constraints |
US8086038B2 (en) * | 2007-07-11 | 2011-12-27 | Ricoh Co., Ltd. | Invisible junction features for patch recognition |
US9405751B2 (en) * | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US8825682B2 (en) | 2006-07-31 | 2014-09-02 | Ricoh Co., Ltd. | Architecture for mixed media reality retrieval of locations and registration of images |
US8332401B2 (en) * | 2004-10-01 | 2012-12-11 | Ricoh Co., Ltd | Method and system for position-based image matching in a mixed media environment |
US7885955B2 (en) * | 2005-08-23 | 2011-02-08 | Ricoh Co. Ltd. | Shared document annotation |
US8195659B2 (en) * | 2005-08-23 | 2012-06-05 | Ricoh Co. Ltd. | Integration and use of mixed media documents |
US8184155B2 (en) * | 2007-07-11 | 2012-05-22 | Ricoh Co. Ltd. | Recognition and tracking using invisible junctions |
US7917554B2 (en) * | 2005-08-23 | 2011-03-29 | Ricoh Co. Ltd. | Visibly-perceptible hot spots in documents |
US8838591B2 (en) * | 2005-08-23 | 2014-09-16 | Ricoh Co., Ltd. | Embedding hot spots in electronic documents |
US7812986B2 (en) * | 2005-08-23 | 2010-10-12 | Ricoh Co. Ltd. | System and methods for use of voice mail and email in a mixed media environment |
US8369655B2 (en) * | 2006-07-31 | 2013-02-05 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US8005831B2 (en) * | 2005-08-23 | 2011-08-23 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment with geographic location information |
US8156427B2 (en) * | 2005-08-23 | 2012-04-10 | Ricoh Co. Ltd. | User interface for mixed media reality |
US8276088B2 (en) * | 2007-07-11 | 2012-09-25 | Ricoh Co., Ltd. | User interface for three-dimensional navigation |
US8856108B2 (en) * | 2006-07-31 | 2014-10-07 | Ricoh Co., Ltd. | Combining results of image retrieval processes |
US8176054B2 (en) | 2007-07-12 | 2012-05-08 | Ricoh Co. Ltd | Retrieving electronic documents by converting them to synthetic text |
US7702673B2 (en) * | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US10192279B1 (en) | 2007-07-11 | 2019-01-29 | Ricoh Co., Ltd. | Indexed document modification sharing with mixed media reality |
US8521737B2 (en) * | 2004-10-01 | 2013-08-27 | Ricoh Co., Ltd. | Method and system for multi-tier image matching in a mixed media environment |
US8868555B2 (en) | 2006-07-31 | 2014-10-21 | Ricoh Co., Ltd. | Computation of a recongnizability score (quality predictor) for image retrieval |
US8510283B2 (en) * | 2006-07-31 | 2013-08-13 | Ricoh Co., Ltd. | Automatic adaption of an image recognition system to image capture devices |
US8335789B2 (en) * | 2004-10-01 | 2012-12-18 | Ricoh Co., Ltd. | Method and system for document fingerprint matching in a mixed media environment |
US7672543B2 (en) * | 2005-08-23 | 2010-03-02 | Ricoh Co., Ltd. | Triggering applications based on a captured text in a mixed media environment |
US8385589B2 (en) | 2008-05-15 | 2013-02-26 | Berna Erol | Web-based content detection in images, extraction and recognition |
US9384619B2 (en) * | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US8221397B2 (en) * | 2004-10-15 | 2012-07-17 | Baxano, Inc. | Devices and methods for tissue modification |
US20060090123A1 (en) * | 2004-10-26 | 2006-04-27 | Fuji Xerox Co., Ltd. | System and method for acquisition and storage of presentations |
US7712096B2 (en) * | 2004-12-21 | 2010-05-04 | International Business Machines Corporation | Method, system, and storage medium for dynamically reordering resource participation in two-phase commit to heuristically optimize for last-agent optimization |
KR100670003B1 (ko) * | 2004-12-28 | 2007-01-19 | 삼성전자주식회사 | 적응형 문턱치를 이용한 영상의 평탄 영역 검출장치 및 그방법 |
GB0502844D0 (en) | 2005-02-11 | 2005-03-16 | Univ Edinburgh | Storing digital content for access using a captured image |
US7519221B1 (en) * | 2005-02-28 | 2009-04-14 | Adobe Systems Incorporated | Reconstructing high-fidelity electronic documents from images via generation of synthetic fonts |
US7466858B2 (en) * | 2005-04-28 | 2008-12-16 | Fuji Xerox Co., Ltd. | Methods for slide image classification |
US7500194B2 (en) * | 2005-05-13 | 2009-03-03 | Microsoft Corporation | Applying a slide layout with an arbitrary number of placeholders |
US7724981B2 (en) * | 2005-07-21 | 2010-05-25 | Ancestry.Com Operations Inc. | Adaptive contrast control systems and methods |
US7801392B2 (en) * | 2005-07-21 | 2010-09-21 | Fuji Xerox Co., Ltd. | Image search system, image search method, and storage medium |
US20070041628A1 (en) * | 2005-08-17 | 2007-02-22 | Xerox Corporation | Detection of document security marks using run profiles |
US7769772B2 (en) * | 2005-08-23 | 2010-08-03 | Ricoh Co., Ltd. | Mixed media reality brokerage network with layout-independent recognition |
TWI299466B (en) * | 2005-10-27 | 2008-08-01 | Premier Image Technology Corp | System and method for providing presentation files for an embedded system |
US7702182B2 (en) * | 2006-02-16 | 2010-04-20 | Adobe Systems, Incorporated | Method and apparatus for creating a high-fidelity glyph prototype from low-resolution glyph images |
US7734092B2 (en) * | 2006-03-07 | 2010-06-08 | Ancestry.Com Operations Inc. | Multiple image input for optical character recognition processing systems and methods |
GB2436656A (en) * | 2006-03-31 | 2007-10-03 | Tandberg Television Asa | Computing a sliding sum of absolute differences for video signal compression |
US9063952B2 (en) * | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US8201076B2 (en) * | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US8489987B2 (en) * | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
US9176984B2 (en) * | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US8676810B2 (en) * | 2006-07-31 | 2014-03-18 | Ricoh Co., Ltd. | Multiple index mixed media reality recognition using unequal priority indexes |
US9020966B2 (en) * | 2006-07-31 | 2015-04-28 | Ricoh Co., Ltd. | Client device for interacting with a mixed media reality recognition system |
US8073263B2 (en) | 2006-07-31 | 2011-12-06 | Ricoh Co., Ltd. | Multi-classifier selection and monitoring for MMR-based image recognition |
US7697758B2 (en) * | 2006-09-11 | 2010-04-13 | Google Inc. | Shape clustering and cluster-level manual identification in post optical character recognition processing |
US7646921B2 (en) * | 2006-09-11 | 2010-01-12 | Google Inc. | High resolution replication of document based on shape clustering |
US8175394B2 (en) | 2006-09-08 | 2012-05-08 | Google Inc. | Shape clustering in post optical character recognition processing |
US7650035B2 (en) * | 2006-09-11 | 2010-01-19 | Google Inc. | Optical character recognition based on shape clustering and multiple optical character recognition processes |
US8708227B1 (en) | 2006-10-31 | 2014-04-29 | United Services Automobile Association (Usaa) | Systems and methods for remote deposit of checks |
US7873200B1 (en) | 2006-10-31 | 2011-01-18 | United Services Automobile Association (Usaa) | Systems and methods for remote deposit of checks |
US8504546B2 (en) * | 2006-11-29 | 2013-08-06 | D&S Consultants, Inc. | Method and system for searching multimedia content |
US8019155B2 (en) * | 2007-03-26 | 2011-09-13 | Eastman Kodak Company | Digital object information via category-based histograms |
US8356035B1 (en) | 2007-04-10 | 2013-01-15 | Google Inc. | Association of terms with images using image similarity |
US20080270378A1 (en) * | 2007-04-24 | 2008-10-30 | Nokia Corporation | Method, Apparatus and Computer Program Product for Determining Relevance and/or Ambiguity in a Search System |
US8055664B2 (en) | 2007-05-01 | 2011-11-08 | Google Inc. | Inferring user interests |
US7904461B2 (en) | 2007-05-01 | 2011-03-08 | Google Inc. | Advertiser and user association |
US20090083237A1 (en) * | 2007-09-20 | 2009-03-26 | Nokia Corporation | Method, Apparatus and Computer Program Product for Providing a Visual Search Interface |
US9058512B1 (en) | 2007-09-28 | 2015-06-16 | United Services Automobile Association (Usaa) | Systems and methods for digital signature detection |
US9159101B1 (en) | 2007-10-23 | 2015-10-13 | United Services Automobile Association (Usaa) | Image processing |
US7853622B1 (en) | 2007-11-01 | 2010-12-14 | Google Inc. | Video-related recommendations using link structure |
US8041082B1 (en) | 2007-11-02 | 2011-10-18 | Google Inc. | Inferring the gender of a face in an image |
US8036468B2 (en) * | 2007-12-24 | 2011-10-11 | Microsoft Corporation | Invariant visual scene and object recognition |
US10380562B1 (en) | 2008-02-07 | 2019-08-13 | United Services Automobile Association (Usaa) | Systems and methods for mobile deposit of negotiable instruments |
US7480411B1 (en) | 2008-03-03 | 2009-01-20 | International Business Machines Corporation | Adaptive OCR for books |
US8014604B2 (en) * | 2008-04-16 | 2011-09-06 | International Business Machines Corporation | OCR of books by word recognition |
US20090297045A1 (en) * | 2008-05-29 | 2009-12-03 | Poetker Robert B | Evaluating subject interests from digital image records |
US7961986B1 (en) * | 2008-06-30 | 2011-06-14 | Google Inc. | Ranking of images and image labels |
US20100064222A1 (en) * | 2008-09-08 | 2010-03-11 | Apple Inc. | Object-aware transitions |
US7721209B2 (en) * | 2008-09-08 | 2010-05-18 | Apple Inc. | Object-aware transitions |
US10504185B1 (en) | 2008-09-08 | 2019-12-10 | United Services Automobile Association (Usaa) | Systems and methods for live video financial deposit |
US20100118037A1 (en) * | 2008-09-08 | 2010-05-13 | Apple Inc. | Object-aware transitions |
US8452689B1 (en) | 2009-02-18 | 2013-05-28 | United Services Automobile Association (Usaa) | Systems and methods of check detection |
US10956728B1 (en) | 2009-03-04 | 2021-03-23 | United Services Automobile Association (Usaa) | Systems and methods of check processing with background removal |
JP4573910B1 (ja) * | 2009-03-17 | 2010-11-04 | エンパイア テクノロジー ディベロップメント エルエルシー | 画像表示システム、画像表示装置、画像提供装置およびその方法 |
WO2010106632A1 (ja) * | 2009-03-17 | 2010-09-23 | キーパー=スミス エル・エル・ピー | 画像表示システム、画像表示装置、画像提供装置およびその方法 |
US8346800B2 (en) * | 2009-04-02 | 2013-01-01 | Microsoft Corporation | Content-based information retrieval |
JP2010250658A (ja) * | 2009-04-17 | 2010-11-04 | Seiko Epson Corp | 印刷装置、画像処理装置、画像処理方法およびコンピュータープログラム |
CN101872475B (zh) * | 2009-04-22 | 2012-03-28 | 中国科学院自动化研究所 | 一种扫描文档图像自动配准方法 |
US20100303301A1 (en) * | 2009-06-01 | 2010-12-02 | Gregory Micheal Lamoureux | Inter-Frame Motion Detection |
US8385660B2 (en) * | 2009-06-24 | 2013-02-26 | Ricoh Co., Ltd. | Mixed media reality indexing and retrieval for repeated content |
AU2010282211B2 (en) * | 2009-08-11 | 2016-09-08 | Someones Group Intellectual Property Holdings Pty Ltd | Method, system and controller for searching a database |
US9779392B1 (en) | 2009-08-19 | 2017-10-03 | United Services Automobile Association (Usaa) | Apparatuses, methods and systems for a publishing and subscribing platform of depositing negotiable instruments |
US8977571B1 (en) | 2009-08-21 | 2015-03-10 | United Services Automobile Association (Usaa) | Systems and methods for image monitoring of check during mobile deposit |
US8311950B1 (en) | 2009-10-01 | 2012-11-13 | Google Inc. | Detecting content on a social network using browsing patterns |
US8306922B1 (en) | 2009-10-01 | 2012-11-06 | Google Inc. | Detecting content on a social network using links |
US8565554B2 (en) * | 2010-01-09 | 2013-10-22 | Microsoft Corporation | Resizing of digital images |
US8526732B2 (en) * | 2010-03-10 | 2013-09-03 | Microsoft Corporation | Text enhancement of a textual image undergoing optical character recognition |
US8773490B2 (en) * | 2010-05-28 | 2014-07-08 | Avaya Inc. | Systems, methods, and media for identifying and selecting data images in a video stream |
US9129340B1 (en) | 2010-06-08 | 2015-09-08 | United Services Automobile Association (Usaa) | Apparatuses, methods and systems for remote deposit capture with enhanced image detection |
US8942917B2 (en) | 2011-02-14 | 2015-01-27 | Microsoft Corporation | Change invariant scene recognition by an agent |
US8712188B2 (en) * | 2011-04-28 | 2014-04-29 | Hewlett-Packard Development Company, L.P. | System and method for document orientation detection |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
WO2013035902A1 (ko) * | 2011-09-08 | 2013-03-14 | 엘지전자 주식회사 | 원격 건강 관리 솔루션에서 비디오를 기반으로 한 헬스 케어 시스템 및 헬스 케어 서비스 제공방법 |
US10380565B1 (en) | 2012-01-05 | 2019-08-13 | United Services Automobile Association (Usaa) | System and method for storefront bank deposits |
US9165188B2 (en) * | 2012-01-12 | 2015-10-20 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US11321772B2 (en) | 2012-01-12 | 2022-05-03 | Kofax, Inc. | Systems and methods for identification document processing and business workflow integration |
DE102012008512A1 (de) | 2012-05-02 | 2013-11-07 | Eyec Gmbh | Vorrichtung und Verfahren zum Vergleich zweier Grafik- und Textelemente enthaltenden Dateien |
JP5993642B2 (ja) * | 2012-07-09 | 2016-09-14 | キヤノン株式会社 | 情報処理装置及びその制御方法及びプログラム |
JP6045232B2 (ja) * | 2012-07-09 | 2016-12-14 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
US11620733B2 (en) | 2013-03-13 | 2023-04-04 | Kofax, Inc. | Content-based object detection, 3D reconstruction, and data extraction from digital images |
US10127636B2 (en) | 2013-09-27 | 2018-11-13 | Kofax, Inc. | Content-based detection and three dimensional geometric reconstruction of objects in image and video data |
US10783615B2 (en) | 2013-03-13 | 2020-09-22 | Kofax, Inc. | Content-based object detection, 3D reconstruction, and data extraction from digital images |
US9384423B2 (en) * | 2013-05-28 | 2016-07-05 | Xerox Corporation | System and method for OCR output verification |
JP6168928B2 (ja) * | 2013-09-05 | 2017-07-26 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
US9286514B1 (en) | 2013-10-17 | 2016-03-15 | United Services Automobile Association (Usaa) | Character count determination for a digital image |
US10318576B2 (en) * | 2013-12-12 | 2019-06-11 | Nant Holdings Ip, Llc | Image recognition verification |
US9864758B2 (en) | 2013-12-12 | 2018-01-09 | Nant Holdings Ip, Llc | Image recognition verification |
US10037821B2 (en) * | 2013-12-27 | 2018-07-31 | General Electric Company | System for integrated protocol and decision support |
US10580014B2 (en) * | 2014-06-12 | 2020-03-03 | Avaya Inc. | System and method for payment card industry compliance |
US9547678B2 (en) | 2014-06-17 | 2017-01-17 | Nant Holdings Ip, Llc | Activity recognition systems and methods |
WO2016014020A1 (en) * | 2014-07-21 | 2016-01-28 | Hewlett-Packard Development Company, L.P. | Radial histogram matching |
KR20160027862A (ko) * | 2014-09-02 | 2016-03-10 | 삼성전자주식회사 | 이미지 데이터를 처리하는 방법과 이를 지원하는 전자 장치 |
CN105631393A (zh) | 2014-11-06 | 2016-06-01 | 阿里巴巴集团控股有限公司 | 信息识别方法及装置 |
US10467465B2 (en) | 2015-07-20 | 2019-11-05 | Kofax, Inc. | Range and/or polarity-based thresholding for improved data extraction |
US10242285B2 (en) * | 2015-07-20 | 2019-03-26 | Kofax, Inc. | Iterative recognition-guided thresholding and data extraction |
US10592548B2 (en) | 2015-08-17 | 2020-03-17 | Adobe Inc. | Image search persona techniques and systems |
US20170053365A1 (en) * | 2015-08-17 | 2017-02-23 | Adobe Systems Incorporated | Content Creation Suggestions using Keywords, Similarity, and Social Networks |
US10475098B2 (en) | 2015-08-17 | 2019-11-12 | Adobe Inc. | Content creation suggestions using keywords, similarity, and social networks |
US11048779B2 (en) | 2015-08-17 | 2021-06-29 | Adobe Inc. | Content creation, fingerprints, and watermarks |
US10878021B2 (en) | 2015-08-17 | 2020-12-29 | Adobe Inc. | Content search and geographical considerations |
US10152780B2 (en) * | 2015-11-02 | 2018-12-11 | Cognex Corporation | System and method for finding lines in an image with a vision system |
US10937168B2 (en) | 2015-11-02 | 2021-03-02 | Cognex Corporation | System and method for finding and classifying lines in an image with a vision system |
US10506281B1 (en) | 2015-12-22 | 2019-12-10 | United Services Automobile Association (Usaa) | System and method for capturing audio or video data |
US9524430B1 (en) * | 2016-02-03 | 2016-12-20 | Stradvision Korea, Inc. | Method for detecting texts included in an image and apparatus using the same |
CN106503283B (zh) * | 2016-09-09 | 2018-02-02 | 武汉开目信息技术股份有限公司 | 一种二维图纸智能比较方法及装置 |
US10083353B2 (en) * | 2016-10-28 | 2018-09-25 | Intuit Inc. | Identifying document forms using digital fingerprints |
KR102358373B1 (ko) * | 2017-04-06 | 2022-02-04 | 삼성전자주식회사 | 손글씨 입력에 대한 그래픽 효과를 제공하기 위한 장치 및 그에 관한 방법 |
GB201708762D0 (en) * | 2017-06-01 | 2017-07-19 | Microsoft Technology Licensing Llc | Managing electronic slide decks |
US11062176B2 (en) | 2017-11-30 | 2021-07-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
US11475039B2 (en) | 2018-04-05 | 2022-10-18 | Adp, Inc. | Augmented reality database synchronization system |
US11030752B1 (en) | 2018-04-27 | 2021-06-08 | United Services Automobile Association (Usaa) | System, computing device, and method for document detection |
US10755130B2 (en) * | 2018-06-14 | 2020-08-25 | International Business Machines Corporation | Image compression based on textual image content |
US11488374B1 (en) * | 2018-09-28 | 2022-11-01 | Apple Inc. | Motion trajectory tracking for action detection |
US10853983B2 (en) | 2019-04-22 | 2020-12-01 | Adobe Inc. | Suggestions to enrich digital artwork |
US10984279B2 (en) * | 2019-06-13 | 2021-04-20 | Wipro Limited | System and method for machine translation of text |
CN111356016B (zh) | 2020-03-11 | 2022-04-22 | 北京小米松果电子有限公司 | 视频处理方法、视频处理装置及存储介质 |
US11900755B1 (en) | 2020-11-30 | 2024-02-13 | United Services Automobile Association (Usaa) | System, computing device, and method for document detection and deposit processing |
US20240005689A1 (en) * | 2022-06-30 | 2024-01-04 | David Pintsov | Efficient use of training data in data capture for Commercial Documents |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5060980A (en) | 1990-05-30 | 1991-10-29 | Xerox Corporation | Form utilizing encoded indications for form field processing |
US5583980A (en) * | 1993-12-22 | 1996-12-10 | Knowledge Media Inc. | Time-synchronized annotation method |
WO1999050736A1 (en) | 1998-04-01 | 1999-10-07 | Xerox Corporation | Paper indexing of recordings |
US6122647A (en) * | 1998-05-19 | 2000-09-19 | Perspecta, Inc. | Dynamic generation of contextual links in hypertext documents |
US6370498B1 (en) * | 1998-06-15 | 2002-04-09 | Maria Ruth Angelica Flores | Apparatus and methods for multi-lingual user access |
US6243713B1 (en) * | 1998-08-24 | 2001-06-05 | Excalibur Technologies Corp. | Multimedia document retrieval by application of multimedia queries to a unified index of multimedia data for a plurality of multimedia data types |
AU3395500A (en) | 1999-03-04 | 2000-09-21 | Cardiff Software, Inc. | Automated form generation into an advanced page layout format with embedded field definitions |
US6732915B1 (en) * | 1999-09-10 | 2004-05-11 | Fuji Xerox Co., Ltd. | Systems and methods for controlling a presentation using physical objects |
US7653925B2 (en) | 1999-11-17 | 2010-01-26 | Ricoh Company, Ltd. | Techniques for receiving information during multimedia presentations and communicating the information |
US20020120939A1 (en) * | 2000-12-18 | 2002-08-29 | Jerry Wall | Webcasting system and method |
JP4889159B2 (ja) * | 2001-05-14 | 2012-03-07 | 富士通株式会社 | データ検索システムおよびデータ検索方法 |
US6836870B2 (en) * | 2001-06-15 | 2004-12-28 | Cubic Corporation | Method and system for incorporating a dynamic situation display in a powerpoint slide show presentation |
US20030009342A1 (en) | 2001-07-06 | 2003-01-09 | Haley Mark R. | Software that converts text-to-speech in any language and shows related multimedia |
JP4303490B2 (ja) * | 2003-02-21 | 2009-07-29 | 富士通株式会社 | 画像と文書のマッチング方法及び装置並びにマッチングプログラム |
US7236632B2 (en) * | 2003-04-11 | 2007-06-26 | Ricoh Company, Ltd. | Automated techniques for comparing contents of images |
US20050041872A1 (en) * | 2003-08-20 | 2005-02-24 | Wai Yim | Method for converting PowerPoint presentation files into compressed image files |
US7379627B2 (en) * | 2003-10-20 | 2008-05-27 | Microsoft Corporation | Integrated solution to digital image similarity searching |
US7702673B2 (en) * | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
-
2003
- 2003-04-11 US US10/412,757 patent/US7236632B2/en active Active
-
2004
- 2004-04-08 JP JP2004114025A patent/JP4516778B2/ja not_active Expired - Fee Related
-
2007
- 2007-05-16 US US11/749,606 patent/US7394938B2/en not_active Expired - Fee Related
-
2010
- 2010-04-12 JP JP2010091143A patent/JP5050075B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004318879A (ja) | 2004-11-11 |
US20040202349A1 (en) | 2004-10-14 |
US7236632B2 (en) | 2007-06-26 |
US20070269139A1 (en) | 2007-11-22 |
US7394938B2 (en) | 2008-07-01 |
JP4516778B2 (ja) | 2010-08-04 |
JP2010205277A (ja) | 2010-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5050075B2 (ja) | 画像判別方法 | |
US11288823B2 (en) | Logo recognition in images and videos | |
CA3027038C (en) | Document field detection and parsing | |
US8373905B2 (en) | Semantic classification and enhancement processing of images for printing applications | |
Wu et al. | Textfinder: An automatic system to detect and recognize text in images | |
US7120318B2 (en) | Automatic document reading system for technical drawings | |
Yanikoglu et al. | Pink Panther: a complete environment for ground-truthing and benchmarking document page segmentation | |
US8358837B2 (en) | Apparatus and methods for detecting adult videos | |
US9633257B2 (en) | Method and system of pre-analysis and automated classification of documents | |
US5335290A (en) | Segmentation of text, picture and lines of a document image | |
US8155442B2 (en) | Method and apparatus for modifying the histogram of an image | |
US8144986B2 (en) | Method and apparatus for binarization threshold calculation | |
US8041139B2 (en) | Method and apparatus for calculating the background color of an image | |
US7627176B2 (en) | Apparatus, method, and computer program for analyzing document layout | |
JP2004265407A (ja) | デジタル画像におけるカラーオブジェクトの検出方法 | |
JP2003515230A (ja) | ビデオストリームの分類可能な記号の分離方法及びシステム | |
Sidhwa et al. | Text extraction from bills and invoices | |
Chiu et al. | Picture detection in document page images | |
Lu et al. | Video text detection | |
Bhaskar et al. | Implementing optical character recognition on the android operating system for business cards | |
Zayene et al. | Data, protocol and algorithms for performance evaluation of text detection in arabic news video | |
Behera et al. | Visual signature based identification of low-resolution document images | |
Samuel et al. | Automatic Text Segmentation and Recognition in Natural Scene Images Using Msocr | |
JP2003515229A (ja) | ニューラルネットワークに与えられた形状特徴での記号分類 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111025 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120710 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120723 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150727 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5050075 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |