JP2008159056A - 画像中に生じる特徴の生成モデルによる分類 - Google Patents

画像中に生じる特徴の生成モデルによる分類 Download PDF

Info

Publication number
JP2008159056A
JP2008159056A JP2007328481A JP2007328481A JP2008159056A JP 2008159056 A JP2008159056 A JP 2008159056A JP 2007328481 A JP2007328481 A JP 2007328481A JP 2007328481 A JP2007328481 A JP 2007328481A JP 2008159056 A JP2008159056 A JP 2008159056A
Authority
JP
Japan
Prior art keywords
category
feature
conditional
image
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007328481A
Other languages
English (en)
Inventor
Prateek Sarkar
サーカー プラティーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2008159056A publication Critical patent/JP2008159056A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

【課題】テンプレートマッチング、帰納的規則、またはOCR等の高レベル特徴分析に頼ることなく、特徴の変動性に対処するディジタル文書および画像の分類実行方法が必要とされている。
【解決手段】画像中に生じる特徴の生成モデルによって分類を行うシステムは、それぞれ1つのカテゴリに割り当てられた複数のトレーニング画像中に生じる特徴の、カテゴリ条件付き確率分布を記憶させたものと、分類器とを含み、分類器は、未分類の画像中に生じる特徴を特定する特徴識別部と、特定した特徴について、各カテゴリの前記カテゴリ条件付き確率分布を用いてカテゴリ条件付き尤度を決定する尤度評価部と、未分類の画像を、カテゴリ条件付き尤度に基づいて1つのカテゴリに割り当てるカテゴリ分類部とを含む。
【選択図】図1

Description

本出願は、一般には画像分類に関し、より特定的には画像中に生じる特徴を生成モデルによって分類するシステムおよび方法に関する。
現在、ディジタル画像は、業務用および個人用の幅広い用途向けに簡単に交換および操作できる。ディジタル画像は、ハードコピーの代わりにテキスト文書の絵画データおよびディジタル化した複製を含む。このディジタル文書を従来の印刷文書に幅広く取り入れることに対応して、オフィスおよび個人用生産性装置は、ディジタイザおよび印刷内容をディジタル画像に直接変換する同様の手段を組み入れ始めている。コピー機、スキャナ、およびディジタル可能なファクシミリ機等の装置は、紙の文書の等価物を電子的に迅速に生成できる。ただし一般には、変換された「生」のディジタルデータを言語処理またはデータ分析で必要とされるような利用可能な形式に変換させることが必要である。必要な処理形式は変換される文書の種類によって異なり、例えばインデックス付けと検索、ソートと統合、ならびに自動分析タスク等がある。このため、さらなる処理工程を行う前にディジタル画像を分類しなければならない場合が多い。
「単純な特徴のブースト・カスケードを用いた高速対象検出(Rapid Object Detection Using a Boosted Cascade of Simple Features)」P.A.ビオラおよびM.J.ジョーンズ(P.A.Viola and M.Jones)著、CVPR議事録511〜518ページ(2001年)
ディジタル画像のディジタル化後の分類は、大量の文書が変換されるため手動での分類が現実的に不可能なことから、問題となりやすい。現在、テンプレートマッチング、高レベル特徴抽出に基づく判別モデル、アドホックルールに基づくシステム、および言語形状認識等の方法が画像分類に利用されているが、これら方法にはそれぞれ欠点がある。例えばテンプレートマッチングは、変換スキュー、縮尺、外部マーク、用紙の折れ、または抜け箇所等の、ディジタル画像上で識別される入力特徴のわずかなばらつきのために失敗する場合がある。
同様に、高レベル特徴抽出法は、光学文字認識(「OCR」)またはレイアウト分析による内容分析を用いる。OCRは画像データをディジタル方式でテキストに変換し、これを意味論から分析して文書の分類に役立てる。OCR支援型テキスト分類は、文書が十分な種類、品質、および量のテキストを含む場合にもっとも効果的に機能する。さらに、テキストデータは、絵画データ、またはテキストデータの少ない所得税還付等の様式文書を適正に分類するには不十分な場合がある。最後に、OCRは当該文書の言語では利用不可な場合がある。
レイアウト分析は、ディジタル画像を対比させるカテゴリプロトタイプとして用いられる文書署名を利用する。プロトタイプは理想のカテゴリ例から抽出した特徴を含みうる。最も一致するプロトタイプに基づいて文書画像が分類される。レイアウト分析は、プロトタイプ作成に多大な努力を要するため用途が狭く、特徴配置の変化によって誤識別または拒絶を生じる場合がある。
アドホックルールに基づくシステムは、ユーザが指定した、異なるカテゴリの文書を特徴付ける特徴を検索する。かかるシステムはトライアルアンドエラー(試行錯誤)によって発展し、モデル固有の仮定外の特徴を含む文書画像に対してはすぐに失敗する。また、新たな文書カテゴリを加えるには、特徴を判別する境界を再定義しなければならない。
最後に、文字形状認識は、レイアウト分析システムによってセグメント化された文書画像のモデルに対して行われる。構文解析した文字形状を判別決定ツリーに適用して、適切なカテゴリを特定する。しかし文字形状認識には、広範な文字形状サンプルを用いた訓練が必要である。
従って、テンプレートマッチング、帰納的規則、またはOCR等の高レベル特徴分析に頼ることなく、特徴の変動性に対処するディジタル文書および画像の分類実行方法が必要とされている。
入力文書画像を特徴生成モデルによってカテゴリに分類するシステムおよび方法を提供する。強度変化を評価して画像を分類し、例えばハールフィルタ特徴等の低レベル特徴を含む各特徴を認識する。閾値を超えるフィルタ応答は「firing(発火)」となり、文書の特徴リストに加えられる。特徴リストの長さは入力画像の変動性によって可変であり、縮尺は画像またはフィルタサイズを調整して変更できる。特徴の発火は分散図中の点としてモデル化される。各文書カテゴリは確率分布として提示され、これを散布図と対比させて最尤カテゴリを特定する。
一実施形態では、画像中に生じる特徴の生成モデルによって分類を実行するシステムおよび方法を提供する。複数のトレーニング画像中に生じる特徴のカテゴリ条件付き確率分布を維持する。それぞれの分布を1つのカテゴリに割り当てる。未分類画像中に生じる特徴を特定し、各カテゴリのカテゴリ条件付き確率分布を用いて、特定した特徴のカテゴリ条件付き尤度を求める。カテゴリ条件付き尤度に基づいて、未分類画像を1つのカテゴリに割り当てる。
画像の分類は、大きくは文書画像分析の一環として行われ、後続の分析を支援するために、ディジタル文書画像を1つ以上の事前に定義されたカテゴリに分析および割り当てる工程を含みうる。図1は、本発明の一実施形態に従って、画像中に生じる特徴の生成モデルによって分類を実行するシステム10を示す。本明細書中、「ディジタル画像」、「文書画像」、「ディジタル化文書」、および「ディジタル化した複製」は互換可能に使用でき、例えばテキスト、絵画、グラフィックス等を任意に組み合わせたものを含む印刷文書のディジタル画像を指すものとする。
画像分析の一形式では、画像分類は分類器11によって実行され、分類器11はコンピュータシステム13上で作動して入力文書画像14を各カテゴリ12に割り当てる。画像分類はまた、画像分析を参照しない独立機能としても実行できる。文書画像14は、例えば所得税還付様式等の様式および事前印刷文書16、アメリカ合衆国大統領の肖像画等の絵画データ17、および絵画とテキスト両方のデータを含む郵便切手のディジタル表現等の混合データ18を含む。これら以外の種類の文書画像14も可能である。
分類器11は各文書画像14を分析し、文書画像14が属する尤度が最も高いカテゴリ12を決定する。他の実施形態では、分類器11は1つ以上のカテゴリ12を決定できる。カテゴリ群12はカテゴリラベルのセットを特定し、これは図2以降を参照して詳述する生成特徴モデリング法を用いて分類器11が認識するディジタル画像のタイプに関連付けられるものである。分類後、文書画像14に対して動作群15を実行できる。一例として、動作群15には、入力画像14から派生したテキストおよびその他のデータのインデックス付け19と検索20、ならびに派生データのソート21と統合22が含まれうる。さらに、タスク割り当て23によって、文書画像14をOCR、レイアウト分析、および文字形状コード分析を含む適切な分類後の処理へ進めることができる。他の動作群15も可能である。
好適には、コンピュータシステム13は、ソフトウェアプログラムを実行するパーソナルデスクトップまたはノートブックコンピュータ等の汎用計算ワークステーションである。コンピュータシステム13は、中央演算処理装置、記憶装置、ネットワークインターフェース、永続的記憶装置、およびネットワーク相互連結用の各構成要素等、従来の計算装置に見られる構成要素を含む。分類器13はまた、ハードウェア中でマイクロプログラムを組み込んだ装置または専用計算モジュールとして実現することもできる。その他のシステムおよび構成要素も可能である。
画像分類は、各画像で特定された特徴に基づいて入力ディジタル画像を1つ以上のカテゴリに割り当てる。図2は、本発明の一実施形態に従って、画像中に生じる特徴の生成モデルによって分類を実行する方法30を示す工程フロー図である。生成特徴モデルは、サンプル文書のセットに対するトレーニングによって生成して各カテゴリ12の特徴セットを特定するものでもよいし、または手動または自動化手段で構築される事前に定義されたモデルとして設けてもよい。
まず最初に各画像中の特徴を特定し、これは例えば、未分類画像の輝度チャネル表現の2つのレベル、すなわち黒白、グレースケール、またはカラー画像等の一方の強度変化に対する特徴フィルタの応答を評価して行う。所定の閾値に合致する各特徴フィルタ応答は特徴の「発火」となり、図3を参照して下記に詳述する画像の特徴リストの一要素として加えられる(動作31)。特徴リスト中の各特徴発火は、以下で図6を参照して詳述するように記録される。最後に、記録された特徴リストにカテゴリ12の各カテゴリの確率分布が適合され、図6を参照して詳述するようにカテゴリ条件付き特徴尤度関数を推定する(動作32)。その後、最良または最大カテゴリ条件付き尤度、相応な尤度、または尤度が信頼閾値を満足させるだけであるかに基づいて、カテゴリラベルを文書画像41に割り当てることができる。これ以外の場合、文書画像41は認識不可または未知のカテゴリとして分類できる。他の実施形態では、カテゴリ割り当ては、厳密ではなく近似のカテゴリ条件付き尤度に基づく。
特徴リストは、画像中で特定された特徴のリストであり、入力画像中の変動性のため可変長となりうる。特徴リストは、各カテゴリに特有の生成モデルに合致する。図3は、図2の方法で用いる特徴リスト生成ルーチンを示す工程フロー図である。一実施形態では、各文書画像41で特定される特徴はハール・フィルタの一形式であり、これは本願に引用して適用する「単純な特徴のブースト・カスケードを用いた高速対象検出(Rapid Object Detection Using a Boosted Cascade of Simple Features)」P.A.ビオラおよびM.J.ジョーンズ(P.A.Viola and M.Jones)著、CVPR議事録511〜518ページ(2001年)に記載されているビオラ・ジョーンズ矩形フィルタとしても公知である。ここでは特徴はビオラ・ジョーンズフィルタのサブセットとして実現されるが、他の種類の特徴、フィルタ、および視覚アーチファクトも可能であり、例えば他形式のハール・フィルタ、操縦可能(スティーラブル)フィルタ、ガボール・フィルタ、ウェーブレット・フィルタ、エッジ検出フィルタ、明暗強度転移カウント、テクスチャ特徴、相似形特徴、接続成分、および高レベル対象検出器を含む、他のタイプの特徴、フィルタ、および可視アーチファクト等が含まれる。
各文書画像41は、まずインテグラルイメージを作成して中間表現に変換され(動作42)、これは白黒画像では強度の強弱からなる。インテグラルイメージは、上記文献の512〜513ページに記載されているように、画素和43の累積によって1つの計算パスで高速特徴評価を可能にする。特定された特徴が評価され(動作44)、特徴リスト46が形成される。画素和43が所定の閾値規準を満たせば、特徴エントリは特徴の「発火(firing)」45として記録され、特徴リスト46に加えられる。
一実施形態では、各特徴発火は、一種類の特徴と1つのスケールについて画像中のある位置でとられた文書画像41のフィルタ応答測定値をあらわす。図4は、フィルタの一例としてビオラ・ジョーンズ矩形フィルタ(別名ハール・フィルタ)のブロック図を示す。評価される各種ビオラ・ジョーンズ矩形フィルタは、面積和51、水平ステップ52、垂直ステップ53、垂直バンド54、水平バンド55、および斜線バンド56を含む。各フィルタタイプごとに、フィルタの暗部の画素強度の和を明部の画素強度の和から減じて、フィルタ応答を評価する。
各特徴発火45は5字組の一要素として特徴リスト46に保存される。図5は、特徴リストのエントリを保存する5字組60用の構成例を示すデータ構造図である。5字組60はそれぞれ、特徴のタイプ61と、文書イメージ中のx軸62およびy軸63と、特徴の幅64および高さ65の対数とを含む。特徴の寸法は、5字組60の要素数、すなわち5に対応するが、ただし特徴リストNの長さは入力ディジタル画像41の差に応じて異なる。他のデータ構造および構成も可能である。
分類される各画像は、顕著な特徴[x,x,...,x]の特徴リスト46で表される。各特徴リストの長さNは画像ごとに異なってもよい。各特徴リスト46に対応する文書画像41が、組S={1,2,...,C}の事前に特定したC個のカテゴリの1つに割り当てられる。一実施形態では、カテゴリは最尤法によって割り当てられる。観察される画像のカテゴリCMLは、以下の式で求められる。
式中、cはあるカテゴリを表す整数をさし0<c≦C、CMLは最尤度カテゴリをさす。
画像カテゴリは、カテゴリ条件付き特徴尤度関数p(x|c)として識別される。各特徴xは測定値または属性のD次元ベクトル[xn1,xn2,...,xnD]である。一実施形態では、カテゴリごとに、尤度関数p(x|c)を潜在条件付き独立確率分布モデルを用いてK個の独立成分の混合としてモデリングする。これは以下の式で表わされる。
式中、kは0≦k≦Kの独立成分を示し、dは1≦d≦Dの次元を示す。従って、xndは特徴xのd番目の次元の値を示し、p(c)は特徴がk番目の混合成分から生成されるカテゴリ条件付き確率を示し、p(x|c)は、特徴xのd番目の次元の値がxnDとなるカテゴリおよび潜在条件付き尤度を示す。尤度関数は、属性の値が連続している場合は、ガウシアン、指数、ベータ、ガンマ、およびラプラス分布等の密度から構成され、属性が有限個の値からなる離散的なものである場合は、多項確率関数として分布から構成される。
各特徴リスト46中の特徴発火45は、分散図等を用いてポイントとして図式的に表すことができるが、表示または視覚化が可能な他の形式も可能である。図6は、特徴リスト46の特徴発火ポイントを示す分散図70の一例である。x軸およびy軸はそれぞれ文書画像41のx座標およびy座標を示す。
2次元で見られるようにするため、分散図70はビジネスレターにおける等の文書画像41について、各特徴発火45のx座標点とy座標点のみを示す。本例では、各点は文書画像41でのグループ分けに基づいて6つのグループ0≦k≦5に分けられる。潜在条件付き独立モデルは以下の式で表される。
従って、5つの次元では潜在条件付き独立モデルは以下の式で表される。
式中、fは特徴の種類を示し、wは特徴の幅の対数を示し、hは特徴の高さの対数を示す。モデルを適用して、カテゴリcについての1つの潜在条件付き独立式を作ると、モデルは次のようになる。
各モデルをトレーニングするには期待最大化アルゴリズムを用いることができる。
本発明の一実施形態に従い、画像中に生じる特徴の生成モデルによって分類を実行するシステムを示すブロック図である。 本発明の一実施形態に従い、画像中に生じる特徴の生成モデルによって分類を実行する方法を示す工程フロー図である。 図2の方法で使用する特徴リストを生成するルーチンを示す工程フロー図である。 ハール(Haar)フィルタの例を示すブロック図である。 特徴リストのエントリを保存するための5字組の構造構成の一例を示すデータ構造図である。 特徴リスト用の特徴発火ポイントの一例を示す分散図である。
符号の説明
11 分類器、12 カテゴリ、13 コンピュータシステム、14 ディジタル文書画像、15 動作、16 事前印刷文書、17 絵画データ、18 混合データ、19 インデックス付け、20 検索、21 保存、22 統合、23 タスク割り当て。

Claims (6)

  1. 画像中に生じる特徴の生成モデルによって分類を行うシステムであって、
    それぞれ1つのカテゴリに割り当てられた複数のトレーニング画像中に生じる特徴の、カテゴリ条件付き確率分布を記憶させたものと、
    分類器とを含み、前記分類器は、
    未分類の画像中に生じる特徴を特定する特徴識別部と、
    前記特定した特徴について、各カテゴリの前記カテゴリ条件付き確率分布を用いてカテゴリ条件付き尤度を決定する尤度評価部と、
    前記未分類の画像を、前記カテゴリ条件付き尤度に基づいて1つのカテゴリに割り当てるカテゴリ分類部とを含む、システム。
  2. 請求項1に記載のシステムにおいて、前記特定された各特徴は可変長の特徴リストの一要素として表され、各要素は1つ以上の次元を含む選択された特徴空間の値を含み、前記各次元に沿った測定値は連続値または離散値であるシステム。
  3. 請求項2に記載のシステムにおいて、前記選択された特徴空間は5つの次元をもち、各特徴要素xは以下の5字組
    で表すことができ、式中、nは0<n≦N等の整数、Nは特徴の総数、fは特徴の種類、xおよびyは未分類画像中の特徴の座標を含み、wおよびhはそれぞれ特徴の幅および高さ、またはその対数を含むシステム。
  4. 請求項1に記載のシステムにおいて、前記カテゴリ条件付き尤度は、前記未分類画像の特定された各特徴のカテゴリ条件付き確率の積として求められ、前記システムはさらに、
    発生の各条件付き尤度p(x|c)を以下の式で表される潜在条件付き独立分布モデルとして評価する分析部を含み、
    式中、kは独立成分に対する指標0≦k≦K、dは次元のインデックス1<d<D、xndは特徴xのd番目の次元の値、p(c)は特徴がk番目の独立成分から生成されるカテゴリ条件付き確率、p(x|c)は特徴xがそのd番目の次元の値としてxndをもつカテゴリおよび潜在条件付き尤度を示し、
    前記次元は、各カテゴリおよび潜在条件付き尤度が連続次元ごとに一変量のガウス密度としてモデリングされる連続属性値、および各カテゴリおよび潜在条件付き尤度が離散次元ごとに多項確率関数としてモデリングされる離散有限属性値のいずれか一方であるシステム。
  5. 請求項4に記載のシステムであって、
    各発生の確率p(x|c)を以下の式で表される潜在条件付き独立分布モデルとして近似する推定部をさらに含み、
    式中、kは独立成分に対するインデックス0≦k≦K、dは次元のインデックス1≦d≦D、xndは特徴xのd番目の次元の値、p(c)は特徴がk番目の独立成分から生成されるカテゴリ条件付き確率、p(x|c)は特徴xがそのd番目の次元の値としてxndをもつカテゴリおよび潜在条件付き確率を示すシステム。
  6. 請求項1に記載のシステムにおいて、カテゴリ条件付き尤度が信頼閾値を満たせば、前記未分類画像に1つのカテゴリラベルが割り当てられ、信頼閾値に達しない場合は、前記未分類画像には未承認または未知のカテゴリラベルが割り当てられるシステム。
JP2007328481A 2006-12-22 2007-12-20 画像中に生じる特徴の生成モデルによる分類 Pending JP2008159056A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/644,776 US8000538B2 (en) 2006-12-22 2006-12-22 System and method for performing classification through generative models of features occurring in an image

Publications (1)

Publication Number Publication Date
JP2008159056A true JP2008159056A (ja) 2008-07-10

Family

ID=39247129

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007328481A Pending JP2008159056A (ja) 2006-12-22 2007-12-20 画像中に生じる特徴の生成モデルによる分類

Country Status (3)

Country Link
US (1) US8000538B2 (ja)
EP (1) EP1936536B1 (ja)
JP (1) JP2008159056A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8509524B2 (en) 2009-11-26 2013-08-13 Fujitsu Limited Device, method and program on a storage medium to adjust dictionary data related to objects with specific features
US9218531B2 (en) 2013-01-11 2015-12-22 Fuji Xerox Co., Ltd. Image identification apparatus, image identification method, and non-transitory computer readable medium

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009090804A1 (ja) * 2008-01-18 2009-07-23 Nikon Corporation 画像群の標題付与装置、画像のグループ化装置、画像群の代表画像決定装置、画像表示装置、カメラおよび画像表示プログラム
US9842331B2 (en) 2008-01-18 2017-12-12 Mitek Systems, Inc. Systems and methods for mobile image capture and processing of checks
US9292737B2 (en) * 2008-01-18 2016-03-22 Mitek Systems, Inc. Systems and methods for classifying payment documents during mobile image processing
US8983170B2 (en) 2008-01-18 2015-03-17 Mitek Systems, Inc. Systems and methods for developing and verifying image processing standards for mobile deposit
US8260062B2 (en) * 2009-05-07 2012-09-04 Fuji Xerox Co., Ltd. System and method for identifying document genres
US10891475B2 (en) 2010-05-12 2021-01-12 Mitek Systems, Inc. Systems and methods for enrollment and identity management using mobile imaging
US8503769B2 (en) 2010-12-28 2013-08-06 Microsoft Corporation Matching text to images
US20120330880A1 (en) * 2011-06-23 2012-12-27 Microsoft Corporation Synthetic data generation
US10042836B1 (en) * 2012-04-30 2018-08-07 Intuit Inc. Semantic knowledge base for tax preparation
US9536139B2 (en) 2013-03-15 2017-01-03 Mitek Systems, Inc. Systems and methods for assessing standards for mobile image quality
US11250203B2 (en) 2013-08-12 2022-02-15 Microsoft Technology Licensing, Llc Browsing images via mined hyperlinked text snippets
WO2017069741A1 (en) * 2015-10-20 2017-04-27 Hewlett-Packard Development Company, L.P. Digitized document classification
US11475310B1 (en) * 2016-11-29 2022-10-18 Perceive Corporation Training network to minimize worst-case error
US11227065B2 (en) 2018-11-06 2022-01-18 Microsoft Technology Licensing, Llc Static data masking
US11436853B1 (en) * 2019-03-25 2022-09-06 Idemia Identity & Security USA LLC Document authentication
US20220318497A1 (en) * 2021-03-30 2022-10-06 Microsoft Technology Licensing, Llc Systems and methods for generating dialog trees
KR102670389B1 (ko) * 2021-10-13 2024-05-29 주식회사 포티투마루 텍스트의 데이터 구조화 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005096178A1 (en) * 2004-03-31 2005-10-13 Isis Innovation Limited Method and apparatus for retrieving visual object categories from a database containing images

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7194134B2 (en) * 2001-01-02 2007-03-20 Microsoft Corporation Hierarchical, probabilistic, localized, semantic image classifier
US7305132B2 (en) * 2003-11-19 2007-12-04 Mitsubishi Electric Research Laboratories, Inc. Classification in likelihood spaces
US20050223031A1 (en) * 2004-03-30 2005-10-06 Andrew Zisserman Method and apparatus for retrieving visual object categories from a database containing images

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005096178A1 (en) * 2004-03-31 2005-10-13 Isis Innovation Limited Method and apparatus for retrieving visual object categories from a database containing images

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8509524B2 (en) 2009-11-26 2013-08-13 Fujitsu Limited Device, method and program on a storage medium to adjust dictionary data related to objects with specific features
US9218531B2 (en) 2013-01-11 2015-12-22 Fuji Xerox Co., Ltd. Image identification apparatus, image identification method, and non-transitory computer readable medium

Also Published As

Publication number Publication date
US20080152238A1 (en) 2008-06-26
EP1936536B1 (en) 2015-06-24
EP1936536A2 (en) 2008-06-25
EP1936536A3 (en) 2012-05-09
US8000538B2 (en) 2011-08-16

Similar Documents

Publication Publication Date Title
JP2008159056A (ja) 画像中に生じる特徴の生成モデルによる分類
US10853638B2 (en) System and method for extracting structured information from image documents
JP6831480B2 (ja) テキスト検出分析方法、装置及びデバイス
USRE47889E1 (en) System and method for segmenting text lines in documents
US8045798B2 (en) Features generation and spotting methods and systems using same
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
US8165410B2 (en) Bags of visual context-dependent words for generic visual categorization
US8442319B2 (en) System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking
US8566349B2 (en) Handwritten document categorizer and method of training
US8315465B1 (en) Effective feature classification in images
Bhunia et al. Text recognition in scene image and video frame using color channel selection
JP2008097607A (ja) 入力イメージを自動的に分類する方法
JP2001167131A (ja) 文書シグネチュアを使用する文書の自動分類方法
CN109685065B (zh) 试卷内容自动分类的版面分析方法、系统
JP7396568B2 (ja) 帳票レイアウト解析装置、その解析プログラムおよびその解析方法
CN110008365B (zh) 一种图像处理方法、装置、设备及可读存储介质
CN111507344A (zh) 从图像中识别出文字的方法和装置
Qi et al. A new method for visual stylometry on impressionist paintings
CN112508000B (zh) 一种用于ocr图像识别模型训练数据生成的方法及设备
Banerjee et al. A system for handwritten and machine-printed text separation in Bangla document images
CN110796134B (zh) 一种强噪声复杂背景图像中的汉字组词方法
JP5413156B2 (ja) 画像処理プログラム及び画像処理装置
US11335108B2 (en) System and method to recognise characters from an image
Calvo-Zaragoza et al. Pixelwise classification for music document analysis
WO2021140682A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120416

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120724