JP5149259B2 - ランレングスヒストグラムを用いて文書の表現を生成する方法及び装置 - Google Patents
ランレングスヒストグラムを用いて文書の表現を生成する方法及び装置 Download PDFInfo
- Publication number
- JP5149259B2 JP5149259B2 JP2009235288A JP2009235288A JP5149259B2 JP 5149259 B2 JP5149259 B2 JP 5149259B2 JP 2009235288 A JP2009235288 A JP 2009235288A JP 2009235288 A JP2009235288 A JP 2009235288A JP 5149259 B2 JP5149259 B2 JP 5149259B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- histogram
- document
- run
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
オプションとして、入力された画像を、以下に示す正規化思慮のうちの1以上を実行することで正規化してもよい。
白黒のハードコピー文書の場合ですら、スキャンすると、スキャナは画素についてのグレーレベルが毎回異なったものになり得る。8ビットシステムでは、256の離散的なグレーレベルが認識される。すなわち、デジタル画像のピクセル値は0から255にわたる。複数の色分版(例えばRGBスキャナの場合は3)を持つカラー画像の場合、各色分版が256の離散的な画素値を有する。したがって、デジタル符号化画像はすでに量子化(グレーレベルについて256レベルの量子化、カラー画像については2563=16,777,216色)されているものの、ランレングス符号化は比較的レベル数が少ない場合に効率がよい。白黒文書の画像については、量子化レベルを2にすることが有益であり,これは画像を二値化することと等価である。カラー画像については、1つの実装では、色分版のうちの1つだけ(例えばRだけ)を考慮し、画素値の範囲をNレベルへと量子化する。ここで、Nは正の整数であり、例えば2〜10の値である。画像中の各画素は、N個の量子化レベルのうちの1つにより表現されることとなる。量子化レベルのレベル数を多くするほど情報はより多くなるが、ノイズが増える結果を招く可能性があることを理解されたい。RGBのうちの1つのみを用いた初期の試験ではよい結果が得られた。別の例では、2又はそれ以上の色分版を量子化する。例えば、RGB成分の各々に2つの色値量子レベルの1つを割り当てれば、N=2×2×2=8の量子化値を得られる。
図4に例示したように、次に画像中の領域50の集合が抽出される。それら領域は画像を区分することにより得られる。画像を規則的に、例えば4×4の領域へと区分してもよい。またこの代わりに、例えばすべての領域が(ほぼ)同じ数の画素を有することを保証する区分処理など、不規則的な区分を行ってもよい。
各領域50にて、ランレングスヒストグラムが抽出される。詳細には、ランレングスは、当該領域内の各画素ラインを選ばれた方向にスキャンして画素のランを識別することにより抽出される。ランは、選ばれた方向(例えば水平、垂直、対角線、反対角線)に連続する同じ色値を持つ画素の連鎖のことである。ランの長さ(ランレングス)は、その連鎖が含む画素の数である。二値画像の場合、各ランはそれぞれすべて黒画素(量子化値=0)であるか、又はすべて白画素(量子化値=1)である。より一般的には、2以上の色値レベルが用いられる場合、1つのラン内の画素はすべて同じ量子化値を持つ。ランレングスヒストグラムは、M個のランレングス(ラン長)の各々についてのランの数のヒストグラムである。一例では,ヒストグラム・ビンの数を減らすためにランの長さを量子化する。量子化は、例えば線形のものでよく、例えばあり得るランレングスの範囲を同サイズの複数の間隔へと分割するものでよい。あるいは、量子化は、対数的な分割その他不均一な分割により発生頻度の高いランレングスをより弁別できるようにするものでもよい。対数的な方法では、量子化は例えば以下のようになる。
1)領域のヒストグラムを、N×M×Lの値(この例では80)の総和が1となるように全体的に正規化する。
2)各方向及び各画素量子化値(例えば黒か白か)に対応するサブヒストグラム群を、それぞれ独立に正規化する。
3)各方向を個別に正規化する。すなわち、N×Mの値の総和が1(この例では、黒と白のサブヒストグラムに対応する2×10の値の総和が1)になるように正規化する。
最終的な画像表現22は、各領域に対応する領域ヒストグラムを単に連結(結合)したものでよい。あるいは、例えば主成分解析などを用いることで、固定の要素数まで次元を減らしてもよい。
1.画像検索:2つの画像同士の距離は、それら画像のヒストグラム表現22同士の距離として定義することができる。ヒストグラム同士の類似度/距離についての適切な尺度としては、内積(dot product)、バタチャリヤ(Bhattacharyya)距離、カルバック-ライブラー情報量(Kullback-Leibler divergence)(対称化したものであっても、そうでなくてもよい)、ジェンセン-シャノン情報量(Jensen-Shannon divergence)、カイ二乗距離等があり、これらは例えば類似度を計算するのに用いてよい。例えば、画像18の大きな集合S、及びそれら画像に対応するヒストグラム表現22の集まりが、メモリに格納される。ユーザは、新たな画像を入力するか、又は前述の集合の中から1つを選び、それをターゲット画像として用いる。ターゲット画像のヒストグラム表現に対する各画像のヒストグラム表現の類似度に基づき、その集合の中から類似画像を自動的に検索される。例えば、この装置は、閾値以上の類似度を持つヒストグラム表現を持つ画像を検索する。また別の例では、類似度値が最も高い10個(又は他の選ばれた数の)画像を集合から検索してもよい。画像検索のためのコンポーネントは、画像表現生成器内に含まれていてもよいし、画像表現生成器の別のコンポーネントであってもよいし、別のコンピュータであってもよい。上述した方法の例は、このアプリケーションに有効であることがわかった。
確率的潜在意味論解析(PLSA: Probability Latent Semantic Analysis)クラスタリングなどのような非負行列因子分解(non-negative matrix factorization)技術に適している。コンピュータ10、又は通信可能に接続されたコンピュータは、画像クラスタリングのためのコンポーネントを有していてもよい。そのようなコンポーネントは、集合内の画像同士の距離の計算結果の行列を生成してもよい。この行列は、画像群をクラスタリングするために、例えばPLSAを用いて処理される。
納税フォーム、IDカード、契約書及び医療フォームなどの文書画像を含んだデータベースについてこの方法をテストした。この方法が文書を分類する能力をシミュレートするために、データベース内の画像群のうちの一部のものを、それぞれ一組の分類(クラス)のうちの1つに人手によりカテゴリ分けした。これらラベル付けした画像は、(スパースロジスティック回帰により)分類器に学習させるのに用いた。そして、学習済みの分類器をラベル付けされていない文書画像を分類するのに用い、割り当てられた分類を人手で精査することによりこの方法の精度を評価した。以下の3つのデータベースについての結果を例として示す。
Claims (4)
- 画像の表現を生成する方法であって、
表現を生成すべき画像を受け取るステップと、
前記画像を複数の領域に区分するステップと、
前記画像の前記複数の領域の各々についてランレングスヒストグラムを計算するステップと、
前記ランレングスヒストグラムに基づき画像表現を生成するステップであって、前記複数の領域の前記ランレングスヒストグラムを連結する処理を行うステップと、
前記画像表現を出力するステップと、
を有する方法。 - 請求項1に記載の方法であって、前記複数の領域は、複数の異なるスケールでのものであり、それら複数の領域のいくつかが少なくとも部分的に重なり合うように区分されている、ことを特徴とする方法。
- 請求項1又は2に記載の方法であって、前記ランレングスヒストグラムの計算では、複数の画素色値の量子化レベルの各々についてランレングスサブヒストグラムを計算し、それらサブヒストグラムを組み合わせる、ことを特徴とする方法。
- 文書画像の画像表現を生成するためのコンピュータ装置であって、
受け取った文書画像を格納するメモリと、
2以上の異なるスケールで、前記文書画像内の複数の領域を、それら複数の領域のいくつかが少なくとも部分的に重なり合うように抽出する領域抽出コンポーネントと、
前記文書画像の前記各領域についてランレングスヒストグラムを抽出し、それら異なる各領域に対応するランレングスヒストグラムを組み合わせるヒストグラム生成コンポーネントと、
組み合わされたランレングスヒストグラムに基づく画像表現を出力する出力コンポーネントと、
前記各コンポーネントを実行するプロセッサと、
を備えるコンピュータ装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/251,689 | 2008-10-15 | ||
US12/251,689 US8249343B2 (en) | 2008-10-15 | 2008-10-15 | Representing documents with runlength histograms |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010097609A JP2010097609A (ja) | 2010-04-30 |
JP2010097609A5 JP2010097609A5 (ja) | 2012-11-22 |
JP5149259B2 true JP5149259B2 (ja) | 2013-02-20 |
Family
ID=41557524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009235288A Expired - Fee Related JP5149259B2 (ja) | 2008-10-15 | 2009-10-09 | ランレングスヒストグラムを用いて文書の表現を生成する方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8249343B2 (ja) |
EP (1) | EP2178028A3 (ja) |
JP (1) | JP5149259B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10115036B2 (en) | 2016-06-15 | 2018-10-30 | Abbyy Development Llc | Determining the direction of rows of text |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8705736B2 (en) * | 2008-12-31 | 2014-04-22 | Pitney Bowes Inc. | Image encryption for print-and-scan channels using pixel position permutation |
US9269154B2 (en) * | 2009-01-13 | 2016-02-23 | Futurewei Technologies, Inc. | Method and system for image processing to classify an object in an image |
US9233399B2 (en) | 2010-02-09 | 2016-01-12 | Xerox Corporation | Document separation by document sequence reconstruction based on information capture |
US9531906B2 (en) * | 2010-06-11 | 2016-12-27 | Xerox Corporation | Method for automatic conversion of paper records to digital form |
US8332429B2 (en) | 2010-06-22 | 2012-12-11 | Xerox Corporation | Photography assistant and method for assisting a user in photographing landmarks and scenes |
US8532399B2 (en) | 2010-08-20 | 2013-09-10 | Xerox Corporation | Large scale image classification |
US8566746B2 (en) | 2010-08-30 | 2013-10-22 | Xerox Corporation | Parameterization of a categorizer for adjusting image categorization and retrieval |
US8553045B2 (en) | 2010-09-24 | 2013-10-08 | Xerox Corporation | System and method for image color transfer based on target concepts |
US8731317B2 (en) | 2010-09-27 | 2014-05-20 | Xerox Corporation | Image classification employing image vectors compressed using vector quantization |
US8369616B2 (en) | 2010-10-20 | 2013-02-05 | Xerox Corporation | Chromatic matching game |
CN102467739A (zh) * | 2010-10-29 | 2012-05-23 | 夏普株式会社 | 图像判断装置、图像提取装置以及图像判断方法 |
US8370338B2 (en) | 2010-12-03 | 2013-02-05 | Xerox Corporation | Large-scale asymmetric comparison computation for binary embeddings |
US8514470B2 (en) * | 2010-12-08 | 2013-08-20 | Xerox Corporation | Digital printing control using a spectrophotometer |
US8447767B2 (en) | 2010-12-15 | 2013-05-21 | Xerox Corporation | System and method for multimedia information retrieval |
US8379974B2 (en) | 2010-12-22 | 2013-02-19 | Xerox Corporation | Convex clustering for chromatic content modeling |
US9058611B2 (en) | 2011-03-17 | 2015-06-16 | Xerox Corporation | System and method for advertising using image search and classification |
US8594385B2 (en) | 2011-04-19 | 2013-11-26 | Xerox Corporation | Predicting the aesthetic value of an image |
US8712157B2 (en) | 2011-04-19 | 2014-04-29 | Xerox Corporation | Image quality assessment |
US8774515B2 (en) | 2011-04-20 | 2014-07-08 | Xerox Corporation | Learning structured prediction models for interactive image labeling |
JP2013008270A (ja) * | 2011-06-27 | 2013-01-10 | Renesas Electronics Corp | 並列演算装置及びマイクロコンピュータ |
US9298982B2 (en) | 2011-07-26 | 2016-03-29 | Xerox Corporation | System and method for computing the visual profile of a place |
US8813111B2 (en) | 2011-08-22 | 2014-08-19 | Xerox Corporation | Photograph-based game |
US8533204B2 (en) | 2011-09-02 | 2013-09-10 | Xerox Corporation | Text-based searching of image data |
US8699789B2 (en) | 2011-09-12 | 2014-04-15 | Xerox Corporation | Document classification using multiple views |
US8824797B2 (en) | 2011-10-03 | 2014-09-02 | Xerox Corporation | Graph-based segmentation integrating visible and NIR information |
US8489585B2 (en) | 2011-12-20 | 2013-07-16 | Xerox Corporation | Efficient document processing system and method |
US9076076B1 (en) * | 2012-03-30 | 2015-07-07 | Google Inc. | Image similarity determination |
US9075824B2 (en) | 2012-04-27 | 2015-07-07 | Xerox Corporation | Retrieval system and method leveraging category-level labels |
US8666992B2 (en) | 2012-06-15 | 2014-03-04 | Xerox Corporation | Privacy preserving method for querying a remote public service |
US8892562B2 (en) | 2012-07-26 | 2014-11-18 | Xerox Corporation | Categorization of multi-page documents by anisotropic diffusion |
US8873812B2 (en) | 2012-08-06 | 2014-10-28 | Xerox Corporation | Image segmentation using hierarchical unsupervised segmentation and hierarchical classifiers |
US8879796B2 (en) | 2012-08-23 | 2014-11-04 | Xerox Corporation | Region refocusing for data-driven object localization |
US9092667B2 (en) * | 2012-08-27 | 2015-07-28 | Symbol Technologies, Llc | Arrangement for and method of reading forms in correct orientation by image capture |
US9008429B2 (en) | 2013-02-01 | 2015-04-14 | Xerox Corporation | Label-embedding for text recognition |
US8879103B2 (en) | 2013-03-04 | 2014-11-04 | Xerox Corporation | System and method for highlighting barriers to reducing paper usage |
US9384423B2 (en) | 2013-05-28 | 2016-07-05 | Xerox Corporation | System and method for OCR output verification |
US9082047B2 (en) | 2013-08-20 | 2015-07-14 | Xerox Corporation | Learning beautiful and ugly visual attributes |
US9412031B2 (en) | 2013-10-16 | 2016-08-09 | Xerox Corporation | Delayed vehicle identification for privacy enforcement |
US9779284B2 (en) | 2013-12-17 | 2017-10-03 | Conduent Business Services, Llc | Privacy-preserving evidence in ALPR applications |
US9424492B2 (en) | 2013-12-27 | 2016-08-23 | Xerox Corporation | Weighting scheme for pooling image descriptors |
US9158971B2 (en) | 2014-03-03 | 2015-10-13 | Xerox Corporation | Self-learning object detectors for unlabeled videos using multi-task learning |
US9639806B2 (en) | 2014-04-15 | 2017-05-02 | Xerox Corporation | System and method for predicting iconicity of an image |
US9589231B2 (en) | 2014-04-28 | 2017-03-07 | Xerox Corporation | Social medical network for diagnosis assistance |
WO2016035020A2 (en) * | 2014-09-02 | 2016-03-10 | Koninklijke Philips N.V. | Image fingerprinting |
US9298981B1 (en) * | 2014-10-08 | 2016-03-29 | Xerox Corporation | Categorizer assisted capture of customer documents using a mobile device |
US9443164B2 (en) | 2014-12-02 | 2016-09-13 | Xerox Corporation | System and method for product identification |
US9216591B1 (en) | 2014-12-23 | 2015-12-22 | Xerox Corporation | Method and system for mutual augmentation of a motivational printing awareness platform and recommendation-enabled printing drivers |
US9367763B1 (en) | 2015-01-12 | 2016-06-14 | Xerox Corporation | Privacy-preserving text to image matching |
US10055479B2 (en) * | 2015-01-12 | 2018-08-21 | Xerox Corporation | Joint approach to feature and document labeling |
US9626594B2 (en) | 2015-01-21 | 2017-04-18 | Xerox Corporation | Method and system to perform text-to-image queries with wildcards |
US9600738B2 (en) | 2015-04-07 | 2017-03-21 | Xerox Corporation | Discriminative embedding of local color names for object retrieval and classification |
US9443320B1 (en) | 2015-05-18 | 2016-09-13 | Xerox Corporation | Multi-object tracking with generic object proposals |
US9619701B2 (en) | 2015-05-20 | 2017-04-11 | Xerox Corporation | Using motion tracking and image categorization for document indexing and validation |
EP3252669B1 (en) | 2016-06-02 | 2018-12-12 | HP Printing Korea Co., Ltd. | Method and device for classifying scanned documents |
US10438000B1 (en) * | 2017-09-22 | 2019-10-08 | Symantec Corporation | Using recognized backup images for recovery after a ransomware attack |
EP3503048B1 (de) * | 2017-12-22 | 2021-03-10 | CI Tech Sensors AG | Verfahren und vorrichtung zum prüfen eines wertdokuments |
US10725870B1 (en) | 2018-01-02 | 2020-07-28 | NortonLifeLock Inc. | Content-based automatic backup of images |
CN112489046B (zh) * | 2020-12-25 | 2023-01-31 | 上海深博医疗器械有限公司 | 柔性扫描图像的ai辅助测量体积补偿方法及装置 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4668995A (en) * | 1985-04-12 | 1987-05-26 | International Business Machines Corporation | System for reproducing mixed images |
US4949392A (en) | 1988-05-20 | 1990-08-14 | Eastman Kodak Company | Document recognition and automatic indexing for optical character recognition |
US5038381A (en) | 1988-07-11 | 1991-08-06 | New Dest Corporation | Image/text filtering system and method |
US5452374A (en) * | 1992-04-06 | 1995-09-19 | Ricoh Corporation | Skew detection and correction of a document image representation |
US5335290A (en) | 1992-04-06 | 1994-08-02 | Ricoh Corporation | Segmentation of text, picture and lines of a document image |
US5592226A (en) * | 1994-01-26 | 1997-01-07 | Btg Usa Inc. | Method and apparatus for video data compression using temporally adaptive motion interpolation |
US5822454A (en) | 1995-04-10 | 1998-10-13 | Rebus Technology, Inc. | System and method for automatic page registration and automatic zone detection during forms processing |
US5867597A (en) * | 1995-09-05 | 1999-02-02 | Ricoh Corporation | High-speed retrieval by example |
JPH09120443A (ja) * | 1995-10-26 | 1997-05-06 | Canon Inc | 画像処理方法とその装置 |
US5933823A (en) * | 1996-03-01 | 1999-08-03 | Ricoh Company Limited | Image database browsing and query using texture analysis |
GB9605207D0 (en) * | 1996-03-12 | 1996-05-15 | Ibm | Address block location |
KR100207426B1 (ko) * | 1996-05-08 | 1999-07-15 | 전주범 | 무늬의 크기와 방향성을 이용한 텍스쳐 분류 장치 |
JPH09319764A (ja) * | 1996-05-31 | 1997-12-12 | Matsushita Electric Ind Co Ltd | キーワード生成装置及び文書検索装置 |
US6141464A (en) | 1998-03-30 | 2000-10-31 | Xerox Corporation | Robust method for finding registration marker positions |
US6363381B1 (en) * | 1998-11-03 | 2002-03-26 | Ricoh Co., Ltd. | Compressed document matching |
US6922699B2 (en) * | 1999-01-26 | 2005-07-26 | Xerox Corporation | System and method for quantitatively representing data objects in vector space |
US6564202B1 (en) * | 1999-01-26 | 2003-05-13 | Xerox Corporation | System and method for visually representing the contents of a multiple data object cluster |
US6941321B2 (en) * | 1999-01-26 | 2005-09-06 | Xerox Corporation | System and method for identifying similarities among objects in a collection |
US6397213B1 (en) * | 1999-05-12 | 2002-05-28 | Ricoh Company Ltd. | Search and retrieval using document decomposition |
US6542635B1 (en) * | 1999-09-08 | 2003-04-01 | Lucent Technologies Inc. | Method for document comparison and classification using document image layout |
US7162080B2 (en) * | 2001-02-23 | 2007-01-09 | Zoran Corporation | Graphic image re-encoding and distribution system and method |
US7248737B2 (en) * | 2001-10-02 | 2007-07-24 | Siemens Corporate Research, Inc. | Page decomposition using local orthogonal transforms and a map optimization |
US7053939B2 (en) * | 2001-10-17 | 2006-05-30 | Hewlett-Packard Development Company, L.P. | Automatic document detection method and system |
US7124149B2 (en) | 2002-12-13 | 2006-10-17 | International Business Machines Corporation | Method and apparatus for content representation and retrieval in concept model space |
US7475061B2 (en) * | 2004-01-15 | 2009-01-06 | Microsoft Corporation | Image-based document indexing and retrieval |
JP2006023834A (ja) * | 2004-07-06 | 2006-01-26 | Canon Inc | 画像処理装置及びその制御方法、プログラム |
US7756341B2 (en) | 2005-06-30 | 2010-07-13 | Xerox Corporation | Generic visual categorization method and system |
JP4859025B2 (ja) * | 2005-12-16 | 2012-01-18 | 株式会社リコー | 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体 |
US7680341B2 (en) | 2006-05-05 | 2010-03-16 | Xerox Corporation | Generic visual classification with gradient components-based dimensionality enhancement |
US7885466B2 (en) | 2006-09-19 | 2011-02-08 | Xerox Corporation | Bags of visual context-dependent words for generic visual categorization |
JP4960817B2 (ja) * | 2007-09-19 | 2012-06-27 | キヤノン株式会社 | 画像処理装置、および画像処理方法 |
-
2008
- 2008-10-15 US US12/251,689 patent/US8249343B2/en active Active
-
2009
- 2009-10-08 EP EP09172491.4A patent/EP2178028A3/en not_active Withdrawn
- 2009-10-09 JP JP2009235288A patent/JP5149259B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10115036B2 (en) | 2016-06-15 | 2018-10-30 | Abbyy Development Llc | Determining the direction of rows of text |
Also Published As
Publication number | Publication date |
---|---|
US8249343B2 (en) | 2012-08-21 |
US20100092084A1 (en) | 2010-04-15 |
EP2178028A3 (en) | 2013-11-27 |
EP2178028A2 (en) | 2010-04-21 |
JP2010097609A (ja) | 2010-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5149259B2 (ja) | ランレングスヒストグラムを用いて文書の表現を生成する方法及び装置 | |
US8699789B2 (en) | Document classification using multiple views | |
US9542752B2 (en) | Document image compression method and its application in document authentication | |
US8005300B2 (en) | Image search system, image search method, and storage medium | |
US8380647B2 (en) | Training a classifier by dimension-wise embedding of training data | |
US8111923B2 (en) | System and method for object class localization and semantic class based image segmentation | |
US8520941B2 (en) | Method and system for document image classification | |
US9910829B2 (en) | Automatic document separation | |
US7593961B2 (en) | Information processing apparatus for retrieving image data similar to an entered image | |
US8594431B2 (en) | Adaptive partial character recognition | |
US8086039B2 (en) | Fine-grained visual document fingerprinting for accurate document comparison and retrieval | |
US8462394B2 (en) | Document type classification for scanned bitmaps | |
CN100559387C (zh) | 图像处理装置和方法,图像形成装置 | |
US10796144B2 (en) | Method and device for classifying scanned documents | |
Attivissimo et al. | An automatic reader of identity documents | |
US20200387701A1 (en) | On-device partial recognition systems and methods | |
Padma et al. | I DENTIFICATION OF T ELUGU, D EVANAGARI AND E NGLISH S CRIPTS U SING D ISCRIMINATING | |
Aparna et al. | A complete OCR system development of Tamil magazine documents | |
Dey et al. | A comparative study of margin noise removal algorithms on marnr: A margin noise dataset of document images | |
RU2630743C1 (ru) | Способ и устройство классификации изображений печатных копий документов и система сортировки печатных копий документов | |
Dhandra et al. | Classification of Document Image Components | |
JP2005316813A (ja) | 画像処理方法、画像処理プログラムおよび画像処理装置 | |
US20240202517A1 (en) | Document processing with efficient type-of-source classification | |
Lu et al. | Document Image Understanding: Computational Image Processing in the Cultural Heritage Sector | |
JP3074210B2 (ja) | 紙文書画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121005 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121005 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20121005 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20121023 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121129 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |