JP5659563B2 - 識別方法、識別装置およびコンピュータプログラム - Google Patents
識別方法、識別装置およびコンピュータプログラム Download PDFInfo
- Publication number
- JP5659563B2 JP5659563B2 JP2010129890A JP2010129890A JP5659563B2 JP 5659563 B2 JP5659563 B2 JP 5659563B2 JP 2010129890 A JP2010129890 A JP 2010129890A JP 2010129890 A JP2010129890 A JP 2010129890A JP 5659563 B2 JP5659563 B2 JP 5659563B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- identifying
- pixel
- pixels
- portions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 95
- 238000004590 computer program Methods 0.000 title claims description 6
- 238000012015 optical character recognition Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 19
- 238000012937 correction Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 13
- 238000005516 engineering process Methods 0.000 claims description 12
- 230000000873 masking effect Effects 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 4
- 230000000877 morphologic effect Effects 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000003628 erosive effect Effects 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 claims 1
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 238000009499 grossing Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 9
- 238000003384 imaging method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008602 contraction Effects 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
本発明の第2の態様にかかる画像識別システムは、ドキュメントのページを表す画像を受信する受信手段と、前記ページ内のテキストオブジェクトを識別するために前記画像を分析する分析手段と、前記ページ中のテキストオブジェクトを含む画像領域をマスクしてマスク画像を生成するマスク画像生成手段と、前記マスク画像中の、前記ページ中の少なくとも一つの図画に対応する画素グループを識別する画素グループ識別手段と、一以上の前記画素グループに基づいて前記ページ中の前記少なくとも一つの図画に対応する領域を識別する図画領域識別手段と、前記少なくとも一つの図画に対応する前記領域に関する情報を含む属性情報を、前記図画の各々に対応づけて保存する保存手段と、を備えることを特徴とする。
・ オペレーティングシステム212 様々な基本システムサービスの処理、ハードウェア依存処理を行う。
・ 通信モジュール214 コンピュータシステム200を他のコンピュータに一以上の通信インターフェース204(有線あるいは無線、インターネット、WAN、LAN、都市間通信ネットワークなど)を介して接続する。
・ ユーザインターフェースモジュール216 入力装置208を通じてユーザからのコマンドを受信し、表示デバイス206にユーザインタフェースオブジェクトを生成する。
・ 画像形成モジュール218 画像形成デバイス260のインターフェースを構成する。
・ 図画識別モジュール108 後で詳述するように、ドキュメント中の図画を識別する。
・ ドキュメントページの画像250 識別された図画の領域252と関連づけられたキャプションテキスト254を含む。
・ メタデータ256
なお、図画識別モジュール108は、以下のモジュールを含む。
・ 光学文字認識(OCR)モジュール222 画像中のテキストオブジェクトを識別する。
・ マスキングモジュール224 画像中の領域をマスクする。
・ 二値化モジュール226 所定の条件に応じて画素のカラー値を1あるいは0に設定する。
・ フィルタリングモジュール228 画像を滑らかにする。
・ グループ化モジュール230 画像中の画素をグループ化する。
・ 図画識別モジュール232 グループ化された画素から個々の図画を識別する。
・ メタデータモジュール234 識別された図画のメタデータあるいはメタデータタグを生成、記憶する。
・ ダウンサンプリングモジュール236 画像をダウンサンプリングする。
・ ノイズ除去モジュール238 画像からノイズや装丁用グラフィックスを除去する。
・ 画素削減モジュール240 画像中の画素数を削減する。
104 画像入力システム
106 画像
108 図画識別システム
Claims (19)
- 受信手段がドキュメントのページを表す画像を受信し、
図画領域識別手段が前記画像の複数のキャプションを識別し、
前記図画領域識別手段が前記画像の部分の各々を識別し、
前記図画領域識別手段が前記画像の部分の各々が少なくとも前記画像の複数のキャプションの数及び位置に基づいて複数の図画を含むことを識別し、
保存手段が前記複数の図画のメタデータタグを保存し、
前記図画領域識別手段が、前記画像の部分の各々が少なくとも前記画像の複数のキャプションの数及び位置に基づいて複数の図画を含むことを識別することは、
一以上の画素グループへの前記画像の部分の各々の予備画素グループ化を決定し、
前記一以上の画素グループに前記画像の部分の各々の画素をグループ化する画素の修正グループを生成し、
前記画素の修正グループは、予備画素グループのセグメント化不足及び/または過剰セグメント化を修正し、
前記画素の修正グループに基づいて前記複数の図画の識別を行う、
ことを含み、
前記画素の修正グループを生成することは、
前記画像の部分の各々に対応するキャプションの数と、前記予備画素グループの画素グループの数と、を比較し、
前記修正グループの画素グループの数と前記画像の部分の各々に対応するキャプションの数とが等しくなるように、前記画像の部分の各々に対応するキャプションの数と、前記予備画素グループの画素グループの数とが異なる判定に応じて、前記比較に基づいて前記一以上の画素グループを調整する、
ことを含む、
ドキュメント中の図画の識別方法。 - 前記図画領域識別手段が前記複数のキャプションを識別することは、光学文字認識技術(OCR)を用いることを含む、請求項1に記載の識別方法。
- 前記画像の部分の各々を識別することは、前記画像のテキストオブジェクトを含む画像領域をマスクすることを含み、
前記画像のテキストオブジェクトを含む画像領域をマスクすることは、
前記画像の背景色を識別し、前記テキストオブジェクトを含む画像領域内の画素について、前記背景色のカラー値をカラー値として設定する、
ことを含む、
請求項1または2に記載の識別方法。 - 前記画像の部分の各々を識別することは、前記画像のテキストオブジェクトを含む画像領域をマスクすることを含み、
前記画像のテキストオブジェクトを含む画像領域をマスクすることは、
前記画像の背景色を識別し、前記テキストオブジェクトの境界ボックスで囲まれる画像領域内の画素について、前記背景色のカラー値をカラー値として設定する、
ことを含む、
請求項1または2に記載の識別方法。 - 前記画像の部分の各々を識別することに先立って、画像処理手段が、前記画像をダウンサンプリングする、
ことをさらに含む、請求項1〜4のいずれか1項に記載の識別方法。 - 前記画像のダウンサンプリングに先立って、前記画像処理手段が、前記画像を平滑化する、
ことをさらに含む、請求項5に記載の識別方法。 - 前記画像の部分の各々を識別することに先立って、前記画像を二値化する工程をさらに含み、
前記画像を二値化する工程は、
前記画像の背景色のカラー値に関する所定の閾値の範囲内にないカラー値を有する画素に第1のカラー値を設定し、
前記画像の背景色のカラー値に関する所定の閾値の範囲内にあるカラー値を有する画素に第2のカラー値を設定する、
ことを含む、
請求項1〜6のいずれか1項に記載の識別方法。 - 前記第1のカラー値を有する画素の数を削減する、ことをさらに含む請求項7に記載の識別方法。
- 前記第1のカラー値を有する画素の数を削減することは、周囲を前記第1のカラー値を有する画素で囲まれた内部画素を削減することを含む、請求項8に記載の識別方法。
- 前記内部画素を削減することは、モルフォロジ収縮エッジ検出器を用いることを含む、請求項9に記載の識別方法。
- 前記画像の部分の各々を識別することに先立って、前記画像からノイズを除去することをさらに含む、請求項1〜10のいずれか1項に記載の識別方法。
- 前記画像の部分の各々を識別することに先立って、前記画像から装丁用グラフィックスを削減する、ことをさらに含む請求項1〜11のいずれか1項に記載の識別方法。
- 画素グループ識別手段は、倍率変更画像を生成するために、結合コンポーネントの寸法に基づいて前記画像を拡縮し、ノーマライズドカット法を用いて、N個の要素を含むとともに、前記要素kの各々はk個のクラスタを含む(ここでkは0<k≦Nの整数)、倍率変換した前記画像の画素のクラスタリングシーケンスを取得し、
所定の条件を満たすクラスタリングシーケンスの要素を識別する、
請求項1〜12のいずれか1項に記載の識別方法。 - 前記所定の条件を満たすクラスタリングシーケンスの要素を識別することは、クラスタリングのシーケンス中の隣接する要素中のクラスタ間の距離の変化を最大化するクラスタリングシーケンスの要素を識別することを含む、請求項13に記載の識別方法。
- 前記比較に基づく前記一以上の画素グループの調整は、前記予備画素グループの画素の前記一以上の画素グループの一部を結合することを含む、請求項1〜14のいずれか1項に記載の識別方法。
- 前記比較に基づく前記一以上の画素グループの調整は、前記予備画素グループの画素の前記一以上の画素グループの一部を分割することを含む、請求項1〜14のいずれか1項に記載の識別方法。
- 前記画像の複数のキャプションを識別することは、光学文字認識技術を用いて、画像中で、前記画像の部分の各々から所定の距離内に存在するテキストの各々を識別し、
キャプションテキストであることを示す所定のテキストトークンであるかを識別するために、前記テキストの各々に、文字列マッチング処理を行い、
前記テキストの各々の複数のテキストオブジェクトの各々について、前記テキストオブジェクトの各々がキャプション識別条件に適合することに応じて、前記テキストオブジェクトの各々をキャプションとして識別し、
前記キャプション識別条件は、前記テキストオブジェクトの各々が前記所定のテキストトークンの一つを含む、ことを含む、
請求項1〜16のいずれか1項に記載の識別方法。 - ドキュメントのページを表す画像を受信する受信手段と、
前記画像の複数のキャプションを識別し、前記画像の部分の各々を識別し、前記画像の部分の各々が少なくとも前記画像の複数のキャプションの数及び位置に基づいて複数の図画を含むことを識別する図画領域識別手段と、
前記複数の図画のメタデータタグを保存する保存手段と、
を備え、
前記図画領域識別手段が、前記画像の部分の各々が少なくとも前記画像の複数のキャプションの数及び位置に基づいて複数の図画を含むことを識別することは、
一以上の画素グループへの前記画像の部分の各々の予備画素グループ化を決定し、
前記一以上の画素グループに前記画像の部分の各々の画素をグループ化する画素の修正グループを生成し、
前記画素の修正グループは、予備画素グループのセグメント化不足及び/または過剰セグメント化を修正し、
前記画素の修正グループに基づいて前記複数の図画の識別を行う、
ことを含み、
前記画素の修正グループを生成することは、
前記画像の部分の各々に対応するキャプションの数と、前記予備画素グループの画素グループの数と、を比較し、
前記修正グループの画素グループの数と前記画像の部分の各々に対応するキャプションの数とが等しくなるように、前記画像の部分の各々に対応するキャプションの数と、前記予備画素グループの画素グループの数とが異なる判定に応じて、前記比較に基づいて前記一以上の画素グループを調整する、
ことを含む、
ドキュメント中の図画の識別システム。 - コンピュータを、
ドキュメントのページを表す画像を受信し、
前記画像の複数のキャプションを識別し、
前記画像の部分の各々を識別し、
前記画像の部分の各々が少なくとも前記画像の複数のキャプションの数及び位置に基づいて複数の図画を含むことを識別し、
前記複数の図画のメタデータタグを保存する、
ように動作させるためのドキュメント中の図画の識別用のコンピュータプログラムであって、
前記画像の部分の各々が少なくとも前記画像の複数のキャプションの数及び位置に基づいて複数の図画を含むことを識別することは、
一以上の画素グループへの前記画像の部分の各々の予備画素グループ化を決定し、
前記一以上の画素グループに前記画像の部分の各々の画素をグループ化する画素の修正グループを生成し、
前記画素の修正グループは、予備画素グループのセグメント化不足及び/または過剰セグメント化を修正し、
前記画素の修正グループに基づいて前記複数の図画の識別を行う、
ことを含み、
前記画素の修正グループを生成することは、
前記画像の部分の各々に対応するキャプションの数と、前記予備画素グループの画素グループの数と、を比較し、
前記修正グループの画素グループの数と前記画像の部分の各々に対応するキャプションの数とが等しくなるように、前記画像の部分の各々に対応するキャプションの数と、前記予備画素グループの画素グループの数とが異なる判定に応じて、前記比較に基づいて前記一以上の画素グループを調整する、
ことを含む、
コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/547,396 | 2009-08-25 | ||
US12/547,396 US8634644B2 (en) | 2009-08-25 | 2009-08-25 | System and method for identifying pictures in documents |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011048816A JP2011048816A (ja) | 2011-03-10 |
JP5659563B2 true JP5659563B2 (ja) | 2015-01-28 |
Family
ID=43625012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010129890A Expired - Fee Related JP5659563B2 (ja) | 2009-08-25 | 2010-06-07 | 識別方法、識別装置およびコンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8634644B2 (ja) |
JP (1) | JP5659563B2 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8184910B2 (en) * | 2008-03-18 | 2012-05-22 | Toshiba Tec Kabushiki Kaisha | Image recognition device, image recognition method, and image scanning apparatus having image recognition device |
JP5132416B2 (ja) * | 2008-05-08 | 2013-01-30 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
US20120284276A1 (en) * | 2011-05-02 | 2012-11-08 | Barry Fernando | Access to Annotated Digital File Via a Network |
US9105073B2 (en) * | 2012-04-24 | 2015-08-11 | Amadeus S.A.S. | Method and system of producing an interactive version of a plan or the like |
CN104346615B (zh) * | 2013-08-08 | 2019-02-19 | 北大方正集团有限公司 | 版式文档中复合图的提取装置和提取方法 |
RU2595557C2 (ru) | 2014-09-17 | 2016-08-27 | Общество с ограниченной ответственностью "Аби Девелопмент" | Выявление снимков экрана на изображениях документов |
US9355311B2 (en) | 2014-09-23 | 2016-05-31 | Konica Minolta Laboratory U.S.A., Inc. | Removal of graphics from document images using heuristic text analysis and text recovery |
US9830508B1 (en) * | 2015-01-30 | 2017-11-28 | Quest Consultants LLC | Systems and methods of extracting text from a digital image |
US20160267569A1 (en) * | 2015-03-10 | 2016-09-15 | Google Inc. | Providing Search Results Comprising Purchase Links For Products Associated With The Search Results |
US10298907B2 (en) * | 2016-04-20 | 2019-05-21 | Fuji Xerox Co., Ltd. | Method and system for rendering documents with depth camera for telepresence |
US11176621B1 (en) * | 2017-01-30 | 2021-11-16 | Intuit Inc. | Computer-implemented methods systems and articles of manufacture for addressing optical character recognition triggered import errors during preparation of electronic tax return |
US10977744B1 (en) | 2017-01-30 | 2021-04-13 | Intuit Inc. | Computer-implemented methods systems and articles of manufacture for validating electronic tax return data |
US11295396B1 (en) | 2017-01-30 | 2022-04-05 | Intuit Inc. | Computer-implemented methods systems and articles of manufacture for image-initiated preparation of electronic tax return |
US10445615B2 (en) * | 2017-05-24 | 2019-10-15 | Wipro Limited | Method and device for extracting images from portable document format (PDF) documents |
JP7006009B2 (ja) * | 2017-08-15 | 2022-01-24 | 富士フイルムビジネスイノベーション株式会社 | 画像識別装置及び画像形成プログラム |
EP3682372A4 (en) | 2017-09-14 | 2021-07-21 | Chevron U.S.A. Inc. | CLASSIFICATION OF STRINGS USING MACHINE LEARNING |
US11080808B2 (en) | 2017-12-05 | 2021-08-03 | Lendingclub Corporation | Automatically attaching optical character recognition data to images |
US10861162B2 (en) | 2017-12-08 | 2020-12-08 | Ebay Inc. | Object identification in digital images |
US10769429B2 (en) * | 2018-08-31 | 2020-09-08 | Wipro Limited | Method and system for extracting text from an engineering drawing |
CA3114255C (en) * | 2018-09-25 | 2023-08-22 | Element Ai Inc. | Automatically detecting and isolating objects in images |
JP7252818B2 (ja) * | 2019-04-05 | 2023-04-05 | 株式会社日立製作所 | デジタル文書からのデータ抽出システム |
US11514702B2 (en) | 2020-01-31 | 2022-11-29 | Servicenow Canada Inc. | Systems and methods for processing images |
WO2021152550A1 (en) * | 2020-01-31 | 2021-08-05 | Element Ai Inc. | Systems and methods for processing images |
CN111695558B (zh) * | 2020-04-28 | 2023-08-04 | 深圳市跨越新科技有限公司 | 基于YoloV3模型的物流运单图片摆正方法及系统 |
KR102285269B1 (ko) * | 2020-05-18 | 2021-08-04 | 주식회사 선도소프트 | 빅데이터 기반 Geo AI를 활용한 이미지 분석 장치 및 방법 |
US11423265B1 (en) * | 2020-06-30 | 2022-08-23 | Amazon Technologies, Inc. | Content moderation using object detection and image classification |
CN111860502B (zh) * | 2020-07-15 | 2024-07-16 | 北京思图场景数据科技服务有限公司 | 图片表格的识别方法、装置、电子设备及存储介质 |
CN112464852B (zh) * | 2020-12-09 | 2023-12-05 | 重庆大学 | 一种车辆行驶证图片自适应矫正与识别方法 |
CN113269183A (zh) * | 2021-05-21 | 2021-08-17 | 上海蜜度信息技术有限公司 | 一种用于确定文字图片的方法与设备 |
US20230215207A1 (en) * | 2021-11-29 | 2023-07-06 | RedShred LLC | Geographic management of document content |
US11749006B2 (en) * | 2021-12-15 | 2023-09-05 | Intuit Inc. | Optical character recognition quality evaluation and optimization |
US11856261B1 (en) * | 2022-09-29 | 2023-12-26 | Motorola Solutions, Inc. | System and method for redaction based on group association |
KR102571815B1 (ko) * | 2022-11-14 | 2023-08-28 | 주식회사 플랜티넷 | 객체 군집화 및 객체 선택 기반 문서 분류 방법 및 장치 |
CN116110051B (zh) * | 2023-04-13 | 2023-07-14 | 合肥机数量子科技有限公司 | 一种文件信息处理方法、装置、计算机设备及存储介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5784487A (en) * | 1996-05-23 | 1998-07-21 | Xerox Corporation | System for document layout analysis |
US6804403B1 (en) * | 1998-07-15 | 2004-10-12 | Digital Accelerator Corporation | Region-based scalable image coding |
JP2000090239A (ja) * | 1998-09-10 | 2000-03-31 | Matsushita Electric Ind Co Ltd | 画像検索装置 |
US6463175B1 (en) * | 2000-12-15 | 2002-10-08 | Shih-Jong J. Lee | Structure-guided image processing and image feature enhancement |
JP2003346161A (ja) * | 2002-05-23 | 2003-12-05 | Kansai Electric Power Co Inc:The | 図表内テキスト・図表キャプション・図表説明文・図表種類抽出プログラム、及び当該抽出プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに図表内テキスト・図表キャプション・図表説明文・図表種類抽出装置 |
US7391917B2 (en) * | 2003-02-13 | 2008-06-24 | Canon Kabushiki Kaisha | Image processing method |
US7782339B1 (en) * | 2004-06-30 | 2010-08-24 | Teradici Corporation | Method and apparatus for generating masks for a multi-layer image decomposition |
JP4548062B2 (ja) * | 2004-09-22 | 2010-09-22 | 富士ゼロックス株式会社 | 画像処理装置 |
US7848567B2 (en) | 2004-09-23 | 2010-12-07 | Fuji Xerox Co., Ltd. | Determining regions of interest in synthetic images |
US7949186B2 (en) * | 2006-03-15 | 2011-05-24 | Massachusetts Institute Of Technology | Pyramid match kernel and related techniques |
US20090112830A1 (en) | 2007-10-25 | 2009-04-30 | Fuji Xerox Co., Ltd. | System and methods for searching images in presentations |
US8601393B2 (en) * | 2008-01-28 | 2013-12-03 | Fuji Xerox Co., Ltd. | System and method for supporting document navigation on mobile devices using segmentation and keyphrase summarization |
JP5302768B2 (ja) * | 2008-06-26 | 2013-10-02 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
US8290268B2 (en) * | 2008-08-13 | 2012-10-16 | Google Inc. | Segmenting printed media pages into articles |
-
2009
- 2009-08-25 US US12/547,396 patent/US8634644B2/en not_active Expired - Fee Related
-
2010
- 2010-06-07 JP JP2010129890A patent/JP5659563B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8634644B2 (en) | 2014-01-21 |
JP2011048816A (ja) | 2011-03-10 |
US20110052062A1 (en) | 2011-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5659563B2 (ja) | 識別方法、識別装置およびコンピュータプログラム | |
US20210256253A1 (en) | Method and apparatus of image-to-document conversion based on ocr, device, and readable storage medium | |
Ye et al. | Text detection and recognition in imagery: A survey | |
JP4918776B2 (ja) | 電子文書比較プログラム、電子文書比較装置および電子文書比較方法 | |
US6009196A (en) | Method for classifying non-running text in an image | |
US5889886A (en) | Method and apparatus for detecting running text in an image | |
JP4271878B2 (ja) | 映像中の文字検索方法及び装置並びに文字検索処理プログラム | |
US9396540B1 (en) | Method and system for identifying anchors for fields using optical character recognition data | |
US8843494B1 (en) | Method and system for using keywords to merge document clusters | |
Rigaud et al. | Robust frame and text extraction from comic books | |
JPS61267177A (ja) | 文書画像追加情報の蓄積方法 | |
JP2004318879A (ja) | 画像内容を比較する自動化技術 | |
JP2007102715A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
Akram et al. | Document Image Processing- A Review | |
Mizan et al. | Text Recognition using Image Processing. | |
JP2011065621A (ja) | 情報処理装置及び情報処理プログラム | |
US11321558B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2019016350A (ja) | 電子文書における強調テキストの識別 | |
Faustina Joan et al. | A survey on text information extraction from born-digital and scene text images | |
Sahare et al. | Robust character segmentation and recognition schemes for multilingual Indian document images | |
Fateh et al. | Persian printed text line detection based on font size | |
Kumar et al. | Online handwritten character recognition for Telugu language using support vector machines | |
JP2008028716A (ja) | 画像処理方法及び装置 | |
JP2006253842A (ja) | 画像処理装置、画像形成装置、プログラム、記憶媒体および画像処理方法 | |
Nazemi et al. | Practical segmentation methods for logical and geometric layout analysis to improve scanned PDF accessibility to Vision Impaired |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130522 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5659563 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |