JP2011048816A - 識別方法、識別装置およびコンピュータプログラム - Google Patents
識別方法、識別装置およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2011048816A JP2011048816A JP2010129890A JP2010129890A JP2011048816A JP 2011048816 A JP2011048816 A JP 2011048816A JP 2010129890 A JP2010129890 A JP 2010129890A JP 2010129890 A JP2010129890 A JP 2010129890A JP 2011048816 A JP2011048816 A JP 2011048816A
- Authority
- JP
- Japan
- Prior art keywords
- image
- page
- mask image
- identifying
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004590 computer program Methods 0.000 title claims description 5
- 238000012850 discrimination method Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims description 100
- 238000012015 optical character recognition Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 15
- 238000005516 engineering process Methods 0.000 claims description 12
- 230000000873 masking effect Effects 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 230000000877 morphologic effect Effects 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 230000008602 contraction Effects 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 9
- 238000003384 imaging method Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
【解決手段】ドキュメントのページを表す画像を受信し、ページ内のテキストオブジェクトを識別するために画像を分析し、ページ中のテキストオブジェクトを含む画像領域をマスクしてマスク画像を生成し、マスク画像中の、ページ中の少なくとも一つの図画に対応する画素グループを識別し、一以上の画素グループに基づいてページ中の少なくとも一つの図画に対応する領域を識別し、少なくとも一つの図画に対応する領域に関する情報を含む属性情報を、前記図画の各々に対応づけて保存するようにした。
【選択図】図1
Description
本発明の第2の態様にかかる画像識別システムは、ドキュメントのページを表す画像を受信する受信手段と、前記ページ内のテキストオブジェクトを識別するために前記画像を分析する分析手段と、前記ページ中のテキストオブジェクトを含む画像領域をマスクしてマスク画像を生成するマスク画像生成手段と、前記マスク画像中の、前記ページ中の少なくとも一つの図画に対応する画素グループを識別する画素グループ識別手段と、一以上の前記画素グループに基づいて前記ページ中の前記少なくとも一つの図画に対応する領域を識別する図画領域識別手段と、前記少なくとも一つの図画に対応する前記領域に関する情報を含む属性情報を、前記図画の各々に対応づけて保存する保存手段と、を備えることを特徴とする。
・ オペレーティングシステム212 様々な基本システムサービスの処理、ハードウェア依存処理を行う。
・ 通信モジュール214 コンピュータシステム200を他のコンピュータに一以上の通信インターフェース204(有線あるいは無線、インターネット、WAN、LAN、都市間通信ネットワークなど)を介して接続する。
・ ユーザインターフェースモジュール216 入力装置208を通じてユーザからのコマンドを受信し、表示デバイス206にユーザインタフェースオブジェクトを生成する。
・ 画像形成モジュール218 画像形成デバイス260のインターフェースを構成する。
・ 図画識別モジュール108 後で詳述するように、ドキュメント中の図画を識別する。
・ ドキュメントページの画像250 識別された図画の領域252と関連づけられたキャプションテキスト254を含む。
・ メタデータ256
なお、図画識別モジュール108は、以下のモジュールを含む。
・ 光学文字認識(OCR)モジュール222 画像中のテキストオブジェクトを識別する。
・ マスキングモジュール224 画像中の領域をマスクする。
・ 二値化モジュール226 所定の条件に応じて画素のカラー値を1あるいは0に設定する。
・ フィルタリングモジュール228 画像を滑らかにする。
・ グループ化モジュール230 画像中の画素をグループ化する。
・ 図画識別モジュール232 グループ化された画素から個々の図画を識別する。
・ メタデータモジュール234 識別された図画のメタデータあるいはメタデータタグを生成、記憶する。
・ ダウンサンプリングモジュール236 画像をダウンサンプリングする。
・ ノイズ除去モジュール238 画像からノイズや装丁用グラフィックスを除去する。
・ 画素削減モジュール240 画像中の画素数を削減する。
104 画像入力システム
106 画像
108 図画識別システム
Claims (22)
- 受信手段により、ドキュメントのページを表す画像を受信し、
分析手段により、前記ページ内のテキストオブジェクトを識別するために前記画像を分析し、
マスク画像生成手段により、前記ページ中のテキストオブジェクトを含む画像領域をマスクしてマスク画像を生成し、
画素グループ識別手段により、前記マスク画像中の、前記ページ中の少なくとも一つの図画に対応する画素グループを識別し、
図画領域識別手段により、一以上の前記画素グループに基づいて前記ページ中の前記少なくとも一つの図画に対応する領域を識別し、
保存手段により、前記少なくとも一つの図画に対応する前記領域に関する情報を含む属性情報を、前記図画の各々に対応づけて保存する、
ことを特徴とするドキュメント中の図画の識別方法。 - 前記図画領域識別手段は、前記ページ内のテキストオブジェクトを識別するために光学文字認識技術(OCR)を用いて前記画像を分析することを特徴とする請求項1記載の識別方法。
- 前記マスク画像生成手段は、前記画像の背景色を識別し、前記テキストオブジェクトを含む画像領域内の画素について、前記背景色のカラー値をカラー値として設定することを特徴とする請求項1記載の識別方法。
- 前記マスク画像生成手段は、前記画像の背景色を識別し、前記テキストオブジェクトの境界ボックスで囲まれる画像領域内の画素について、前記背景色のカラー値をカラー値として設定することを特徴とする請求項1記載の識別方法。
- 前記画素グループ識別手段による前記マスク画像内の一以上の前記画素グループの識別に先立って、さらに画像処理手段が、前記マスク画像をダウンサンプリングすることを特徴とすることを特徴とする請求項1記載の識別方法。
- 前記マスク画像のダウンサンプリングに先立って、さらに前記画像処理手段が、前記マスク画像を平滑化することを特徴とする請求項5記載の識別方法。
- 前記画素グループ識別手段による前記マスク画像中の一以上の画素グループの識別に先立って、前記マスク画像を二値化する工程を含み、
前記マスク画像を二値化する工程は、前記画像の背景色のカラー値に関する所定の閾値の範囲内にないカラー値を有する画素に第1のカラー値を設定し、前記画像の背景色のカラー値に関する所定の閾値の範囲内にあるカラー値を有する画素に第2のカラー値を設定することを特徴とする請求項1記載の識別方法。 - 前記マスク画像に対して、前記第1のカラー値を有する画素の数を削減する処理を施すことを特徴とする請求項7記載の識別方法。
- 前記第1のカラー値を有する画素の削減処理は、周囲を前記第1のカラー値を有する画素で囲まれた内部画素を削減することを含むことを特徴とする請求項8記載の識別方法。
- 前記内部画素を削減するために、モルフォロジ収縮エッジ検出器を用いることを含むことを特徴とする請求項9記載の識別方法。
- 前記画素グループ識別手段による前記マスク画像中の一以上の画素グループの識別に先立って、画像処理手段が、前記マスク画像からノイズを除去することをさらに含むことを特徴とする請求項1記載の識別方法。
- 前記画素グループ識別手段による前記マスク画像中の一以上の画素グループの識別に先立って、画像処理手段が、前記マスク画像から装丁用グラフィックスを削除することをさらに含む請求項1記載の識別方法。
- 前記画素グループ識別手段は、倍率変更画像を生成するために、結合コンポーネントの寸法に基づいて前記マスク画像を拡縮し、ノーマライズドカット法を用いて、N個の要素を含むとともに、前記要素kの各々はk個のクラスタを含む(ここでkは0<k≦Nの整数)、倍率変換した前記マスク画像の画素のクラスタリングシーケンスを取得し、
所定の条件を満たすクラスタリングシーケンスの要素を識別する、
ことを特徴とする請求項1記載の識別方法。 - 前記所定の条件は、前記クラスタリングのシーケンス中の隣接する要素中のクラスタ間の距離の変化を最大化するクラスタリングシーケンスの要素を含むことであることを特徴とする請求項13記載の識別方法。
- 前記図画領域識別手段が、一以上の前記画素グループに基づいて前記図画の領域を識別する工程は、
前記一以上の画素グループのセグメント化不足あるいは過剰セグメント化を修正し、
修正された前記画素グループに基づいて前記図画の領域の識別を行う、
ことを含む、
請求項1記載の識別方法。 - 一以上の前記画素グループの修正は、前記ページ内の前記図画に対応するキャプションテキストを識別し、前記キャプションテキストに基づいて前記一以上の画素グループを調整することを特徴とする請求項15記載の識別方法。
- 前記キャプションテキストに基づく前記一以上の画素グループの調整は、前記一以上の画素グループの一部を結合することを含むことを特徴とする請求項16記載の識別方法。
- 前記キャプションテキストに基づく前記一以上の画素グループの調整は、前記一以上の画素グループの一部を分割することを含むことを特徴とする請求項16記載の識別方法。
- 前記ページ内の前記図画に対応するキャプションテキストの識別は、光学文字認識技術を用いて、前記ページを表す画像中で、前記一以上の画素グループから所定の距離内に存在するテキストを識別し、
識別された前記キャプションテキストが、キャプションテキストであることを示す所定のテキストトークンであるかを識別するために、文字列マッチング処理を行う、
ことを特徴とする請求項16記載の識別方法。 - 前記図画の各々のメタデータタグとともに各前記キャプションテキストを保存することを特徴とする請求項19記載の識別方法。
- ドキュメントのページを表す画像を受信する受信手段と、
前記ページ内のテキストオブジェクトを識別するために前記画像を分析する分析手段と、
前記ページ中のテキストオブジェクトを含む画像領域をマスクしてマスク画像を生成するマスク画像生成手段と、
前記マスク画像中の、前記ページ中の少なくとも一つの図画に対応する画素グループを識別する画素グループ識別手段と、
一以上の前記画素グループに基づいて前記ページ中の前記少なくとも一つの図画に対応する領域を識別する図画領域識別手段と、
前記少なくとも一つの図画に対応する前記領域に関する情報を含む属性情報を、前記図画の各々に対応づけて保存する保存手段と、
と備えることを特徴とするドキュメント中の図画の識別システム。 - コンピュータを、
受信手段により、ドキュメントのページを表す画像を受信し、
分析手段により、前記ページ内のテキストオブジェクトを識別するために前記画像を分析し、
マスク画像生成手段により、前記ページ中のテキストオブジェクトを含む画像領域をマスクしてマスク画像を生成し、
画素グループ識別手段により、前記マスク画像中の、前記ページ中の少なくとも一つの図画に対応する画素グループを識別し、
図画領域識別手段により、一以上の前記画素グループに基づいて前記ページ中の前記少なくとも一つの図画に対応する領域を識別し、
保存手段により、前記少なくとも一つの図画に対応する前記領域に関する情報を含む属性情報を、各前記図画に対応づけて保存する、
ように動作させるためのドキュメント中の図画の識別用のコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/547,396 | 2009-08-25 | ||
US12/547,396 US8634644B2 (en) | 2009-08-25 | 2009-08-25 | System and method for identifying pictures in documents |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011048816A true JP2011048816A (ja) | 2011-03-10 |
JP5659563B2 JP5659563B2 (ja) | 2015-01-28 |
Family
ID=43625012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010129890A Expired - Fee Related JP5659563B2 (ja) | 2009-08-25 | 2010-06-07 | 識別方法、識別装置およびコンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8634644B2 (ja) |
JP (1) | JP5659563B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020170445A (ja) * | 2019-04-05 | 2020-10-15 | 株式会社日立製作所 | デジタル文書からのデータ抽出方法およびシステム |
KR102285269B1 (ko) * | 2020-05-18 | 2021-08-04 | 주식회사 선도소프트 | 빅데이터 기반 Geo AI를 활용한 이미지 분석 장치 및 방법 |
KR102571815B1 (ko) * | 2022-11-14 | 2023-08-28 | 주식회사 플랜티넷 | 객체 군집화 및 객체 선택 기반 문서 분류 방법 및 장치 |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8184910B2 (en) * | 2008-03-18 | 2012-05-22 | Toshiba Tec Kabushiki Kaisha | Image recognition device, image recognition method, and image scanning apparatus having image recognition device |
JP5132416B2 (ja) * | 2008-05-08 | 2013-01-30 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
US20120284276A1 (en) * | 2011-05-02 | 2012-11-08 | Barry Fernando | Access to Annotated Digital File Via a Network |
US9105073B2 (en) * | 2012-04-24 | 2015-08-11 | Amadeus S.A.S. | Method and system of producing an interactive version of a plan or the like |
CN104346615B (zh) * | 2013-08-08 | 2019-02-19 | 北大方正集团有限公司 | 版式文档中复合图的提取装置和提取方法 |
RU2595557C2 (ru) | 2014-09-17 | 2016-08-27 | Общество с ограниченной ответственностью "Аби Девелопмент" | Выявление снимков экрана на изображениях документов |
US9355311B2 (en) | 2014-09-23 | 2016-05-31 | Konica Minolta Laboratory U.S.A., Inc. | Removal of graphics from document images using heuristic text analysis and text recovery |
US9830508B1 (en) * | 2015-01-30 | 2017-11-28 | Quest Consultants LLC | Systems and methods of extracting text from a digital image |
US20160267569A1 (en) * | 2015-03-10 | 2016-09-15 | Google Inc. | Providing Search Results Comprising Purchase Links For Products Associated With The Search Results |
US10298907B2 (en) * | 2016-04-20 | 2019-05-21 | Fuji Xerox Co., Ltd. | Method and system for rendering documents with depth camera for telepresence |
US10977744B1 (en) | 2017-01-30 | 2021-04-13 | Intuit Inc. | Computer-implemented methods systems and articles of manufacture for validating electronic tax return data |
US11295396B1 (en) | 2017-01-30 | 2022-04-05 | Intuit Inc. | Computer-implemented methods systems and articles of manufacture for image-initiated preparation of electronic tax return |
US11176621B1 (en) * | 2017-01-30 | 2021-11-16 | Intuit Inc. | Computer-implemented methods systems and articles of manufacture for addressing optical character recognition triggered import errors during preparation of electronic tax return |
US10445615B2 (en) * | 2017-05-24 | 2019-10-15 | Wipro Limited | Method and device for extracting images from portable document format (PDF) documents |
JP7006009B2 (ja) * | 2017-08-15 | 2022-01-24 | 富士フイルムビジネスイノベーション株式会社 | 画像識別装置及び画像形成プログラム |
CN111095296B (zh) * | 2017-09-14 | 2024-07-02 | 雪佛龙美国公司 | 使用机器学习对字符串进行分类 |
US11080808B2 (en) | 2017-12-05 | 2021-08-03 | Lendingclub Corporation | Automatically attaching optical character recognition data to images |
US10861162B2 (en) | 2017-12-08 | 2020-12-08 | Ebay Inc. | Object identification in digital images |
US10769429B2 (en) * | 2018-08-31 | 2020-09-08 | Wipro Limited | Method and system for extracting text from an engineering drawing |
WO2020061691A1 (en) * | 2018-09-25 | 2020-04-02 | Element Ai Inc. | Automatically detecting and isolating objects in images |
WO2021152550A1 (en) * | 2020-01-31 | 2021-08-05 | Element Ai Inc. | Systems and methods for processing images |
US11514702B2 (en) | 2020-01-31 | 2022-11-29 | Servicenow Canada Inc. | Systems and methods for processing images |
CN111695558B (zh) * | 2020-04-28 | 2023-08-04 | 深圳市跨越新科技有限公司 | 基于YoloV3模型的物流运单图片摆正方法及系统 |
US11423265B1 (en) * | 2020-06-30 | 2022-08-23 | Amazon Technologies, Inc. | Content moderation using object detection and image classification |
CN111860502B (zh) * | 2020-07-15 | 2024-07-16 | 北京思图场景数据科技服务有限公司 | 图片表格的识别方法、装置、电子设备及存储介质 |
CN112464852B (zh) * | 2020-12-09 | 2023-12-05 | 重庆大学 | 一种车辆行驶证图片自适应矫正与识别方法 |
CN113269183A (zh) * | 2021-05-21 | 2021-08-17 | 上海蜜度信息技术有限公司 | 一种用于确定文字图片的方法与设备 |
US20230215207A1 (en) * | 2021-11-29 | 2023-07-06 | RedShred LLC | Geographic management of document content |
US11749006B2 (en) * | 2021-12-15 | 2023-09-05 | Intuit Inc. | Optical character recognition quality evaluation and optimization |
US11856261B1 (en) * | 2022-09-29 | 2023-12-26 | Motorola Solutions, Inc. | System and method for redaction based on group association |
CN116110051B (zh) * | 2023-04-13 | 2023-07-14 | 合肥机数量子科技有限公司 | 一种文件信息处理方法、装置、计算机设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090239A (ja) * | 1998-09-10 | 2000-03-31 | Matsushita Electric Ind Co Ltd | 画像検索装置 |
JP2003346161A (ja) * | 2002-05-23 | 2003-12-05 | Kansai Electric Power Co Inc:The | 図表内テキスト・図表キャプション・図表説明文・図表種類抽出プログラム、及び当該抽出プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに図表内テキスト・図表キャプション・図表説明文・図表種類抽出装置 |
JP2006092048A (ja) * | 2004-09-22 | 2006-04-06 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2009176298A (ja) * | 2008-01-28 | 2009-08-06 | Fuji Xerox Co Ltd | セグメント化及びキーフレーズを利用してモバイル機器でのドキュメントナビゲーションをサポートする方法、プログラム及びデバイス |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5784487A (en) * | 1996-05-23 | 1998-07-21 | Xerox Corporation | System for document layout analysis |
US6804403B1 (en) * | 1998-07-15 | 2004-10-12 | Digital Accelerator Corporation | Region-based scalable image coding |
US6463175B1 (en) * | 2000-12-15 | 2002-10-08 | Shih-Jong J. Lee | Structure-guided image processing and image feature enhancement |
US7391917B2 (en) * | 2003-02-13 | 2008-06-24 | Canon Kabushiki Kaisha | Image processing method |
US7782339B1 (en) * | 2004-06-30 | 2010-08-24 | Teradici Corporation | Method and apparatus for generating masks for a multi-layer image decomposition |
US7848567B2 (en) * | 2004-09-23 | 2010-12-07 | Fuji Xerox Co., Ltd. | Determining regions of interest in synthetic images |
US7949186B2 (en) * | 2006-03-15 | 2011-05-24 | Massachusetts Institute Of Technology | Pyramid match kernel and related techniques |
US20090112830A1 (en) * | 2007-10-25 | 2009-04-30 | Fuji Xerox Co., Ltd. | System and methods for searching images in presentations |
JP5302768B2 (ja) * | 2008-06-26 | 2013-10-02 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
US8290268B2 (en) * | 2008-08-13 | 2012-10-16 | Google Inc. | Segmenting printed media pages into articles |
-
2009
- 2009-08-25 US US12/547,396 patent/US8634644B2/en not_active Expired - Fee Related
-
2010
- 2010-06-07 JP JP2010129890A patent/JP5659563B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090239A (ja) * | 1998-09-10 | 2000-03-31 | Matsushita Electric Ind Co Ltd | 画像検索装置 |
JP2003346161A (ja) * | 2002-05-23 | 2003-12-05 | Kansai Electric Power Co Inc:The | 図表内テキスト・図表キャプション・図表説明文・図表種類抽出プログラム、及び当該抽出プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに図表内テキスト・図表キャプション・図表説明文・図表種類抽出装置 |
JP2006092048A (ja) * | 2004-09-22 | 2006-04-06 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2009176298A (ja) * | 2008-01-28 | 2009-08-06 | Fuji Xerox Co Ltd | セグメント化及びキーフレーズを利用してモバイル機器でのドキュメントナビゲーションをサポートする方法、プログラム及びデバイス |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020170445A (ja) * | 2019-04-05 | 2020-10-15 | 株式会社日立製作所 | デジタル文書からのデータ抽出方法およびシステム |
JP7252818B2 (ja) | 2019-04-05 | 2023-04-05 | 株式会社日立製作所 | デジタル文書からのデータ抽出システム |
KR102285269B1 (ko) * | 2020-05-18 | 2021-08-04 | 주식회사 선도소프트 | 빅데이터 기반 Geo AI를 활용한 이미지 분석 장치 및 방법 |
KR102571815B1 (ko) * | 2022-11-14 | 2023-08-28 | 주식회사 플랜티넷 | 객체 군집화 및 객체 선택 기반 문서 분류 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP5659563B2 (ja) | 2015-01-28 |
US20110052062A1 (en) | 2011-03-03 |
US8634644B2 (en) | 2014-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5659563B2 (ja) | 識別方法、識別装置およびコンピュータプログラム | |
WO2020192391A1 (zh) | 基于ocr的图像转档方法、装置、设备及可读存储介质 | |
Ye et al. | Text detection and recognition in imagery: A survey | |
US6009196A (en) | Method for classifying non-running text in an image | |
JP4271878B2 (ja) | 映像中の文字検索方法及び装置並びに文字検索処理プログラム | |
US9396540B1 (en) | Method and system for identifying anchors for fields using optical character recognition data | |
JP4856925B2 (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
US8843494B1 (en) | Method and system for using keywords to merge document clusters | |
Rigaud et al. | Robust frame and text extraction from comic books | |
JPS61267177A (ja) | 文書画像追加情報の蓄積方法 | |
US9842251B2 (en) | Bulleted lists | |
JP2007115193A (ja) | 電子文書比較プログラム、電子文書比較装置および電子文書比較方法 | |
Akram et al. | Document Image Processing- A Review | |
JP2004318879A (ja) | 画像内容を比較する自動化技術 | |
US11321558B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2019016350A (ja) | 電子文書における強調テキストの識別 | |
CN112784932B (zh) | 一种字体识别方法、装置和存储介质 | |
Yu et al. | An effective method for figures and tables detection in academic literature | |
JP2008028716A (ja) | 画像処理方法及び装置 | |
JP2006253842A (ja) | 画像処理装置、画像形成装置、プログラム、記憶媒体および画像処理方法 | |
Nazemi et al. | Practical segmentation methods for logical and geometric layout analysis to improve scanned PDF accessibility to Vision Impaired | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
Diem et al. | Semi-automated document image clustering and retrieval | |
CN113850208A (zh) | 一种图片信息结构化方法、装置、设备及介质 | |
Xu et al. | Graph-based layout analysis for pdf documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130522 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5659563 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |