JP7532124B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP7532124B2 JP7532124B2 JP2020122994A JP2020122994A JP7532124B2 JP 7532124 B2 JP7532124 B2 JP 7532124B2 JP 2020122994 A JP2020122994 A JP 2020122994A JP 2020122994 A JP2020122994 A JP 2020122994A JP 7532124 B2 JP7532124 B2 JP 7532124B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- information processing
- image
- degrees
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 31
- 238000003672 processing method Methods 0.000 title claims 2
- 238000000034 method Methods 0.000 claims description 99
- 238000001514 detection method Methods 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 29
- 238000005516 engineering process Methods 0.000 description 10
- 238000012805 post-processing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 238000012015 optical character recognition Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
[ハードウェア構成]
図1は、本実施形態に係る情報処理システムのハードウェア構成を示す図である。情報処理システムは、複写機100と、情報処理装置110とを有する。
複写機100は、スキャナ101と、複写機側通信部102とを有する。スキャナ101は、文書のスキャンを行い、文書画像を生成する。複写機側通信部102は、ネットワークを介して、情報処理装置110を含む外部装置と通信を行う。
次に、本実施形態に係る情報処理システムにおける、文書画像に対するCOR処理を実現するソフトウェアの動作フローについて、図2を用いて説明する。図2のフローチャートに示す一連の処理は、システム制御部111が所定のプログラムをROM112等から読み出して実行することで実現される。なお、以下の説明において記号「S」はステップを意味する。
S204では、原稿種類に依らない汎用的な文字認識処理が実行される。文字認識処理が完了すると、本処理を終了する。
続いて、S217の後処理について、図6のフローチャートを参照しつつ説明する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (10)
- 文書に記載されている文字が正立する状態の文書画像に対して、縦書きか横書きかを判定する処理を行う判定手段と、
前記文書画像を回転させる処理を行う回転手段と、
横書きの文字列領域を特定するのに適した文字列検出処理を行う検出手段と、
前記文字列検出処理で検出された文字列領域に対し、文字認識処理を行う文字認識手段と、
を備え、
前記検出手段は、
前記判定の結果が横書きである場合には、前記回転手段によって回転されていない前記文書画像に対して前記文字列検出処理を行い、
前記判定の結果が縦書きである場合には、前記回転手段によって90度回転させた前記文書画像に対して前記文字列検出処理を行い、
前記文字認識手段は、
前記判定の結果が縦書きである場合、前記文字列検出処理で検出された文字列領域を-90度回転させた文字列領域の画像に対して第1の文字認識処理を行い、
さらに、前記第1の文字認識処理の対象となった文字列領域のうちの英数字が支配的な文字列領域を90度回転させた文字列領域の画像に対して第2の文字認識処理を行う、
ことを特徴とする情報処理装置。 - 前記検出手段は、前記文書画像内に存在する黒画素塊の有無を水平方向に走査して、黒画素塊同士の間隔が一定範囲内にある複数の黒画素塊を特定し、当該特定された複数の黒画素塊を囲む外接矩形領域を、前記文字列領域として検出することを特徴とする請求項1に記載の情報処理装置。
- 前記検出された文字列領域を-90度回転させた文字列領域の画像は、前記文字列検出処理で検出された文字列領域に対応する部分画像を-90度回転させる処理、または、前記文字列検出処理で検出された文字列領域の座標情報を-90度回転させて、当該-90度回転後の座標情報を前記回転手段で回転されていない前記文書画像に適用する処理、のいずれかを行うことによって得られる、ことを特徴とする請求項1または2に記載の情報処理装置。
- 前記英数字が支配的な文字列領域を90度回転させた文字列領域の画像は、前記第1の文字認識処理の対象となった前記英数字が支配的な文字列領域の部分画像を90度回転させる処理、または、前記英数字が支配的な文字列領域の座標情報を90度回転させて、当該90度回転後の座標情報を前記回転手段によって90度回転させた前記文書画像に適用する処理、のいずれかを行うことによって得られる、ことを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
- 前記英数字が支配的な文字列領域とは、前記第1の文字認識処理の結果に基づき、英数字が支配的であると判定された行単位の文字列領域である、ことを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
- 前記文字認識手段は、前記第1の文字認識処理の結果と前記第2の文字認識処理の結果とを統合する手段を有することを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
- 前記第2の文字認識処理は、メールアドレスまたはURLに使用される文字種を認識対象とする文字認識処理であることを特徴とする請求項1乃至6のいずれか1項に記載の情報処理装置。
- 前記文書は、名刺であることを特徴とする請求項1乃至7のいずれか1項に記載の情報処理装置。
- 情報処理装置の判定手段が、文書に記載されている文字が正立する状態の文書画像に対して、縦書きか横書きかを判定する処理を行う判定ステップと、
前記情報処理装置の回転手段が、前記文書画像を回転させる処理を行う回転ステップと、
前記情報処理装置の検出手段が、横書きの文字列領域を特定するのに適した文字列検出処理を行う検出ステップと、
前記情報処理装置の文字認識手段が、前記文字列検出処理で検出された文字列領域に対し、文字認識処理を行う文字認識ステップと、
を含み、
前記検出ステップでは、
前記判定の結果が横書きである場合には、前記回転ステップで回転されていない前記文書画像に対して前記文字列検出処理を行い、
前記判定の結果が縦書きである場合には、前記回転ステップで90度回転させた前記文書画像に対して前記文字列検出処理を行い、
前記文字認識ステップでは、
前記判定の結果が縦書きである場合、前記検出された文字列領域を-90度回転させた文字列領域の画像に対して第1の文字認識処理を行い、
さらに、前記第1の文字認識処理の対象となった文字列領域のうちの英数字が支配的な文字列領域を90度回転させた文字列領域の画像に対して第2の文字認識処理を行う、
ことを特徴とする情報処理方法。 - コンピュータを、請求項1乃至8のいずれか1項に記載の情報処理装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020122994A JP7532124B2 (ja) | 2020-07-17 | 2020-07-17 | 情報処理装置、情報処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020122994A JP7532124B2 (ja) | 2020-07-17 | 2020-07-17 | 情報処理装置、情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022019257A JP2022019257A (ja) | 2022-01-27 |
JP7532124B2 true JP7532124B2 (ja) | 2024-08-13 |
Family
ID=80204086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020122994A Active JP7532124B2 (ja) | 2020-07-17 | 2020-07-17 | 情報処理装置、情報処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7532124B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009289038A (ja) | 2008-05-29 | 2009-12-10 | Sharp Corp | 文字列抽出装置、文字列抽出方法、文字列抽出プログラム、及びコンピュータに読み取り可能な記録媒体 |
JP2013206258A (ja) | 2012-03-29 | 2013-10-07 | Dainippon Printing Co Ltd | 文書認識装置、文書認識方法、プログラム |
JP2019128727A (ja) | 2018-01-23 | 2019-08-01 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
-
2020
- 2020-07-17 JP JP2020122994A patent/JP7532124B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009289038A (ja) | 2008-05-29 | 2009-12-10 | Sharp Corp | 文字列抽出装置、文字列抽出方法、文字列抽出プログラム、及びコンピュータに読み取り可能な記録媒体 |
JP2013206258A (ja) | 2012-03-29 | 2013-10-07 | Dainippon Printing Co Ltd | 文書認識装置、文書認識方法、プログラム |
JP2019128727A (ja) | 2018-01-23 | 2019-08-01 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
Non-Patent Citations (2)
Title |
---|
中尾 一郎、外3名,"文書構造と単語属性に基づく再認識処理による名刺OCRソフトウェア",Matsushita Technical Journal,日本,松下電器産業株式会社,2000年04月18日,Vol.46, No.2,pp.127-132 |
嶌田 聡、外2名,"文字の切り出しを行わないテロップ文字列の高速な認識",電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2011年11月17日,Vol.111, No.317,pp.57-62 |
Also Published As
Publication number | Publication date |
---|---|
JP2022019257A (ja) | 2022-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9754164B2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
JP4631133B2 (ja) | 文字認識処理のための装置、方法及び記録媒体 | |
Luo et al. | Design and implementation of a card reader based on build-in camera | |
JP3996579B2 (ja) | 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム | |
Gebhardt et al. | Document authentication using printing technique features and unsupervised anomaly detection | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
CN114299528B (zh) | 一种针对扫描文档的信息提取和结构化方法 | |
JP4574503B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JPH11143986A (ja) | ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体 | |
CN108564081A (zh) | 卡片放置方向的识别方法、装置以及图像处理装置 | |
US11881043B2 (en) | Image processing system, image processing method, and program | |
Akinbade et al. | An adaptive thresholding algorithm-based optical character recognition system for information extraction in complex images | |
EP3786844A1 (en) | Image processing system, image processing method, and program | |
JP2010061471A (ja) | 文字認識装置およびプログラム | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP3006466B2 (ja) | 文字入力装置 | |
CN117333893A (zh) | 基于ocr的自定义模板图像识别方法、系统及存储介质 | |
Kaur et al. | Page segmentation in OCR system-a review | |
JP7532124B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
Bhaskar et al. | Implementing optical character recognition on the android operating system for business cards | |
KR101498546B1 (ko) | 문서 디지털 복원 시스템 및 방법 | |
JP2008084105A (ja) | 文字切出方法及び文字認識装置 | |
Sherkat et al. | Use of colour for hand-filled form analysis and recognition | |
JP4974794B2 (ja) | 文書認識装置、文書認識方法、コンピュータプログラム | |
JP7543014B2 (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240423 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240618 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240731 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7532124 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |