JP2022014322A - 画像処理装置、画像処理方法、およびプログラム - Google Patents
画像処理装置、画像処理方法、およびプログラム Download PDFInfo
- Publication number
- JP2022014322A JP2022014322A JP2020116595A JP2020116595A JP2022014322A JP 2022014322 A JP2022014322 A JP 2022014322A JP 2020116595 A JP2020116595 A JP 2020116595A JP 2020116595 A JP2020116595 A JP 2020116595A JP 2022014322 A JP2022014322 A JP 2022014322A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- black pixel
- pixel block
- brightness
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 48
- 238000003672 processing method Methods 0.000 title claims 2
- 238000000034 method Methods 0.000 claims description 77
- 238000000605 extraction Methods 0.000 claims description 66
- 238000012015 optical character recognition Methods 0.000 description 20
- 230000010365 information processing Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/273—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion removing elements interfering with the pattern to be recognised
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
Description
図1は、第1の実施形態に係る情報処理システムを示す図である。情報処理システムは、複写機(複合機)100と、情報処理装置110とを含む。複合機100は、スキャナ101と、プリンタ102と、通信部103とを有している。スキャナ101は、文書のスキャンを行い、スキャン画像を生成する。プリンタ102は、画像を用紙にプリント(画像形成)する。複写機100の通信部103は、ネットワークを介して外部装置と通信を行う。
VTH < V ≦ p×VMAX ・・・(式1)
を満たす輝度値Vを有する画素を黒色とし、その他の画素を白色とすることにより、高輝度画像を作成する。ここで、VMAXは入力画像内の最大輝度値であり、本実施形態において、係数pは0.98を用いるものとする。なお、係数pは、0.98に限るものではなく、
VTH / VMAX < p < 1.0 ・・・(式2)
を満たす範囲で、係数pの値を変更するようにしてもよい。このようにして、S203で生成される高輝度画像は、S201の二値化処理時の閾値よりも高い輝度を有し、かつ、背景色より低い輝度を有する画素を黒画素とし、それ以外の画素(輝度の低い画素および背景の画素)を白画素とした画像である。なお、係数pの値が大きくなるにつれて、式1を満たす画素の数も増え、不要なノイズも抽出しやすくなる傾向があるため、高輝度画像内において孤立点除去等のノイズ除去処理を行ってもよい。また、高輝度画像では濃度ムラのある画像も多いため、平滑化処理などの濃度ムラを改善する処理を予め行ってもよい。
第二の実施形態については、第一の実施形態との差分のみの説明とし、特に明記しない部分については第一の実施形態と同じ構成/手順となる。
第三の実施形態については、第一、二実施形態との差分のみの説明とし、特に明記しない部分については第一、二実施形態と同じ構成/手順となる。
第四の実施形態については、第一の実施形態との差分のみの説明とし、特に明記しない部分については第一の実施形態と同じ構成/手順となる。
また、本発明は、以下の処理を実行することによっても実現される。その処理は、上述した実施例の機能を実現させるソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (13)
- 入力画像を閾値に基づいて二値化することにより、二値画像を生成する二値化手段と、
前記入力画像において所定の高輝度の画素を黒画素化することにより高輝度画像を生成する生成手段と、
前記二値画像内の黒画素塊に基づいて特定される文字画像の位置と、前記高輝度画像内の黒画素塊の位置とに基づいて、前記高輝度画像内の黒画素塊を抽出対象にするか否か判定する判定手段と、
を備えることを特徴とする画像処理装置。 - 前記生成手段は、前記入力画像において、前記二値化手段で用いた閾値よりも高い輝度で且つ背景よりも低い輝度を有する画素を黒画素化することにより、前記高輝度画像を生成する、ことを特徴とする請求項1に記載の画像処理装置。
- 前記二値化手段で生成された前記二値画像において、文字画像と非文字画像とを特定する特定手段を更に備え、
前記判定手段は、前記特定手段で特定された文字画像の位置と、前記高輝度画像内の黒画素塊の位置とに基づいて、前記高輝度画像内の黒画素塊を抽出対象にするか否か判定する、ことを特徴とする請求項1または2に記載の画像処理装置。 - 前記判定手段は、前記二値画像内の黒画素塊に基づいて特定される文字画像の間にある前記高輝度画像内の黒画素塊を、抽出対象にしないと判定する、ことを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
- 前記判定手段は、前記高輝度画像内の黒画素塊の領域内に、前記二値画像内の黒画素塊に基づいて特定される文字画像がある場合、前記高輝度画像内の黒画素塊を、抽出対象にしないと判定する、ことを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。
- 前記二値画像内の黒画素塊に基づいて特定される文字画像と、前記判定手段で抽出対象として判定された前記高輝度画像内の黒画素塊とに対して、文字認識処理を実行する文字認識手段、を更に備えることを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
- 前記文字認識手段による文字認識結果に基づいて、KeyとValueの関係にある文字情報を抽出するKey-Value抽出手段、を更に有することを特徴とする請求項6に記載の画像処理装置。
- 前記判定手段は、前記高輝度画像内の黒画素塊の領域と、前記特定手段で特定された前記非文字画像が所定の範囲で重なっている場合、当該高輝度画像内の黒画素塊を、抽出対象にしないと判定する、ことを特徴とする請求項3に記載の画像処理装置。
- 前記特定手段は、前記非文字画像として罫線を特定し、
前記判定手段は、前記特定された罫線によって囲まれた前記高輝度画像内の黒画素塊の領域が複数並んで存在する場合、当該高輝度画像内の黒画素塊を、抽出対象にしないと判定する、ことを特徴とする請求項3に記載の画像処理装置。 - 前記高輝度画像内の黒画素塊に対して、文字認識処理を実行する文字認識手段、を更に備え、
前記判定手段は、前記二値画像内の黒画素塊に基づいて特定される文字画像の位置と、前記高輝度画像内の黒画素塊の位置と、前記文字認識手段による前記高輝度画像内の黒画素塊の文字認識処理の結果とに基づいて、前記高輝度画像内の黒画素塊を抽出対象にするか否か判定する、
ことを特徴とする請求項1に記載の画像処理装置。 - 前記文字認識手段による文字認識結果に基づいて、Keyの文字情報を判定し、当該判定されたKeyの文字情報に対応する位置の周辺に、前記判定手段で抽出対象にしないと判定された前記高輝度画像内の黒画素塊が存在する場合、当該抽出対象にしないと判定された前記高輝度画像内の黒画素塊に対して文字認識処理を行い、当該文字認識処理の結果に基づいて、当該高輝度画像内の黒画素塊を抽出対象に設定するか否か判定する第2の判定手段を、更に備えることを特徴とする請求項6に記載の画像処理装置。
- 入力画像を閾値に基づいて二値化することにより、二値画像を生成する二値化ステップと、
前記入力画像において所定の高輝度の画素を黒画素化することにより高輝度画像を生成する生成ステップと、
前記二値画像内の黒画素塊に基づいて特定される文字画像の位置と、前記高輝度画像内の黒画素塊の位置とに基づいて、前記高輝度画像内の黒画素塊を抽出対象にするか否か判定する判定ステップと、
を備えることを特徴とする画像処理方法。 - コンピュータを、請求項1乃至11のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020116595A JP2022014322A (ja) | 2020-07-06 | 2020-07-06 | 画像処理装置、画像処理方法、およびプログラム |
US17/364,015 US11948342B2 (en) | 2020-07-06 | 2021-06-30 | Image processing apparatus, image processing method, and non-transitory storage medium for determining extraction target pixel |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020116595A JP2022014322A (ja) | 2020-07-06 | 2020-07-06 | 画像処理装置、画像処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022014322A true JP2022014322A (ja) | 2022-01-19 |
JP2022014322A5 JP2022014322A5 (ja) | 2023-07-05 |
Family
ID=79166324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020116595A Pending JP2022014322A (ja) | 2020-07-06 | 2020-07-06 | 画像処理装置、画像処理方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11948342B2 (ja) |
JP (1) | JP2022014322A (ja) |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7873215B2 (en) * | 2007-06-27 | 2011-01-18 | Seiko Epson Corporation | Precise identification of text pixels from scanned document images |
JP4491488B2 (ja) * | 2008-03-03 | 2010-06-30 | シャープ株式会社 | 画像処理装置、画像読取装置、画像データ出力処理装置、および画像処理方法 |
JP2014036314A (ja) * | 2012-08-08 | 2014-02-24 | Canon Inc | スキャンサービスシステム、スキャンサービス方法及びスキャンサービスプログラム |
GB201610425D0 (en) * | 2016-06-15 | 2016-07-27 | Q-Linea Ab | Analysis of images of biological material |
JP6900164B2 (ja) * | 2016-09-27 | 2021-07-07 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP6903966B2 (ja) * | 2017-03-16 | 2021-07-14 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム及びプログラム |
JP2019159420A (ja) | 2018-03-07 | 2019-09-19 | キヤノン株式会社 | 画像処理装置、制御方法、およびそのプログラム |
JP6970835B2 (ja) * | 2018-09-28 | 2021-11-24 | 株式会社Pfu | 画像処理装置、制御方法及び制御プログラム |
JP7301529B2 (ja) * | 2018-11-30 | 2023-07-03 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
JP2021043775A (ja) * | 2019-09-12 | 2021-03-18 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
-
2020
- 2020-07-06 JP JP2020116595A patent/JP2022014322A/ja active Pending
-
2021
- 2021-06-30 US US17/364,015 patent/US11948342B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20220004795A1 (en) | 2022-01-06 |
US11948342B2 (en) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107093172B (zh) | 文字检测方法及系统 | |
CN101231698B (zh) | 分割图像和/或接收表示分割的图像的信号的设备和方法 | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
JP5887770B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2018121226A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2012205181A (ja) | 画像処理装置およびプログラム | |
JP2022147074A (ja) | 画像処理装置、画像処理方法およびプログラム | |
CN115131590B (zh) | 目标检测模型的训练方法、目标检测方法及相关设备 | |
JP2022014322A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP5742367B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2017174031A (ja) | 画像処理装置及び画像処理プログラム | |
KR102455883B1 (ko) | 신경망 기반 디지털 문서의 위아래 방향 판단 장치 및 방법 | |
JP5742283B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2020087320A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP5283267B2 (ja) | コンテンツ識別方法及び装置 | |
JP2008250425A (ja) | 帳票処理装置 | |
JP2022167414A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP4974367B2 (ja) | 領域分割方法及び装置、並びにプログラム | |
JP5213338B2 (ja) | 文字認識装置、文字認識方法、コンピュータプログラム | |
JP5747604B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2007280346A (ja) | 画像処理装置、画像方向判別方法、および画像方向判別プログラム | |
JP2006201885A (ja) | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 | |
JPH0535914A (ja) | 画像傾き検出方法 | |
JP2022019253A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2021189859A (ja) | 文書データ生成装置、画像形成装置、及び文書データ生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20200731 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230627 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230627 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20231213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240402 |