JP6874387B2 - 画像処理装置、画像処理方法およびプログラム - Google Patents
画像処理装置、画像処理方法およびプログラム Download PDFInfo
- Publication number
- JP6874387B2 JP6874387B2 JP2017011844A JP2017011844A JP6874387B2 JP 6874387 B2 JP6874387 B2 JP 6874387B2 JP 2017011844 A JP2017011844 A JP 2017011844A JP 2017011844 A JP2017011844 A JP 2017011844A JP 6874387 B2 JP6874387 B2 JP 6874387B2
- Authority
- JP
- Japan
- Prior art keywords
- colors
- color
- image
- components
- ruled line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Description
ラン1の中心座標Xc1=(xs1+xe1)/2
ラン2の中心座標Xc2=(xs2+xe2)/2
罫線の傾きA=ラン2の中心座標Xc2−ラン1の中心座標Xc1
(A−1)表候補矩形内に垂直罫線と水平罫線がそれぞれ3本以上存在すること。
(A−2)表候補矩形内に垂直罫線と水平罫線のどちらかが2本以上存在し、もう一方が4本以上存在すること。
(B−1)表候補矩形が大きすぎないこと(例えば画像サイズの95%以上ではないこと)。入力画像のほとんどを囲うような矩形は原稿の縁の可能性があるので除外するという意図である。
(B−2)表候補矩形の縦幅もしくは横幅が大きい(例えば800画素以上)とき、表候補矩形内に縦罫線と横罫線がどちらも3本以上あること。これを満たさない場合は、囲い枠であって表ではないと判断して除外するという意図である。
(B−3)表候補矩形の縦幅もしくは横幅が大きい(例えば800画素以上)とき、表候補矩形内の密集度(幅/罫線の数で表すことができる)が密(例えば300画素/本以上)であること。密集していない場合、表の中に絵柄が含まれやすいので除外するという意図である。
(条件)表矩形の面積に対して罫線の面積が所定の割合以上(例えば40%以上)であること。
(条件1)表矩形外に存在すること。
(条件2)太い罫線候補であること(例えば8画素以上の太さを持つ罫線候補)。
(条件3)斜めの罫線の確度αが低いこと(例えば5画素以上の線幅を持つ場合など)。
(条件1)罫線色、セル色、文字色の色数がそれぞれ1つであること。
(条件2)罫線色、文字色の色数が1つでかつ黒であること。
(条件3)セル色の色数が1つでかつ白であること。
(条件1)罫線色、文字色の色数が1つでかつ白であること。
(条件1)表矩形内の罫線色、セル色、文字色の色数がそれぞれ1つであること。
(条件2)表矩形内の罫線色、セル色、文字色の色数の合計が2つであること(セル色が罫線色、文字色に入り込んでいる場合を想定)。
(条件3)表矩形内の罫線色が黒、文字色が黒であること。
(条件4)表矩形内の罫線色が白、文字色が白であること。
(α)スキャナの特性上、エッジ部は鈍るために正しい色にならないので、同色の罫線と文字のエッジ部を除外する。
(β)残った罫線画素と文字画素の画素数と平均色をそれぞれ計測し、画素数の多い方の平均色を罫線色および文字色とて採用する。
これにより、表矩形領域内で罫線色と文字色の一部が統一されるので、高画質化が実現できる。また、文字や罫線が細い場合でも、エッジ部ではなく罫線もしくは文字の内部の安定した色を使用できるため、文字や罫線の色を別々で統一するよりも変色を少なくできる。
(条件1)セル色が1色であること。
(条件2)セル色が白色と、白以外の色であること。
(条件3)セル色が白を含まない2色以上であること。
10 検出部
11 第1の検出部
12 エッジ強調部
13 第2の検出部
14 算出部
15 決定部
16 圧縮処理部
17 ファイル生成部
18 原稿種判定部
101 CPU
102 RAM
103 ROM
104 HDD
105 ネットワークI/F
131 第1の生成部
132 第1の線画候補検出部
133 第2の生成部
134 第2の線画候補検出部
135 検出処理部
136 統一部
137 出力部
Claims (9)
- 多値画像から、複数の罫線で区切られる複数のセルの各々に文字を表示可能な表を検出する検出部と、
前記表の構成要素の情報に基づいて、前記表の構成要素の色を統一する方法を切り替える統一部と、を備え、
前記統一部は、
前記表の構成要素の色数に応じて、前記構成要素の色の統一を行うか否かを切り替え、
前記表に含まれる罫線の色数に応じて、罫線の色を統一するか否かを切り替え、
着目した罫線の色数が1つの場合は、その色で該罫線を塗りつぶし、
着目した罫線の色数が2つで、それぞれ罫線に対応する色、セルに対応する色だった場合は、罫線に対応する色に統一し、
着目した罫線の色数が2以上で、罫線に対応する色、セルに対応する色以外の色が存在する場合、該罫線の色は変更しない、
画像処理装置。 - 前記統一部は、前記表に含まれる文字の色数に応じて、文字の色を統一するか否かを切り替える、
請求項1に記載の画像処理装置。 - 多値画像から、複数の罫線で区切られる複数のセルの各々に文字を表示可能な表を検出する検出部と、
前記表の構成要素の情報に基づいて、前記表の構成要素の色を統一する方法を切り替える統一部と、を備え、
前記統一部は、
前記表の構成要素の色数に応じて、前記構成要素の色の統一を行うか否かを切り替え、
前記表に含まれるセルの色数に応じて、セルの色を統一するか否かを切り替える、
画像処理装置。 - 多値画像から、複数の罫線で区切られる複数のセルの各々に文字を表示可能な表を検出する検出部と、
前記表の構成要素の情報に基づいて、前記表の構成要素の色を統一する方法を切り替える統一部と、を備え、
前記統一部は、原稿種に応じて、前記表の構成要素の色を統一するか否かを切り替える、
画像処理装置。 - 前記多値画像に対して、背景よりも低輝度のオブジェクトを抽出するための2値化を行って第1の画像を生成する第1の生成部と、
前記多値画像に対して、背景よりも高輝度のオブジェクトを検出するための2値化を行って第2の画像を生成する第2の生成部と、をさらに備える、
請求項1乃至4のうちの何れか1項に記載の画像処理装置。 - 前記検出部は、
前記第1の画像に基づいて前記表を検出し、
前記表の構成要素が所定の条件を満たす場合は、前記第2の画像に含まれる線画のうち前記表の領域に重なる部分を除外する、
請求項5に記載の画像処理装置。 - 前記検出部は、
前記第2の画像に基づいて前記表を検出し、
前記表の構成要素が所定の条件を満たす場合は、前記第1の画像に含まれる線画のうち前記表の領域に重なる部分を除外する、
請求項5に記載の画像処理装置。 - 多値画像から、複数の罫線で区切られる複数のセルの各々に文字を表示可能な表を検出する検出ステップと、
前記表の構成要素の情報に基づいて、前記表の構成要素の色を統一する方法を切り替える統一ステップと、を含み、
前記統一ステップは、原稿種に応じて、前記表の構成要素の色を統一するか否かを切り替える、
画像処理方法。 - コンピュータに、
多値画像から、複数の罫線で区切られる複数のセルの各々に文字を表示可能な表を検出する検出ステップと、
前記表の構成要素の情報に基づいて、前記表の構成要素の色を統一する方法を切り替える統一ステップと、を実行させ、
前記統一ステップは、原稿種に応じて、前記表の構成要素の色を統一するか否かを切り替える、
ためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017011844A JP6874387B2 (ja) | 2017-01-26 | 2017-01-26 | 画像処理装置、画像処理方法およびプログラム |
US15/861,635 US10699110B2 (en) | 2017-01-26 | 2018-01-03 | Image processing apparatus, image processing method, and non-transitory recording medium storing program for causing computer to execute image processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017011844A JP6874387B2 (ja) | 2017-01-26 | 2017-01-26 | 画像処理装置、画像処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018121226A JP2018121226A (ja) | 2018-08-02 |
JP6874387B2 true JP6874387B2 (ja) | 2021-05-19 |
Family
ID=62906514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017011844A Active JP6874387B2 (ja) | 2017-01-26 | 2017-01-26 | 画像処理装置、画像処理方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10699110B2 (ja) |
JP (1) | JP6874387B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6939449B2 (ja) * | 2017-11-14 | 2021-09-22 | 株式会社リコー | 画像処理装置、画像処理方法および画像処理プログラム |
CN109726643B (zh) * | 2018-12-13 | 2021-08-20 | 北京金山数字娱乐科技有限公司 | 图像中表格信息的识别方法、装置、电子设备及存储介质 |
CN111402282B (zh) * | 2019-01-02 | 2023-10-27 | 中国移动通信有限公司研究院 | 一种图像处理方法及设备 |
JP7259491B2 (ja) * | 2019-04-01 | 2023-04-18 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
US11282187B2 (en) | 2019-08-19 | 2022-03-22 | Ricoh Company, Ltd. | Inspection system, inspection apparatus, and method using multiple angle illumination |
JP7333733B2 (ja) * | 2019-09-13 | 2023-08-25 | 株式会社Pfu | 媒体搬送装置、制御方法及び制御プログラム |
JP7404875B2 (ja) | 2020-01-06 | 2023-12-26 | 株式会社リコー | 検査システム、情報処理装置およびプログラム |
US11887393B2 (en) * | 2021-03-02 | 2024-01-30 | Claritrics Inc. | End-to-end system for extracting tabular data present in electronic documents and method thereof |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2890306B2 (ja) | 1988-07-12 | 1999-05-10 | 富士ゼロックス株式会社 | 表領域分離装置および表領域分離方法 |
US5416308A (en) * | 1991-08-29 | 1995-05-16 | Video Lottery Technologies, Inc. | Transaction document reader |
JP3985928B2 (ja) | 2000-02-14 | 2007-10-03 | 株式会社リコー | 画像処理方法、画像処理装置、文字認識装置及び記憶媒体 |
JP2005190010A (ja) * | 2003-12-24 | 2005-07-14 | Fuji Xerox Co Ltd | 画像処理装置 |
JP4861711B2 (ja) | 2005-07-27 | 2012-01-25 | 株式会社リコー | 画像処理装置、画像圧縮方法、画像圧縮プログラム及び記録媒体 |
US8260057B2 (en) | 2007-07-12 | 2012-09-04 | Ricoh Company, Limited | Image processing apparatus that obtains a ruled line from a multi-value image |
JP5042917B2 (ja) | 2007-07-12 | 2012-10-03 | 株式会社リコー | 画像処理装置およびプログラム |
JP2010186246A (ja) * | 2009-02-10 | 2010-08-26 | Nec Corp | 画像処理装置、方法、及び、プログラム |
TWI411927B (zh) * | 2010-04-02 | 2013-10-11 | Primax Electronics Ltd | 嵌入資訊於輸入影像的方法、自輸入影像中擷取出資訊的方法以及相關裝置 |
JP6693310B2 (ja) | 2015-07-24 | 2020-05-13 | 株式会社リコー | 画像処理装置、画像処理方法およびプログラム |
JP6648580B2 (ja) | 2016-03-18 | 2020-02-14 | 株式会社リコー | 原稿種認識装置、画像形成装置、原稿種認識方法およびプログラム |
-
2017
- 2017-01-26 JP JP2017011844A patent/JP6874387B2/ja active Active
-
2018
- 2018-01-03 US US15/861,635 patent/US10699110B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10699110B2 (en) | 2020-06-30 |
US20180211106A1 (en) | 2018-07-26 |
JP2018121226A (ja) | 2018-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6874387B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
US10455117B2 (en) | Image processing apparatus, method, and storage medium | |
US8009908B2 (en) | Area testing method for image processing | |
JP3990375B2 (ja) | 画像処理装置および画像処理方法 | |
JP2001297303A (ja) | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 | |
US9349237B2 (en) | Method of authenticating a printed document | |
JP2008148298A (ja) | 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体 | |
JP2009535899A (ja) | 走査されたカラー画像からの複調画像の生成 | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
KR20120132314A (ko) | 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체 | |
JP5042917B2 (ja) | 画像処理装置およびプログラム | |
US8620081B2 (en) | Image processing apparatus, method, and storage medium for determining attributes | |
JP5887242B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
US8577132B2 (en) | Electronic document generation system, electronic document generation method, and program | |
JP4208520B2 (ja) | 画像処理装置および画像処理方法、プログラムおよび記憶媒体 | |
KR101820848B1 (ko) | 화상형성장치, 화상처리방법 및 컴퓨터 판독가능 기록매체 | |
JP2012205133A (ja) | 画像処理装置およびその制御方法 | |
JP2017118433A (ja) | 画像処理装置、画像処理方法およびプログラム | |
US10931852B2 (en) | Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region | |
US20120194883A1 (en) | Character detection apparatus, character detection method, and computer-readable storage medium | |
US11948342B2 (en) | Image processing apparatus, image processing method, and non-transitory storage medium for determining extraction target pixel | |
JPWO2020065980A1 (ja) | 画像処理装置、制御方法及び制御プログラム | |
US9098768B2 (en) | Character detection apparatus, character detection method, and computer-readable storage medium | |
JP2017118299A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2006345456A (ja) | 画像処理装置、方法、プログラム及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210119 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210323 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210405 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6874387 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |