JP2005234845A - 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 - Google Patents
画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP2005234845A JP2005234845A JP2004042389A JP2004042389A JP2005234845A JP 2005234845 A JP2005234845 A JP 2005234845A JP 2004042389 A JP2004042389 A JP 2004042389A JP 2004042389 A JP2004042389 A JP 2004042389A JP 2005234845 A JP2005234845 A JP 2005234845A
- Authority
- JP
- Japan
- Prior art keywords
- image
- cell
- table area
- document
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】この画像処理装置は、原稿画像の二値化画像を識別して表領域画像を抽出し、該表領域画像をセル画像に分割する場合、前記原稿画像がカラー画像またはグレースケール画像に対しては、前記表領域画像に対応する前記原稿画像から所定の長さ以上のエッジを抽出し、前記表領域画像に該エッジを罫線として重ねあわせて新たな表領域画像を生成し、該重ね合わせて生成された表領域画像をセル画像に分割するようにした。
【選択図】図2
Description
このような文字認識を行う場合、まず、文書画像を文字領域、写真や図形などのイメージ領域または表領域などに分割し、それぞれの領域に別の処理を行うことが多い。
表領域に関しては、表を構成する罫線の位置を認識し、罫線で囲まれた枠内(セル)を一つの文字領域とし、セル内の文字行が横書きであるか縦書きであるかを判別し、この判別結果に応じて各セル内の文字行の抽出方法を切り替えて文字認識を行っている。
この判定により、縦長の枠中に横書きの文字行がある場合でも、文字列の方向を縦書きと誤って判定することがない。
請求項6に記載の発明は、請求項5に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
また、二値化画像の場合や、色や濃淡によるセルの分割に失敗した場合であっても、セル内の情報を用いて、セル内の文字行の方向を推定することができる。これにより、文字認識処理の行切り出しの失敗を防ぐことができる。
図1は、本発明の画像処理装置を適用した文字認識装置の概略ブロック図である。ここに示す文字認識装置は、スキャナ装置のような画像入力装置と液晶ディスプレイ等の表示装置を接続して、画像入力装置から読み取った文字領域および表領域の画像にある文字を認識して文字コードに変換し、その認識結果を他のアプリケーションソフトウェアで使用できるようにする。その変換の際、認識途中における作業支援のために表示装置が使われる。
入力部10は、カラー画像入力機器(例えば、デジタルカラー複写機、スキャナ、カメラ等)からカラー原稿やグレースケール原稿を入力してA/D変換処理を行い、原画像記憶部15へ記憶する。また、デジタルカメラのアプリケーションソフトウェアや文書画像解析・認識システムから画像データを受信したり、すでに画像データを格納しているファイルから入力するようにしてもよい。
前処理部30は、二値化画像記憶部25に記憶された二値化画像のスキュー補正やノイズ除去を行って、二値化画像記憶部25を更新する。
図2は、表領域処理部60の機能構成を示すブロック図であり、同図において、表領域処理部60は、罫線設定部61、セル分割部62および行方向推定部63を含んで構成されている。
このとき、数画素程度の切れは、連続していると判断をし、所定の長さ以上続いている場合を罫線として判断する。従って、領域識別処理によって表領域として抽出されなかった表領域以外の画像には影響は及ぼさない。
まず、主走査方向の仮想罫線や罫線を次のようにして設定する。
表領域のすべての画素に対して、主走査方向に2×3画素の窓(図4(1))を設け、この窓を主走査方向にずらしながら、窓内で副走査方向に対する画素の濃度差が所定の閾値を越えている画素連続を抽出する(図5(A),(B))。この画素連続の長さが所定の長さ以上続いている場合に、この画素連続を罫線或いは仮想罫線(図5(B))であると判断する(ステップS01)。
ここで、濃度差のない画素連続が1つの窓の幅以下であれば、画素連続であると判断する。
上記ステップS01とS02とを表領域の画像のすべての画素について処理するまで繰り返す(ステップS03)。
まず最初、表領域中のセルの行方向は、ユーザが指定した原稿の行方向(ユーザが原稿の行方向は横と指定すればセル方向は横になる)、または、行方向を自動設定するモードが設定された場合は、領域識別部40で求められた行方向がデフォルト値としてセットされる。
(1)縦横比が所定値よりも大きい縦長のセルである。
(2)セル内の行数が1行または2行である。
(3)セルの縦の長さが表の縦の大きさの1/2より短い。
(4)表領域の左半分にセルが含まれている(図6)。
(5)縦横比が所定よりも大きい縦長のセルである。
(6)セル内の行数が1行である。
(7)セルの縦の長さが表の縦の大きさの1/2より長い。
(11)縦横比が所定値よりも大きい横長のセルである。
(12)セル内の行数が1行または2行である。
(13)セルの横の長さが表の横の大きさの1/2より短い。
(14)表領域の上半分にセルが含まれている(図6)。
(15)縦横比が所定よりも大きい横長のセルである。
(16)セル内の行数が1行である。
(17)セルの横の長さが表の横の大きさの1/2より長い。
ここで、表領域をセルに分割する罫線が掠れなどによって、セル内に存在することがあり、これによる悪影響を除外するために、横長矩形や縦長矩形の最大値を求める際には、その値が所定の値よりも小さな矩形のみを対象として最大値を求めるようにする。
また、二値化画像の場合や、色や濃淡によるセルの分割に失敗した場合であっても、セル内の情報を用いて、セル内の文字行の方向を推定することができる。これにより、文字認識処理の行切り出しの失敗を防ぐことができる。
この場合、記録媒体から読み出されたプログラム自体が上述した実施形態の機能を実現することになり、そのプログラムおよびそのプログラムを記録した記録媒体も本発明を構成することになる。
なお、コンピュータでは、可搬型の記録媒体上のプログラム、または転送されてくるプログラムをインストールし、そのインストールされたプログラムを実行することによって上述した実施形態の機能が実現される。
Claims (6)
- 原稿画像の二値化画像を識別して表領域画像を抽出する領域識別手段と、該表領域画像をセル画像に分割するセル分割手段とを有する画像処理装置において、前記原稿画像がカラー画像またはグレースケール画像の場合、前記表領域画像に対応する前記原稿画像から所定の長さ以上のエッジを抽出し、前記表領域画像に該エッジを罫線として重ねあわせて新たな表領域画像を生成する罫線設定手段を有し、前記セル分割手段は、該重ね合わせて生成された表領域画像をセル画像に分割するようにしたことを特徴とする画像処理装置。
- 請求項1に記載の画像処理装置において、前記セル分割手段で分割されたセル画像内の黒画素の連結成分の外接矩形を抽出し、該外接矩形から求めた標準文字サイズと前記セル画像の大きさとからセル内の行数を算出し、前記行数と、前記セル画像の大きさと、前記セル画像の表中での位置とからセル内の文字行方向を推定する行方向推定手段を有することを特徴とする画像処理装置。
- 原稿画像の二値化画像を識別して表領域画像を抽出し、該表領域画像をセル画像に分割する画像処理方法において、前記原稿画像がカラー画像またはグレースケール画像の場合、前記表領域画像に対応する前記原稿画像から所定の長さ以上のエッジを抽出し、前記表領域画像に該エッジを罫線として重ねあわせて新たな表領域画像を生成し、該重ね合わせて生成された表領域画像をセル画像に分割するようにしたことを特徴とする画像処理方法。
- 原稿画像を入力する原稿画像入力手段と、前記原稿画像の二値化画像を識別して表領域画像を抽出する領域識別手段と、該表領域画像をセル画像に分割するセル分割手段と、該セル画像を文字認識する文字認識手段とを有する文字認識装置において、前記原稿画像がカラー画像またはグレースケール画像の場合、前記表領域画像に対応する前記原稿画像から所定の長さ以上のエッジを抽出し、前記表領域画像に該エッジを罫線として重ねあわせて新たな表領域画像を生成する罫線設定手段を有し、前記セル分割手段は、該重ね合わせて生成された表領域画像をセル画像に分割するようにしたことを特徴とする文字認識装置。
- コンピュータに、請求項1または2に記載の画像処理装置の機能、または、請求項4に記載の文字認識装置の機能を実行させるためのプログラム。
- 請求項5に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004042389A JP4420440B2 (ja) | 2004-02-19 | 2004-02-19 | 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004042389A JP4420440B2 (ja) | 2004-02-19 | 2004-02-19 | 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005234845A true JP2005234845A (ja) | 2005-09-02 |
JP4420440B2 JP4420440B2 (ja) | 2010-02-24 |
Family
ID=35017747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004042389A Expired - Fee Related JP4420440B2 (ja) | 2004-02-19 | 2004-02-19 | 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4420440B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008198157A (ja) * | 2007-02-16 | 2008-08-28 | Fujitsu Ltd | 表認識プログラム、表認識方法および表認識装置 |
JP2010282270A (ja) * | 2009-06-02 | 2010-12-16 | Takenaka Komuten Co Ltd | 部材情報管理システム |
JP2012048343A (ja) * | 2010-08-25 | 2012-03-08 | Fujifilm Corp | ドキュメント閲覧システム及びドキュメント画像配信装置並びにドキュメント閲覧方法 |
JP5240194B2 (ja) * | 2007-06-07 | 2013-07-17 | ソニー株式会社 | 信号処理方法および信号処理装置 |
JP2017084012A (ja) * | 2015-10-26 | 2017-05-18 | シャープ株式会社 | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 |
CN107016663A (zh) * | 2016-11-30 | 2017-08-04 | 浙江理工大学 | 一种基于改进l0梯度的织物沾水区域分割方法 |
CN110263682A (zh) * | 2019-06-04 | 2019-09-20 | 北京华宇信息技术有限公司 | 基于轮廓提取的表格识别方法和装置、设备及存储介质 |
-
2004
- 2004-02-19 JP JP2004042389A patent/JP4420440B2/ja not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008198157A (ja) * | 2007-02-16 | 2008-08-28 | Fujitsu Ltd | 表認識プログラム、表認識方法および表認識装置 |
JP5240194B2 (ja) * | 2007-06-07 | 2013-07-17 | ソニー株式会社 | 信号処理方法および信号処理装置 |
JP2010282270A (ja) * | 2009-06-02 | 2010-12-16 | Takenaka Komuten Co Ltd | 部材情報管理システム |
JP2012048343A (ja) * | 2010-08-25 | 2012-03-08 | Fujifilm Corp | ドキュメント閲覧システム及びドキュメント画像配信装置並びにドキュメント閲覧方法 |
JP2017084012A (ja) * | 2015-10-26 | 2017-05-18 | シャープ株式会社 | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 |
CN107016663A (zh) * | 2016-11-30 | 2017-08-04 | 浙江理工大学 | 一种基于改进l0梯度的织物沾水区域分割方法 |
CN110263682A (zh) * | 2019-06-04 | 2019-09-20 | 北京华宇信息技术有限公司 | 基于轮廓提取的表格识别方法和装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4420440B2 (ja) | 2010-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3768052B2 (ja) | カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体 | |
JP4525787B2 (ja) | 画像抽出装置、及び画像抽出プログラム | |
EP2270746B1 (en) | Method for detecting alterations in printed document using image comparison analyses | |
US7738734B2 (en) | Image processing method | |
JP4189506B2 (ja) | 画像処理のための装置、方法及び記録媒体 | |
US8326078B2 (en) | System and method for removing artifacts from a digitized document | |
US20050047660A1 (en) | Image processing apparatus, image processing method, program, and storage medium | |
JP4420440B2 (ja) | 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 | |
JP4275973B2 (ja) | 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法 | |
JP4502001B2 (ja) | 画像処理装置および画像処理方法 | |
JP6780271B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2001076095A (ja) | 情報処理装置及びその方法 | |
JP2004127203A (ja) | 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US11570331B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP7406884B2 (ja) | 情報処理装置、プログラム及び制御方法 | |
JP2009217303A (ja) | テロップ文字抽出方法およびテロップ文字認識装置 | |
JP4162195B2 (ja) | 画像処理装置、及び画像処理プログラム | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
US20180013918A1 (en) | Image processing apparatus and method with partition image processing function | |
US11778122B2 (en) | Apparatus, method, and storage medium for removing shading dots | |
JP2003317107A (ja) | 罫線抽出方法及び装置 | |
JP4738645B2 (ja) | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 | |
JP2009272714A (ja) | 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体 | |
JP2010182052A (ja) | 画像処理装置及び画像処理プログラム | |
JP3618926B2 (ja) | 文書画像の傾き検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061228 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090210 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090311 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090825 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091021 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091130 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4420440 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131211 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |