JP4706764B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP4706764B2 JP4706764B2 JP2009018577A JP2009018577A JP4706764B2 JP 4706764 B2 JP4706764 B2 JP 4706764B2 JP 2009018577 A JP2009018577 A JP 2009018577A JP 2009018577 A JP2009018577 A JP 2009018577A JP 4706764 B2 JP4706764 B2 JP 4706764B2
- Authority
- JP
- Japan
- Prior art keywords
- line segment
- line
- image
- module
- ruled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
- G06V30/18095—Summing image-intensity values; Projection and histogram analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
請求項1の発明は、画像内の線分長を計測する線分長計測手段と、前記線分長計測手段によって計測された線分長と前記線分の位置に基づいて、該線分の評価を行う線分長評価手段と、前記線分の評価を行う類似性評価手段と、前記線分長評価手段による評価結果と前記類似性評価手段による評価結果に基づいて、罫線であるか否かを判定する罫線判定手段を具備し、前記類似性評価手段は、次式による類似性指数を評価結果とする
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前であることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
ランとは、線分である。ラン長とは、横方向又は縦方向(走査方向又は副走査方向)の線分の画素数をいう。そのランの画素は黒であってもよいし、白であってもよい。なお、本実施の形態の説明においては、黒の画素を対象とする。したがって、ラン長の計測とは、画像内を横方向又は縦方向に走査して黒画素の連続している画素数を計数することである。これによって、横線又は縦線の長さを計測している。
このように、ラン長評価モジュール122は、線分は罫線を構成する短い線分又は長い線分であるかの評価を行う。そして、評価結果として、線分の位置毎に合計された黒画素数を罫線判定モジュール130に渡す。また、対象画像の縦方向の位置においても同様のことを行う。
罫線であると判定された線分は、横線又は縦線であり、その線種は、実線、点線、破線等が含まれている。つまり、元の画像内の文字等は削除されて、罫線だけからなる画像を生成する。
画像処理装置全体は、画像受付モジュール210、オブジェクト分離モジュール220、表領域抽出モジュール230、表罫線補正モジュール240、上書きモジュール250、文字認識モジュール260、情報構成モジュール270、出力モジュール280を備えている。
また、画像受付モジュール210は、受け付けた画像に対して、ノイズ除去、傾き補正、正規化等の前処理を行うようにしてもよい。
部分画像への分離は、画像から空白等で区切られた領域(部分画像)を抽出することによって行う。この部分画像に分離する処理は、例えば、画像受付モジュール210によって受け付けられた画像から白画素の領域が一定の長さ(あるいは面積)以上あるところによって区切る。そのように区切ると、黒画素の領域(例えば、矩形)を抽出することができる。さらに、その黒画素の領域の画像としての特徴(例えば、面積、縦又は横の大きさ、形状、黒画素塊の存在位置等)を抽出し、文字領域、図形領域、表領域、写真領域等の種別を判別することができる。もちろん他の既存の方法で部分画像を抽出してもよい。
例えば、図4の例に示す表領域画像400が該当する。表領域画像400内には、横罫線420から424、縦罫線430から440によって構成されている表410がある。また、図4の例に示すように、表410内の各セルには文字が記載されている。ここで、表領域画像400に対して、例えば、垂直方向に黒画素数をその位置(横方向)毎に計数したもの(ヒストグラム)を示すと、図5の例に示すようになる。この波形から罫線とその他の部分(文字がある部分)とを、閾値を用いて分離することは困難である。図5の例に示すように、点線、破線部分の罫線の黒画素数と文字部分の黒画素数とは区別がつかないからである。
ステップS312では、ラン長評価モジュール122が、ラン長が閾値1Hよりも小又はラン長が閾値2Hよりも大(run<th1H or run>th2H)である範囲にあるランを抽出する。
ステップS320では、罫線判定モジュール130が、ステップS318でのRLUが閾値3Hよりも大であるか否かを判断する。大である場合(Yes)はステップS322へ進み、それ以外の場合(No)はステップS324へ進む。例えば、図7(a)の例に示すような場合、閾値3Hよりも大である部分はない。
ステップS324では、ステップS316かつステップS320でNoと判断された場合、罫線画像生成モジュール140が、対象としている表領域画像からその水平方向の画素を消すようにする。図6(a)の例では、該当箇所として投影波形621、622、623以外の部分があり、図7(a)の例では、全て該当箇所である。したがって、ステップS324による処理終了時点では、表領域画像400から投影波形621、622、623以外の部分を削除することとなる。
ステップS326では、罫線画像生成モジュール140が、ステップS322の処理によって残された画像とステップS324の処理によって削除された画像から、罫線である横線だけを残したマスク画像を生成する。また、図8(a)の例に示すように、図6(a)に示した例と図7(a)に示した例とを合成したものから、マスク画像を生成するようにしてもよい。
ステップS352では、ラン長評価モジュール122が、ラン長が閾値1Vよりも小又はラン長が閾値2Vよりも大(run<th1V or run>th2V)である範囲にあるランを抽出する。
ステップS360では、罫線判定モジュール130が、ステップS358でのRLUが閾値3Vよりも大であるか否かを判断する。大である場合(Yes)はステップS362へ進み、それ以外の場合(No)はステップS364へ進む。例えば、図7(b)の例に示すような場合、閾値3Vよりも大である部分(投影波形711、712、713)が3つあることを示しており、それぞれ縦罫線434、436、438に対応する。
ステップS364では、ステップS356かつステップS360でNoと判断された場合、罫線画像生成モジュール140が、対象としている表領域画像からその垂直方向の画素を消すようにする。図6(b)の例では、該当箇所として投影波形611、612、613、614以外の部分があり、図7(b)の例では、該当箇所として投影波形711、712、713以外の部分がある。したがって、ステップS364による処理終了時点では、表領域画像400から投影波形611、612、613(711)、712、713、614以外の部分を削除することとなる。
ステップS366では、罫線画像生成モジュール140が、ステップS362の処理によって残された画像とステップS364の処理によって削除された画像から、罫線である縦線だけを残したマスク画像を生成する。また、図8(b)の例に示すように、図6(b)に示した例と図7(b)に示した例とを合成したものから、マスク画像を生成するようにしてもよい。
ステップS382では、罫線画像補正モジュール150が、膨張、収縮処理を行って、点線、破線等を実線化する。例えば、図9の例に示した表410は、図10の例に示したようになる。つまり、図4の例に示した表410内から文字が削除されて、実線化された罫線の表1010が生成されることとなる。
また、図3の例に示したフローチャートでは、ステップS302からステップS310とステップS350の処理に分かれたが、ステップS310からステップS326までの処理を行った後に、受け付けられた画像を90度回転して、再度ステップS310からステップS326までの処理を行うようにしてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…ラン評価モジュール
122…ラン長評価モジュール
124…ラン類似性評価モジュール
130…罫線判定モジュール
140…罫線画像生成モジュール
150…罫線画像補正モジュール
210…画像受付モジュール
220…オブジェクト分離モジュール
230…表領域抽出モジュール
240…表罫線補正モジュール
250…上書きモジュール
260…文字認識モジュール
270…情報構成モジュール
280…出力モジュール
Claims (6)
- 前記線分長評価手段は、前記線分の位置毎に、予め定められた範囲内にある線分長を有する線分の累積画素数に基づいて、該線分の評価を行う
ことを特徴とする請求項1に記載の画像処理装置。 - 前記類似性評価手段は、前記線分の位置毎に、類似性指数を算出する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記線分長計測手段は、画像の縦方向における線分長及び横方向における線分長を計測し、
前記線分長評価手段、前記類似性評価手段における線分の位置は、前記画像の縦方向における位置及び横方向における位置であり、
前記罫線判定手段は、線分が縦罫線であるか否かの判定と線分が横罫線であるか否かの判定を行う
ことを特徴とする請求項1から3のいずれか一項に記載の画像処理装置。 - 前記罫線判定手段によって罫線であると判定された線分を用いて表画像を生成する表画像生成手段と、
前記表画像生成手段によって生成された表画像の罫線を実線に変換する実線変換手段
をさらに具備することを特徴とする請求項1から4のいずれか一項に記載の画像処理装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009018577A JP4706764B2 (ja) | 2009-01-29 | 2009-01-29 | 画像処理装置及び画像処理プログラム |
US12/505,747 US8805076B2 (en) | 2009-01-29 | 2009-07-20 | Image processing apparatus, image processing method and computer readable medium |
KR1020090075957A KR101336901B1 (ko) | 2009-01-29 | 2009-08-18 | 화상 처리 장치, 화상 처리 방법 및 기록 매체 |
CN2009101671110A CN101794388B (zh) | 2009-01-29 | 2009-08-18 | 图像处理装置和图像处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009018577A JP4706764B2 (ja) | 2009-01-29 | 2009-01-29 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010176414A JP2010176414A (ja) | 2010-08-12 |
JP4706764B2 true JP4706764B2 (ja) | 2011-06-22 |
Family
ID=42354193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009018577A Expired - Fee Related JP4706764B2 (ja) | 2009-01-29 | 2009-01-29 | 画像処理装置及び画像処理プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US8805076B2 (ja) |
JP (1) | JP4706764B2 (ja) |
KR (1) | KR101336901B1 (ja) |
CN (1) | CN101794388B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5724341B2 (ja) * | 2010-12-06 | 2015-05-27 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
TWI461656B (zh) * | 2011-12-01 | 2014-11-21 | Ind Tech Res Inst | 距離感測裝置及距離感測方法 |
JP6468463B2 (ja) * | 2015-07-30 | 2019-02-13 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
JP7234719B2 (ja) * | 2019-03-18 | 2023-03-08 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04291479A (ja) * | 1991-03-19 | 1992-10-15 | Ricoh Co Ltd | 罫線認識方法及び表処理方法 |
JPH07230525A (ja) * | 1993-12-22 | 1995-08-29 | Ricoh Co Ltd | 罫線認識方法及び表処理方法 |
JPH0895966A (ja) * | 1994-09-21 | 1996-04-12 | Casio Comput Co Ltd | 表罫線編集装置 |
JPH10134180A (ja) * | 1996-10-30 | 1998-05-22 | Hitachi Ltd | 認識辞書自動生成方法 |
JPH10171922A (ja) * | 1996-12-05 | 1998-06-26 | Ricoh Co Ltd | 罫線消去装置及び記録媒体 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3838729C2 (de) * | 1987-11-16 | 1994-05-05 | Canon Kk | Dokumentverarbeitungsgerät |
KR950006410B1 (ko) * | 1989-10-20 | 1995-06-15 | 가부시기갸이샤 히다찌세이사꾸쇼 | 서식문서의 화상표시/처리방법 및 장치 |
US5191612A (en) * | 1990-03-13 | 1993-03-02 | Fujitsu Limited | Character recognition system |
JP3052438B2 (ja) | 1991-07-03 | 2000-06-12 | 松下電器産業株式会社 | 表認識装置 |
DE69333694T2 (de) * | 1992-09-11 | 2005-10-20 | Canon K.K. | Verfahren und Anordnung zur Bildverarbeitung |
JPH0713999A (ja) | 1993-06-23 | 1995-01-17 | Matsushita Electric Ind Co Ltd | 表認識装置 |
US6466687B1 (en) * | 1997-02-12 | 2002-10-15 | The University Of Iowa Research Foundation | Method and apparatus for analyzing CT images to determine the presence of pulmonary tissue pathology |
JPH1176658A (ja) | 1997-09-05 | 1999-03-23 | Brother Ind Ltd | 刺繍データ処理装置及びミシン並びに記録媒体 |
JPH11123289A (ja) | 1997-10-22 | 1999-05-11 | Brother Ind Ltd | 刺繍データ処理装置及び刺繍ミシン並びに記録媒体 |
JP4742404B2 (ja) * | 2000-05-17 | 2011-08-10 | コニカミノルタビジネステクノロジーズ株式会社 | 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 |
-
2009
- 2009-01-29 JP JP2009018577A patent/JP4706764B2/ja not_active Expired - Fee Related
- 2009-07-20 US US12/505,747 patent/US8805076B2/en not_active Expired - Fee Related
- 2009-08-18 KR KR1020090075957A patent/KR101336901B1/ko active IP Right Grant
- 2009-08-18 CN CN2009101671110A patent/CN101794388B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04291479A (ja) * | 1991-03-19 | 1992-10-15 | Ricoh Co Ltd | 罫線認識方法及び表処理方法 |
JPH07230525A (ja) * | 1993-12-22 | 1995-08-29 | Ricoh Co Ltd | 罫線認識方法及び表処理方法 |
JPH0895966A (ja) * | 1994-09-21 | 1996-04-12 | Casio Comput Co Ltd | 表罫線編集装置 |
JPH10134180A (ja) * | 1996-10-30 | 1998-05-22 | Hitachi Ltd | 認識辞書自動生成方法 |
JPH10171922A (ja) * | 1996-12-05 | 1998-06-26 | Ricoh Co Ltd | 罫線消去装置及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
CN101794388A (zh) | 2010-08-04 |
JP2010176414A (ja) | 2010-08-12 |
KR20100088052A (ko) | 2010-08-06 |
CN101794388B (zh) | 2013-10-23 |
KR101336901B1 (ko) | 2013-12-04 |
US8805076B2 (en) | 2014-08-12 |
US20100189307A1 (en) | 2010-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5240047B2 (ja) | キーワード識別方法及装置 | |
JP4310288B2 (ja) | 画像処理装置及びその方法、プログラム並びに記憶媒体 | |
JP5934762B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置 | |
US20100008585A1 (en) | Image processing apparatus, image processing method, computer-readable medium and computer data signal | |
US8155945B2 (en) | Image processing apparatus, image processing method, computer-readable medium and computer data signal | |
JP4706764B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4232679B2 (ja) | 画像形成装置およびプログラム | |
KR20090098650A (ko) | 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체 | |
JP5365440B2 (ja) | 画像処理装置及び画像処理プログラム | |
US10924620B2 (en) | Document reading guidance for operator using feature amount acquired from image of partial area of document | |
US20230062113A1 (en) | Information processing apparatus, information processing method and non-transitory storage medium | |
JP5262778B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5742283B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5489894B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6547301B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6606885B2 (ja) | 画像処理装置及び画像処理プログラム | |
US9325872B2 (en) | Image processing apparatus | |
US20220343666A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP5062076B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4995507B2 (ja) | 画像処理システム、文字認識システムおよび画像処理プログラム | |
KR20230080784A (ko) | 수치화 장치 및 방법 | |
CN111046758A (zh) | 一种打印暗记追踪比对方法及系统 | |
JP2009009179A (ja) | 画像処理装置及び画像処理プログラム | |
JP2019195117A (ja) | 情報処理装置、情報処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101210 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110228 |
|
LAPS | Cancellation because of no payment of annual fees |