JP2009048499A - 画像処理装置、画像処理方法、及び、画像処理プログラム - Google Patents

画像処理装置、画像処理方法、及び、画像処理プログラム Download PDF

Info

Publication number
JP2009048499A
JP2009048499A JP2007215246A JP2007215246A JP2009048499A JP 2009048499 A JP2009048499 A JP 2009048499A JP 2007215246 A JP2007215246 A JP 2007215246A JP 2007215246 A JP2007215246 A JP 2007215246A JP 2009048499 A JP2009048499 A JP 2009048499A
Authority
JP
Japan
Prior art keywords
image
image processing
processing
data
rectangular area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007215246A
Other languages
English (en)
Other versions
JP4804433B2 (ja
Inventor
Yoshichika Ohashi
佳周 大橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007215246A priority Critical patent/JP4804433B2/ja
Priority to US12/190,032 priority patent/US8045229B2/en
Publication of JP2009048499A publication Critical patent/JP2009048499A/ja
Application granted granted Critical
Publication of JP4804433B2 publication Critical patent/JP4804433B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Character Input (AREA)

Abstract

【課題】画像処理の前段において、不要な要素が除外された処理用データを生成し、処理用データを用いて画像処理を行うことができる画像処理装置を提供する。
【解決手段】原稿の画像データから属性に基づいて矩形領域を抽出する抽出手段と、抽出された矩形領域の傾斜角度を算出する算出手段と、算出された傾斜角度の内、閾値以上の角度である傾斜角度を有する矩形領域を不要要素として判定し、閾値未満の角度である傾斜角度を有する矩形領域を必要要素として判定した結果に基づいて、必要要素を選択する選択手段と、選択された必要要素に対して画像処理を行う処理手段とを有する。
【選択図】図3

Description

本発明は、光学的に読み取られた原稿の画像に対して、所定の画像処理を施す画像処理装置及び方法に関する。
従来、スキャナ等で入力された帳票(以下、検索帳票ともいう)の画像を認識し、検索帳票を類似する帳票に自動的に分類する帳票認識技術が、広く用いられている。そのような帳票認識技術においては、スキャナ等により読み取られた検索帳票の画像データが、属性を有する複数の領域に分割され、それぞれの領域において特徴量が抽出される。複数の領域は、異なった属性を有する場合もある。更に、抽出された特徴量に応じて、検索帳票の帳票書式データが生成される。その検索帳票の帳票書式データと、事前に登録されている登録帳票の帳票書式データとの類似度が求められ、最も類似度が高い登録帳票が、帳票認識の結果とされる。そのような帳票書式データの類似度が求められる方法において、様々な技術が開発されている。
特許文献1には、画像特徴量抽出手段によって得られるテーブルブロックの注目度を帳票書式データに加え、その帳票書式データに基づいて帳票認識を行う帳票認識装置が開示されている。この文献によると、帳票認識結果として出力される類似度をより人の感覚的な印象に近い値とすることができると記載されている。
また、特許文献2には、帳票上の識別色領域を帳票識別に利用する光学文字読取装置が開示されている。この文献によると、記入者にとって無意味な文字による帳票IDではなく、帳票上の識別色領域が帳票識別に用いられるので、記入者に対して色分けされた見やすい帳票が提供され、一括して読取処理を行うことができると記載されている。
更に、特許文献3には、色情報、罫線情報等の認識結果等の複数の特徴を有する登録帳票を共通の特徴で予め分類しておくことにより、検索範囲を絞りながら帳票の識別を行う帳票識別装置が開示されている。この文献によると、複数の特徴を有する大量、多品種の帳票を識別することができると記載されている。
しかしながら、紙の媒体としての帳票は、管理する上で、例えば、「至急」や、「承認」といったような印が押印されたり、シールが添付されたりする場合がある。そのような帳票がスキャナ等により読み取られると、押印やシールが添付された箇所が、他と同様に、領域分割の対象となってしまい、不要な要素を含んだ帳票書式データを生成してしまう。また、領域を分割する技術は、帳票識別処理ばかりでなく、文字認識処理や傾斜補正処理等の画像処理一般に広く用いられる要素技術である。従って、押印やシールのような不要な要素については、様々な画像処理が行われる前段において除去されることが望ましい。しかしながら、以上の文献において、そのような課題は、特に記載されていない。
特開2000−285187号公報(段落[0070]) 特開2001−109842号公報(段落[0074]) 特開2000−285190号公報(段落[0092])
そこで、上記の点に鑑み、本発明は、画像処理の前段において、不要な要素が除外された処理用データを生成し、処理用データを用いて画像処理を行うことができる画像処理装置を提供することを目的とする。
上記課題を解決するため、本発明に係る画像処理装置は、原稿の画像データから属性に基づいて矩形領域を抽出する抽出手段と、抽出手段により抽出された矩形領域の傾斜角度を算出する算出手段と、算出手段により算出された傾斜角度の内、閾値以上の角度である傾斜角度を有する矩形領域を不要要素として判定し、閾値未満の角度である傾斜角度を有する矩形領域を必要要素として判定した結果に基づいて、必要要素を選択する選択手段と、選択手段により選択された必要要素に対して画像処理を行う処理手段とを有する。
本発明によれば、画像処理の前段において、不要な要素が除外された処理用データを生成し、処理用データを用いて画像処理を行うことができる。
以下に、本発明を実施するための最良の形態について、図面を参照しながら詳しく説明する。なお、同一の構成要素には同一の参照番号を付して、説明を省略する。
図1は、本発明に係る実施形態における画像処理装置の概略構成を示すブロック図である。図1に示すように、本画像処理装置は、CPU101、ROM102、RAM103、外部記憶装置104、ディスプレイ105を含んでいる。また、本画像処理装置は、入力装置106、スキャナ107、プリンタ108、ネットワークインタフェース109を含んでいる。CPU101は、ROM102に格納されている制御プログラムに従って、本画像処理装置の全体を制御する。ROM102には、制御プログラムの他に、各種のパラメータデータが格納されていても良い。RAM103は、画像データ等が格納されており、データの作業領域や、データの一時的な待機領域としても用いられる。外部記憶装置104は、例えば、ハードディスクやCDROM等で構成され、画像データを管理するデータベースを含む各種のデータが格納されている。例えば、文字認識処理で用いられる文字のパターンを有するデータベース等が格納されていても良い。ディスプレイ105は、例えば、LCDやCRTで構成されており、入力装置106は、例えば、マウスやペンタブレット等で構成されている。
スキャナ107は、例えば、カラー画像を入力することができるスキャナであって、帳票等の画像を光学的に読取り、画像データとして取得することができる。プリンタ108は、所定の画像処理が行われた画像データを印刷する。
図1に示す画像処理装置を汎用的なコンピュータで構成した場合に、例えば、制御プログラムが外部記憶装置104に格納され、オペレータの指示によって、RAM103に読み出され、実行されても良い。また、本画像処理装置は、ネットワークインタフェース109によって、外部のネットワークと通信することができる。例えば、外部のネットワークにサーバや外部記憶装置等が接続されていて、本画像処理装置は、ネットワークインタフェース109によって、プログラムやデータ等を読出し、又は、書き込むことができる。ここで、ネットワークとして、例えば、LANやWAN等の通信ネットワークが用いられても良い。そのような通信ネットワークとして、インターネット、電話回線、専用ディジタル回線、ATM、フレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等がある。図1に示すディスプレイ105やスキャナ107は、ネットワークインタフェース109を介して接続されても良い。本実施形態において、以上の機能ブロックは、システムバス等のバス110によって相互に接続されている。
図2は、図1に示す機能ブロックで構成された1つの実現例を示す図である。図2に示すように、画像処理装置は、コンピュータ装置201、スキャナ107、プリンタ108で構成されている。図2に示すコンピュータ装置201は、図1に示すCPU101、ROM102、RAM103、外部記憶装置104、ディスプレイ105、入力装置106、ネットワークインタフェース109を含んでおり、所定の画像処理を実行する。スキャナ107により光学的に読み取られた原稿は電子化され、電子化された画像データが、コンピュータ装置201に出力される。また、プリンタ108は、所定の画像処理が行われた画像データ等を印刷する。ここで、画像処理とは、帳票識別処理、画像生成処理、文字認識処理等をいう。本画像処理装置が行う画像処理については、後述する。また、図1に示されるディスプレイ105、プリンタ108は、出力機器の一例であり、他の出力装置が接続されていても良い。
以下、本発明の第1の実施形態に係る画像処理装置の動作について説明する。図3は、本発明の第1の実施形態に係る画像処理装置における帳票登録処理の手順を示すフローチャートである。ここで、帳票とは、複数の罫線によって囲まれた領域が複数配置されて構成されている画像をいう。
まず、ステップS301において、スキャナ107によって画像が入力される。ここで、入力される画像の一例を図4に示す。本実施形態においては、スキャナ107を用いて、図4に示すような帳票画像を入力している。入力された帳票画像は、スキャナ107によって2値化処理される。ステップS302において、入力された帳票画像の形状についての特徴量が抽出される。ここで、形状についての特徴量とは、帳票画像の内部に存在する、例えば、テーブルやフレーム、テキスト等の画像についての大きさや、位置、数、セル数等の情報をいう。図5は、ステップS302において、図4に示す帳票画像に含まれる各画像の形状についての特徴が抽出された様子を示す図である。図5に示すように、図4に示す画像は、文字列であるテキストブロックと、外枠で囲まれ内部に罫線が存在しないフレームブロックと、外枠で囲まれ内部に罫線が存在するテーブルブロックと、写真画像等のイメージブロックという特徴量として抽出されている。本実施形態において、ブロックとは、テキストの外接矩形、又は、黒画素の集合に外接する外接矩形で囲まれた矩形領域をいう。以下、図5に示すように、原稿の画像データから少なくとも1つの矩形領域が抽出された場合を説明している。また、本実施形態では、外接矩形でない形状で抽出された領域については、対象外とする。例えば、図4におけるラベル領域401が、下部のテーブル、即ち、図5に示すテーブルブロック504と重なっている場合には、外接矩形領域として抽出されないので、本実施形態の処理対象外とする。
テキストブロックは、テキスト属性を有する矩形領域であり、フレームブロックは、フレーム属性を有する矩形領域である。また、テーブルブロックは、テーブル属性を有する矩形領域であり、イメージブロックは、イメージ属性を有するイメージブロックである。本実施形態において、画像処理装置は、そのような矩形領域を抽出する手段を、抽出手段の1つとして有している。ステップS303において、ステップS302で抽出された複数のブロックから、テーブルブロックとフレームブロックとを選択する。例えば、図5においては、テーブルブロック504及び507と、フレームブロック501及び506及び508とが選択される。次に、ステップS304において、ステップS303において選択されたテーブルブロック及びフレームブロックの傾き(傾斜角度)が算出される。本実施形態における画像処理装置は、そのような機能を算出手段の1つとして有している。例えば、テーブルブロック又はフレームブロックを構成する矩形枠の一辺を構成する線と、画像上の座標を決定する基準となるX軸又はY軸等の基準軸とから角度が算出されても良い。算出された傾きは、各ブロックが有する傾斜情報として、例えば、ROM102等に格納される。図6は、選択されたテーブルブロック及びフレームブロックの傾斜情報を示す図である。図6に示す傾斜欄は角度を表しており、テーブルブロック又はフレームブロックが、時計回りに傾いている場合に正の値として示され、反時計周りに傾いている場合に負の値として示されている。ステップS305において、ステップS303において選択されたテーブルブロック及びフレームブロックの傾斜情報の絶対値を参照し、所定の閾値以上の傾きを有するブロックを抽出する。例えば、所定の閾値が、1度である場合には、−1度以下と+1度以上の傾きを有するブロックが抽出され、それらが原稿における不要な要素と判定される。また、所定の閾値より小さい(閾値未満)傾きのブロックは、不要でない要素と判定される。例えば、図6においては、フレームブロック501とフレームブロック508とが抽出され、不要な要素とされる。ここで、本実施形態において、所定の閾値は、ユーザインタフェースによってユーザにより指定されても良いし、他のブロックの傾斜情報との平均値を算出する等、動的な方法によって算出されても良い。ステップS305において、不要な要素と不要でない要素とが決定された画像データを処理用データとする(不要な要素と不要でない要素とを決定した矩形領域に関する処理用データを生成する)。本画像処理装置は、以上のような手段を生成手段の1つとして有している。なお、本実施形態において、不要な要素を不要要素ともいい、また、不要でない要素を必要要素ともいう。
本実施形態における画像処理装置は、外部から入力された原稿に対して、押印やシール等の傾きを有する要素を不要な要素とする処理を行う。更に、不要要素と必要要素とが決定された画像データ、即ち、処理用データに対して、画像の構造を分析したり、又は、画像の劣化の原因を除去したりする処理が行われても良い。
ステップS306において、処理用データにおける不要なブロックを除いた残りのブロックの特徴量が、外部記憶装置104に登録される。つまり、不要なブロック以外のブロックを特徴量抽出処理の処理対象として選択し、当該選択したブロックから抽出した特徴量を外部記憶装置に登録する。例えば、図5においては、フレームブロック501及び508を除いた残りのブロックの特徴量が、外部から入力された原稿の書式データとして、外部記憶装置104に登録される。不要な要素が除かれ、外部記憶装置104に登録された書式データは、本実施形態における処理手段の1つである帳票識別処理における登録帳票の書式データとして用いられることができる。
図7は、本発明の第1の実施形態に係る画像処理装置における帳票識別処理の手順を示すフローチャートである。図3において説明した、不要要素と必要要素とが決定された処理用データは、登録帳票だけでなく、帳票識別処理における検索帳票としても用いられることができる。
まず、ステップS701において、スキャナ107から帳票画像が入力される。本フローチャートにおいて、入力される帳票画像を、特に検索帳票という。ステップS702において、スキャナ107において読み取られた検索帳票の画像データは2値化処理され、図3に示すステップS302〜S306の処理によって、処理用データ及び書式データが生成される。次に、ステップS703において、事前に、外部記憶装置104等に登録されている比較の基準となる登録帳票の書式データとのマッチングを行い、最も類似した登録帳票の書式データを抽出し、検索帳票を登録帳票として識別する帳票識別処理を行う。ここで、帳票識別処理とは、本実施形態において画像処理装置が行う処理手段の1つである。
本実施形態においては、画像処理装置が帳票識別処理を行う場合に、領域分割された要素の内、閾値以上の角度を有するブロック、即ち、図4に示すラベル領域401及び402を検出する。検出されたラベル領域401及び402は、不要な要素として、登録帳票又は検索帳票の画像データから除外されることができる。従って、押印やシール等が添付された画像であっても、それらに影響されることなく、帳票識別処理が行われることができる。また、ステップS303において、ステップS302で抽出された複数のブロックから、テーブルブロックとフレームブロックとが選択されているが、イメージブロック等他の属性を有するブロックが選択されても良い。
次に、本発明の第2の実施形態に係る画像処理装置の動作について説明する。
図8は、本発明の第2の実施形態に係る画像処理装置における画像生成処理の手順を示すフローチャートである。まず、ステップS801において、図4に示すような帳票画像が、スキャナ107から入力される。ここで、スキャナ107により読み取られた帳票画像は、一時的にRAM103に格納される。以下、本実施形態において、その格納された帳票画像を、特に原画像という。RAM103に格納された原画像は、2値化処理され、ステップS802に進む。ステップS802において、原画像に含まれるそれぞれの画像の形状についての特徴量が抽出される。ここで、特徴量とは、第1の実施形態における説明と同様である。ステップS803において、図3に示すステップS303〜S305の処理が行われ、画像生成処理の対象から除外されるテーブルブロック及びフレームブロックが選択された処理用データが生成される。ステップS804において、RAM103に格納されている原画像が取り出され、処理用データを参照することによって、不要な各ブロックについての背景色が抽出される。例えば、本実施形態においては、各ブロックの矩形領域の1画素分外側の画素値を参照し、多数決方式により、最も多い画素値を背景色として採用する。ステップS805において、抽出された背景色によって、ステップS803において抽出されたブロックが塗り潰される。従って、原画像において、閾値以上の傾斜情報を有するブロックが、それぞれのブロックの背景色によって塗り潰される。ここで、図9は、ステップS806において生成された画像を示す図である。図9に示すように、ステップS806において、図4に示す原画像から「要処理」及び「保存対象」で示されるラベル領域401及び402が削除されている。ステップS807において、生成された画像が、ディスプレイ105又はプリンタ108等の出力装置から出力される。
本実施形態においては、画像処理装置が画像生成処理を行う場合に、領域分割された要素の内、閾値以上の角度を有するブロック、即ち、図4に示すラベル領域401及び402が、背景色によって塗り潰される。従って、押印やシール等が添付された画像であっても、それらに影響されることなく、画像生成処理が行われることができる。ここで、画像生成処理は、本実施形態において画像処理装置が行う処理手段の1つとして行われる。
本発明の第3の実施形態に係る画像処理装置の動作について説明する。本実施形態において、画像処理装置は、文字認識処理を行う。一般的に、文字認識処理は、スキャナーやファックス等によって読み取られた画像を2値化する2値化処理と、1文字ずつ切り出す切り出し処理と、切り出された文字に対して類似する文字をデータベース等により検索する認識処理とを含んでいる。本実施形態においては、スキャナ107によって帳票画像が入力され2値化されると、図3に示すステップS302〜S305が処理されることによって、閾値以上の角度を有するブロックが検出された処理用データが生成される。生成された処理用データは、例えば、外部記憶装置104に格納されても良い。以降の切り出し処理及び認識処理は、外部記憶装置104に格納された処理用データに対して行われる。
従って、本実施形態においては、画像処理装置が文字認識処理を行う前段に、領域分割された要素の内、閾値以上の角度を有するブロック、即ち、図4に示すラベル領域401及び402が検出された処理用データが生成される。また、文字認識処理が行われる際には、処理用データを参照し、不要な要素(ラベル領域401及び402)を除いた領域について文字認識処理が行われる。従って、押印やシール等が添付された画像であっても、それらに影響されることなく、文字認識処理が行われることができる。ここで、文字認識処理は、本実施形態において画像処理装置が行う処理手段の一例として行われる。また、このラベル領域以外の領域の文字認識結果を第1の実施形態における書式データ(特徴量)の一部として用いることも可能である。
なお、処理用データを参照し、ラベル領域401及び402それぞれの角度を補正して文字認識処理を行い、ラベル領域内の文字認識結果も得るようにしても良い。このラベル領域内の文字データは、帳票識別時の書式データとして使うことに適していないので処理対象から外すが、その場合にでも、例えば、登録した帳票画像をキーワード検索する際のメタデータとして使うことはできる。
本発明の第4の実施形態に係る画像処理装置の動作について説明する。本実施形態において、画像処理装置は、傾斜補正処理を行う。スキャナ等で画像を取り込む際に、原稿が斜行すると、取り込まれる画像データに傾斜が発生してしまう。そのような傾斜は、第1〜第3の実施形態において説明したような処理を行う場合に、精度の著しい低下を引き起こしてしまう。従って、傾斜した画像を検知し、正立画像に補正する処理が必要とされる。一般的に、そのような傾斜補正処理は、スキャナ等により画像が取り込まれると、X軸又はY軸等の基準軸との傾斜角を検知し、検知された傾斜角に応じて画像を回転することにより傾斜を補正する。しかしながら、押印やシールがあると、その影響で原稿の傾斜角の検知がうまく行われない場合があり得る。そこで、本実施形態においては、スキャナ107によって帳票画像が斜行して入力されると、まず、図3に示すステップS302〜S304の処理が行われる。更に、各ブロックの傾斜角が算出され、当該検出された各ブロックの傾斜角のデータを含む処理用データが生成される。生成された処理用データは、例えば、外部記憶装置104に格納されても良い。以降の傾斜補正処理は、外部記憶装置104に格納された処理用データに対して行われる。ここで、画像が斜行して取り込まれているので、画像内の多くのブロックに傾斜が発生している。そこで、本実施形態では、次に、ブロックの傾斜角の分布に基づいて、原稿自体の斜行による傾斜角を判断する。そして、その傾斜角よりも大きく外れた傾斜角を有するブロックを、押印やシール等であると判断する。例えば、傾斜角の分布において、ほぼ同じ傾斜角が複数存在すれば、当該傾斜角を斜行による傾斜と判断し、その傾斜角より大きく外れた傾斜角のブロックを押印やシールと判断する。つまり、画像内の複数のブロックそれぞれの傾斜角から特定の値を決定し、特定の値近傍に分布する傾斜角を有するブロックの傾斜については斜行によって生じたと判断する。更に、その特定の値から閾値以上大きく外れた傾斜角を有するブロックについては、押印やシール等であると判断する。その後、押印やシールと判定されたブロック以外のブロックに基づいて原稿の傾斜角を最終決定し、当該決定した傾斜角に基づいて原稿画像の傾き補正を行う。
本実施形態では、画像処理装置が傾斜補正処理を行う前段に、領域分割された要素の内、閾値以上の角度を有するブロック(即ち、図4に示すラベル領域401及び402に相当するブロック)を検知し、それ以外のブロックに基づいて原稿の傾斜角を決定する。従って、押印やシール等が添付された画像であっても、それらに影響されることなく、精度の良い傾斜補正処理を行うことができる。また、傾斜補正処理を行った後、不要な要素を除いた領域について文字認識処理が行われるようにしても良い。なお、不要な要素(押印やシールの領域)については、領域毎に傾斜補正処理を行って文字認識処理を行っても良い。ここで、傾斜補正処理は、本実施形態において画像処理装置が行う処理手段の一例として行われる。
本発明の第5の実施形態に係る画像処理装置の動作について説明する。本実施形態において、画像処理装置は、原稿内の文字の向きに基づいて原稿の方向補正処理を行う。例えば、スキャナ等によって画像が取り込まれる際に、原稿の向きが指定とは逆向きに配置されていると、文字認識処理が行われることができない。そのような場合に、文字の方向を認識し、正しい方向に文字を補正するということが広く知られている。従って、本実施形態においては、スキャナ107によって帳票画像が入力されると、まず、図3に示すステップS302〜S305の処理が行われ、閾値以上の角度を有するブロックが検出された処理用データが生成される。生成された処理用データは、例えば、外部記憶装置104に格納されても良い。以降の方向補正処理は、外部記憶装置104に格納された処理用データに対して行われる。
従って、本実施形態においては、画像処理装置が方向補正処理を行う前段に、領域分割された要素の内、閾値以上の角度を有するブロック、即ち、図4に示すラベル領域401及び402が検出された処理用データが生成される。また、方向補正処理が行われる際には、処理用データを参照し、不要な要素(ラベル領域401及び402)を除いた領域に基づいて文字の方向を検知し、その結果、原稿の方向を決定して原稿の方向補正処理が行われる。従って、押印やシール等が添付された画像であっても、それらに影響されることなく、方向補正処理が行われることができる。ここで、方向補正処理は、本実施形態において画像処理装置が行う処理手段の一例として行われる。
本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用されても良いし、また、1つの機器からなる装置に適用されても良い。なお、前述した実施形態の機能を実現するソフトウエアのプログラム(実施形態の図に示されたフローチャートに対応したプログラム)が、システムあるいは装置に、直接あるいは遠隔から供給されても良い。その場合に、本発明は、システムあるいは装置が、該供給されたプログラムコードを読み出して実行することによっても達成される場合を含んでいる。本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体を含んでいる。その場合に、プログラムの機能を有していれば、オブジェクトコードやインタプリタにより実行されるプログラムや、OSに供給されるスクリプトデータ等の形態とされても良い。プログラムを供給するための記録媒体として、例えば、フロッピーディスク(登録商標)、ハードディスク、光ディスク、光磁気ディスクがある。また、他には、MO、CDROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)等がある。
プログラムは、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、ホームページから本発明のコンピュータプログラム自身を含んだファイルをハードディスク等の記録媒体にダウンロードされて供給されても良い。その場合に、ファイルが、圧縮され自動インストール機能を含んでいても良い。また、本発明のプログラムを構成するプログラムコードが複数のファイルに分割され、それぞれのファイルが異なるホームページからダウンロードされても良い。従って、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれる。
また、本発明のプログラム(画像処理プログラム)が暗号化され、CDROM等の記憶媒体に格納してユーザに配布されても良い。その場合に、所定の条件をクリアしたユーザは、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードし、その鍵情報を用いて、暗号化されたプログラムを実行し、コンピュータにインストールして本発明の機能を実現することができる。また、コンピュータが、読み出されたプログラムを実行することによる他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOS等が、実際の処理の一部または全部を行なうことによっても本実施形態の機能は実現され得る。更に、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれても良い。その場合に、そのプログラムの指示に基づき、機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行なうことによっても本実施形態の機能は実現され得る。
本発明に係る実施形態における画像処理装置の概略構成を示すブロック図である。 図1に示す機能ブロックで構成された1つの実現例を示す図である。 本発明の第1の実施形態に係る画像処理装置における帳票登録処理の手順を示すフローチャートである。 図3に示すステップS301において、入力される画像の一例を示す図である。 図3に示すステップS302において、図4に示す帳票画像の形状についての特徴が抽出された様子を示す図である。 選択されたテーブルブロック及びフレームブロックの傾斜情報を示す図である。 本発明の第1の実施形態に係る画像処理装置における帳票識別処理の手順を示すフローチャートである。 本発明の第2の実施形態に係る画像処理装置における画像生成処理の手順を示すフローチャートである。 図8に示すステップS806において生成された画像を示す図である。
符号の説明
101 CPU
102 ROM
103 RAM
104 外部記憶装置
105 ディスプレイ
106 入力装置
107 スキャナ
108 プリンタ
109 ネットワークインタフェース
110 バス
201 コンピュータ装置
401、402 ラベル領域

Claims (9)

  1. 原稿の画像データから属性に基づいて矩形領域を抽出する抽出手段と、
    前記抽出手段により抽出された前記矩形領域の傾斜角度を算出する算出手段と、
    前記算出手段により算出された前記傾斜角度の内、閾値以上の角度である前記傾斜角度を有する前記矩形領域を不要要素として判定し、閾値未満の角度である前記傾斜角度を有する前記矩形領域を必要要素として判定した結果に基づいて、前記必要要素を選択する選択手段と、
    前記選択手段により選択された前記必要要素に対して画像処理を行う処理手段と、
    を有することを特徴とする画像処理装置。
  2. 前記処理手段が、
    前記必要要素を登録帳票の書式データとしてメモリに格納し、
    検索帳票の書式データと、前記メモリに格納された前記登録帳票の書式データとを比較し、前記検索帳票の書式データに最も類似した書式データを有する前記登録帳票を識別する帳票識別処理を行う請求項1記載の画像処理装置。
  3. 前記処理手段が、
    前記必要要素を検索帳票の書式データとし、
    前記検索帳票の書式データをメモリに格納された比較の基準とされる登録帳票の書式データと比較し、前記検索帳票の書式データに最も類似した書式データを有する前記登録帳票を識別する帳票識別処理を行う請求項1記載の画像処理装置。
  4. 前記処理手段が、
    外部から入力された前記原稿の画像データを出力装置に出力する画像生成処理を行う請求項1記載の画像処理装置。
  5. 前記処理手段が、
    文字認識処理を行う請求項1記載の画像処理装置。
  6. 前記処理手段が、
    前記原稿の読み取り時の斜行によって生じた前記原稿の画像データの傾斜を算出し、当該原稿の画像データの傾斜を補正する傾斜補正処理を行う請求項1記載の画像処理装置。
  7. 前記処理手段が、
    前記原稿の画像データに含まれる文字の方向を検知し、文字の方向が定められた方向となっていない場合に、前記方向を補正することによって、方向補正処理を行う請求項1記載の画像処理装置。
  8. 抽出手段が、原稿の画像データから属性に基づいて矩形領域を抽出する抽出ステップと、
    算出手段が、前記抽出手段により抽出された前記矩形領域の傾斜角度を算出する算出ステップと、
    選択手段が、前記算出手段により算出された前記傾斜角度の内、閾値以上の角度である前記傾斜角度を有する前記矩形領域を不要要素として判定し、閾値未満の角度である前記傾斜角度を有する前記矩形領域を必要要素として判定した結果に基づいて、前記必要要素を選択する選択ステップと、
    処理手段が、前記選択手段により選択された前記必要要素に対して画像処理を行う処理ステップと、
    を有することを特徴とする画像処理方法。
  9. コンピュータを、
    原稿の画像データから属性に基づいて矩形領域を抽出する抽出手段、
    前記抽出手段により抽出された前記矩形領域の傾斜角度を算出する算出手段、
    前記算出手段により算出された前記傾斜角度の内、閾値以上の角度である前記傾斜角度を有する前記矩形領域を不要要素として判定し、閾値未満の角度である前記傾斜角度を有する前記矩形領域を必要要素として判定した結果に基づいて、前記必要要素を選択する選択手段、
    前記選択手段により選択された前記必要要素に対して画像処理を行う処理手段、
    として機能させるための画像処理プログラム。
JP2007215246A 2007-08-21 2007-08-21 画像処理装置、画像処理方法、及び、画像処理プログラム Expired - Fee Related JP4804433B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007215246A JP4804433B2 (ja) 2007-08-21 2007-08-21 画像処理装置、画像処理方法、及び、画像処理プログラム
US12/190,032 US8045229B2 (en) 2007-08-21 2008-08-12 Image processing apparatus, image processing method and medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007215246A JP4804433B2 (ja) 2007-08-21 2007-08-21 画像処理装置、画像処理方法、及び、画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2009048499A true JP2009048499A (ja) 2009-03-05
JP4804433B2 JP4804433B2 (ja) 2011-11-02

Family

ID=40381852

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007215246A Expired - Fee Related JP4804433B2 (ja) 2007-08-21 2007-08-21 画像処理装置、画像処理方法、及び、画像処理プログラム

Country Status (2)

Country Link
US (1) US8045229B2 (ja)
JP (1) JP4804433B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363982B2 (en) * 2007-10-09 2013-01-29 Nec Corporation Method for rotating image, program for rotation, recording medium, and rotation device
JP5931841B2 (ja) * 2013-11-28 2016-06-08 京セラドキュメントソリューションズ株式会社 原稿読取装置及び画像形成装置
KR20180019976A (ko) * 2016-08-17 2018-02-27 에스프린팅솔루션 주식회사 화상 형성 장치, 그의 스캔 이미지 보정 방법 및 비일시적 컴퓨터 판독가능 기록매체

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05174182A (ja) * 1991-12-19 1993-07-13 Seiko Epson Corp 文書傾き角検出方法および文書傾き角検出装置
JPH08212343A (ja) * 1995-02-03 1996-08-20 Oki Electric Ind Co Ltd 印鑑照会登録システム
JPH0981669A (ja) * 1995-09-19 1997-03-28 Oki Electric Ind Co Ltd 光学式文字読取り装置
JP2002109470A (ja) * 2000-09-27 2002-04-12 Minolta Co Ltd 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2003141444A (ja) * 2001-10-30 2003-05-16 Canon Inc 画像処理装置および画像処理装置の制御方法およびプログラムおよび記憶媒体
JP2006201965A (ja) * 2005-01-19 2006-08-03 Oki Electric Ind Co Ltd 帳票識別システム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5452374A (en) * 1992-04-06 1995-09-19 Ricoh Corporation Skew detection and correction of a document image representation
JP3851742B2 (ja) 1999-03-31 2006-11-29 株式会社東芝 帳票処理方法及び装置
JP4416202B2 (ja) 1999-03-31 2010-02-17 キヤノン株式会社 帳票認識装置、情報システム、及び記憶媒体
JP2001109842A (ja) 1999-10-12 2001-04-20 Hitachi Ltd 光学文字読取装置
JP4219542B2 (ja) * 2000-09-07 2009-02-04 富士ゼロックス株式会社 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体
US7903876B2 (en) * 2007-02-27 2011-03-08 Seiko Epson Corporation Distortion correction of a captured image

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05174182A (ja) * 1991-12-19 1993-07-13 Seiko Epson Corp 文書傾き角検出方法および文書傾き角検出装置
JPH08212343A (ja) * 1995-02-03 1996-08-20 Oki Electric Ind Co Ltd 印鑑照会登録システム
JPH0981669A (ja) * 1995-09-19 1997-03-28 Oki Electric Ind Co Ltd 光学式文字読取り装置
JP2002109470A (ja) * 2000-09-27 2002-04-12 Minolta Co Ltd 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2003141444A (ja) * 2001-10-30 2003-05-16 Canon Inc 画像処理装置および画像処理装置の制御方法およびプログラムおよび記憶媒体
JP2006201965A (ja) * 2005-01-19 2006-08-03 Oki Electric Ind Co Ltd 帳票識別システム

Also Published As

Publication number Publication date
JP4804433B2 (ja) 2011-11-02
US20090051978A1 (en) 2009-02-26
US8045229B2 (en) 2011-10-25

Similar Documents

Publication Publication Date Title
US7965892B2 (en) Image processing apparatus, control method thereof, and program
EP2241999B1 (en) Underline removal apparatus
JP2006295606A (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
US7680339B2 (en) Image processing method and apparatus for edge detection in an image
JPWO2007049340A1 (ja) 電子透かしの埋め込み及び検出
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
US7630572B2 (en) Image processing apparatus, image processing method, and computer program
JP4437756B2 (ja) 情報抽出方法および情報抽出装置および情報抽出プログラムおよび記憶媒体
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP4804433B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2007109179A (ja) 画像処理装置及びその制御方法、プログラム
JP4275973B2 (ja) 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法
JP2007109177A (ja) 画像処理装置及びその制御方法、プログラム
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2002024838A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP3090070B2 (ja) 帳票識別方法及び装置
JP4164458B2 (ja) 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2007109178A (ja) 画像処理装置及びその制御方法、プログラム
JP4083723B2 (ja) 画像処理装置
JP2010258627A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JPS63101983A (ja) 文字列抽出方式
JP4854398B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4420443B2 (ja) 帳票認識装置及びその制御方法、プログラム
JP4434803B2 (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100714

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110715

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110809

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140819

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees