JP2009272962A - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP2009272962A
JP2009272962A JP2008122705A JP2008122705A JP2009272962A JP 2009272962 A JP2009272962 A JP 2009272962A JP 2008122705 A JP2008122705 A JP 2008122705A JP 2008122705 A JP2008122705 A JP 2008122705A JP 2009272962 A JP2009272962 A JP 2009272962A
Authority
JP
Japan
Prior art keywords
read image
writing
character
erecting
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008122705A
Other languages
English (en)
Inventor
Katsumi Minamino
勝巳 南野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Murata Machinery Ltd
Original Assignee
Murata Machinery Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Murata Machinery Ltd filed Critical Murata Machinery Ltd
Priority to JP2008122705A priority Critical patent/JP2009272962A/ja
Publication of JP2009272962A publication Critical patent/JP2009272962A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Facsimiles In General (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】読取画像の正立方向を自動判別することができる画像処理装置を提供する。
【解決手段】文字並び判別部13は、読取画像内において横方向及び縦方向に延びる地色画素からなる白帯領域を検出し、横方向の白帯領域の数と、縦方向の白帯領域の数とを比較して、当該読取画像内の文字の並び方向を判別する。書出方向判別部14は、この並び方向に基づいて文字領域の両端位置を求め、両端位置のばらつきに基づいて、文字の書出方向を判別する。また、縦書き又は横書きのいずれであるのかが記載様式として指定される。正立方向判別部15は、これらの書出方向及び記載様式に基づいて、読取画像の正立方向を判別する。
【選択図】図7

Description

本発明は、画像処理装置に係り、更に詳しくは、文書原稿の光学読み取りを行って生成された読取画像の正立方向を判別する画像処理装置に関する。また、上記画像処理装置をコンピュータを用いて実現するためのコンピュータプログラムに関する。
一般に、デジタル複合機は、スキャナ、プリンタ、ファクシミリ通信部などを備え、紙媒体からなる文書原稿をスキャナにより光学的に読み取って、読取画像を生成することができる。この様にして生成された読取画像は、プリンタによって紙媒体に印刷され、ファクシミリ通信部によって他のファクシミリ装置へ送信され、あるいは、ディスプレイに表示させることができる。
スキャナによって生成された読取画像は上下左右の向きを有している。このため、読取画像に文字が含まれている場合、読取画像の向きと文字の向きとの関係が問題となる。文字には正しい向きがあり、本明細書では、文字が正しい向きで配置されている状態を正立状態と呼び、正立状態における文字の上方向を正立方向と呼ぶことにする。また、文書原稿や読取画像内に文字が含まれている場合、当該文字の正立方向を文書原稿や読取画像の正立方向と呼ぶことにする。さらに、読取画像の上方向と正立方向が一致している状態を正立状態、逆向きになっている状態を倒立状態と呼ぶ。
スキャナを用いて正立状態の読取画像を生成させるためには、文書原稿の正立方向を予め定められたスキャナの基準方向と一致させておく必要がある。原稿台に文書原稿を正しい向きで載置した場合には、正立状態の読取画像が生成されるが、例えば、この文書原稿を180°回転させて載置すれば、倒立状態の読取画像が生成される。このような倒立状態の読取画像が生成された場合、当該読取画像をディスプレイに正しく表示させるためには、当該読取画像をディスプレイ上に一旦表示させ、読取画像の正立方向がどの方向であるのかを閲覧者が判断し、読取画像を回転させて再表示させる必要があった。
そこで、読取画像の正立方向を自動判別することができれば、必要に応じて読取画像を回転させ、正立状態の読取画像に変換するという煩雑な作業をユーザが行う必要がなくなる。
ここで、文書原稿の傾きを補正する技術が既に知られている。この傾き補正は、スキャナの基準方向に対し、文書原稿の向きが僅かにずれてスキュー角が発生している場合に、矩形からなる文書原稿の端辺を検出し、当該スキュー角を補償するように読取画像を回転させる方法である。このような傾き補正は、90°よりも十分に小さい角度を補償できるに過ぎず、読取画像の正立方向がいずれであるのかを判別しているわけではない。
また、読取画像の正立方向を自動判別するための方法として、パターンマッチングの技術が知られている(例えば特許文献1)。特許文献1に記載された自動判別方法は、90°×n(n=0〜3)回転させた基準文字パターンと、読取画像から切り出された文字パターンとを照合することによって、読取画像の正立方向を判別するものである。このようなパターンマッチング処理は、演算量が多いことから、処理能力の高い演算処理装置が必要であり、また、処理時間が長くなるという問題があった。
特許第3630705号公報
本発明は、上記の事情に鑑みてなされたものであり、読取画像の正立方向を自動判別することができる画像処理装置を提供することを目的とする。特に、演算負荷を顕著に増大させることなく、読取画像の正立方向の自動判別を可能にすることを目的とする。
第1の本発明による画像処理装置は、文書原稿の光学読み取りを行って、読取画像を生成する光学読取手段と、縦書き又は横書きのいずれかを記載様式として指定する記載様式指定手段と、上記読取画像における文字の並び方向を判別する文字並び判別手段と、上記並び方向に基づいて、上記読取画像における文字の書出方向を判別する書出方向判別手段と、上記書出方向及び記載様式に基づいて、上記読取画像の正立方向を判別する正立方向判別手段とを備えて構成される。
この画像処理装置では、まず文字の並び方向を判別し、この並び方向に基づいて文字の書出方向を判別している。このようにして求められた書出方向と、指定された記載様式とに基づいて、文書の正立方向を判別することができる。例えば、読取画像の上下左右の4方向のうち、いずれの方向が正立方向であるのかを判別することができる。また、読取画像の上下の2方向のいずれが正立方向であるのかを判別するものであってもよい。
第2の本発明による画像処理装置は、上記構成に加えて、上記文字並び判別手段が、上記読取画像を構成する縦方向及び横方向の画素列であって、画素値の和が白帯判定範囲内となる1又は2以上の画素列からなる白帯領域を検出する白帯領域検出手段を有し、これらの白帯領域の数に基づいて文字の並び方向を判別しするように構成される。この様な構成によれば、縦方向及び横方向の白帯領域を検出し、その数に基づいて、文字の並び方向を判別することができるので、複雑な演算処理を行うことなく、文字の並び方向を判別することができる。
第3の本発明による画像処理装置は、上記構成に加えて、上記文字並び判別手段が、上記読取画像を構成する縦方向及び横方向の画素列であって、画素値の和が白帯判定範囲内となる1又は2以上の画素列からなる白帯領域を検出する白帯領域検出手段を有し、これらの白帯領域の幅に基づいて文字の並び方向を判別するように構成される。この様な構成によれば、縦方向及び横方向の白帯領域を検出し、その幅に基づいて、文字の並び方向を判別することができるので、複雑な演算処理を行うことなく、文字の並び方向を判別することができる。
第4の本発明による画像処理装置は、上記構成に加えて、上記書出方向判別手段が、上記並び方向における文字の両端位置の偏差に基づいて書出方向を判別するように構成される。この様な構成によれば、複雑な演算処理を行うことなく、文字の書出方向を判別することができる。
第5の本発明による画像処理装置は、上記構成に加えて、上記書出方向判別手段が、幅が白ブロック判定レベルを超える上記白帯領域によって区切られた1又は2以上の文字ブロックを上記読取画像から抽出する文字ブロック抽出手段と、上記文字ブロック内における上記両端位置の偏差を検出する両端偏差検出手段とを有し、上記文字ブロックごとの上記両端位置の偏差に基づいて、上記読取画像における文字の書出方向を判別するように構成される。この様な構成によれば、複雑な演算処理を行うことなく、文字の書出方向を容易に判別することができる。
第6の本発明による画像処理装置は、上記構成に加えて、上記正立方向判別手段の判別結果を表示する表示手段を備えている。この様な構成により、読取画像の正立方向の判別結果をユーザに知らせることができる。
第7の本発明による画像処理装置は、上記構成に加えて、上記正立方向判別手段の判別結果に基づいて、上記読取画像を回転させる画像回転手段を備えて構成される。このような構成によれば、読取画像を回転させて、その上方向と正立方向とを一致させた正立状態にすることができる。従って、正立状態の読取画像を記憶装置に保存したり、印刷出力したり、ファクシミリ送信したり、ディスプレに表示したりすることができる。
第8の本発明による画像処理装置は、上記構成に加えて、言語種別を指定する言語種別指定手段を備え、上記正立方向判別手段が、上記書出方向、記載様式及び言語種別に基づいて、上記読取画像の正立方向を判別するように構成される。このような構成により、文書原稿に記載されている言語に応じて、正立方向を判別することができる。例えば、書出方向が右側となる言語の場合であっても正立方向を正しく判別することができる。
第9の本発明によるコンピュータプログラムは、光学読取装置による文書原稿の光学読み取りを制御し、読取画像を生成する光学読取ステップと、縦書き又は横書きのいずれかが記載様式として指定される記載様式指定ステップと、上記読取画像における文字の並び方向を判別する文字並び判別ステップと、上記並び方向に基づいて、上記読取画像における文字の書出方向を判別する書出方向判別ステップと、上記書出方向及び記載様式に基づいて、上記読取画像の正立方向を判別する正立方向判別ステップとを実行するための手順からなる。
本発明によれば、文字の並び方向を判別した後に文字の書出方向を判別し、当該書出方向と、縦書き又は横書きからなる記載様式とに基づいて、読取画像の正立方向を判別している。このため、読取画像の正立方向を容易に判別することができる。また、演算負荷を顕著に増大させることなく、このような自動判別を実現することができる。
特に、読取画像内で白帯領域を検出することによって文字の並び方向を判別し、この並び方向における文字の両端位置の偏差に基づいて書出方向を判別している。このため、演算負荷を顕著に増大させることなく、このような自動判別を実現することができる。
さらに、指定された言語種別に基づいて読取画像の正立方向を判別している。このため、文書原稿に記載されている言語に応じて正立方向を判別することができ、特殊な言語が記載されている場合であっても正立方向を正しく判別することができる。
実施の形態1.
図1は、本発明の実施の形態1による画像処理装置100の一構成例を示したブロック図であり、画像処理装置の一例としてデジタル複合機が示されている。この画像処理装置100は、主制御部1、スキャナ2、操作入力部3、端末通信部4、表示出力部5、プリンタ6、ファクシミリ通信部7及びデータ記憶部8により構成される。
主制御部1は、画像処理装置100を構成する他のブロック2〜8を制御する制御手段であり、マイクロプロセッサ及びその周辺回路からなる。また、読取画像の正立方向を判別する正立方向判別処理や、判別された正立方向に基づいて読取画像を回転させ、その上方向と正立方向を一致させる正立化処理も主制御部1において行われている。これらの判別処理の詳細については後述する。
スキャナ2は、紙媒体からなる文書原稿に対し光を照射し、その反射光を受光することによって、文書原稿の画像情報を光学的に読み取って、読取画像を生成する光学読取装置である。生成された読取画像はデータ記憶部8に格納される。スキャナ2の原稿台には基準方向が予め定められており、この基準方向が、読取画像の上方向に対応づけられている。従って、文書原稿の正立方向をスキャナ2の基準方向と一致させるように原稿台に文書原稿を載置して光学読み取りを行えば、正立状態の読取画像が生成される。
なお、スキャナ2によって生成される読取画像は、多数のピクセル情報によって構成される画像情報、例えば、ビットマップデータであり、OCR(Optical Character Reader)などのパターンマッチング法を利用してコード化された情報ではない。
操作入力部3は、各種情報を入力するための複数の操作キーからなる。ユーザがキー操作を行った場合、操作入力部3から主制御部1へキー操作信号が出力される。読取画像の正立状態を判別するために使用される文書原稿の記載様式や言語種別も、操作入力部3の操作キーを用いて入力される。
端末通信部4は、図示しないパーソナルコンピュータなどのユーザ端末装置と通信を行う通信手段である。例えば、画像処理装置100の制御情報をユーザ端末装置から受信したり、印刷出力やファクシミリ送信の対象となる読取画像をユーザ端末装置から受信することができる。また、ユーザ端末装置のディスプレイに表示させる読取画像をユーザ端末装置へ送信することもできる。
表示出力部5は、各種情報を表示するための表示手段、例えば液晶表示装置である。この表示出力部5には、正立方向の判別結果を表示することができる。また、読取画像を表示させることもでき、正立方向の判別処理の結果に基づいて、正立化させた読取画像を表示させることができる。
プリンタ6は、画像情報を紙媒体に印刷するための印刷装置であり、レーザプリンタやインクジェットプリンタなどにより構成される。このプリンタ6は、読取画像の上方向が印刷用紙の特定方向と一致するように印刷出力する。
ファクシミリ通信部7は、公衆回線網(PSTN)に接続され、図示しない他のファクシミリ装置との間でファクシミリ通信を行う通信手段である。このファクシミリ通信部7は、読取画像のファクシミリ送信を行うことができる。
データ記憶部8は、読取画像を保持する記憶手段であり、書き込み可能な記憶手段、例えば半導体メモリやハードディスクを用いることができる。スキャナ2で読み取られた読取画像はデータ記憶部8に格納される。また、データ記憶部8から読み出された読取画像は、表示出力部5やユーザ端末装置のディスプレイに表示され、プリンタ6によって印刷出力され、あるいは、ファクシミリ通信部7によってファクシミリ送信される。
この画像処理装置100では、読取画像の正立方向、つまり、読取画像に含まれる文字の上方向を自動判別することができる。この判別処理は、主制御部1によって行われる。例えば、スキャナ2により光学読み取りが行われた場合に、生成された読取画像について正立方向の判別処理が行われる。また、データ記憶部8内に保持されている読取画像の印刷出力や、ファクシミリ送信や、表示出力を行う際、当該読取画像について正立方向の判別処理が行われる。これらの判別結果は、表示出力部5に表示される。
図2及び図3は、読取画像の一例を示した図である。図2の(a)〜(d)は、いずれも横書きの文字を含む読取画像であるが、それぞれの正立方向が異なっている。この図は、読取画像の上方向が紙面の上方向となるように示されており、(a)〜(d)の正立方向は90°ずつ異なっている。すなわち、読取画像の正立方向が、(a)では上方向、(b)では左方向、(c)では下方向、(d)では右方向となっている。
同様にして、図3の(a)〜(d)は、いずれも縦書きの文字を含む読取画像であるが、それぞれの正立方向が異なっている。この図も、読取画像の上方向が紙面の上方向となるように示されており、(a)〜(d)の正立方向は90°ずつ異なっている。すなわち、読取画像の正立方向が、(a)では上方向、(b)では左方向、(c)では下方向、(d)では右方向となっている。
本実施の形態における正立方向判別処理では、文字の並び方向を判別し、当該並び方向に基づいて文字の書出方向を判別している。そして、文書原稿の記載様式と、文字の書出方向に基づいて、読取画像の正立方向を判別する。
記載様式とは、文字が横書き又は縦書きのいずれで記載されているのかの区別であり、操作入力部3を用いてユーザにより指定される。横書きとは、文字列が左右方向に延びる記載方法であり、通常、その書出方向は左方向となる。つまり、文字の書出方向を時計回りに90°回転させた方向が文字の正立方向となる。一方、縦書きとは、文字列が上下方向に延びる記載方法であり、通常、その書出方向は上方向となる。つまり、文字の書出方向が文字の正立方向と一致している。このため、文書原稿の記載様式が既知であれば、読取画像の書出方向から、当該読取画像の正立方向を求めることができる。
図4〜図6は、読取画像の書出方向判別方法についての説明図である。図4は、図2(a)の読取画像から白帯領域50h,50vが検出された状態を示した図である。図中のハッチングが付された領域が、白帯領域50h,50vであり、ハッチングが付されていない領域が、文字帯領域51h,51vである。また、図中の(a)には、横方向の白帯領域50h及び文字帯領域51hによって読取画像が区分された様子が示されており、(b)には、縦方向の白帯領域50v及び文字帯領域51vによって読取画像が区分された状態が示されている。
白帯領域50h,50vとは、読取画像内で縦方向又は横方向に整列している地色の画素からなる領域、つまり、文書原稿において一端から他端まで真っ直ぐに延びる文字のない領域である。地色とは、文字が表示されていない領域の色であり、通常は、文書原稿の媒体の色である。最も一般的な紙媒体の色は白であり、ここでは地色が白であるものとして説明する。なお、白帯領域50h,50v以外の領域である文字帯領域51h,51vは、文字が記載されていると推定される領域である。
縦方向及び横方向の白帯領域50h,50vの数を比較した場合、文字の並び方向が横方向であれば、横方向の白帯領域50hの数の方が多くなり、文字の並び方向が縦方向であれば、縦方向の白帯領域50vの数の方が多くなる。この例では、横方向の白帯領域50hの数の方が多くなっていることから、文字の並び方向が横方向であるということを判別することができる。
図5は、図2(a)の読取画像から白ブロック54及び文字ブロック56が抽出された状態を示した図である。図4(a)の白帯領域50hのうち、予め定められた閾値を超える幅を有する白帯領域50hを白ブロック54とする。また、文書原稿の両端に相当する白帯領域50hは、その幅にかかわらず白ブロック54とする。そして、これらの白ブロック54に挟まれた領域を文字ブロック56とする。このようにして抽出された文字ブロック56には、2以上の文字帯領域51hと、これらの文字帯領域51hに挟まれた細い白帯領域50hとが含まれている。つまり、各文字ブロック56には、2行以上の文字がそれぞれ含まれている。
図6は、図4(a)の各文字帯領域51hごとに両端位置が求められた状態を示した図であり、図中の文字領域57は、文字帯領域51hのうち、両端の余白部を除いた表示領域である。ここでは、各文字帯領域51hごとに、最も左側に位置する文字色の位置と、最も右側に位置する文字色の位置が求められている。
次に、各文字ブロック56ごとに両端位置のばらつきが求められ、これらのばらつきに基づいて、読取画像の書出方向が判別される。ここでは、左端位置のばらつきと右端位置のばらつきとを求めて、これらのばらつきを比較している。その結果、左端位置のばらつきの方が小さいことがわかり、読取画像の書出方向は左であると判別することができる。
このようにして、書出方向が上下左右の4方向のいずれであるのかを判別すれば、その判別結果と、記載様式に基づいて、読取画像の正立方向を判別することができる。つまり、記載様式が横書きであれば、書出方向を時計方向に90°回転させた方向が正立方向となることがわかる。一方、記載様式が縦書きであれば、書出方向が正立方向であることがわかる。また、正立方向がわかれば、読取画像の上方向と正立方向とを一致させるように、読取画像を回転させれば、正立状態の読取画像が得られる。このような回転処理を正立化処理と呼ぶ。
図7は、図1の画像処理装置100の要部について一構成例を示したブロック図であり、主制御部1により実行されるコンピュータプログラムとして実現される正立化処理の機能ブロックが示されている。この主制御部1は、傾き補正部10、縮小処理部11、画素値積算部12、文字並び判別部13、書出方向判別部14、正立方向判別部15及び画像回転部16によって構成される。
また、図8及び図9は、図7の主制御部1による正立化処理の一例を示した図であり、正立化処理の対象となる読取画像の一例が示されている。
傾き補正部10には、正立化処理の対象となる読取画像が入力される。傾き補正部10は、スキュー角に基づいて、読取画像を回転させることにより、各読取画像のスキュー角を補償する補正処理を行っている。スキュー角とは、スキャナ2の基準方向に対する文書原稿の傾きであり、例えば、文書原稿の端辺をスキャナ2が読み取ることによって検知することができる。この傾き補正は、後段の文字並び判別部13及び書出方向判別部14における判別精度を向上させるために行われる処理であり、省略することもできる。
縮小処理部11では、読取画像のデータ量を減少させる処理、例えば、読取画像を構成する画素数を減少させる処理や、各画素の階調数を減少させる処理が行われている。本実施の形態による正立化処理は、読取画像のデータ量を削減しても、判別精度が顕著に低下することはない。この縮小処理は、画素値積算部12などにおける処理負荷を軽減するために行われる処理であり、省略することもできる。
画素値積算部12は、縦方向及び横方向に整列する画素列について画素値60h,60vを積算している。すなわち、縮小処理後の読取画像を構成する全画素を横方向に延びる多数の画素列に分割し、各画素列ごとに画素値の和60hが求められる。同様にして、全画素を縦方向に延びる多数の画素列に分割し、各画素列ごとに画素値の和60vが求められる。本実施の形態では、画素値として輝度が与えられていれば、当該輝度を最大輝度との差である黒レベルに変換し、画素列ごとに黒レベルの和を求めているものとする。
文字並び判別部13は、読取画像内における文字の並び方向が横方向又は縦方向のいずれであるのかを判別している。この文字並び判別部13は、白帯領域50h,50vを検出する白帯検出部13aと、白帯領域50h,50vの数を比較する白帯数比較部13bによって構成される。
白帯検出部13aは、読取画像内において縦方向及び横方向に延びる白色の画素からなる白帯領域50h,50vを検出している。この白帯領域50h,50vは、画素値積算部12によって求められた積算値60h,60vが所定の白帯判定範囲内となる1又は隣接する2以上の画素列からなる。ここでは、上記積算値60h,60vを所定の閾値(白帯判定レベル)と比較しているものとする。例えば、各画素値(黒レベル)の和が白帯検出レベルを下回っている画素列であって、1又は隣接する2以上の画素列によって構成される領域として、白帯領域50h,50vが求められる。また、2つの白帯領域50h,50vによって挟まれた領域として文字帯領域51h,51vが求められる。
白帯数比較部13bは、白帯領域50h及び50vの数を比較し、文字の並び方向が横方向又は縦方向のいずれであるのかを判別している。すなわち、横方向の白帯領域50hの数の方が多ければ、文字の並び方向が横方向であると判別する。一方、縦方向の白帯領域50vの数の方が多ければ、文字の並び方向が縦方向であると判別する。図8の(b)には、文字の並び方向が横方向であると判別された場合が示されている。
書出方向判別部14は、文字の書出方向を判別している。すなわち、文字の並び方向が横方向であれば、書出方向が左右のいずれであるのかを判別し、文字の並び方向が縦方向であれば、書出方向が上下のいずれであるのかを判別する。この書出方向判別部14は、文字ブロック抽出部14a、両端偏差検出部14b及び偏差比較部14cによって構成される。
文字ブロック抽出部14aは、文字並び判別部13によって判別された文字の並び方向と同じ方向の白帯領域50hのうち、所定の閾値(ブロック判定レベル)を超える幅を有するものを白ブロック54とする。また、文字領域の全域にわたって、黒レベルが高い文字帯領域51hを罫線ブロック55とする。ここで、文字帯領域51hのうち、領域内の画素値(黒レベル)の和を領域幅で割った値が、所定の閾値(罫線判定レベル)を超えるものを罫線ブロック55としている。このようにして求められた白ブロック54及び罫線ブロック55によって区分された残りの各領域を文字ブロック56とする。
両端偏差検出部14bは、各文字ブロック56内における文字領域57の両端位置の偏差を求めている。この両端偏差検出部14bでは、各文字帯領域51hごとに、文字が記載されている文字領域57が求められる。この文字領域57は、文字帯領域51hから文字が記載されていない両側の余白部分を除いた領域であり、その両端の位置によって特定される。そして、各文字ブロック56ごとに、当該文字ブロック56に属する各文字領域57の両端位置の偏差が求められる。つまり、1つの文字ブロック56に属する各文字領域57の一端の位置についての偏差と、他端の位置についての偏差がそれぞれ求められる。ここでは、左端位置の標準偏差と、右端位置の標準偏差とがそれぞれ求められる。
偏差比較部14cは、各文字ブロック56における両端位置の偏差に基づいて、読取画像の書出方向を判別している。図8(b)に示したように、複数の文字領域57について両端の位置を比較すれば、文字が書き出される側の端部の位置は、他方の端部の位置に比べて揃っている。このため、読取画像内に含まれる各文字領域57の両端位置の偏差に基づいて、書出方向を判別することができる。つまり、一端の位置についての偏差と、他端の位置についての偏差を求め、偏差の小さい方が、書出方向であると判別することができる。
ここでは、文字ブロック56の面積を荷重として、各文字ブロック56の左端位置の標準偏差の荷重和を求めることにより、読取画像の左端偏差を求めている。同様にして、文字ブロック56の面積を荷重として、各文字ブロック56の右端位置の標準偏差の荷重和を求めることにより、読取画像の右端偏差を求めている。この様にして求められた読取画像の左端偏差と右端偏差を比較すれば、左端偏差の方が小さくなっている。このため、書出方向は、左方向であると判別することができる。
また、偏差比較部14cは、文字ブロック56ごとに書出方向を求め、これらの書出位置に基づいて、読取画像の書出方向と判別するものであってもよい。つまり、まず、文字ブロック56ごとに両端の偏差を比較することによって、文字ブロック56ごとの書出方向が求められる。次に、求められた書出方向ごとに文字ブロック56の面積の和を求め、面積の和がより大きい方を読取画像の書出方向と判別することができる。図8(b)の例では、文字ブロック56ごとに、書出方向が左右のいずれであるのかが判別される。そして、書出方向が左と判別された文字ブロック56の面積の和と、右と判別された文字ブロック56の面積の和とが比較される。その結果、前者の方が大きくなっていることから、書出方向は、左方向であると判別することができる。
さらに、書出方向の判別方法として、いずれの方法を採用する場合であっても、文字ブロック56の面積に代えて、文字ブロック56の高さを利用することもできる。
正立方向判別部15は、書出方向及び記載様式に基づいて正立方向を判別している。記載様式が横書きの場合、求められた書出方向を時計方向に90°回転させた方向が正立方向と判別され、記載様式が縦書きの場合には、求められた書出方向が正立方向と判別される。この判別結果は、表示出力部5に表示され、あるいは、端末通信部4を介してユーザ端末装置に送信され、ユーザ端末装置のディスプレイ上に表示される。
画像回転部16は、読取画像の上方向と正立方向を一致させるように、当該読取画像を回転させることによって、正立状態の読取画像へ変換している。このようにして、正立化された読取画像は、表示出力部5、プリンタ6、ファクシミリ通信部7、端末通信部4又はデータ記憶部8へ出力される。
なお、画像回転部16が長方形の読取画像を回転させる際、読取画像の長手方向を指定された方向にする条件と、文字の正立方向を一致させる条件のいずれを優先させてもよい。すなわち、読取画像の正立方向に基づいて読取画像を回転させ、読取画像が縦長及び横長のいずれになることも許容してもよい。また、読取画像が縦長及び横長のいずれであるのかは予め指定されており、読取画像の正立方向に基づいて更に180度回転させるものであってもよい。
図10のステップS101〜S107は、図1の画像処理装置100による動作の一例を示したフローチャートであり、正立化処理の動作が記載されている。このフローチャートは、操作入力部3のユーザ操作により、あるいは、ユーザ端末装置からの制御信号により、正立化処理が指示された場合に開始される。また、スキャナ2による文書原稿の光学読み取り時、プリンタ6による印刷出力時、ファクシミリ通信部7による送信時、あるいは、端末通信部4からの出力時に開始するようにすることもできる。
正立化処理の対象となる読取画像に対し、ステップS101〜S107の処理が順次に行われる。すなわち、スキュー角を補償する傾き補正処理(ステップS101)、データ量を削減するための縮小処理(ステップS102)、縦方向及び横方向の各画素列ごとに画素値を積算する画素値積算処理(ステップS103)、並びに、上記積算値に基づいて白帯領域50h,50vを検出し、文字の並び方向を判別する文字並び判別処理(ステップS104)が行われる。
次に、文字の並び方向に基づいて書出方向判別処理が実行される(ステップS105)。つまり、文字領域57の両端位置のばらつきが求められ、このばらつきに基づいて書出方向が判別される。そして、書出方向と記載様式に基づいて、読取画像の正立方向を判別する正立方向判別処理が実行される(ステップS106)。その後、この判別結果に基づいて、読取画像の上方向と正立方向が一致するように、読取画像の回転処理が行われる(ステップS107)。
本実施の形態による画像処理装置100は、読取画像における文字の並び方向を判別し、この並び方向に基づいて文字の書出方向を判別している。そして、これらの書出方向及び記載様式に基づいて、読取画像の正立方向を判別している。このため、パターンマッチング技術を利用する従来の判別方法に比べて、処理負荷が軽く、短い処理時間で判別結果を得ることができる。
また、本実施の形態による画像処理装置100は、読取画像内で縦方向及び横方向の画素列であって、概ね文書原稿の地色の画素からなる白帯領域50h,50vを検出し、これらの白帯領域50h,50vの数の比較結果に基づいて文字の並び方向を判別している。このため、文字の並び方向を容易に判別することができる。
また、本実施の形態による画像処理装置100は、白帯領域50h,50vによって区分された文字帯領域51h,51vごとに、文字領域57の両端位置を検出し、これらの両端位置の偏差に基づいて、読取画像における文字の書出方向を判別している。このため、文字の書出方向を容易に判別することができる。
特に、所定幅を超える白帯領域50h,50vを白ブロック54とし、白ブロック54によって区切られた文字ブロック56ごとに書出方向を判別し、これらの書出方向に基づいて、読取画像の書出方向を判別している。このため、文字の書出方向を正確に判別することができる。
実施の形態2.
図11は、本発明の実施の形態2による画像処理装置100の要部について一構成例を示した図であり、主制御部1により実行されるコンピュータプログラムとして実現される正立化処理の機能ブロックが示されている。図7のブロック図と比較すれば、正立方向判別部15に言語種別が入力されている点で異なる。
この正立方向判別部15は、書出方向、記載様式及び言語種別に基づいて、正立方向を判別している。言語種別は、文書原稿に含まれている文字の言語に関する情報であり、操作入力部3を用いて入力され、あるいは、データ記憶部8に予め格納されている。
一般的に横書きの場合の書出方向は左方向である。ところが、アラビア語のように、横書きの場合の書出方向が右側となる言語も存在する。このため、言語種別を指定することによって、正立方向判別部15は、言語種別に応じた処理を行うことができる。すなわち、横書きの場合の書出方向が右側となる言語が指定されている場合、横書きの書出方向を反時計方向に90°回転させた方向を正立方向と判別する。
なお、英語やドイツ語のように、文字の縦書きが行われない言語であれば、記載様式を指定する必要はない。つまり、記載様式として、一般的には、縦書き又は横書きの一方しか利用されない言語の場合、言語種別から記載様式を求めてもよい。
なお、上記実施の形態では、読取画像を構成する各画素の輝度を利用して正立方向の判別を行っている。このため、読取画像が、カラー画像、グレースケース画像、モノクロ画像のいずれの場合にも適用することができる。例えば、読取画像が、RGB色空間のカラー画像情報であれば、まずYCrCb色空間のカラー画像情報に変換した後、Y(輝度)成分に基づいて正立化処理が行われる。
また、読取画像がカラー画像の場合、操作入力部3やユーザ端末装置から文字色を指定して正立化処理を行うこともできる。例えば、白帯領域50h,50vを検出する際、検出文字色以外は地色とみなすことにより、文書原稿中に写真などが含まれていた場合であっても、白帯領域50h,50v及び文字帯領域51h,51vを正確に検出することができる。
実施の形態3.
上記実施の形態では、白帯領域50h及び50vの数を比較することによって文字の並び方向を判別する画像処理装置の例について説明した。これに対し、本実施の形態では、白帯領域50h及び50vの幅に基づいて文字の並び方向を判別する画像処理装置について説明する。
図12は、実施の形態3による画像処理装置の主制御部1について一構成例を示したブロック図である。図7のブロック図と比較すれば、白帯数比較部13bに代えて、白帯幅比較部13cを備えている点で異なる。この白帯幅比較部13cは、横方向及び縦方向の白帯領域50h,50vの幅の平均値をそれぞれ求め、平均値のより大きい方向を文字の並び方向と判別する。
読取画像内の文字に等幅フォントが用いられ、文字が一定ピッチで配置されている場合には、文字の並び方向に隣接する文字間の空白によって、文字の並び方向と直交する方向に延びる白帯領域が形成される。従って、縦方向及び横方向の白帯領域の数を比較しても、文字並び方向を正確に判定できない場合がある。
このような場合を考慮して、白帯領域の幅に基づいて、並び方向を判別することもできる。一般に、並び方向に隣接する文字間の空白は、行間の空白よりも狭い。このため、文字の並び方向と直交する方向に延びる白帯領域の幅は、文字の並び方向に延びる白帯領域の幅よりも細くなる。従って、縦方向及び横方向について白帯領域の幅の平均値をそれぞれ求め、平均値のより大きい方向を文字の並び方向と判別することもできる。
なお、白帯領域の幅の平均値に代えて、幅の最小値を用いることもできる。また、数の比較結果と、幅の平均値の比較結果とに基づいて、文字の並び方向を判別することもできる。
なお、上記実施の形態では、白帯検出部13aが、縦方向及び横方向の各画素列について画素値の和を求める場合について説明したが、画素値の和には、画素値の平均も含まれることは言うまでもない。
本発明の実施の形態1による画像処理装置100の一構成例を示したブロック図である。 横書きの文字を含む読取画像であって、正立方向が異なる読取画像の一例が示されている。 縦書きの文字を含む読取画像であって、正立方向が異なる読取画像の一例が示されている。 読取画像から白帯領域50h,50vが検出された状態を示した図である。 図2(a)の読取画像から白ブロック54及び文字ブロック56が抽出された状態を示した図である。 図4(a)の各文字帯領域51hごとに両端位置が求められた状態を示した図である。 図1の画像処理装置100の要部について一構成例を示したブロック図である。 図7の主制御部1による正立化処理の一例を示した図である。 図7の主制御部1による正立化処理の一例を示した図である。 図1の画像処理装置100による動作の一例を示したフローチャートであり、正立化処理の動作が記載されている。 本発明の実施の形態2による画像処理装置100の要部について一構成例を示した図である。 実施の形態3による画像処理装置の主制御部1について一構成例を示したブロック図である。
符号の説明
100 画像処理装置
1 主制御部
2 スキャナ
3 操作入力部
4 端末通信部
5 表示出力部
6 プリンタ
7 ファクシミリ通信部
8 データ記憶部
10 傾き補正部
11 縮小処理部
12 画素値積算部
13 文字並び判別部
13a 白帯検出部
13b 白帯数比較部
14 書出方向判別部
14a 文字ブロック抽出部
14b 両端偏差検出部
14c 偏差比較部
15 正立方向判別部
16 画像回転部
50h,50v 白帯領域
51h,51v 文字帯領域
54 白ブロック
55 罫線ブロック
56 文字ブロック
57 文字領域
60h,60v 画素列の積算値
100 画像処理装置

Claims (9)

  1. 文書原稿の光学読み取りを行って、読取画像を生成する光学読取手段と、
    縦書き又は横書きのいずれかを記載様式として指定する記載様式指定手段と、
    上記読取画像における文字の並び方向を判別する文字並び判別手段と、
    上記並び方向に基づいて、上記読取画像における文字の書出方向を判別する書出方向判別手段と、
    上記書出方向及び記載様式に基づいて、上記読取画像の正立方向を判別する正立方向判別手段とを備えたことを特徴とする画像処理装置。
  2. 上記文字並び判別手段は、上記読取画像を構成する縦方向及び横方向の画素列であって、画素値の和が白帯判定範囲内となる1又は2以上の画素列からなる白帯領域を検出する白帯領域検出手段を有し、これらの白帯領域の数に基づいて文字の並び方向を判別することを特徴とする請求項1に記載の画像処理装置。
  3. 上記文字並び判別手段は、上記読取画像を構成する縦方向及び横方向の画素列であって、画素値の和が白帯判定範囲内となる1又は2以上の画素列からなる白帯領域を検出する白帯領域検出手段を有し、これらの白帯領域の幅に基づいて文字の並び方向を判別することを特徴とする請求項1に記載の画像処理装置。
  4. 上記書出方向判別手段は、上記並び方向における文字の両端位置の偏差に基づいて書出方向を判別することを特徴とする請求項1に記載の画像処理装置。
  5. 上記書出方向判別手段は、幅が白ブロック判定レベルを超える上記白帯領域によって区切られた1又は2以上の文字ブロックを上記読取画像から抽出する文字ブロック抽出手段と、
    上記文字ブロック内における上記両端位置の偏差を検出する両端偏差検出手段とを有し、
    上記文字ブロックごとの上記両端位置の偏差に基づいて、上記読取画像における文字の書出方向を判別することを特徴とする請求項4に記載の画像処理装置。
  6. 上記正立方向判別手段の判別結果を表示する表示手段を備えたことを特徴とする請求項1に記載の画像処理装置。
  7. 上記正立方向判別手段の判別結果に基づいて、上記読取画像を回転させる画像回転手段を備えたことを特徴とする請求項1に記載の画像処理装置。
  8. 言語種別を指定する言語種別指定手段を備え、
    上記正立方向判別手段は、上記書出方向、記載様式及び言語種別に基づいて、上記読取画像の正立方向を判別することを特徴とする請求項1に記載の画像処理装置。
  9. 光学読取装置による文書原稿の光学読み取りを制御し、読取画像を生成する光学読取ステップと、
    縦書き又は横書きのいずれかが記載様式として指定される記載様式指定ステップと、
    上記読取画像における文字の並び方向を判別する文字並び判別ステップと、
    上記並び方向に基づいて、上記読取画像における文字の書出方向を判別する書出方向判別ステップと、
    上記書出方向及び記載様式に基づいて、上記読取画像の正立方向を判別する正立方向判別ステップとを実行するための手順からなるコンピュータプログラム。
JP2008122705A 2008-05-08 2008-05-08 画像処理装置 Pending JP2009272962A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008122705A JP2009272962A (ja) 2008-05-08 2008-05-08 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008122705A JP2009272962A (ja) 2008-05-08 2008-05-08 画像処理装置

Publications (1)

Publication Number Publication Date
JP2009272962A true JP2009272962A (ja) 2009-11-19

Family

ID=41439105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008122705A Pending JP2009272962A (ja) 2008-05-08 2008-05-08 画像処理装置

Country Status (1)

Country Link
JP (1) JP2009272962A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013206258A (ja) * 2012-03-29 2013-10-07 Dainippon Printing Co Ltd 文書認識装置、文書認識方法、プログラム
JP2016038821A (ja) * 2014-08-08 2016-03-22 京セラドキュメントソリューションズ株式会社 画像処理装置
JP2017046248A (ja) * 2015-08-27 2017-03-02 株式会社沖データ 画像形成装置
JP2017062574A (ja) * 2015-09-24 2017-03-30 富士通フロンテック株式会社 帳票画像判定プログラム、帳票画像判定方法および帳票画像判定システム
JP2021117609A (ja) * 2020-01-23 2021-08-10 東芝テック株式会社 画像処理装置、及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013206258A (ja) * 2012-03-29 2013-10-07 Dainippon Printing Co Ltd 文書認識装置、文書認識方法、プログラム
JP2016038821A (ja) * 2014-08-08 2016-03-22 京セラドキュメントソリューションズ株式会社 画像処理装置
JP2017046248A (ja) * 2015-08-27 2017-03-02 株式会社沖データ 画像形成装置
JP2017062574A (ja) * 2015-09-24 2017-03-30 富士通フロンテック株式会社 帳票画像判定プログラム、帳票画像判定方法および帳票画像判定システム
JP2021117609A (ja) * 2020-01-23 2021-08-10 東芝テック株式会社 画像処理装置、及びプログラム
JP7374003B2 (ja) 2020-01-23 2023-11-06 東芝テック株式会社 画像処理装置、及びプログラム

Similar Documents

Publication Publication Date Title
JP5280425B2 (ja) 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP5861503B2 (ja) 画像検査装置及び方法
JP5834866B2 (ja) 画像処理装置、画像生成方法、およびコンピュータプログラム
JP4881605B2 (ja) 文字認識装置、記憶媒体、文字認識方法
JP6665595B2 (ja) 文字認識装置、方法およびプログラム
JP2009272962A (ja) 画像処理装置
JP4869841B2 (ja) 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP5049922B2 (ja) 画像処理装置及び画像処理方法
JP4140519B2 (ja) 画像処理装置、プログラムおよび記録媒体
JP2013500527A (ja) 文書内の表の自動的な位置特定
US8285043B2 (en) Image processing apparatus and image processing method
JP2016184914A (ja) 画像処理装置
JP6197840B2 (ja) 画像処理装置、電子ファイル生成方法及びプログラム
JP2009141597A (ja) 画像処理装置、文字領域特定方法、および文字領域特定プログラム
JP4866184B2 (ja) 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP4396710B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
US7969618B2 (en) Image forming apparatus, image forming system, computer readable recording medium, and image forming method
JP2009271788A (ja) 画像処理装置
JP2007124623A (ja) 印刷方法、印刷装置および印刷プログラム
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
US8125691B2 (en) Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information
JP4998176B2 (ja) 翻訳装置及びプログラム
JP5081885B2 (ja) プレビュー機能付き原稿読取装置