JP4927122B2 - 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体 - Google Patents

画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP4927122B2
JP4927122B2 JP2009142552A JP2009142552A JP4927122B2 JP 4927122 B2 JP4927122 B2 JP 4927122B2 JP 2009142552 A JP2009142552 A JP 2009142552A JP 2009142552 A JP2009142552 A JP 2009142552A JP 4927122 B2 JP4927122 B2 JP 4927122B2
Authority
JP
Japan
Prior art keywords
area
image
image data
partial area
reliability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009142552A
Other languages
English (en)
Other versions
JP2010288229A (ja
Inventor
淳寿 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2009142552A priority Critical patent/JP4927122B2/ja
Priority to US12/814,144 priority patent/US8532434B2/en
Priority to CN2010102032992A priority patent/CN101923644B/zh
Publication of JP2010288229A publication Critical patent/JP2010288229A/ja
Application granted granted Critical
Publication of JP4927122B2 publication Critical patent/JP4927122B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、画像データの天地方向を判定し、文字認識を行う画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体に関するものである。
従来、画像処理技術の一つとして、画像データに含まれる文字を認識する技術が知られている。この文字認識技術は、例えば画像読取装置にて読み取られた原稿画像の画像データについて文字認識を行うものである。
文字認識を行う場合、画像データが正規の状態から90度あるいは180度回転していると、文字を正確に認識することができない。このため、画像データの天地を判定し、その判定結果が示す天地方向に基づいて文字認識を行う必要がある。
一方、画像データのなかには、文字を含む表やグラフなど、形式が異なる複数の領域を含むものがある。このような画像データについては、単純に天地を判定することが困難である。そこで、例えば特許文献1では、文書画像中の文字領域を、テキスト領域、タイトル領域、表中の文字領域および図面のキャプション領域の各部分領域に分離している。そして、下記の何れかの方法で文書画像の方向を判定し、全文字領域にわたって文字認識を実行している。
(1)テキスト領域、タイトル領域、表中の文字領域および図のキャプション領域に優先順位をつけ、優先順位の高い領域を用いて文書方向を判定し、その判定結果を文書方向とする。
(2)文字領域の方向判定において自信度の高い判定結果を用い、この判定結果が複数の文字領域で一致する場合、その方向を文書方向として決定する。
(3)全文字領域の方向判定を行い、判定結果の回数の多い方向をもって文書の方向を決定する。
また、特許文献2には次の技術が記載されている。すなわち、画像データを複数の領域に分割し、各分割領域について、それらを原稿全体に対する天地認識に使用した場合の信頼度を求める。次に、信頼度が最も高い値となった領域から文字データを切り出して、天地認識処理を行う。
特開平9−69136号公報(平成9年3月11日公開) 特開2000−32247号公報(平成12年1月28日公開) 特開平6−189083号公報(平成6年7月8日公開) 特開平7−192086号公報(平成7年7月28日公開)
特許文献1,2に示されている技術は、いずれも画像データを複数の領域に分割し、分割した各領域について天地方向を求め、それら天地方向を画像データ全体の天地方向としている。例えば、分割した領域の天地方向のうち、信頼度の高い天地方向を画像データの天地方向としている。このため、このようにして決定された天地方向に従って、画像データ全体の文字認識を行う場合において、例えば文字方向が互いに異なる複数の領域が画像データ中に存在する場合には、それら領域について文字認識を正確に行うことができないという問題点を有している。一方、文字の認識率を高めるために、文字認識を行う際に、画像データまたは参照する辞書データを回転させて文字認識を行うことが考えられる。しかしながら、そのような場合、全ての方向について画像データ全体、あるいは辞書データ全体を回転させる必要があるので、認識処理に長時間を要するという問題点が生じる。
本発明の画像処理装置は、入力された画像データを複数の部分領域に分割する領域分割部と、前記部分領域の画像データの上下左右の4方向を天地方向とした場合の信頼度をそれぞれ求め、求めた信頼度のうち、信頼度が最も高い方向をその部分領域の天地方向として設定する天地判定部と、前記天地判定部により天地方向が設定された部分領域について、天地方向の信頼度が所定値よりも低い部分領域である対象部分領域、および信頼度が所定値以上の部分領域である非対象部分領域のうち、少なくとも前記対象部分領域の画像と前記対象部分領域の天地方向を指定するユーザ入力を受け付ける指示領域の画像とを表示装置に表示させるための表示用画像データを生成する表示制御部と、前記対象部分領域については前記指示領域に対して指定された天地方向を天地方向として、前記非対象部分領域については前記天地判定部にて設定された天地方向を天地方向として、各部分領域ごとに文字認識を行う文字認識部とを備えていることを特徴としている。
本発明の画像処理方法は、入力された画像データを複数の部分領域に分割する領域分割工程と、前記部分領域の画像データの上下左右の4方向を天地方向とした場合の信頼度をそれぞれ求め、求めた信頼度のうち、信頼度が最も高い方向をその部分領域の天地方向として設定する天地判定工程と、前記天地判定工程により天地方向が設定された部分領域について、天地方向の信頼度が所定値よりも低い部分領域である対象部分領域、および信頼度が所定値以上の部分領域である非対象部分領域のうち、少なくとも前記対象部分領域の画像と前記対象部分領域の天地方向を指定するユーザ入力を受け付ける指示領域の画像とを表示装置に表示させるための表示用画像データを生成する表示制御工程と、前記対象部分領域については前記指示領域に対して指定された天地方向を天地方向として、前記非対象部分領域については前記天地判定部にて設定された天地方向を天地方向として、各部分領域ごとに文字認識を行う文字認識工程とを備えていることを特徴としている。
上記の構成によれば、天地判定部(天地判定工程)により設定された天地方向の信頼度が所定値以上の部分領域(非対象部分領域)については、その天地方向に従って文字認識部(文字認識工程)により文字認識が行われる。一方、天地判定部(天地判定工程)により設定された天地方向の信頼度が所定値よりも低い部分領域(対象分部領域)については、その対象部分領域の画像とともに、その対象部分領域の天地方向を指定するユーザ入力を受け付ける指示領域の画像が表示装置に表示される。そして、対象部分領域については、指示領域に対してユーザにより指定された天地方向に従って文字認識部(文字認識工程)により文字認識が行われる。
これにより、例えば天地方向の信頼度が低い部分領域(対象部分領域)と高い部分領域(非対象部分領域)とが混在しているような入力画像データに対しても、各部分領域に対して正しい天地方向に従って正確な文字認識を行うことができる。また、対象部分領域と非対象部分領域とでは、正しい天地方向に従って文字認識を行えるように、処理手順を異ならせているので、文字認識処理までを含む処理時間を抑制しながら、入力画像データ全体に対して高精度の文字認識処理を行うことができる。
上記の画像処理装置において、前記表示制御部は、前記対象部分領域の画像と前記指示領域の画像とを生成する表示用画像生成部と、これら対象部分領域の画像と指示領域の画像とを拡大して前記表示用画像データとして出力する表示用画像出力部とを備えている構成としてもよい。
上記の構成によれば、対象部分領域についての天地方向の指定をユーザに促す場合には、対象部分領域の画像と指示領域の画像とが拡大して表示される。これにより、ユーザは天地方向を指定すべき対象部分領域の存在を容易に知ることができ、また、指示領域への入力が容易となる。
上記の画像処理装置において、前記表示制御部は、前記指示領域に対しての天地方向を指定する入力に従って前記表示用画像データを回転させ、前記表示用画像データとして出力する回転処理部を備えている構成としてもよい。
上記の構成によれば、表示装置に表示される表示用画像データは、ユーザが指示領域に対して指定した天地方向に従って回転処理され、再度表示される。したがって、ユーザは、対象部分領域に対する天地方向の指定が正しいか否かをその場で確認することができる。また、前記表示用画像出力部において表示用画像データの間引き処理が行われている場合、回転処理部は、間引き処理された表示用画像データ(プレビュー用画像データ)を回転処理するので、処理の負担を軽減することができる。
上記の画像処理装置において、前記文字認識部は、前記非対象部分領域については前記天地判定部により設定された天地方向に従って前記非対象部分領域を回転させた後、前記対象部分領域については前記指示領域に対しての天地方向を指定する入力に従って前記対象部分領域を回転させた後、前記文字認識を行う構成としてもよい。
上記の構成によれば、文字認識部は、辞書データを参照して文字認識を行う際に、データ容量が大きい辞書データではなく、非対象部分領域および対象部分領域を回転させて文字認識を行う。したがって、文字認識における負担を軽減し、かつ処理時間を短縮することができる。
上記の画像処理装置において、前記表示制御部は、前記指示領域を前記対象部分領域に対する上下左右の4箇所の位置に配置し、各指示領域のサイズおよび色のうちの少なくとも一つを、前記天地判定部により求められた、前記4方向の信頼度の相違に応じて相違させる構成としてもよい。
上記の構成によれば、対象部分領域の周りの4箇所の位置(4方向の位置)に配置された指示領域は、天地方向としての4方向の信頼度に応じて、サイズおよび色のうちの少なくとも一つが互いに異なる状態にて表示される。したがって、ユーザが指示領域に対して対象部分領域の天地方向を指定する場合に、各指示領域の表示状態の相違を参考にして、指示領域に対する天地方向の指定を容易に行うことができる。
本発明の構成によれば、例えば天地方向の信頼度が低い部分領域(対象部分領域)と高い部分領域(非対象部分領域)とが混在しているような入力画像データに対しても、各部分領域に対して正しい天地方向に従って正確な文字認識を行うことができる。また、対象部分領域と非対象部分領域とでは、正しい天地方向に従って文字認識を行えるように、処理手順を異ならせているので、文字認識処理までを含む処理時間を抑制しながら、入力画像データ全体に対して高精度の文字認識処理を行うことができる。
本発明の実施形態の画像処理装置の概略構成を示すブロック図である。 図2(a)は、例えば入力装置(スキャナ)によって取得された入力画像データの一例を示す説明図、図2(b)は、図1に示した領域分割部により図2(a)に示した入力画像データから分割された複数の部分領域を示す説明図である。 図3(a)は、図1に示した領域分割部により、文字領域の属性が異なる複数の部分領域を有する画像データから抽出された複数のブロック(部分領域)を示す説明図、図3(b)は、同領域分割部により画像データから抽出された、表中文字領域の一例を示す説明図、図3(c)は同領域分割部により画像データから抽出された、キャプション領域の一例を示す説明図である。 図4(a)は、一つの部分領域内に天地方向が異なる2種類の文字画像が存在する場合のその部分領域における各天地方向の信頼度の設定結果を示す説明図である。図4(b)は、部分領域内の文字画像の方向が一方向である場合のその部分領域における各天地方向の信頼度の設定結果を示す説明図である。図4(c)は、部分領域内において文字画像が少ない場合のその部分領域における各天地方向の信頼度の設定結果を示す説明図である。 図5(a)は、図1に示した天地判定部により算出された、図2(b)に示した第1〜第3部分領域についての0度、90度、180度、270度の各天地方向についての信頼度を示す説明図、図5(b)は、図5(a)に示した第1〜第3部分領域についての各天地方向の信頼度に基づいて決定された、第1〜第3部分領域についての天地方向を示す説明図である。 図6(a)は、図1に示した天地判定部により決定された、第1〜第3部分領域についての天地方向と信頼度とを示す説明図、図6(b)は、各部分領域についての天地方向の信頼度と信頼度の閾値との関係に基づく、各部分領域についての図1に示した表示装置でのプレビュー・入力指示表示の要否の例を示す説明図である。 図1に示した表示制御部の構成を示すブロック図である。 図2に示した表示装置の表示画面に表示された、対象部分領域を含む画像データのプレビュー画像を示す説明図である。 図1に示した天地判定部の天地方向判定における信頼度が低い第2部分領域について、画像データのプレビュー画像を表示した表示画面において、第2部分領域に対応する選択領域および指示領域をポップアップ表示した状態を示す説明図である。 図9に示したポップアップ表示において、操作された指示領域の方向が天方向となるように、対象部分領域(選択領域)を回転させた状態を示す説明図である。 図1に示した画像処理装置1の動作を示すフローチャートである。 図11の動作につづく画像処理装置1の動作を示すフローチャートである。 図1に示した表示装置に表示させたプレビュー画像において、各部分領域を囲む矩形枠を各部分領域の天地方向の信頼度に応じて色分けして表示する例を示す説明図である。 図1に示した表示装置に表示させたプレビュー画像において、各部分領域を信頼度に応じてた順序に並べて配置した状態を示す説明図である。 図15(a)は図1に示した表示装置においてプレビュー表示される部分領域の4方向の天地方向と信頼度との関係を示す説明図、図15(b)は、図15(a)に示した部分領域のポップアップ表示において、各天地方向の信頼度に応じて指示領域の濃度もしくは色を異ならせた状態を示す説明図である。 図16(a)は、図15(b)に示した4方向の天地方向に対応する4個の指示領域について、天地方向の信頼度が高い順にて指示領域の濃度(色)を変化させる場合の、信頼度が第1位から第4位までの指示領域の色の例を示す説明図、図16(b)は、図16(a)に示したR(R1〜R4)の値を示す説明図、図16(c)は、図16(a)に示したR(R1〜R4)の値の他の決定方法を示す説明図である。 図9に示した部分領域のポップアップ表示において、各天地方向の信頼度に応じて指示領域のサイズを異ならせた状態を示す説明図である。 図18(a)は、4方向の天地方向に対応する4個の指示領域について、天地方向の信頼度が高い順にて指示領域のサイズ(長さ)を変化させる場合の、信頼度が第1位から第4位までの指示領域のサイズ(長さ)の例を示す説明図、図18(b)は、図18(a)に示したM(M1〜M4)の値(倍率)を示す説明図、図18(c)は、図18(a)に示したM(M1〜M4)の値の他の決定方法を示す説明図、図18(d)は、図18(c)に示した信頼度に応じた倍率(C1〜C4)の値の決定方法を示す説明図である。 本発明の実施の形態の画像形成装置における印刷動作の状態を示すブロック図である。 本発明の実施の形態の画像形成装置におけるプレビュー表示の動作状態を示すブロック図である。 本発明の実施の形態の画像形成装置におけるイメージ送信状態を示すブロック図である。 図19に示した第1原稿検知部の構成を示すブロック図である。 図19に示した第2原稿検知部の構成を示すブロック図である。 図24(a)は表示装置の表示特性に応じたγ補正曲線の一例を示すグラフ、図24(b)は文字をくっきりとさせるγ補正曲線の一例を示すグラフである。 本発明の実施の形態の画像読取装置の構成を示すブロック図である。
〔実施の形態1〕
本発明の実施の形態を図面に基づいて以下に説明する。
図1は、本発明の実施形態の画像処理装置1の概略構成を示すブロック図である。画像処理装置1は、例えば画像入力装置に備えられている。画像入力装置は、原稿から画像を読み取り、画像データを取得する。さらに、画像入力装置は、複写機、あるいは複写機能に加えて他の複数の機能を有する複合機に備えられている。画像処理装置1は、上記画像データに対して画像処理を行う。
図1に示すように、画像処理装置1は、表示装置2および記憶装置3と接続されている。表示装置2は、例えば上記画像形成装置の操作パネルに備えられている。この表示装置2は、タッチパネルとしての機能を有するとともに、グラフィカルユーザインターフェイスとしても機能する。なお、表示装置2としては、液晶ディスプレイ等の一般的な画像表示手段が用いられる。
記憶装置3は、上記画像形成装置に備えられているデータ保存手段である。記憶装置3としては一般的なハードディスク装置、あるいはその他の記憶装置を用いることができる。
図1の構成において、画像入力装置によって取得された画像データは記憶装置3に保存される。画像処理装置1は、記憶装置3から読み出した画像データに画像処理を施し、再度記憶装置3に保存する。また、画像処理装置1は、上記画像データを、あるいは上記画像データから生成したプレビュー画像を表示装置2に表示させる。
画像処理装置1は、図1に示すように、領域分割部11、天地判定部12、文字認識部13および表示制御部14を備えている。
領域分割部11は、入力された画像データ(入力画像データ)のうちの文字領域を、文字領域の属性に応じて、タイトル領域、本文領域、表中文字領域、キャプション領域(図形領域に付属する文字領域)等の領域に分割し、各属性領域の外接矩形(外接座標)を算出する。なお、文字以外の画像を含む画像データを扱う場合には、領域分割部11の前段に後述の領域分離部231(図20参照)を設け、領域分離部231により入力画像データから文字領域を分離する構成としてもよい。
図2(a)は、例えば上記入力装置によって取得された入力画像データの一例を示す説明図である。図2(b)は、領域分割部11により図2(a)に示した入力画像データから複数の部分領域(属性領域)、すなわち第1部分領域41、第2部分領域42および第3部分領域43を分割した状態を示す説明図である。
図2(a)の例において、入力画像データは文字領域として3種類の属性領域を有する。領域分割部11は、この入力画像データに対し、文字領域を上記属性領域ごとに分割して3個の部分領域とし、部分領域情報を生成する。
領域分割部11にて取得された文字領域の画像データ(部分領域の文字画像データ)および部分領域情報は、後段の天地判定部12および文字認識部13にて利用される。
ここで、領域分割部11による領域分割処理の詳細について説明する。領域分割部11では、領域分割処理を次の(a1)〜(a8)の手順によって行う。この処理は、画像データを、例えば、タイトル、著者名、アブストラクトおよび本文に分割するための処理である。
(a1)入力された画像データの最初のラインを注目ラインとし、黒画素にラベルをセットする。すなわちラベリングを行う。
(a2)次に、注目ラインを一つ下のラインにずらし、黒画素について上記ラインとは異なるラベルをセットする。
(a3)次に、注目ラインと注目ラインの一つ上のラインとにおける黒画素の連結状態を判定する。この判定の結果、連結している場合は、画素がつながっていると判断し、同じラベル(上のラインのラベル)に置き換える。
(a4)以上の(a1)〜(a3)の処理を繰り返し、文字領域を抽出する。抽出した文字領域の上端、下端、左端および右端の画素位置に基づき、文字領域に対する外接矩形を抽出する。なお、画素位置の座標は、入力された画像データの左端の位置を原点として求める。
(a5)次に、隣接する外接矩形間の距離を算出し、得られた外接矩形間の距離に基づいて、隣接する文字群からなる文字列を各々特定する。つまり、間隔が所定値より小さい外接矩形同士は同じ文字列に属し、間隔が所定値より大きい外接矩形同士は同じ文字列に属さないことから、隣接する外接矩形間の距離を算出することで、各文字列を特定できる。
(a6)次に、いずれか1つの文字列を注目文字列とし、注目文字列に属する外接矩形の垂直方向(上記ラインに対する垂直方向)の長さの平均値を求める。また、当該平均値は、垂直方向の長さが閾値より小さい外接矩形を除いて算出される。これは、句読点に設定される外接矩形を除外するためである。また、注目文字列に属する外接矩形の下辺の座標値の平均値を求める。
(a7)次に、注目文字列に属する外接矩形の下辺の座標値の平均値から、上記垂直方向に向けて、上記外接矩形の所定方向の長さの平均値を基準とした所定範囲内に、別の文字列が存在するか否かを判定する。この判定の結果、上記所定範囲内に別の文字列が存在する場合、当該文字列を注目文字列と同じ領域と判定する。また、上記所定範囲内に別の文字列が存在しない場合、上記所定範囲には当該注目文字列と同じ領域に属する文字列が存在しないと判定する。なお、上記の所定範囲とは、例えば、外接矩形の上記垂直方向の長さの平均値の1.5倍の範囲である。
(a8)注目文字列を変更して(a6)および(a7)を繰り返す。これにより、例えば、原稿画像を、文字領域の属性に応じて複数の領域に分離することができる。
図3(a)は、領域分割部11により、文字領域の属性が異なる複数の部分領域を有する画像データから抽出された複数のブロック(部分領域)を示す説明図、図3(b)は、領域分割部11により画像データから抽出された、表中文字領域の一例を示す説明図、図3(c)は領域分割部11により画像データから抽出された、キャプション領域の一例を示す説明図である。
図3(a)において、部分領域AEはタイトルである。このタイトルは、画像データ(原稿画像)の上部あるいは右端に存在し、部分領域AE(外接矩形)のサイズが大きいものである。そのサイズ(ライン方向のサイズ)は、本文と見なされる部分領域(外接矩形)のサイズの例えば1.5倍以上である。また、同図において、部分領域Bは著者名、部分領域Cはアブストラクト(本文と区別する必要はない領域)、部分領域Dは本文である。
図3(b)に示す表中文字領域は、同図に示すように、外接矩形(部分領域)が罫線(連続する黒画素)に囲まれている場合に、表中文字領域であると判断される。図3(c)に示すキャプション領域は、同図に示すように、外接矩形(部分領域)がライン(連続する黒画素)の近傍に存在する場合に、キャプション領域であると判断される。この判断において、上記ライン(連続する黒画素)は、例えば、キャプション領域となる外接矩形(部分領域)の垂直方向の長さの平均値の1.5倍の範囲となる。
天地判定部12は、領域分割部11から提供される部分領域の文字画像データおよび部分領域情報を使用し、部分領域の文字画像データごとに天地方向を判定する。この部分領域ごとの天地判定においては、まず、天地方向を例えば0度、90度、180度、270度の4方向とした場合の天地方向ごとの信頼度を算出する。次に、天地判定部12は、各部分領域について、天地方向ごとの信頼度のうちの最も信頼度の高い天地方向をその部分領域の天地方向として決定する。したがって、部分領域の天地方向の信頼度は、最も信頼度の高い天地方向の信頼度となる。
なお、天地方向が0度とは、その部分領域の天地方向が文字の正規の天地方向と一致していることを示す。天地方向が90度とは、その部分領域の天地方向が文字の正規の天地方向に対して反時計回りに90度回転していること(その部分領域を時計回りに90度回転させれば文字が正規の天地方向になること)を示す。天地方向が180度とは、その部分領域の天地方向が文字の正規の天地方向に対して180度回転していることを(その部分領域を180度回転させれば文字が正規の天地方向になること)示す。天地方向が270度とは、その部分領域の天地方向が文字の正規の天地方向に対して反時計回りに270度回転していること(その部分領域を時計回りに270度回転させれば文字が正規の天地方向になること)を示す。
次に、天地判定部12での天地判定動作を詳細に説明する。天地判定部12では、例えば特開平6−189083号公報(特許文献3)に記載の方法を用いて、部分領域毎に画像の天地判定を行う。天地判定処理の手順は次のとおりである。
(b1)OCR技術を用いて文字認識を行い、入力画像内の一文字一文字を個々に切り出し、その文字をパターン化する。
(b2)入力画像の文字パターン(以下、入力文字パターンと称する)の特徴とデータベース化された文字パターン(以下、データベース化文字パターンと称する)とを比較する。マッチングの方法としては、入力画像から切り出された入力文字パターンをデータベース化文字パターンに対して重ね合わせ、画素ごとの白黒を比較する。全ての画素の白黒が合致した場合、入力文字パターンは比較したデータベース化文字パターンであると判断する。入力文字パターンに対して全ての画素の白黒が合致するデータベース化文字パターンがない場合、入力文字パターンに対してマッチングする画素が最も多いデータベース化文字パターンの文字を入力文字パターンの文字であると判断する。なお、所定のマッチング割合に達しなければ判別不能と判断する。
(b3)切り出された入力文字パターンを90度、180度、270度と順次回転させ、各回転角度において上記(b2)の処理を繰り返す。
(b4)天地方向の判定結果として、0度、90度、180度および270度の4通りの方向における判別可能な文字数を出力する。
次に、天地判定部12での天地判定の信頼度の設定処理について説明する。上記の天地判定処理により、各天地方向における判別可能な文字数が得られる。天地判定部12では、それら文字数から0度、90度、180度および270度の4方向に対する信頼度を設定する。
図4(a)は、一つの部分領域内に天地方向が異なる2種類の文字画像が存在する場合の各天地方向の信頼度の設定結果を示す説明図である。図4(b)は、部分領域内の文字画像の方向が一方向である場合の各天地方向の信頼度の設定結果を示す説明図である。図4(c)は、部分領域内において文字画像が少ない場合の各天地方向の信頼度の設定結果を示す説明図である。
図4(a)に示すように、一つの部分領域内に天地方向が異なる2種類の文字画像(天地方向が0度および270度方向の文字画像)が存在する場合は、0度および270度方向において信頼度が高くなる。但し、この場合には両方向の信頼度の差は小さい。また、図4(b)に示すように、部分領域内の文字画像の方向が一方向(0度方向)の場合は、0度方向において信頼度が高くなる。また、図4(c)に示すように、部分領域内において文字画像が少ない場合には、全ての天地方向において信頼度が低くなる。
図5(a)は、天地判定部12により算出された、図2(b)に示した第1〜第3部分領域41〜43についての0度、90度、180度、270度の各天地方向についての信頼度を示す説明図である。図5(b)は、図5(a)に示した第1〜第3部分領域41〜43についての各天地方向の信頼度に基づいて決定された、第1〜第3部分領域41〜43についての天地方向を示す説明図である。図5(b)の結果では、天地方向は、第1部分領域41が90度、第2部分領域42が270度、第3部分領域43が180度と決定されている。
表示制御部14は、天地判定部12により決定された、各部分領域についての天地方向の信頼度を取得し、信頼度が所定の閾値未満の部分領域(以下、対象部分領域と称する)が画像データに含まれている場合には、その対象部分領域を含む画像データについてのプレビュー画像を作成し、表示装置2に出力する。このプレビュー画像には、対象部分領域の画像データについての天地方向を指定する入力を促す表示が含まれている。なお、上記プレビュー画像は、入力画像データのうち、対象部分領域の画像データのみを含むものであってもよい。
図6(a)は、天地判定部12による図5(a)および図5(b)に示した判定結果から得られる第1〜第3部分領域41〜43についての天地方向と信頼度とを示す説明図である。図6(b)は、各部分領域についての天地方向の信頼度と信頼度の閾値との関係に基づく、各部分領域についての表示装置2でのプレビュー表示の要否の例を示す説明図である。
図6(a)に示すように、各部分領域についての天地方向とその信頼度(天地方向/信頼度)は、第1部分領域41が90度/80、第2部分領域42が270度/40、第3部分領域43が180度/90となっている。ここで、天地方向の信頼度の上記閾値を70とした場合、図6(b)に示すように、第1および第3部分領域41,43についてはプレビュー表示が不要となり、第2部分領域42についてはプレビュー表示が要(プレビュー表示対象)となる。
上記の動作を行うため、表示制御部14は、図7に示すように、プレビュー要否判定部21、プレビュー画像生成部(表示用画像生成部)22、プレビュー画像出力部(表示用画像出力部)23および回転処理部24を備えている。図7は、図1に示した表示制御部14の構成を示すブロック図である。
プレビュー要否判定部21は、天地判定部12により決定された各部分領域についての天地方向の信頼度を所定の閾値と比較して、各部分領域についてユーザにより天地方向の指定を受けることの要否を判定する。すなわち、少なくともその対象部分領域およびその対象部分領域についての天地方向をユーザが指定するための指示領域32についてのプレビュー表示の要否を判定する。
(1−1)プレビュー表示要否の第1の判定方法
具体的には、プレビュー要否判定部21は、天地判定部12により決定された、各部分領域についての天地方向の信頼度を取得し、それら信頼度と所定の閾値とを比較する。そして、天地方向の信頼度が所定の閾値未満の部分領域(対象部分領域)については上記プレビュー表示が必要とし、天地方向の信頼度が所定の閾値以上の部分領域については上記プレビュー表示が不要とする。
なお、上記プレビュー表示の要否についての判定方法としては、上記の第1の判定方法の他、後述する判定方法がある。
プレビュー画像生成部22は、上記画像データに対象部分領域が含まれているとプレビュー要否判定部21にて判定された場合、少なくともその対象部分領域についてのプレビュー画像を生成する。あるいは、対象部分領域を含む画像データ全体のプレビュー画像を生成する。いずれのプレビュー画像を生成するかは、画像処理装置1において適宜設定可能である。ここでは、後者のプレビュー画像を生成する場合について説明する。
プレビュー画像生成部22が生成するプレビュー画像は、少なくとも指示領域を含んでいる。さらに、選択領域を含んでいてもよい。
選択領域は、上記対象部分領域に相当する領域であり、タッチパネルからなる領域である。指示領域は、上記選択領域として表示する対象部分領域の天地方向をユーザの入力操作により指定するための領域である。選択領域は、後述するように、ポップアップ表示を行う場合に使用される。
選択領域を生成する場合、プレビュー画像生成部22は、対象部分領域を含む画像データを記憶装置3から読み出す。次に、領域分割部11から提供される部分領域情報のうち、対象部分領域に関する部分領域情報を参照し、読み出した上記画像データにおいて、対象部分領域に相当する領域の座標を算出して切り出し、選択領域を生成する。そして、生成した選択領域を上記画像データの対象部分領域に重なるように配置する。
指示領域は、例えば上記選択領域の4辺に沿って配置された枠状のタッチパネルからなる領域である。上記指示領域では、上記4辺に沿う部分のうちのいずれかの部分をユーザが操作することにより、対象部分領域を指定し、かつその対象部分領域の天地方向を指摘できるようになっている。指示領域を生成する場合、プレビュー画像生成部22は、指示領域の配置位置の座標を計算して求め、選択領域(対象部分領域)の回りに配置する。
プレビュー画像出力部23は、プレビュー画像生成部22により生成されたプレビュー画像を表示装置2に出力する。この場合、プレビュー画像出力部23は、プレビュー画像の全体が表示装置2に適当なサイズに表示されるように、プレビュー画像に対して、画素の間引き処理あるいは拡大処理を行う。さらに、プレビュー画像出力部23は、表示装置2の表示特性に応じた階調補正(ガンマ補正)を行う。
画像に対する画素の間引き処理あるいは拡大処理としては、例えば、ニアレストネイバー法、バイリニア法およびバイキュービック法が知られている。
ニアレストネイバー法は、補間する画素に一番近い画素の値、あるいは補間する画素に対して所定の位置関係にある既存画素の値を補間する画素の値とする。バイリニア法は、補間する画素を囲む周囲4点の既存画素の距離に比例した形で重み付けした値の平均を求め、その値をその補間する画素の値とする。バイキュービック法は、補間する画素を囲む4点に加え、さらにそれらを囲む12点を加えた計16点の画素の値を用いて、画素の補間演算を行う。
回転処理部24は、表示装置2に表示にさせる画像(画像データ)を回転させるための回転処理を行う。例えば、上記指示領域に対して画像の天地方向を指定するユーザの入力が行われた場合、ユーザが選択した指示領域の位置に基づいて画像データの変換処理すなわち回転処理を行う。画像データの回転は、本実施の形態において、90度、180度または270度の90度単位にて、例えば時計回りに行われる。
文字認識部13は、画像データに含まれる各部分領域の画像データに対して、画像データと辞書データとを比較して文字認識を行う。具体的には、白黒2値(輝度信号)に変換された低解像度(例えば300dpi)の画像データを用いて、画像データの特徴量を抽出し、辞書データと比較して文字認識を行う。
この場合、文字認識部13は、信頼度が閾値以上の部分領域の画像データについては、天地判定部12にて決定された天地方向に従って文字認識を行う。一方、信頼度が閾値未満のために指示領域に対してユーザにより天地方向が指定された対象部分領域の画像データについては、指定された天地方向に従って文字認識を行う。なお、対象部分領域に対して天地方向が指定された場合、対象部分領域の画像データは指定された天地方向に回転処理部24にて回転される。したがって、文字認識部13は回転処理後の画像データに対して文字認識を行う。
例えば、第1部分領域41についての天地方向の判定結果は90度となっているので、第1部分領域41の画像データについては、画像データを時計回りに90度回転した後、文字認識を行う。これにより、天地方向が異なることによる誤認識が軽減され、文字認識精度が向上する。
(2−1)部分領域の矩形枠の第1の表示例
対象部分領域のみならず全ての部分領域をプレビュー表示する場合、あるいは対象部分領域を入力画像データに含まれた状態にてプレビュー表示する場合には、対象部分領域を囲む矩形枠を表示してもよい。図8は、表示装置2の表示画面2aに表示された、対象部分領域を含む画像データのプレビュー画像を示す説明図である。この例では、対象部分領域である第2部分領域42のみについて矩形枠が表示されている。また、第2部分領域42の矩形枠42aは上記の指示領域となっている。なお、部分領域の矩形枠の表示例としては、上記第1の表示例の他、後述の表示例がある。
(3−1)ポップアップ表示の第1の例
図9は、天地方向の信頼度が低い(信頼度に関する所定の閾値よりも低い)第2部分領域42について、画像データのプレビュー画像を表示した表示画面2aにおいて、第2部分領域42に対応する選択領域31および指示領域32をポップアップ表示した状態を示す説明図である。
上記のように、天地方向の信頼度が所定の閾値よりも低い部分領域(対象部分領域)については、少なくともその対象部分領域の画像をプレビュー表示する。このプレビュー表示においては、その対象部分領域の画像をポップアップ表示してもよい。
図9の表示状態は、図8に示した表示状態において、第2部分領域42上にタッチパネルからなる選択領域31が配置されている構成を前提としてこの選択領域31がユーザにより操作されること、あるいは指示領域32がユーザにて操作されることにより得られる。
図9の表示では、対象部分領域の画像をポップアップ表示し、さらにポップアップ表示した対象部分領域の周りに指示領域を重ねてポップアップ表示する。また、ポップアップ表示する場合において、画像データ全体をプレビュー画像として表示し、そのうち、対象部分領域のみをポップアップ表示しても、あるいは対象部分領域のみをプレビュー画像としてポップアップ表示してもよい。図9では、後者の場合を示している。この場合の選択領域および指示領域の生成方法は前述のとおりである。
また、図9の表示では、対象部分領域(選択領域31)をポップアップ表示する場合には、その対象部分領域(選択領域31)に対して天地判定部12により決定された天地方向に従って回転させた状態で表示されている。この場合の回転処理は回転処理部24にて行われる。
なお、天地判定部12では、図6(a)に示した第2部分領域42の天地方向の判定において誤判定している。すなわち、天地判定部12の判定結果では、信頼度が最も高い天地方向を270度としているものの、正解は90度である。したがって、図9のポップアップ表示では、誤判定の天地方向に従って第2部分領域42を時計回りに270度回転させて表示している。また、ポップアップ表示の例としては、上記第1の例の他、後述の例がある。
ポップアップ表示においては、いずれかの指示領域32が操作された場合、図10に示すように、例えば操作された指示領域32の方向が天方向となるように、対象部分領域(選択領域31)を回転させる。この回転処理は回転処理部24にて行われる。図10の例では、指示領域32a〜32dが配置され、指示領域32aがユーザにて操作された場合を示している。
また、入力画像データ全体のプレビュー画像を表示する場合において、対象部分領域のみならず全ての部分領域についてポップアップ表示を行うようにしてもよい。この場合の各部分領域のポップアップ表示の方法は、部分領域(選択領域31)および指示領域32をポップアップ表示するなど、上述した対象部分領域のみをポップアップ表示する場合と同様である。
なお、ポップアップ表示およびプレビュー表示の終了は、図示しない表示終了ボタンが操作されることにより行われる。また、入力画像データ全体の天地方向については、プレビュー画像を表示した状態において、表示装置2の表示画面2aにおいて、入力画像データ全体の天地方向を確認し、かつ天地方向を指定する入力をユーザに促す表示を行うようにしてもよい。
上記の構成において、本発明の実施の形態の画像処理装置1の動作を図11および図12のフローチャートに基づいて以下に説明する。図11は、図1に示した画像処理装置1の動作を示すフローチャート、図12は図11の動作につづく画像処理装置1の動作を示すフローチャートである。
画像処理装置1では、入力された画像データを記憶装置3に格納する(S11)。この入力画像データは、例えば画像読取装置にて読み取られた原稿の画像データである。
次に、領域分割部11は記憶装置3から入力画像データを読み出し、その画像データを複数の部分領域に分割する(S12)。
次に、天地判定部12は、各部分領域について、第1方向〜第4方向(0度方向、90度方向、180度方向、270度方向)の天地方向における信頼度を算出する(S13)。
次に、各部分領域における天地方向の信頼度が第1位の天地方向を各部分領域の天地方向として記憶する(S14)。
次に、表示制御部14は、入力画像データに信頼度の低い部分領域が含まれているか否か、すなわち入力画像データに、部分領域の天地方向(部分領域における信頼度が第1位の天地方向)の信頼度が所定の閾値未満の部分領域が含まれているか否かを判定する(S15)。
この判定の結果、入力画像データに天地方向の信頼度が所定の閾値未満の部分領域(対象部分領域)が含まれている場合、表示制御部14は、その対象部分領域に対する指示領域(タッチエリア)32と選択領域(タッチエリア)31とを作成する(S16)。なお、対象部分領域が複数存在する場合には、各対象部分領域に対して指示領域32および選択領域31を作成する。
次に、表示制御部14は、記憶装置3からプレビュー表示すべき入力画像データを読み出し(S17)、その入力画像データに対してプレビュー表示するための間引き処理を行う(S18)。
次に、表示制御部14は、間引き処理後の入力画像データにおける対象部分領域に、選択領域31と指示領域32とを重ね、その入力画像データをプレビュー表示用の画像データとして表示装置2に出力する。これにより、表示装置2ではプレビュー表示が行われる(S19)。
このプレビュー表示状態では、表示装置2において選択領域31に対する選択を受け付ける(S20)。この場合、表示制御部14は、表示装置2において、選択領域31がオン操作されると対象部分領域がポップアップ表示される旨の表示を行わせてもよい。
その後、選択領域31に対する選択の入力がなく(S21)、また、全ての対象部分領域に対して指示領域32への天地方向を指定する入力が行われると(S22)、処理を終了する。
一方、S21において、対象部分領域に設定された選択領域31に対する選択の入力操作が行われると、表示制御部14は、入力操作が行われた選択領域31に対応する対象部分領域を入力画像データ(例えば上記の間引き処理済の画像データ)から切り出す(S23、図12)。
次に、表示制御部14は、切り出した対象部分領域を拡大し(S24)、拡大した対象部分領域と指示領域32とを仮回転させる(S25)。この仮回転とは、前述のように、その対象部分領域を天地判定部12により決定された天地方向に従って回転させる処理である。
次に、表示制御部14は、S25にて処理された対象部分領域と指示領域32とをポップアップ表示用の画像データとして表示装置2に出力する。これにより、表示装置2では対象部分領域と指示領域32とがポップアップ表示される(S26)。なお、このポップアップ表示のための一連の処理は、選択領域31へのユーザ入力を要件とせず(S20およびS21の処理を経ることなく)、例えばS19での対象部分領域のプレビュー表示の際に、自動的に行われるようにしてもよい。
このポップアップ表示状態では、表示装置2において指示領域32に対する選択を受け付ける(S27)。この場合、表示制御部14は、表示装置2において、指示領域32に対しての、画像の天地方向を指定するユーザ入力を促す旨の表示を行ってもよい。
その後、対象部分領域の周りのいずれかの指示領域32に対してユーザ入力が行われると(S28)、表示制御部14は、ユーザ入力が行われた指示領域32に対応する対象部分領域の天地方向を、指示領域32への入力操作により指定された天地方向に更新する(S29)。
次に、表示制御部14は、対象部分領域と指示領域32とを、指示領域32へのユーザ入力により指定された天地方向に合致するように回転させ(S30)、S26の処理に戻る。これにより、表示装置2では、対象部分領域が、指示領域32へのユーザ入力により指定された天地方向に回転された状態で、ポップアップ表示される。
一方、S28において、対象部分領域の周りのいずれかの指示領域32に対してユーザ入力がない状態において、例えばユーザ入力によりポップアップ表示の終了が指示されると(S31)、S20に戻って選択領域31に対する選択受付け状態となる。
また、S28において対象部分領域の周りのいずれかの指示領域32に対してユーザ入力がなく、かつS31において例えばユーザ入力によりポップアップ表示の終了が指示されていない状態において、S21での選択領域31に対する入力操作から所定時間が経過すると(S32)、S20に戻って選択領域31に対する選択受付け状態となる。なお、S21での選択領域31に対する入力操作から所定時間が経過しない状態では、S26、S27、S28、S31、S32の処理を繰り返す。
以上のように、本実施の形態の画像処理装置1では、天地方向の信頼度が低い部分領域(対象部分領域)と高い部分領域(非対象部分領域)とが混在しているような入力画像データ(例えばPDFデータ)に対しても、各部分領域に対して正しい天地方向に従って正確な文字認識を行うことができる。また、対象部分領域と非対象部分領域とでは、正しい天地方向に従って文字認識を行えるように、処理手順を異ならせているので、文字認識処理までを含む処理時間を抑制しながら、入力画像データ全体に対して高精度の文字認識処理を行うことができる。
なお、上記プレビュー表示の要否についての判定方法としては、上記の第1の判定方法の他、下記の判定方法がある。
(1−2)プレビュー表示要否の第2の判定方法
プレビュー要否判定部21は、天地判定部12により決定された、各部分領域についての天地方向の信頼度を取得し、各部分領域について信頼度が第1位の天地方向の信頼度R1と信頼度が第2位の天地方向の信頼度R2との比(R1/R2)を求める。そして、各部分領域ついての比(R1/R2)と所定の閾値Tc(例えばTc=2)とを比較する。この比較の結果、比(R1/R2)が所定の閾値Tc以下の部分領域(対象部分領域)については上記プレビュー表示が必要とし、比(R1/R2)が所定の閾値Tcよりも大きい部分領域については上記プレビュー表示が不要とする。
(1−3)プレビュー表示要否の第3の判定方法
プレビュー要否判定部21は、天地判定部12により決定された、各部分領域についての天地方向の信頼度を取得し、各部分領域について信頼度が第1位の天地方向の信頼度R1と所定の閾値Ta(例えばTa=70)とを比較する。また、各部分領域について信頼度が第1位の天地方向の信頼度R1と信頼度が第2位の天地方向の信頼度R2との比(R1/R2)を求め、この比(R1/R2)と所定の閾値Tc(例えばTc=2)とを比較する。この比較の結果、信頼度R1が所定の閾値Ta以下、かつ比(R1/R2)が所定の閾値Tc以下の部分領域については上記プレビュー表示が必要とし、信頼度R1が所定の閾値Taよりも大きいか、あるいは比(R1/R2)が所定の閾値Tcよりも大きい部分領域については上記プレビュー表示が不要とする。
また、部分領域の矩形枠の表示例としては、上記第1の表示例の他、下記の表示例がある。
(2−2)部分領域の矩形枠の第2の表示例
対象部分領域のみならず全ての部分領域をプレビュー表示する場合には、各部分領域を天地方向の信頼度に応じて色分けして表示してもよい。この場合には、例えば各部分領域を囲む矩形枠を色を変えて表示する。図13は、表示装置2に表示させたプレビュー画像33において、各部分領域を囲む矩形枠を各部分領域の天地方向の信頼度に応じて色分けして表示する例を示す説明図である。図13において、天地方向の信頼度が第1位の第3部分領域43の矩形枠43aは濃度が低い色(淡い色)、天地方向の信頼度が第2位の第1部分領域41の矩形枠41aは濃度が中間の色、天地方向の信頼度が第3位の第2部分領域42の矩形枠42aは濃度が高い色(濃い色)となっている。なお、各矩形枠41a〜43aは上記の指示領域32に相当する機能を有するものとしてもよい。
(2−3)部分領域の矩形枠の第3の表示例
対象部分領域のみならず全ての部分領域をプレビュー表示する場合には、各部分領域を天地方向の信頼度に応じた順序に並べて配置してもよい。図14は、表示装置2に表示させたプレビュー画像33において、各部分領域を信頼度に応じてた順序に並べて配置した状態を示す説明図である。図14の例では、第1〜第3部分領域41〜43が天地方向の信頼度の低い順序に左側から右側に並べられている。なお、各矩形枠41a〜43aは上記の指示領域32に相当する機能を有するものとしてもよい。
また、ポップアップ表示の例としては、上記第1の例の他、下記の例がある。
(3−2)ポップアップ表示の第2の例
上記(3−1)の例では、対象部分領域上の、タッチパネルからなる選択領域31もしくは指示領域32がユーザにて操作されることにより対象部分領域(選択領域31)をポップアップ表示する構成としている。これに対し、対象部分領域をプレビュー画像としてポップアップ表示する場合には、図8の表示状態を経ずに、図9に示すように、対象部分領域を直接ポップアップ表示する構成としてもよい。
(3−3)ポップアップ表示の第3の例
図9のポップアップ表示では、対象部分領域(選択領域31)を天地判定部12により決定された天地方向に従って回転させた状態で表示させている。これに対して、対象部分領域(選択領域31)を天地判定部12により決定された天地方向に従って回転させない状態で、すなわち画像データ中における第2部分領域42の天地方向のままで表示させてもよい。
(3−4)ポップアップ表示の第4の例
例えば図9に示したポップアップ表示においては、対象部分領域(選択領域31)を囲むように矩形枠状に配置された4個の指示領域32が表示されている。この例は、これら指示領域32の表示濃度をあるいは表示色を、対象部分領域における天地方向ごとの信頼度に応じて異ならせるものである。
図15(a)は表示装置2においてプレビュー表示される部分領域の4方向の天地方向と信頼度との関係を示す説明図である。図15(b)は、図15(a)に示した部分領域のポップアップ表示において、各天地方向の信頼度に応じて指示領域32の濃度もしくは色を異ならせた状態を示す説明図である。
図15(a)に示す部分領域51では、天地方向と信頼度との関係が、反時計回り方向に見て、0度/35、90度/10、180度/80、270度/15となっている。このような部分領域51に対して、図15(b)に示したポップアップ表示では、信頼度が最も低い天地方向に対応する指示領域32は、最も濃度が低く(最も薄い色)、信頼度が高くなるに従って指示領域32の濃度が高く(濃い色)なるようにしている。
図16(a)は、図15(b)に示した4方向の天地方向に対応する4個の指示領域32について、天地方向の信頼度が高い順にて指示領域32の濃度(色)を変化させる場合の、信頼度が第1位から第4位までの指示領域32の色の例を示す説明図である。図16(b)は、図16(a)に示したR(R1〜R4)の値を示す説明図である。図16(c)は、図16(a)に示したR(R1〜R4)の値の他の決定方法を示す説明図である。
図15(a)に示す部分領域51では、各天地方向の信頼度の順位が、1位:180度、2位:0度、3位:270度、4位:90度となっている。一方、図16(a)の例では、指示領域32の色を示すR,G,Bの値のうち、G(=0)およびB(=127)を一定として、Rの濃度を変化させている。また、図16(b)の例では、R1からR4に向かって濃度が低くなっている。したがって、指示領域32の色は、1位の180度に対応する指示領域32の色が最も濃く、2位の0度、3位の270度、4位の90度に向かって順次色が薄くなっている。ただし、ここでは、信頼度の値ではなく、信頼度の順位に応じて指示領域32の値濃度(色)が決定される。
図16(c)の例では、天地方向の信頼度が1位の信頼度を基準とし、その信頼度に対する他の天地方向の信頼度の比Cを求め、その比Cを用いて各天地方向に対応する指示領域32の濃度(色)を決定している。
(3−5)ポップアップ表示の第5の例
この例は、例えば図9に示したポップアップ表示において、各天地方向に対応する4個の指示領域32の表示サイズを、対象部分領域51における天地方向ごとの信頼度に応じて異ならせるものである。
図17は、図9に示した部分領域のポップアップ表示において、各天地方向の信頼度に応じて指示領域32のサイズを異ならせた状態を示す説明図である。この例では、矩形にて表示されている指示領域32の長さを異ならせている。
図17に示す部分領域51では、天地方向と信頼度との関係が、図15(a)に示すように、反時計回り方向に見て、0度/35、90度/10、180度/80、270度/15となっているものとする。このような部分領域51に対して、図17に示したポップアップ表示では、信頼度が最も低い天地方向に対応する指示領域32は、最も短く、信頼度が高くなるに従って指示領域32の長さが長くなっている。
図18(a)は、4方向の天地方向に対応する4個の指示領域32について、天地方向の信頼度が高い順にて指示領域32のサイズ(長さ)を変化させる場合の、信頼度が第1位から第4位までの指示領域32のサイズ(長さ)の例を示す説明図である。図18(b)は、図18(a)に示したM(M1〜M4)の値(倍率)を示す説明図である。図18(c)は、図18(a)に示したM(M1〜M4)の値の他の決定方法を示す説明図である。図18(d)は、図18(c)に示した信頼度に応じた倍率(C1〜C4)の値の決定方法を示す説明図である。
図15(a)に示す部分領域51では、各天地方向の信頼度の順位が、1位:180度、2位:0度、3位:270度、4位:90度となっている。一方、図18(a)の例では、各指示領域32のサイズ(長さ)を指示領域32の基準サイズ(例えば最大サイズ)に倍率Mを乗じて決定している。倍率Mは、図18(b)に示すように、天地方向の信頼度が高いほど大きくなっている。したがって、指示領域32のサイズ(長さ)は、1位の180度に対応する指示領域32のサイズ(長さ)が最も大きく、2位の0度、3位の270度、4位の90度に向かって順次小さくなっている。ただし、ここでは、信頼度の値ではなく、信頼度の順位により指示領域32のサイズが決定される。
図18(c)の例では、上記倍率M(M1〜M4)を信頼度の値に応じた値C(C1〜C4)としている。すなわち、各指示領域32のサイズ(長さ)を求めるために、指示領域32の基準サイズに乗じる倍率Mを、図18(d)に示すように、天地方向の信頼度が1位の信頼度に対する他の天地方向の信頼度の比としている。
〔実施の形態2〕
本発明の他の実施の形態を図面に基づいて以下に説明する。本実施の形態は、図1に示した画像処理装置1を複合機である画像形成装置に適用した例を示すものである。図19は画像形成装置200における印刷動作の状態を示すブロック図である。図20は画像形成装置200のプレビュー表示の動作状態を示すブロック図である。図21は画像形成装置200のイメージ送信状態を示すブロック図である。
本実施形態の画像形成装置200は、複写機能(複写モード)、プリンタ機能(プリントモード)、ファクシミリ送受信信機能(ファクシミリ送信モード、ファクシミリ受信モード)およびscan to e-mail機能(scan to e-mailモード)等を備えたデジタルカラー複合機である。
複写モードは、原稿の画像データを読み取り、その画像データの画像を用紙に印刷するモードである。プリントモードは、画像形成装置200に接続されている端末装置から送られてくる画像データの画像を用紙に印刷するモードである。ファクシミリ送信モードは、原稿の画像データを読み取り、その画像データを電話回線によって外部装置に送信するモードである。ファクシミリ受信モードは、外部装置から画像データをファクシミリにて受信し、受信した画像データの画像を用紙に印刷するモードである。scan to e-mailモードは、原稿を読み取って生成した画像データを電子メールに添付して指定されたアドレスへ送信するモードである。なお、画像出力装置(印刷装置)は電子写真方式プリンタやインクジェット方式プリンタ等の画像を再現する装置である。
画像形成装置は、例えば図19に示すように、画像処理装置201、画像入力装置、202、画像出力装置203、送受信装置204、画像表示装置205、記憶装置204および制御装置207を備えている。
画像入力装置202は、CCD(Charge Coupled Device)ラインセンサを備え、原稿の読取動作を行う。すなわち、原稿に対して光りを照射し、原稿から反射してきた光をR、G、B(R:赤・G:緑・B:青)に色分解された電気信号に変換する。画像処理装置201は、画像入力装置202から入力した画像データに対して画像処理を施す。画像出力装置203は、例えば電子写真方式プリンタやインクジェット方式のプリンタであり、画像処理装置201から入力した画像データの画像を用紙に印刷する。送受信装置204は、電話回線またはインターネットに接続されており、外部装置との間で画像データを送受信する。画像表示装置205は、画像形成装置200の操作パネル(図示せず)に備えられているタッチパネル方式の例えば液晶ディスプレイであり、カラー表示が可能なものである。この画像表示装置は、図1に示した表示装置2に対応する。
記憶装置206は、図1に示した記憶装置3に対応する。制御装置207は、CPUを含むコンピュータであり、画像形成装置200が備える各種ハードウエアや各ハードウエア間のデータ転送等を統括的に制御する。また、制御部108は、画像形成装置200に備えられる各制御する機能も有する。
画像処理装置201は、A/D(アナログ/デジタル)変換部221、シェーディング補正部222、入力処理部223、第1原稿検知部224、色化処理部226、黒生成/下色除去部227、空間フィルタ部228、出力階調補正部229、中間調生成部230および領域分離処理部231、第2原稿検知部232、文字認識部233、描画コマンド生成部234およびフォーマット化処理部235を有している。
A/D変換部221は、画像入力装置202から入力されたアナログのRGBの画像信号をデジタルのRGBの画像データに変換する。シェーディング補正部222は、A/D変換部222から入力された画像データに対して、画像入力装置202の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施す。入力処理部223は、シェーディング補正部222から入力されたRGBの画像データのそれぞれに対してγ補正処理などの階調変換処理を施す。
第1原稿検知部224は、入力処理部223にて処理された画像データに対して、原稿の傾き検知を行う。原稿補正部225は、第1原稿検知部224での傾き検知の結果に基づいて、画像データに対して傾き補正処理を行う。
色補正部226は、原稿補部225から入力したRGBの画像データをCMYの画像データに変換し、また当該画像データに対して色再現性を高める処理を施す。
黒生成/下色除去部227は、色補正部226から入力したCMYの画像データから黒(K)の画像データを生成し、入力したCMYの画像データから黒(K)の画像データを差し引いて新たなCMYの画像データを生成する。
空間フィルタ部228は、黒生成/下色除去部227から入力したCMYKまたはCMYの画像データに対して、領域分離データを基にデジタルフィルタによる空間フィルタ処理(強調処理、平滑化処理等)を行う。
出力階調補正部229は、空間フィルタ部228から入力した画像データに対して、用紙等の記録媒体に出力するためのγ補正処理を行う。
中間調生成部230は、出力階調補正部229から入力した画像データに対し、誤差拡散法やディザ法を用いて、画像出力装置203において画像を印刷するために必要な階調再現処理(中間調生成処理)を行う。
領域分離部231は、原稿補正部225から入力したRGBの画像データについて、各画素が例えば黒文字領域、色文字領域あるいは網点領域のうちの何れの領域に属するかを判別し、その判別結果を示す領域分離データを生成する。生成した領域分離データは、黒生成/下色除去部227、空間フィルタ部228および中間調生成部230に出力される。
第2原稿検知部232は、図1に示した領域分割部11、天地判定部12および表示制御部14に対応する機能を有する。
文字認識部233は、図1に示した文字認識部13に対応するものであり、文字認識部13と同様の機能を有する。
描画コマンド生成部234は、画像データに対して文字認識部233による文字認識結果を透明テキストとして埋め込む処理を行う。
フォーマット化処理部235は、入力された画像データを外部装置が扱える汎用のフォーマット(ファイル形式)に変換する。
図22は、第1原稿検知部224の構成を示すブロック図である。第1原稿検知部224は、図22に示すように、信号変換部241、2値化処理部242、解像度変換部243および原稿傾き検知部244を備えている。
信号変換部241は、下記の演算により、RGBのカラー画像データを輝度信号に変換する。
Yi=0.30Ri+0.59Gi+0.11Bi
Y:各画素の輝度信号
R,G,B:各画素の各色成分の値
添え字のi:画素毎に付与された値(iは1以上の整数)
なお、信号変換部241ので処理においては、RGB信号をCIE1976L***信号(CIE:Commission International de l'Eclairage、L*:明度、a*,b*:色度)に変換してもよく、あるいは、G信号を用いてもよい。
2値化処理部242は、信号変換部241から入力した画像データを2値化する。画像データが8ビットの場合、例えば、閾値を128とする。あるいは、複数の画素(例えば5×5)よりなるブロックも濃度(画素値)の平均値を閾値とする。
解像度変換部243は、2値化処理部242にて2値化された画像データの解像度を低解像度化する。例えば、1200dpiあるいは600dpiで読み込まれた画像データを300dpiに変換する。解像度変換の方法は、公知のニアレストネイバー法、バイリニア法、バイキュービック法等を用いて行う。
原稿傾き検知部244は、例えば特開平7−192086号公報(特許文献4)に記載の方法により原稿の傾き検知を行う。この原稿傾き検知とは、原稿画像を読み取るためにスキャナとしての画像入力装置202に載置された原稿の傾きによる読取画像(画像データ)を補正するために行うものである。ここでの原稿傾き検知は、次の手順にて行われる。
(c1)2値化処理部242にて2値化された画像データから、黒画素と白画素との境界点を複数個抽出し、各境界点の点列の座標データを求める。この場合、黒画素と白画素の境界点は、例えば各文字の上端における白/黒境界点の座標であり、この座標を求めて記憶装置206に格納する。
(c2)上記(c1)の処理によって得られた多数の境界点の座標からなる点列座標データを参照して、この点列座標から回帰直線を求め、その回帰係数bを計算してメモリに格納する(下記(1)式)。
Figure 0004927122
ここで、(1)式におけるSx,Syはそれぞれ変量xとyの残差平方和で、Sxyはxの残差とyの残差の積の和である。すなわち、次の(2)〜(4)式で表わされる。
Figure 0004927122
回帰係数bより画像の傾き角度(θ)を(5)式によって算出する。
Figure 0004927122
原稿補正部225からは、原稿の傾きが補正された300dpiの画像データが第2原稿検知部232に出力される。第2原稿検知部232に備えられる領域分割部11では、凡そのレイアウトが分かれば良いため、上記解像度変換部243で75dpiの画像データを生成して第2原稿検知部232に出力し、文字認識部233には300dpiの画像データを出力するようにしてもよい。
原稿補正部225は、前述のように、第1原稿検知部224での傾き検知の結果に基づいて、画像データに対して傾き補正処理を行う。
画像データを原点を中心に、反時計まわりに角度θだけ、傾き補正した場合の補正前後の座標の関係は以下の(6)式にて表され、その式を用いて原稿の傾き補正を行う。
補正前座標(X,Y)、補正後座標(X’,Y’)
Figure 0004927122
例えば、画像データを原点を中心に、反時計まわりに角度90度、180度、270度回転する場合の回転前後の座標の関係は以下の式で表される。そこで、下記式を用いて原稿の傾き補正を行う。
回転前座標(X,Y)、回転後座標(X’,Y’)
90度回転時
X’= オリジナル画像Y方向サイズ − 1 − Y
Y’= X
180度回転時
X’= オリジナル画像X方向サイズ − 1 − X
Y’= オリジナル画像Y方向サイズ − 1 − Y
270度回転時
X’= Y
Y’= オリジナル画像X方向サイズ − 1 − X
図23は第2原稿検知部232の構成を示すブロック図である。第2原稿検知部232は、領域分割部251、天地判定部252および天地判定補正部253を備えている。領域分割部251は、図1に示した領域分割部11に対応するものであり、領域分割部11と同様の機能を有する。天地判定部252は、図1に示した天地判定部12に対応するものであり、天地判定部12と同様の機能を有する。天地判定補正部253は、天地判定部252から出力される2値画像データを90度単位で回転させる。何度回転させるかは、天地判定部252における天地判定結果に従う。
上記の構成において、画像形成装置200における複写モードでの印刷動作(図19)について説明する。この際には、画像入力装置202にて原稿の画像が読み取られ、画像入力装置202から画像処理装置201にアナログのカラー画像信号(RGBアナログ信号)が入力される。この画像信号は、A/D変換部221にてデジタル信号に変換され、シェーディング補正部222にて画像入力装置202の照明系、結像系、撮像系で生じる各種の歪みが取り除かれる。その後、入力処理部223においてRGB信号のそれぞれに対してγを補正する処理などが施される。入力処理部223にて処理された画像データは一旦記憶装置206に記憶される。
次に、第1原稿検知部224は記憶装置206に記憶されている上記画像データに対して、原稿の傾き検知を行う。次に、原稿補正部225は、第1原稿検知部224での傾き検知の結果に基づいて、上記画像データに対して傾き補正処理を行う。
なお、原稿補正部225にて処理された画像データは、ファイリングデータとして管理してもよい。この場合、上記画像データは、例えば、JPEG圧縮アルゴリズムに基づいてJPEGコードに圧縮されて格納される。
上記JPEGコードは、コピー出力動作やプリント出力動作が指示された場合、記憶装置206から読み出され、JPEG伸張部(図示せず)において復号化処理されてRGBデータに変換される。一方、イメージ送信動作の場合、記憶装置206から読み出され、ネットワーク網や通信回線を介して外部接続装置や通信回線へ出力される。なお、ファイリングデータの管理やデータの引渡しの動作制御については制御装置207が行うものとする。
色補正部226では、RGB信号の補色であるCMY(C:シアン・M:マゼンタ・Y:イエロー)信号が生成されると共に色再現性を高める処理が施され、黒生成/下色除去部227にてCMYK(K:黒)4色信号に変換される。空間フィルタ部228ではCMYK信号に対して強調処理や平滑化処理がなされ、出力階調補正部229では、用紙等の記録媒体に出力するための出力γ補正処理がなされる。中間調生成部230では画像を出力するための階調再現処理が行われる。中間調処理部230から出力されたCMYK信号は画像出力装置203に入力され、可視像として用紙に印刷される。
ここで、出力階調補正部229にて行われるγ補正について説明する。図24(a)は表示装置の表示特性に応じたγ補正曲線の一例を示すグラフ、図24(b)は文字をくっきりとさせるγ補正曲線の一例を示すグラフである。画像出力装置203での印刷のための出力階調補正部229でのγ補正では、図24(b)に実線に示すように、印刷した文字が鮮明となるように、表示装置の表示特性に応じたγ補正(破線)とは異なるγ補が行われる。
一方、領域分離部231から出力される領域分離データは、黒生成/下色除去部227、空間フィルタ部228、中間調生成部230に入力され、これら各機能部において各種領域に応じた適切な処理の切替えが行われる。
次に、画像形成装置200におけるイメージ送信動作(図21)について説明する。この場合の画像入力装置202、A/D変換部221、シェーディング補正部222、入力処理部223および領域分離部231の処理内容は、前述した複写モードでの印刷動作時と同様である。
色補正部226では、対象部分領域25から入力した画像データを、一般に普及している表示装置の表示特性に適合したR’G’B’の画像データ(例えば、sRGBデータ)に変換する。空間フィルタ部228では、対象部分領域231から出力される領域分離データを基に、入力された画像データに対してデジタルフィルタによる空間フィルタ処理(強調処理,平滑化処理)を行う。出力階調補正部229では、例えば、文字領域に対しては図24(b)のγ補正曲線を用いた補正を行い、文字領域以外の領域に対しては図24(a)のγ補正曲線を用いた補正を行う。
なお、黒生成/下色除去部227および中間調生成部230は、入力される画像データに対して処理を行わず、その画像データをそのまま後段のブロックにスルーする。したがって、出力階調補正部229から出力されるのはR’G’B’の画像データである。
一方、第2原稿検知部232において天地方向が補正された部分領域の画像データを含み、第2原稿検知部232での処理を経た各部分領域の画像データに対しては、文字認識部233において文字認識処理が行われる。次に、描画コマンド生成部234では、上記の各部分領域を含む画像データに対して、透明テキストを配置する命令の生成が行われる。
出力階調補正部229から出力されるR’G’B’の画像データおよび描画コマンド生成部234から出力される認識データは、ファーマット化処理部235にてPDFファイル等の画像ファイルに変換される。この画像ファイルには、文字認識の結果が描画コマンド生成部234により透明テキストとして埋め込まれている。フォーマット化された画像ファイルは、図示しないメール処理部(ジョブ装置)にて電子メールに添付され、その電子メールがネットワークを介して相手先に送信されることになる。
次に、画像形成装置200におけるプレビュー表示の動作(図20)について説明する。この動作では、指示領域231、第2原稿検知部232および文字認識部233により、図1に示した画像処理装置1と同様の動作が行われる。この場合、第2原稿検知部232は、図1に示した領域分割部11、天地判定部12および表示制御部14として機能し、領域分割部11は領域分離部231からの領域分離データに基づいて画像データを部分領域に分割する。画像表示装置205は図1の表示装置として機能する。
〔実施の形態3〕
本発明の実施の他の形態を図面に基づいて以下に説明する。本実施の形態は、図1に示した画像処理装置1を画像読取装置(スキャナ)に適用した例を示すものである。図25は画像読取装置300の構成を示すブロック図である。
画像読取装置300は画像入力装置202と画像処理装置301とを備えている。画像処理装置301は、A/D変換部221、シェーディング補正部222、入力処理部223、第1原稿検知部224、原稿補正部225、色補正部226、第2原稿検知部232、文字認識部233、描画コマンド生成部234およびフォーマット化処理部235を備えている。画像処理装置301の各処理部の処理内容は、前述の画像形成装置200におけるイメージ送信の場合と同様である。
画像処理装置301において処理が施された画像データ、例えばPDFファイルはコンピュータやハードディスク、ネットワークなどへ出力される。また、画像表示装置205において天地方向の信頼度が低い部分領域(対象部分領域)につてプレビュー表示が行われる点、並びにこのプレビュー表示された指示領域32に対してユーザにより天地方向が指定された場合に、対象部分領域の天地方向を指定された天地方向とする点については、画像処理装置1の場合と同様である。
本発明はコンピュータに実行させるためのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録したコンピュータ読み取り可能な記録媒体に、上記した原稿の方向判定を行い原稿に回転処理を施す方向を重ねて表示を行う画像処理方法を記録するものとすることもできる。
この結果、原稿の方向判定を行い原稿に回転処理を施す方向を重ねて表示を行う画像処理方法を行うプログラムを記録した記録媒体を持ち運び自在に提供することができる。
なお、本実施の形態では、この記録媒体としては、マイクロコンピュータで処理が行われるために図示していないメモリ、例えばROMのようなものそのものがプログラムメディアであってもよいし、また外部記憶装置(図示せず)としてプログラム読み取り装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。
いずれの場合においても、格納されているプログラムコードはマイクロプロセッサがアクセスして実行させる構成であってもよいし、あるいは、いずれの場合もプログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムコードが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスクやハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムコードを担持する媒体であってもよい。
また、本実施の形態においては、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムコードを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムコードをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別の記録媒体からインストールされるものであってもよい。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
上記記録媒体は、デジタルカラー画像形成装置やコンピュータシステムに備えられるプログラム読み取り装置により読み取られることで上述した画像処理方法が実行される。
コンピュータシステムは、フラットベッドスキャナ、フィルムスキャナ、デジタルカメラなどの画像入力装置、所定のプログラムがロードされることにより上記画像処理方法など様々な処理が行われるコンピュータ、コンピュータの処理結果を表示するCRTディスプレイ、液晶ディスプレイなどの画像表示装置およびコンピュータの処理結果を紙などに出力するプリンタより構成される。さらには、ネットワークを介してサーバーなどに接続するための通信手段としてのネットワークカードやモデムなどが備えられる。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
1 画像処理装置
2 表示装置
11 領域分割部
12 天地判定部
13 文字認識部
14 表示制御部
21 プレビュー要否判定部
22 プレビュー画像生成部(表示用画像生成部)
23 プレビュー画像出力部(表示用画像出力部)
24 回転処理部
31 選択領域
32 指示領域
33 プレビュー画像
41 第1部分領域
41 a 矩形枠
42 第2部分領域
42 矩形枠
43 第3部分領域
43 矩形枠
51 部分領域
200 画像形成装置
201 画像処理装置
202 画像入力装置
203 画像出力装置(印刷装置)
205 画像表示装置
224 第1原稿検知部
225 原稿補正部
231 領域分離部
232 第2原稿検知部
233 文字認識部
300 画像読取装置
301 画像処理装置

Claims (10)

  1. 入力された画像データが少なくとも複数の文字画像を含む文書画像データであり、前記画像データをそれぞれが文字画像を含む、上下の平行な直線および左右の平行な直線にて区切った複数の矩形の部分領域に分割する領域分割部と、
    前記画像データが前記部分領域の矩形における互いに平行な上下の2辺に垂直な方向を上下方向として配置され、前記部分領域の画像データの上下方向および左右方向方向を天地方向とした場合の、上の向き、下の向き、右の向きおよび左の向きの4つの向きについて、前記部分領域の文字画像に含まれる各文字のデータベース化された文字パターンとのパターンマッチングにより判別可能な文字数を求め、それら文字数から、それぞれの向きを天の向きと見なす上での信頼度をそれぞれの向きについて求め、求めた信頼度のうち、信頼度が最も高い向きをその部分領域の天の向きとして設定する天地判定部と、
    前記天地判定部により天の向きが設定された部分領域について、天の向きの信頼度が任意に設定された所定値よりも低い部分領域である対象部分領域、および信頼度が所定値以上の部分領域である非対象部分領域のうち、少なくとも前記対象部分領域の画像と前記対象部分領域の天の向きを指定するユーザ入力を受け付ける領域であって矩形の前記対象部分領域の4辺に沿って前記対象部分領域の周りの上下左右の4箇所の位置に配置される指示領域の画像とを表示装置に表示させるための表示用画像データを生成する表示制御部と、
    前記対象部分領域については前記指示領域に対して指定された天の向き天の向きとして、前記非対象部分領域については前記天地判定部にて設定された天の向き天の向きとして、各部分領域ごとに文字認識を行う文字認識部とを備えていることを特徴とする画像処理装置。
  2. 前記表示制御部は、前記対象部分領域の画像と前記指示領域の画像とを生成する表示用画像生成部と、これら対象部分領域の画像と指示領域の画像とを拡大して前記表示用画像データとして出力する表示用画像出力部とを備えていることを特徴とする請求項1に記載の画像処理装置。
  3. 前記表示制御部は、前記指示領域に対しての天の向きを指定する入力に従って前記表示用画像データを回転させ、前記表示用画像データとして出力する回転処理部を備えていることを特徴とする請求項2に記載の画像処理装置。
  4. 前記文字認識部は、前記非対象部分領域については前記天地判定部により設定された天の向きに従って前記非対象部分領域を回転させた後、前記対象部分領域については前記指示領域に対しての天の向きを指定する入力に従って前記対象部分領域を回転させた後、前記文字認識を行うことを特徴とする請求項1に記載の画像処理装置。
  5. 前記表示制御部は、前記各指示領域のサイズを、前記天地判定部により求められた、前記4方向の信頼度に応じて、各指示領域に対応する方向の信頼度が高いほど大きくすることを特徴とする請求項1に記載の画像処理装置。
  6. 前記表示制御部は、前記各指示領域のを、前記天地判定部により求められた、前記4方向の信頼度に応じて、各指示領域に対応する方向の信頼度が高いほど濃くすることを特徴とする請求項1に記載の画像処理装置。
  7. 請求項1から5の何れか1項に記載の画像処理装置と、前記表示用画像データを表示する表示装置と、画像データを用紙上に印刷する印刷装置とを備えていることを特徴とする画像形成装置。
  8. 入力された画像データが少なくとも複数の文字画像を含む文書画像データであり、前記画像データをそれぞれが文字画像を含む、上下の平行な直線および左右の平行な直線にて区切った複数の矩形の部分領域に分割する領域分割工程と、
    前記画像データが前記部分領域の矩形における互いに平行な上下の2辺に垂直な方向を上下方向として配置され、前記部分領域の画像データの上下方向および左右方向方向を天地方向とした場合の、上の向き、下の向き、右の向きおよび左の向きの4つの向きについて、前記部分領域の文字画像に含まれる各文字のデータベース化された文字パターンとのパターンマッチングにより判別可能な文字数を求め、それら文字数から、それぞれの向きを天の向きと見なす上での信頼度をそれぞれの向きについて求め、求めた信頼度のうち、信頼度が最も高い向きをその部分領域の天の向きとして設定する天地判定工程と、
    前記天地判定工程により天の向きが設定された部分領域について、天の向きの信頼度が任意に設定された所定値よりも低い部分領域である対象部分領域、および信頼度が所定値以上の部分領域である非対象部分領域のうち、少なくとも前記対象部分領域の画像と前記対象部分領域の天の向きを指定するユーザ入力を受け付ける領域であって矩形の前記対象部分領域の4辺に沿って前記対象部分領域の周りの上下左右の4箇所の位置に配置される指示領域の画像とを表示装置に表示させるための表示用画像データを生成する表示制御工程と、
    前記対象部分領域については前記指示領域に対して指定された天の向き天の向きとして、前記非対象部分領域については前記天地判定工程にて設定された天の向き天の向きとして、各部分領域ごとに文字認識を行う文字認識工程とを備えていることを特徴とする画像処理方法。
  9. 請求項1から何れかに1項に記載の画像処理装置の前記の各部としてコンピュータを機能させるためのプログラム。
  10. 請求項に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2009142552A 2009-06-15 2009-06-15 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体 Expired - Fee Related JP4927122B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009142552A JP4927122B2 (ja) 2009-06-15 2009-06-15 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体
US12/814,144 US8532434B2 (en) 2009-06-15 2010-06-11 Image processing method and apparatus for determining orientations based on reliabilities of a plurality of portions into which image has been divided or for determining orientations of portions of image divided by user's input so as to recognize characters for each divided portion of image, image forming apparatus, and storage medium
CN2010102032992A CN101923644B (zh) 2009-06-15 2010-06-11 图像处理方法、图像处理装置以及图像形成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009142552A JP4927122B2 (ja) 2009-06-15 2009-06-15 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2010288229A JP2010288229A (ja) 2010-12-24
JP4927122B2 true JP4927122B2 (ja) 2012-05-09

Family

ID=43306506

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009142552A Expired - Fee Related JP4927122B2 (ja) 2009-06-15 2009-06-15 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体

Country Status (3)

Country Link
US (1) US8532434B2 (ja)
JP (1) JP4927122B2 (ja)
CN (1) CN101923644B (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4625861B2 (ja) * 2008-11-17 2011-02-02 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、制御プログラム、および記録媒体
US9094617B2 (en) * 2011-04-01 2015-07-28 Sharp Laboratories Of America, Inc. Methods and systems for real-time image-capture feedback
US8947453B2 (en) 2011-04-01 2015-02-03 Sharp Laboratories Of America, Inc. Methods and systems for mobile document acquisition and enhancement
CN102890784B (zh) * 2011-07-20 2016-03-30 富士通株式会社 识别图像块中文字的方向的方法和装置
CN102890783B (zh) * 2011-07-20 2015-07-29 富士通株式会社 识别图像块中文字的方向的方法和装置
US9201900B2 (en) * 2013-08-29 2015-12-01 Htc Corporation Related image searching method and user interface controlling method
US9286514B1 (en) * 2013-10-17 2016-03-15 United Services Automobile Association (Usaa) Character count determination for a digital image
JP5959550B2 (ja) * 2014-01-29 2016-08-02 京セラドキュメントソリューションズ株式会社 画像処理装置
KR20160027862A (ko) * 2014-09-02 2016-03-10 삼성전자주식회사 이미지 데이터를 처리하는 방법과 이를 지원하는 전자 장치
US9171352B1 (en) 2014-12-04 2015-10-27 Google Inc. Automatic processing of images
JP6494435B2 (ja) 2015-06-04 2019-04-03 キヤノン株式会社 情報処理装置、その制御方法及びコンピュータプログラム
US10121250B2 (en) * 2016-12-01 2018-11-06 International Business Machines Corporation Image orientation detection
US10019772B1 (en) * 2017-10-06 2018-07-10 Vertifi Software, LLC Document image orientation, assessment and correction
JP2019168999A (ja) * 2018-03-23 2019-10-03 カシオ計算機株式会社 撮像装置、撮像方法及びプログラム
US11030752B1 (en) 2018-04-27 2021-06-08 United Services Automobile Association (Usaa) System, computing device, and method for document detection
US11297296B2 (en) * 2018-05-30 2022-04-05 Sony Corporation Display control apparatus, program, and display control method
JP7468515B2 (ja) 2019-05-20 2024-04-16 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム
US11003937B2 (en) * 2019-06-26 2021-05-11 Infrrd Inc System for extracting text from images

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4717971A (en) * 1984-08-24 1988-01-05 Eastman Kodak Company Partitioned editing method for a collection of video still pictures
US5235651A (en) * 1991-08-06 1993-08-10 Caere Corporation Rotation of images for optical character recognition
JPH06189083A (ja) 1992-02-13 1994-07-08 Ricoh Co Ltd 画像方向認識装置および画像方向認識方法
US5301036A (en) * 1992-04-06 1994-04-05 Xerox Corporation Image orientation control
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
US5649033A (en) * 1992-09-18 1997-07-15 Minolta Camera Kabushiki Kaisha Image processing apparatus outputting desired image irrespective of directions of original and output paper
JP3338537B2 (ja) * 1993-12-27 2002-10-28 株式会社リコー 画像傾き検出装置
US6222545B1 (en) * 1995-03-28 2001-04-24 Canon Kabushiki Kaisha Image processing apparatus and method
JP3787377B2 (ja) 1995-08-31 2006-06-21 キヤノン株式会社 文書方向判定方法及び装置及び文字認識方法及び装置
US6137905A (en) * 1995-08-31 2000-10-24 Canon Kabushiki Kaisha System for discriminating document orientation
JP4170441B2 (ja) * 1997-11-28 2008-10-22 富士通株式会社 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体
JPH11341229A (ja) * 1998-05-29 1999-12-10 Canon Inc 画像処理装置及び画像処理方法
TW457458B (en) * 1998-06-01 2001-10-01 Canon Kk Image processing method, device and storage medium therefor
JP3629962B2 (ja) 1998-07-10 2005-03-16 ミノルタ株式会社 画像認識装置
US6798905B1 (en) * 1998-07-10 2004-09-28 Minolta Co., Ltd. Document orientation recognizing device which recognizes orientation of document image
JP2000113103A (ja) * 1998-09-30 2000-04-21 Ricoh Co Ltd 文書画像の方向判定方法、装置および記録媒体
US6157439A (en) * 1999-04-26 2000-12-05 Hewlett-Packard Company Copy system with document previewing
JP2001043310A (ja) * 1999-07-30 2001-02-16 Fujitsu Ltd 文書画像補正装置および補正方法
JP4416890B2 (ja) * 1999-12-20 2010-02-17 富士通株式会社 帳票識別装置
US6697091B1 (en) * 2000-01-19 2004-02-24 Xerox Corporation Systems, methods and graphical user interfaces for indicating a desired original document orientation for image capture devices
US6993205B1 (en) * 2000-04-12 2006-01-31 International Business Machines Corporation Automatic method of detection of incorrectly oriented text blocks using results from character recognition
JP5033277B2 (ja) * 2000-09-12 2012-09-26 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
DE60204066T2 (de) * 2001-02-22 2006-02-02 Oce Print Logic Technologies S.A. Automatische Lokalisierung von Tabellen in Dokumenten
JP2003234887A (ja) * 2002-02-08 2003-08-22 Ricoh Co Ltd 画像形成方法、画像形成装置、コンピュータプログラムおよび記憶媒体
US7215828B2 (en) * 2002-02-13 2007-05-08 Eastman Kodak Company Method and system for determining image orientation
US7010165B2 (en) * 2002-05-10 2006-03-07 Microsoft Corporation Preprocessing of multi-line rotated electronic ink
KR100498043B1 (ko) * 2002-12-13 2005-07-01 삼성전자주식회사 디지털 카메라 및 그의 제어방법
RU2003108433A (ru) * 2003-03-28 2004-09-27 Аби Софтвер Лтд. (Cy) Способ предварительной обработки изображения машиночитаемой формы
JP3743664B2 (ja) 2003-06-09 2006-02-08 コニカミノルタホールディングス株式会社 画像編集方法及び画像表示方法
US7248809B2 (en) * 2003-11-17 2007-07-24 Samsung Electronics Co., Ltd. Method of indicating a paper insertion direction and a printer driver using the same
JP2005269524A (ja) 2004-03-22 2005-09-29 Fuji Photo Film Co Ltd 画像表示装置および方法並びにプログラム
JP2006072580A (ja) 2004-08-31 2006-03-16 Sharp Corp 電子機器、情報管理装置、通信システム、撮影位置表示方法、プログラム、および、プログラムを記録したコンピュータ読み取り可能な記録媒体
US20060061599A1 (en) * 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. Method and apparatus for automatic image orientation normalization
US7671845B2 (en) * 2004-11-30 2010-03-02 Microsoft Corporation Directional input device and display orientation control
JP2007200280A (ja) 2005-12-27 2007-08-09 Ricoh Co Ltd ユーザインタフェース装置、画像表示方法、およびその方法をコンピュータに実行させるプログラム
JP2008059546A (ja) * 2006-08-03 2008-03-13 Sharp Corp 画像処理装置、画像読取装置、画像形成装置、画像処理方法、コンピュータプログラム、及び記録媒体
JP4960754B2 (ja) * 2007-04-25 2012-06-27 キヤノン株式会社 情報処理装置、情報処理方法
US8144989B2 (en) * 2007-06-21 2012-03-27 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8208725B2 (en) * 2007-06-21 2012-06-26 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
JP4362528B2 (ja) * 2007-09-10 2009-11-11 シャープ株式会社 画像照合装置、画像照合方法、画像データ出力処理装置、プログラム、及び記録媒体
US8290306B2 (en) * 2008-02-26 2012-10-16 Kyocera Document Solutions Inc. Image processing method and image processing apparatus
US8023770B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
US8023741B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for detecting numerals in a digital image
JP4572248B2 (ja) 2008-06-23 2010-11-04 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、制御プログラム、記録媒体
US8160365B2 (en) * 2008-06-30 2012-04-17 Sharp Laboratories Of America, Inc. Methods and systems for identifying digital image characteristics
US8103099B2 (en) * 2008-07-15 2012-01-24 Lockheed Martin Corporation Method and system for recognizing characters and character groups in electronically represented text
JP4625860B2 (ja) 2008-10-29 2011-02-02 シャープ株式会社 画像処理装置、画像形成装置、画像読取装置、画像処理方法、制御プログラム、記録媒体
JP4625861B2 (ja) * 2008-11-17 2011-02-02 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、制御プログラム、および記録媒体
JP5249262B2 (ja) * 2010-02-18 2013-07-31 シャープ株式会社 操作機器、その操作機器を備えた電子機器および画像処理装置
JP5323746B2 (ja) * 2010-03-02 2013-10-23 株式会社沖データ 印刷処理装置、印刷設定方法及び印刷制御プログラム
JP5269862B2 (ja) 2010-11-26 2013-08-21 京セラドキュメントソリューションズ株式会社 操作装置及び操作方法
US8873075B2 (en) * 2010-10-27 2014-10-28 Kyocera Document Solutions Inc. Operation device, image forming apparatus, and operation method storing orientation setting information
US8639296B2 (en) * 2011-06-07 2014-01-28 Lg Electronics Inc. Mobile device and an image display method thereof

Also Published As

Publication number Publication date
US8532434B2 (en) 2013-09-10
JP2010288229A (ja) 2010-12-24
CN101923644A (zh) 2010-12-22
CN101923644B (zh) 2013-03-13
US20100316295A1 (en) 2010-12-16

Similar Documents

Publication Publication Date Title
JP4927122B2 (ja) 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体
JP4772888B2 (ja) 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
US8634650B2 (en) Image processing apparatus, image forming apparatus, image reading apparatus, and image processing method
JP5280425B2 (ja) 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP4625861B2 (ja) 画像処理装置、画像読取装置、画像形成装置、画像処理方法、制御プログラム、および記録媒体
JP5972578B2 (ja) 画像処理装置、画像形成装置、プログラム、記録媒体
JP2010273324A (ja) 制御装置、画像読取装置、画像形成装置、画像読取装置の制御方法、プログラム、記録媒体
JP2009232085A (ja) 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記憶媒体
JP2010146185A (ja) 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体
JP2009015820A (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP6628279B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2012118863A (ja) 画像読取装置、画像形成装置、画像読取方法、プログラムおよびその記録媒体
JP4487000B2 (ja) 画像処理装置、画像形成装置、画像処理方法、画像処理システム、画像処理プログラムおよびその記録媒体
JP2013123119A (ja) 画像処理装置、画像形成装置、画像読取装置、画像処理方法、コンピュータプログラム及び記録媒体
JP4361946B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、およびそのプログラムが格納された記録媒体
JP2012074852A (ja) 画像処理装置、画像形成装置、画像読取装置、画像処理方法、画像処理プログラムおよび記録媒体
JP5025611B2 (ja) 画像処理装置、画像形成装置、コンピュータプログラム、記録媒体及び画像処理方法
JP2008092541A (ja) 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP2010011359A (ja) 画像処理装置、画像形成装置、画像処理装置の制御方法、制御プログラム、記録媒体
JP2006229817A (ja) 下地検出方法、プログラム、記録媒体、画像処理装置及び画像形成装置
JP2011010232A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体
JP2010286917A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体
JP2022189063A (ja) 画像データ生成装置および画像データ生成方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120208

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4927122

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees