JP2001312697A - 画像方向判別方法及び装置 - Google Patents

画像方向判別方法及び装置

Info

Publication number
JP2001312697A
JP2001312697A JP2000132733A JP2000132733A JP2001312697A JP 2001312697 A JP2001312697 A JP 2001312697A JP 2000132733 A JP2000132733 A JP 2000132733A JP 2000132733 A JP2000132733 A JP 2000132733A JP 2001312697 A JP2001312697 A JP 2001312697A
Authority
JP
Japan
Prior art keywords
character
image
determining
determination
directions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000132733A
Other languages
English (en)
Inventor
Hisatsugu Tawara
久嗣 田原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000132733A priority Critical patent/JP2001312697A/ja
Publication of JP2001312697A publication Critical patent/JP2001312697A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】一部分に手書き文字や、斜めに記載された文字
などがある原稿において、文書方向を正しく判別できる
画像方向判別装置を提供する。 【解決手段】原稿を読み取って得られた画像データを処
理する画像処理装置において、この画像データから、原
稿中の文字領域を抽出し(ステップS13、S14)、
その抽出された文字領域のそれぞれについて文字認識を
行い、その結果に基づいて各文字領域の方向を判別する
(ステップS15)。そして、判別された方向が複数種
類存在した場合は、文字領域の合計面積を各判別方向毎
に計算し、この合計面積が最も大きくなる方向を当該原
稿の方向と判断する(ステップS16〜S19)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えばデジタル複
写機等の原稿画像の読み取り装置によって得られた画像
データが表わす画像の方向を判別する画像方向判別装置
及び方法に関するものである。
【0002】
【従来の技術】従来、この様な画像処理装置において、
読み取られた原稿画像の文書方向を検出して、原稿の文
書の方向が所定の方向と異なっていても画像データを回
転させ、文書方向をそろえる機能を有するものが提案さ
れている。一般に、この様な機能を有する画像処理装置
においては、1枚の原稿中に複数の文書方向を検出した
場合は、方向を特定せずに検知不能として処理してい
る。
【0003】
【発明が解決しようとする課題】しかしながら、1枚の
原稿中に複数の文書方向を検出した場合に、方向を特定
せずに検知不能として処理していたため、この原稿の文
書方向はあらかじめ正しい向きに置かれたとして処理す
るか、その他に正しく文書方向が検出できた原稿があれ
ば、その方向に合わせるなどの、正確さを欠く処理を行
わざるを得ないという問題があった。さらに、ワープロ
原稿の様に文書方向判別が正しく行いやすい原稿中に、
一部分の手書き文字が存在するような原稿や、ワープロ
原稿においても、一部分に斜めに配置された文字や飾り
文字等のある原稿などでは、手書き部分や斜めに配置さ
れた部分の文字の方向判別を正しく行うことが困難なた
め、この様な問題が発生する確率が高くなってしまうと
いう問題があった。
【0004】本発明は、上述の課題に鑑みてなされたも
ので、その目的とするところは、1枚の原稿中に複数の
文字判定結果が出てしまうような場合でも、方向判別を
正しく行うことができる画像方向判別装置及び方法を提
供することにある。
【0005】
【課題を解決するための手段】上記の目的を達成するた
めの本発明の一態様による画像方向判別装置は、画像デ
ータが表わす画像の方向を判別する画像方向判別装置で
あって、前記画像データから複数の文字領域を抽出する
抽出手段と、前記抽出された複数の文字領域の夫々につ
いて、その方向を判定する判定手段と、前記判定手段に
よる判定の結果、前記複数の文字領域に関して複数の判
定方向が存在した場合に、前記複数の文字領域について
判定方向別に大きさの合計値を算出する算出手段と、前
記算出手段で算出された大きさが最も大きくなる判別方
向を当該画像の方向に決定する決定手段とを備えること
を特徴とする。
【0006】また、上記の目的を達成するための本発明
の他の態様による画像方向判別方法は、画像データが表
わす画像の方向を判別する画像方向判別方法であって、
前記画像データから複数の文字領域を抽出する抽出工程
と、前記抽出された複数の文字領域の夫々について、そ
の方向を判定する判定工程と、前記判定工程による判定
の結果、前記複数の文字領域に関して複数の判定方向が
存在した場合に、前記複数の文字領域について判定方向
別に大きさの合計値を算出する算出工程と、前記算出工
程で算出された大きさが最も大きくなる判別方向を当該
画像の方向に決定する決定工程とを備えることを特徴と
する。
【0007】更に、上記の目的を達成するために、本発
明により提供されるコンピュータ可読メモリは、画像デ
ータが表わす画像の方向をコンピュータに判別させるた
めの制御プログラムを格納するコンピュータ可読メモリ
であって、該制御プログラムが、前記画像データから複
数の文字領域を抽出する抽出工程のコードと、前記抽出
された複数の文字領域の夫々について、その方向を判定
する判定工程のコードと、前記判定工程による判定の結
果、前記複数の文字領域に関して複数の判定方向が存在
した場合に、前記複数の文字領域について判定方向別に
大きさの合計値を算出する算出工程のコードと、前記算
出工程で算出された大きさが最も大きくなる判別方向を
当該画像の方向に決定する決定工程のコードとを備える
ことを特徴とする。
【0008】
【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な実施形態を説明する。
【0009】以下に、本発明の実施形態にかかる画像処
理装置を説明する。
【0010】図1は、本発明の実施形態にかかる画像処
理装置の構成を模式的に表した断面図である。101は
原稿台ガラスであり、原稿自動送り装置142から給送
された原稿が順次、所定位置に載置される。102は、
例えば、ハロゲンランプから構成される原稿照明ランプ
で、原稿台ガラス101に載置された原稿を露光する。
103、104および105は、走査ミラーであり、不
示図の光学走査ユニットに収容され、往復運動しなが
ら、原稿からの反射光をCCDユニット106に導く。
CCDユニット106はCCDに原稿からの反射光を結
像させる結像レンズ107、例えばCCDから構成され
る撮像素子108、撮像素子108を駆動するCCDド
ライバ109等から構成されている。撮像素子108か
らの画像信号出力は、例えば8ビット、のデジタルデー
タに変換された後、コントローラ部139に入力され
る。
【0011】110は感光ドラムであり、画像形成に備
えて、112の前露光ランプによって除電される。11
3は1次帯電器であり、感光ドラム110を一様に帯電
させる。117は露光手段であり、例えば半導体レーザ
等で構成され、画像形成と装置全体の制御を行うコント
ローラ部139で処理された画像データに基づいて感光
ドラム110を露光し、静電潜像を形成する(以下、レ
ーザユニット117という)。118は現像器であり、
黒色の現像剤(トナー)が収容されている。119は転
写前帯電器であり、感光ドラム110上に現像されたト
ナー像を用紙に転写する前に高圧をかける。120、1
22および124は給紙ユニットであり、各給紙ローラ
121、123および125の駆動により、転写用紙が
装置内へ給送され、レジストローラ126の配設位置で
一旦停止し、感光ドラム110に形成された画像との書
き出しタイミングがとられ再給送される。
【0012】127は転写帯電器であり、感光ドラム1
10に現像されたトナー像を給送される転写用紙に転写
する。128は分離帯電器であり、転写動作の終了した
転写用紙を感光ドラム110より分離する。転写されず
に感光ドラム110上に残ったトナーはクリーナー11
1によって回収される。129は搬送ベルトで、転写プ
ロセスの終了した転写用紙は定着器130に搬送され、
例えば熱により定着される。
【0013】131はフラッパであり、定着プロセスの
終了した転写用紙の搬送パスを、ステイプルソータ13
2または中間トレイ137の配置方向のいずれかに制御
する。ステイプルソータ132に排紙された用紙は各ビ
ンに仕分けされ、コントローラ部139からの指示によ
りステイプル部141がステイプルを行う。また、13
3から136は給送ローラであり、一度定着プロセスの
終了した転写用紙を中間トレイ137に反転(多重)ま
たは非反転(両面)して給送する。138は再給送ロー
ラであり、中間トレイ137に載置された転写用紙を再
度、レジストローラ126の配設位置まで搬送する。
【0014】なお、コントローラ部139には後述する
マイクロコンピュータ、画像処理部等が備えられてお
り、操作パネル140からの指示に従って、前述の画像
形成動作を行う。
【0015】図2は、本実施形態にかかる画像処理装置
におけるコントローラ部139の構成を表すブロック図
である。
【0016】201は画像処理装置全体の制御を行うC
PUであり、装置本体の制御手順(制御プログラム)を
記憶した読み取り専用メモリ203(ROM)からプロ
グラムを順次読み取り、実行する。CPU201のアド
レスバスおよびデータバスはバスドライバ/アドレスデ
コーダ回路202を経由して各部に接続されている。ま
た、204は、入力データの記憶や作業用記憶領域等と
して用いる主記憶装置であるところのランダムアクセス
メモリ(RAM)である。205はI/Oインターフェ
ースであり、操作者がキー入力を行ったり装置の状態等
を液晶やLEDを用いて表示するするための操作パネル
140、給紙系、搬送系及び光学系の駆動を行うモータ
類207、クラッチ類208及びソレノイド類209、
また、搬送される用紙を検知するための紙検知センサ類
210等の、装置各部に接続される。また、現像器11
8には現像器内のトナー量を検知するトナー残検センサ
211が配置されており、その出力信号がI/Oポート
205に入力される。215は高圧制御ユニットであ
り、CPU201の指示に従って、前述の1次帯電器1
13、現像器118、転写前帯電器119、転写帯電器
127及び分離帯電器128への高圧の印加を制御す
る。
【0017】206は画像処理部であり、CCDユニッ
ト106から出力された画像信号が入力され、後述する
画像処理を行い、この処理によって得られた画像データ
に従ってレーザユニット117の制御信号を出力する。
レーザユニット117から出力されるレーザ光は感光ド
ラム110を照射し、露光すると共に、非画像領域にお
いて、受光センサであるところの213のビーム検知セ
ンサによって発光状態が検知され、その出力信号がI/
Oポート205に入力される。また、I/Oポート20
5からは、図3で後述する画像処理部206内のセレク
タ312に選択信号が出力される。
【0018】図3は、本実施形態にかかる画像処理装置
におけるコントローラ部139内の画像処理部206の
構成を示すブロック図である。
【0019】CCD108により電気信号に変換された
画像信号は、まずシェーディング回路301によって画
素間のばらつきの補正を行い、変倍回路302におい
て、縮小コピー時はデータの間引き処理を行い、拡大コ
ピー時はデータの補間を行う。次に、エッジ強調回路3
03において、例えば5×5のウインドウで2階微分を
とり、画像のエッジを強調する。この画像データは、輝
度データであるのでプリンタに出力するための濃度デー
タに変換するため、γ変換回路304でテーブルリサー
チによりデータ変換を行う。濃度データに変換された画
像データは、2値化処理部305へ入力される。ここで
は、例えば誤差拡散法(ED法)により多値データを2
値データに変換する。2値に変換された画像データは、
合成回路307に入力される。合成回路307では、入
力された画像データと、例えばDRAM、により構成さ
れる画像用メモリ310内の画像データを選択的に出力
する、または論理ORをとって出力する。この画像用メ
モリ310に対するリードライト制御は、メモリ制御部
309で行う。これらの画像データは、レーザの発光強
度の信号に変換するためPWM回路308へ入力され、
画像の濃度に従ったパルス幅をレーザユニットに対して
出力する。また、シェーディング回路301からの画像
出力は、セレクタ312へ入力される。セレクタ312
へは、文字パターン発生部311からの出力信号が入力
され、CPU201の指示により、I/Oポート205
からセレクタ312に選択信号が入力される。入力され
た選択信号に従って、シェーディング回路301からの
画像出力信号または文字パターン発生部311からの出
力信号のいずれかが文書方向判別部306へ入力され、
後述する文書方向判別処理が行われる。
【0020】次に、図4から図9を用いて、本実施形態
にかかる画像処理装置における文書方向判別部306の
動作について説明する。
【0021】図4は、文書方向判別部306内の構成を
示すブロック図である。シェーディング回路301から
出力された画像データは、CPU/メモリ部401に入
力され、画像データを一時的に保存すると共に、各種制
御を行う。コントローラ部139内のCPU201と
は、例えば、不図示のデュアルポートRAMによってバ
ス接続されており、データを送受信する。もちろんシリ
アル通信でもよい。
【0022】文字認識/方向判別部402は、文書の方
向を一番正確に表しているのは文字であることに着目
し、文書中の複数個の文字領域について0°、90°、
180°、270°の方向から文字認識を行い、それら
各方向における文字認識の精度(文字認識の自信度:文
字の特徴分布に対する距離)の中で一番精度の高い方向
を文書方向とする。
【0023】領域分離部403は、文字認識/方向判別
部402による文字認識・方向判別処理を行うための前
処理として、文書画像データより、文字部、図形部、自
然画部、表部などを矩形の領域に分離して、各領域の属
性(文字部など)を付加する処理を行うブロックであ
る。
【0024】記憶装置404は、例えば、ハードディス
クや光磁気ディスクなどにより構成され、各種処理結果
(画像データ、領域分離結果、文字認識結果など)を保
存するために利用される。I/F部405は、SCSI
やRS232Cなどにより構成され、外部へデータを伝
送するために設けられている。コンピュータ406は、
I/F部405を介して得られる情報、光磁気ディスク
等の移動可能の記憶装置から得られるデータを利用す
る。
【0025】次に、本実施形態にかかる画像処理装置に
おける文書方向自動判別・補正、および文字認識処理の
概要を図5と図11のフローチャートに従って説明す
る。
【0026】画像データ(多値画像)が入力されると
(ステップS1)、入力された画像について文書方向の
判別が行われる(ステップS2)。文書方向の判別処理
では、まず領域分離部403が、画像から文字部、図形
部、自然画部、表部などの属性別に領域を分離する。本
実施形態では、矩形で囲まれた領域情報を作成する。次
に、各属性より文字領域の矩形情報を抽出する。ここ
で、文字領域とは、文章部、タイトル部、表中の文字、
図のキャプション部などである。例えば、図6(a)、
(c)の文書の場合は、それぞれ図6(b)、(d)に
示したような文字領域の矩形情報が抽出される。そし
て、これらの中の数ブロックを用いて、当該画像が表わ
す文書の方向判別を行う。文書方向判別については後で
更に詳しく説明する。
【0027】その結果、文書方向が正方向であれば、引
き続き画像中の文字ブロックに対して文字認識処理を行
う(ステップS3、S6)。一方、文書方向が正方向で
なければ、画像データを正しい方向に回転させる(ステ
ップS3、S4)。なお、画像の回転は、図4のCPU
/メモリ401を用いて公知の技術により簡単に行うこ
とが可能であり、その説明は省略する。そして、回転画
像に対して領域分離を行い、領域分離情報の補正処理を
行う(ステップS5)。この領域分離情報の補正処理
は、画像回転に伴う領域分離情報の相違を補正するもの
であり、補正の方法としては、全回転画像データに対し
て再び領域分離処理を行う第1の方法と、アドレス変換
を領域分離結果にかける第2の方法とがある。ただし、
領域分離処理は、一般に画像が正方向を向いていること
を想定しているため、初期の段階で行った領域分離処理
と回転後の画像データに対して行った領域分離処理とで
は結果が異なることが多い。それゆえ、第1の方法が望
ましい。
【0028】ステップS6で、回転画像データ中の文字
領域ブロックは、文字認識処理系で文字認識される。こ
の結果、最終的に、回転なし/回転ありの両方の場合と
も、領域分離情報と文字認識情報が得られる(ステップ
S7)。この処理結果は、I/F部405を介してコン
ピュータ406に伝送され、コンピュータ406上のフ
ァイリングのアプリケーションソフト等で利用される。
また、コントローラ部139内のCPU201に画像毎
に送信される。
【0029】以上、説明した処理により、図9(a)に
示した原画像データ、図9(b)に示した領域分離デー
タ、図9(c)に示した文字認識情報を得ることができ
る。これらの情報は、前述のようにコントローラ部13
9のCPU201へ送られ、各種画像処理、各種制御に
使用される。
【0030】領域分離データの形式は、図9(b)に示
したように、領域分離データである旨を示す「header」
と、分離した領域の識別子、「rect1」から「rect4」に
より構成される。さらに、分離した領域の識別子で区別
された各領域(ブロック)の情報は、ブロックの番号
「order」、ブロックの属性(文字部、図形部など)「a
tt」、ブロックの左上の座標値「x1」および「y1」、ブ
ロックの幅「w」、ブロックの高さ「h」、縦書き、ま
たは横書きを示す「direction」、当該ブロックのID
である「selfID」、当該ブロックを包含する親ブロック
のIDである「upperID」、親ブロックの属性「upperAt
t」、予備領域「reserve」により構成されている。
【0031】また、文字認識情報は、図9(c)に示し
たように、文字認識情報である旨を示す「header」を有
し、例えば「本」等の単一の文字に関する文字認識情報
「OCR1」等と、当該文字が含まれているブロックを示す
上記「rect1」等に相当する「blk header」との組み合
わせ情報により構成されている。
【0032】そして、「OCR1」等の各文字認識情報は、
文字であるか、あるいは空白であるかを示す「type」、
前述の文字認識の自信度に従った第1から第5候補文
字、「文字1」から「文字5」、当該文字の切り出し位
置「x1」および「y1」、当該文字の幅「w」、当該文字
の高さ「h」、予備領域「reserve」により構成されて
いる。文字認識ができない場合、例えば画像データすべ
てに文字が含まれない等の時は予備領域「reserve」に
「unknown(検知不能)」を表すデータを返す。
【0033】次に、文字認識処理を用いた文書方向判別
の手法について説明する。図11は本実施形態にかかる
文書方向自動判別の処理手順を説明するフローチャート
である。
【0034】図11において、コピーキーがオンされる
と(或いは原稿読み取りが指示されると)、ステップS
11からステップS12へ進み、原稿画像の読み取りが
行われる。以上が、図5のステップS1に相当する処理
である。その後、ステップS2で示される文書方向判別
(ステップS13〜S19の処理)に処理を進める。ス
テップS13では後述の領域分離処理を行い、ステップ
S14ではこの領域分離処理の結果を受けて文字領域が
抽出される。そして、ステップS15において、後述の
文字認識処理と文字方向判別処理を実行することにより
各文字領域の方向を判定する。そして、各文字領域につ
いて判別された方向がすべて一致しておれば、その方向
を文書の方向として決定する(ステップS16、S1
9)。一方、判別結果として複数の方向が得られた場合
は、ステップS16からステップS17へ進み、同じ方
向に判別された文字領域の合計を計算する。そして、ス
テップS18において、各方向毎の文字領域の大きさを
比較し、ステップS19にて、最も大きい文字領域に対
応する判別方向を文書方向に決定する。
【0035】<領域分離処理(ステップS13、S1
4)>文書画像データの黒画素を検出してゆき、輪郭線
追跡、またはラベリング方式により、黒画素ブロックの
矩形枠を作成する。次に、その矩形の中の黒画素密度、
隣接矩形ブロックの有無、矩形の縦横比率などを判断基
準にして、文字領域(タイトル、本文、キャプションな
ど)、図形領域、自然画領域、表領域などを判別する。
この処理結果により、文字領域と判別された矩形領域が
得られる。
【0036】<文字認識処理と方向判別(ステップS1
5)>文字認識処理の1つの方法として、特徴ベクトル
抽出、比較方法がある。例えば図7(a)に示したよう
に、「本」という文字を含む文字領域が判別されたとす
る。第1段階として、この文字領域について文字の切り
出し処理を行う(図7(b)参照)。これは、一つの文
字の矩形を切り出す処理で、まず8ビットである画像デ
ータを白と黒の2値に変換し、黒画素連続性の状態を検
出していけば求められる。第二段階として、一文字をm
×n(例えば64×64)の画素ブロックに切り出す
(図7(c)参照)。そして、その中から3×3画素の
ウインドウを用いて、黒画素の分布方向を抽出する(方
向ベクトル情報:図7(d)参照)。
【0037】なお、図7(d)は、方向ベクトル情報の
一部を例示したものであり、上記3×3画素のウインド
ウをずらしてゆき、方向ベクトル情報を数十個得る。こ
のベクトル情報が文字の特徴となる。この特徴ベクトル
と、あらかじめ記憶されている文字認識辞書の内容と比
較して、特徴ベクトルに特徴が一番近い文字から順番に
文字を抽出する。この場合、特徴ベクトルに特徴が近い
順番に第1候補、第2候補・・・となる。この特徴ベク
トルに対する特徴の近さが、その文字に対する距離の近
さ、すなわち文字認識の自信度(精度)という数値であ
る。
【0038】このようにして文字認識の自信度が求めら
れるが、その自信度に基づいた文字方向判別処理を、図
8に示した「本発明の名称」という文例を用いて説明す
る。図8(a)は正方向の文、図8(b)は270°回
転した文である。ここで「本」に注目すると、文字方向
を判別する場合は、図8(c)に示したように、1つの
文字「本」について0°、90°、180°、270°
の4方向から文字認識を行ってみる。各回転角度は、文
字矩形の領域の読み出し方を変更すればよく、特に原稿
を回転する必要はない。
【0039】各回転角度における文字認識結果は、図8
(c)に示したように、互いに異なっている。なお、図
8(c)に示される文字認識結果および自信度は、説明
のためのものであり、現実にこの通りになるとは限らな
いことは理解されよう。
【0040】図8(c)において、正方向(0°)から
文字認識を行った場合は、「本」と正しく認識され、自
信度も0.90と高い値となる。90°回転した方向か
ら文字認識を行った場合は、「町」と誤認識され、自信
度も0.40と低下する。このように誤認識が発生し、
自信度も低下するのは、回転した方向から見た場合の特
徴ベクトルに基づいて文字認識を行ったからである。同
様に180°、270°回転した方向から文字認識を行
った場合も、誤認識が発生し、自信度も低下する。な
お、文字認識の方向別の自信度は、複雑な文字であれば
あるほど、その差が顕著に現れてくる。
【0041】図8(c)の結果によれば、正方向の場合
に自信度が1番高いため、文書は正方向に向いている可
能性が高いと判断される。文字方向判別の精度を向上さ
せるため、同一ブロック内の複数の文字について、同様
に4方向から文字認識を行ってみる。こうして、各ブロ
ックについて、当該ブロック内の各認識対象文字につい
て4方向別の自信度の平均値を求め、この平均値が最も
高い方向を当該文字領域の文字方向として認定する。こ
のように、1文字だけの自信度で文字方向を認定するこ
となく、同一ブロック内の複数文字の自信度で文字方向
を認定することにより、文字領域の方向を高精度に判別
することが可能となる。ただし、1文字だけの自信度で
文字方向を判別するようにしてもよい。この場合、信頼
性は若干低下するものの、処理速度が向上することにな
る。
【0042】次に、図10の説明図および図11のフロ
ーチャートを参照して本実施形態にかかる画像処理装置
の詳細な動作について説明する。
【0043】まず、ステップS11で、操作パネル14
0上のコピーキーがONしたかどうかを判断する。ON
されれば、ステップS12で原稿台上の原稿を読み取
り、ステップS13〜S15で、前述した方法により文
書方向判別部306で文字領域の方向判別を行う。例え
ば、図10に示した様な原稿の場合、「1.本発明の名
称」という文字列が存在する文字領域、「2.文字認識
装置」という文字列が存在する文字領域、「3.A4R
の原稿の場合」という文字列が存在する文字領域に関し
ては、すべてが文字方向0°に検出される。また、「C
ONFIDENTIAL」という文字列が存在する文字
領域に対しては、斜めに配置しているために、例えば文
字方向90°と検出される。
【0044】次に、ステップS16で、判別された方向
が複数かどうかを判断する。判別方向が1つであれば、
ステップS19に移り、文字方向はその方向に決定され
る。図10に示した例では、文字方向が0°と90°の
2方向あるのでステップS17に進み、前述した領域分
離処理によって分離された各文字領域の面積を計算し、
同じ方向とされた文字領域の面積の合計を算出する。図
10においては、文字方向が0°のエリア1、エリア
2、エリア3の面積の合計及び文字方向が90°のエリ
ア4の面積を算出する。次に、ステップS18では、ス
テップS17で算出された値(文字領域の面積)を比較
して、面積の大きい方の文字領域の文字方向に当該文書
の方向を決定して終了する。図10の例では、この文書
全体の文字方向として0°という値が確定される。
【0045】以上、説明したように、本実施形態によれ
ば、ワープロ原稿などの文書方向判別が正しく行いやす
い原稿中に、一部分、手書き文字が存在するような原稿
や、一部分に斜めに配置された文字や飾り文字等のある
原稿などの、1枚の原稿中に複数の文字判定結果が出や
すい場合でも、方向判別を正しく行うことが可能とな
る。
【0046】なお、本発明は、複数の機器(例えばホス
トコンピュータ、インタフェイス機器、リーダ、プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機、ファクシミリ装置
など)に適用してもよい。
【0047】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納された
プログラムコードを読み出し実行することによっても、
達成されることは言うまでもない。この場合、記憶媒体
から読み出されたプログラムコード自体が前述した実施
形態の機能を実現することになり、そのプログラムコー
ドを記憶した記憶媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実
行することにより、前述した実施形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼働しているオペレーティングシステ
ム(OS)などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0048】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0049】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードが格納されることになる。
【0050】
【発明の効果】以上説明したように、本発明によれば、
1枚の原稿中に複数の文字判定結果が出てしまうような
場合でも、方向判別を正しく行うことが可能となる。
【図面の簡単な説明】
【図1】本実施形態にかかる画像処理装置の構成の模式
的な断面図である。
【図2】本実施形態にかかる画像処理装置のコントロー
ラ部のブロック図である。
【図3】本実施形態にかかるコントローラ部における、
画像処理部のブロック図である。
【図4】本実施形態にかかる画像処理部における、文書
方向判別部のブロック図である。
【図5】本実施形態にかかる画像処理装置の動作手順を
説明するフローチャートである。
【図6】本実施形態にかかる文書方向自動判別における
領域分離を説明する図である。
【図7】文字認識処理の処理過程を説明するための説明
図である。
【図8】本実施形態にかかる文字領域方向の自動判別処
理を説明する図である。
【図9】領域分離および文字認識情報のデータ構成例を
示した図である。
【図10】読み取られ、処理される原稿例を示した図で
ある。
【図11】本実施形態にかかる画像方向の自動判別処理
の手順を説明するフローチャートである。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 画像データが表わす画像の方向を判別す
    る画像方向判別装置であって、 前記画像データから複数の文字領域を抽出する抽出手段
    と、 前記抽出された複数の文字領域の夫々について、その方
    向を判定する判定手段と、 前記判定手段による判定の結果、前記複数の文字領域に
    関して複数の判定方向が存在した場合に、前記複数の文
    字領域について判定方向別に大きさの合計値を算出する
    算出手段と、 前記算出手段で算出された大きさが最も大きくなる判別
    方向を当該画像の方向に決定する決定手段とを備えるこ
    とを特徴とする画像方向判別装置。
  2. 【請求項2】 前記判定手段は、前記複数の文字領域の
    夫々について、 文字領域内に存在する文字に対して、複数の方向で文字
    認識処理を行い、 前記複数の方向のうち、前記認識手段による認識の信頼
    度が最も高くなる方向を当該文字領域の方向とすること
    を特徴とする請求項1に記載の画像方向判別装置。
  3. 【請求項3】 前記判定手段は、文字領域内に存在する
    複数の文字に対して複数の方向で文字認識処理を行い、
    認識の信頼度の平均値が最大となる方向をもって当該文
    字領域の方向とすることを特徴とする請求項2に記載の
    画像方向判別装置。
  4. 【請求項4】 画像データが表わす画像の方向を判別す
    る画像方向判別方法であって、 前記画像データから複数の文字領域を抽出する抽出工程
    と、 前記抽出された複数の文字領域の夫々について、その方
    向を判定する判定工程と、 前記判定工程による判定の結果、前記複数の文字領域に
    関して複数の判定方向が存在した場合に、前記複数の文
    字領域について判定方向別に大きさの合計値を算出する
    算出工程と、 前記算出工程で算出された大きさが最も大きくなる判別
    方向を当該画像の方向に決定する決定工程とを備えるこ
    とを特徴とする画像方向判別方法。
  5. 【請求項5】 前記判定工程は、前記複数の文字領域の
    夫々について、 文字領域内に存在する文字に対して、複数の方向で文字
    認識処理を行い、 前記複数の方向のうち、前記認識工程による認識の信頼
    度が最も高くなる方向を当該文字領域の方向とすること
    を特徴とする請求項4に記載の画像方向判別方法。
  6. 【請求項6】 前記判定工程は、文字領域内に存在する
    複数の文字に対して複数の方向で文字認識処理を行い、
    認識の信頼度の平均値が最大となる方向をもって当該文
    字領域の方向とすることを特徴とする請求項5に記載の
    画像方向判別方法。
  7. 【請求項7】 画像データが表わす画像の方向をコンピ
    ュータに判別させるための制御プログラムを格納するコ
    ンピュータ可読メモリであって、該制御プログラムが、 前記画像データから複数の文字領域を抽出する抽出工程
    のコードと、 前記抽出された複数の文字領域の夫々について、その方
    向を判定する判定工程のコードと、 前記判定工程による判定の結果、前記複数の文字領域に
    関して複数の判定方向が存在した場合に、前記複数の文
    字領域について判定方向別に大きさの合計値を算出する
    算出工程のコードと、 前記算出工程で算出された大きさが最も大きくなる判別
    方向を当該画像の方向に決定する決定工程のコードとを
    備えることを特徴とするコンピュータ可読メモリ。
  8. 【請求項8】 前記判定工程は、前記複数の文字領域の
    夫々について、 文字領域内に存在する文字に対して、複数の方向で文字
    認識処理を行い、 前記複数の方向のうち、前記認識工程による認識の信頼
    度が最も高くなる方向を当該文字領域の方向とすること
    を特徴とする請求項7に記載のコンピュータ可読メモ
    リ。
  9. 【請求項9】 前記判定工程は、文字領域内に存在する
    複数の文字に対して複数の方向で文字認識処理を行い、
    認識の信頼度の平均値が最大となる方向をもって当該文
    字領域の方向とすることを特徴とする請求項8に記載の
    コンピュータ可読メモリ。
JP2000132733A 2000-05-01 2000-05-01 画像方向判別方法及び装置 Withdrawn JP2001312697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000132733A JP2001312697A (ja) 2000-05-01 2000-05-01 画像方向判別方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000132733A JP2001312697A (ja) 2000-05-01 2000-05-01 画像方向判別方法及び装置

Publications (1)

Publication Number Publication Date
JP2001312697A true JP2001312697A (ja) 2001-11-09

Family

ID=18641369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000132733A Withdrawn JP2001312697A (ja) 2000-05-01 2000-05-01 画像方向判別方法及び装置

Country Status (1)

Country Link
JP (1) JP2001312697A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008770A (ja) * 2009-06-26 2011-01-13 Kyocera Mita Corp 原稿方向の検出方法及び装置
JP2018117255A (ja) * 2017-01-18 2018-07-26 京セラドキュメントソリューションズ株式会社 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム
CN110443239A (zh) * 2019-06-28 2019-11-12 平安科技(深圳)有限公司 文字图像的识别方法及其装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008770A (ja) * 2009-06-26 2011-01-13 Kyocera Mita Corp 原稿方向の検出方法及び装置
JP2018117255A (ja) * 2017-01-18 2018-07-26 京セラドキュメントソリューションズ株式会社 画像読取装置、画像読取方法、画像形成装置及び画像読取プログラム
CN110443239A (zh) * 2019-06-28 2019-11-12 平安科技(深圳)有限公司 文字图像的识别方法及其装置

Similar Documents

Publication Publication Date Title
JP3050007B2 (ja) 画像読取装置およびこれを備えた画像形成装置
JP2001274969A (ja) 画像処理装置
JPH08212298A (ja) 文書方向自動判別装置、及び文書方向自動補正装置
JP3728040B2 (ja) 画像形成装置及び方法
KR100306063B1 (ko) 화상처리방법및장치
JP3902840B2 (ja) 画像処理装置および画像処理方法
JP2000298702A (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
JPH11341229A (ja) 画像処理装置及び画像処理方法
JP3787440B2 (ja) 画像処理装置及び画像処理方法
JP2001312697A (ja) 画像方向判別方法及び装置
JPH11213089A (ja) 画像処理装置及びその方法
JPH10191018A (ja) 画像処理方法及び装置
JP2000067156A (ja) 画像処理装置及び方法
JPH11220557A (ja) 画像処理装置及び方法
JP3684050B2 (ja) 画像処理方法及び装置
JPH10307460A (ja) 画像形成装置及び画像形成方法並びに記憶媒体
JP2000099628A (ja) 画像処理装置及び画像処理方法
JPH1115224A (ja) 複写装置
JPH11195085A (ja) 画像処理方法及び画像処理装置並びに記憶媒体
JP2003141444A (ja) 画像処理装置および画像処理装置の制御方法およびプログラムおよび記憶媒体
JPH11103381A (ja) 画像形成方法及び装置
JPH11341252A (ja) 画像形成装置、画像形成方法、記憶媒体
JP2001030580A (ja) 画像処理装置、印刷制御方法、及び記憶媒体
JPH11331549A (ja) 画像処理装置及び画像処理方法
JP2000113104A (ja) 画像処理装置及び画像処理方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070703