JP2000067156A - 画像処理装置及び方法 - Google Patents

画像処理装置及び方法

Info

Publication number
JP2000067156A
JP2000067156A JP10237170A JP23717098A JP2000067156A JP 2000067156 A JP2000067156 A JP 2000067156A JP 10237170 A JP10237170 A JP 10237170A JP 23717098 A JP23717098 A JP 23717098A JP 2000067156 A JP2000067156 A JP 2000067156A
Authority
JP
Japan
Prior art keywords
image data
character
image
area
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10237170A
Other languages
English (en)
Inventor
Yasuki Nakajima
康喜 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10237170A priority Critical patent/JP2000067156A/ja
Publication of JP2000067156A publication Critical patent/JP2000067156A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】文書内に複数方向の文字を持つ原稿であっても
高い精度での文書方向の判別をおこなうことが可能な画
像処理装置を提供する。 【解決手段】 入力画像データを複数のエリアに分割し
(S2)、分割した画像データの各々のエリアにおける
画像データ中の文字部を抽出し(S3)、抽出した文字
の方向を認識する(S4〜S7)。文字方向の認識(S
7)は、分割領域ごとに優先順位をつけ、領域ごとに各
方向についての文字認識をしてもっとも自信度の高い文
字認識結果が得られた方向と優先順位に基づいて入力さ
れた画像データの方向判断を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像処理装置及び方
法に関し、例えば入力画像中の文字の方向を認識可能な
画像処理装置及び方法に関するものである。
【0002】
【従来の技術】従来の画像処理装置、例えばデジタル複
写機およびスキャナ等の画像処理装置、特にCCD等の
光電変換素子により読み取った文書の文字とその方向を
認識するというOCR機能を備えた装置において、画像
データの方向を判断する際に、より判断精度を高めるた
め、画像データ中の複数の文字を認識しその方向から画
像データの方向を判断していた。
【0003】
【発明が解決しようとする課題】しかしながら、CCD
等の光電変換素子により読み取った画像データ中の複数
の文字が同一方向を向いていないことがある。たとえ
ば、図と文字列とが混在している原稿文書、特にグラフ
などの図が入っている文書である。このような文書の方
向を判断する場合、従来は正確な方向判別ができなかっ
た。
【0004】
【課題を解決するための手段】本発明は上述した課題を
解決することを目的として成されたもので、原稿に複数
の方向を向いた複数の文字が存在している場合であって
も、原稿に記載されている保持の方向を正確に認識でき
る画像処理装置及び方法を提供するにある。係る目的を
達成する一手段として例えば以下の構成を備える。
【0005】即ち、入力画像データを複数のエリアに分
割する画像エリア分割手段と、前記画像エリア分割手段
により分割された前記画像データの各々のエリアにおけ
る画像データ中の文字と文字方向を認識する認識手段
と、前記認識手段による認識結果に対して優先順位をつ
け、前記認識手段による認識文字方向と前記優先順位に
基づいて前記入力された画像データの方向判断を行う方
向判断手段とを備えることを特徴とする。
【0006】又は、入力画像データを複数のエリアに分
割する画像エリア分割手段と、前記画像エリア分割手段
により分割された前記画像データの各々のエリア毎に優
先順位を付与する付与手段と、前記付与手段の付与した
優先順位の高いエリアより画像データ中の文字と文字方
向を認識する認識手段と、前記認識手段による認識文字
方向により分割エリアの画像データの方向判断を行う方
向判断手段とを備えることを特徴とする。
【0007】そして例えば、原稿画像を読み取る読取手
段を備え、前記入力画像データは前記読取手段による読
取原稿画像とすることを特徴とする。
【0008】また例えば、前記方向判断手段は、画像デ
ータを複数方向に回転させ、回転させた画像毎に文字認
識を行ない、認識自信度の最も高い方向を求めて分割エ
リアの画像データの方向判断を行うことを特徴とする。
【0009】
【発明の実施の形態】以下に、図面を参照して本発明に
係る一発明の実施の形態例を説明する。
【0010】図1は本発明に係る一発明の実施の形態例
の画像処理装置としての画像形成装置の構成を説明する
断面図である。図1において、101は原稿台ガラスで
あり、原稿自動送り装置142から給送された原稿が順
次、所定位置に載置される。102は例えばハロゲンラ
ンプから構成される原稿照明ランプであり、原稿台ガラ
ス101に載置された原稿を露光する。
【0011】103、104、105は走査ミラーであ
り、図示しない光学走査ユニットに収容され、往復運動
しながら、原稿からの反射光をCCDユニット106に
導く。CCDユニット106はCCDに原稿からの反射
光を結像させる結像レンズ107、例えばCCDから構
成される撮像素子108、撮像素子108を駆動するC
CDドライバ109等から構成されている。
【0012】撮像素子108からの画像信号出力は、例
えば8ビットのデジタルデータに変換された後、コント
ローラ部139に入力される。また、撮像素子108か
らの画像信号出力は文書方向判別部306へ入力され、
後述する文書方向判別処理を行う。
【0013】また、110は感光ドラムであり、112
の前露光ランプによって画像形成に備えて除電される。
113は1次帯電器であり、感光ドラム110を一様に
帯電させる。117は露光手段であり、例えば半導体レ
ーザー等で構成され、画像処理や装置全体の制御を行う
コントローラ部139で処理された画像データに基づい
て感光ドラム110を露光し、静電潜像を形成する。
【0014】118は現像器であり、黒色の現像剤(ト
ナー)が収容されている。119は転写前帯電器であ
り、感光ドラム110上に現像されたトナー像を用紙に
転写する前に高圧をかける。120、122、124は
給紙ユニットであり、各給紙ローラ121、123、1
25の駆動により、転写用紙が装置内へ給送され、レジ
ストローラ126の配設位置で一旦停止し、感光ドラム
110に形成された画像との書き出しタイミングがとら
れ再給送される。
【0015】127は転写帯電器であり、感光ドラム1
10に現像されたトナー像を給送される転写用紙に転写
する。128は分離帯電器であり、転写動作の終了した
転写用紙を感光ドラム110より分離する。転写されず
に感光ドラム110上に残ったトナーはクリーナー11
1によって回収される。
【0016】129は搬送ベルトであり、転写プロセス
の終了した転写用紙を定着器130に搬送し、例えば熱
により定着される。131はフラッパであり、定着プロ
セスの終了した転写用紙の搬送パスを、ステイプルソー
ター132または中間トレイ137の配置方向のいずれ
かに制御する。
【0017】ステイプルソーター132に排紙された用
紙は各ビンに仕分けされ、コントローラ部139からの
指示により141のステイプル部141がステイプルを
行う。133〜136は給送ローラであり、一度定着プ
ロセスの終了した転写用紙を中間トレイ137に反転
(多重)または非反転(両面)して給送する。138は
再給送ローラであり、中間トレイ137に載置された転
写用紙を再度、レジストローラ126の配設位置まで搬
送する。
【0018】139のコントローラ部には後述するマイ
クロコンピュータ、画像処理部等を備えており、操作パ
ネル140からの指示に従って、前述の画像形成動作を
行う。
【0019】以下、図2を参照して本実施の形態例のコ
ントローラ部139の詳細構成を説明する。図2は本実
施の形態例の画像形成装置におけるコントローラ部13
9の詳細構成を示すブロック図である。
【0020】図2において、201は画像処理装置全体
の制御を行うCPUであり、装置本体の制御手順(制御
プログラム)を記憶した読み取り専用メモリ203(R
OM)からプログラムを順次読み取り、実行する。
【0021】CPU201のアドレスバスおよびデータ
バスは202に示すバスドライバー回路、アドレスデコ
ーダ回路をへて各負荷に接続されている。また、204
は入力データの記憶や作業用記憶領域等として用いる主
記憶装置であるところのランダムアクセスメモリ(RA
M)である。
【0022】205はI/Oインターフェースであり、
以下の各I/Oとのインタフェースを司る。140の操
作パネルは、キーボード部と表示部とを含んでいる。そ
して、操作者がキー入力を行い、装置の状態等を液晶、
LED等で構成される表示部を用いて表示する。
【0023】更にI/Oインターフェース205は、給
紙系、搬送系、光学系の駆動を行うモーター類207、
クラッチ類208、ソレノイド類209、また、搬送さ
れる用紙を検知するための紙検知センサ類210等の装
置の各負荷に接続される。
【0024】現像器118には現像器内のトナー量を検
知する211のトナー残検センサが配置されており、そ
の出力信号がI/Oポート205に入力される。215
は高圧ユニットであり、CPUの指示に従って、前述の
1次帯電器113、現像器118、転写前帯電器11
9、転写帯電器127、分離帯電器128へ高圧を出力
する。
【0025】206は画像処理部であり、CCDユニッ
ト106から出力された画像信号が入力され、後述する
画像処理を行い、画像データに従って117のレーザー
ユニットの制御信号を出力する。レーザーユニット11
7から出力されるレーザー光は感光ドラム110を照射
し、露光するとともに非画像領域において受光センサで
あるところのビーム検知センサ213によって発光状態
が検知され、その出力信号がI/Oポート206に入力
される。
【0026】次に本実施の形態例のコントローラ部13
9内の画像処理部206の詳細構成を説明する。図3は
本実施の形態例の画像形成装置におけるコントローラ部
139内の画像処理部206の詳細構成を示すブロック
図である。
【0027】図3において、CCDユニット106のC
CD108により電気信号に変換された画像信号は、ま
ずシェーディング回路301によって画素間のばらつき
の補正を行った後、302の変倍回路において、縮小コ
ピー時はデータの間引き処理を行い、拡大コピー時はデ
ータの補間を行う。
【0028】次に、303のエッジ強調回路において、
例えば5×5のウィンドウで2次微分を行い、画像のエ
ッジを強調する。この画像データは輝度データであるの
でプリンターに出力するための濃度データに変換するた
め304のγ変換回路でテーブルサーチによりデータ変
換を行う。
【0029】濃度データに変換された画像データは30
6の2値化処理部へ入力される。ここでは例えばED法
(誤差拡散法)により多値データを2値データに変換す
る。2値に変換された画像データは307の合成回路に
入力される。合成回路307では、入力された画像デー
タと例えばDRAMやハードディスクにより構成される
画像用メモリ310内の画像データを選択的に出力す
る。
【0030】この画像用メモリ310に対するリードラ
イト制御は、メモリ制御部309で行い、画像を回転さ
せる場合はメモリ内の画像データの読み出しアドレスを
制御することで行う。これらの画像データはレーザーの
発光強度の信号に変換するためPWM回路308へ入力
され、画像の濃度に従ったパルス幅をレーザーユニット
に対して出力する。
【0031】次に図4〜図17を用いて本実施の形態例
における文書方向判別動作について説明する。本実施の
形態例においては、原稿のヘッダー部分,ページ番号部
分が原稿の方向を表わしていることに注目し、原稿のヘ
ッダー部分,ページ番号部分の文字方向を認識し、その
結果により原稿の方向を判断することで、より高い精度
での文書の方向の判断を可能としている。
【0032】図4は図3に示す文書方向判別部306の
詳細構成を示すブロック図である。図4において、撮像
素子108から出力された画像データは、画像エリア分
割部401により複数のエリアに分割される。画像エリ
ア分割部401により分割された画像データは、CPU
/メモリ部402に入力され、各々のエリアごとに画像
データを一時的に保存すると共に、各種制御を行う。
【0033】コントローラ部139内のCPU201と
は、例えば、図示しないデュアルポートRAMによりバ
ス接続されており、データを送受信する。もちろんシリ
アル通信でもよい。
【0034】文字認識/方向判別部403は、文書の方
向を一番正確に表しているのは文字であることに着目
し、文書中の数種類の文字領域を0°、90°、180
°、270°の方向から文字認識を行い、それら各方向
における文字認識の精度(文字認識の自信度:文字の特
徴分布に対する距離)の中で一番精度の高い方向を文書
方向とする。
【0035】領域分離部404は文字認識/方向判別部
403による文字認識・方向判別処理を行うための前処
理として、文書画像データより、文字部、図形部、自然
画部、表部などを矩形の領域に分離して、各領域の属性
(文字部など)を付加する処理を行うブロックである。
【0036】記憶装置405は、例えば、ハードディス
クや光磁気ディスクなどにより構成され、各種処理結果
(画像データ、領域分離結果、文字認識結果など)を保
存するために利用される。I/F部406は、SCSI
やRS232C規格でのインタフェースにより構成さ
れ、外部へデータを伝送するために設けられている。
【0037】コンピュータ407は、I/F部406を
介して必要な情報を得たり、光磁気ディスク等の移動可
能な記憶装置よりデータを得て利用する。
【0038】次に、本実施の形態例における文書方向自
動判別・補正、および文字認識処理の概要を図5のフロ
ーチャートに従って説明する。図5は本実施の形態例に
おける文書方向自動判別、文字認識処理を示すフローチ
ャートである。
【0039】まずステップS1で例えばCCDユニット
106を走査して原稿台ガラス101に載置された原稿
画像を読み込んで読み込み画像を入力する。続いてステ
ップS2において、入力された画像データ(多値画像)
を領域分離部404により文字部、図形部、自然画部、
表部などの属性別に矩形の領域に分離する。ここでは、
実際には、矩形で囲まれた領域情報を作成する。
【0040】次に、ステップS3において文字部検出処
理を行ない、各属性より文字領域の矩形情報を抽出す
る。ここで、文字領域とは、文章部、タイトル部、表中
の文字、図のキャプション部などである。例えば、図6
に示すような文書の場合は、図7に枠で囲った文字領域
の矩形情報が抽出され、図8に示すような文書の場合は
図9に枠で囲った文字領域の矩形情報が抽出される。
【0041】そして、続くステップS4においてこれら
の中の数ブロックを用いて、文書方向判別を行う。ステ
ップS4における文字判別の結果、文書方向が正方向で
あれば(回転させる必要が無ければ)ステップS7に進
み、引き続き画像中の文字ブロックに対して文字認識処
理を行う。
【0042】一方、文書方向が不正方向(傾いた状態)
であればステップS5に進み、画像データを正しい方向
に回転させる。そして、ステップS6において、回転画
像に対して領域分離を行い、領域分離情報の補正処理を
行う。これは、画像回転に伴う領域分離情報の相違を補
正するもので、一つの方法としては、全回転画像データ
に対して再び領域分離処理を行う方法、もう一つはアド
レス変換を領域分離結果にかける方法がある。
【0043】領域分離処理は、一般に画像が正方向を想
定しているため、初期の段階で行った領域分離処理と回
転画像データに対して行った領域分離処理は結果が異な
ることが多い。それゆえ、前者の方法がとられるのが望
ましい。そしてその後ステップS7に進む。
【0044】ステップS7においては、回転画像データ
中の文字領域ブロックは、文字認識処理系で文字認識さ
れる。この結果、ステップS8に示すように、最終的な
回転なし/回転ありの両方の場合とも、領域分離情報と
文字認識情報が得られる。
【0045】この処理結果は、I/F部406を介して
コンピュータ407に伝送され、コンピュータ407上
のファイリングのアプリケーションソフト等で利用され
る。
【0046】次に、本実施の形態例における文字認識処
理を用いた文書方向判別の手法について説明する。 [領域分離処理]文書画像データの黒画素を検出してゆ
き、輪郭線追跡、またはラベリング方式により、黒画素
ブロックの矩形枠を作成する。次に、その矩形の中の黒
画素密度、隣接矩形ブロックの有無、矩形の縦横比率な
どを判断基準にして、文字領域(タイトル、本文、キャ
プションなど)、図形領域、自然画領域、表領域などを
判別する。この処理結果により、文字領域の矩形領域が
判別される。また、文書画像データ内に文字領域が判別
されなかった場合は、『unknown』(判別不可)
と判断する。 [文字認識処理]文字認識処理として本実施の形態例で
は、例えば特徴ベクトル抽出、比較方式を用いる。この
方式は、例えば図10に示すように、「本」という文字
を含む文字領域が判別されたとする。第一段階として、
図11に示すようにこの文字領域について文字切り出し
処理を行う。これは、一つの文字の矩形を切り出す処理
で、黒画素連続性の状態を検出していけば求められる。
【0047】第二段階として、図12に示すように、一
文字をm×n(例えば64×64)の画素ブロックに切
り出す。そして、図13に示すように,その中から3×
3画素のウィンドウを用いて、黒画素の分布方向(方向
ベクトル情報)を抽出する。なお、図13は、本実施の
形態例における文字認識処理の処理方向ベクトル情報の
一部を例示した図であり、上記3×3画素のウィンドウ
をずらしてゆき、方向ベクトル情報を数十個得る。
【0048】このベクトル情報が文字の特徴となる。こ
の特徴ベクトルと予め記憶されている文字認識辞書の内
容と比較して、特徴ベクトルに特徴が一番近い文字から
順番に文字を抽出する。この場合、特徴ベクトルに特徴
が近い順番に第1候補、第2候補・・・となる。
【0049】この特徴ベクトルに対する特徴の近さが、
その文字に対する距離の近さ、すなわち文字認識の自信
度(精度)という数値になる。 [文字方向判別処理]このようにして文字認識の自信度
が求められるが、その自信度に基づいた文字方向判別処
理を、図14〜図16に示す「本発明の名称」という文
例を用いて説明する。
【0050】図14は正方向の文、図15は270°回
転した文である。ここで「本」に注目すると、文字方向
を判別する場合は、図16に示したように、1つの文字
「本」について0°、90°、180°、270°の4
方向から文字認識を行なう。各回転角度は、文字矩形の
領域の読み出し方を変更すればよく、特に原稿を回転す
る必要はない。
【0051】各回転角度における文字認識結果は、図1
6に示すように、互いに異なっている。なお、図16に
は説明用の仮の文字認識結果および自信度が示されてお
り、現実にこの通りになるとは限らない。
【0052】図16において、正方向(0°)から文字
認識を行った場合は、「本」と正しく認識され、自信度
も0.90と高い値となる。90°回転した方向から文
字認識を行った場合は、「町」と誤認識され、自信度も
0.40と低下する。このように誤認識が発生し、自信
度も低下するのは、回転した方向から見た場合の特徴ベ
クトルに基づいて文字認識を行ったからである。同様に
180°、270°回転した方向から文字認識を行った
場合も、誤認識が発生し、自信度も低下する。なお、文
字認識の方向別の自信度は、複雑な文字であればあるほ
ど、その差が顕著に現れてくる。
【0053】図16の結果は、正方向の場合に自信度が
1番高いため、文書は正方向に向いている可能性が高い
と判断される。文字方向判別の精度を向上させるため、
同一ブロック内の複数の文字について、同様に4方向か
ら文字認識を行なうことが望ましい。
【0054】さらに、1つのブロックだけで文字方向を
判別した場合、特殊な文字列について文字方向を誤って
判別するおそれがあるので、複数のブロックについて同
様の文字認識を行うことが望ましい。そして、各ブロッ
クについて、当該ブロック内の各認識対象文字の4方向
別の自信度の平均値を求め、さらに、各ブロックでの4
方向別の自信度の平均値に対する平均値を求め、この平
均値が最も高い方向を文字方向(文書方向)として認定
する。
【0055】このように、本実施の形態例によれば、1
文字だけの自信度で文字方向を認定することなく、同一
ブロック内の複数文字、さらには同一ブロック内の複数
文字の自信度で文字方向を認定することにより、文字
(文書)方向を高精度に判別することが可能となる。
【0056】ただし、1文字だけの自信度で文字方向を
判別したり、あるいは同一ブロック内の複数文字の自信
度で文字方向を判別しても、従来よりも高精度に文字方
向を判別できることは言うまでもない。
【0057】次に、文字方向(文書方向)の判別結果が
正方向以外の方向であるときは、文字方向が正方向にな
るように原画像を回転する。この回転は、図4に示すC
PU/メモリ401を用いて公知の技術により簡単に行
うことが可能であり、その説明は省略する。
【0058】以上のような処理により、図17の(a)
に示した原画像データに対応した図17の(b)に示す
領域分離データ、図17の(c)に示す文字認識情報を
得ることができる。これらの情報は、前述のようにコン
トローラ部139のCPU201へ送られ、各種画像処
理、各種制御に使用する。
【0059】本実施の形態例における領域分離データの
形式は、図17の(b)に示すように、領域分離データ
である旨を示す「header」と、分離した領域の識
別子「rect1」〜「rect4」により構成されて
いる。
【0060】そして、この識別子で区別された各領域
(ブロック)の情報は、ブロックの番号「orde
r」、ブロックの属性(文字部、図形部など)「ar
t」、ブロックの左上の座標値「x1」および「y
1」、ブロックの幅「w」、ブロックの高さ「h」、縦
書き、または構書きを示す「direction」、当
該ブロックのIDである「selfID」、当該ブロッ
クを包含する親ブロックのIDである「upperI
D」、親ブロックの属性「upperAtt」、予備領
域「reserve」により構成されている。
【0061】また、文字認識情報は、図17の(c)に
示したように、文字認識情報である旨を示す「head
er」を有し、例えば「本」等の単一の文字に関する文
字認識情報「OCR1」等と、当該文字が含まれている
ブロックを示す上記「rect1」等に相当する「bl
k header」との組み合わせ情報により構成され
ている。
【0062】そして、「OCR1」等の各文字認識情報
は、文字であるか或いは空白であるかを示す「typ
e」、前述の文字認識の自信度に従った第1〜第5候補
文字「文字1」〜「文字5」、当該文字の切り出し位置
「x1」および「y1」、当該文字の幅「w」、当該文
字の高さ「h」、予備領域「reserve」により構
成されている。
【0063】次に、図18乃至図21を参照して本実施
の形態例に特有の文書方向の判断について詳しく説明す
る。以下の説明は、図18に示す文書内に2方向の文字
を持つ原稿に関しての文書の方向判別を行う場合を例と
して文書方向の判断を説明する。
【0064】図18は本実施の形態例における文書方向
の判断を説明するための2方向の文字を持った原稿を示
す図、図19は本実施の形態例における画像分割例を示
す図、図20は本実施の形態例における分割画像エリア
の優先順位を示す図、図21は本実施の形態例における
文書方向自動判別を示すフローチャートである。
【0065】以下、図21の文書方向の判断処理を示す
フローチャートに従って説明を行う。
【0066】撮像素子108で読み取られた原稿の画像
データ、例えば、図18に示す原稿の画像データは、画
像エリア分割部401により、例えば図19に示す9つ
のエリアに分割される。画像エリア分割部401により
分割された画像データはCPU/メモリ部402に入力
され、9つの各々のエリアごとに画像データを一時的に
保存する。
【0067】このとき各エリアには優先順位がつけられ
ている。この優先順位の例を図20に示す。これは、各
エリアごとの方向判別結果が同一方向であればその方向
を文書の方向とすればいいのだが、図18に示される画
像データのような場合はヘッダー部分およびページ番号
部分が最も文書の方向をあらわしていることに注目して
いるためである。
【0068】CPU/メモリ部402に保存された各エ
リアごとの画像データは、図21のステップS201に
おいて、最も高い優先順位の高い領域に対して前述した
領域分離処理・文字認識処理・文字方向判別処理を行な
う。そして続くステップS202で判別結果を調べる。
判断の結果が『unknown』でなければステップS
203に進み、分割エリアの方向判断結果を原稿の方向
判断結果として当該処理を終了する。
【0069】一方、ステップS202で判断結果が『u
nknown』であればステップS204に進み、次に
優先順位の高い分割エリア(優先順位2位の領域)の画
像データに対して前述の処理及び判断を行なう。即ち、
判断の結果が『unknown』でなければステップS
203に進み、分割エリアの方向判断結果を原稿の方向
判断結果として当該処理を終了する。
【0070】以下同様にして順次優先順位より低い優先
順位の画像領域に対して画像データの方向を判別する
(ステップS205〜219)。ただし、分割エリアの
すべてにおいて判断結果が『unknown』だった場
合にはステップS219よりステップS220に進み、
その原稿はすべて絵または白紙等と判断し、方向判別不
可能とする。
【0071】以上説明した様に本実施の形態例におよれ
ば、光学的に読み取られた文書情報を光電変換して画像
データとして入力する画像入力手段と、前記画像入力手
段により入力された画像データ中の文字とその方向を認
識する文字方向認識手段と、前記画像データを少なくと
も2つ以上の複数のエリアに分割する画像エリア分割手
段とを有し、前記画像エリア分割手段により分割された
前記画像データの各々のエリアにおける前記文字方向認
識手段による認識結果の優先順位をつけ、前記各々の分
割エリアにおける文字方向認識結果が同一でない場合、
優先順位の高い分割エリアの文字方向認識と優先順位に
基づき前記入力された画像データの方向判断を行うの
で、図の入っている文書、特にグラフなどの図が入って
いる文書の方向を判断する場合にも、より高い精度で文
書の方向を判断することが可能となる。
【0072】そして、このようにして判別した文字方向
を加味して画像データの傾きを補正してから文字認識処
理を行なうことにより、種々の傾きの文字に対して高い
認識率を得ることができる。これにより、たとえ原稿が
傾いた状態で読み込まれたとしても、確実に原稿の文字
認識をすることができる。
【0073】また、たとえ原稿が傾いた状態で読み込ま
れたとしても、このようにして判別した文字方向を加味
して画像データの傾きを補正することができ、表示画面
に表示する際など、傾きが補正された見やすい表示とす
ることができる。
【0074】[他の実施形態例]なお、本発明は、複数の
機器(例えばホストコンピュータ,インタフェイス機
器,リーダ,プリンタなど)から構成されるシステムに
適用しても、一つの機器からなる装置(例えば、複写
機,ファクシミリ装置など)に適用してもよい。
【0075】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0076】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0077】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0078】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0079】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0080】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになる。
【0081】
【発明の効果】以上説明したように、本発明によれば、
文書内に複数方向の文字を持つ原稿にであっても高い精
度での文書方向の判別をおこなうことが可能となる。
【0082】
【図面の簡単な説明】
【図1】本発明に係る一発明の実施の形態例の画像形成
装置の構成を説明する断面図である。
【図2】本実施の形態例の画像形成装置におけるコント
ローラ部の詳細構成を示すブロック図である。
【図3】本実施の形態例の図2に示すコントローラ部内
の画像処理部の詳細構成を示すブロック図である。
【図4】図3に示す文書方向判別部の詳細構成を示すブ
ロック図である。
【図5】本実施の形態例における文書方向自動判別、文
字認識処理を示すフローチャートである。
【図6】、
【図7】、
【図8】、
【図9】本実施の形態例における文書方向自動判別にお
ける領域分離状態を説明するための図である。
【図10】、
【図11】,
【図12】本実施の形態例における文字認識処理の処理
過程を説明するための説明図である。
【図13】本実施の形態例における文字認識処理の処理
方向ベクトル情報の一部を例示する図である。
【図14】、
【図15】,
【図16】本実施の形態例における文書方向自動判別処
理を説明するための説明図である。
【図17】本実施の形態例における領域分離および文字
認識情報のデータ形式を示す図である。
【図18】本実施の形態例における文書方向の判断を説
明するための2方向の文字を持った原稿を示す図であ
る。
【図19】本実施の形態例における画像分割例を示す図
である。
【図20】本実施の形態例における分割画像エリアの優
先順位を示す図である。
【図21】本実施の形態例における文書方向自動判別を
示すフローチャートである。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力画像データを複数のエリアに分割す
    る分割手段と、 前記分割手段により分割された前記画像データの各々の
    エリアにおける画像データ中の文字と文字方向を認識す
    る認識手段と、 前記認識手段による認識結果に対して優先順位をつけ、
    前記認識手段による認識文字方向と前記優先順位に基づ
    いて前記入力された画像データの方向判断を行う方向判
    断手段とを備えることを特徴とする画像処理装置。
  2. 【請求項2】 入力画像データを複数のエリアに分割す
    る分割手段と、 前記分割手段により分割された前記画像データの各々の
    エリア毎に優先順位を付与する付与手段と、 前記付与手段の付与した優先順位の高いエリアより画像
    データ中の文字と文字方向を認識する認識手段と、 前記認識手段による認識文字方向により分割エリアの画
    像データの方向判断を行う方向判断手段とを備えること
    を特徴とする画像処理装置。
  3. 【請求項3】 原稿画像を読み取る読取手段を備え、 前記入力画像データは前記読取手段による読取原稿画像
    とすることを特徴とする請求項1または請求項2のいず
    れかに記載の画像処理装置。
  4. 【請求項4】 前記方向判断手段は、画像データを複数
    方向に回転させ、回転させた画像毎に文字認識を行な
    い、認識自信度の最も高い方向を求めて分割エリアの画
    像データの方向判断を行うことを特徴とする請求項1乃
    至請求項3のいずれかに記載の画像処理装置。
  5. 【請求項5】 入力画像データを複数のエリアに分割
    し、分割した前記画像データの各々のエリアにおける画
    像データ中の文字と文字方向を認識し、認識結果に対し
    て優先順位をつけ、前記認識した文字方向と前記優先順
    位に基づいて前記入力された画像データの方向判断を行
    うことを特徴とする画像処理方法。
  6. 【請求項6】 入力画像データを複数のエリアに分割
    し、分割された前記画像データの各々のエリア毎に優先
    順位を付与して、付与した優先順位の高いエリアより画
    像データ中の文字と文字方向を認識し、認識した文字方
    向により分割エリアの画像データの方向判断を行うこと
    を特徴とする画像処理方法。
  7. 【請求項7】 前記入力画像データを原稿読取手段によ
    る読取原稿画像とすることを特徴とする請求項5または
    請求項6のいずれかに記載の画像処理方法。
  8. 【請求項8】 前記方向判断は、画像データを複数方向
    に回転させ、回転させた画像毎に文字認識を行ない、認
    識自信度の最も高い方向を求めて分割エリアの画像デー
    タの方向判断を行うことを特徴とする請求項5乃至請求
    項7のいずれかに記載の画像処理方法。
  9. 【請求項9】 前記請求項1乃至請求項8のいずれか1
    項に記載の機能を実現するコンピュータプログラム列。
  10. 【請求項10】 前記請求項1乃至請求項8のいずれか
    1項に記載の機能を実現するコンピュータプログラムを
    記憶したコンピュータ可読記録媒体。
JP10237170A 1998-08-24 1998-08-24 画像処理装置及び方法 Withdrawn JP2000067156A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10237170A JP2000067156A (ja) 1998-08-24 1998-08-24 画像処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10237170A JP2000067156A (ja) 1998-08-24 1998-08-24 画像処理装置及び方法

Publications (1)

Publication Number Publication Date
JP2000067156A true JP2000067156A (ja) 2000-03-03

Family

ID=17011426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10237170A Withdrawn JP2000067156A (ja) 1998-08-24 1998-08-24 画像処理装置及び方法

Country Status (1)

Country Link
JP (1) JP2000067156A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007142227A1 (ja) * 2006-06-07 2007-12-13 Nec Corporation 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム
US7567730B2 (en) 2005-03-17 2009-07-28 Ricoh Company, Ltd. Detecting an orientation of characters in a document image
JP2015114806A (ja) * 2013-12-11 2015-06-22 富士ゼロックス株式会社 画像処理装置及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7567730B2 (en) 2005-03-17 2009-07-28 Ricoh Company, Ltd. Detecting an orientation of characters in a document image
WO2007142227A1 (ja) * 2006-06-07 2007-12-13 Nec Corporation 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム
JP4957922B2 (ja) * 2006-06-07 2012-06-20 日本電気株式会社 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム
US8548254B2 (en) 2006-06-07 2013-10-01 Nec Corporation Image direction judging device, image direction judging method and image direction judging program
JP2015114806A (ja) * 2013-12-11 2015-06-22 富士ゼロックス株式会社 画像処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US5452105A (en) Joint-portion processing device for image data for use in an image processing apparatus
US6624910B1 (en) Image forming method and apparatus
JP2001274969A (ja) 画像処理装置
US6360028B1 (en) Image processing apparatus and method
US5960229A (en) Image processing method and apparatus
JP3787440B2 (ja) 画像処理装置及び画像処理方法
JP2000067156A (ja) 画像処理装置及び方法
JPH11213089A (ja) 画像処理装置及びその方法
JPH11220557A (ja) 画像処理装置及び方法
JP2001312697A (ja) 画像方向判別方法及び装置
JPH10307460A (ja) 画像形成装置及び画像形成方法並びに記憶媒体
JP3684050B2 (ja) 画像処理方法及び装置
JPH11341252A (ja) 画像形成装置、画像形成方法、記憶媒体
JPH1115224A (ja) 複写装置
JP2000099628A (ja) 画像処理装置及び画像処理方法
JPH11195085A (ja) 画像処理方法及び画像処理装置並びに記憶媒体
JP3629962B2 (ja) 画像認識装置
JP2003141444A (ja) 画像処理装置および画像処理装置の制御方法およびプログラムおよび記憶媒体
JP2003316207A (ja) 画像形成装置
JPH11103381A (ja) 画像形成方法及び装置
JPH11331549A (ja) 画像処理装置及び画像処理方法
JP2001030580A (ja) 画像処理装置、印刷制御方法、及び記憶媒体
JPH11213134A (ja) 画像処理装置及び方法
JPH11184315A (ja) 画像処理装置
JP2000113104A (ja) 画像処理装置及び画像処理方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20051101