JP2000099628A - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法

Info

Publication number
JP2000099628A
JP2000099628A JP10265187A JP26518798A JP2000099628A JP 2000099628 A JP2000099628 A JP 2000099628A JP 10265187 A JP10265187 A JP 10265187A JP 26518798 A JP26518798 A JP 26518798A JP 2000099628 A JP2000099628 A JP 2000099628A
Authority
JP
Japan
Prior art keywords
character
image
document
writing
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10265187A
Other languages
English (en)
Inventor
Hisatsugu Tawara
久嗣 田原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10265187A priority Critical patent/JP2000099628A/ja
Publication of JP2000099628A publication Critical patent/JP2000099628A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】あらゆる形態の文字について正確に方向判別す
ること。 【解決手段】入力された画像データの文書方向を文字判
別辞書としてのメモリ1005を用いて判別する文字認
識/方向判別部402を有し、メモリ1005に対し一
般的なフォントデータの他、例えばメーカーのロゴマー
クや新聞の見出しの様な特殊な形態の文字データを書込
み自在とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像データを処理
し、その文書方向を判別する画像処理装置及び画像処理
方法に関するものである。
【0002】
【従来の技術】従来、この種の画像処理装置として、複
数の原稿の文書の方向がそれぞれ異なる場合に、画像デ
ータを回転させ、文書方向をそろえて出力、或いは文字
認識する機能を有するものが提案されている。
【0003】
【発明が解決しようとする課題】しかしながら、従来は
原稿の文書方向を判別するために用いられる判別辞書デ
ータとしては、一般的なフォントデータしか有していな
かった。従って、例えばメーカーのロゴマークや新聞の
見出しの様な特殊な形態の文字は判別することが困難で
あった。
【0004】本発明は上記の従来技術の課題を解決する
ためになされたもので、その目的とするところは、あら
ゆる形態を有する文字に対しても、高精度に文字方向の
判別を行なうことのできる高品質な画像処理装置及び画
像処理方法を提供することにある。
【0005】
【課題を解決するための手段】本発明は上記目的を達成
するために提案された画像処理装置であって、画像デー
タを入力する画像入力手段と、前記画像入力手段により
入力された画像データの文書方向を、文字判別辞書を用
いて判別する文書方向判別手段と、前記文字判別辞書に
対し文字情報の書込みを行なう書込手段と、を有するこ
とを特徴とする。また、原稿上の画像を読取る画像読取
手段を有し、前記画像入力手段は、該画像読取手段によ
って読取った画像を入力することを特徴とする。前記書
込手段は、前記画像読取手段によって読取られた画像デ
ータから、自動的に文字情報を抽出し、前記文字判別辞
書に書込むことを特徴とする。前記文字判別辞書は、文
字パターンを格納する文字パターン格納手段であって、
前記文書方向判別手段は、前記画像入力手段により入力
された画像データ中の文字を所定角度回転したものと、
前記文字パターン格納手段に格納された前記文字パター
ンとを比較し、マッチングの信頼性から、文字の方向を
判別し、文字方向から文書方向を判別する手段であっ
て、前記書込手段は前記文字パターン格納手段に対して
文字パターンの書込みを行なう文字パターン書込手段で
あることを特徴とする。また、本発明の画像処理方法
は、文字判別辞書に対し文字情報の書込みを行なう書込
工程と、前記書込工程によって文字情報の書込みが行わ
れた前記文字判別辞書を用いて画像データの文書方向を
判別する文書方向判別工程と、を有することを特徴とす
る。前記書込工程は、原稿上の画像を読取る読取工程を
含み、前記読取工程によって読取られた画像データから
前記文字情報を抽出して前記文字判別辞書に書込むこと
を特徴とする。また、本発明のコンピュータ可読メモリ
は、文字判別辞書を有する画像処理装置の制御プログラ
ムを格納したコンピュータ可読メモリであって、前記文
字判別辞書に対し文字情報の書込みを行なう書込工程の
プログラムモジュールと、前記書込工程によって文字情
報の書込みが行われた前記文字判別辞書を用いて画像デ
ータの文書方向を判別する文書方向判別工程のプログラ
ムモジュールと、を有することを特徴とする。
【0006】
【発明の実施の形態】以下に図面を参照して、この発明
の好適な実施の形態を例示的に詳しく説明する。ただ
し、この実施の形態に記載されている構成要素、プログ
ラムモジュール等の相対配置、解像度等の数値などにつ
いては特に特定的な記載がない限りは、本発明の範囲を
それらのみに限定する趣旨のものではない。
【0007】(第1の実施の形態)図1はこの発明の第
1の実施の形態としての画像処理装置の全体構成を説明
する概略断面図である。101は原稿台ガラスであり、
原稿自動送り装置142から給送された原稿が順次、所
定位置に載置される。102は例えばハロゲンランプか
ら構成される原稿照明ランプで、原稿台ガラス101に
載置された原稿を露光する。103、104、105は
走査ミラーであり、図示しない光学走査ユニットに収容
され、往復動しながら、原稿からの反射光をCCDユニ
ット106に導く。CCDユニット106はCCDに原
稿からの反射光を結像させる結像レンズ107、CCD
から構成される撮像素子108、撮像素子108を駆動
するCCDドライバ109等から構成されている。撮像
素子108からの画像信号出力は例えば8ビットのデジ
タルデータに変換された後、コントローラ部139に入
力される。
【0008】また、110は感光ドラムであり、112
の前露光ランプによって画像形成に備えて除電される。
113は1次帯電器であり、感光ドラム110を一様に
帯電させる。117は露光手段であり、半導体レーザ等
で構成され、画像処理や装置全体の制御を行うコントロ
ーラ部139で処理された画像データに基づいて感光ド
ラム110を露光し、静電潜像を形成する。118は現
像器であり、黒色の現像剤(トナー)が収容されてい
る。119は転写前帯電器であり、感光ドラム110上
に現像されたトナー像を用紙に転写する前に高電圧を付
与することによって帯電を行なう。120、122、1
24は給紙ユニットであり、各給紙ローラ121、12
3、125の駆動により、転写用紙が装置内へ給送さ
れ、レジストローラ126の配設位置で一旦停止し、感
光ドラム110に形成された画像との書き出しタイミン
グがとられ再給送される。127は転写帯電器であり、
感光ドラム110に現像されたトナー像を給送される転
写用紙に転写する。128は分離帯電器であり、転写動
作の終了した転写用紙を感光ドラム110より分離す
る。転写されずに感光ドラム110上に残ったトナーは
クリーナ111によって回収される。129は搬送ベル
トで、転写プロセスの終了した転写用紙を定着器130
に搬送し、熱及び/或いは圧力により定着される。13
1はフラッパであり、定着プロセスの終了した転写用紙
の搬送パスを、ステイプルソーター132または中間ト
レイ137の配置方向のいずれかに制御する。ステイプ
ルソーター132に排紙された用紙は各ビンに仕分けさ
れ、コントローラ部139からの指示により141のス
テイプル部141がステイプルを行う。また、133〜
136は給送ローラであり、一度定着プロセスの終了し
た転写用紙を中間トレイ137に反転(多重)または非
反転(両面)して給送する。138は再給送ローラであ
り、中間トレイ137に載置された転写用紙を再度、レ
ジストローラ126の配設位置まで搬送する。
【0009】139のコントローラ部には後述するマイ
クロコンピュータ、画像処理部等を備えており、操作パ
ネル140からの指示に従って、前述の構成要素を制御
し、画像形成動作を行う。
【0010】図2は本装置におけるコントローラ部13
9のハードウェア構成を示すブロック図である。
【0011】201は画像処理装置全体の制御を行うC
PUであり、装置本体の制御手順(制御プログラム)を
記憶した読取り専用メモリ203(ROM)からプログ
ラムを順次読取り、実行する。CPU201のアドレス
バスおよびデータバスはバスドライバ/アドレスデコー
ダ回路202をへて各負荷に接続されている。
【0012】また、204は入力データの記憶や作業用
記憶領域等として用いる主記憶装置であるところのラン
ダムアクセスメモリ(RAM)である。205はI/O
インタフェースであり、操作者がキー入力を行い、装置
の状態等を液晶、LEDを用いて表示する140の操作
パネルや給紙系、搬送系、光学系の駆動を行うモーター
類207、クラッチ類208、ソレノイド類209、ま
た、搬送される用紙を検知するための紙検知センサ類2
10等の装置の各負荷に接続される。現像器118には
現像器内のトナー量を検知するトナー残検センサ211
が設けられており、その出力信号がI/Oポート205
に入力される。215は高圧ユニットであり、CPUの
指示に従って、前述の1次帯電器113、現像器11
8、転写前帯電器119、転写帯電器127、分離帯電
器128へ高圧電力を出力する。
【0013】206は画像処理部であり、CCDユニッ
ト106から出力された画像信号が入力され、後述する
画像処理を行い、画像データに従って117のレーザユ
ニットの制御信号を出力する。レーザユニット117か
ら出力されるレーザ光は感光ドラム110を照射し、露
光するとともに非画像領域において受光センサであると
ころのビーム検知センサ214によって発光状態が検知
され、その出力信号がI/Oポート205に入力され
る。
【0014】図3は本装置におけるコントローラ部13
9内の画像処理部206のブロック図である。
【0015】CCD108により電気信号に変換された
画像信号は、まずシェーディング回路301によって画
素間のばらつきの補正を行った後、変倍回路302にお
いて、縮小コピー時はデータの間引き処理を行い、拡大
コピー時はデータの補間を行う。次に、エッジ強調回路
303において、例えば5×5のウィンドウで2次微分
を行い、画像のエッジを強調する。
【0016】この画像データは輝度データであるため、
プリンタ出力用の濃度データに変換する必要があり、γ
変換回路304でテーブルサーチによりデータ変換を行
う。濃度データに変換された画像データは2値化処理部
305へ入力される。ここではED法により多値データ
を2値データに変換する。2値に変換された画像データ
は合成回路307に入力され、入力された画像データ
か、或いはDRAMにより構成される画像用メモリ31
0内の画像データを選択的に、またはORをとって出力
する。画像用メモリ310に対するリードライト制御は
メモリ制御部309で行う。合成回307から出力され
た画像データはレーザの発光強度の信号に変換するため
PWM回路308へ入力され、画像の濃度に従ったパル
ス幅をレーザユニットに対して出力する。
【0017】また、シェーディング回路301からの画
像出力は文書方向判別部306へ入力され、後述する文
書方向判別処理を行う。
【0018】次に図4〜図9を用いて本発明における文
書方向判別動作について説明する。図4は文書方向判別
部306内のブロック図である。文書方向判別部306
は、図のように、CPU/メモリ部401、文字認識/
方向判別部402、領域分離部403、記憶装置40
4、I/F部405を備えており、I/F部405を介
して外部のコンピュータ406と接続されている。
【0019】シェーディング回路301から出力された
画像データは、文書方向判別部306に入力されると、
まず、CPU/メモリ部401に一時的に保存され、そ
れに伴い、各種制御が行なわれる。このCPU/メモリ
部401はコントローラ部139内のCPU201とデ
ュアルポートRAM(不図示)によりバス接続されてお
り、このバスを介してデータが送受信される。もちろん
シリアル通信でもよい。
【0020】文字認識/方向判別部402は、文書の方
向を一番正確に表しているのは文字であることに着目
し、全文書中から数種類の文字領域を選択し、その一部
の文字領域について、0°、90°、180°、270
°の方向から文字認識を行い、それら各方向における文
字認識の精度(文字認識の信頼度:文字の特徴分布に対
する距離)を比較し、一番精度の高い方向を文書方向と
判別する。
【0021】領域分離部403は文字認識/方向判別部
402による文字認識・方向判別処理を行うための前処
理として、文書画像データより、文字部、図形部、自然
画部、表部などを矩形の領域に分離して、各領域の属性
(文字部など)を付加する処理を行うブロックである。
【0022】記憶装置404は、例えば、ハードディス
クや光磁気ディスクなどにより構成され、各種処理結果
(画像データ、領域分離結果、文字認識結果など)を保
存するために利用される。I/F部405は、SCSI
やRS232Cなどにより構成され、外部ヘデータを伝
送するために設けられている。コンピュータ406は、
I/F部405を介して情報を得たり、光磁気ディスク
等の移動可能の記憶装置よりデータを得て利用する。
【0023】次に、文字認識処理を用いた文書方向判別
に必要な各種の処理について説明する。
【0024】[領域分離処理]文書画像データの黒画素
を検出してゆき、輪郭線追跡、またはラベリング方式に
より、黒画素ブロックの矩形枠を作成する。次に、その
矩形の中の黒画素密度、隣接矩形ブロックの有無、矩形
の縦横比率などを判断基準にして、文字領域(タイト
ル、本文、キャプションなど)、図形領域、自然画領
域、表領域などを判別する。この処理結果により、文字
領域の矩形領域が判別される。
【0025】[文字認識処理]文字認識処理の一つの方
法として、特徴ベクトル抽出、比較方式がある。例えば
図7(a)に示したように、「本」という文字を含む文
字領域が判別されたとする。第一段階として、この文字
領域について文字切り出し処理を行う(図7(b)参
照)。これは、一つの文字の矩形を切り出す処理で、黒
画素連続性の状態を検出していけば求められる。
【0026】第二段階として、一文字をm×n(例えば
64×64)の画素ブロックに切り出す(図7(c)参
照)。そして、その中から3×3画素のウィンドウを用
いて、黒画素の分布方向を抽出する(方向ベクトル情
報:図7(d)参照)。
【0027】なお、図7(d)は、方向ベクトル情報の
一部を例示したものであり、上記3×3画素のウィンド
ウをずらしてゆき、方向ベクトル情報を数十個得る。こ
のベクトル情報が文字の特徴となる。この特徴ベクトル
と予め記憶されている文字認識辞書の内容と比較して、
特徴ベクトルに特徴が一番近い文字から順番に文字を抽
出する。この場合、特徴ベクトルに特徴が近い順番に第
1候補、第2候補・・・となる。この特徴ベクトルに対
する特徴の近さが、その文字に対する距離の近さ、すな
わち文字認識の信頼度(精度)という数値になる。
【0028】この文字認識辞書には、ユーザの要求に応
じて特殊なフォントデータを登録することができ、たと
え、もともとこの辞書に登録されていないフォントの文
字であっても、高精度な認識を実現できる。
【0029】[文字方向判別処理]このようにして文字
認識の信頼度が求められるが、その信頼度に基づいた文
字方向判別処理を、図8に示した「本発明の名称」とい
う文例を用いて説明する。
【0030】図8(a)は正方向の文、図8(b)は2
70°回転した文である。ここで「本」に注目すると、
文字方向を判別する場合は、図8(c)に示したよう
に、1つの文字「本」について0°、90°、180
°、270°の4方向から文字認識を行ってみる。各回
転角度は、文字矩形の領域の読み出し方を変更すればよ
く、特に原稿を回転する必要はない。
【0031】各回転角度における文字認識結果は、図8
(c)に示したように、互いに異なっている。なお、図
8(c)には説明用の仮の文字認識結果および信頼度が
示されており、現実にこの通りになるとは限らない。
【0032】図8(c)において、正方向(0°)から
文字認識を行った場合は、「本」と正しく認識され、信
頼度も0.90と高い値となる。90°回転した方向か
ら文字認識を行った場合は、「町」と誤認識され、信頼
度も0.40と低下する。このように誤認識が発生し、
信頼度も低下するのは、回転した方向から見た場合の特
徴ベクトルに基づいて文字認識を行ったからである。同
様に180°、270°回転した方向から文字認識を行
った場合も、誤認識が発生し、信頼度も低下する。な
お、文字認識の方向別の信頼度は、複雑な文字であれば
あるはど、その差が顕著に現れてくる。
【0033】図8(c)の結果は、正方向の場合に信頼
度が1番高いため、文書は正方向に向いている可能性が
高いと判断される。文字方向判別の精度を向上させるた
め、同一ブロック内の複数の文字について、同様に4方
向から文字認識を行ってみる。さらに、1つのブロック
だけで文字方向を判別した場合、特殊な文字列について
文字方向を誤って判別するおそれがあるので、複数のブ
ロックについて同様の文字認識を行ってみる。そして、
各ブロックについて、当該ブロック内の各認識対象文字
の4方向別の信頼度の平均値を求め、さらに、各ブロッ
クでの4方向別の信頼度の平均値に対する平均値を求
め、この平均値が最も高い方向を文字方向(文書方向)
として認定する。
【0034】このように、1文字だけの信頼度で文字方
向を認定することなく、同一ブロック内の複数文字、さ
らには複数ブロック内の複数文字の信頼度で文字方向を
認定することにより、文字(文書)方向を高精度に判別
することが可能となる。ただし、1文字だけの信頼度で
文字方向を判別したり、あるいは同一ブロック内の複数
文字の信頼度で文字方向を判別しても、従来よりも高精
度に文字方向を判別できることは言うまでもない。
【0035】次に、文字方向(文書方向)の判別結果が
正方向以外の方向であるときは、文字方向が正方向にな
るように原画像を回転する。この回転は、図4のCPU
/メモリ401を用いて公知の技術により簡単に行うこ
とが可能であり、その説明は省略する。
【0036】次に、本画像処理装置を用いて、文書方向
を判別し、更に、判別した文書方向に基づいて文書全体
の文字認識を行なう場合について説明する。図5は、こ
のような、文書方向自動判別・補正、及び文字認識処理
の概要を示すフローチャートである。
【0037】入力された画像データ(多値画像)は、ま
ず領域分離部403により、文字部、図形部、自然画
部、表部などの属性別に矩形の領域に分離される(ステ
ップS1、S2)。ここでは、矩形で囲まれた領域情報
を作成するものとする。
【0038】次に、各属性を有する領域情報から文字領
域の矩形情報を抽出する(ステップS3)。ここで、文
字領域とは、文章部、タイトル部、表中の文字、図のキ
ャプション部などである。例えば、図6(a)、(c)
の文書の場合は、それぞれ図6(b)、(d)に示した
ような文字領域の矩形情報が抽出される。そして、これ
らの中の数ブロックを用いて、文書方向判別を行う(ス
テップS4)。その結果、文書方向が正方向であれば、
次に、画像中の全文字ブロックに対して文字認識処理を
行う(ステップS7)。 一方、文書方向が正方向でな
ければ、画像データを正方向になるように回転させる
(ステップS5)。そして、回転画像に対して再度、領
域分離を行い、領域分離情報の補正処理を行う(ステッ
プS6)。これは、画像回転に伴う領域分離情報の相違
を補正するものである。回転画像に対して文字認識を行
なう際、回転させた全画像データに対して再び領域分離
処理を行う方法と、アドレス変換を回転前の領域分離結
果にかける方法がある。領域分離処理は、一般に画像が
正方向を想定しているため、初期の段階で行った領域分
離処理と回転画像データに対して行った領域分離処理は
結果が異なることが多い。それゆえ、前者の方法がとら
れるのが望ましく、ここでは、ステップS6で回転した
全画像データに対して再度領域分離処理を行なってい
る。
【0039】次に、ステップS7に進んで、回転画像デ
ータ中の文字領域ブロックは、文字認識処理系で文字認
識される。そして、領域分離情報と文字認識情報を処理
結果として得る(ステップS8)。
【0040】この処理結果は、I/F部405を介して
コンピュータ406に伝送され、コンピュータ406上
のファイリングのアプリケーションソフト等で利用され
る。また、コントローラ部139内のCPU201へ各
画像毎に送信される。以上のような処理により、図9
(A)に示した原画像データ、図9(B)に示した領域
分離データ、図9(C)に示した文字認識情報を得るこ
とができる。これらの情報は前述のようにコントローラ
部139のCPU201へ送られ、各種画像処理、各種
制御に使用する。
【0041】領域分離データの形式は図9(B)に示し
たように、領域分離データである旨を示す「heade
r」と、分離した領域の識別子「rect1」〜「re
ct4」により構成され、この識別子で区別された各領
域(ブロック)の情報は、ブロックの番号「orde
r」、ブロックの属性(文字部、図形部など)「ar
t」、ブロックの左上の座標値「x1」および「y
1」、ブロックの幅「w」、ブロックの高さ「h」、縦
書き、または横書きを示す「direction」、当
該ブロックのIDである「selfID」、当該ブロッ
クを包含する親ブロックのIDである「upperI
D」、親ブロックの属性「upperAtt」、予備領
域「reserve」により構成されている。
【0042】また、文字認識情報は、図9(C)に示し
たように、文字認識情報である旨を示す「heade
r」を有し、例えば「本」等の単一の文字に関する文字
認識情報「OCR1」等と、当該文字が含まれているブ
ロックを示す上記「rect1」等に相当する「blk
header」との組み合わせ情報により構成されて
いる。
【0043】そして、「OCR1」等の各文字認識情報
は、文字であるか或いは空白であるかを示す「typ
e」、前述の文字認識の信頼度に従った第1〜第5候補
文字「文字1」〜「文字5」、当該文字の切り出し位置
「x1」および「y1」、当該文字の幅「w」、当該文
字の高さ「h」、予備領域「reserve」により構
成されている。
【0044】次に、図10のブロック図を用いて図4に
おけるCPU/メモリ部の詳細な動作について説明す
る。
【0045】CPU/メモリ部内には文書方向判別処
理、画像形成装置本体内のCPU201との間で通信制
御を行うCPU1001があり、ROMまたはフラッシ
ュメモリによって構成されるプログラムメモリ1004
内のプログラムに従って各制御を行う。また、RAMま
たはフラッシュメモリによって構成される辞書メモリ1
005内には文字認識/方向判別を行うための方向ベク
トル情報があらかじめ記憶されている。1003は入力
された画像データを格納しておく画像メモリであり、セ
レクタ1002によりデータバスがCPU1001のデ
ータバスと切り換えられる。文字認識/方向判別を行う
際はすでに図4〜図9により説明したとおり、画像メモ
リ1003に格納された画像データから、領域分離部4
03で文字領域を切り出し、文字認識/方向判別部40
2で辞書メモリ1005の内容と比較することによって
判別処理を行う。
【0046】辞書メモリ1005は書込み自在であり、
文字登録モードでは、入力した文字画像について、方向
ベクトルデータ導き出し、その文字コードに関連づけて
辞書メモリ1005内の所定のエリアに格納する。これ
により、次に同様の形態の文字が入力された場合の、文
字認識ひいては文書方向判別の精度が格段に向上する。
【0047】図11は、文字登録を行なう場合の処理を
示すフローチャートである。
【0048】まず、ステップS11で操作パネル140
上の図示しないスイッチにより文書方向判別用の文字登
録モードに入ったかどうかを判断する。この登録モード
でない場合は他の画像形成処理を行う(ステップS1
7)。文書方向判別用の文字登録モードに入ったと判断
されたらステップS12において同じく操作パネル14
0上の図示しないコピーキーが押されたかどうかを判断
する。コピーキーが押されたら原稿ガラス101上の原
稿を走査し、画像を読取る(ステップS13)。読取ら
れた画像データは画像メモリ1003に格納される。次
に、ステップS14で文字領域の分離処理を行い、ステ
ップS15で文字部の検出を行うことにより、読取られ
た画像の中の文字に対する方向ベクトル情報を得る。こ
こで得られた方向ベクトル情報はステップS16で辞書
メモリ1005の空きエリアに格納する。そして次回か
らの文書方向判別処理時に使用される。
【0049】(他の実施形態)なお、本発明は、複数の
機器(例えばホストコンピュータ,インタフェイス機
器,リーダ,プリンタなど)から構成されるシステムに
適用しても、一つの機器からなる装置(例えば、複写
機,ファクシミリ装置など)に適用してもよい。
【0050】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0051】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0052】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0053】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0054】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0055】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになるが、簡単に説
明すると、図11のメモリマップ例に示す各モジュール
を記憶媒体に格納することになる。すなわち、少なくと
も「文字判別辞書に対し文字情報の書込みを行なう書込
工程のプログラムモジュール」と、「書込工程によって
文字情報の書込みが行われた文字判別辞書を用いて画像
データの文書方向を判別する文書方向判別工程のプログ
ラムモジュール」の各モジュールのプログラムコードを
記憶媒体に格納すればよい。
【0056】
【発明の効果】以上、説明したように本発明では原稿の
文書方向を判別するための判別辞書に一般的なフォント
データの他、例えばメーカーのロゴマークや新聞の見出
しの様な特殊な形態の文字データを追加する事が可能と
なり、あらゆる形態の文字について正確に方向判別でき
るようになる。
【0057】
【図面の簡単な説明】
【図1】本発明の一実施の形態としての画像処理装置の
構成を説明する断面図である。
【図2】本発明の一実施の形態としての画像処理装置に
おけるコントローラ部139のブロック図である。
【図3】本発明の一実施の形態としての画像処理装置に
おけるコントローラ部139内の画像処理部206のブ
ロック図である。
【図4】図3における文書方向判別部306のブロック
図である。
【図5】本発明の一実施の形態としての画像処理装置に
おける文書方向自動判別、文字認識処理を示すフローチ
ャートである。
【図6】本発明の一実施の形態としての画像処理装置に
おける文書方向自動判別における領域分離状態を示した
図である。
【図7】本発明の一実施の形態としての画像処理装置に
おける文字認識処理の処理過程を説明するための説明図
である。
【図8】本発明の一実施の形態としての画像処理装置に
おける文書(文字)方向自動判別処理を説明するための
説明図である。
【図9】本発明の一実施の形態としての画像処理装置に
おける領域分離および文字認識情報のデータ形式を示し
た図である。
【図10】図4におけるCPU/メモリ部401のブロ
ック図である。
【図11】本発明の一実施の形態としての画像処理装置
における辞書登録処理を示すフローチャートである。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】画像データを入力する画像入力手段と、 前記画像入力手段により入力された画像データの文書方
    向を、文字判別辞書を用いて判別する文書方向判別手段
    と、 前記文字判別辞書に対し文字情報の書込みを行なう書込
    手段と、 を有することを特徴とする画像処理装置。
  2. 【請求項2】原稿上の画像を読取る画像読取手段を有
    し、 前記画像入力手段は、該画像読取手段によって読取った
    画像を入力することを特徴とする請求項1に記載の画像
    処理装置。
  3. 【請求項3】前記書込手段は、前記画像読取手段によっ
    て読取られた画像データから、自動的に文字情報を抽出
    し、前記文字判別辞書に書込むことを特徴とする請求項
    1又は2に記載の画像処理装置。
  4. 【請求項4】前記文字判別辞書は、文字パターンを格納
    する文字パターン格納手段であって、 前記文書方向判別手段は、前記画像入力手段により入力
    された画像データ中の文字を所定角度回転したものと、
    前記文字パターン格納手段に格納された前記文字パター
    ンとを比較し、マッチングの信頼性から、文字の方向を
    判別し、文字方向から文書方向を判別する手段であっ
    て、 前記書込手段は前記文字パターン格納手段に対して文字
    パターンの書込みを行なう文字パターン書込手段である
    ことを特徴とする請求項1、2または3に記載の画像処
    理装置。
  5. 【請求項5】文字判別辞書に対し文字情報の書込みを行
    なう書込工程と、 前記書込工程によって文字情報の書込みが行われた前記
    文字判別辞書を用いて画像データの文書方向を判別する
    文書方向判別工程と、 を有することを特徴とする画像処理方法。
  6. 【請求項6】前記書込工程は、 原稿上の画像を読取る読取工程を含み、 前記読取工程によって読取られた画像データから前記文
    字情報を抽出して前記文字判別辞書に書込むことを特徴
    とする請求項5に記載の画像処理方法。
  7. 【請求項7】文字判別辞書を有する画像処理装置の制御
    プログラムを格納したコンピュータ可読メモリであっ
    て、 前記文字判別辞書に対し文字情報の書込みを行なう書込
    工程のプログラムモジュールと、 前記書込工程によって文字情報の書込みが行われた前記
    文字判別辞書を用いて画像データの文書方向を判別する
    文書方向判別工程のプログラムモジュールと、 を有することを特徴とするコンピュータ可読メモリ。
JP10265187A 1998-09-18 1998-09-18 画像処理装置及び画像処理方法 Withdrawn JP2000099628A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10265187A JP2000099628A (ja) 1998-09-18 1998-09-18 画像処理装置及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10265187A JP2000099628A (ja) 1998-09-18 1998-09-18 画像処理装置及び画像処理方法

Publications (1)

Publication Number Publication Date
JP2000099628A true JP2000099628A (ja) 2000-04-07

Family

ID=17413779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10265187A Withdrawn JP2000099628A (ja) 1998-09-18 1998-09-18 画像処理装置及び画像処理方法

Country Status (1)

Country Link
JP (1) JP2000099628A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101265022B1 (ko) 2011-06-29 2013-05-27 후지쯔 가부시끼가이샤 이미지 블록 내의 문자들의 방향을 식별하기 위한 방법 및 장치
KR101272445B1 (ko) 2011-07-20 2013-06-07 후지쯔 가부시끼가이샤 이미지 블록 내 문자들의 방향을 식별하는 방법 및 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101265022B1 (ko) 2011-06-29 2013-05-27 후지쯔 가부시끼가이샤 이미지 블록 내의 문자들의 방향을 식별하기 위한 방법 및 장치
US8805080B2 (en) 2011-06-29 2014-08-12 Fujitsu Limited Method of and device for identifying direction of characters in image block
KR101272445B1 (ko) 2011-07-20 2013-06-07 후지쯔 가부시끼가이샤 이미지 블록 내 문자들의 방향을 식별하는 방법 및 장치
US8737743B2 (en) 2011-07-20 2014-05-27 Fujitsu Limited Method of and device for identifying direction of characters in image block

Similar Documents

Publication Publication Date Title
JP3050007B2 (ja) 画像読取装置およびこれを備えた画像形成装置
JP2001274969A (ja) 画像処理装置
JP3728040B2 (ja) 画像形成装置及び方法
JPH08212298A (ja) 文書方向自動判別装置、及び文書方向自動補正装置
US5960229A (en) Image processing method and apparatus
JP3902840B2 (ja) 画像処理装置および画像処理方法
JPH11341229A (ja) 画像処理装置及び画像処理方法
JP3787440B2 (ja) 画像処理装置及び画像処理方法
JP2000099628A (ja) 画像処理装置及び画像処理方法
JPH11213089A (ja) 画像処理装置及びその方法
JP2001312697A (ja) 画像方向判別方法及び装置
JPH10191018A (ja) 画像処理方法及び装置
JP2000067156A (ja) 画像処理装置及び方法
JPH11220557A (ja) 画像処理装置及び方法
JPH10307460A (ja) 画像形成装置及び画像形成方法並びに記憶媒体
JP3684050B2 (ja) 画像処理方法及び装置
JPH11195085A (ja) 画像処理方法及び画像処理装置並びに記憶媒体
JPH11331549A (ja) 画像処理装置及び画像処理方法
JPH11341252A (ja) 画像形成装置、画像形成方法、記憶媒体
JP2003141444A (ja) 画像処理装置および画像処理装置の制御方法およびプログラムおよび記憶媒体
JPH1115224A (ja) 複写装置
JP2003316207A (ja) 画像形成装置
JP2001030580A (ja) 画像処理装置、印刷制御方法、及び記憶媒体
JP2000113104A (ja) 画像処理装置及び画像処理方法
JPH11213088A (ja) 画像処理装置及び方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060110