JP2003203205A - 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2003203205A
JP2003203205A JP2002001749A JP2002001749A JP2003203205A JP 2003203205 A JP2003203205 A JP 2003203205A JP 2002001749 A JP2002001749 A JP 2002001749A JP 2002001749 A JP2002001749 A JP 2002001749A JP 2003203205 A JP2003203205 A JP 2003203205A
Authority
JP
Japan
Prior art keywords
image data
character recognition
image
inclination
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002001749A
Other languages
English (en)
Inventor
Toshifumi Yamaai
敏文 山合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002001749A priority Critical patent/JP2003203205A/ja
Publication of JP2003203205A publication Critical patent/JP2003203205A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 画像データの傾きや方向の検出処理と文字認
識処理の効率化が図れること。 【解決手段】 画像適正化部は、画像データが所定の解
像度R1より大きい場合(ステップS701:Ye
s)、画像データの縮小画像を作成し(ステップS70
2)、二値化処理後に画像の傾きや文書の方向を検出し
補正する(ステップS705)。この後、画像データが
所定の解像度R2より小さい場合には(ステップS70
6:Yes)、画像データの拡大画像を作成し(ステッ
プS707)、二値化処理後に文字認識をおこなう(ス
テップS709)。縮小した画像データを用いて画像の
傾きや文書の方向を検出し補正する処理の効率化が図
れ、拡大した画像データにより文字認識の高精度化を図
ることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文字認識をおこ
なう、より詳しくは、原稿の画像を読み取り文字データ
を出力する文字認識方法において、画像の傾きや方向の
検出処理と文字認識処理の効率化を図ることができる文
字認識装置、文字認識方法、およびその方法をコンピュ
ータに実行させるプログラム、並びにそのプログラムを
記録したコンピュータ読み取り可能な記録媒体に関す
る。
【0002】
【従来の技術】文字認識装置は、原稿上の文字等の画像
を文字認識して文字データを出力する。文字認識処理実
行前において、画像データの傾きを補正しておく必要が
ある。特開平6−068245号公報に開示されている
画像処理方法では、読み込んだ画像データの傾きを画像
処理により補正するものであり、この後に文字認識処理
がなされる。
【0003】図8は、従来の画像データの補正および文
字認識処理の工程を示すフローチャートである。この画
像処理方法では、先に画像データの二値化処理をおこな
い(ステップS801)、得られた二値画像上で画像デ
ータの傾きを検出し(ステップS802)、検出された
補正角度に基づき二値画像を補正する(ステップS80
3)。この後補正された二値画像を用いて文字認識をお
こなう(ステップS804)。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の画像処理方法を用いて、カラー等多値の画像データ
の画像の傾きを補正する場合には、カラーの画像データ
と、二値画像データの両方に対し傾き補正するか、ある
いは、カラー画像データを傾き補正した後に、再度二値
化処理をおこなって、文字認識に適した画像データを生
成することになる。
【0005】このように、カラーの画像データと、二値
画像データの両方に対し、これらを同じ画像処理アルゴ
リズムで傾ける補正処理をおこなうと、明らかになって
いる場合を除いては、カラー画像と二値画像で補正の差
が生じる。例えば、画像データの端などに両者で補正に
差が生じる。
【0006】一方、カラーの画像データを補正した後に
再度二値化処理をおこなう場合には、画像処理に時間が
かかり、処理の効率化の点で不利が生じる。
【0007】この発明は、上述した従来技術による問題
点を解消するため、画像データの傾きや方向の検出処理
と文字認識処理の効率化が図れる文字認識装置、文字認
識方法、およびその方法をコンピュータに実行させるプ
ログラム、並びにそのプログラムを記録したコンピュー
タ読み取り可能な記録媒体を提供することを目的とす
る。
【0008】
【課題を解決するための手段】上述した課題を解決し、
目的を達成するため、請求項1の発明にかかる文字認識
方法は、入力される画像データの傾きや文書の方向を検
出し補正した後に文字認識をおこなう文字認識方法にお
いて、画像データの傾きや文書の方向を検出し補正する
ときと、画像データの文字認識をおこなうときに、前記
画像データをそれぞれの処理に適したサイズに変更させ
る画像適正化工程を備えたことを特徴とする。
【0009】この請求項1の発明によれば、傾きや文書
の方向を検出し補正するための画像データと、文字認識
をおこなう画像データは、それぞれに適した画像サイズ
に変更可能であり、各処理の効率化を図ることができ
る。
【0010】また、請求項2の発明にかかる文字認識方
法は、入力される画像データの傾きや文書の方向を検出
し補正した後に文字認識をおこなう文字認識方法におい
て、画像データの傾きや文書の方向を検出し補正すると
きと、画像データの文字認識をおこなうときに、前記画
像データをそれぞれの処理に適した二値化アルゴリズム
に変更して二値化処理する画像適正化工程を備えたこと
を特徴とする。
【0011】この請求項2の発明によれば、画像データ
の傾きや方向の検出用に適した二値化と、文字認識用に
適した二値化処理を選択することができ、各処理の効率
化を図ることができる。
【0012】また、請求項3の発明にかかる文字認識方
法は、請求項1,2のいずれか一つに記載の発明におい
て、前記画像適正化工程は、前記画像データが有する解
像度の情報を用いて、画像データに対する前記変更処理
を実行することを特徴とする。
【0013】この請求項3の発明によれば、入力される
画像データの解像度に基づき、画像データの傾きや文書
の方向の検出用、あるいは文字認識用に適した画像サイ
ズと、二値化アルゴリズムをそれぞれ選択することがで
き、これら画像データの傾きの補正と、文字認識にかか
る処理の効率化を図ることができる。
【0014】また、請求項4の発明にかかる文字認識方
法は、請求項1〜3のいずれか一つに記載の発明におい
て、前記画像適正化工程は、入力される画像データがあ
らかじめ定めた所定の解像度(R1)より大きい場合、
前記画像の傾きや文書の方向を検出し補正する際に該画
像データを縮小処理した画像データを用い、前記文字認
識をおこなう際には、前記縮小処理前の画像データを用
いることを特徴とする。
【0015】この請求項4の発明によれば、入力される
画像データが所定の解像度(R1)より大きい場合に、
縮小した画像データを用いて画像の傾きや文書の方向を
検出し補正する処理の効率化を図ることができる一方、
文字認識時には縮小処理前の画像データを用いて文字認
識の高精度化を図ることができる。
【0016】また、請求項5の発明にかかる文字認識方
法は、請求項1〜3のいずれか一つに記載の発明におい
て、前記画像適正化工程は、入力される画像データがあ
らかじめ定めた所定の解像度(R2)より小さい場合、
前記画像の傾きや文書の方向を検出し補正する際に該入
力された画像データを用い、前記文字認識をおこなう際
には、前記入力された画像データを拡大処理した画像デ
ータを用いることを特徴とする。
【0017】この請求項5の発明によれば、入力される
画像データが所定の解像度(R2)より小さい場合に、
この画像データを用いて画像の傾きや文書の方向を検出
し補正する処理の効率化を図ることができる一方、文字
認識時には拡大した画像データを用いて文字認識の高精
度化を図ることができる。
【0018】また、請求項6の発明にかかる文字認識方
法は、請求項1〜3のいずれか一つに記載の発明におい
て、前記画像適正化工程は、前記画像の傾きや文書の方
向を検出し補正する際に、入力される画像データがあら
かじめ定めた所定の解像度(R1)より大きい場合に
は、該画像データを縮小処理した画像データを用い、前
記文字認識をおこなう際に、入力される画像データがあ
らかじめ定めた所定の解像度(R2)より小さい場合に
は、前記入力された画像データを拡大処理した画像デー
タを用いることを特徴とする。
【0019】この請求項6の発明によれば、入力される
画像データが所定の解像度(R1)より大きい場合、縮
小した画像データを用いて画像の傾きや文書の方向を検
出し補正する処理の効率化を図ることができるととも
に、文字認識時にはこの画像データが所定の解像度(R
2)より小さい場合、拡大した画像データを用いて文字
認識の高精度化を図ることができる。
【0020】また、請求項7の発明にかかる文字認識装
置は、入力される画像データの傾きや文書の方向を検出
し補正した後に文字認識をおこなう文字認識装置におい
て、画像データの傾きや文書の方向を検出し補正すると
きと、画像データの文字認識をおこなうときに、前記画
像データをそれぞれの処理に適したサイズに変更させる
画像適正化手段を備えたことを特徴とする。
【0021】この請求項7の発明によれば、傾きや文書
の方向を検出し補正するための画像データと、文字認識
をおこなう画像データは、それぞれに適した画像サイズ
に変更可能であり、各処理の効率化を図ることができ
る。
【0022】また、請求項8の発明にかかるプログラム
は、前記請求項1〜6のいずれか一つに記載された方法
をコンピュータに実行させることを特徴とする。
【0023】この請求項8の発明によれば、請求項1〜
6のいずれかに記載された方法をコンピュータに実行さ
せることができ、コンピュータを用いて画像データの傾
きや文書の方向の検出および補正と、文字認識処理を実
行でき、文字認識処理にかかるパフォーマンスの向上を
図ることができる。
【0024】また、請求項9の発明にかかるコンピュー
タ読み取り可能な記録媒体は、請求項8に記載されたプ
ログラムを記録したことを特徴とする。
【0025】この請求項9の発明によれば、請求項8に
記載されたコンピュータに実行させるプログラムを記録
したことで、そのプログラムをコンピュータ読み取り可
能となり、これによって請求項8の動作をコンピュータ
によって実現することができる。
【0026】
【発明の実施の形態】以下に添付図面を参照して、この
発明にかかる文字認識装置、文字認識方法、およびその
方法をコンピュータに実行させるプログラム、並びにそ
のプログラムを記録したコンピュータ読み取り可能な記
録媒体の好適な実施の形態を詳細に説明する。
【0027】図1は、本発明の文字認識装置の全体構成
を示すブロック図である。文字認識装置100は、スキ
ャナ101が読み取った画像データを文字認識してディ
スプレイ102、およびプリンタ等の印字装置103に
テキスト等の文字データを出力する。
【0028】文字認識装置100は、スキャナ101の
画像データを格納する画像メモリ104,画像メモリ1
04の画像データを文字認識処理するCPU105,C
PU105の文字認識処理プログラムが格納されたRO
M106,CPU105の文字認識処理時のデータのワ
ークエリアとして用いられるRAM107,CPU10
5の文字認識処理時に参照されるOCR辞書(辞書デー
タ格納部)108によって構成されている。
【0029】図2は、上記ROM106に格納された文
字認識処理プログラムの各機能を抽出したブロック図で
ある。ROM106の文字認識処理プログラムは、文字
認識をおこなう画像のサイズを検出するサイズ検出部,
OCR(文字認識)部,画像データの傾きを検出する補
正角度検出部201,検出された傾きの角度で画像デー
タを回転させる画像回転部202,画像データを二値化
する二値化部203,画像サイズを変更するサイズ変更
部204,の各手段(機能別プログラム)により大略構
成されている。
【0030】図3は、本発明の画像処理にかかる各機能
部への画像データの流れを示す工程図である。多値の画
像データは、画像適正化部301に入力された後、二値
化部203に入力され二値化処理される。この後、補正
角度検出部201で画像データの傾きが検出され、多値
画像補正部302を介し、画像適正化部301に入力さ
れる。この後、二値化部203で二値化処理され、文字
認識部303で文字認識され、結果(文字データ)が出
力される。
【0031】画像適正化部301は、後段の画像処理で
必要なサイズとなるよう、入力された画像データのサイ
ズ(解像度)を変更する。また、後段の画像処理で必要
な画像データが得られるよう画像処理の内容を変更す
る。
【0032】図4は、上記構成による画像処理内容を示
すフローチャートである。多値画像が入力されると、画
像適正化部301は、入力された画像データを所定の画
像サイズで二値化する(ステップS401)。次に、画
像データの傾きや文書の方向を検出する(ステップS4
02)。そして、この検出結果に基づき画像データの傾
きや文書の方向が一定となるようこの画像データを回転
させ補正する(ステップS403)。次に、文字認識に
適した所定のサイズで画像データを二値化し(ステップ
S404)、文字認識処理する(ステップS405)。
【0033】上記のように、入力された画像データの傾
きや方向を検出し、補正をおこなった後に文字認識をお
こなう。ここで、画像適正化部301は、傾きや文書の
方向を判別するための画像と文字認識をおこなう画像と
で、処理する画像サイズをそれぞれ適正なサイズに変更
する。例として、カラー画像が入力された場合に、スキ
ュー(傾き)補正や方向判別専用の二値画像と、文字認
識用の二値画像のサイズを変える場合に適用できる。
【0034】そして、画像適正化部301は、画像デー
タの解像度の情報を用いて画像サイズを変更するパラメ
ーターに使用する。画像データのサイズ変更は、画像デ
ータの解像度を変更するだけで画像サイズを変更させる
ことができる。
【0035】例えば、文字認識時には、画像データのサ
イズを拡大したほうが、文字認識の精度が高くなる向が
ある。概ね200dpi以下のサイズの多値画像データ
が入力された場合は、2倍程度に拡大してから二値化を
おこなうほうが、文字認識の精度がより高いものが得ら
れる。
【0036】また、上記ステップS401における傾き
等の画像データ補正用の処理時に用いる二値化手法と、
ステップS404における文字認識用の二値化手法をそ
れぞれに適した異なる二値化アルゴリズムを用いること
ができる。
【0037】例えば、カラーの画像データが入力された
場合に、スキュー補正や方向判別のための専用の二値化
をおこない、文字認識時には文字認識用の二値化をおこ
なう。スキュー補正や方向判別のための専用の二値化の
例としては、例えばエッジ強調等のフィルタを用いる。
スキューの検出には、直線成分のエッジが有効であるの
で、エッジを強めるフィルタをかけると、スキュー補正
により適した画像が得られる。同様に、罫線を抽出する
のが重要な表の認識処理時にも適用できる。これら、直
線成分の情報が重要な処理に関しては、エッジ強調のフ
ィルタをかけ、他の処理時にはこのエッジ強調のフィル
タをかけないようにして用いる。
【0038】エッジ強調フィルタは、例えばソーベルパ
ラメーターで、 を使用する例がある。
【0039】一方、このようなフィルタを用いない他の
処理例としては、後述するように、スキュー検出時等の
処理では低い解像度の画像データを作って処理をおこな
い、文字認識時の処理では高解像度のままで処理をおこ
なうことがある。すなわち、二値化処理時に、モノクロ
多値(グレー状態)の画像データから縮小した画像デー
タを作って二値化する構成と、グレー状態の画像データ
から拡大した画像データを作成してから二値化する構成
がある。
【0040】二値化された後の画像データに対してサイ
ズを縮小した場合には、すでに濃度情報が失われている
ため、斜め線がぎざぎざな画像になる等の問題が生じる
が、多値の画像データのままで拡大してから二値化する
ことにより、線形補完など比較的単純な方法をとって
も、上記問題が生じにくく、特に文字認識処理の精度向
上に良好な効果が得られるようになる。
【0041】他の例としては、写真や網点部分を認識す
る場合には、逆にエッジをぼかした平滑化された画像を
利用するということが有効となる。これらの各二値化手
法においても、上述した如く、画像データの解像度の情
報に基づき、上記エッジ強調のフィルタのパラメーター
を可変する構成とすることができる。
【0042】図5は、入力された画像データの解像度を
二値化処理内容に応じて変更する処理内容を示すフロー
チャートである。画像適正化部301は、入力された多
値の画像データを画像データの傾斜等の補正に必要な解
像度と比較する。この際、あらかじめ定めた所定の解像
度R1と比較する(ステップS501)。画像データが
この解像度R1より大きかった場合(ステップS50
1:Yes)、画像の傾きや文書の方向を検出するため
に入力画像を縮小した処理画像を作成する(ステップS
502)。一方、画像データがこの解像度R1より小さ
かった場合(ステップS501:No)、縮小画像は作
成せず入力された解像度の画像データを用いる。
【0043】この後、画像の傾き等を検出するための二
値化処理をおこない(ステップS503)、回転等に必
要な補正角度を検出し(ステップS504)、多値の画
像データに対する回転等の補正をおこなう(ステップS
505)。この際、ステップS503にて二値化された
画像データは不要であり破棄する。この後、画像データ
を二値化し(ステップS506)、文字認識処理する
(ステップS507)。
【0044】上記処理における、スキューや文書の方向
の検出、および補正時には、解像度を拡大しても、精度
そのものはそれほど変わらないため、スキュー補正や文
書の方向の判別用に解像度を落とした縮小画像を生成し
て画像データの補正をおこなうことができる。
【0045】上記した画像データの縮小について説明す
ると、装置が1/8に縮小する構成である場合、モノク
ロ、あるいはカラーの多値で400dpiの画像データ
が入力されると、1/8の解像度の50dpi相当に縮
小する処理をおこなう。このような構成時に、異なる解
像度の画像データが入力された場合には、同様に1/8
に縮小する画像データを作成する。これに限らず、縮小
後の画像データを一定(50dpi)とするよう、入力
された画像データが600dpiである場合、縮小率を
入出力の解像度から得て1/12にする構成も考えられ
る。
【0046】このように、画像データに対しての縮小処
理は、入力される大きな解像度の画像データに対する上
記スキューや文書の方向に対する補正のための処理時間
の高速化(効率化)のために実行される。ここで、縮小
される画像データのサイズは、最も頻繁に使用されるカ
ラー画像の解像度(例えば200dpi)に対応して設
定しておくことができる。この場合、カラーの600d
piの画像データが入力されるとき、200dpi相当
に縮小する構成にすれば、画像処理のアルゴリズム上、
および処理速度の面の双方で有効な効果が得られる。
【0047】図6は、入力された画像データの解像度を
二値化処理内容に応じて変更する処理内容を示す他のフ
ローチャートである。以下の処理は、入力された多値の
画像データが文字認識に必要な所定解像度R2より小さ
かった場合に有効である。
【0048】多値画像が入力されると、画像適正化部3
01は、入力された画像データを傾きや方向の検出用に
二値化する(ステップS601)。次に、画像データの
傾きや文書の方向を検出する(ステップS602)。そ
して、この検出結果に基づき画像データの傾きや文書の
方向が一定となるようこの画像データを回転させ補正す
る(ステップS603)。この後、ステップS601に
て二値化された画像データは不要であり破棄する。
【0049】次に、画像データが文字認識に適した所定
のサイズ(解像度)であるか判断する(ステップS60
4)。画像データがあらかじめ定めた解像度R2より小
さい場合には(ステップS604:Yes)、拡大(解
像度を向上)させた画像データを作成する(ステップS
605)。一方、画像データがこの解像度R2より大き
い場合(ステップS604:No)、拡大画像は作成せ
ず入力された解像度の画像データを用いる。この後、画
像データを二値化し(ステップS606)、文字認識処
理する(ステップS607)。
【0050】上記の処理によれば、画像の傾きや文書の
方向の検出および補正時には、入力された画像データの
解像度を落とさずに画像データを補正し、文字認識をお
こなう際には、画像データの解像度が一定以上となるよ
う入力された画像データを拡大処理して文字認識をおこ
なう。文字認識時には、入力された画像データの大きさ
(解像度)が小さい場合に比して、大きいほうが精度が
高くなる傾向があることは前述した。概ね入力される画
像データの解像度が200dpi以下の多値画像である
場合には、2倍程度に拡大してから二値化をおこなうほ
うが、文字認識精度を高精度化できる。
【0051】図7は、入力された画像データの解像度を
二値化処理内容に応じて変更する処理内容を示す他のフ
ローチャートである。この処理では、上述した図5,図
6の各処理を組み合わせた内容である。
【0052】画像適正化部301は、入力された多値の
画像データを画像データの傾斜等の補正に必要な解像度
と比較する。この際、あらかじめ定めた所定の解像度R
1と比較する(ステップS701)。画像データがこの
解像度R1より大きかった場合(ステップS701:Y
es)、画像の傾きや文書の方向を検出するために入力
画像を縮小した処理画像を作成する(ステップS70
2)。一方、画像データがこの解像度R1より小さかっ
た場合(ステップS701:No)、縮小画像は作成せ
ず入力された解像度の画像データを用いる。
【0053】この後、画像の傾き等を検出するための二
値化処理をおこない(ステップS703)、回転等に必
要な補正角度を検出し(ステップS704)、多値の画
像データに対する回転等の補正をおこなう(ステップS
705)。この際、ステップS703にて二値化された
画像データは不要であり破棄する。
【0054】次に、画像データが文字認識に適した所定
のサイズ(解像度)であるか判断する(ステップS70
6)。画像データがあらかじめ定めた解像度R2より小
さい場合には(ステップS706:Yes)、拡大(解
像度を向上)させた画像データを作成する(ステップS
707)。一方、画像データがこの解像度R2より大き
い場合(ステップS706:No)、拡大画像は作成せ
ず入力された解像度の画像データを用いる。この後、画
像データを二値化し(ステップS708)、文字認識処
理する(ステップS709)。
【0055】上記処理によれば、入力された画像データ
を、スキューや文書の方向の検出および補正時と、文字
認識時に、それぞれ適した大きさ(解像度)にして画像
処理することができる。これにより、スキューや文書の
方向の検出、補正時には画像データの大きさに応じて解
像度を縮小可能とし処理の効率化が図れる。加えて、文
字認識をおこなう際には、画像データの解像度が一定以
上となるよう入力された画像データを拡大処理して文字
認識をおこない、文字認識精度を高精度化させることが
できる。
【0056】また、上記説明した画像データの縮小時
に、縮小後の基準解像度を例えば200dpiと定め、
この基準解像度と整数倍の差が生じないように解像度を
変更する構成としてもよい。例えば、入力される画像デ
ータの解像度が600dpiであるときには、この画像
データを1/3に縮小し200dpiにする。この場
合、250dpiの画像データが入力されたときには、
画像はそのままの250dpiで用い、解像度に整数倍
(2倍以上)の差を出さない。また、例えば、110d
piの画像データが入力されたときには、画像を2倍
(220dpi)に拡大させる。
【0057】このように、基準解像度を設定した場合で
も、縮小後の解像度に幅を持たせ、全てを200dpi
に揃えない構成にする。縮小の処理を整数倍で実行する
ことにより、縮小を高速におこなえるようになる。例え
ば、205dpiの画像データが入力されたときに、こ
れを200dpiに変更しても性能自体が大きく変化し
ないため、この場合には縮小処理を実行しない。これに
より、縮小処理にかかる余分な実行時間を削減でき、全
体の処理効率を向上できるようになる。なお、文字認識
時における画像データの拡大処理についても同様に基準
解像度を設定しておき、この基準解像度を基準として所
定の範囲の拡大を許容する構成についても同様に実行で
きる。
【0058】なお、本実施の形態で説明した文字認識方
法は、あらかじめ用意されたプログラムをパーソナルコ
ンピュータやワークステーション等のコンピュータで実
行することにより実現することができる。このプログラ
ムは、ハードディスク、フロッピー(R)ディスク、C
D−ROM、MO、DVD等のコンピュータで読み取り
可能な記録媒体に記録され、コンピュータによって記録
媒体から読み出されることによって実行される。またこ
のプログラムは、上記記録媒体を介して、インターネッ
ト等のネットワークを介して配布することができる。
【0059】以上説明した本発明は、文字認識(OC
R)機能を有するパーソナルコンピュータ等の各種装置
に適用することができるほかに、ファイリング装置や、
FAX配信装置などにも適用して同様の効果を得ること
ができる。
【0060】
【発明の効果】以上説明したように、請求項1に記載の
発明によれば、入力される画像データの傾きや文書の方
向を検出し補正した後に文字認識をおこなう文字認識方
法において、画像データの傾きや文書の方向を検出し補
正するときと、画像データの文字認識をおこなうとき
に、前記画像データをそれぞれの処理に適したサイズに
変更させる画像適正化工程を備えたので、傾きや文書の
方向を検出し補正するための画像データと、文字認識を
おこなう画像データは、それぞれに適した画像サイズに
変更可能であり、各処理の効率化を図ることができると
いう効果を奏する。
【0061】また、請求項2に記載の発明によれば、入
力される画像データの傾きや文書の方向を検出し補正し
た後に文字認識をおこなう文字認識方法において、画像
データの傾きや文書の方向を検出し補正するときと、画
像データの文字認識をおこなうときに、前記画像データ
をそれぞれの処理に適した二値化アルゴリズムに変更し
て二値化処理する画像適正化工程を備えたので、画像デ
ータの傾きや方向の検出用に適した二値化と、文字認識
用に適した二値化処理を選択することができ、各処理の
効率化を図ることができるという効果を奏する。
【0062】また、請求項3に記載の発明によれば、請
求項1,2のいずれか一つに記載の発明において、前記
画像適正化工程は、前記画像データが有する解像度の情
報を用いて、画像データに対する前記変更処理を実行す
ることとしたので、入力される画像データの解像度に基
づき、画像データの傾きや文書の方向の検出用、あるい
は文字認識用に適した画像サイズと、二値化アルゴリズ
ムをそれぞれ選択することができ、これら画像データの
傾きの補正と、文字認識にかかる処理の効率化を図るこ
とができるという効果を奏する。
【0063】また、請求項4に記載の発明によれば、請
求項1〜3のいずれか一つに記載の発明において、前記
画像適正化工程は、入力される画像データがあらかじめ
定めた所定の解像度(R1)より大きい場合、前記画像
の傾きや文書の方向を検出し補正する際に該画像データ
を縮小処理した画像データを用い、前記文字認識をおこ
なう際には、前記縮小処理前の画像データを用いること
としたので、入力される画像データが所定の解像度(R
1)より大きい場合に、縮小した画像データを用いて画
像の傾きや文書の方向を検出し補正する処理の効率化を
図ることができる一方、文字認識時には縮小処理前の画
像データを用いて文字認識の高精度化を図ることができ
るという効果を奏する。
【0064】また、請求項5に記載の発明によれば、請
求項1〜3のいずれか一つに記載の発明において、前記
画像適正化工程は、入力される画像データがあらかじめ
定めた所定の解像度(R2)より小さい場合、前記画像
の傾きや文書の方向を検出し補正する際に該入力された
画像データを用い、前記文字認識をおこなう際には、前
記入力された画像データを拡大処理した画像データを用
いることとしたので、入力される画像データが所定の解
像度(R2)より小さい場合に、この画像データを用い
て画像の傾きや文書の方向を検出し補正する処理の効率
化を図ることができる一方、文字認識時には拡大した画
像データを用いて文字認識の高精度化を図ることができ
るという効果を奏する。
【0065】また、請求項6に記載の発明によれば、請
求項1〜3のいずれか一つに記載の発明において、前記
画像適正化工程は、前記画像の傾きや文書の方向を検出
し補正する際に、入力される画像データがあらかじめ定
めた所定の解像度(R1)より大きい場合には、該画像
データを縮小処理した画像データを用い、前記文字認識
をおこなう際に、入力される画像データがあらかじめ定
めた所定の解像度(R2)より小さい場合には、前記入
力された画像データを拡大処理した画像データを用いる
こととしたので、入力される画像データが所定の解像度
(R1)より大きい場合、縮小した画像データを用いて
画像の傾きや文書の方向を検出し補正する処理の効率化
を図ることができるとともに、文字認識時にはこの画像
データが所定の解像度(R2)より小さい場合、拡大し
た画像データを用いて文字認識の高精度化を図ることが
できるという効果を奏する。
【0066】また、請求項7に記載の発明によれば、入
力される画像データの傾きや文書の方向を検出し補正し
た後に文字認識をおこなう文字認識装置において、画像
データの傾きや文書の方向を検出し補正するときと、画
像データの文字認識をおこなうときに、前記画像データ
をそれぞれの処理に適したサイズに変更させる画像適正
化手段を備えたので、傾きや文書の方向を検出し補正す
るための画像データと、文字認識をおこなう画像データ
は、それぞれに適した画像サイズに変更可能であり、各
処理の効率化を図ることができるという効果を奏する。
【0067】また、請求項8に記載の発明によれば、前
記請求項1〜6のいずれか一つに記載された方法をコン
ピュータに実行させることとしたので、コンピュータを
用いて画像データの傾きや文書の方向の検出および補正
と、文字認識処理を実行でき、文字認識処理にかかるパ
フォーマンスの向上を図ることができるという効果を奏
する。
【0068】また、請求項9に記載の発明によれば、請
求項8に記載されたプログラムを記録したので、そのプ
ログラムをコンピュータ読み取り可能となり、これによ
って請求項8の動作をコンピュータによって実現するこ
とができるという効果を奏する。
【図面の簡単な説明】
【図1】この発明の本実施の形態にかかる文字認識装置
のハード構成を示すブロック図である。
【図2】この発明の本実施の形態にかかる文字認識装置
の主要な構成部を示す機能ブロック図である。
【図3】この発明の本実施の形態にかかる文字認識装置
を構成する各部における画像データの流れを示す工程図
である。
【図4】この発明の本実施の形態にかかる文字認識処理
の概要を示すフローチャートである。
【図5】この発明の本実施の形態にかかる文字認識処理
の画像データの傾き等の検出時における画像データの縮
小処理手順を示すフローチャートである。
【図6】この発明の本実施の形態にかかる文字認識処理
の文字認識時における画像データの拡大処理手順を示す
フローチャートである。
【図7】この発明の本実施の形態にかかる文字認識処理
の画像データの傾き等の検出時と文字認識時における画
像データの縮小および拡大処理手順を示すフローチャー
トである。
【図8】従来の文字認識の処理手順を示すフローチャー
トである。
【符号の説明】
100 文字認識装置 101 スキャナ 102 ディスプレイ 103 印字装置 104 画像メモリ 105 CPU 106 ROM 107 RAM 108 OCR辞書 201 補正角度検出部 202 画像回転部 203 二値化部 204 サイズ変更部 301 画像適正化部 302 多値画像補正部 303 文字認識部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力される画像データの傾きや文書の方
    向を検出し補正した後に文字認識をおこなう文字認識方
    法において、 画像データの傾きや文書の方向を検出し補正するとき
    と、画像データの文字認識をおこなうときに、前記画像
    データをそれぞれの処理に適したサイズに変更させる画
    像適正化工程を備えたことを特徴とする文字認識方法。
  2. 【請求項2】 入力される画像データの傾きや文書の方
    向を検出し補正した後に文字認識をおこなう文字認識方
    法において、 画像データの傾きや文書の方向を検出し補正するとき
    と、画像データの文字認識をおこなうときに、前記画像
    データをそれぞれの処理に適した二値化アルゴリズムに
    変更して二値化処理する画像適正化工程を備えたことを
    特徴とする文字認識方法。
  3. 【請求項3】 前記画像適正化工程は、 前記画像データが有する解像度の情報を用いて、画像デ
    ータに対する前記変更処理を実行することを特徴とする
    請求項1,2のいずれか一つに記載の文字認識方法。
  4. 【請求項4】 前記画像適正化工程は、 入力される画像データがあらかじめ定めた所定の解像度
    (R1)より大きい場合、 前記画像の傾きや文書の方向を検出し補正する際に該画
    像データを縮小処理した画像データを用い、 前記文字認識をおこなう際には、前記縮小処理前の画像
    データを用いることを特徴とする請求項1〜3のいずれ
    か一つに記載の文字認識方法。
  5. 【請求項5】 前記画像適正化工程は、 入力される画像データがあらかじめ定めた所定の解像度
    (R2)より小さい場合、 前記画像の傾きや文書の方向を検出し補正する際に該入
    力された画像データを用い、 前記文字認識をおこなう際には、前記入力された画像デ
    ータを拡大処理した画像データを用いることを特徴とす
    る請求項1〜3のいずれか一つに記載の文字認識方法。
  6. 【請求項6】 前記画像適正化工程は、 前記画像の傾きや文書の方向を検出し補正する際に、入
    力される画像データがあらかじめ定めた所定の解像度
    (R1)より大きい場合には、該画像データを縮小処理
    した画像データを用い、 前記文字認識をおこなう際に、入力される画像データが
    あらかじめ定めた所定の解像度(R2)より小さい場合
    には、前記入力された画像データを拡大処理した画像デ
    ータを用いることを特徴とする請求項1〜3のいずれか
    一つに記載の文字認識方法。
  7. 【請求項7】 入力される画像データの傾きや文書の方
    向を検出し補正した後に文字認識をおこなう文字認識装
    置において、 画像データの傾きや文書の方向を検出し補正するとき
    と、画像データの文字認識をおこなうときに、前記画像
    データをそれぞれの処理に適したサイズに変更させる画
    像適正化手段を備えたことを特徴とする文字認識装置。
  8. 【請求項8】 前記請求項1〜6のいずれか一つに記載
    された方法をコンピュータに実行させることを特徴とす
    るプログラム。
  9. 【請求項9】 前記請求項8に記載されたプログラムを
    記録したことを特徴とするコンピュータ読み取り可能な
    記録媒体。
JP2002001749A 2002-01-08 2002-01-08 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JP2003203205A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002001749A JP2003203205A (ja) 2002-01-08 2002-01-08 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002001749A JP2003203205A (ja) 2002-01-08 2002-01-08 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2003203205A true JP2003203205A (ja) 2003-07-18

Family

ID=27641801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002001749A Pending JP2003203205A (ja) 2002-01-08 2002-01-08 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2003203205A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007336143A (ja) * 2006-06-14 2007-12-27 Ricoh Co Ltd 画像処理装置
JP2013527513A (ja) * 2010-03-10 2013-06-27 マイクロソフト コーポレーション 光学文字認識されるテキスト画像のテキスト解像度の改善方法及びシステム
CN116503880A (zh) * 2023-06-29 2023-07-28 武汉纺织大学 一种倾斜字体的英文字符识别方法和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007336143A (ja) * 2006-06-14 2007-12-27 Ricoh Co Ltd 画像処理装置
JP2013527513A (ja) * 2010-03-10 2013-06-27 マイクロソフト コーポレーション 光学文字認識されるテキスト画像のテキスト解像度の改善方法及びシステム
CN116503880A (zh) * 2023-06-29 2023-07-28 武汉纺织大学 一种倾斜字体的英文字符识别方法和系统
CN116503880B (zh) * 2023-06-29 2023-10-31 武汉纺织大学 一种倾斜字体的英文字符识别方法和系统

Similar Documents

Publication Publication Date Title
US7430065B2 (en) Method and system for correcting distortions in image data scanned from bound originals
US8139897B2 (en) Detecting tilt in an image having different resolutions in different directions
US6798906B1 (en) Image processing apparatus and method including line segment data extraction
JP4339925B2 (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
US6771842B1 (en) Document image skew detection method
JP2003259110A (ja) 画像結合装置、その方法、プログラム
JP4565396B2 (ja) 画像処理装置および画像処理プログラム
JP2003203205A (ja) 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008259172A (ja) 画像処理装置、画像処理方法およびプログラム
JP2004129022A (ja) 画像読取装置
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP5821994B2 (ja) 画像処理装置、画像形成装置およびプログラム
JP2005051383A (ja) 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム
KR100350854B1 (ko) 이진 영상 회전 시스템 및 그 방법
JP3604909B2 (ja) 画像間位置合わせ方法
JP4261922B2 (ja) 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体
JP2000261653A (ja) 画像処理装置
JP2007328652A (ja) 画像処理装置および画像処理プログラム
CN110569847B (zh) 一种文字倾斜角度确定方法、文字倾斜纠正方法和计算机
JP4517288B2 (ja) 画像処理装置、画像処理方法及びそのプログラム
JP2007221838A (ja) 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム
JP4136860B2 (ja) 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム
JP3605773B2 (ja) 画像領域判別装置
JP4517287B2 (ja) 画像処理装置、画像処理方法及びそのプログラム
JP2004088499A (ja) 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040712

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070410

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070814