JPH1196298A - 文字認識装置及びその方法 - Google Patents

文字認識装置及びその方法

Info

Publication number
JPH1196298A
JPH1196298A JP9258989A JP25898997A JPH1196298A JP H1196298 A JPH1196298 A JP H1196298A JP 9258989 A JP9258989 A JP 9258989A JP 25898997 A JP25898997 A JP 25898997A JP H1196298 A JPH1196298 A JP H1196298A
Authority
JP
Japan
Prior art keywords
character recognition
document image
image
tilt angle
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9258989A
Other languages
English (en)
Inventor
Kitahiro Kaneda
北洋 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP9258989A priority Critical patent/JPH1196298A/ja
Publication of JPH1196298A publication Critical patent/JPH1196298A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文字認識対象の原稿画像を入力する場合に、
その入力した原稿画像の傾斜角補正を効率的に実行する
ことできる文字認識装置及びその方法を提供する。 【解決手段】 入力された原稿画像の傾斜角を傾斜角検
出部108で検出する。原稿画像の傾斜角が検出不可能
な場合、該原稿画像から被傾斜角検出対象画像を手動傾
斜角検出領域設定部110で指定する。傾斜角検出部1
08で検出された傾斜角、あるいは手動傾斜角検出領域
設定部110で指定された被傾斜角検出対象画像から検
出される傾斜角に基づいて原稿画像の傾斜を画像補正部
112で補正する。傾斜補正された原稿画像に対し文字
認識を文字認識部114で実行する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された原稿画
像の文字認識を実行する文字認識装置及びその方法に関
するものである。
【0002】
【従来の技術】一般に文字認識の前処理で最も重要なプ
ロセスは、取得された原稿画像の傾斜補正である。即
ち、現行画像中の入力文字図形が傾くなどして本来の形
状から回転変形してしまうと、その文字の認識率は大幅
に低下してしまう。そのため、文字認識の前には、必ず
原稿画像の傾斜角を検出し、それに基づいて傾きを補正
するという作業が必要となってくる。
【0003】通常は、この作業は自動的に行われること
が多いが、これが不可能な場合がある。そもそも、この
傾斜角自動検出の原理は、図6に示すように原稿画像上
の所定の2領域の横方向の濃度ヒストグラムを取り、そ
のピークから求まる上下方向の距離と、検出領域間の水
平距離より傾斜角を算出している。従って、この2領域
にまたがるような水平文字行、あるいは水平ライン等が
存在する場合は問題無いが、そういう対象物がない場
合、あるいはあってもノイズなどによりヒストグラムが
正常に取得できない場合は、傾斜角を求めることが不可
能となってしまう。このような場合、従来はユーザーに
手動で任意の行に沿うように図7に示すような検出ライ
ンを引かせ、それに基づき傾斜角を算出し、補正してい
た。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の文字認識装置では、ユーザー自信が目視で一次元的
な検出ラインを引かなければならないので、操作しづら
く、また、その設定も不正確になりがちであった。
【0005】本発明は上記の問題点に鑑みてなされたも
のであり、文字認識対象の原稿画像を入力する場合に、
その入力した原稿画像の傾斜角補正を効率的に実行する
ことできる文字認識装置及びその方法を提供することを
目的とする。
【0006】
【課題を解決するための手段】上記の目的を達成するた
めの本発明による文字認識装置は以下の構成を備える。
即ち、入力された原稿画像の文字認識を実行する文字認
識装置であって前記入力された原稿画像の傾斜角を検出
する検出手段と、前記検出手段で前記原稿画像の傾斜角
が検出不可能な場合、該原稿画像から被傾斜角検出対象
画像を指定する指定手段と、前記検出手段で検出された
傾斜角、あるいは前記指定手段で指定された被傾斜角検
出対象画像から検出される傾斜角に基づいて前記原稿画
像の傾斜を補正する補正手段と、前記補正手段で傾斜補
正された原稿画像に対し文字認識を実行する文字認識手
段とを備える。
【0007】また、好ましくは、前記指定手段は、ユー
ザーによって指定される。
【0008】また、好ましくは、前記指定手段は、前記
原稿画像から被傾斜角検出対象画像を矩形で指定する。
【0009】また、好ましくは、前記指定手段は、前記
原稿画像から複数の被傾斜角検出対象画像を指定する。
【0010】また、好ましくは、前記指定手段は、ポイ
ンティングデバイスである。
【0011】また、好ましくは、前記指定手段は、キー
ボードである。
【0012】また、好ましくは、前記検出手段で前記原
稿画像の傾斜角が検出不可能な場合、その旨をユーザに
報知する。
【0013】上記の目的を達成するための本発明による
文字認識方法は以下の構成を備える。即ち、入力された
原稿画像の文字認識を実行する文字認識方法であって前
記入力された原稿画像の傾斜角を検出する検出工程と、
前記検出工程で前記原稿画像の傾斜角が検出不可能な場
合、該原稿画像から被傾斜角検出対象画像を指定する指
定工程と、前記検出工程で検出された傾斜角、あるいは
前記指定工程で指定された被傾斜角検出対象画像から検
出される傾斜角に基づいて前記原稿画像の傾斜を補正す
る補正工程と、前記補正工程で傾斜補正された原稿画像
に対し文字認識を実行する文字認識工程とを備える。
【0014】上記の目的を達成するための本発明による
コンピュータ可読メモリは以下の構成を備える。即ち、
入力された原稿画像の文字認識を実行する文字認識のプ
ログラムコードが格納されたコンピュータ可読メモリで
あって前記入力された原稿画像の傾斜角を検出する検出
工程のプログラムコードと、前記検出工程で前記原稿画
像の傾斜角が検出不可能な場合、該原稿画像から被傾斜
角検出対象画像を指定する指定工程のプログラムコード
と、前記検出工程で検出された傾斜角、あるいは前記指
定工程で指定された被傾斜角検出対象画像から検出され
る傾斜角に基づいて前記原稿画像の傾斜を補正する補正
工程のプログラムコードと、前記補正工程で傾斜補正さ
れた原稿画像に対し文字認識を実行する文字認識工程の
プログラムコードとを備える。
【0015】
【発明の実施の形態】以下、図面を参照して本発明の好
適な実施形態を詳細に説明する。
【0016】図1は本発明の実施形態の文字認識装置を
実現する情報処理装置の構成を示すブロック図である。
【0017】図1において、CPU1はメインバス7を
介して情報処理装置10全体の制御を実行するととも
に、情報処理装置10の外部に接続される入力装置11
(例えば、イメージスキャナ、記憶装置、ネットワーク
回線を介して接続される他の情報処理装置、電話回線を
介して接続されるファクシミリ等)を入力I/F(印あ
フェース)4を介して制御する。また、情報処理装置1
0の外部に接続される出力装置12(例えば、プリン
タ、モニタ、ネットワーク回線を介して接続される他の
情報処理装置、電話回線を介して接続されるファクシミ
リ等)5を介して制御する。また、CPU1は、KBD
I/F(キーボードインタフェース)6を介して入力部
(例えば、キーボード23やポインティングデバイス2
4やペン25)から入力された指示に従って、画像の入
力、画像処理、色変換処理、画像の出力制御等の一連の
処理を実行する。更に、入力装置11より入力された画
像データや、キーボード3やポインティングデバイス2
4やペン25を用いて作成された画像データを表示する
表示部30をビデオI/F(インタフェース)28を介
して制御する。
【0018】ROM2は、CPU1の各種制御を実行す
る各種制御プログラムを記憶している。RAM3は、C
PU1によりOSや本発明を実現するための制御プログ
ラムを含むその他の制御プログラムがロードされ実行さ
れる。また、制御プログラムを実行するために用いられ
る各種作業領域、一時待避領域として機能する。また、
入力装置11より入力された画像データや、キーボード
23やポインティングデバイス24やペン25を用いて
作成された画像データを、一旦、保持するVRAM(不
図示)が構成されている。
【0019】次に、本実施形態の文字認識装置の機能構
成について、図2を用いて説明する。
【0020】図2は本発明の実施形態の文字認識装置の
機能構成を示すブロック図である。図2において、10
4は原稿画像を格納する画像メモリである。30は原稿
画像を表示するための表示部である。108は画像メモ
リ104内の原稿画像の傾斜角を所定の領域で検出する
傾斜角検出部である。110は手動で傾斜角の検出領域
を設定するための手動傾斜角検出領域設定部である。1
12は傾斜角検出部108で検出された傾斜角に基づい
て画像メモリ104内の原稿画像を回転して補正する画
像補正部である。114は補正された原稿画像を使って
文字認識を行う文字認識部である。
【0021】次に、本実施形態の文字認識装置で実行さ
れる動作について、図2を用いて説明する。
【0022】画像読み取り装置、あるいはファイルなど
から取得された原稿画像は先ず、画像メモリ104に記
録される。次に、取得された原稿画像の確認のため画像
メモリ104から原稿画像を読み出し表示部30に表示
する。その後、ユーザーの指示で自動傾斜角検出、補正
を、傾斜角検出部108及び画像補正部114にて行
う。ここで、何等問題無く処理を終えた場合は、その結
果を表示部30に更新表示する。一方、傾斜角検出部1
08で傾斜角検出不能と判断された場合は、表示部30
と手動傾斜角検出領域設定部110により、手動で傾斜
角検出領域を設定し、その後、傾斜角検出を行う。そし
て、その傾斜角検出結果を画像補正部112に渡す。
【0023】手動傾斜角検出領域設定部110の動作の
詳細については、後述する。画像補正部112では検出
された傾斜角に基づき、画像メモリ104内の原稿画像
を回転させ、その傾斜を補正し、表示部30に更新表示
する。補正された原稿画像は文字認識部114に送ら
れ、文字認識が実行される。
【0024】次に、手動傾斜角検出領域設定部110で
実行される動作について、図3を用いて説明する。
【0025】図3は本発明の実施形態の手動傾斜角領域
設定部で実行される動作を示すフローチャートである。
【0026】まず、ステップS401で、画像メモリ1
04から原稿画像を入力する。次に、ステップ402
で、傾斜角を検出する。尚、通常、傾斜角検出領域は予
め画面上に複数個設定される。
【0027】ステップ404で、正常に傾斜角が検出で
きたか否かを判定する。正常に傾斜角が検出できなかっ
た場合(ステップS404でNO)、即ち、傾斜角検出
領域が不適当な場合、ステップS406へ進む。ステッ
プ406で、ユーザーに手動で傾斜角検出領域を設定す
るよう促す警告を発生する。次に、ステップ408で、
実際に、例えば、表示部30に表示されている原稿画像
を見ながらマウスなどのポインティングデバイスをドラ
ッグし、例えば、図4に示すような、視覚的に傾斜角を
検出しやすい領域を2次元的に指定する。
【0028】一方、正常に傾斜角が検出できた場合(ス
テップS404でYES)、ステップS410へ進む。
ステップ410で、検出結果に基づいて原稿画像を回転
させ傾斜の補正を行う。
【0029】尚、上記実施形態では、手動で傾斜角検出
領域を設定する場合、図4に示したように単一の領域を
指定していたが、何もこれに限定されるものではない。
例えば、図5に示すように、複数個の傾斜角検出領域を
指定しても良い。
【0030】また、傾斜角検出領域設定部110での設
定は、マウスなどのポインティングデバイスを使用して
行ったが、何もこれに限定されることはなく、キーボー
ドを使用して行ってもよい。
【0031】以上説明したように、本実施形態によれ
ば、予め設定された領域で原稿画像の傾斜角検出が不可
能な場合、ユーザー自信が傾斜角を検出できそうな領域
を目視で確認し、マウスなどをドラッグして領域指定す
るだけで、簡単に傾斜補正が可能となる。
【0032】また、ユーザーはその領域を指定するだけ
で実際の傾斜角検出は装置が行うので、精度も従来の手
動傾斜補正と比較して遙かに高いものとなり、より快適
な文字認識を実現することができる。
【0033】尚、本発明は、複数の機器(例えばホスト
コンピュータ、インタフェース機器、リーダ、プリンタ
など)から構成されるシステムに適用しても、一つの機
器からなる装置(例えば、複写機、ファクシミリ装置な
ど)に適用してもよい。
【0034】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0035】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0036】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−R、磁気テープ、不揮発性のメモリカード、ROMな
どを用いることができる。
【0037】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0038】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれることは言うまでもない。
【0039】
【発明の効果】以上説明したように、本発明によれば、
文字認識対象の原稿画像を入力する場合に、その入力し
た原稿画像の傾斜角補正を効率的に実行することできる
文字認識装置及びその方法を提供できる。
【0040】
【図面の簡単な説明】
【図1】本発明の実施形態の文字認識装置を実現する情
報処理装置の構成を示すブロック図である。
【図2】本発明の実施形態の文字認識装置の機能構成を
示すブロック図である。
【図3】本発明の実施形態の手動傾斜角領域設定部で実
行される動作を示すフローチャートである。
【図4】本発明の実施形態の手動傾斜角補正を説明する
ための図である。
【図5】本発明の実施形態の手動傾斜角補正を説明する
ための図である。
【図6】従来の傾斜角検出を説明するための図である。
【図7】従来の手動傾斜角補正を説明するための図であ
る。
【符号の説明】
30 表示部 104 画像メモリ 108 傾斜角検出部 110 手動傾斜角検出領域設定部 112 画像補正部 114 文字認識部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 入力された原稿画像の文字認識を実行す
    る文字認識装置であって前記入力された原稿画像の傾斜
    角を検出する検出手段と、 前記検出手段で前記原稿画像の傾斜角が検出不可能な場
    合、該原稿画像から被傾斜角検出対象画像を指定する指
    定手段と、 前記検出手段で検出された傾斜角、あるいは前記指定手
    段で指定された被傾斜角検出対象画像から検出される傾
    斜角に基づいて前記原稿画像の傾斜を補正する補正手段
    と、 前記補正手段で傾斜補正された原稿画像に対し文字認識
    を実行する文字認識手段とを備えることを特徴とする文
    字認識装置。
  2. 【請求項2】 前記指定手段は、ユーザーによって指定
    されることを特徴とする請求項1に記載の文字認識装
    置。
  3. 【請求項3】 前記指定手段は、前記原稿画像から被傾
    斜角検出対象画像を矩形で指定することを特徴とする請
    求項1に記載の文字認識装置。
  4. 【請求項4】 前記指定手段は、前記原稿画像から複数
    の被傾斜角検出対象画像を指定することを特徴とする請
    求項1に記載の文字認識装置。
  5. 【請求項5】 前記指定手段は、ポインティングデバイ
    スであることを特徴とする請求項1に記載の文字認識装
    置。
  6. 【請求項6】 前記指定手段は、キーボードであること
    を特徴とする請求項1に記載の文字認識装置。
  7. 【請求項7】 前記検出手段で前記原稿画像の傾斜角が
    検出不可能な場合、その旨をユーザに報知することを特
    徴とする請求項1に記載の文字認識装置。
  8. 【請求項8】 入力された原稿画像の文字認識を実行す
    る文字認識方法であって前記入力された原稿画像の傾斜
    角を検出する検出工程と、 前記検出工程で前記原稿画像の傾斜角が検出不可能な場
    合、該原稿画像から被傾斜角検出対象画像を指定する指
    定工程と、 前記検出工程で検出された傾斜角、あるいは前記指定工
    程で指定された被傾斜角検出対象画像から検出される傾
    斜角に基づいて前記原稿画像の傾斜を補正する補正工程
    と、 前記補正工程で傾斜補正された原稿画像に対し文字認識
    を実行する文字認識工程とを備えることを特徴とする文
    字認識方法。
  9. 【請求項9】 前記指定工程は、前記原稿画像から被傾
    斜角検出対象画像を矩形で指定することを特徴とする請
    求項8に記載の文字認識方法。
  10. 【請求項10】 前記指定工程は、前記原稿画像から複
    数の被傾斜角検出対象画像を指定することを特徴とする
    請求項8に記載の文字認識方法。
  11. 【請求項11】 前記検出工程で前記原稿画像の傾斜角
    が検出不可能な場合、その旨をユーザに報知することを
    特徴とする請求項8に記載の文字認識方法。
  12. 【請求項12】 入力された原稿画像の文字認識を実行
    する文字認識のプログラムコードが格納されたコンピュ
    ータ可読メモリであって前記入力された原稿画像の傾斜
    角を検出する検出工程のプログラムコードと、前記検出
    工程で前記原稿画像の傾斜角が検出不可能な場合、該原
    稿画像から被傾斜角検出対象画像を指定する指定工程の
    プログラムコードと、 前記検出工程で検出された傾斜角、あるいは前記指定工
    程で指定された被傾斜角検出対象画像から検出される傾
    斜角に基づいて前記原稿画像の傾斜を補正する補正工程
    のプログラムコードと、 前記補正工程で傾斜補正された原稿画像に対し文字認識
    を実行する文字認識工程のプログラムコードとを備える
    ことを特徴とするコンピュータ可読メモリ。
JP9258989A 1997-09-24 1997-09-24 文字認識装置及びその方法 Withdrawn JPH1196298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9258989A JPH1196298A (ja) 1997-09-24 1997-09-24 文字認識装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9258989A JPH1196298A (ja) 1997-09-24 1997-09-24 文字認識装置及びその方法

Publications (1)

Publication Number Publication Date
JPH1196298A true JPH1196298A (ja) 1999-04-09

Family

ID=17327818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9258989A Withdrawn JPH1196298A (ja) 1997-09-24 1997-09-24 文字認識装置及びその方法

Country Status (1)

Country Link
JP (1) JPH1196298A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017059990A (ja) * 2015-09-16 2017-03-23 富士ゼロックス株式会社 画像読取装置および画像形成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017059990A (ja) * 2015-09-16 2017-03-23 富士ゼロックス株式会社 画像読取装置および画像形成装置

Similar Documents

Publication Publication Date Title
US20090051946A1 (en) Image area selecting method
US8422796B2 (en) Image processing device
JPH03144863A (ja) 画像の傾き検出方法および補正方法ならびに画像情報処理装置
US7068855B2 (en) System and method for manipulating a skewed digital image
US20190286383A1 (en) Image processing apparatus, image processing method, and storage medium
US20130050243A1 (en) Image display apparatus and control method thereof
JPH096914A (ja) 画像処理方法及び装置
US6718070B2 (en) Device and method for detecting subject inclination
US11233911B2 (en) Image processing apparatus and non-transitory computer readable medium for image processing
JPH1196298A (ja) 文字認識装置及びその方法
JPH1196299A (ja) 文字認識装置及びその方法
JP2000181988A (ja) 光学文字読取装置
JP2002109470A (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2006350967A (ja) 画像処理装置、方法及びプログラム
JPH0490083A (ja) 文字認識装置
JPH08161424A (ja) 画像処理方法および装置
JP4366149B2 (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP3103100B2 (ja) 領域指定方法及び装置
JPH10191026A (ja) 画像処理装置及びその方法
JP2000165639A (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
JPH1055431A (ja) 画像処理装置
JP2005149114A (ja) 画像傾き検出方法、装置、プログラム、記憶媒体および画像傾き補正方法、装置、プログラム並びに記録媒体
JP2771959B2 (ja) 画像処理方法
JP2005196563A (ja) 傾き補正装置、傾き補正方法、プログラムおよび記録媒体
JP2002157573A (ja) 図面ファイルの傾き補正方法、ファイリング方法及びそのプログラムを記憶してなる媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20041207