JPH04288691A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH04288691A
JPH04288691A JP3052766A JP5276691A JPH04288691A JP H04288691 A JPH04288691 A JP H04288691A JP 3052766 A JP3052766 A JP 3052766A JP 5276691 A JP5276691 A JP 5276691A JP H04288691 A JPH04288691 A JP H04288691A
Authority
JP
Japan
Prior art keywords
point
character string
image
rectangular area
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3052766A
Other languages
English (en)
Inventor
Takeshi Furuto
健 古戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP3052766A priority Critical patent/JPH04288691A/ja
Publication of JPH04288691A publication Critical patent/JPH04288691A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、紙面上などに形成され
た文字列を含む文書画像を読み取り、この読み取った文
書画像から所定の領域を抽出し、この領域中の文字列を
認識する文字認識装置に関する。
【0002】
【従来の技術および発明が解決しようとする課題】従来
から、紙面などに形成した文字列を含む文書画像を光学
的に読み取り、この読み取った文書画像から文字列を切
り出して、この切り出した文字列の認識を行うようにし
て、自動的に文字コード列からなる文書ファイルなどが
作成されるようにした文書入力装置が用いられている。 このような文書入力装置では、文書が形成された原稿な
どを光学的に読み取って得られた文書画像は、一旦画像
メモリに記憶され、この記憶された画像がCRTなどに
表示される。そして、操作者がたとえば装置に付属のマ
ウスなどで入力すべき画像領域の指定を行うと、これに
応答して、当該領域内の文書画像に対して文字認識処理
が施される。
【0003】この文字認識処理ではまず、文書画像の傾
きが検出される。すなわち、光学的に読み取られた文書
画像は、必ずしも文字列が画像メモリにおける行方向や
列方向に沿っているわけではないので、文字の認識を正
しく行うためには、文書画像の傾斜角の検出が必要とな
るのである。上記の傾斜角の検出のための典型的な先行
技術は、たとえば特開平2− 69886号公報に開示
されている。この先行技術では、画像メモリに入力され
た文書画像を複数の傾斜角を設定して各傾斜角ごとに走
査し、各走査線毎に黒画素の数を計数し、この黒画素数
が所定値を超えている走査線数が最大である傾斜角を、
文字列の傾斜角とし決定するものである。しかし、当該
公開公報の記載からも明らかなように、この先行技術の
傾斜角の検出では、処理が極めて繁雑であり、文書入力
処理の高速化が妨げられることは必至であるとともに、
回路構成も複雑になるという問題がある。
【0004】一方、入力すべき画像領域の指定のための
一般的な技術では、CRTに表示された文書画像中で矩
形領域が指定される。この矩形領域の指定は、当該矩形
領域の対角線の両端の頂点をマウスなどの座標入力手段
から指定することよって行われる。しかし、このような
指定方法では、図4に示すように、文書画像21が傾斜
してCRTの表示画面20に表示される場合(すなわち
画像メモリにも傾斜した状態で記憶されている。)には
、2点A,Bの入力により指定できる矩形領域S21は
入力したい文書画像領域から傾斜した状態となる。この
ため、所望の領域の文書画像を矩形領域S21中に含ま
せようとすると、不必要な部分の文書画像まで矩形領域
S21内に入ってしまうという問題がある。この場合に
は、文字認識処理を経て入力された文書中には不必要な
部分が含まれていることになるから、文字認識の後の編
集作業によって、不必要な部分の削除を行わなければな
らず、文書入力作業の作業効率を劣化させることとなる
【0005】そこで、本発明の目的は、上述の技術的課
題を解決し、文書画像の傾斜角の検出が簡単な処理で行
われ、また入力画像領域の指定を良好に行うことができ
るようにして、文書入力作業がより短時間で行われるよ
うにした文字認識装置を提供することである。
【0006】
【課題を解決するための手段】上記の目的を達成するた
めの請求項1記載の文字認識装置は、文字列を含む文書
画像を光学的に読み取る読取手段と、この読取手段で読
み取られた文書画像を記憶する画像記憶手段と、この画
像記憶手段に記憶された文書画像を表示する表示手段と
、この画像記憶手段に記憶された文書画像から任意の矩
形領域の画像を切り出す切出手段と、この切出手段で切
り出された文書画像中の文字列を文字列の傾斜方向に基
づいてコード列に変換する変換手段とを含む文字認識装
置において、上記切出手段に切り出させるべき矩形領域
の隣接する頂点である第1点および第2点を上記表示手
段の表示画面上で指定する第1の指定手段と、上記切出
手段に切り出させるべき矩形領域の上記第1点および第
2点を結ぶ辺の対辺上の点である第3点を上記表示手段
の表示画面上で指定する第2の指定手段と、上記第1点
および第2点の表示画面における座標位置に基づいて、
文字列の傾斜角を検出して上記変換手段に与える傾斜角
検出手段とを含み、上記切出手段は、上記第1点、第2
点および第3点により確定される矩形領域の画像を、上
記画像記憶手段に記憶された文書画像から切り出すもの
であることを特徴とする。
【0007】また、請求項2記載の文字認識装置は、上
記第2の指定手段から入力される第3点は、上記矩形領
域の上記第1点および第2点を結ぶ辺の対辺における一
方端の頂点であることを特徴とする。さらに、請求項3
記載の文字認識装置は、上記第1点から第2点に向かう
方向を、文字列の方向として検出して上記変換手段に与
える文字列方向検出手段をさらに含むことを特徴とする
ものである。
【0008】
【作用】上記の構成によれば、切出手段で切り出させる
べき矩形領域の隣接する頂点を第1点および第2点とし
て指定し、この第1点および第2点を結ぶ辺の対辺上の
一点を第3点として指定することにより、切り出すべき
矩形領域を確定させるようにしているので、表示手段の
表示画面上で傾斜している矩形領域の指定をも行うこと
ができる。
【0009】また、文書画像の傾斜角は、第1点および
第2点の表示画面における座標位置に基づいて検出され
るので、第1点および第2点を文字列の方向に沿って指
定することにより、正確な文書画像の傾斜角を、第1点
および第2点の各座標位置のみに基づく簡単な処理によ
り検出することができる。さらに、第1点から第2点に
向かう方向を文字列の方向として検出するようにすれば
、文字列の方向に従って第1点および第2点を順に指定
するだけで、文字列の方向についての情報の入力も同時
に達成されることになる。
【0010】
【実施例】以下実施例を示す添付図面によって詳細に説
明する。図1は本発明の一実施例の文字認識装置の基本
的な構成を示すブロック図である。紙面などに形成され
た文字列を含む文書画像は、イメージスキャナなどで構
成された読取部1で電気信号に変換されて読み取られる
。この読取部1の出力信号は、二値化部2で適当なスラ
イスレベルでレベル弁別されて「1」または「0」の二
値信号に変換される。この二値信号は、CPU(中央処
理装置)5の制御の下に、画像メモリ4に入力されて記
憶される。これにより、画像メモリ4には、二値化後の
文書画像が記憶されることになる。この画像メモリ4の
記憶画像は、CPU5を介して画像制御部6に与えられ
る。この画像制御部6は画像メモリ4の記憶画像に対応
した表示制御信号を作成して表示手段であるCRT7に
与える。この結果、CRT7には、読み取られた文書画
像が表示されることになる。本実施例では、CPU5が
切出手段および傾斜角検出手段ならびに文字列方向検出
手段として機能する。
【0011】画像制御部6には、文書の入力を行うべき
任意の矩形領域を指定したりするために用いられ、第1
の指定手段および第2の指定手段として機能するマウス
8が接続されている。このマウス8から、後述するよう
にして文書の入力を行うべき矩形領域の指定が行われる
と、CPU5は、画像メモリ4の記憶画像から指定され
た矩形領域の画像を切り出し、この切り出した画像を文
章領域バッファ9に格納する。
【0012】CPU5では、マウス8からの矩形領域の
指定入力に基づいて、後述するようにして、指定された
矩形領域中の文字列の傾斜角および文字列の方向(文字
認識を行うべき順序を指定する方向)が検出される。こ
の検出結果はライン10を介して傾き補正部11に与え
られる。この傾き補正部11は、文章領域バッファ9の
記憶画像に適当な補正を施して、文字切出部12に入力
させる。この文字切出部12では、1文字分のデータが
切り出され、この切り出されたデータが文字認識部13
に与えられる。文字認識部13では、予め記憶されてい
る基準の文字パターンとのマッチング処理などが行われ
、このようにして文字が認識されて、対応する文字コー
ドに変換される。なお、文字切り出し部12および文字
認識部13は、CPU5からライン14,15を介して
与えられる各制御信号に基づいて各動作を行う。本実施
例では、上記傾き補正部11、文字切出部12および文
字認識部13を含んで変換手段が構成されている。
【0013】図2は動作を説明するためのフローチャー
トである。、ステップn1で文書画像が読み取られて画
像メモリ4に格納されると、ステップn2では、当該文
書画像がCRT7に表示される。このCRT7における
表示態様は、図3に示されており、7Aは表示画面を示
し、30は文書画像を示す。ステップn3では、操作者
は、マウス8を操作して、文書の入力を行わせるべき矩
形領域S1の1つの頂点P1を指定して入力する。この
入力操作は、マウス8の操作によりカーソルCを頂点P
1に位置させ、この状態でマウスボタンを押圧してクリ
ック操作を行うことにより達成される。なお、矩形領域
S1のうち、最初に指定される第1点は、入力すべき文
章の文頭の近傍の頂点P1とするか、最終行の先頭の近
傍の頂点P4とする必要がある。このことについては後
述する。
【0014】ステップn4では、操作者は、カーソルC
を頂点P1の近傍の行の行末の近傍の頂点P2に位置さ
せ、マウスクリックにより頂点P2を第2点として指定
する。ステップn3の操作で頂点P4を選択したときに
は、頂点P3を第2点として指定することになる。ステ
ップn3およびn4で入力された第1点および第2点の
表示画面における座標位置は、画像制御部6からCPU
5に与えられる。このCPU5では、第1点および第2
点の座標位置に基づいて、文書画像の傾斜角を検出し(
ステップn5)、さらに第1点から第2点に向かう方向
を文字列の方向として検出する(ステップn6)。上記
のステップn3において、第1点を、入力すべき領域の
先頭の行の行頭の近傍の頂点P1などに選ぶのは、ステ
ップn6での文字列の方向の検出のためである。
【0015】ステップn5における傾斜角の検出は、第
1点および第2点の座標位置のみに基づいて行われるか
ら、この傾斜角の検出は極めて簡単な処理で達成され、
この処理に長時間を要することはない。ステップn7で
は、上記第1点および第2点(すなわち頂点P1,P2
)を頂点とする長方形の描画のためのサブルーチンがコ
ールされる。この状態では、カーソルCは、第2点とし
て指定した頂点P2に立てた頂点P1,P2を結ぶ線分
の垂線上のみに移動が規制される。そして、頂点P1,
P2およびカーソルCの位置を頂点に含む長方形がCR
T7の表示画面上に表示される。この状態から、操作者
は、ステップn8において、表示された長方形が入力す
べき矩形領域S1に一致する状態、すなわち、カーソル
Cが頂点P3上に位置する状態で、マウス8をクリック
する。これにより、第3点目の指定が行われ、文書入力
を行うべき矩形領域が確定する。すなわち、CPU5は
、画像制御部6から与えられる第3点の座標に基いて第
4の頂点P4の座標を演算する(ステップn9)。 さらにCPU5は、第1点〜第3点の指定により得られ
た頂点P1〜P3の座標位置と、ステップn9で求めら
れた頂点P4の座標位置とに基づいて、矩形領域S1の
文書画像を画像メモリ4の記憶画像から切り出し、この
切り出した画像をバスライン16を介して文章領域バッ
ファ9に格納する(ステップn10)。このようにして
、入力を行うべき矩形領域S1の文書画像の切出が達成
される。
【0016】文章領域バッファ9に格納された文書画像
は、傾き補正部11により上記の傾斜角および文字列の
方向に基づいて順次読み出され、このようにして傾斜角
を補正した画像データが文字切出部12に与えられるこ
とになる。以上のように本実施例の文字認識装置によれ
ば、マウス8の操作により、入力を行うべき矩形領域S
1の頂点である第1点および第2点を指定することによ
り、この第1点および第2点の座標値から、文書の傾斜
角および文字列の方向が検出される。このような傾斜角
の演算は、第1点および第2点の座標位置のみに基づい
て行われるので、傾斜角の検出は簡単な構成で、しかも
極めて短時間で行うことができる。これにより、文書入
力が格段に高速化できる。また、第1点および第2点を
順に指定することによって、文字列の方向をも指定でき
るから、図3のような横書きの文書に限らず、縦書きの
文書にも容易に対応することができる。また、1つの文
書画像中に、横書きの文書と縦書きの文書とが混在して
いるような場合などにも良好に対応することができる。
【0017】さらに、第1点および第2点を一辺とする
矩形領域の画像が画像メモリ4に記憶された文書画像か
ら切り出されるので、文書画像が傾斜して画像メモリ4
に記憶されている場合でも、確実に所望の矩形領域のみ
を指定して切り出させることができる。この結果、文書
の入力後の操作者による編集作業が格段に低減されるの
で、文書入力作業の作業性を格段に向上することができ
るようになる。
【0018】なお、本発明は上記の実施例に限定される
ものではない。たとえば上記の実施例では、第3点の指
定の際にカーソルCの移動を第2点から下した第1点お
よび第2点を結ぶ線分の垂線上に規制するようにして頂
点P3を第3点として指定するようにしているが、カー
ソルCの移動を第1点から下した垂線上に規制するよう
にして頂点P4を第3点として指定させるようにしても
よい。
【0019】また上記の実施例では、第3点の指定の際
にカーソルCの移動を第2点から下した第1点および第
2点を結ぶ線分の垂線上に規制するようにして、第1点
および第2点を結ぶ辺の対辺の一方端の頂点を第3点と
して指定することとしているが、第3点の指定の際にも
カーソルCは任意に移動し得るようにして、カーソルC
の位置を第1点および第2点を結ぶ辺の対辺上の一点と
する長方形を表示画面に表示させるようにしてもよい。 この場合には、第1点および第2点を頂点とし、第1点
および第2点を結ぶ辺の対辺上に第3点を有する矩形領
域の切り出しが行われることになる。
【0020】また、上記の実施例では、マウス8により
第1点、第2点および第3点の指定を行うこととしてい
るが、たとえばライトペンなどの他の座標入力手段など
により第1〜第3点を指定することとしてもよい。その
他、本発明の要旨を変更しない範囲で種々の設計変更を
施すことが可能である。
【0021】
【発明の効果】以上のように本発明の文字認識装置によ
れば、表示手段の表示画面上で傾斜した矩形領域をも指
定して文書画像を切り出させることができるので、必要
な部分の文書画像だけを確実に切り出すことができる。 これにより、文字認識後の編集作業などが格段に低減さ
れ、文書の入力を短時間で行えるようになる。
【0022】また、文書画像の傾斜角は第1点および第
2点の座標位置に基づいて検出されるので、第1点およ
び第2点を文字列の方向に沿って指定することにより、
正確な文書画像の傾斜角を、第1点および第2点の各座
標値位置のみに基づく簡単な処理により検出することが
できる。これにより、文書入力処理全体を格段に高速化
することができる。また、傾斜角の検出のための構成の
簡素化にも寄与することができる。
【0023】さらに、第1点から第2点に向かう方向を
文字列の方向として検出するようにすれば、文字列の方
向に従って第1点および第2点を順に指定するだけで、
文字列の方向についての情報の入力も同時に達成される
ことになる。この結果、たとえば縦書きと横書きとの指
定も、切り出すべき矩形領域の指定と同時に行わせるこ
とができる。
【図面の簡単な説明】
【図1】本発明の一実施例の文字認識装置の基本的な構
成を示すブロック図である。
【図2】動作を説明するためのフローチャートである。
【図3】CRT7の表示態様を示す図である。
【図4】従来技術における入力すべき矩形領域の指定の
態様を示す図である。
【符号の説明】
1    読取部 4    画像メモリ(画像記憶手段)5    CP
U(切出手段、傾斜角検出手段、文字列方向検出手段) 6    画像制御部 7    CRT(表示手段) 8    マウス(第1の指定手段、第2の指定手段)
9    文章領域バッファ 11  傾き補正部 12  文字切出部 13  文字認識部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】文字列を含む文書画像を光学的に読み取る
    読取手段と、この読取手段で読み取られた文書画像を記
    憶する画像記憶手段と、この画像記憶手段に記憶された
    文書画像を表示する表示手段と、この画像記憶手段に記
    憶された文書画像から任意の矩形領域の画像を切り出す
    切出手段と、この切出手段で切り出された文書画像中の
    文字列を文字列の傾斜方向に基づいてコード列に変換す
    る変換手段とを含む文字認識装置において、上記切出手
    段に切り出させるべき矩形領域の隣接する頂点である第
    1点および第2点を上記表示手段の表示画面上で指定す
    る第1の指定手段と、上記切出手段に切り出させるべき
    矩形領域の上記第1点および第2点を結ぶ辺の対辺上の
    点である第3点を上記表示手段の表示画面上で指定する
    第2の指定手段と、上記第1点および第2点の表示画面
    における座標位置に基づいて、文字列の傾斜角を検出し
    て上記変換手段に与える傾斜角検出手段とを含み、上記
    切出手段は、上記第1点、第2点および第3点により確
    定される矩形領域の画像を、上記画像記憶手段に記憶さ
    れた文書画像から切り出すものであることを特徴とする
    文字認識装置。
  2. 【請求項2】上記第2の指定手段から入力される第3点
    は、上記矩形領域の上記第1点および第2点を結ぶ辺の
    対辺における一方端の頂点であることを特徴とする請求
    項1記載の文字認識装置。
  3. 【請求項3】上記第1点から第2点に向かう方向を、文
    字列の方向として検出して上記変換手段に与える文字列
    方向検出手段をさらに含むことを特徴とする請求項1記
    載の文字認識装置。
JP3052766A 1991-03-18 1991-03-18 文字認識装置 Pending JPH04288691A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3052766A JPH04288691A (ja) 1991-03-18 1991-03-18 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3052766A JPH04288691A (ja) 1991-03-18 1991-03-18 文字認識装置

Publications (1)

Publication Number Publication Date
JPH04288691A true JPH04288691A (ja) 1992-10-13

Family

ID=12923997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3052766A Pending JPH04288691A (ja) 1991-03-18 1991-03-18 文字認識装置

Country Status (1)

Country Link
JP (1) JPH04288691A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325415A (zh) * 2018-08-22 2019-02-12 吴昌议 一种基于图像列对齐特征预测所有目标区域的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325415A (zh) * 2018-08-22 2019-02-12 吴昌议 一种基于图像列对齐特征预测所有目标区域的方法

Similar Documents

Publication Publication Date Title
US5123062A (en) OCR for sequentially displaying document layout according to recognition process
US5257074A (en) Image forming apparatus
US5509092A (en) Method and apparatus for generating information on recognized characters
JP2002056398A (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
US5271067A (en) Optical character recognition apparatus
US5233672A (en) Character reader and recognizer with a specialized editing function
JP3006466B2 (ja) 文字入力装置
JP3186246B2 (ja) 文書読取装置
JPH04288691A (ja) 文字認識装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPS61253587A (ja) 光学文字読取装置
JP4297815B2 (ja) 情報処理装置および処理方法およびプログラムおよび記録媒体
JP3186712B2 (ja) 文書読取装置
JP3761923B2 (ja) 画像処理装置及び方法
JPH11250179A (ja) 文字認識装置および文字認識方法
JP2002133367A (ja) 文字認識装置
JPH08137987A (ja) 光学式文字読取装置
JPS61198376A (ja) 光学的文字読取装置
JP3077580B2 (ja) 文字読取装置
JPH03269689A (ja) 文書読み取り装置
JPH05324628A (ja) 文字読取装置
JPH0459669B2 (ja)
JPH0459668B2 (ja)
JPH02193278A (ja) 画像処理装置
JPH06259594A (ja) 光学的読取りデータの処理方法及び同装置