JPH03250387A - 文字切出し方式 - Google Patents

文字切出し方式

Info

Publication number
JPH03250387A
JPH03250387A JP2048007A JP4800790A JPH03250387A JP H03250387 A JPH03250387 A JP H03250387A JP 2048007 A JP2048007 A JP 2048007A JP 4800790 A JP4800790 A JP 4800790A JP H03250387 A JPH03250387 A JP H03250387A
Authority
JP
Japan
Prior art keywords
character
center position
characters
segmented
scanning area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2048007A
Other languages
English (en)
Inventor
Hideaki Taniguchi
谷口 英明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP2048007A priority Critical patent/JPH03250387A/ja
Publication of JPH03250387A publication Critical patent/JPH03250387A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 文字をDaするために文字を切り出す文字切出し方式に
関し、 一定の傾きあるいは複雑な傾きを有する文字行の文字を
正確に切り出すことを目的とし、原稿を読み取った後に
文字を切り出して、当該文字の特徴抽出を行い、当該特
徴と識別辞書に予め格納されている特徴とを比較して文
字を認識する文字認識装置における文字切出し方式にお
いて、原稿が傾斜している場合にも正しく切出され得る
ように、前に切り出した文字の中心位置を基準にして次
の文字の切り出し範囲を設定していくように構成される
〔産業上の利用分野〕
本発明は、文字を認識するために文字を切り出す文字切
出し方式に関するものである。
〔従来の技術〕
第4図を参照しつつ従来例を説明する。第4図において
、人力部20は、文字をイメージデータとして入力する
。前処理部21では、前記入力部20で読み取られた文
字を切り出すと共に、雑音となるゴミを取り除き平滑化
する。そして、前処理部21により切り出された文字は
、特徴抽出部22において、特徴が抽出される。
一方、識別用辞書25には、予め文字を認識するための
特徴が格納されている。識別部23では、前記特徴抽出
部22により抽出された特徴と予め辞書に格納されてい
る特徴とを比較して、切り出した文字を識別する。
そして、結果出力24としてデイスプレィ等に表示する
〔発明が解決しようとする課題〕
しかし、第5図図示のごとく、傾斜して印刷された原稿
30では、切出し走査領域31を水平に走査すると、所
定の読み取り範囲外にはみ出す文字が生じて切出し不能
領域32ができる。
上記切出し不能領域32を出さないた狛に、従来例にお
ける文字切り出しは、傾斜した原稿の文字行の周辺分布
を求めたり、あるいは原稿の端を検出することによって
、原稿の傾斜量や傾斜方向を算出して処理していた。し
たがって、上記方法は、文字行の切り出しを行うための
処理速度が遅い。
また、最初に算出した傾斜量や傾斜角度は、その原稿に
印刷された全ての文字行に反映されるため、文字行の途
中で傾斜量や傾斜角度が変動すると、これに対応できず
に正しい文字を切り出せなかった。
本発明は、一定の傾きあるいは複雑な傾きを有する文字
行の文字を正確に切り出すことができる文字切出し方式
を提供することを目的とする。
〔課題を解決するた袷の手段〕
第1図を参照しつつ本発明の詳細な説明する。
第1図において、人力部lでは、文字をイメージデータ
として入力する。文字中心位置検出部2では、行におけ
る個々の文字の中心位置を検出する。文字切出し位置設
定部3では、次の文字の走査領域の中心位置を設定する
。文字切出し部4では前記走査領域にしたがって文字を
切り出す。前処理部5では、前記切り出された文字の雑
音となるゴミを取り除き平滑化する。そして、前記切り
出された文字は、特徴抽出部6において、特徴が抽出さ
れる。識別用辞書9には、予め文字を認識するための特
徴が格納されている。識別部7では、前記特徴抽出部6
により抽出された特徴と予め識別用辞書9に格納されて
いる特徴とを比較して、切り出した文字を識別する。そ
して、文字の識別結果は、結果出力8としてデイスプレ
ィ等に表示される。
〔作  用〕
本発明における原理に基づく作用を説明する。
入力部1から人力された文字に関するイメージデータは
、光学的に読み取られ、図示されていないバッファメモ
リに格納された後、行中の文字が走査され、文字中心位
置検出部2によってその文字の中心位置が検出される。
この中心位置は、文字切出し位置設定部3により次の文
字を切り出す走査領域の中心基準を設定する。そして、
当該走査領域の中心基準の上下一定幅に基づいて、文字
を切り出す。
その後、前処理部5による処理、特徴抽出、識別処理等
は従来例と同様に行われる。
〔実 施 例〕
第2図を参照しつつ本発明における実施例を説明する。
第2図において、たとえば、正しい位置にある帳票11
が非所望に傾斜していて、図示のごとく、傾斜した位置
12にあるものとする。このような帳票12に記載され
ている文字、「A、B、CJを切り出す場合を説明する
先ず、最初の文字「A」は、行の中心位置13を中心と
して上下60ラスタ分が切出し走査領域14となる。第
1図図示の文字中心位置検出部2は、上記走査領域14
の走査を開始して、文字rAJについて最初の黒領域と
最後の黒領域との文字の中心位置15を検出する。
次の文字「B」は、前記文字の中心位置15を中心とし
た上下60ラスタ分が切出し走査領域16となる。同様
にして、文字r B Jの中心位置17を検出して、中
心位置の上下60ラスタ分が次の文字「C」の切出し走
査領域となる。
以上の操作を第3図のフローチャートにしたがって説明
する。
先ず、走査が開始されると、行の中心位置情報から走査
領域としてサーチ範囲が設定される(ステップ■)。
走査領域において、文字の走査を続け、黒領域となる一
番左の位置をサーチして文字の左端を検出(ステップ■
)し、この情報は左端位置情報格納メモリに格納される
(ステップ■)。
同様に、文字の右端を検出(ステップ■)して、この情
報を右端位置情報格納メモリに格納する(ステップ■)
次に、文字の走査領域において、最上端位置をサーチし
て文字の上端を検出(ステップ■)し、この情報は上端
位置情報格納メモリに格納される(ステップ■)。
同様に、文字の下端を検出(ステップ■)して、この情
報を下端位置情報格納メモリに格納する(ステップ■)
このようにして切り出された文字は、文字を認識するた
めにゴミ取りあるいは平滑化等の前処理を行う(ステッ
プC)。この処理の1行分が終わるまで続ける(ステッ
プ■)。
1行が終らない場合には、次の文字の切り出し範囲を設
定するために、前記文字の中心基準から±60ラスクの
範囲に走査領域を設定する(ステップ■)。
そして、この走査領域において前記と同様の処理を縫り
返す。1行の処理が終わると次の行の処理(ステップ0
)に移る。
〔発明の効果) 本発明によれば、文字を切り出す場合の走査領域を、常
に1文字前に切り出した文字の中心位置を基準として決
するため、文字単位の切り出し補正が簡単にできる。し
たがって、文字行中の傾斜景あるいは傾斜方向が変動し
ても、これに対応することができるので、複雑にスキュ
ウした文字行であっても確実に文字を切り出せる。
【図面の簡単な説明】
第1図は本発明におけるブロック構成図、第2図は本発
明における実施例説明図、第3図は本発明におけるフロ
ーチャート、第4図は従来例におけるブロック構成図、
第5図は従来例説明図である。 1・・・入力部 2・・・文字中心位置検出部 3・・・文字切出し位置設定部 4・・・文字切出し部 5・・・前処理部 6・・・特徴抽出部 7・・・識別部 8・・・結果出力 9・・・識別用辞書 本発明に8tl原理ブロックja成図 第1図 本発明における実施例説明図 第2図

Claims (1)

  1. 【特許請求の範囲】 傾斜した原稿を読み取った後に文字を切り出して、当該
    文字の特徴抽出を行い、当該特徴と識別辞書に予め格納
    されている特徴とを比較して文字を認識する文字認識装
    置における文字切出し方式において、 前に切り出した文字の中心位置を検出する文字中心位置
    検出部2を備え、 当該中心位置を基準にして次の文字の切り出し範囲を設
    定していくようにしたことを特徴とする文字切出し方式
JP2048007A 1990-02-28 1990-02-28 文字切出し方式 Pending JPH03250387A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2048007A JPH03250387A (ja) 1990-02-28 1990-02-28 文字切出し方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2048007A JPH03250387A (ja) 1990-02-28 1990-02-28 文字切出し方式

Publications (1)

Publication Number Publication Date
JPH03250387A true JPH03250387A (ja) 1991-11-08

Family

ID=12791242

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2048007A Pending JPH03250387A (ja) 1990-02-28 1990-02-28 文字切出し方式

Country Status (1)

Country Link
JP (1) JPH03250387A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5781660A (en) * 1994-07-28 1998-07-14 Seiko Epson Corporation Image processing method and apparatus

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57176484A (en) * 1981-04-24 1982-10-29 Toshiba Corp Optical character reader

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57176484A (en) * 1981-04-24 1982-10-29 Toshiba Corp Optical character reader

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5781660A (en) * 1994-07-28 1998-07-14 Seiko Epson Corporation Image processing method and apparatus

Similar Documents

Publication Publication Date Title
EP1843275A2 (en) Outlier detection during scanning
JPH08123900A (ja) ライン走査画像のための位置決定方法及びその装置
JPH1139428A (ja) 文書映像の方向修正方法
JP3031579B2 (ja) 帳票の文字認識領域指定方法
JPH03250387A (ja) 文字切出し方式
JP2000113106A (ja) 文書画像処理装置
JP2786044B2 (ja) 光学的文字読み取り装置
JPH0728935A (ja) 文書画像処理装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JPH03263282A (ja) 文字読取装置の文字切出し方法
JPS63158676A (ja) 領域抽出装置
JPS63101983A (ja) 文字列抽出方式
JP3000480B2 (ja) 文字領域区切り検出方法
JPH04276888A (ja) 文字読取装置
JPS5949671A (ja) 光学的文字読取装置
JP3190794B2 (ja) 文字切り出し装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JP4024960B2 (ja) 画像照合装置および画像照合方法
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法
JP2963474B2 (ja) 類似文字識別方法
JPH04156694A (ja) 文字認識方式
JP2022186250A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2925270B2 (ja) 文字読取装置
JPH04330586A (ja) 単語領域抽出方式
JPH05174184A (ja) 光学式文字読み取り装置