JPH05166010A - 文字切出方法 - Google Patents

文字切出方法

Info

Publication number
JPH05166010A
JPH05166010A JP3353626A JP35362691A JPH05166010A JP H05166010 A JPH05166010 A JP H05166010A JP 3353626 A JP3353626 A JP 3353626A JP 35362691 A JP35362691 A JP 35362691A JP H05166010 A JPH05166010 A JP H05166010A
Authority
JP
Japan
Prior art keywords
character
pattern
cutout
candidate
segmenting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3353626A
Other languages
English (en)
Inventor
Yutaka Kato
豊 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP3353626A priority Critical patent/JPH05166010A/ja
Publication of JPH05166010A publication Critical patent/JPH05166010A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 パターンの局所的な構造的特徴を用いること
により、類型パターンの判別性能を向上させる。 【構成】 ある切出し候補パターンの認識結果が類型パ
ターンの可能性のある場合、そのパターンが互いに接触
した複数文字で形成されてるか否かをパターンの局所的
な構造的特徴を用いて調べ(ステップ103、10
4)、その結果によって文字らしさ度を修正する個別処
理を施し(ステップ105、106)、全切出し候補の
うち文字らしさ度の最も大きいものを切出し位置として
決定する(ステップ107)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば光学式文字認識
装置に用いられる文字切出方法に関する。
【0002】
【従来の技術】従来の文字切出し方法は、考えられる切
出し候補の画像をいくつか抽出しておき、各々の切出し
候補を辞書パターンと照合して認識させ、最も実際らし
く見える切出し候補を一文字の切出し位置として確定し
ている。
【0003】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の方法は文字パターンの中には1文字のパター
ンなのか、互いに接触した複数文字で形成されたパター
ンなのかを人間でも見分け難い図2に示す「m」と「r
n」のような類型パターンパターンが存在し、このよう
なパターンはどちらも1文字と思えばそのように見え、
複数文字と思えばそのようにも見えるので、従来の方法
では判別が困難であった。
【0004】本発明はこのような状況に鑑みてなされた
もので、ある切出し候補パターンを認識した結果が類型
パターンの可能性のある所定文字の場合、はそのパター
ンが互いに接触した複数文字で形成されているか否かパ
ターンの局所的な構造的特徴を用いて調べることによ
り、類型パターンの判別性能を向上させるようにしたも
のである。
【0005】
【課題を解決するための手段】この様な課題を解決する
ために本発明の文字切出方法は、入力された画像から文
字を切出して認識し、文字コードに変換する文字切出し
方法において、ある切出し候補パターンの認識結果が類
型パターンの可能性のある場合はそのパターンが互いに
接触した複数文字で形成されてるか否かをパターンの局
所的な構造的特徴を用いて調べ、その結果によって文字
らしさ度を修正する個別処理を施し、全切出し候補のう
ち文字らしさ度の最も大きいものを切出し位置として決
定することを特徴とする。
【0006】
【作用】ある文字を切出して認識した結果が類型パター
ンの可能性がある場合は、パターンの局所的特徴からそ
れが複数文字で形成されているか否かを判断し、その結
果によって修正された結果のうち文字らしさ度の最も大
きいものを切出し位置とする。
【0007】
【実施例】次に、本発明の実施例を図面に基づいて説明
する。図1は本発明の画像読取装置の一実施例を示すブ
ロック図である。図においてバスライン1に接続された
制御装置2は通信制御装置3を介して図示しないイメー
ジリーダから読み込んだ文字を画像保存用RAM4に記
憶すると共に、図示しない表示部に表示させる。またこ
の制御装置2は切出し制御プログラムROM5および制
御装置演算用RAM6を用いて1文字認識部7を制御
し、1文字認識を行うようになっている。
【0008】ここで判別する類型パターンは図2に示す
ように例えば「m」と「rn」のように類似したもので
あり、図に示すように「r」と「n」の文字が接近して
いるために、両者ともほとんど同じように見えるもので
ある。
【0009】図3はこの装置の動作を示すフローチャー
トであり、ステップ100において図示しないイメージ
リーダから画像が取込まれ、画像保存用RAM4に記憶
される。そして制御装置1は切出し制御プログラムRO
M5に記憶されたプログラムに従って、ステップ101
において文書画像から全ての文字行を切出す行の切出し
を行う。この行の切出しは例えば水平方向に濃度投影
し、投影値が0となるところを行間とみなすことによっ
て行う。
【0010】そして制御装置1は切出し制御プログラム
ROM5に記録されたプログラムに従ってステップ10
2において、文書画像から1文字の切出し候補を複数個
抽出する。これは例えば切出された1行に対し、垂直方
向に濃度投影し、投影値が谷となるところを文字境界の
候補として複数の切出し候補画像を設定するなどの方法
によって行う。
【0011】このようにして複数の文字が切出された
後、1文字認識部7はステップ103において、切出し
候補画像を全ての辞書パターンと照合し、認識距離の最
も近い文字をその切出し候補の認識結果とし、距離をそ
の切出し候補が1文字である可能性(文字らしさ)とし
て記憶しておく。このときの認識結果がステップ104
に示すように、いま対象としている文字「m」であり、
かつ認識距離が閾値より近ければ、ステップ105にお
いて窪み検出を行う。
【0012】図4(a)に示す「rn」という文字の窪
み検出は図4(b)に斜線で示すようにその候補の注目
エリアを決め、図4(c)に示すように注目エリアの上
からのペリフェラルデータperi「x」を得る。ここ
で現在点のデータperi「x]が1つ左の点peri
[x−1」よりも高ければこの点は上り、低ければ下り
と呼ぶ。ペリフェラルデータを左から順にみていき、
「下り」から「上り」に転ずるまでの区間を見つけ、そ
の区間の中点座標を谷位置とする。同じ方法で谷の左右
に存在する山位置を見つけ、左右の山の低い方と谷との
高低差を谷深さとする。谷深さが一定値を越えるときそ
の谷を窪み候補とする。
【0013】また、注目エリアの最下行の画素を左から
順にみていき、図4(e)に示すように初めに白画素か
ら黒画素に変わる点を始点とし、次に黒画素から白画素
に変わる点を終点とする区間を縦棒とみなし、その区間
の中点を中心線の位置とする。そして窪み候補の中で縦
棒中心線よりも左側に位置しているものがあればこの切
出し候補は窪みありと判定し、なければ窪み無しと判定
する。
【0014】図4(d)に示すように谷深さ1と谷深さ
2がある程度以上深いとすると、谷1と谷2は窪み候補
となる。そして図4(e)に示すように、谷1は中心線
より左に位置しているのでこの場合は窪みありと判定さ
れる。
【0015】ステップ105において窪みありと判定さ
れたとき、このパターンが「m]である可能性が少ない
とみて、文字らしさ度を定数分さげる。窪み無しと判断
されたときこのパターンが「m]である可能性が大きい
とみて文字らしさ度を定数分上げ、ステップ106に示
すように文字らしさを修正する。そして、ステップ10
2で抽出された全切出し候補についてステップ103乃
至106の処理を行って、ステップ107に示すように
1文字切出し位置を決定する。
【0016】ステップ107の処理が終了するとステッ
プ102に戻り、次の文字について同様の処理が行われ
る。
【0017】
【発明の効果】以上説明したように本発明による文字切
出し方法は、取込まれたパターンが接触した複数文字で
形成されているか否かをパターンの局所的な構造的特徴
を用いて調べ、その結果に応じて文字らしさ度を修正す
るようにしたので、類型パターンの可能性のある文字で
も正確に切り出しを行うことができるという効果を有す
る。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図
【図2】類型パターンの一例を示す図
【図3】1文字切り出しの動作を示すフローチャート
【図4】窪み検出動作を説明するための図
【符号の説明】
1 バスライン 2 制御装置 3 通信制御装置 4 画像保存用RAM 5 切出し・制御プログラムROM 6 制御装置演算用RAM 7 1文字認識装置

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力された画像から文字を切出して認識
    し文字コードに変換する文字切出し方法において、 ある切出し候補パターンの認識結果が類型パターンの可
    能性のある場合はそのパターンが互いに接触した複数文
    字で形成されてるか否かをパターンの局所的な構造的特
    徴を用いて調べ、 その結果によって文字らしさ度を修正する個別処理を施
    し、 全切出し候補のうち文字らしさ度の最も大きいものを切
    出し位置として決定することを特徴とする文字切出し方
    法。
JP3353626A 1991-12-17 1991-12-17 文字切出方法 Pending JPH05166010A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3353626A JPH05166010A (ja) 1991-12-17 1991-12-17 文字切出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3353626A JPH05166010A (ja) 1991-12-17 1991-12-17 文字切出方法

Publications (1)

Publication Number Publication Date
JPH05166010A true JPH05166010A (ja) 1993-07-02

Family

ID=18432120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3353626A Pending JPH05166010A (ja) 1991-12-17 1991-12-17 文字切出方法

Country Status (1)

Country Link
JP (1) JPH05166010A (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991582A (ja) * 1982-11-16 1984-05-26 Nec Corp 文字読取装置
JPS61190679A (ja) * 1985-02-19 1986-08-25 Fujitsu Ltd 文字デ−タ処理装置
JPS62145486A (ja) * 1985-12-20 1987-06-29 Ricoh Co Ltd 文字認識方式
JPS63216188A (ja) * 1987-03-04 1988-09-08 Sharp Corp 接触文字切出し方法
JPH01181177A (ja) * 1988-01-14 1989-07-19 Toshiba Corp 文字検出切出装置
JPH0344789A (ja) * 1989-07-12 1991-02-26 Hamamatsu Photonics Kk 文字自動抽出装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991582A (ja) * 1982-11-16 1984-05-26 Nec Corp 文字読取装置
JPS61190679A (ja) * 1985-02-19 1986-08-25 Fujitsu Ltd 文字デ−タ処理装置
JPS62145486A (ja) * 1985-12-20 1987-06-29 Ricoh Co Ltd 文字認識方式
JPS63216188A (ja) * 1987-03-04 1988-09-08 Sharp Corp 接触文字切出し方法
JPH01181177A (ja) * 1988-01-14 1989-07-19 Toshiba Corp 文字検出切出装置
JPH0344789A (ja) * 1989-07-12 1991-02-26 Hamamatsu Photonics Kk 文字自動抽出装置

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
US5410611A (en) Method for identifying word bounding boxes in text
US5687253A (en) Method for comparing word shapes
EP0543593B1 (en) Method for determining boundaries of words in text
US5557689A (en) Optical word recognition by examination of word shape
US5640466A (en) Method of deriving wordshapes for subsequent comparison
WO1991017519A1 (en) Row-by-row segmentation and thresholding for optical character recognition
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP5630689B2 (ja) 文字認識方法及び文字認識装置
JP2898562B2 (ja) ナンバープレート決定方法
JPH02293989A (ja) 文字認識装置
JPH05166010A (ja) 文字切出方法
JP3457094B2 (ja) 文字認識装置及び文字認識方法
JP3710164B2 (ja) 画像処理装置及び方法
JPH07160810A (ja) 文字認識装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP2001147988A (ja) 文字認識方法及び文字認識装置
JPH0535921A (ja) 文字照合装置及びそのための方法
JP2832035B2 (ja) 文字認識装置
JPH03219384A (ja) 文字認識装置
JPH0632074B2 (ja) 正規化方法
JPH03122786A (ja) 光学的文字読取装置
JPH08202876A (ja) 画像処理装置
JPH0433082A (ja) 文書認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980810