JPS61195474A - 文字パタ−ン切り出し装置 - Google Patents

文字パタ−ン切り出し装置

Info

Publication number
JPS61195474A
JPS61195474A JP60036165A JP3616585A JPS61195474A JP S61195474 A JPS61195474 A JP S61195474A JP 60036165 A JP60036165 A JP 60036165A JP 3616585 A JP3616585 A JP 3616585A JP S61195474 A JPS61195474 A JP S61195474A
Authority
JP
Japan
Prior art keywords
character
pattern
cutting
basic pattern
basic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60036165A
Other languages
English (en)
Other versions
JPH0420507B2 (ja
Inventor
Fumio Yoda
依田 文夫
Yoji Maeda
前田 陽二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP60036165A priority Critical patent/JPS61195474A/ja
Publication of JPS61195474A publication Critical patent/JPS61195474A/ja
Publication of JPH0420507B2 publication Critical patent/JPH0420507B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、文書に記入された文字列から文字パターン
を切り出す文字パターン切り出し装置に関するものであ
る。
〔従来の技術〕
文字を認識するKは、用紙に記入された文字を充電変換
し、文字の部分、背景の部分に対応して1.0の信号に
2値化変換した文字パターンから1文字づつ文字パター
ンを切り出さなければならない。第2図は従来のこの種
の装置の構成を示す図であシ、図中(1)は用紙、(2
)は用紙(1)上に記入された文字列を光学的に走査し
て光電変換する走査手段、(8)は光電変換された文字
列のパターン(以後、文字列パターンと呼ぶ)を記憶す
る文字列パターン記憶手段、(4)は上記文字列と直交
する方向に文字列パターンを走査して求めた、周辺分布
値の連続性に基づき、上記文字列パターンを分割して求
めたパターン(以後、基本パターシと呼ぶ)の左右端と
上下端の座標より基本パターン領域を検出する基本パタ
ーン領域検出手段、(6)は基本パターン領域検出手段
(4)で求めた基本パターン領域の位置情報から単独の
基本パターン及び連続する複数個の基本パターン領域を
結合したパターン(以後「結合パターン」と呼ぶ)のそ
れぞれが、どの程度1文字のパターンらしいかを定量化
した値幅後文字評価値と呼ぶ)を計算する文字評価値算
出手段、(6)は上記文字評価値算出手段(5)で求め
た文字評価値の大きさく基づき切り出すべき文字パター
ンの位置を決定する文字切り出し手段、(テ)は文字切
り出し手段(6)で決定した文字パターン切り出し位置
に基づいて文字列パターン記憶手段(8)から1文字づ
つ文字パターンを切り出す出力手段である0 第3図は、第2図の上記基本パターン領域検出手段(4
)Kよる処理の一例を示す図である。図中(8)は文字
列パターン、(9)は周辺分布値、(7)は基本パター
ンの例であシ、該基本パターンと対応する基本パターン
領域を矩形で囲って示しである。
第4図は、第2図に示された文字評価値算出手段(5)
で文字評価値を算出する為の基本パターンと結合パター
ンの例である。
第5図は、第2図の文字切り出し手段(6)で文字を切
り出すために発生させる基本パターン又は結合パターン
の組み合せの例を示す図である。
次に第2図〜第5図を用いて第2図に示す従来のむの種
装置の動作について説明する。まず用紙(1)上の文字
列は走査手段(2)で光電変換され、文字列パターン記
憶手段(8)に格納される。次に文字列パターン記憶手
段(8)内の文字列パターン「設計」(8)は基本パタ
ーン領域検出手段(4)K渡される。
基本パターン領域検出手段(4)では、文字列と直交す
る上下方向に文字列パターンを走査して作成した周辺分
布値(9)が所定の閾値をこえる領域の連続性に基づい
て文字列パターン「設計」(8)を分割し、分割して得
た各基本パターン「言」、「ス」。
「言J 、 r”t J(IIの左右端と上下端の座標
を基本パターン領域として検出する。
次に、文字評価値算出手段(6)では、第4図の例に示
すように単独の基本パターン領域と、連続する複数個の
基本パターン領域を結合した結合パターンの領域とのす
べてに対し、基本パターン領域の位置情報から求めたパ
ターンの形状やパターン間に存在する空白部分の広さ等
に基づいて文字領域らしさを示す文字評価値を算出する
そして文字切り出し手段(6)では、上記基本パターン
領域間の境界点を文字列パターンの切り出し候補位置と
し、この各切り出し候補位置のあらゆる可能な組み合せ
により第5図に示すすべての可能な切り出しパターンの
組み合せを求める。そして次に各切り出し候補位置の組
について切り出し候補位置で切り出されたパターンに対
応する基本パターンあるいは結合パターンの上記文字評
価値算出手段(6)で計算した文字評価値に基づいて切
り出し評価値を求め、この切り出し評価値に基づいて最
適な文字切り出し位置の組を決定する。その次に出力手
段(7)は、上記文字切り出し手段(6)で決定した文
字切り出し位置の組の情報に基づいて上記文字列パター
ン記憶手段(8)から1文字ずつ文字パターンを切り出
して出力する。
〔発明が解決しようとする問題点〕
従来の文字パターン切り出し装置は以上のように、文字
評価値算出手段において単独の基本パターン領域と連続
する複数個の基本パターン領域を結合して発生する結合
パターンの領域ナベてに対しどの程度文字領域らしいか
を示す文字評価値を計算し、文字切り出し手段でこれら
の基本パターンと結合パターンのナベての組み合せの中
から最適な組を検出するように構成されているので1行
すべての基本パターンに対して処理を行った場合、基本
パターンの組み合せのケースが膨大な数となり切り出し
処理時間がかかるという問題点があった0 更に、日本語には1文字パターンに外接する矩形の形状
が正方形に近い一般の文字とは特徴を異にするr−J、
r二J、r、J、r″」などの特殊な形状の文字が存在
するため、これらすべての文字パターンに対し文字評価
値を精度よく求めるkは複雑な文字評価値算出式を使わ
ねばならなかった。このため従来の装置では文字評価値
算出手段の構成が極めて複雑になシ装置が高価になると
いう問題点があった。
この発明は上記のような問題点を解消するためになされ
たもので構成を簡単にし、かつ切り出し処理時間を速く
した文字パターン切り出し装置を得ることを目的とする
〔問題点を解決するための手段〕
この発明に係る文字パターン切り出し装置は、切り出し
対象文字の基準パターンから求めた単独又は複数個の基
本パターン領域の形状、大きさ及び配置関係等の情報を
格納した文字切9出し用辞書を記憶する文字切り出し用
辞書記憶手段と、文字切り出し用辞書記憶手段に記憶し
た文字切り出し用辞書に基づいて文字列パターンから文
字である確率の高いパターンを切り出す整合切り出し手
段とを付加したものである。
〔作用〕
この発明における文字パターン切り出し装置は。
まず整合切り出し手段で1行の文字列パターンより上記
特殊な文字を含む文字である確率の高い文字パターンを
切り出し、次に!!合切り出し手段では切り出すことの
出来ない文字パターンを文字列パターンの部分領域から
文字評価値算出手段と文字切り出し手段とで切り出すこ
とによ)、単純な構成でもって切り出し処理時間を早く
することができる。
〔実施例〕
以下、図面を用いて詳細に説明する。
第1図は、この発明の実施例の構成を示す図である。図
中(1) e (2) 、 ts) * (4) e 
(δ) # (6)は上記従来装置と同一のものである
。(2)は、切ル出し対象文字O基準パターンから求め
た単独又は複数個の基本パターン領域の形状、大きさ及
び配置関係等の情報を格納した文字切り出し用辞書を記
憶する文字切り出し用辞書記憶手段(ロ)である。(2
)は、上記文牢切り出し用辞書記憶手段に記憶した文字
切り出し用辞書と文字列パターンから抽出した単独又は
複数側の基本パターン領域との整合を図シ、整合のとれ
た基本パターン領域の組み合せを1文字として切り出す
整合切り出し手段である。a〜は、上記整合切り出し手
段−で切り出したパターンの位置情報と上記文字切り出
し手段(6)で切り出し゛たパターンの位置情報とを編
集して上記文字列パターン記憶手段(8)から1文字ず
つ文字パターンを切り出す編集出力手段である。
第6図は、本発明の実施例の動作を説明するための図で
あり、図中−は文字列パターンの一例、邸)はこの文字
列パターンから抽出した基本パターン領域、■)は整合
切り出し手段−で切り出したパターンの領域、1つは文
字切り出し手段(6)に転送される基本パターン領域、
(2)は文字切り出し手段(6)で切り出したパターン
の領域である0 第7図は、文字切り出し用辞書記憶手段(ロ)に記憶し
た文字切り出し用辞書に格納した句読点パターンの整合
条件の概念を説明するための図であシ、図中α呻は切り
出し対象である基本パターン領域P1、■は基本パター
ン領域P1の左横に存在する基本パターン領域P1−0
、(2I)は基本パターン領域P1の右横に存在する基
本パターン領域P1+□ である。
次にs IK 1図に示す実施例の動作を説明する。
まず用紙(1)上に記入された文字列は走査手段(2)
で光電変換され、この結果得九1行分の文字列パターン
(4)は、文字列パターン記憶手段(8)に格納される
。次に文字列パターンに)は、基本パターン領域検出手
段(4)に渡される。基本パターン領域(4)では、文
字列パターンa匂から基本パターン「年」。
r−J、r回」、「、」、「言J、r2J、r言」。
+1J、rす」、「る」を抽出し各基本パターンに外接
する矩形に対応する左右端、上下端の座標などの基本パ
ターン領域(2)の位置情報を求めて上記整合切り出し
手段(2)に転送する。
次に、整合切り出し手段<1aでは1、上記基本パター
ン領域の位置情報から文字切り出し用辞書記憶手段(2
)に記憶した文字切り出し用辞書と整合のとれる基本パ
ターン領域(至)を検出する。そしてこれら整合のとれ
た基本パターン領域の組°の位置情報を編集出力手段a
鴫に転送し、また文字切り出し用辞書記憶手段(2)に
記憶した文字切り出し用辞書と整1合のとれない基本パ
ターン領域αりの情報を文字評価値算出手段(5)に送
シ従来の方法で文字パターンを切り出す。
次に文字切り出し用辞書記憶手段(ロ)と整合切り出し
手段(轡について更に詳しく説明する。文字切り出し用
辞書記憶手段(2)は、切り出し対象文字の基準パター
ンから求めた単独又は複数個の基本パターン領域の形状
と大きさと配置関係などの条件を記述した文字切り出し
用辞書を記憶することにより構成する。例えば第7図は
、文字切り出し用辞書記憶手段に記憶した文字切り出し
用辞書に格納した句読点パターンを切り出すための整合
条件の概念を示した図であシ、基本パターン領域P1(
至)の幅W1が所定の閾値T〜より小さくかつ基本パタ
ーン領域P11ieの上端x1が左右の基本パターン領
域P1−0−と Plや、体1)の中点 C1−エとC
1ヤ□より下方に存在する条件を基本パターン領域P1
(至)が句読点の領域、の整合条件として登鎌したもの
である。一方整合切り出し手段−は、切り出し対象の基
本パターン領域の組が上記した整合条件を満足した場合
、切り出し対象の基本パターン領域の組を1文字として
切り出すように構成する0次に文字切り出し用辞書記憶
手段(2)に記憶した文字切り出し用辞書と整合がとれ
ない基本パターン領域の処理について説明する。
上記整合切り出し手段((至)で整合のとれない基本パ
ターン領域の列は従来の装置と同様に文字評価値算出手
段(5)と文字切り出し手段(6)とにより切り出しパ
ターンの可能なすべての組み合せについて評価を行い最
も高い評価が与えられる切り出し候補点の組を検出し、
この情報を編集出力手段mに転送する。例えば第6図で
は、整合がとれない基本パターン領域(ロ)のすべての
可能な組み合せに対し評価を行いパターン「設」「計」
なる領域を切り出す。
最後に編集出力手段αmでは、整合切)出し手段憤で切
り出したパターンの位置情報と文字切り出し手段(6)
で切り出したパターンの位置情報を編集した結果に基づ
いて1文字ずつ文字パターンを切り出し、外部装置へ転
送する0すなわち第6図の例では、整合切り出し手段(
至)で切り出した基本パターン領域(至)の切り出し位
置と文字切り出し手段(6)で切り出した領域(ト)の
切り出し位置を左から順に並べ換えて文字列パターン四
から1文字ずつ文字パターンを切り出して転送する0 なお、上記実施例では、横書きの文字列から文字を切夛
出す場合について説明したが、この発明はこれに限らず
、縦書きの文字列から文字を切り出す場合に用いてもよ
い。
また、整合切り出し手段で1つの基本パターン領域を1
文字のパターン領域として切り出す場合についてのみ説
明したが、これに限らず2個以上の基本パターン領域を
1文字のパターン領域として結合して切り出してもよい
0 〔発明の効果〕 以上のように、この発明によれば整合切り出し手段で切
り出せないパターンだけを文字切9出し手段で切り出す
ように構成したので、簡単な構成でしかも高速に文字パ
ターンを切〕出すことのできる装置が得られる効果があ
る。
【図面の簡単な説明】
第1図はこの発明の一実施例による文字パターン切り出
し装置の全体構成図、第2図は従来の文字パターン切り
出し装置の全体構成図、第3図は基本パターン領域検出
手段の処理例の説明図、第4図は文字評価値算出手段で
文字評価値を算出するパターンの例を示すパターン説明
図、第5図は文字切り出し手段で評価するパターンの組
み合せの例を示す組み合せ説明図、第6図は本発明の実
施例の動作を説明するための動作説明図、第7図は文字
切り出し用辞書に記憶した文字切り出し用辞書を説明す
るための概略説明図である。 図中、(1)は用紙、(2)は走査手段、(8)は文字
列パターン記憶手段、(4)は基本パターン領域検出手
段、(6)は文字評価値算出手段、(6)は文字切り出
し手段、(6)は文字切り出し用記憶手段、四は整合切
り出し手段、四は編集出力手段である。 なお図中同一あるいは相当部分には同一符号を付して表
示しである。 第1図     第2図 第6図 0口日ローX17 0ロー18 手続補正書(自発) 昭和60年11 r 日 2、発明の名称 文字パターン切り出し装置 3、補正をす5る者 事件との関係 特許出願人 代表者志岐守哉 4、代理人 5、補正の対象 6、補正の内容 (1)明細書第2頁第10行の「各々切り」という記載
を「各々の切り」と補正する。 (2)明細書第3頁第17行〜第18行の「以後、文字
列パターンと呼ぶ」という記載を「以後、r文字列パタ
ーン1と呼ぶ」と補正する。 (3)明細書第3頁第20行の「た、周辺分布値」とい
う記載を「た周辺分布値」と補正する。 (4)明細書第4頁第2行の「以後、基本パターンと呼
ぶ」という記載を「以後、r基本パターンJと呼ぶ」と
補正する。 (5)明細書第4頁第9行〜第10行の「以後、文字評
価値と呼ぶ」という記載を「以後、r文字評価値」と呼
ぶ」と補正する。 (8)明細書第9頁第8行の「構成でもって切り」とい
う記載を「構成で切り」と補正する。 (7)明細書第11頁第8行の「基本パターン領域(0
」という記載を「基本パターン領域検出手段(4)」と
補正する。 (8)明細書第15頁第17行のr文字切り出し用記憶
手段」という記載をr文字切り出し用辞書記憶手段」と
補正する。 以  上

Claims (1)

    【特許請求の範囲】
  1. 用紙などに記入された文字列から1文字ずつ文字パター
    ンを切り出す文字パターン切り出し装置において、用紙
    上の文字列を光学的に走査し光電変換する走査手段と、
    光電変換された上記文字列のパターンを記憶する文字列
    パターン記憶手段と、上記文字列の方向と直交する方向
    に上記文字列パターンを走査して求めた周辺分布値の連
    続性に基づいて文字列パターンを分割し、分割して得た
    基本パターンの左右端と上下端との座標より基本パター
    ン領域を決める基本パターン領域検出手段と、切り出し
    対象文字の基準パターンから求めた単独又は複数個の基
    本パターン領域の形状と大きさ及び位置関係とを格納し
    た文字切り出し用辞書を記憶する文字切り出し用辞書記
    憶手段と、上記基本パターン領域検出手段で検出した基
    本パターン領域の列を上記文字切り出し用辞書記憶手段
    に記憶した文字切り出し用辞書で整合が取れるか否かを
    調べ、整合のとれた基本パターン領域の組を文字パター
    ン領域として切り出す整合切り出し手段と、単独の基本
    パターン領域の文字評価値と連続する複数個の基本パタ
    ーン領域を結合した結合パターンに対応する領域の文字
    評価値とを上記基本パターン領域の左右端と上下端の座
    標から各々算出する文字評価値算出手段と、上記基本パ
    ターン領域の位置情報に基づいて切り出し候補位置のあ
    らゆる可能な組み合せを求め、各々切り出し候補位置の
    組み合せについて切り出し候補位置で切り出された基本
    パターンと結合パターンとに対応する上記文字評価値に
    基づいて切り出し評価値を求め、この切り出し評価値に
    基づく最適な文字切り出し位置の組み合せを決定する文
    字切り出し手段と、上記整合切り出し手段の結果と上記
    文字切り出し手段との結果に基づいて上記文字列のパタ
    ーンから、文字ずつ文字パターンを切り出して出力する
    編集出力手段とを具備し、上記整合切り出し手段で切り
    出すことができない上記文字列のパターンの部分領域に
    おいて上記文字切り出し手段を用いて文字パターンを切
    り出すことを特徴とする文字パターン切り出し装置。
JP60036165A 1985-02-25 1985-02-25 文字パタ−ン切り出し装置 Granted JPS61195474A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60036165A JPS61195474A (ja) 1985-02-25 1985-02-25 文字パタ−ン切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60036165A JPS61195474A (ja) 1985-02-25 1985-02-25 文字パタ−ン切り出し装置

Publications (2)

Publication Number Publication Date
JPS61195474A true JPS61195474A (ja) 1986-08-29
JPH0420507B2 JPH0420507B2 (ja) 1992-04-03

Family

ID=12462148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60036165A Granted JPS61195474A (ja) 1985-02-25 1985-02-25 文字パタ−ン切り出し装置

Country Status (1)

Country Link
JP (1) JPS61195474A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6482287A (en) * 1987-09-25 1989-03-28 Nippon Telegraph & Telephone Character segmenting, discriminating, and deciding system
JPH02220188A (ja) * 1989-02-22 1990-09-03 Nec Corp 文字認識装置
JPH0337782A (ja) * 1989-07-04 1991-02-19 Mitsubishi Electric Corp 文字パターン切り出し装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6482287A (en) * 1987-09-25 1989-03-28 Nippon Telegraph & Telephone Character segmenting, discriminating, and deciding system
JPH02220188A (ja) * 1989-02-22 1990-09-03 Nec Corp 文字認識装置
JPH0337782A (ja) * 1989-07-04 1991-02-19 Mitsubishi Electric Corp 文字パターン切り出し装置

Also Published As

Publication number Publication date
JPH0420507B2 (ja) 1992-04-03

Similar Documents

Publication Publication Date Title
JPH1166105A (ja) 手書き文書中の単語の索引付け方法及びマイクロプロセッサベースのシステム
JPH04195692A (ja) 文書読取装置
US7680329B2 (en) Character recognition apparatus and character recognition method
JPS63182793A (ja) 文字切り出し方式
JP2006238119A (ja) 情報抽出方法および情報抽出装置および情報抽出プログラムおよび記憶媒体
JPS61195474A (ja) 文字パタ−ン切り出し装置
JPH0728935A (ja) 文書画像処理装置
JPH0410087A (ja) 基本ライン抽出方法
JP2503208B2 (ja) 名刺画像処理方法
JPH0350692A (ja) 文字認識装置
JPH0467674B2 (ja)
JPH07220081A (ja) 画像認識装置の図形の切出し方法
JPH0550785B2 (ja)
JPS6254380A (ja) 文字認識装置
JPH0476159B2 (ja)
JPH08315069A (ja) 文字認識方法
JP2683116B2 (ja) 罫線の除去方法
JPH07120392B2 (ja) 文字パターン切り出し装置
JPH0728934A (ja) 文書画像処理装置
JPS63136291A (ja) 単語読み取り方式
JP2813601B2 (ja) 表形式文書認識装置
JPH0514952B2 (ja)
JPS59206989A (ja) 文字切り出し装置
CN115410207A (zh) 一种针对竖排文本的检测方法及装置
ANTONACOPOULOS Automatic reading of Braille documents

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term