JPH0420507B2 - - Google Patents

Info

Publication number
JPH0420507B2
JPH0420507B2 JP60036165A JP3616585A JPH0420507B2 JP H0420507 B2 JPH0420507 B2 JP H0420507B2 JP 60036165 A JP60036165 A JP 60036165A JP 3616585 A JP3616585 A JP 3616585A JP H0420507 B2 JPH0420507 B2 JP H0420507B2
Authority
JP
Japan
Prior art keywords
character
pattern
cutting
basic pattern
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP60036165A
Other languages
English (en)
Other versions
JPS61195474A (ja
Inventor
Fumio Yoda
Yoji Maeda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP60036165A priority Critical patent/JPS61195474A/ja
Publication of JPS61195474A publication Critical patent/JPS61195474A/ja
Publication of JPH0420507B2 publication Critical patent/JPH0420507B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、文書に記入された文字列から文字
パターンを切り出す文字パターン切り出し装置に
関するものである。
〔従来の技術〕
文字を認識するには、用紙に記入された文字を
光電変換し、文字の部分、背景の部分に対応して
1,0の信号に2値化変換した文字パターンから
1文字づつ文字パターンを切り出さなければなら
ない。第2図は従来のこの種の装置の構成を示す
図であり、図中1は用紙、2は用紙1上に記入さ
れた文字列を光学的に走査して光電変換する走査
手段、3は光電変換された文字列のパターン(以
後、『文字列パターン』と呼ぶ)を記憶する文字
列パターン記憶手段、4は上記文字列と直交する
方向に文字列パターンを走査して求めた周辺分布
値の連続性に基づき、上記文字列パターンを分割
して求めたパターン(以後、『基本パターン』と
呼ぶ)の左右端と上下端の座標より基本パターン
領域を検出する基本パターン領域検出手段、5は
基本パターン領域検出手段4で求めた基本パター
ン領域の位置情報から単独の基本パターン及び連
続する複数個の基本パターン領域を結合したパタ
ーン(以後「結合パターン」と呼ぶ)のそれぞれ
が、どの程度1文字のパターンらしいかを定量化
した値(以後『文字評価値』と呼ぶ)を計算する
文字評価値算出手段、6は上記文字評価値算出手
段5で求めた文字評価値の大きさに基づき切り出
すべき文字パターンの位置を決定する文字切り出
し手段、7は文字切り出し手段6で決定した文字
パターン切り出し位置に基づいて文字列パターン
記憶手段3から1文字づつ文字パターンを切り出
す出力手段である。
第3図は、第2図の上記基本パターン領域検出
手段4による処理の一例を示す図である。図中8
は文字列パターン、9は周辺分布値、10は基本
パターンの例であり、該基本パターンと対応する
基本パターン領域を短形で囲つて示してある。
第4図は、第2図に示された文字評価値算出手
段5で文字評価値を算出する為の基本パターンと
結合パターンの例である。
第5図は、第2図の文字切り出し手段6で文字
を切り出すために発生させる基本パターン又は結
合パターンの組み合せの例を示す図である。
次に第2図〜第5図を用いて第2図に示す従来
のこの種装置の動作について説明する。まず用紙
1上の文字列は走査手段2で光電変換され、文字
列パターン記憶手段3に格納される。次に文字列
パターン記憶手段3内の文字列パターン「設計」
8は基本パターン領域検出手段4に渡される。
基本パターン領域検出手段4では、文字列と直
交する上下方向に文字列パターンを走査して作成
した周辺分布値9が所定の閾値をこえる領域の連
続性に基づいて文字列パターン「設計」8を分割
し、分割して得た各基本パターン「言」、「〓」、
「言」、「〓」10の左右端と上下端の座標を基本
パターン領域として検出する。
次に、文字評価値算出手段5では、第4図の例
に示すように単独の基本パターン領域と、連続す
る複数個の基本パターン領域を結合した結合パタ
ーンの領域とのすべてに対し、基本パターン領域
の位置情報から求めたパターンの形状やパターン
間に存在する空白部分の広さ等に基づいて文字領
域らしさを示す文字評価値を算出する。
そして文字切り出し手段6では、上記基本パタ
ーン領域間の境界点を文字列パターンの切り出し
候補位置とし、この各切り出し候補位置のあらゆ
る可能な組み合せにより第5図に示すすべての可
能な切り出しパターンの組み合せを求める。そし
て次に各切り出し候補位置の組について切り出し
候補位置で切り出されたパターンに対応する基本
パターンあるいは結合パターンの上記文字評価値
算出手段5で計算した文字評価値に基づいて切り
出し評価値を求め、この切り出し評価値に基づい
て最適な文字切り出し位置の組を決定する。その
次に出力手段7は、上記文字切り出し手段6で決
定した文字切り出し位置の組の情報に基づいて上
記文字列パターン記憶手段3から1文字ずつ文字
パターンを切り出して出力する。
〔発明が解決しようとする問題点〕
従来の文字パターン切り出し装置は以上のよう
に、文字評価値算出手段において単独の基本パタ
ーン領域と連続する複数個の基本パターン領域を
結合して発生する結合パターンの領域すべてに対
しどの程度文字領域らしいかを示す文字評価値を
計算し、文字切り出し手段でこれらの基本パター
ンと結合パターンのすべての組み合せの中から最
適な組を検出するように構成されているので1行
すべての基本パターンに対して処理を行つた場
合、基本パターンの組み合せのケースが膨大な数
となり切り出し処理時間がかかるという問題点が
あつた。
更に、日本語には、文字パターンに外接する短
形の形状が正方形に近い一般の文字とは特徴を異
にする「一」、「二」、「、」、「”」などの特殊な形

の文字が存在するため、これらすべての文字パタ
ーンに対し文字評価値を精度よく求めるには複雑
な文字評価値算出式を使わねばならなかつた。こ
のため従来の装置では文字評価値算出手段の構成
が極めて複雑になり装置が高価になるという問題
点があつた。
この発明は上記のような問題点を解消するため
になされたもので構成を簡単にし、かつ切り出し
処理時間を速くした文字パターン切り出し装置を
得ることを目的とする。
〔問題点を解決するための手段〕
この発明に係る文字パターン切り出し装置は、
切り出し対象文字の基本パターンから求めた単独
又は複数個の基本パターン領域の形状、大きさ及
び配置関係等の情報を格納した文字切り出し用辞
書を記憶する文字切り出し用辞書記憶手段と、文
字切り出し用辞書記憶手段に記憶した文字切り出
し用辞書に基づいて文字列をパターンから文字で
ある確率の高いパターンを切り出す整合切り出し
手段とを付加したものである。
〔作用〕
この発明における文字パターン切り出し装置
は、まず整合切り出し手段で1行の文字列パター
ンより上記特殊な文字を含む文字である確率の高
い文字パターンを切り出し、次に整合切り出し手
段では切り出すことの出来ない文字パターンを文
字列パターンの部分領域から文字評価値算出手段
と文字切り出し手段とで切り出すことにより、単
純な構成で切り出し処理時間を早くすることがで
きる。
〔実施例〕
以下、図面を用いて詳細に説明する。
第1図は、この発明の実施例の構成を示す図で
ある。図中1,2,3,4,5,6は上記従来装
置と同一のものである。11は、切り出し対象文
字の基準パターンから求めた単独又は複数個の基
本パターン領域の形状、大きさ及び配置関係等の
情報を格納した文字切り出し用辞書を記憶する文
字切り出し用辞書記憶手段11である。12は、
上記文字切り出し用辞書記憶手段に記憶した文字
切り出し用辞書と文字列パターンから抽出した単
独又は複数個の基本パターン領域との整合を図
り、整合のとれた基本パターン領域の組み合せを
1文字として切り出す整合切り出し手段である。
13は、上記整合切り出し手段12で切り出した
パターンの位置情報と上記文字切り出し手段6で
切り出したパターンの位置情報とを編集して上記
文字列パターン記憶手段3から1文字ずつ文字パ
ターンを切り出す編集出力手段である。
第6図は、本発明の実施例の動作を説明するた
めの図であり、図中14は文字列パターンの一
例、15はこの文字列パターンから抽出した基本
パターン領域、16は整合切り出し手段12で切
り出したパターン領域、17は文字切り出し手段
6に転送される基本パターン領域、18は文字切
り出し手段6で切り出したパターンの領域であ
る。
第7図は、文字切り出し用辞書記憶手段11に
記憶した文字切り出し用辞書に格納した句読点パ
ターンの整合条件の概念を説明するための図であ
り、図中19は切り出し対象である基本パターン
領域Pi、20は基本パターン領域Piの左横に存在
する基本パターン領域Pi-1、21は基本パターン
領域Piの右横に存在する基本パターン領域Pi+1
ある。
次に、第1図に示す実施例の動作を説明する。
まず用紙1上に記入された文字列は走査手段2
で光電変換され、この結果得た1行分の文字列パ
ターン14は、文字列パターン記憶手段3に格納
される。次に文字列パターン14は、基本パター
ン領域検出手段4に渡される。基本パターン領域
検出手段4では、文字列パターン14から基本パ
ターン「年」、「一」、「回」、「、」、「言」、「〓
」、
「言」、「〓」、「す」、「る」を抽出し各基本パター
ンに外接する短形に対応する左右端、上下端の座
標などの基本パターン領域15の位置情報を求め
て上記整合切り出し手段12に転送する。
次に、整合切り出し手段12では、上記基本パ
ターン領域の位置情報から文字切り出し用辞書記
憶手段11に記憶した文字切り出し用辞書と整合
のとれる基本パターン領域16を検出する。そし
てこれら整合のとれた基本パターン領域の組の位
置情報を編集出力手段13に転送し、また文字切
り出し用辞書記憶手段11に記憶した文字切り出
し用辞書と整合のとれない基本パターン領域17
の情報を文字評価値算出手段5に送り従来の方法
で文字パターンを切り出す。
次に文字切り出し用辞書記憶手段11と整合切
り出し手段12について更に詳しく説明する。文
字切り出し用辞書記憶手段11は、切り出し対象
文字の基準パターンから求めた単独又は複数個の
基本パターン領域の形状と大きさと配置関係など
の条件を記述した文字切り出し用辞書を記憶する
ことにより構成する。例えば第7図は、文字切り
出し用辞書記憶手段に記憶した文字切り出し用辞
書に格納した句読点パターンを切り出すための整
合条件の概念を示した図であり、基本パターン領
域Pi19の幅Wiが所定の閾値THWより小さくか
つ基本パターン領域Pi19の上端Xiが左右の基本
パターン領域Pi-120とPi+121の中点Ci-1とCi+1
より下方に存在する条件を基本パターン領域Pi
9が句読点の領域の整合条件として登録したもの
である。一方整合切り出し手段12は、切り出し
対象の基本パターン領域の組が上記した整合条件
を満足した場合、切り出し対象の基本パターン領
域の組を1文字として切り出すように構成する。
次に文字切り出し用辞書記憶手段11に記憶し
た文字切り出し用辞書と整合がとれない基本パタ
ーン領域の処理について説明する。
上記整合切り出し手段12で整合のとれない基
本パターン領域の列は従来の装置と同様に文字評
価値算出手段5と文字切り出し手段6とにより切
り出しパターンの可能なすべての組み合せについ
て評価を行い最も高い評価が与えられる切り出し
候補点の組を検出し、この情報を編集出力手段1
3に転送する。例えば第6図では、整合がとれな
い基本パターン領域17のすべての可能な組み合
せに対し評価を行いパターン「設」「計」なる領
域を切り出す。
最後に編集出力手段13では、整合切り出し手
段12で切り出したパターンの位置情報と文字切
り出し手段6で切り出したパターンの位置情報を
編集した結果に基づいて1文字ずつ文字パターン
を切り出し、外部装置へ転送する。すなわち第6
図の例では、整合切り出し手段12で切り出した
基本パターン領域16の切り出し位置と文字切り
出し手段6で切り出した領域18の切り出し位置
を左から順に並べ換えて文字列パターン14か1
文字ずつ文字パターンを切り出して転送する。
なお、上記実施例では、横書きの文字列から文
字を切り出す場合について説明したが、この発明
はこれに限らず、縦書きの文字列から文字を切り
出す場合に用いてもよい。
また、整合切り出し手段で1つの基本パターン
領域を1文字のパターン領域として切り出す場合
についてのみ説明したが、これに限らず2個以上
の基本パターン領域を1文字のパターン領域とし
て結合して切り出してもよい。
〔発明の効果〕
以上のように、この発明によれば整合切り出し
手段で切り出せないパターンだけを文字切り出し
手段で切り出すように構成したので、簡単な構成
でしかも高速に文字パターンを切り出すことので
きる装置が得られる効果がある。
【図面の簡単な説明】
第1図はこの発明の一実施例による文字パター
ン切り出し装置の全体構成図、第2図は従来の文
字パターン切り出し装置の全体構成図、第3図は
基本パターン領域検出手段の処理例の説明図、第
4図は文字評価値算出手段で文字評価値を算出す
るパターンの例を示すパターン説明図、第5図は
文字切り出し手段で評価するパターンの組み合せ
の例を示す組み合せ説明図、第6図は本発明の実
施例の動作を説明するための動作説明図、第7図
は文字切り出し用辞書に記憶した文字切り出し用
辞書を説明するための概略説明図である。 図中、1は用紙、2は走査手段、3は文字列パ
ターン記憶手段、4は基本パターン領域検出手
段、5は文字評価値算出手段、6は文字切り出し
手段、11は文字切り出し用辞書記憶手段、12
は整合切り出し手段、13は編集出力手段であ
る。なお同一図中あるいは相当部分には同一符号
を付して表示してある。

Claims (1)

    【特許請求の範囲】
  1. 1 用紙などに記入された文字列から1文字ずつ
    文字パターンを切り出す文字パターン切り出し装
    置において、用紙上の文字列を光学的に走査し光
    電変換する走査手段と,光電変換された上記文字
    列のパターンを記憶する文字列パターン記憶手段
    と、上記文字列の方向と直交する方向に上記文字
    列パターンを走査して求めた周辺分布値の連続性
    に基づいて文字列パターンを分割し、分割して得
    た基本パターンの左右と上下端との座標より基本
    パターン領域を決める基本パターン領域検出手段
    と、切り出し対象文字の基準パターンから求めた
    単独又は複数個の基本パターン領域の形状と大き
    さ及び位置関係とを格納した文字切り出し用辞書
    を記憶する文字切り出し用辞書記憶手段と、上記
    基本パターン領域検出手段で検出した基本パター
    ン領域の列を上記文字切り出し用辞書記憶手段に
    記憶した文字切り出し用辞書で整合が取れるか否
    かを調べ、整合のとれた基本パターン領域の組を
    文字パターン領域として切り出す整合切り出し手
    段と、単独の基本パターン領域の文字評価値と連
    続する複数個の基本パターン領域を結合した結合
    パターンに対応する領域の文字評価値とを上記基
    本パターン領域の左右端と上下端の座標から各々
    算出する文字評価値算出手段と、上記基本パター
    ン領域の位置情報に基づいて切り出し候補位置の
    あらゆる可能な組み合せを求め、各々の切り出し
    候補位置の組み合せについて切り出し候補位置で
    切り出された基本パターンと結合パターンとに対
    応する上記文字評価値に基づいて切り出し評価値
    を求め、この切り出し評価値に基づく最適な文字
    切り出し位置の組み合せを決定する文字切り出し
    手段と、上記整合切り出し手段の結果と上記文字
    切り出し手段との結果に基づいて上記文字列のパ
    ターンから1文字ずつ文字パターンを切り出して
    出力する編集出力手段とを具備し、上記整合切り
    出し手段で切り出すことができない上記文字列の
    パターンの部分領域において上記文字切り出し手
    段を用いて文字パターンを切り出すことを特徴と
    する文字パターン切り出し装置。
JP60036165A 1985-02-25 1985-02-25 文字パタ−ン切り出し装置 Granted JPS61195474A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60036165A JPS61195474A (ja) 1985-02-25 1985-02-25 文字パタ−ン切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60036165A JPS61195474A (ja) 1985-02-25 1985-02-25 文字パタ−ン切り出し装置

Publications (2)

Publication Number Publication Date
JPS61195474A JPS61195474A (ja) 1986-08-29
JPH0420507B2 true JPH0420507B2 (ja) 1992-04-03

Family

ID=12462148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60036165A Granted JPS61195474A (ja) 1985-02-25 1985-02-25 文字パタ−ン切り出し装置

Country Status (1)

Country Link
JP (1) JPS61195474A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2571236B2 (ja) * 1987-09-25 1997-01-16 日本電信電話株式会社 文字切出し識別判定方法
JPH02220188A (ja) * 1989-02-22 1990-09-03 Nec Corp 文字認識装置
JPH0337782A (ja) * 1989-07-04 1991-02-19 Mitsubishi Electric Corp 文字パターン切り出し装置

Also Published As

Publication number Publication date
JPS61195474A (ja) 1986-08-29

Similar Documents

Publication Publication Date Title
JPH0420507B2 (ja)
JPS6254380A (ja) 文字認識装置
JPS62121589A (ja) 文字切出し方法
JPH0728935A (ja) 文書画像処理装置
JPH0550785B2 (ja)
JPH0713994A (ja) 文字認識装置
JPH0210472B2 (ja)
JPH0337782A (ja) 文字パターン切り出し装置
JPH0467674B2 (ja)
JPS603078A (ja) 文字認識方法
JPH07160810A (ja) 文字認識装置
JP3071479B2 (ja) 行間スペース検出方法
JP2571826B2 (ja) 文字列パターン切り出し装置
JPS60238986A (ja) 文字認識装置のパタ−ンマツチング方式
JPH03268181A (ja) 文書読み取り装置
JPH0514952B2 (ja)
JPS60181880A (ja) 光学的文字入力装置
JPH0242589A (ja) 文字パターン切り出し装置
JPH0576674B2 (ja)
JPS6172373A (ja) 認識装置
JPS59206989A (ja) 文字切り出し装置
JPS6160187A (ja) 文字認識装置
JPS59206987A (ja) 文字認識装置
JPS63128490A (ja) 文字イメージ抽出処理装置
JPH03268191A (ja) 光学式文字読取装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term