JP2539026B2 - 文字切り出し装置 - Google Patents

文字切り出し装置

Info

Publication number
JP2539026B2
JP2539026B2 JP1038785A JP3878589A JP2539026B2 JP 2539026 B2 JP2539026 B2 JP 2539026B2 JP 1038785 A JP1038785 A JP 1038785A JP 3878589 A JP3878589 A JP 3878589A JP 2539026 B2 JP2539026 B2 JP 2539026B2
Authority
JP
Japan
Prior art keywords
character
character pattern
length
continuous portion
cut out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1038785A
Other languages
English (en)
Other versions
JPH02217978A (ja
Inventor
学 高倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1038785A priority Critical patent/JP2539026B2/ja
Publication of JPH02217978A publication Critical patent/JPH02217978A/ja
Application granted granted Critical
Publication of JP2539026B2 publication Critical patent/JP2539026B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔概要〕 2値化された画像メモリ上の文字パターンから文字を
切り出し、前記切り出された文字パターンを、前記文字
パターンから文字を認識する文字認識装置に送る文字切
り出し装置に関し、 連結文字を切り出すことを目的とし、 前記文字パターンを文字の並ぶ方向と垂直に投影し、
該投影の影の長さを求める文字パターン長さ検出手段
と、前記文字パターン長さ検出手段によって求められた
影の長さが予め決められた値より大きい場合に、前記文
字パターンの外郭点を求め、前記外郭点間の垂直方向の
距離が予め決められた値以下で且つ横方向に連続してい
る部分を検出する連続部分検出手段と、前記検出された
連続部分の長さが予め決められた値より大きい場合に、
前記連続部分を該連続部分を含む文字パターンから除去
して、複数の文字パターンとして切り出す切り出し手段
を有し、文字パターン長さ検出手段によって求められた
長さが予め決められた値より小さい文字パターンの場合
は前記文字パターンを切り出し、大きい場合は、連続線
分検出手段によって検出された連続部分を、切り出し手
段によって除去し、複数の文字パターンとして切り出す
構成とする。
〔産業上の利用分野〕
本発明は、連結して書かれた文字を1文字ずつに分離
する装置に関する。
〔従来の技術〕
従来、1文字ずつ文字枠を設定し、その中に文字を記
入し、前記文字を枠毎に読み取った後に、文字認識装置
(以下、OCRと略す)で認識することが行われていた。
然しながら、OCRの利用分野が特定の業務処理の入力
軽減を目的とした分野から、不特定多数を対象とした伝
票入力を可能とする分野に拡大してきているのが現状で
あり、記入上の制限を設けても、事実上これにそぐわな
い記入が行われる場合がある。その為、1つの文字枠に
1つの文字を記入するのでは無く、記入欄をブロック枠
とし、その中に文字を記入したいという要求があった。
近年、数字のみを入力する場合は、1文字毎の記入枠
を設けなくても、1文字ずつ分離されていれば、読み取
ることが可能と成っている。
第5図文字切り出し装置とその周辺装置の構成図であ
る。3は入力装置でここでは光学的にイメージを読み取
る、4は前記2値イメージを記憶する画像メモリ、2は
文字切り出し装置、400は画像メモリに記憶されたイメ
ージからブロック枠に相当するイメージを指定もしくは
切り取るブロック枠切り取り装置で、予め与えられたブ
ロック枠の座標から前記処理を行う。300は文字認識装
置である。
第6図(a)の様に1文字の書き込み枠が設けられて
いないブロック枠内に文字が記入されている場合は、前
記文字パターンを入力装置3が読み取った後に、2値イ
メージとして画像メモリ4に記録する。その後、ブロッ
ク枠切り取り装置で、ブロック枠内のイメージを切り取
り、更に、文字切り出し装置2によって、前記記録され
た文字パターンの垂直投影をとり、前記投影が無い所と
投影が有る所で文字を区別し、1文字毎に切り出した。
その後、前記1文字毎に切り出された文字は、文字認識
装置に送られ文字として認識された。
〔発明が解決しようとする課題〕
然し、第6図(b)の様に2文字以上の文字が繋がっ
て記入してある場合は、前記の様に、垂直投影を取った
だけでは、繋がって書かれた文字パターンが1文字とし
て文字切り出し装置2によって、切り出され、文字認識
装置による文字認識が不可能となる。
よって、本発明の目的は、2文字以上の文字が連結さ
れている文字パターンを、1文字ずつ切り出すことを可
能にすることである。
〔課題を解決する為の手段〕
上記の目的を達成する為に、本発明は、前記文字パタ
ーンを文字の並ぶ方向と垂直に投影し、該投影の影の長
さを求める文字パターン長さ検出手段と、前記文字パタ
ーン長さ検出手段によって求められた影の長さが予め決
められた値より大きい場合に、前記文字パターンの上下
各方向からの走査毎に該文字パターンの外郭点を求め、
該上下各方向から求めた外郭点間の垂直方向の距離が予
め決められた値以下で且つ横方向に連続している部分を
検出する連続部分検出手段と、前記検出された連続部分
の長さが予め決められた値より大きい場合に、前記連続
部分を該連続部分を含む文字パターンから除去して、複
数の文字パターンとして切り出す切り出し手段を設ける
構成とする。
〔作用〕
文字パターン長さ検出手段によって求められた長さが
予め決められた値より小さい文字パターンの場合は前記
文字パターンを切り出し、大きい場合は、連続線分検出
手段によって検出された連続部分を、切り出し手段によ
って除去し、複数の文字パターンとして切り出す。
〔実施例〕
第1図は実施例である文字切り出しプログラムのフロ
ーチャート図、第2図は実施例の周辺装置の構成図、第
3図,第4図は前記文字切り出しプログラムの動作例の
説明図である。第1図中、211は文字パターン長さ検出
手段、212は連続部分検出手段、213は切り出し手段であ
る。第2図中、1はMPU、2は文字切り出しプログラ
ム、3は入力装置、4は画像メモリである。文字切り出
しプログラムはMPU1で起動し、従来例の文字切り出し装
置2に相当する。
以下、図面に従って本発明の一実施例を説明する。
文字パターンは入力装置3から入力され、画像メモリ
4に2値化情報として記録される。
前記画像メモリ4内に記録された2値化情報は、予め
与えられたブロック枠の開始点31と終了点32とブロック
枠の高さ33情報をもとに垂直方向の投影をとる(第1図
フローチャート22)。前記処理は、第3図の様になる。
前記垂直投影(22)の結果から、横方向の文字の長さ
(黒ドットの長さ)を検出する(23)。第3図の場合、
11,12である。
次いで、第3図中の11,12が、 1≧s{s=|ブロック枠の開始点−ブロック枠の終了
点|÷C×α(C:ブロック枠記入文字数,α:文字種に
より決定される係数)}ならば、1の文字長を有する文
字塊は2文字以上と文字と判断する(24)。
前記文字の塊について、上及び下からの各走査毎の外
郭点座標を求める(第1図フローチャート26及び第4図
参照)。第4図中の41は拡大図である。×は下からの外
郭点,は上からの外郭点である。
さて、前記上からの外郭点座標(xu,yu),下からの
外郭点座標(xd,yd)とすると、 |yu−yd|≦m を満足する点を抽出し、前記条件を満足する外郭点の横
方向の連続的な長さFが、 F≧K(K≧1) ならば、連結線分と判断する(28)。第4図中では、点
AB間、点CD間が連結線分として抽出される。
次いで、連結線分として抽出された部分を分離する
(29)。具体的には第4図の先頭の「0」については、
点Aの一つ前の走査線上の点を文字部分の右端として切
り出す。2番目の「0」については、点Bの1つ次の走
査線上の点を左端として、点Cの1つ前を右端として切
り出す。3番目の「0」については、点Dの次の走査線
上の点を左端とし、文字塊の最終走査線を右端として切
り出す。上下方向の切り出し位置は、以下の様に決定す
る。上位置については、左右端で切り出された文字部分
について、上からの外郭点y座標の最小値を上位置とす
る。下位置については、左右端で切り出された文字部分
について、下からの外郭点y座標の最大値を下位置とす
る。
その後、文字塊の全走査が完了したら(201)、文字
切り出しサイズが予め決められたサイズ内におさまるか
どうか判定され(202)、サイズ外の時は、前記判定さ
れた文字に対し、サイズ外であるという情報を設定する
(203)。
尚、処理24で1文字と判断された文字パターンは、前
記文字パターンの外接四辺形で切り出される(第1図フ
ローチャート241)。
以上、実施例に従って本発明を説明した。実施例で
は、切り出された文字サイズに言及したが、本発明はそ
れにこだわる物では無い。上記に示す如く本発明は、本
発明の要旨に従い種々の変形が可能であり、それらを排
除するものでは無い。
〔効果〕
本発明によれば、ブロック枠内の続け字を認識させる
ことが可能となり、記入者への負担をかけずにOCR入力
が可能となる。
【図面の簡単な説明】
第1図は実施例である文字切り出しプログラムのフロー
チャート図、第2図は実施例の周辺装置の説明図、第3
図,第4図は前記文字切り出しプログラムの動作例の説
明図、第5図は従来例の装置構成図、第6図はブロック
枠に書かれた文字の説明図である。 1……MPU 2……文字切り出しプログラム 3,4……入力装置 211……文字パターン長さ検出手段 212……連続部分検出手段 213……切り出し手段

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】2値化された画像メモリ上の文字パターン
    から文字を切り出し、前記切り出された文字パターン
    を、前記文字パターンから文字を認識する文字認識装置
    に送る文字切り出し装置に於いて、 前記文字パターンを文字の並ぶ方向と垂直に投影し、該
    投影の影の長さを求める文字パターン長さ検出手段と、 前記文字パターン長さ検出手段によって求められた影の
    長さが予め決められた値より大きい場合に、前記文字パ
    ターンの上下各方向からの走査毎に該文字パターンの外
    郭点を求め、該上下各方向から求めた外郭点間の垂直方
    向の距離が予め決められた値以下で且つ横方向に連続し
    ている部分を検出する連続部分検出手段と、 前記検出された連続部分の長さが予め決められた値より
    大きい場合に、前記連続部分を該連続部分を含む文字パ
    ターンから除去して、複数の文字パターンとして切り出
    す切り出し手段を有し、 文字パターン長さ検出手段によって求められた長さが予
    め決められた値より小さい文字パターンの場合は前記文
    字パターンを切り出し、大きい場合は、連続部分検出手
    段によって検出された連続部分を、切り出し手段によっ
    て除去し、複数の文字パターンとして切り出すことを特
    徴とする文字切り出し装置。
JP1038785A 1989-02-17 1989-02-17 文字切り出し装置 Expired - Lifetime JP2539026B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1038785A JP2539026B2 (ja) 1989-02-17 1989-02-17 文字切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1038785A JP2539026B2 (ja) 1989-02-17 1989-02-17 文字切り出し装置

Publications (2)

Publication Number Publication Date
JPH02217978A JPH02217978A (ja) 1990-08-30
JP2539026B2 true JP2539026B2 (ja) 1996-10-02

Family

ID=12534954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1038785A Expired - Lifetime JP2539026B2 (ja) 1989-02-17 1989-02-17 文字切り出し装置

Country Status (1)

Country Link
JP (1) JP2539026B2 (ja)

Also Published As

Publication number Publication date
JPH02217978A (ja) 1990-08-30

Similar Documents

Publication Publication Date Title
JPH05242292A (ja) 分離方法
JPH07200732A (ja) ワードオブジェクト抽出方法及びラスタ化イメージ内のノイズ除去方法
US6947596B2 (en) Character recognition method, program and recording medium
JP2539026B2 (ja) 文字切り出し装置
JPH0410087A (ja) 基本ライン抽出方法
JPS58197581A (ja) 文字図形認識方法とその装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JPH10207981A (ja) 帳票認識方法
JP3122476B2 (ja) 自動文書清書装置
JPH0728935A (ja) 文書画像処理装置
JP2868392B2 (ja) 手書き記号認識装置
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP3710164B2 (ja) 画像処理装置及び方法
JPH04130979A (ja) 文字画像切出し方法
JP2795222B2 (ja) 文字切り出し方法および文字切り出し装置
JPH04309B2 (ja)
JP2931485B2 (ja) 文字切出し装置及び方法
JP3196603B2 (ja) バーコード認識方法及びシステム
JP3199033B2 (ja) 光学式文字読取方法、及び光学式文字読取装置
JP3190794B2 (ja) 文字切り出し装置
JP2923004B2 (ja) 画像生成装置
JP2618468B2 (ja) 文書処理装置
JP2925270B2 (ja) 文字読取装置
JP2671533B2 (ja) 文字列認識方法及びその装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080708

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090708

Year of fee payment: 13

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090708

Year of fee payment: 13

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090708

Year of fee payment: 13