JP2539026B2 - 文字切り出し装置 - Google Patents
文字切り出し装置Info
- Publication number
- JP2539026B2 JP2539026B2 JP1038785A JP3878589A JP2539026B2 JP 2539026 B2 JP2539026 B2 JP 2539026B2 JP 1038785 A JP1038785 A JP 1038785A JP 3878589 A JP3878589 A JP 3878589A JP 2539026 B2 JP2539026 B2 JP 2539026B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character pattern
- length
- continuous portion
- cut out
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
Description
切り出し、前記切り出された文字パターンを、前記文字
パターンから文字を認識する文字認識装置に送る文字切
り出し装置に関し、 連結文字を切り出すことを目的とし、 前記文字パターンを文字の並ぶ方向と垂直に投影し、
該投影の影の長さを求める文字パターン長さ検出手段
と、前記文字パターン長さ検出手段によって求められた
影の長さが予め決められた値より大きい場合に、前記文
字パターンの外郭点を求め、前記外郭点間の垂直方向の
距離が予め決められた値以下で且つ横方向に連続してい
る部分を検出する連続部分検出手段と、前記検出された
連続部分の長さが予め決められた値より大きい場合に、
前記連続部分を該連続部分を含む文字パターンから除去
して、複数の文字パターンとして切り出す切り出し手段
を有し、文字パターン長さ検出手段によって求められた
長さが予め決められた値より小さい文字パターンの場合
は前記文字パターンを切り出し、大きい場合は、連続線
分検出手段によって検出された連続部分を、切り出し手
段によって除去し、複数の文字パターンとして切り出す
構成とする。
する装置に関する。
入し、前記文字を枠毎に読み取った後に、文字認識装置
(以下、OCRと略す)で認識することが行われていた。
軽減を目的とした分野から、不特定多数を対象とした伝
票入力を可能とする分野に拡大してきているのが現状で
あり、記入上の制限を設けても、事実上これにそぐわな
い記入が行われる場合がある。その為、1つの文字枠に
1つの文字を記入するのでは無く、記入欄をブロック枠
とし、その中に文字を記入したいという要求があった。
を設けなくても、1文字ずつ分離されていれば、読み取
ることが可能と成っている。
る。3は入力装置でここでは光学的にイメージを読み取
る、4は前記2値イメージを記憶する画像メモリ、2は
文字切り出し装置、400は画像メモリに記憶されたイメ
ージからブロック枠に相当するイメージを指定もしくは
切り取るブロック枠切り取り装置で、予め与えられたブ
ロック枠の座標から前記処理を行う。300は文字認識装
置である。
いないブロック枠内に文字が記入されている場合は、前
記文字パターンを入力装置3が読み取った後に、2値イ
メージとして画像メモリ4に記録する。その後、ブロッ
ク枠切り取り装置で、ブロック枠内のイメージを切り取
り、更に、文字切り出し装置2によって、前記記録され
た文字パターンの垂直投影をとり、前記投影が無い所と
投影が有る所で文字を区別し、1文字毎に切り出した。
その後、前記1文字毎に切り出された文字は、文字認識
装置に送られ文字として認識された。
て記入してある場合は、前記の様に、垂直投影を取った
だけでは、繋がって書かれた文字パターンが1文字とし
て文字切り出し装置2によって、切り出され、文字認識
装置による文字認識が不可能となる。
れている文字パターンを、1文字ずつ切り出すことを可
能にすることである。
ーンを文字の並ぶ方向と垂直に投影し、該投影の影の長
さを求める文字パターン長さ検出手段と、前記文字パタ
ーン長さ検出手段によって求められた影の長さが予め決
められた値より大きい場合に、前記文字パターンの上下
各方向からの走査毎に該文字パターンの外郭点を求め、
該上下各方向から求めた外郭点間の垂直方向の距離が予
め決められた値以下で且つ横方向に連続している部分を
検出する連続部分検出手段と、前記検出された連続部分
の長さが予め決められた値より大きい場合に、前記連続
部分を該連続部分を含む文字パターンから除去して、複
数の文字パターンとして切り出す切り出し手段を設ける
構成とする。
予め決められた値より小さい文字パターンの場合は前記
文字パターンを切り出し、大きい場合は、連続線分検出
手段によって検出された連続部分を、切り出し手段によ
って除去し、複数の文字パターンとして切り出す。
ーチャート図、第2図は実施例の周辺装置の構成図、第
3図,第4図は前記文字切り出しプログラムの動作例の
説明図である。第1図中、211は文字パターン長さ検出
手段、212は連続部分検出手段、213は切り出し手段であ
る。第2図中、1はMPU、2は文字切り出しプログラ
ム、3は入力装置、4は画像メモリである。文字切り出
しプログラムはMPU1で起動し、従来例の文字切り出し装
置2に相当する。
4に2値化情報として記録される。
与えられたブロック枠の開始点31と終了点32とブロック
枠の高さ33情報をもとに垂直方向の投影をとる(第1図
フローチャート22)。前記処理は、第3図の様になる。
(黒ドットの長さ)を検出する(23)。第3図の場合、
11,12である。
点|÷C×α(C:ブロック枠記入文字数,α:文字種に
より決定される係数)}ならば、1の文字長を有する文
字塊は2文字以上と文字と判断する(24)。
郭点座標を求める(第1図フローチャート26及び第4図
参照)。第4図中の41は拡大図である。×は下からの外
郭点,は上からの外郭点である。
外郭点座標(xd,yd)とすると、 |yu−yd|≦m を満足する点を抽出し、前記条件を満足する外郭点の横
方向の連続的な長さFが、 F≧K(K≧1) ならば、連結線分と判断する(28)。第4図中では、点
AB間、点CD間が連結線分として抽出される。
(29)。具体的には第4図の先頭の「0」については、
点Aの一つ前の走査線上の点を文字部分の右端として切
り出す。2番目の「0」については、点Bの1つ次の走
査線上の点を左端として、点Cの1つ前を右端として切
り出す。3番目の「0」については、点Dの次の走査線
上の点を左端とし、文字塊の最終走査線を右端として切
り出す。上下方向の切り出し位置は、以下の様に決定す
る。上位置については、左右端で切り出された文字部分
について、上からの外郭点y座標の最小値を上位置とす
る。下位置については、左右端で切り出された文字部分
について、下からの外郭点y座標の最大値を下位置とす
る。
切り出しサイズが予め決められたサイズ内におさまるか
どうか判定され(202)、サイズ外の時は、前記判定さ
れた文字に対し、サイズ外であるという情報を設定する
(203)。
記文字パターンの外接四辺形で切り出される(第1図フ
ローチャート241)。
は、切り出された文字サイズに言及したが、本発明はそ
れにこだわる物では無い。上記に示す如く本発明は、本
発明の要旨に従い種々の変形が可能であり、それらを排
除するものでは無い。
ことが可能となり、記入者への負担をかけずにOCR入力
が可能となる。
チャート図、第2図は実施例の周辺装置の説明図、第3
図,第4図は前記文字切り出しプログラムの動作例の説
明図、第5図は従来例の装置構成図、第6図はブロック
枠に書かれた文字の説明図である。 1……MPU 2……文字切り出しプログラム 3,4……入力装置 211……文字パターン長さ検出手段 212……連続部分検出手段 213……切り出し手段
Claims (1)
- 【請求項1】2値化された画像メモリ上の文字パターン
から文字を切り出し、前記切り出された文字パターン
を、前記文字パターンから文字を認識する文字認識装置
に送る文字切り出し装置に於いて、 前記文字パターンを文字の並ぶ方向と垂直に投影し、該
投影の影の長さを求める文字パターン長さ検出手段と、 前記文字パターン長さ検出手段によって求められた影の
長さが予め決められた値より大きい場合に、前記文字パ
ターンの上下各方向からの走査毎に該文字パターンの外
郭点を求め、該上下各方向から求めた外郭点間の垂直方
向の距離が予め決められた値以下で且つ横方向に連続し
ている部分を検出する連続部分検出手段と、 前記検出された連続部分の長さが予め決められた値より
大きい場合に、前記連続部分を該連続部分を含む文字パ
ターンから除去して、複数の文字パターンとして切り出
す切り出し手段を有し、 文字パターン長さ検出手段によって求められた長さが予
め決められた値より小さい文字パターンの場合は前記文
字パターンを切り出し、大きい場合は、連続部分検出手
段によって検出された連続部分を、切り出し手段によっ
て除去し、複数の文字パターンとして切り出すことを特
徴とする文字切り出し装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1038785A JP2539026B2 (ja) | 1989-02-17 | 1989-02-17 | 文字切り出し装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1038785A JP2539026B2 (ja) | 1989-02-17 | 1989-02-17 | 文字切り出し装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02217978A JPH02217978A (ja) | 1990-08-30 |
JP2539026B2 true JP2539026B2 (ja) | 1996-10-02 |
Family
ID=12534954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1038785A Expired - Lifetime JP2539026B2 (ja) | 1989-02-17 | 1989-02-17 | 文字切り出し装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2539026B2 (ja) |
-
1989
- 1989-02-17 JP JP1038785A patent/JP2539026B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH02217978A (ja) | 1990-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH05242292A (ja) | 分離方法 | |
JPH07200732A (ja) | ワードオブジェクト抽出方法及びラスタ化イメージ内のノイズ除去方法 | |
US6947596B2 (en) | Character recognition method, program and recording medium | |
JP2539026B2 (ja) | 文字切り出し装置 | |
JPH0410087A (ja) | 基本ライン抽出方法 | |
JPS58197581A (ja) | 文字図形認識方法とその装置 | |
JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
JPH0991385A (ja) | 文字認識辞書追加方法及びこれを用いた端末ocr装置 | |
JPH10207981A (ja) | 帳票認識方法 | |
JP3122476B2 (ja) | 自動文書清書装置 | |
JPH0728935A (ja) | 文書画像処理装置 | |
JP2868392B2 (ja) | 手書き記号認識装置 | |
JP4040231B2 (ja) | 文字抽出方法及び装置並びに記憶媒体 | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
JPH04130979A (ja) | 文字画像切出し方法 | |
JP2795222B2 (ja) | 文字切り出し方法および文字切り出し装置 | |
JPH04309B2 (ja) | ||
JP2931485B2 (ja) | 文字切出し装置及び方法 | |
JP3196603B2 (ja) | バーコード認識方法及びシステム | |
JP3199033B2 (ja) | 光学式文字読取方法、及び光学式文字読取装置 | |
JP3190794B2 (ja) | 文字切り出し装置 | |
JP2923004B2 (ja) | 画像生成装置 | |
JP2618468B2 (ja) | 文書処理装置 | |
JP2925270B2 (ja) | 文字読取装置 | |
JP2671533B2 (ja) | 文字列認識方法及びその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080708 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090708 Year of fee payment: 13 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090708 Year of fee payment: 13 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090708 Year of fee payment: 13 |