JPS61190679A - 文字デ−タ処理装置 - Google Patents

文字デ−タ処理装置

Info

Publication number
JPS61190679A
JPS61190679A JP60029274A JP2927485A JPS61190679A JP S61190679 A JPS61190679 A JP S61190679A JP 60029274 A JP60029274 A JP 60029274A JP 2927485 A JP2927485 A JP 2927485A JP S61190679 A JPS61190679 A JP S61190679A
Authority
JP
Japan
Prior art keywords
character
character data
characters
histogram
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60029274A
Other languages
English (en)
Other versions
JPH0522947B2 (ja
Inventor
Toshio Matsuura
松浦 俊夫
Katsuhiko Nishikawa
克彦 西川
Tomomitsu Murano
朋光 村野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60029274A priority Critical patent/JPS61190679A/ja
Publication of JPS61190679A publication Critical patent/JPS61190679A/ja
Publication of JPH0522947B2 publication Critical patent/JPH0522947B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 本発明に係る技術的概要について述べると、当該装置は
、図面等に書かれた英数字文字等を走査した後文字認識
する前段階として文字パターンを個々に切出す装置であ
って、特に隣接する文字パターンの相互が接合している
場合接合文字パターンを個々に分離するものである。か
\る分離方法としては、接合領域内の文字パターンの線
幅についてヒストグラムをとり、そのヒストグラムパタ
ーンを分析して分離位置を決定するものである。
〔産業上の利用分野〕
本発明は、手書文字認識装置に関するものであり、特に
その前処理として文字切出データ処理装置に関する。
〔従来技術、および発明が解決しようとする問題点〕
手書文字を光学的に読取り文字認識するものとしてはO
CR装置が知られている。OCRg置の場合は一般に文
字書込枠が定められた用紙を用いて文字を手書きするか
ら、文字の個々の切出しは特に重要ではない。
ところが自由形式で書かれた文字を文字認識するOCR
装置、あるいは手書図面内の手書文字を読み取りコンピ
ュータ処理した図面を描画するCAD装置などでは、手
書文字区々の切出しが必要となる。
このような手書文字の切出しに当って、隣接する文字同
士が部分的に接合している場合、いかに分離するかが問
題となる。
c問題を解決するための手段〕 本発明においては、入力された英数字様の文字データパ
ターンを個々に切出す際隣接する文字データパターンの
少くとも一部が相互に接合していることを検出する文字
切出手段、該文字切出手段で検出された接合する文字デ
ータパターンの所定の領域について所定の接続関係を保
持し一の方向から文字データパターンの線幅についてヒ
ストグラムを算出する手段、および、該ヒストグラム算
出手段で算出されたヒストグラムのパターンに応じて接
合する文字データパターンを2つの文字データパターン
に分離すべき位置を決定して接合する文字データパター
ンを分離する手段、を具備する、文字データ処理装置が
提供される。
〔作 用〕
接合文字データパターンが検出された場合、接合文字デ
ータパターンの所定の領域における文字データパターン
の線幅についてヒストグラムを求め、そのヒストグラム
のパターンに応じた分離位置を定める。
〔実施例〕
本発明の実施例について添付図面を参照して以下に述べ
る。
第1図は本発明の文字データ処理装置の一構成例を示す
。1は図形走査データを記憶しておく画像メモリ、2は
文字領域決定部、3は文字枠抽出部、4は接触領域設定
部、5は投影ヒストグラム算出部、6は分離位置決定部
、7は文字分離部である。
第2図は第1図に図示の装置の処理の概要を示すフロー
チャートである。第2図に図示のフローチャートに沿っ
て第1図に図示の装置の動作を述べろ。
先ず、切分けすべき手書文字が書かれた図面を光学的に
走査した結果が画像メモリーにストアされている。該画
像メモリー内から走査データをロードする(ステップ5
01)。か\るロードされたデータについて文字領域決
定部2において文字領域を決定する(502)。決定さ
れた文字領域について文字枠を抽出して文字個々の切出
し処理を文字枠抽出部3にて行う (SO3)。文字個
々の切出しは、例えば、文字の高さhに対し1文字の横
幅Wが−h以内にあるものとして識別する。すなわちか
−る横幅Wを基準として隣接してはいるが離れて書かれ
ている文字を区分していく。
但し、ここで対象とする文字は、アルファベット、数字
又はこれらに類似するものであって、平仮名、カタカナ
、漢字等は対象としていない。
以上の処理において、横幅W内に分離域が存在しない場
合、すなわち第3図(a)に図示する如く、文字にとL
の一部が接触している場合が検出されると(SO4)、
以下に述べる分離処理を行う。
先ず矩形領域設定部4において分離すべき位置決めの対
象となる矩形領域を設定する(SO5)。
矩形領域の設定としては、第3図(a)に図示の如く、
文字にとLの両端E1〜E2の中心Pに対し、左右に閾
値α・αは線幅より少し大きめにとる・たけ拡げた8点
およびe点と、文字の高さhで囲まれた範囲とする。
次いで該矩形領域内の文字データパターンについての線
幅のヒストグラムを投影ヒストグラム抽出部5において
算出する(SO6)。ヒストグラムのとり方としては、
第3図(b)に図示の如く、矩形領域内の文字パターン
について、X線に沿ってY軸方向における文字データパ
ターンの線幅を計数する。但し、線幅の計数に際しては
、第3図(b)中白抜きで示したように終端した先端で
あって他と連続性のない部分についてはヒストグラムの
対象とはしない。従って第3図(b)中、ヒストグラム
の対象となる文字データパターンの対象の線幅とは、斜
線を施した部分のみである。これにより得られたヒスト
グラムを第3図(c)に示す。
ここで得られる接触部のヒストグラムのパターンについ
て考察すると、基本的に第3図(d)、第4図(d)、
第5図(b)、第6図(b)に図示の如き形状になるこ
とが見出された。その接触部のパターンはそれぞれ第3
図(b)、第4図(b)、第5図(a)、第6図(a)
の場合に相当する。
第3図(C)に図示のパターン、これをパターン1と呼
ぶ、はヒストグラムの基準値Nに対して、それ以上のピ
ーク値があり、そのピークが右側に立上っている場合で
あり、接触文字の分離位置Xnは第3図(d)に図示の
如く立上り部であるとする。
第4図(c)の場合は、文字りとDとが重なった場合で
(第4図(a) (b)、そのヒストグラムは基準値N
以上のピーク値があり、しかもピークかは譬′中央にあ
る。従って分離位置Xnは第4図(d)に図示の如くピ
ークの中央とすることができる。これをパターン2とす
る。
第5図(a) (b)の場合は、第3図に図示の場合と
逆で左側に立上っている場合である。これをパターン3
とする。
第6図(a) (b)はヒストグラム基準値N以上にピ
ークがなく且つヒストグラムは平坦である。この場合の
分離位置Xnは区間Sとeの中央と考えられる。
従って第3図(C)のヒストグラムのパターンの場合は
第3図(d)の立上部を分離位置Xnとする(ステップ
SO7,SO9,Sl 1.513)。
他のヒストグラムパターンの場合は、それぞれのヒスト
グラムパターンに応じた分離位置Xnを決定する(ステ
ップ308.SIO,512)。
このようにして分離位置Xnが決定されたら、この位置
情報に基いて接触する文字を、文字分離部7で2つに分
離する(ステップ514)。
〔発明の効果〕
以上に述べたように本発明によれば、文字と文字が接触
したデータでも一文字づつ分離することが可能となり手
書図面、フリーフォーマット帳表、文字枠なしOCR用
紙等の文字切出しにも対処できるようになる。
【図面の簡単な説明】
第1図は本発明の文字データ処理装置の一実施例として
の構成図、第2図は第1図装置の処理の流れを示すフロ
ーチャート、第3図(a)〜(d)、第4図(a) 〜
(d)第5図(a)、(b) 、第6図(a)。 (b)は接触文字パターンと分離する位置を決定するた
めの説明図である。 (符号の説明) 1・−・画像メモリ、 2−文字領域決定部、 3−文字枠抽出部、 4・−・矩形領域設定部、 5・−投影ヒストグラム抽出部、 6・−・分離位置決定部、 7−文字分離部。

Claims (1)

  1. 【特許請求の範囲】 1、入力された英数字様の文字データパターンを個々に
    切出す際隣接する文字データパターンの少くとも一部が
    相互に接合していることを検出する文字切出手段、 該文字切出手段で検出された接合する文字データパター
    ンの所定の領域について所定の接続関係を保持し一の方
    向から文字データパターンの線幅についてヒストグラム
    を算出する手段、および、該ヒストグラム算出手段で算
    出されたヒストグラムのパターンに応じて接合する文字
    データパターンを2つの文字データパターンに分離すべ
    き位置を決定して接合する文字データパターンを分離す
    る手段、 を具備する、文字データ処理装置。
JP60029274A 1985-02-19 1985-02-19 文字デ−タ処理装置 Granted JPS61190679A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60029274A JPS61190679A (ja) 1985-02-19 1985-02-19 文字デ−タ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60029274A JPS61190679A (ja) 1985-02-19 1985-02-19 文字デ−タ処理装置

Publications (2)

Publication Number Publication Date
JPS61190679A true JPS61190679A (ja) 1986-08-25
JPH0522947B2 JPH0522947B2 (ja) 1993-03-31

Family

ID=12271700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60029274A Granted JPS61190679A (ja) 1985-02-19 1985-02-19 文字デ−タ処理装置

Country Status (1)

Country Link
JP (1) JPS61190679A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63298493A (ja) * 1987-05-28 1988-12-06 Matsushita Electric Ind Co Ltd 光学文字読取装置
JPS6436385A (en) * 1987-07-31 1989-02-07 Matsushita Electric Ind Co Ltd Character recognition device
JPH0344789A (ja) * 1989-07-12 1991-02-26 Hamamatsu Photonics Kk 文字自動抽出装置
JPH05166010A (ja) * 1991-12-17 1993-07-02 Omron Corp 文字切出方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56166587A (en) * 1980-05-28 1981-12-21 Toshiba Corp Character segmenting system
JPS575181A (en) * 1980-06-10 1982-01-11 Toshiba Corp Character detection and segmentation system
JPS59160274A (ja) * 1983-03-02 1984-09-10 Hitachi Ltd 文字切出し方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56166587A (en) * 1980-05-28 1981-12-21 Toshiba Corp Character segmenting system
JPS575181A (en) * 1980-06-10 1982-01-11 Toshiba Corp Character detection and segmentation system
JPS59160274A (ja) * 1983-03-02 1984-09-10 Hitachi Ltd 文字切出し方式

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63298493A (ja) * 1987-05-28 1988-12-06 Matsushita Electric Ind Co Ltd 光学文字読取装置
JPS6436385A (en) * 1987-07-31 1989-02-07 Matsushita Electric Ind Co Ltd Character recognition device
JPH0344789A (ja) * 1989-07-12 1991-02-26 Hamamatsu Photonics Kk 文字自動抽出装置
JPH05166010A (ja) * 1991-12-17 1993-07-02 Omron Corp 文字切出方法

Also Published As

Publication number Publication date
JPH0522947B2 (ja) 1993-03-31

Similar Documents

Publication Publication Date Title
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP2940936B2 (ja) 表領域識別方法
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP3411472B2 (ja) パターン抽出装置
JPH04195692A (ja) 文書読取装置
JP2006338578A (ja) 文字認識装置
JPH1031716A (ja) 文字行抽出方法および装置
JPS61190679A (ja) 文字デ−タ処理装置
JPH0410087A (ja) 基本ライン抽出方法
JP4847378B2 (ja) 画像処理装置、画像処理方法、プログラム及びコンピュータ読取可能な記録媒体
JP4242962B2 (ja) 文字切出装置
JP3197441B2 (ja) 文字認識装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH04130979A (ja) 文字画像切出し方法
JPS5949671A (ja) 光学的文字読取装置
JPH10162104A (ja) 文字認識装置
JPH05174185A (ja) 日本語文字認識装置
JPH0728933A (ja) 文字認識装置
JP2022020277A (ja) 情報処理装置、情報処理方法及びプログラム
JPH06223224A (ja) 行切出し方法
JP2925270B2 (ja) 文字読取装置
JPH01280887A (ja) 文字認識方法
JPH01265378A (ja) 欧文文字認識方式
JPH10134145A (ja) 文字切り出し方法およびそれを用いた文字認識装置と、その文字切り出し方法を実行するプログラムを格納した、コンピュータが読取可能な記憶媒体
JPH04343192A (ja) 文字認識装置の文字切り出し方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees