JPS63223988A - 文字列領域設定方式 - Google Patents

文字列領域設定方式

Info

Publication number
JPS63223988A
JPS63223988A JP62058621A JP5862187A JPS63223988A JP S63223988 A JPS63223988 A JP S63223988A JP 62058621 A JP62058621 A JP 62058621A JP 5862187 A JP5862187 A JP 5862187A JP S63223988 A JPS63223988 A JP S63223988A
Authority
JP
Japan
Prior art keywords
character string
circuit
character
area
inclination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62058621A
Other languages
English (en)
Inventor
Michiko Iwasaki
岩崎 美知子
Yasukazu Ito
伊藤 能一
Masashige Yamamoto
山本 正成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62058621A priority Critical patent/JPS63223988A/ja
Publication of JPS63223988A publication Critical patent/JPS63223988A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 文字列領域設定方式であって、検出した文字列から傾き
を求め、文字列に沿った座標軸を設定する。そして、文
字列の各要素から座標軸までの距離を計算して、それを
基にして文字列を囲む矩形領域を求めることにより、正
確に文字列領域を設定することができる。
〔産業上の利用分野〕
本発明は、文字列領域設定方式に関し、特に、読み取っ
た画像データから文字列を認識して、データ処理を行な
うときの文字列領域設定方式に関するものである。
〔従来の技術〕
図面(機械図、プラント図面等)や文字原稿などの画像
情報を計算機に自動入力して処理を行なおうとすると、
スキャナで読み取った画像データの中から文字や記号か
らなる文字列を抽出し、その文字列を囲む領域を指定す
る必要がある。
第4図は、文字列“EYX”の座標説明図である。図に
おいて、文字列“EYX”を囲む口ERQPを求める場
合を考える。
最初に、文字列“EYX”を検出し、それを含み水平軸
に平行な口ABCDを設定する。そして、文字列の文字
矩形領域の中心を結んだ角度から傾きを求める。
次に、口ABCDの平行な2辺(例えば辺ADと辺BC
)に着目し、それら2辺の内側で文字を構成している画
素(文字を黒色とすると黒画素)を検索する。そして、
検索した画素の中で水平座標が最小の画素と最大の画素
を通り、文字列の傾きと同方向及び垂直方向の直線を引
く。
第4図において、水平座標が最小の画素は点Pであり、
傾きと同方向の直線は点Pと点Qを通る直線、垂直方向
の直線は点Pと点Eを通る直線となる。同様に、水平座
標が最大の画素は点Rであり、傾きと同方向の直線は点
Rと点Eを通る直線、垂直方向の直線は点Rと点Qを通
る直線となる。
上述のようにして引かれた4本の直線で囲まれた領域(
口ERQP)を求め、その外側に画素があれば、外接四
角形を変更して文字列領域を決定していた。
〔発明が解決しようとする問題点〕
ところで、上述した従来方式にあっては、最初に設定し
た水平軸に平行な口ABCDの中に、文字以外の要素(
例えば図形を構成する直線や曲線)が存在すると、それ
らの画素を検出して外接四角形を変更してしまい、正確
な文字列領域を設定することができないという問題点が
あった。そして、文字列以外に線分を含めた文字列領域
を設定すると、それ以降の文字認識に支障をきたすこと
になる。
本発明は、このような点にかんがみて創作されたもので
あり、正確に文字列領域を設定することができるように
した文字列領域設定方式を提供することを目的としてい
る。
〔問題点を解決するための手段〕
第1図は、本発明の文字列領域設定方式の原理ブロック
図である。
図において、文字列抽出手段ttiは、入力される画像
データの中から文字列を検出する。
文字列傾き抽出手段121は、文字列抽出手段111で
検出された文字列の傾きを求める。
座標軸設定手段131は、文字列傾き抽出手段121で
求めた傾きを基にして、文字列に沿った座標軸を設定す
る。
距離演算手段141は、文字列抽出手段111で検出し
た文字の各要素から座標軸設定手段131で設定した座
標軸までの距離を計算する。
文字列領域設定手段151は、距離演算手段141の計
算結果を基にして、文字列を囲む矩形領域を求める。
従って、全体として、検出した文字列及びその傾きから
文字列領域を設定するように構成されている。
〔作 用〕
文字列抽出手段111は、画像データの中から文字列を
検出し、文字列傾き抽出手段121はその文字列の傾き
を求める。
そして、座標軸設定手段131は、文字列に沿った座標
軸を設定し、距離演算手段141によって文字の各要素
から座標軸までの距離を計算する。
文字列領域設定手段151は、距離演算手段141の計
算結果から文字列を囲む矩形領域を求める。
本発明にあっては、文字列に沿った座標軸を設定し、文
字の各要素から座標軸までの距離を計算して、文字列を
含む矩形領域を求めることにより、正確に文字列領域を
設定することができる。
〔実施例〕
以下、図面に基づいて本発明の実施例について詳細に説
明する。
第2図は、本発明の一実施例における文字列領域設定方
式の構成を示す。
■、 1例と第1図との対応 へ ここで、本発明の実施例と第1図との対応関係を示して
おく。
文字列抽出手段111は、文字列抽出回路211に相当
する。
文字列傾き抽出手段121は、傾き抽出回路221に相
当する。
座標軸設定手段131は、座標軸設定回路231に相当
する。
距離演算手段141は、距離算出回路241に相当する
文字列領域設定手段151は、領域設定回路251に相
当する。
1工m虞圃戊 以上のような対応関係があるものとして、以下本発明の
実施例について説明する。
第2図において、図面や原稿から画像データを読み取る
画像スキャナ265からの出力は、アナログ−ディジタ
ル(A/D)変換回路263でディジタルデータに変換
される。そして、メモリ271に格納され、画像処理部
210でデータ処理が行なわれる。
画像処理部210は、メモリ271に格納された画像デ
ータの中から文字列を検出する文字列抽出回路2119
文字列の傾きを求める傾き抽出回路2211文字列に沿
った座標軸を設定する座標軸設定回路2311文字の構
成画素から座標軸までの距離を計算する距離算出回路2
419文字列を含む矩形領域を求める領域設定回路25
1で構成されている。
中央処理装置261は、全体の制御を行ない、A/D変
換回路263.メモリ271及び画像処理部210の各
構成回路と接続されている。
尚、本発明に関係しない周辺機器類や文字列領域を設定
した後の処理回路については省略した。
見工大施拠Ω■庄 第3図は、実施例における文字列領域設定方式の動作手
順を示す。
いま、文字列として、第4図に示した“EYX”を考え
る。画像データは、既に画像スキャナ265で読み取り
、A/D変換回路263でディジタルデータに変換して
、メモリ271に格納しであるものとする。
また、文字の構成要素としては、画素に着目するものと
する。
以下、第2図〜第4図を参照する。
最初に、文字列抽出回路211は、メモリ271から画
像データの読出しを行ない、その中から文字列“EYX
”の検出を行なう。そして、文字列“EYX”を含み水
平軸に平行な口ABCDを設定する(ステップ311)
傾き抽出回路221は、文字列抽出回路211が検出し
た文字列の角度θ、傾きtan θを求める(ステップ
312)。
次に、座標軸設定回路231は、文字列“EYX”に沿
った座標軸の設定を行なう。
座標軸設定回路231は、口ABCDの右下の点Bを遺
り、傾きtan θの直線を求め、これをX軸とする。
点Bの座標を(x 、、 y 、)とするとX軸は、 y = (x −Xz)tan θ+Yl  ・−・ 
(1)で表される(ステップ313)。
尚、点Bの座標(他の点の座標も同様)は水平軸及び垂
直軸に対する座標を示しているものとする。
同様に、座標軸設定回路231は、口ABCDの左下の
点Aを通り、傾き(1/lan θ)の直線を求め、こ
れをY軸とする。点Aの座標を(X+、Y+)とすると
Y軸は、 ’!= (x−X+)(1/lan θ)+Y、・・・
 (2) で表される(ステップ314)。
次に、距離算出回路241は、文字列の高さhを求める
ために、文字列“EYX”の各文字を構成する画素から
X軸に下ろした垂線の長さを計算する(ステップ315
)。
ある画素の座標を(X、、Y、) 、ある画素からX軸
に下ろした垂線の長さをYh とすると、Y、 =XI
、sin θ+YnCO5θ−Yc ・・・ (3) として表される。但し、Yc=−X2sin θ+Y、
 cos θ となる。
距離算出回路241は(3)式を使って、文字列を構成
する全ての画素からX軸までの距離を計算し、その中の
最小値Ymin+最大値Y mm、を求めて(ステップ
316)、次式によって文字列の高さhを計算する(ス
テップ317)。
h=YoX−Y、、1.、− ・・−・・−(4)同様
に、距離算出回路241は、文字列の長さWを求めるた
めに、文字列“EYX”の各文字を構成する画素からY
軸に下ろした垂線の長さを計算する(ステップ318)
ある画素の座標を(X、、Y、)  、ある画素からY
軸に下ろした垂線の長さをXlとすると、X@=X、c
os θ+YIIsin θ−Xc ・・・ (5) として表される。但し、Xc=X、CO5θ+Y。
sin θ となる。
距離算出回路241は(5)式を使って、文字列を構成
する全ての画素からY軸までの距離を計算し、その中の
最小値X +si。、最大値X、、、Xを求めて(ステ
ップ319)、次式によって文字列の長さWを計算する
(ステップ320)。
w=X□8−XMi、1 ・・・・・・・ (6)次に
、領域設定回路251は、文字列“EYX”の左下の起
点E(文字列の書き始め位置)の座標を計算する(ステ
ップ321)。
点Eの座標を(Xo、Yo)、X軸とY軸の交点をH(
X:+、’Y:+)1点EからX軸に下ろした垂線とX
軸との交点をF (a、b)、点EからY軸に下るした
垂線とY軸との交点をG (C,d)とする。
点トIの座標(x、、yi)は、(1)式と(2)式か
ら、 X3= (Xz tan”θ+X+) / (jan”θ+1)・・ ・ (7)Y3−(X+
   Xz ) tan  θ/ (janzθ+1)
+YI−(8)となる。
また、点Fの座標(a、b)は、(7)式と(8)式か
ら、 a = X3 + XIIt+Icos θ= (X2
 tan”θ+X+ ) / (jan”θ+1)+X
 mi 、、CO3θ・・・ (9)b=Y3 ” X
m1n Sinθ =(X+  Xz ) tan θ/ (tanzθ+
1)+Y + +X mi+I Sln θ−−・ (
10)同様に、点Gの座標(c、d)は(7)式と(8
)弐から、次式のように求められる。
c=X3−Y、、、sin θ −(X2 tan”θ+X+ ) / (jan”θ+
1)YsinSln  θ−・ (11) d =Y3+Y、t、 cos  θ −(X+   Xz )  tan  θ/ (tan
2θ+1)+ Y 、  +YIIin CoS θ・
・・ (12)点Fを通り傾き(−1/lan θ)の
直線と、点Gを通り傾きtan θの直線の交点が点E
であるので、点Eの座標(X O+ Y o)は、X0
=c+a−X3 ・・・・・・ (13)Y0=d+b
−Y、  ・・・・・・ (14)となる。したがって
、点Eの座標(X o、 Y o)は、(13)式に(
7)式、 (9)式、(11)式を代入及び(14)式
に(8)式、  (10)式、 (12)式を代入する
ことにより求めることができる。
N−」J■順λ[ζ屹 このようにして、距離算出回路241で(4)式により
文字列“EYX”の高さhを、(6)式により文字列の
長さWを計算し、領域設定回路251t’(13)弐と
(14)式により文字列の書き始め位置を計算すること
により、文字列を囲む矩形領域を定めて、正確な文字列
領域を設定することができる。
■、    B の ・ ノ 冨 〕さなお、上述した
本発明の実施例にあっては、文字を構成する画素からX
軸及びY軸までの距離を計算し、それらの最小値と最大
値から文字列の高さと長さを求めたが、文字を構成する
線分の端部に向かった文字ベクトルの終点から各軸まで
の距離を計算することもできる。
また、「1.実施例と第1図との対応関係」において、
第1図と本発明との対応関係を説明しておいたが、これ
に限られることはなく、各種の変形態様があることは当
業者であれば容易に推考できるであろう。
〔発明の効果〕
上述したように、本発明によれば、文字列に沿った座標
軸を設定し、文字列の各要素から座標軸までの距離を計
算して、それを基に文字列を囲む矩形領域を求めること
ができるので、実用的には極めて有用である。
【図面の簡単な説明】
第1図は本発明の文字列領域設定方式の原理ブロック図
、 第2図は本発明の一実施例による文字列領域設定方式の
構成ブロック図、 第3図は実施例の動作説明図、 第4図は実施例の文字列の座標説明図である。 図において、 111は文字列抽出手段、 121は文字列傾き抽出手段、 131は座標軸設定手段、 141は距離演算手段、 151は文字列領域設定手段、 210は画像処理部、 211は文字列抽出回路、 221は傾き抽出回路、 231は座標軸設定回路、 241は距離算出回路、 251は領域設定回路、 261は中央処理装置、 263はA/D変換回路、 265は画像スキャナ、 271はメモリである。

Claims (3)

    【特許請求の範囲】
  1. (1)入力される画像データの中から文字列を検出する
    文字列抽出手段(111)と、 文字列抽出手段(111)で検出された文字列の傾きを
    求める文字列傾き抽出手段(121)と、文字列傾き抽
    出手段(121)で求めた傾きを基にして、文字列に沿
    った座標軸を設定する座標軸設定手段(131)と、 文字列抽出手段(111)で検出した文字の各要素から
    座標軸設定手段(131)で設定した座標軸までの距離
    を計算する距離演算手段(141)と、 距離演算手段(141)の計算結果を基にして、文字列
    を囲む矩形領域を求める文字列領域設定手段(151)
    と、 を備えるように構成したことを特徴とする文字列領域設
    定方式。
  2. (2)前記各要素は、前記文字列を構成する文字の各画
    素であることを特徴とする特許請求の範囲第1項記載の
    文字列領域設定方式。
  3. (3)前記各要素は、前記文字列を構成する文字の文字
    ベクトルの終点であることを特徴とする特許請求の範囲
    第1項記載の文字列領域設定方式。
JP62058621A 1987-03-13 1987-03-13 文字列領域設定方式 Pending JPS63223988A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62058621A JPS63223988A (ja) 1987-03-13 1987-03-13 文字列領域設定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62058621A JPS63223988A (ja) 1987-03-13 1987-03-13 文字列領域設定方式

Publications (1)

Publication Number Publication Date
JPS63223988A true JPS63223988A (ja) 1988-09-19

Family

ID=13089639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62058621A Pending JPS63223988A (ja) 1987-03-13 1987-03-13 文字列領域設定方式

Country Status (1)

Country Link
JP (1) JPS63223988A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5759285A (en) * 1980-09-26 1982-04-09 Mitsubishi Electric Corp Method for reading character
JPS58146973A (ja) * 1982-02-25 1983-09-01 Ricoh Co Ltd 文字行および文字の切出し方法
JPS5941089A (ja) * 1982-08-31 1984-03-07 Mitsubishi Electric Corp 文字パタ−ン正規化装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5759285A (en) * 1980-09-26 1982-04-09 Mitsubishi Electric Corp Method for reading character
JPS58146973A (ja) * 1982-02-25 1983-09-01 Ricoh Co Ltd 文字行および文字の切出し方法
JPS5941089A (ja) * 1982-08-31 1984-03-07 Mitsubishi Electric Corp 文字パタ−ン正規化装置

Similar Documents

Publication Publication Date Title
US5363476A (en) Image converter for mapping a two-dimensional image onto a three dimensional curved surface created from two-dimensional image data
KR940006120B1 (ko) 기준마아크패턴 검출장치
JPS63223988A (ja) 文字列領域設定方式
JP2644724B2 (ja) 文書画像傾き補正方法
JPH0351894A (ja) ベクトルフオントによる文字パターン発生機能を備えた情報処理装置
US5471536A (en) Figure digitizing system
JPH0876913A (ja) 画像処理装置
JP3582734B2 (ja) 表のベクトル化装置
JP2715930B2 (ja) 線分検出方法
JPS6252911B2 (ja)
JPH0420221B2 (ja)
JPS622382A (ja) 画像処理方法
JPH04579A (ja) 図形の特微点抽出方法
JPH0266681A (ja) 図面処理装置
JPH04141789A (ja) 高精度ベクトル近似装置及び方法
JPH01181165A (ja) 傾き検出装置
JPH03269689A (ja) 文書読み取り装置
JPS636676A (ja) ストロ−ク指示方式
JP2501832B2 (ja) 色マ−ク領域の抽出方法
JPH04281575A (ja) 画像の細線化方式
JPH0786929B2 (ja) 画像処理方法
JPH03150689A (ja) 数字認識方法
JPS5839373A (ja) パタ−ン認識装置
JPS62208181A (ja) 図形抽出方式
JPS59165108A (ja) 産業用ロボツト