JP2519782B2 - 文字分離方式 - Google Patents

文字分離方式

Info

Publication number
JP2519782B2
JP2519782B2 JP63240211A JP24021188A JP2519782B2 JP 2519782 B2 JP2519782 B2 JP 2519782B2 JP 63240211 A JP63240211 A JP 63240211A JP 24021188 A JP24021188 A JP 24021188A JP 2519782 B2 JP2519782 B2 JP 2519782B2
Authority
JP
Japan
Prior art keywords
character
net
characters
bar
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63240211A
Other languages
English (en)
Other versions
JPH0289192A (ja
Inventor
渉 今竹
英雄 安達
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63240211A priority Critical patent/JP2519782B2/ja
Publication of JPH0289192A publication Critical patent/JPH0289192A/ja
Application granted granted Critical
Publication of JP2519782B2 publication Critical patent/JP2519782B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔概要〕 文字を構成する線の外接四辺形を求める手段と、前記
外接四辺形の中心を求める手段と、前記外接四辺形の面
積を求める手段と、異なる2つの線の外接四辺形の中心
間の距離を求める手段と、前記手段により求められた外
接四辺形の面積と、外接四辺形の中心点間の距離から文
字を構成する線の分離を判断する手段と、前記分離され
た文字の線を記憶する手段と、前記複数の文字の外接四
辺形の中心点間の距離から、文字列を判断する手段と、
前記分離された文字が属する文字列を記憶する手段を有
する文字分離方式に関し、 前記分離を正確に行うこと目的とし、 前記方式で分離された文字から、独立した直線を検出
する手段と、前記独立した直線の方向と、複数文字で構
成される文字列の方向の成す角度により、文字の分離を
決定する手段と、前記文字を構成する線の外接四辺形の
中心と、前記線と異なる文字を構成する線の外接四辺形
の中心を結ぶ方向と、前記文字が含まれる文字列の方向
が成す角度により、前記文字の分離を決定する手段を有
する構成とする。
〔産業上の利用分野〕
本発明は、文字認識処理における、文字分離方式に関
する。
〔従来の技術〕
従来から、手書きの文字をスキャナー等で、読み取
り、前記データをベクトルとして、記憶した後に、前記
データを辞書等を参照し、前記データがどの様な文字か
を判定することが行われていた。さて、前記文字情報は
最初に入力される際に、ベクトルとして表現される。
前記ベクトルは、独立した連続ベクトル毎に、分けら
れる。例えば、「A」と言う文字は、線が3つ、つまり
3つのベクトルに集まって構成された線である。そし
て、前記3つのベクトルは連結している。この連結した
ベクトルを連続ベクトルという。
また等号を表す「=」は、2つのベクトルで構成され
ており、前記2つのベクトルは連結していない。つま
り、等記号である「=」と言う文字は、「−」が、2つ
あると記憶される。つまり、連続ベクトルが2つあると
記憶される。
例えば、「F」,「A」,「C」,「O」,「M」等
は、連続ベクトルは、一つである。「!」,「?」,
「=」等は、連続ベクトルを2つもつ。また「%」は、
連続ベクトルを3つ持つ。
さて、従来から、設計図等の、同じ紙面に図面と供に
書かれた文字の読み取りが行われている。前記設計図等
に書かれた文字は、文字の大きさや、文字の方向がまち
まちで読み取りが非常に困難であった。また図面と文字
が、同じ紙面に書かれているので文字と図面を分けて記
憶する方法が必要であった。
前記課題を解決する手段としては、先ず、読み取られ
た図形又は線の中で、前記線の外接四辺形の大きさが、
ある一定の値より大きいものを図形と判断し、前記値以
下の物を、文字を構成する線として判断する方法があ
る。
さて、この時の読み取りは、連続ベクトルとして、読
み取られる。つまり、「=」と言う文字は、「−」と言
い連続ベクトルが、各々別々に読み取られる。また
「%」という文字は、「/」と言う連続ベクトルと
「O」と言う連続ベクトルが2つとして、各々別々に記
憶される。この段階では、文字は、前記文字を構成する
連続ベクトル分けられてしまう。つまり、文字は、
「F」,「A」,「C」,「O」,「M」の様に、連続
ベクトルが一つのもの、「%」,「℃」,「Å」の様に
連続ベクトルが複数で構成されるものがあるが、この最
初の読み取りの段階では、連続ベクトル相互の関係は判
っていない。
また、文字を書く人によっては、「M」 「N」
「L」と言う文字の一部が切れてしまう事がある。ま
た、大文字のアルファベットにおいては、複数のNETで
構成される文字はないが、前記の様なことで分離してし
まう事がある。更に、「=」,「%」等、バーを含む文
字は、設計図等の図面に、頻繁に書かれている。そのた
めに、前記連続ベクトルの幾つかを、組み合わせて一つ
の文字として記憶する処理が必要となる。特に、バー
は、それ自体単独で意味を持つ事は少なく、前記
「=」,「%」等の様に、文字の一部である事が多い。
よって、前記の連続ベクトルを文字として捉える為
に、読み取られた情報の内、文字を構成する線の一つと
判断された連続ベクトルは、前記連続ベクトルの外接四
辺形の面積が求められる。
前記外接四辺形の面積がある一定値以下の連続ベクト
ルは、複数の連続ベクトルで構成される文字の一部を構
成する連続ベクトルと判断される。そして、外接四辺形
の面積が前記の値より大きい連続ベクトルは、一つの連
続ベクトルで構成される文字と判断される。
そして、複数の連続ベクトルから構成される文字(以
下、連続ベクトルをNETと略すこともある。また、複数
の連続ベクトルから構成される文字を複数NET文字と略
す。)の一部と判断されたNETは、前記NETの外接四辺形
の中心と、前記NET同様、複数NET文字の一部と判断され
た他のNETの外接四辺形の中心が求められる。そして、
前記中心点間の距離がある値以下のもので、前記2つの
NETの外接四辺形の面積の和が、ある値に達するものを
文字として判断して、記憶する。1つのNETでも、外接
四辺形の面積がある値に達していれば、一つの文字とし
て記憶される。また、2つのNETの外接四辺形の面積の
和が一定値に達しない場合は、ある距離以内に位置する
NETを、更に一つ加えて、1文字と判断する。
つまり、1つ又は2つ又は3つのNETは、同じ文字、
つまり同じ複数NET文字を構成すると判断され、前記1
つ又は2つ又は3つのNETは、文字単位で記憶される。
前記文字としてのNETの記憶は、4つ以上のNETで構成さ
れる文字は無いことを前提としている。
つまり、最初は、連続ベクトルとして、記憶され、そ
の後、前記の処理で文字単位で記憶される。
次の段階は、文字列としての記憶である。
前記文字として記憶されたNETの外接四辺形と中心
と、前記文字の近辺に位置する文字を構成するNETの外
接四辺形の中心との距離がある一定値以下のものどうし
を、意味をなす文字列として、記憶する。
さて、連続ベクトルのNETとしての情報は、NETテーブ
ルに記憶される。文字単位での記憶は、記憶装置である
文字記憶テーブルに記憶される。また文字列は、文字列
記憶テーブルに記憶される。NETテーブルには、一つのN
ETに属するベクトルの始点と終点が、それぞれベクトル
毎に記憶されている。文字テーブルには、文字を構成す
るNETの情報が記憶されている前記NETテーブルのアドレ
スが記憶されている。文字列テーブルには、ある文字列
を構成する文字の情報が記憶されている前記文字テーブ
ルのアドレスが記憶されている。また、同時に、前記文
字列を構成する文字の両端の文字の外接四辺形の中心間
を結ぶ線が文字列方向として記憶される。
その後、前記文字記憶テーブル、文字列記憶テーブル
は、それぞれが、どの様な文字かが、判定される。
〔発明が解決しようとする課題〕
従来、このように、文字を認識する為に、文字の切り
出しを行った。
しかし、人間の書く文字は、非常に多様で、大きさも
様々である。また、図面等に書かれた文字は、非常に小
さくまた、文字例の方向も様々で、文字列方向は一定で
はない。よって、文字の切り出しは、正確に行われない
ことが多々ある。
例えば、前記図面に、手書きで、「FMR」と書いてあ
ったとする。
前記文字列は、まず前記文字読み取りの段階で、独立
したNETに分けられる。まず、「F」,「M」,「R」
と分けられる。このあと前記NETの外接四辺形の面積が
もとめられるが、前記面積がある一定値以下ならば、複
数NET文字を構成するNETの一部を判断されるので、も
し、「M」と「R」の外接四辺形の面積が前記の値以下
のもので在れば、「M」と「R」は一つの文字として判
断され、前記「FMR」と言う文字列は、「F」,「MR」
の2つの文字からなる文字列と判断されてしまう。
「7−2」なども、「7」,「−」,「2」と言う3
つの文字列に判断されず,「7−」と「2」や、「7」
と「−2」という様に判断してしまうことが多々ある。
また、アルファベット、数字に於いては、複数のNET
で構成される文字は、バーを含む場合が多い。従って、
バーを含む文字が、間違って、切り出されることも多
い。例えば「%」,「=」,「/」,「−」等である。
「%」は、「○」,「|」,「○」と切りされたり,
「」と言う文字は、「O」と「−」に分離してしまう
ことがある。また、「/」が2つで「=」となってしま
うことが多々ある。
従って、本発明は、文字を、間違って分離することが
無く、特に、バーを含む文字に正確に、分離する手段を
提供するものである。
〔課題を解決する為の手段〕 文字を構成する独立した直線を検出する手段と、前記
独立した直線の方向と、複数文字で構成される文字列の
方向の成す角度により、文字の分離を決定する手段と、
前記文字を構成する線の外接四辺形の中心と、前記線と
異なる文字を構成する線の外接四辺形の中心を結ぶ方向
と、前記文字が含まれる文字列の文字が成す角度によ
り、前記文字の分離が決定する手段を設ける。
〔作用〕
個々の文字領域を切り出す過程に、文字を構成する連
続した線の1乃至複数の線を、前記線の外線四辺形の大
きさと、前記外接四辺形の中心点間の距離で一つの文字
と判断した後に、文字を構成する独立した直線の方向
と、複数の文字列の方向の成す角度により、または、文
字を構成する独立した直線以外の線分の外接四辺形の中
心と、前記独立した直線の外接4辺形の中心を結ぶ方向
と、前記文字が含まれる文字列の方向の成す角度によ
り、または、文字を構成する独立した直線以外の外接四
辺形の中心と前記外接四辺形と異なる外接四辺形の中心
の方向と、前記直接が含まれる文字列の方向が成す角度
により、前記一つの文字と判断された線を再び分離する
ことによって文字領域の切り出しの正確さが増す。
〔実施例〕
第1図は、本発明の一実施例のブロック図、第2図
は、実施例の文字分離方式のフローチャート図、第3図
は、文字を構成する独立した直線を検出する手段のフロ
ーチャート図、第4図、第5図、第6図、第7図は、文
字分離処理ルーチンのフローチャート図、第8図は、直
線検出の説明図、第9図、第10図、第11図は、文字分離
処理の具体例を示す説明図である。第1図中、1は中央
処理装置(MPU)、2はスキャナーインターフェース、
3、5、6、7、8、9、10は記憶装置である。前記記
憶装置3には、文字列テーブル分離処理プログラム、5
には、文字分離処理ルーチンが記憶されている。7、8
はそれぞれ文字テーブル、文字例テーブルである。9は
文字及び文字列供給手段のプログラムが記憶されてい
る。10はNETのデータが記憶されているNETテーブルであ
る。4はROMで基本プログラムが記憶されている。
文字及び文字列供給の手段は、〔従来の技術〕で示し
た方法である。本発明の実施例は前記処理の後の処理で
ある。これらは、文字及び文字列情報供給手段プログラ
ム9が、中央処理装置(MPU)で起動されて行う。
前記処理が行われた後に、前記文字テーブルの文字を
構成するNETが、独立した直線を有するかどうかを判定
し、前記独立した直線であるNET(以下、直接NETと略
す。)が、含まれる場合と、そうで無い場合にわける。
更に、1文字内に、幾つNETがあるかで、判定方法が異
なる。以上のことから、4通りの場合が考えられる。こ
れらについては、例を上げて後程説明する。
以下、図面に従って、本発明の一実施例の説明する。
スキャナーで読み取られた情報は、スキャナーインタ
ーフェースを通じて、NETテーブル10、文字テーブル7,
文字列テーブル8にそれぞれ、NET単位での情報、文字
単位での情報、文字列単位の情報として記憶されてい
る。
NETテーブル10には、NETに属するベクトルの始点と終
点の座標が記憶されている。
また、文字テーブルには、一つの文字を構成するNET
のアドレスが記憶されている。
文字列テーブルの情報は、文字及び文字列情報供給手
段9で読み取られ、文字と判断されたNETが文字ごと記
憶されている。文字列テーブル8には、前記文字テーブ
ル7が記憶された文字が、どの文字列に属するかが、記
憶されている。前記文字列テーブル8の情報は文字のNE
Tとしての情報では無く、前記文字テーブルのアドレス
等で記憶される。これらは、従来は技術同様である。
さて、前記文字テーブルに記憶されたNETは、正しく
文字を構成しているとは限らない。
第1図のブロック図及び第2図のフローチャートに従
って、説明する。( )内の番号は、フローチャート内
の処理に対応する。
文字列テーブル8には、多数の文字列が記憶されてい
るが、まず、前記文字列テーブル8の先頭の文字列から
処理する。そこで、文字列テーブル8から前記の文字列
情報が中央処理装置(MPU)に入力される(21)。
前記情報から、処理する文字列に属す先頭の文字を処
理対象とする。そこで文字テーブル7,NETテーブル10か
ら前記文字に属すNET情報を、中央処理装置(MPU)1に
入力する(23)。
前記文字は、1つのNETか、複数のNETから構成されて
いるかが判定される(25)。1つのNETから構成されて
いる文字であれば、分離する必要がないので、文字列に
含まれる次の文字を処理対象とする(28)。
複数のNETからなる場合は、バー判定ルーチンが起動
し(26)、前記文字は、バー判定ルーチンに処理される
(以下、文字を構成する独立した直線のNETをバーと呼
ぶ)。一つの文字を構成する各々のNETは、バーである
ものがあるか無いかが判定される。この処理は、第3図
のフローチャートのバー判定ルーチンに相当する(前記
バー判定ルーチンについては、後程説明する。)。
前記結果は、文字テーブル分離処理ルーチンに送ら
れ、前記結果を参照し、前記文字に属するNETは、分離
するかしないかが判定され、文字テーブル4内の情報が
書き換えられる(27)。この処理は、第4図フローチャ
ートの文字テーブル分離処理ルーチンに相当する(前記
文字テーブル分離処理ルーチンについても、後程説明す
る。)。
その後、処理対象を次の文字に移す(28)。
文字列内の全ての文字について処理が終了したら、文
字列テーブル6の情報を書き換える。
そして、次の文字列テーブルの文字列に関して、同様
の処理を行う(29)。
その後、全ての文字列について、処理が完了したら、
分離処理は終了する(22)。
以上、分離処理を大雑把に説明したが、以下、具体例
を用いて、バー判定ルーチン、文字テーブル分離処理ル
ーチンについて、説明する。
では、第3図のフローチャートと第8図のバー判定処
理の説明図より、バー判定処理を説明する。
さて、人間が書く文字は、正確なものではない。例え
ば「−」と言う直線を書いたつもりでも、実際は、多少
なりとも、曲がっている場合が多い。「−」のつもりで
書かれている線は、通常連続する複数のベクトルで記録
されてしまう。そこで、前記連続する複数のベクトル
を、バーと認めるか認めないかをを判定する処理が必要
である。
第8図は、前記処理の原理説明図である。第8図中の
NETは、3本のベクトルから構成されている。ベクトル
の接続部を屈曲点と呼ぶ。また、ベクトルの始点、又は
終点で、他のベクトルと接していない端点をオープン端
点と言う。
まず、最初のベクトルの始点から、最後のベクトルの
終点までの長さを求め、(前記長さをWとする)。そし
て、前記始点と終点を結ぶ直接と、屈曲点との距離を求
める。前記屈曲点の始点と終点を結ぶ直線との距離のう
ち、最も大きいものを求める(前記最大の高さをHとす
る)。そして、H÷Wの値が、予め決められた値以下な
らば、バーと判定し、予め決められた大きさより大きけ
れば、バーでないと判定する。
以下、第8図フローチャートをもとに、バー判定処理
を説明する。NETは、複数のベクトルが繋がった連続ベ
クトルである。
先ず、NETに含まれるベクトルが1本か否かを、NETテ
ーブル10を参照し、判定する(31)。
ベクトルが一本であれば、直線なので、前記NETはバ
ーと判定され、前記NETがバーであると言う結果とし
て、文字分離処理ルーチン5に“1"を入力する(30
2)。
さて、前記処理(31)で、ベクトルが1本で無いと判
定されたら、前記NETに含まれる最初のベクトルの始点
から,最後のベクトルの終点迄の長さを求める(32)。
その後、2本めのベクトルの始点がオープン端点か否
かが、判定される(34)。オープン端点ならば、直線で
ないと判定される(304)。例えば、「F」,「X」等
が、そうである。2本目以降のベクトルの始点がオープ
ン端点ならば、一つのNETの中に、オープン端点が3つ
存在することになるので、バーではない。バーは、ある
ベクトルの始点と、あるベクトルの終点だけがオープン
端点である。例えば、「F」,「X」等が、そうであ
る。前記処理304では、文字分離処理ルーチン5に、直
線でないという判定を“0"を入力することにより行う。
前記処理でオープン端点でないと判断された時は、そ
の後、処理35を経て、ベクトルの始点が、分岐点かどう
かを判定する(35)。NET内に分岐点があるものは、バ
ーではないと判断され、文字分離処理ルーチンに“0"を
入力する(305)。例えば、「Y」等がそうである。こ
の判定は、NETテーブル内のベクトルの始点の座標が、
他のベクトルの始点もしくは終点と同一のものが2つ以
上存在すれば、分岐点の判断される。
前記ベクトルの始点が分岐点でないものは、ベクトル
の始点の高さを求める(36)。前記高さは、NETに含ま
れる。最初のベクトルの始点から,最後のベクトルの終
点を結ぶと直線と、前記始点との距離である。次いで、
高さ÷長さを求め、Aとする(37)。
こうして、高さが求められ、前記高さの最大の物を求
める。以下、前記を説明する。
2本めのベクトルは処理38を経ない。前記A値を、A
値の最大値として登録する(39)。
(A値の最大値を、MAXAと略す) 処理301で前記、MAXAが、あらかじめ決められた値B
より大きい時は、バーでないと判定される(306)。前
記値以下の時は、3本めのベクトルに同様の処理を行
う。
NETに含まれる全てのベクトルが処理34〜39及び301
を、通れば、処理33で、バーであると判定される。
前記、NETが、バーであるか無いかと言う情報は、文
字分離処理ルーチン5に送られる。
以上、バー判定処理ルーチンについて、説明した。
以下、文字分離処理ルーチンについて、説明する。
文字の分離処理対象は、大きく分けて、4通りある。
(1)複数文字列に含まれる文字であり、前記文字が、
バーのNETを含む場合(第9図(a),(b),
(c),第10図(a))。
(2)複数文字列に含まれる文字であり、前記文字が、
バーのNETを含まない場合(第10図(b),(c))。
(3)一文字文字列であり、バーのNETを含む場合(第1
1図(a),(b),(c))。
(4)一文字文字列であり、バーのNETを含まない場合
(第11図(d))である。
以下、上記(1)〜(4)の4通りの場合を具体例に
あげて、説明する。
(1)複数文字列に含まれる文字であり、前記文字が、
バーのNETを含む場合。前記の場合の、分離方法は、更
に、4通りに分けられる。
以下、フローチャートと第9図(a)〜第10図(a)
の図面を使って、説明する。図面内の実線のNETの枠
は、文字列テーブル8に記憶されている文字の外接四辺
形を領域である。又、点線の枠はNETの外接四辺形の領
域である。
(1−)文字候補内のNETが2個の場合、文字列方向
とNET中心点間方向が、一致した場合のみ、分離対象文
字の分離処理を行う。(第9図(a)参照) 第2図のフローチャートの処理21〜26を経て、文字テ
ーブル分離処理ルーチン27の処理を行う。文字テーブル
分離処理ルーチン記憶部5は、MPU1に送られ実行され
る。以下、第4図のフローチャートに従い、説明する。
文字テーブルと、文字列テーブルの記憶から、対象文
字は、一文字文字列に含まれるか否かが、判定される
(41)。第9図の場合、複数文字文字列である。
文字テーブルの情報から、対象文字は、バーを含むが
どうかを判定する(42)。第9図(a)の91の、「−
4」は、バーを含む。
その後、処理対象文字に、含まれるNETの数が判定さ
れる(43)。「−4」(91)は2つである。
文字列方向と、NETの外接四辺形中心点間の方向が一
致しているかどうかが判定される(44)。「−4」は前
記方向が一致しているので、2つのNETをそれぞれ、文
字として文字テーブル7に登録し、分解対象となった元
の文字テーブルデータを削除する(45)。
92は、前記方向が一致していないので、処理45に行か
ず、処理を終了する。
(1−)文字候補内のNETが3個の場合で、バーの方
向(バーのオープン端点を結んだ方向)と文字列方向が
一致している場合、バーからみて、文字列方向に対して
垂直方向にあるもの以外を分離する。(第9図(b))
前記の場合は、第9図(b)を、用いて、説明する。
処理42(フローチャート第4図参照)までは、同じで
ある。
バーの方向と、文字列方向が同じか、どうかが判定さ
れる(46)。文字93,94とも、バーの方向と、文字列の
方向が一致している。
その後、バーのNETの中心と、その他のNETの中心を結
ぶ方向が、垂直でない前記NETを選び、その前記NETを、
前記文字から分離する。
(1−)文字候補内のNETが3個の場合で、バーの方
向と文字列方向が一致していない場合、バー以外のNET
の中心点間方向が文字列方向と一致したら、3文字に分
離する。以下、第4図,第7図、第9図(c)を用い
て、説明する。
第4図、処理46までは、前記の場合と同様の処理を
辿る。その後、バー以外のNETの外接四辺形の中心点間
方向が文字列方向と一致するかどうか判定される(第7
図71)。この場合は前記条件を満たす。
その後、3個のNETを文字テーブル7に文字として登
録し、分割対象となった元のデータを削除する(72)。
(1−)文字候補内のNETが3個の場合で、バーの方
向と文字列方向が一致していない場合、バー以外のNET
の中心点間方向が文字列方向と垂直であったなら、バー
だけを分離し、それ以外であれば分離処理は行わない。
上記の場合を、第10図(a)と、第7図を用いて説明
する。第7図処理71までは、前記の場合と同様であ
る。この場合は、前記71の条件を満たさない。
その後、バー以外の外接四辺形のNETの中心点間方向
が文字列方向と垂直か否かが,判定される(73)。101
は前記条件を満たすが、102は満たさない。
文字101は、バーのNETを文字テーブルに登録し、元の
文字テーブルより、バーのNETを削除する(74)。102
は、分離されないでそのままである。
次に、(2)の場合を説明する。(2)は複数文字列
に含まれる文字であり、前記文字が、バーのNETを含ま
ない場合である。
前記(2)の場合の処理の仕方は、更に分けて、2通
りある。
以下,第10図(b),第10図(c)と第6図のフロー
チャートに従って、説明する。
(2−)文字候補内のNETが2個の場合、文字列方向
と、NETの外接四辺形間の中心点間方向が一致した時の
み、分離対象文字の分離処理を行う。この場合は、第10
図(b),第10図(c)と第6図のフローチャートを用
いて説明する。
第4図中、処理42で、対象文字は、バーを有するか否
かが判定される。この場合は、バーを持たない。
その後、第6図フローチャートへ進む。
対象文字に含まれるNETの数が、2個か3個か判定さ
れる(61)。この場合は、2個である。その後、文字列
方向と、NETの外接四辺形の中心点を各々結んだ方向が
一致するか、否かが判定される(62)。文字103は、文
字列方向と、NET中心点間方向が一致せず、文字104は一
致する。
文字103は一致しないので、分離しない。
文字104は一致するので、2つのNETを分離し、文字テ
ーブル7にそれぞれ文字として登録し、もとの文字テー
ブルを削除する(63)。
(2−)文字候補内のNETが3個の場合、それぞれのN
ETの中心点間方向の内、文字列方向に対して垂直なNET
の組み合わせ以外を分離する。この場合は、第6図フロ
ーチャートと第10図(c)を用いて、説明する。
処理61迄は、同じ処理を、前記(2−)と同様に辿
る。NETの数が3個である(61)。その後、それぞれのN
ETの外接四辺形の中心点間を結ぶ方向のうち、文字列方
向に対して、垂直なNETの組み合わせを選び、それ以外
のNETを文字テーブル7に、文字として登録する。同時
に、NETの外接四辺形の中心点間を結ぶ方向のうち、文
字列方向に対して、垂直なNETを組み合わせのものは、
分離しないで新たに文字として、文字テーブル7に登録
する(64)。文字105は、文字列方向に対して、垂直なN
ETの組み合わせが有る場合、文字106は文字列方向に対
して、垂直なNETの組み合わせが無い場合である。
(3)一文字文字列であり、バーのNETを含む場合(第1
1図(a),(b),(c))。この場合の処理は、更
に分けて、3通りになる。
以下、第11図(a)、(b)、(c)と第5図フロー
チャートに従い、説明する。
(3−)文字候補内のNETが2個の場合、分離処理を
行う。この場合は、第5図のフローチャート,第11図
(a)を参照する。
第4図フローチャート処理41で対象文字は、1文字文
字列に含まれるか否かが判定され、前記条件を満たす
(41)。その後、第5図フローチャート、処理51では、
対象文字がバーを含むか否かが判定され(51)、この場
合は、バーを含んでいる。
対象文字に含まれるNETの数が、2個か3個か、判定
される(52)。
NETは2個である。この場合は、無条件に分離処理を
行い、文字テーブル7の書き換えを行う(53)。
(3−)文字候補内のNETが3個の場合で、バーの外
接四辺形の中心から、他の2つのNETの外接四辺形の中
心への方向が、同一の時、3分割し、3文字文字列とす
る。この場合は、第5図フローチャート,第11図(b)
を参照する。
処理52まで辿る処理は同じである。NETの数は3個な
ので、バーの外接四辺形の中心から、他のNETの外接四
辺形の中心への方向が、バーの方向と同一方向か否かが
判定される(54)。第11図(b)は、前記条件を満たす
ので、3分割とし、3文字文字列として、文字テーブル
7に登録する(55)。
(3−)文字候補内のNETが3個の場合で、バーの外
接四辺形の中心とその他のNETの外接四辺形の中心を結
ぶ方向が、前記バーの方向に対して垂直でないNETを分
離する。この場合は、第5図フローチャート及び第11図
(c)を参照する。
前記処理54まで辿る処理は、前記(3−)の場合と
同様である。バーの外接四辺形の中心から他の2つのNE
Tの外接四辺形の中心への方向が、同一方向でない。そ
こで、バーのNETの外接四辺形の中心と、その他のNETの
外接四辺の中心を結ぶ線が、バーの線と垂直になるNET
を選び、それ以外のNETを分離して文字テーブル7に登
録する。また、前記垂直となるバーと、その他のNET
は、一つの文字として文字テーブル7に登録される(5
6)。
次に、(4)一文字文字列であり、バーのNETを含ま
ない場合を説明する。第5図フローチャート及び第11図
(d)を参照する。
前記の場合、処理51まで、辿る処理が、(3)の場合
と同様である。その後、バーを含まないので、無条件に
分離する。この場合は、2つのNETからなるものであろ
うと、3つのNETからなる文字であろうと、無条件に分
離することにする。
以上分離処理ルーチについて、説明した。
以上の処理により分離された文字は、文字列テーブル
7に記憶される。また、其に合わせて、文字列テーブル
8の内容も書き換えられる。
以上、実施例に従い、本発明を説明した。本発明の実
施例では、文字を構成するバーに注目して文字を分離す
るか否かを決定した。これは、文字を分離する過程に於
いて、バーは判別しやすく、文字分離の決めてとなるか
らである。
本発明では、NETテーブルにベクトルを記憶してから
バーを判定したが、文字入力時に、バーを判定してもよ
い。
また、記憶装置の有りかたにこだわるものではない。
本発明は、本発明の要旨に従い、種々の変形が可能で
あり、これらを排除するものではない。
〔効果〕
本発明によれば、バーの方向と、NETの外接四辺形の
中心点間の方向と、文字列の方向により、文字の分離が
正しく行うことが可能てある。
【図面の簡単な説明】 第1図は、本発明の一実施例のブロック図、第2図は、
実施例の文字分離方式のフローチャート図、第3図は、
バー判定ルーチンのフローチャート図、第4図、第5
図、第6図、第7図は、文字分離処理ルーチンのフロー
チャート図、第8図は、直線検出の説明図、第9図、第
10図、第11図は、文字分離処理字の具体例を示す説明図
である。 1……中央処理装置(MPU) 2……スキャナーインターフェース 3……文字列テーブル分離処理ルーチン 4……基本プログラム 5……文字分離処理ルーチン 6……バー判定ルーチン 7……文字テーブル 8……文字列テーブル 9……文字及び文字列供給手段のルーチン 10……NETテーブル

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字を構成する線の外接四辺形を求める手
    段と、前記外接四辺形の中心を求める手段と、前記外装
    四辺形の面積を求める手段と、異なる2つの線の外接四
    辺形の中心間の距離を求める手段と、前記手段により求
    められた外接四辺形の面積と、外接四辺形の中心点間の
    距離から文字を構成する線の分離を判断する手段と、前
    記分離された文字の線を記憶する手段と、前記複数の文
    字の外接四辺形の中心点間の距離から、文字列を判断す
    る手段と、前記分離された文字が属する文字列を記憶す
    る手段を有する文字分離方式に於いて、 前記方式で分離された文字から、文字を構成する独立し
    た直線を検出する手段と、 前記独立した直線の方向と、複数文字で構成される文字
    列の方向の成す角度により、文字の分離を決定する手段
    と、 前記文字を構成する線の外接四辺形の中心と、前記線と
    異なる文字を構成する線の外接四辺形の中心を結ぶ方向
    と、前記文字が含まれる文字列の方向が成す角度によ
    り、前記文字の分離を決定する手段を有することを特徴
    とする文字分離方式。
JP63240211A 1988-09-26 1988-09-26 文字分離方式 Expired - Lifetime JP2519782B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63240211A JP2519782B2 (ja) 1988-09-26 1988-09-26 文字分離方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63240211A JP2519782B2 (ja) 1988-09-26 1988-09-26 文字分離方式

Publications (2)

Publication Number Publication Date
JPH0289192A JPH0289192A (ja) 1990-03-29
JP2519782B2 true JP2519782B2 (ja) 1996-07-31

Family

ID=17056107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63240211A Expired - Lifetime JP2519782B2 (ja) 1988-09-26 1988-09-26 文字分離方式

Country Status (1)

Country Link
JP (1) JP2519782B2 (ja)

Also Published As

Publication number Publication date
JPH0289192A (ja) 1990-03-29

Similar Documents

Publication Publication Date Title
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
JPH05189617A (ja) 手書き文字認識に於けるアークのセグメント化の方法と装置
JPH06176199A (ja) パターン認識方法及び装置
JP2519782B2 (ja) 文字分離方式
JP5455364B2 (ja) 情報処理装置及び軌跡データ認識方法
JPS6261990B2 (ja)
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
JPS6228889A (ja) 情報認識装置
JPH0247788B2 (ja)
JP2956094B2 (ja) 手書き文字認識装置
JPS638513B2 (ja)
JP2009259291A (ja) 文字認識方法,プログラム及び記録媒体
JPS60217483A (ja) 文字認識装置
JPH0357509B2 (ja)
JPS62281082A (ja) 文字認識装置
JP2972443B2 (ja) 文字認識装置
JPH10247221A (ja) オンライン文字認識装置
JPS62190565A (ja) 手書き図形清書装置
JPH11126236A (ja) オンライン手書き文字認識装置およびオンライン手書き文字認識方法ならびにその方法を記録した記録媒体
JP2644812B2 (ja) 記号認識方法
JPH1049631A (ja) オンライン手書き文字認識方法および装置
JPS6215681A (ja) オンライン手書き文字認識方式
JP2824704B2 (ja) 文字認識装置
JPH045231B2 (ja)
JPS61153787A (ja) 情報処理装置