JPS6118079A - パタ−ン分離装置 - Google Patents

パタ−ン分離装置

Info

Publication number
JPS6118079A
JPS6118079A JP59139688A JP13968884A JPS6118079A JP S6118079 A JPS6118079 A JP S6118079A JP 59139688 A JP59139688 A JP 59139688A JP 13968884 A JP13968884 A JP 13968884A JP S6118079 A JPS6118079 A JP S6118079A
Authority
JP
Japan
Prior art keywords
segment
pattern
integration
character
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59139688A
Other languages
English (en)
Inventor
Toshio Matsuura
松浦 俊夫
Shigemi Osada
茂美 長田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59139688A priority Critical patent/JPS6118079A/ja
Publication of JPS6118079A publication Critical patent/JPS6118079A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文字認識装置とくに手書き文字認識装置等に用
いられ、複数個の被認識文字パターンの中から1文字分
の被認識文字パターンを切り出すめに用いるパターン分
離装置に関する。
文字認識装置は、記入された多数の被認識文字パターン
の中から、1文字分の被認識文字パターンを取出しく一
般に文字の切出しと称する)、】文字分毎にその特徴を
抽出し、あらかしめ特徴辞書に記憶する文字種毎の標準
特徴と照合することによって、被認識文字パターンの文
字種を決定する装置である。
前記1文字分の被認識文字パターンの切出しを容易にす
るため、被認識文字パターンを所定の文字記入枠内に記
入する方式が古くから採用されているが、近時1文字記
入者に対する負担を軽減することを主目的として、前記
文字記入枠を指定しない方式(一般にフリーフォーマッ
ト方式と称せられる)が実用化されるに至っている。
フリーフォーマント方式においても、被認識文字パター
ンを1文字分ずつ切り出したのち、特徴抽出および照合
等の手順を経て認識をおこなうのであるが、この切出し
を正しくおこなうためには。
隣接する認識文字パターン間の境界を明確にした上で切
出しをおこなう必要があり、そのためにパターン分離装
置が用いられる。
前記のように、フリーフォーマ・ノド方式は文字記入者
に与える負担を軽減することを主[1的としており、し
たがって、これに用いられるパターン分離装置は文字記
入者に対し文字記入間隔を指定する等の負担を与えるも
のではなく、どのように記入された被認識文字パターン
であっても、できる限り確実に1文字分ずつに短い処理
時間で分離できるものでなければならない。
〔従来の技術〕
第3図(alは、フリーフォーマント方式の手書き文字
認識装置に用いられるパターン分離装置の従来例の構成
を示すブロック図であり、1は被認識文字パターンが記
入された用紙をラスク走査によって読み取り、たとえば
0.1mm平方の画素毎にパターン構成画素を“1″と
し背景構成画素を“0”とする2値データとして入力す
る入力装置であり、2は入力装置1によって入力された
被認識文字パターンを記憶して置く画像メモリ、また3
は画像メモリ2に記憶する被認識文字パターンの中から
1行分の文字パターンを抽出し記憶する文字行抽出部で
ある。
つぎに4は文字行抽出部3によって抽出された1行分の
被認識文字パターンから各被認識文字パターンの輪郭画
素を追跡することによって、相互に連接するパターン形
成画素によって構成されるセグメントを抽出するセグメ
ント抽出部であり。
5はセグメント抽出部4によって抽出された各セグメン
ト毎に、第3図山)のように、その外側輪郭から所定距
離以内にある背景構成画素じO”)をパターン構成画素
じ1”)に変換する。いわゆる“太め処理”によって9
点線のように拡大するセグメント拡大部である。
また、6はセグメント拡大部5によって拡大されたため
に接触した複数のセグメントを統合するセグメント統合
部、7は画像メモリ2のアドレス制御部である。
すなわち上記構成のパターン分離装置は、セグメント統
合部6によって統合されたセグメント。
および統合できなかったセグメントを、それぞれ1文字
分の被認識文字パターンとして分離抽出するものである
〔発明が解決しようとする問題点〕
ところが、前記構成のパターン分離装置においては、す
べてのセグメントを拡大する必要があるため処理時間を
要するという問題点、また被認識文字パターンの一部の
セグメントが9文字行方向に隣接する他の被認識文字パ
ターンの一部として分離されることがあり、その結果、
誤認識あるいは認識不能が生ずるという問題点があった
〔問題点を解決するための手段〕
本発明になるパターン分離装置は、方眼状に配列される
画素毎にパターン形成画素と背景形成画素とによって表
される被認識パターンから相互に連接するパターン形成
画素によって構成されるセグメントを抽出するセグメン
ト抽出部と、前記抽出されたセグメントの大きさによっ
て統合候補セグメントを選択するセグメント選択部と、
前記選択されたセグメント上の所定位置を基準として該
セグメントと他のセグメントとを統合するセグメント統
合部と、前記統合された複数のセグメントからなるパタ
ーンの位置によって前記統合結果を検証する検証部とを
備えることによって、前記問照点の解消を図ったもので
ある。
〔作用〕
すなわち1本発明では、抽出されたセグメントの大きさ
によって統合候補セグメントを選択し。
選択されたセグメントに対してのみ統合のための処理を
おこなうことによって、統合1こ要する時間を短縮する
とともに、統合された複数のセグメントからなるパター
ンの位置によって統合結果を検証することによって、統
合の誤りを排除するものである。
〔実施例〕
次に本発明の要旨を第1図に示す実施例によって具体的
に説明する。
第1図は本発明一実施例の構成を示すプロ、7り図であ
り、第3図従来例と共通する符号は同一の対象物を指す
その他、8はセグメント抽出部4によって抽出され記憶
されるれる各セグメントの外接四辺形を生成する四辺形
生成部、9は四辺形生成部8によって生成された外接四
辺形の中から所定面積以下のものを選択することによっ
て、統合候補セグメントを選択するセグメント選択部、
10はセグメント選択部9によって選択されたセグメン
1−の外接四辺形に対して拡大処理を施す四辺膨拡大部
、61はセグメント選択部9によって選択されたセグメ
ントと、そのセグメントの外接四辺形との接点を基準と
して、そのセグメントと他のセグメントとを統合するセ
グメント統合部である。
また1)はセグメント統合部6′によって統合された複
数のセグメントからなるパターンの外接四辺形の重心に
よって、この統合結果を検証する検証部である。
つぎに、第2図によって上記実施例の各構成要部の機能
を詳細に説明する。
(i)セグメント抽出部4は、第2図(alに例示する
ように、セグメント(1)・(2)・・(1)・・を抽
出し記憶する。
(ii )四辺形生成部8は、第2図(blに例示する
ように、各辺が画素配列方向に平行し、かつ各セグメン
トに外接する四辺形を生成する。
(iii )セグメント選択部9は、四辺形生成部8に
よって生成された外接四辺形の面積A+ と、認識対象
として考えられる被認識文字パターンの外接四辺形の面
積の最小値として与えられる所定面積Asとを比較して
At ≦As の条件を満たすセグメント、すなわち1文字分の被認識
パターンとは考えられないセグメント、を統合候補セグ
メントとして選択し、この条件を満たさないセグメント
を1文字分の被認識文字パターンとして分離する。
(iv) 四辺膨拡大部10は、セグメント選択部9に
よって選択された統合候補セグメントの外接四辺形の4
頂点の座標を Pl (xl、yl ) P2 (x2.yl ) P3 (×1.y2) P4 (に2.Y2 ) とするとき、nを1〜にの正の整数とし、εを経験的に
得られる正数として、それぞれをPL ’  (xi−
nε+  yl−ng)P2  ’   (x2+n 
 ε +V1−ng)P3 ’  (xi−n g +
  y2+n t )P4 ’  (x2+n t 、
  y2+n t )のように変換することによって前
記外接四辺形を拡大し、nを1から順次kまで変化させ
ることによって、この処理をに段階に分けておこなう。
なおにεの値は、1文字分の被認識文字パターン中のセ
グメント間の縦方向あるいは横方向の間隔の予想最大値
とする。またεの値は画素幅の整数倍とし、処理速度を
優先する場合には大きい値を選び、処理精度を優先する
場合には小さい値を選ぶ。
(v)セグメント統合部6′は、第2図(C1に示すよ
うに、外接四辺形PIP2P4P3の各辺上にあって。
セグメント選択部9によって選択された統合候補セグメ
ントとの各接点に中心があり、かつ経験的に得られる長
さWを有する線分を頂辺とし、また四辺膨拡大部10に
おけるn段階目の拡大によって形成された四辺形PI 
’ P2 ’ P4 ’ P3 ’の各辺上にあって、
かつ四辺形P1)’2P4P3および四辺形PI ’ 
P2 ’P4 ’ P3 ’の面積をそれぞれAおよび
A′とするとき。
一1=W× 八’/A として定まるに′を底辺とする台形(図中ハンチングに
よって示す)の底辺と最初に接触する他のセグメントと
を統合する。
なおWの値は、これが大きい場合には処理時間を要する
だけでなく統合精度を低下し易く、また反対に小さい場
合にも統合精度を低下し易い。したがって、被認識文字
パターンの字幅等を基準として、経験的に選ぶ。
(vi)検証部1)は、セグメント統合部6′によって
統合された複数のセグメントからなる被認識文字パター
ン候補の外接矩形を生成し、第2図(d)に・示すよう
に、その重心Cの座標値を(x、y)。
前回に分離された被認識文字パターンの外接矩形の重心
Coの座標値を(xo+yo ) + その行方向の幅
を勧、前記二つの外接矩形の行方向の間隔をβ。
また、1文字分の被認識文字パターン毎の文字行中心線
からの偏差等から経験的に得られる所定値をhとすると
き。
にo+’ylo+It > x yo −h < y <yo4− h なる条件が満たされたとき、統合結果を被認識文字パタ
ーンとして分離し、この条件が満たされない場合には、
それぞれのセグメントを被認識文字パターンとして分離
する。
〔発明の効果〕
以上説明したように1本発明によれば、セグメント選択
部において選択された一部のセグメン1−に対してのみ
、統合のための処理をおこなうので。
統合に要する時間を短縮し、その結果、パターン認識の
速度を向上する効果がある。
またセグメント統合部による統合結果を検証部によって
検証するので、統合の誤りを排除し、パターン認識の精
度および認識率を向上する効果がある。
【図面の簡単な説明】
第1図は本発明一実施例の構成を示すブロック図。 第2図は同実施例の構成各要部の説明図。 第3図はパターン分離装置従来例の構成を示すブロック
図と要部の説明図である。 図中。 4はセグメント抽出部、  8は四辺形生成部。 9はセグメント選択部、10は四辺膨拡大部。 6′はセグメント統合部。 1)は検証部である。 第1 閾 t         2       ”7人力■  
 出イ象や、   アトしスセ1.(#きP 3     文 γ才テ 4臼ボ 4    七グヌ〉ト 細ポ岬 8    III  班形 牙 戸( 9乞グLト 夏択奸 tO”鉱量〉 4μ人町 6′    セクタ〉ト 糸り合 1)#証岬 率2 闇 翳− 〕 C(χ 1y)

Claims (4)

    【特許請求の範囲】
  1. (1)方眼状に配列される画素毎にパターン形成画素と
    背景形成画素とによって表される被認識パターンから相
    互に連接するパターン形成画素によって構成されるセグ
    メントを抽出するセグメント抽出部と、前記抽出された
    セグメントの大きさによって統合候補セグメントを選択
    するセグメント選択部と、前記選択されたセグメント上
    の所定位置を基準として該セグメントと他のセグメント
    とを統合するセグメント統合部と、前記統合された複数
    のセグメントからなるパターンの位置によって前記統合
    結果を検証する検証部とを備えることを特徴とするパタ
    ーン分離装置。
  2. (2)前記セグメント選択部は、前記抽出されたセグメ
    ントの外接四辺形の面積によって、統合候補セグメント
    を選択するものであることを特徴とする特許請求の範囲
    第(1)項記載のパターン分離装置。
  3. (3)前記セグメント統合部は、前記選択されたセグメ
    ントと該セグメントの外接四辺形との接点を基準として
    該セグメントと他のセグメントとを統合するものである
    ことを特徴とする特許請求の範囲第(1)項記載のパタ
    ーン分離装置。
  4. (4)前記検証部は、前記統合された複数のセグメント
    からなるパターンの外接四辺形の重心によって前記統合
    結果を検証するものであることを特徴とする特許請求の
    範囲第(1)項記載のパターン分離装置。
JP59139688A 1984-07-05 1984-07-05 パタ−ン分離装置 Pending JPS6118079A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59139688A JPS6118079A (ja) 1984-07-05 1984-07-05 パタ−ン分離装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59139688A JPS6118079A (ja) 1984-07-05 1984-07-05 パタ−ン分離装置

Publications (1)

Publication Number Publication Date
JPS6118079A true JPS6118079A (ja) 1986-01-25

Family

ID=15251107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59139688A Pending JPS6118079A (ja) 1984-07-05 1984-07-05 パタ−ン分離装置

Country Status (1)

Country Link
JP (1) JPS6118079A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63250787A (ja) * 1987-04-08 1988-10-18 Fuji Electric Co Ltd 文字切出し方法
JPH01292486A (ja) * 1988-05-19 1989-11-24 Sony Corp 文字認識装置及び方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63250787A (ja) * 1987-04-08 1988-10-18 Fuji Electric Co Ltd 文字切出し方法
JPH01292486A (ja) * 1988-05-19 1989-11-24 Sony Corp 文字認識装置及び方法

Similar Documents

Publication Publication Date Title
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
CN112200117B (zh) 表格识别方法及装置
EP0279156A2 (en) Apparatus and method for vectorization of incoming scanned image data
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
Ronee et al. Handwritten character recognition using piecewise linear two-dimensional warping
JPS6118079A (ja) パタ−ン分離装置
JPH08320914A (ja) 表認識方法および装置
JP3172498B2 (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
KR102616255B1 (ko) 폰트 생성 시스템 및 이를 이용한 폰트 생성 방법
JPH0736433A (ja) 文字データベース作成装置
JP4409678B2 (ja) 罫線抽出方式
JP4011859B2 (ja) 単語画像正規化装置,単語画像正規化プログラム記録媒体および単語画像正規化プログラム
JPH10207985A (ja) 文字切り出し方法および文字切り出し装置
JP2003317107A (ja) 罫線抽出方法及び装置
JPS62192886A (ja) 文字認識装置における特徴量生成方法
JPH04177483A (ja) パターンマッチング方式
JP2962525B2 (ja) テキストブロック認識方法
JPS6337489A (ja) 文書文字切り出し画像処理方式
JPH09265513A (ja) 文字認識装置
JPH10240867A (ja) 文字切り出し方法および文字切り出し装置
JPH04205394A (ja) 光学的文字読取装置
JPH0417086A (ja) 文字切り出し方法
JP2000293632A (ja) 文字列認識装置および文字列認識方法
JPH0217588A (ja) 文字輪郭生成時の不要データ除去方式
JPH0217589A (ja) 文字輪郭生成方式