JPH01231189A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPH01231189A
JPH01231189A JP63056123A JP5612388A JPH01231189A JP H01231189 A JPH01231189 A JP H01231189A JP 63056123 A JP63056123 A JP 63056123A JP 5612388 A JP5612388 A JP 5612388A JP H01231189 A JPH01231189 A JP H01231189A
Authority
JP
Japan
Prior art keywords
character
segment
contour
inclination
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63056123A
Other languages
English (en)
Other versions
JP2658137B2 (ja
Inventor
Yoshimi Yamada
義美 山田
Naoto Shinoda
信太 直人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP63056123A priority Critical patent/JP2658137B2/ja
Publication of JPH01231189A publication Critical patent/JPH01231189A/ja
Application granted granted Critical
Publication of JP2658137B2 publication Critical patent/JP2658137B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字読取装置における文字認識方式%式% (従来の技術) 従来の文字読取装置における文字認識方式には種々の方
式が提案されている。英数字、カタカナを対象とした文
字の認識法としては、ストロークアナリシス法やパター
ンマツチング法が多用されており、さらに文字の変形を
より吸収する方法としてパターンの線構造を解析する方
法や背景構造を解析する方法等がある。
しかし、上記方式に壇いては、たとえばストロークアナ
リシス法の場合、各文字の特徴を変形までも含めて辞書
に記述するため、辞書が膨大となり、従って処理時間が
大となり、処理時間を短くしようとするとハードウェア
規模が大となるという欠点があった。
また、背景構造を解析する方法においては、文字の背J
it一部に着口し、文字線のループや、あるいは凹とか
凸形状などの特徴を抽出することにより文字を識別する
のであるが、白黒黒判定等処理方法が複雑であるという
欠点がある。
このような欠点を除去するため従来、このような分野の
技術としては、特開昭59−161784号公報(オン
ライン文字認識大分類方法)に記載されるものかあった
。以下、その構成を第2図を用いて説明する。
文字を記載する時の筆記具の座標を示すデータを発生す
るタブレット11と、前記タブレットより発生するデー
タに基づき筆記された文字を認識するオンライン文字認
識装置において、タブレットよりのアナログデータをデ
ィジタルデータに変換する手段12と、ストロークの始
点及び終点を含むディジタルデータを一時格納し面処理
13.14を行い、前記前処理後のデータより線分の長
さ、相対位置等よりなる特徴間の演算14を行った結果
を格納する手段16と、予め格納されているデータまた
は予め格納されているデータを修飾したデータ17と、
前記所定の演算結果のデータとの間の大小関係を比較す
る手段18を存し、筆記された文字のストローク線分の
分布位置を識別することにより筆記文字を認識していた
そして、特徴間として記載された全ストロークの線長及
び各セグメントが存在する位置が用いられる。
(発明が解決しようとする課題) しかしながら、上記第2図に示した従来の構成では、文
字認識にはストロークの始点と終点とを記録しておかね
ばならず、さらにハードウェア規模の縮小処理時間短縮
を図る上で問題があった。
このため輪郭の抽出法を用い、始点を輪郭上どの点でも
よいこととし、つまりストロークを考慮しなくともよい
こととした。ここで輪郭の抽出法を用いる方式は本発明
の目的とするところではないので説明を省略する。さら
に文字の認識力を向上させるため特徴間として線分傾き
別の特徴量抽出を行うこととした。
しかしながら、線分傾き別の特徴間を抽出し記憶する場
合に線分か短いと記憶すべき線分の数の増加に伴い情報
量が多くなりハードウェアの規模の縮小、処理時間短縮
を図る上で問題が生ずる。
本発明は、文字の認識力を一定に保ちつつ、線分傾き別
の特徴間の記録を削減できるように屈曲点を抽出する文
字読取装置における文字認識方式を提供することを目的
とする。
(課題を解決するための手段) 本発明は、帳票上の文字を読取って、2値化した文字パ
ターンのデータを格納する手段と前記データより文字パ
ターンの輪郭を抽出する手段を有して文字を認識する装
置において、前記文字パターンの輪郭を抽出したデータ
より隣接する輪郭線分か相互に屈曲する屈曲点を抽出す
る手段と、前記屈曲点を抽出した線分の傾きを判別する
手段と、前記判別した傾き別に輪郭線分の所定の基準か
らの相対位置よりなる特徴間の算出を行う手段と、予め
格納されている特徴間と前記算出結果の特徴間とを比較
する手段とを有し、人力文字パターンの線分の分布位置
を線分の傾き別に識別することにより、文字を認識する
ことを特徴とする。
(作用) 本発明によれば、以下のように文字認識方式を構成した
ので、屈曲点を抽出する手段は、文字パターンの輪郭を
抽出したデータより輪郭線分の両端のx、y座標におい
てx、y方向の各差分をサイン(正、負、0の符号)と
して算出し、サイン状態の変化点を屈曲点として抽出し
、線分の傾きを判別する手段は文字パターンの輪郭を抽
出したデータにより前記屈曲点間を結ぶ線分であるセグ
メントの傾きを右上り、右下り、水平あるいは垂直かを
判別し、また特徴間の算出を行う手段は、前記セグメン
トの傾きに基づき傾き別にセグメントの相対位置よりな
る特徴間の算出を行う。
予め格納されている特徴間と前記所定の算出結果の特徴
間とを比較する手段では、認識対象文宇金てについて、
予め格納されている特徴間と算出結果の特徴間とのマツ
チングにおける差をマッチング距離とし、マツチング距
離によるソーティングを行い、マツチング距離の最小の
文字が認識結果として選択される。
したがフて、前記問題点を除去でき、ハードウェアの規
模の縮小、処理時間短縮を図ることができる文字読取装
置における文字認識方式を提供できる。
(実施例) 第1図は、本発明の一実施例を示すブロック図である。
同図において、1は2値化された文字パターンを格納す
るパターンレジスタ、2はパターンレジスタ1の内容に
より、文字パターンの輪郭を抽出する輪郭抽出部、3は
輪郭抽出部2で抽出されたx、y輪郭座標より線分の屈
曲点を抽出する屈曲点抽出部、4は屈曲点抽出部3で抽
出された屈曲点間の線分の傾きすなわち右上り、右下り
、水平あるいは垂直かを判別する傾き判別部、5は傾き
判別部4で判別された傾き別に、文字パターンの線分の
相対位置よりなる特徴量を算出する特徴量算出部、6は
文字パターンを識別する識別部である。
以下、本実施例の動作を説明する。
パターンレジスタlには、帳票上の文字を読取フて、2
値化された文字パターンが、図示しない文字パターン人
力部によって人力されている。ここでは、第3図の文字
パターンが格納されているものとする。
輪郭抽出部2はパターンレジスタ1の内容から、第4図
に示すように座標(9,32)及び(目、24)を開始
点として輪郭追跡を行い、輪郭特徴を抽出する。輪郭の
抽出法は、本発明の目的とする処ではないので説明を省
略するが、容易に輪郭抽出は行える。なお、輪郭□追跡
開始点は、どの点であってもよいものとする。
次に屈曲点抽出部3は、輪郭抽出部2で抽出された線分
の両端のx、yの輪郭座標データより線分の両端のx、
y方向の各差分をサイン(正。
負、0の符号)として算出し、サイン状態の変化点を屈
曲点として抽出する。
データ間のx、y方向のサインX sign、 Y s
ignXSlgn” X t   X +−rYsig
n=Y、−Yi−。
で求め、+、0.−で表現する。このようにして求めた
各データ間のX sign、 Y signの状態が連
続する回数をカウントし、同じ状態が1回以上継続した
後、異なる状態に変化した時(Xi、yl)を屈曲点と
して登録する。本説明においてはn=2とする。
第4図に、このようにして求めた点の他に始終点を加え
た屈曲点を示す。この屈曲点間を結ぶ線分を以下セグメ
ントとよぶ。
以上のようにして得られた特徴点情報は傾き判別部4に
出力される。傾き判別部4は特徴点抽出部3により得ら
れた特徴点情報に基づきセグメントの傾きすなわち右上
り、右下り、水平あるいは垂直かを判別する。
右上りについては X 、> X t++で’j t > :!/ t++
あるいはx i < x + + +でy+<y+++
右下りについては X 1 > X + + +で”J + < ’J i
++あるいはXi  <x、+鷹 で :Yi   >
:Yi+璽水平については X、=X1..でy、≠3’i++ 垂直については ’/ i = yt++でx1≠X i + 1の各条
件を判定することによりセグメントの傾きが判別される
第5図に文字パターンのx、y屈曲点座標と傾きを示す
。第5図の傾きの項で“/“は右上り、“\”は右下り
、“−”は水平、“1”は垂直を示す。
特徴量算出部5は傾き判別部4で判別された傾き別にx
、y屈曲点座標よりセグメントの相対位置よりなる特徴
量の算出を行う。
特徴量算出について以下詳細に説明する。
特徴量として、各セグメントが存在する位置を用いる。
存在する位置としであるセグメントか、x、y方向のど
の場所に存在するかをx、y成分別に数値化して、その
平均的な値を算出する。
まず、右上りのセグメントについて考える。
X成分のX軸上の位置については X成分のyfd上の位置についても同様ににより表わさ
れる。
ここで、HX、H,は文字パターンの文字幅を示す。
X成分のy軸上の位置については で、またX成分のX軸上の位置についてはで表わされる
右下りのセグメントについても同様に X成分のxIIIIkFの位置についてはQ5=Qlと
同等な関係式、 X成分のy軸上の位置についてはQ6=Q2と同等な関
係式、 X成分のy軸上の位置についてはQ?=Q3と同等な関
係式、 X成分のX軸上の位置についてはQ8=Q4と同等な関
係式、 で表わされる。
水平なセグメントについては X成分のX軸上の位置についてはQ9=Q+と同等な関
係式、 X成分のy軸上の位置についてはQlo=Q、と同等な
関係式、 さらに垂直なセグメントについては X成分のy軸上の位置についてはQ + + = Q 
2と同等な関係式、 X成分のX軸上の位置についてはQ + 2 = Q 
4と同等な関係式 %式% 上記Q1〜Q12は、文字パターンに外接する長方形の
左下(第5図(1,1))を原点とする座標系により演
算を行う。従って、各セグメントのx、X成分の存在す
る位置は、y軸上の位置については下にくるほど、X軸
上の位置については左にくるほどその特徴量は小さくな
り、本発明の方法では全セグメントの位置に関わる重み
をすべて加算するため、原点に近い部分でのセグメント
の変化は小さな差となって表われ、文字パターンに外接
する長方形上での右上の部分でのセグメントの変化によ
り左右されることとなる。従って、文字パターンに外接
する長方形の右上(第5図(22゜32))を原点とす
る座標系での前記Q1〜Q +2に関する演算を行い、
その結果をQI3〜Q24とする。
以上説明したQ1〜Q24の式を用いて、第6図に示さ
れたx、y屈曲点座標及び傾きデータにより演算を行う
。第6図(a)に示した外縁輪郭、(b)に示した内縁
輪郭に関して各々演算を行い、結果は外縁と内縁輪郭の
和としてQ1〜Q 24が求められる。このように上記
の演算は、複数の内縁がある文字に対しては、その全セ
グメントに関して演算を行う。
識別部6には認識対象文字毎のQ、〜Q24の特徴量が
格納されている。識別部6は特徴量算出部5で算出され
た人力文字パターンの特徴量Q、〜Q24と識別部6に
格納されている文字パターンの特徴’:k Q l〜Q
24とをマツチングさせる。こわらのマツチングにおけ
る差をマツチング距離とし、この算出を識別部6に格納
されている認識対象文字毎てについて行い、マツチング
距離によるソーティングを行う。
このソーティング結果に従って、マツチング距離の最小
の文字が認識結果として選択される。
(発明の効果) 以上詳細に説明したように、本発明によれば、屈曲点を
抽出して、線分の傾きを考慮した傾き別の特徴量抽出を
行なうこととしたので、一定の文字認識を保持しつつ、
文字読取装置におけるハードウェアの規模の縮小、処理
時間の短縮を図れることが期待できる。
【図面の簡単な説明】
第1図は本発明に係る一実施例のブロック図、第2図は
従来のオンライン文字認識大分類方法に係る構成図、第
3図は文字パターン図、第4図は輪郭抽出図、第5図は
屈曲点抽出図、第6図は屈曲点座標図である。 1:パターンレジスタ 2:輪郭抽出部3:屈曲点抽出
部   4:傾き判別部5:特徴量算出部   6:認
識部 特許出願人   沖電気工業株式会社 特許出願代理人 弁理士 山本恵− Vζ、ノート式1 l:1ls−jEiと4り1 乃プ
ロ・ソゲ クコ第1図 貸来#τシライン丈イ3qdスン1壕貝1−ぺ4zia
30第2図 文 露 パダー″−I!l          軸 x
l  ギvr、  圓第3図  第4図 圧耐、東、ffkω 第5図 屈譜、責、t NI’n 第6図

Claims (1)

  1. 【特許請求の範囲】 帳票上の文字を読取って、2値化した文字パターンのデ
    ータを格納する手段と前記データより文字パターンの輪
    郭を抽出する手段を有して文字を認識する装置において
    、 前記文字パターンの輪郭を抽出したデータより隣接する
    輪郭線分が相互に屈曲する屈曲点を抽出する手段と、 前記屈曲点を抽出した線分の傾きを判別する手段と、 前記判別した傾き別に輪郭線分の所定の基準点からの相
    対位置よりなる特徴量の算出を行う手段と、 予め格納されている特徴量と前記算出結果の特徴量とを
    比較する手段とを有し、入力文字パターンの線分の分布
    位置を線分の傾き別に識別することにより、文字を認識
    することを特徴とする文字認識方式。
JP63056123A 1988-03-11 1988-03-11 文字認識方式 Expired - Lifetime JP2658137B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63056123A JP2658137B2 (ja) 1988-03-11 1988-03-11 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63056123A JP2658137B2 (ja) 1988-03-11 1988-03-11 文字認識方式

Publications (2)

Publication Number Publication Date
JPH01231189A true JPH01231189A (ja) 1989-09-14
JP2658137B2 JP2658137B2 (ja) 1997-09-30

Family

ID=13018297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63056123A Expired - Lifetime JP2658137B2 (ja) 1988-03-11 1988-03-11 文字認識方式

Country Status (1)

Country Link
JP (1) JP2658137B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0710384A4 (en) * 1994-05-10 1997-05-02 Motorola Inc LINE SEGMENTATION METHOD FOR MANUSCRIPT INPUT

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58114181A (ja) * 1981-12-26 1983-07-07 Fujitsu Ltd 文字認識方式
JPS6170674A (ja) * 1984-09-14 1986-04-11 Canon Inc 画像処理装置
JPS62290985A (ja) * 1986-06-11 1987-12-17 Hitachi Ltd パタ−ン認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58114181A (ja) * 1981-12-26 1983-07-07 Fujitsu Ltd 文字認識方式
JPS6170674A (ja) * 1984-09-14 1986-04-11 Canon Inc 画像処理装置
JPS62290985A (ja) * 1986-06-11 1987-12-17 Hitachi Ltd パタ−ン認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0710384A4 (en) * 1994-05-10 1997-05-02 Motorola Inc LINE SEGMENTATION METHOD FOR MANUSCRIPT INPUT

Also Published As

Publication number Publication date
JP2658137B2 (ja) 1997-09-30

Similar Documents

Publication Publication Date Title
CN109657631B (zh) 人体姿态识别方法及装置
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
CN110796130A (zh) 用于文字识别的方法、装置及计算机存储介质
CN115439733A (zh) 图像处理方法、装置、终端设备及计算机可读存储介质
JPH01231189A (ja) 文字認識方式
JP2658136B2 (ja) 文字認識方式
JP2785438B2 (ja) 文字認識方式
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
Wei et al. Detection of side-view faces in color images
CN110737364A (zh) 一种安卓系统下触摸书写加速的控制方法
CN112464753B (zh) 图像中关键点的检测方法、检测装置及终端设备
JP2965165B2 (ja) パターン認識方法及び認識用辞書作成方法
JP3817281B2 (ja) 情報処理装置及び方法
JPH09237339A (ja) 円/円弧の認識方法
JP2976426B2 (ja) 文字認識装置
JP2658153B2 (ja) 文字識別方式
US20190003827A1 (en) Shape discrimination device, shape discrimination method and shape discrimination program
JP2658154B2 (ja) 文字識別方式
JPH07302338A (ja) テンプレートマッチング方法およびこの方法を用いたパターン認識装置
JPS5835674A (ja) オンライン手書文字特徴抽出方法
JP2881080B2 (ja) 特徴抽出方法
JP2851865B2 (ja) 文字認識装置
JP4719491B2 (ja) オブジェクト抽出方法、オブジェクト抽出装置及びオブジェクト抽出プログラム
US20200320285A1 (en) Shape discrimination device, shape discrimination method and shape discrimination program

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080606

Year of fee payment: 11