JPS61271586A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS61271586A
JPS61271586A JP60113818A JP11381885A JPS61271586A JP S61271586 A JPS61271586 A JP S61271586A JP 60113818 A JP60113818 A JP 60113818A JP 11381885 A JP11381885 A JP 11381885A JP S61271586 A JPS61271586 A JP S61271586A
Authority
JP
Japan
Prior art keywords
character
characters
pattern
patterns
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60113818A
Other languages
English (en)
Inventor
Michiaki Nakanishi
道明 中西
Yukikazu Kaburayama
蕪山 幸和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60113818A priority Critical patent/JPS61271586A/ja
Publication of JPS61271586A publication Critical patent/JPS61271586A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 辞書記憶部に、複数の部分テンプレート・パターン並び
に文字種、元の文字パターンにおいて部分テンプレート
・パターンが占めるエリアを表すためのパラメータ及び
位置重ね合わせパラメータを有するパラメータ関係情報
を格納し、辞書記憶部の容量を小さく出来ると共に、文
字認識を効率よく行い得るようにした文字認識方式であ
る。
〔産業上の利用分野〕
本発明は、漢字等の多種類の文字を認識する文字認識装
置に係わり、特に手書き文字パターンでの個人的な変動
要素をも効率良く処理出来るように部分テンプレート・
パターン格納において共通化をパラメータを用いて効率
的に実行できる文字認識方式に関するものである。
〔従来技術と問題点〕
従来のテンプレート・パターンの共通化には、その部分
パターンでの共通化方式或いは特徴抽出後にその特徴間
での共通化を図る方式とがあるが、前者は例えば漢字に
おける偏や労などを部分パターンとして把握するもので
あるが、手書き文字などでは、その分離が複雑になり勝
ちである。特徴空間での共通化は特徴自体が他との区別
を目的としているので、特徴を粗く見る等の操作による
もツカ多く、−纏めにしたいパターンと他のパターンの
混在パターンの出現比率が高くなる傾向にあり、細分類
するために別の所でテンプレート追加が必要となる。
〔発明の目的〕
本発明は、上記の考察に基づくものであって、文字認識
におけるテンプレートを認識対象文字間で共通化し、記
憶容量の削減を図ると共に効率的に文字認識処理を行い
得るようにした文字認識方式を提供することを目的とし
ている。
〔目的を達成するための手段〕
そしてそのため本発明の文字認識方式は、文字の部分パ
ターンに対応する部分テンプレート・パターンの複数個
を辞書記憶部に格納すると共に、文字に対応する文字種
、当該文字を構成する際に使用される部分テンプレート
・パターンの名前及びこれら部分テンブレー1・・パタ
ーンが元の文字パターンにおいて占めるエリアを表すた
めのパラメータ等を有するパラメータ関係情報の複数個
を上記辞書記憶部に格納し、入力文字についての特徴を
抽出し、抽出された特徴と上記辞書記憶部の内容を照合
することにより、入力文字の認識を行うことを特徴とす
るものである。
〔発明の実施例〕
以下、本発明を実施例を参照しつつ説明する。
要約すると、本発明は共通化対象の部分文字パターン(
例えば「化」の大傷部分と「傑」の入部部、分)につい
て元の文字パターンから切り取りを行わず、部分テンプ
レート・パターン(入部を表すパターン)及び部分テン
プレート・パターンが元の文字パターン上(「化」や「
傑」の文字パターン)において占めるエリアを示すパラ
メータ(通常は深さ方向1、特定パターンについて幅方
向2、特定点MAX4点)を用いることにより、相対的
な形状の部分文字パターンはもとより、非線型な文字パ
ターンについても一つの部分テンプレート・パターンで
済ませられるようにし、人カバターンとのマツチングに
おいて双方とも部分文字パターンといえども切り取りや
消し込み等の処理をせずに、また対象文字に与えられた
パラメータとの相互演算で一つの部分テンプレート・パ
ターンを複数の文字の部分テンプレート・パターンとし
て用いられるようにしたものである。特定点(特異点)
は主として既に出願済みの「輪郭走査法」の中央線分テ
ーブルを用いる。なお、部分テンプレート・パターンと
は、例えばマツチング・テンプレート・パターン(全面
)が64X64点で構成されたとき32X64又は64
X32となり、これを3枠方向から深さを測った値を各
軸方向に並べたものがサブテンプレート・パターンの中
身になる。
入カバターンから得られたものと何処を基準にして差分
を取るかのパラメータが単に比較するエリアの設定(外
枠)のみの場合と、エリアをより対応すべき部分が重な
るようにするための特定点を指定し、そこと外枠とでエ
リアを補正し差分を取る場合がある。
漢字OCRでの認識処理では複雑な漢字を識別、するた
めカタカナOCRと比べ文字単位の辞書サイズは格段に
大きいのが普通である。反面、多くの漢字は偏、労、冠
、足、構などの部分から構成され、それらをうまく抽出
できれば、各部分毎の部分名の組合せで漢字を表現する
ことが出来る。
例えば「化」という漢字は左右に分割できれば、「イ」
 (入部)と「巳」とからなる。「イ」 (入部)はJ
ISの第一水準だけでも112字種(部首としであるも
ののみ)もあり、これらの文字に関して部分テンプレー
ト・パターンを一つにした時の効果は大きい。しかし「
化」のように分離の比較的容易なものばかりではない。
また「傑」のように「化」に比べて「イ」 (入部)の
比率が少ないものもある。第1図は「傑」と「化」の「
イ」 (入部)の比率の相違を示す。そこで、第2図に
示すようなパラメータを設定することにより部分テンプ
レート・パターンを元の部分文字パターンへ引き写すこ
とを可能とする。第2図は、部分テンプレート・パター
ンを元の部分文字パターンに引き写すだめのバラメーク
を説明する図であり、同図において、dはパターンの厚
み方向(奥行き)の長さ、tはパターンの幅(上) (
労との相対位置)、bはパターンの幅(下)(労との相
対位置)、P、は特異点位置(必要に応して複数個・M
AX4個)をそれぞれ示している。
第3図は登録される部分テンプレート・パターンの元の
部分文字パターンへの展開を説明する図である。全体の
テンプレート・パターン作成対象の大きさが64(幅)
X64.(高さ)であるとすると、文字を左右の分離し
た場合の各部分テンプレート・パターン作成対象の大き
さは、32(幅)X64(高さ)となる。第3図におい
ては、大傷の部分テンプレート・パターン及び「化」の
パラメータとにより「化」という文字の入部パターン(
左枠パターン)を生成しており、また、大傷の部分テン
プレート・パターン及び「傑」のパラメータとにより「
傑」という文字の入部パターン(左枠パターン)を生成
している。「化」の労(右枠パターン)と「北」の労(
右枠パターン)は共通化することが出来るが、この労の
部分テンプレート・パターンとして、最後を跳ねたもの
と、止めたものとを辞書記憶部に登録しておく。辞書記
憶部の中には部分テンプレート・パターンとパラメータ
関係情報とを記憶して置き、パラメータ関係情報によっ
て指定されるゾーンのみを照合対象とし、これにより種
々の変形要因からの影響を最少にする。
第4図は特異点を説明する図である。上下方向の文字線
間の中点を結んで出来る線分を中線分と言い、左右方向
の文字線間の中点を結んで出来る線分を央線分と言う。
特異点として、中線分又は央線分の閉側の点を用いる。
特異点は、位置合せのために使用される。
第5図は分割方法を説明する図である。図示のように、
分割の方法は、左右に分割する方法、上下に分割する方
法、上下に分割したものを更に左右に分割する方法、に
ょう部と残りの部分とに分割する方法等がある。
第6図は一つの文字に対するパラメータ関係情報の構成
の1例を示す図である。パラメータ関係情報は、辞書分
類コード、カテゴリ (文字種)名、主分割方向コード
、上側サブパターン尚、下側サブパターン魚、左側サブ
パターン魚、右側サブパターン患、上パラメータ環さ方
向、上パラメータ開始点、上パラメータ終了点、下パラ
メータ環さ方向、下パラメータ開始点、下パラメータ終
了点、左パラメータ深さ方向、左パラメータ開始点、左
パラメータ終了点、右パラメータ深さ方向、右パラメー
タ開始点、右パラメータ終了点、上下左右特異点数、特
異点の座標及び予備領域から構成されている。なお、サ
ブパターンとは部分テンプレート・パターンのことであ
り、また、深さ方向とは第2図のdのことであり、開始
点とは第2図のtのことであり、終了点とは第2図のb
のことである。
部分テンプレート・パターンの指定パラメータのうち内
部の特異点の記述パラメータ(複雑度に応じてその数を
増減する)を分割方向と異なるサブパターンの深さパラ
メータの決定に使用する以外は・深さ方向パラメータを
メインにして深さ方向側以外の3枠からの外部形状(第
7図)により入力文字パターンの構成要素(サブパター
ン)の大分類を行う。漢字での偏・労の文字は上または
下の深さ方向のパラメータの設定は左右程簡単ではない
が、左右での内部特異点を用いて行う。偏・労の相対位
置の変動要素も大きいので照合時は左・右パターンの重
みを大きくする。その外に単純には左右、上下と言った
サブパターン化が出来ないもの(少画数のもの「米」、
成る程度以上に複雑なもの「書」、周囲が囲まれている
もの「図」、「画」など)にも特異点による深さ方向パ
ラメータの設定により同様のサブ3枠パターンを定義し
、大分類を行うことが可能となる。
第8図は入力文字の候補として「漢」が得られた時に「
さんずい」の部分テンプレート・パターンと入力文字の
左側半分の照合を説明するための図である。まず、「漢
」の候補に対してL D/RDO値を「漢」の辞書から
求める。この値の付近で分割点を探し、入力文字を分割
し、入力文字の左側分割部分を正規化し、正規化された
左側分割部分と「さんずい」の部分テンプレート・パタ
ーンとの差分を取る。なお、矢印は枠からの深さを示し
ている。例えば、高さXに置いて右方向矢印の大きさか
yであれば、左粋に割り当てられた64バイト領域の内
の第X番目のバイトに値yが格納される。
第9図は文字認識装置の概要を示す図である。
第9図において、1は原稿、2はCCDイメージ・セン
サ、3は前処理部、4は文字切出部、5は正規化部、6
は特徴抽出部、7は照合部、8は候補列記憶部、9は詳
細分類部、10は辞書記憶部をそれぞれ示している。原
稿1からの反射光はCCDイメージ・センサ2によって
アナログ電気信号に変換される。CCDイメージ・セン
サ2からのアナログ電気信号は前処理部3に入力され、
前処理部3は雑音除去や2値化等の処理を行い、2値化
された画像データはビデオ・メモリ (図示せず)に格
納される。文字切出部4は、ビデオ・メモリから文字を
1文字ずつ切り出す。正規化部5は、切り出された文字
の大きさを所定の大きさに揃える等の処理を行う。特徴
抽出部6は、入力文字の特徴を抽出する。照合部7は、
辞書記憶部10に格納されている複数のパターン関係情
報及び部分テンプレート・パターンを参照し、これらと
入力文字の特徴の照合を行い、入力文字に対する文字候
補列を定める。この文字候補列は候補列記憶部8に格納
される。詳細分類部9は、辞書記憶部10の内容を参照
し、これと入力文字の特徴とを詳細に照合し、候補列の
中から入力文字に最も似ているものを選択する。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、文字
の部分パターンに対応する部分テンプレート・パターン
、及びその部分テンプレート・パターンが元の文字パタ
ーンにおいて占めるエリアを表すパラメータを持つパラ
メータ関係情報を辞書記憶部に格納しているので、入力
文字パターンを分離すること無く辞書記憶部に格納され
ている部分テンプレート・パターン及びパラメータ関係
情報を用いてその候補文字での部分文字パターンを作成
し、これらの組合せパターンと入力文字パターンとを一
度でラバー・マツチング出来、これにより単純な記憶容
量の削減だけでなくパターン中での相対位置ずれもカバ
ーし、変形パターン対応に効果がある。
【図面の簡単な説明】
第1図は「化」の大傷の文字全体に対する比率と「傑」
の大傷の文字全体に対する比率の違いを示す図、第2図
は部分テンプレート・パターンが元の文字パターンにお
いて占めるエリアを表すためのパラメータを説明する図
、第3図は部分テンプレート・パターンの元の部分文字
パターンへの展開を説明する図、第4図は特異点を説明
する図、第5図は分割方法を説明する図、第6図はパラ
メータ関係情報の構成を示す図、第7図は3枠サブパタ
ーンの概念図、第8図は入力文字の候補として「漢」が
得られた時に「さんずい」の部分テンプレート・パター
ンと入力文字の左側半分の照合を説明するための図、第
9図は文字認識装置の概要を示す図である。 1・・・原稿、2・・・CCDイメージ・センサ、3・
・・前処理部、4・・・文字切出部、5・・・正規化部
、6・・・特徴抽出部、7・・・照合部、8・・・候補
列記憶部、9・・・詳細分類部、10・・・辞書記憶部
。 特許出願人   富士通株式会社 代理人弁理士  京 谷 四 部 彌11!1 %251 第3図 ”fff上  上下→ぞり 下11!今l;いて石ニス
5に+4’+1 囮 t:Jつヨ [↓入日]  定二 兜シ y8−3i 
 、LLD   RD 入力を望2−ン U =コニ=ニコニコ ■ 3Z     71;4     ;i乙慄q1引

Claims (1)

    【特許請求の範囲】
  1. 文字の部分パターンに対応する部分テンプレート・パタ
    ーンの複数個を辞書記憶部に格納すると共に、文字に対
    応する文字種、当該文字を構成する際に使用される部分
    テンプレート・パターンの名前及びこれら部分テンプレ
    ート・パターンが元の文字パターンにおいて占めるエリ
    アを表すためのパラメータ等を有するパラメータ関係情
    報の複数個を上記辞書記憶部に格納し、入力文字につい
    ての特徴を抽出し、抽出された特徴と上記辞書記憶部の
    内容を照合することにより、入力文字の認識を行うこと
    を特徴とする文字認識方式。
JP60113818A 1985-05-27 1985-05-27 文字認識方式 Pending JPS61271586A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60113818A JPS61271586A (ja) 1985-05-27 1985-05-27 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60113818A JPS61271586A (ja) 1985-05-27 1985-05-27 文字認識方式

Publications (1)

Publication Number Publication Date
JPS61271586A true JPS61271586A (ja) 1986-12-01

Family

ID=14621813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60113818A Pending JPS61271586A (ja) 1985-05-27 1985-05-27 文字認識方式

Country Status (1)

Country Link
JP (1) JPS61271586A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5882373A (ja) * 1981-11-12 1983-05-17 Oki Electric Ind Co Ltd オンライン文字認識方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5882373A (ja) * 1981-11-12 1983-05-17 Oki Electric Ind Co Ltd オンライン文字認識方法

Similar Documents

Publication Publication Date Title
Konidaris et al. Keyword-guided word spotting in historical printed documents using synthetic data and user feedback
Lakshmi et al. An optical character recognition system for printed Telugu text
Chi et al. Separation of single-and double-touching handwritten numeral strings
Heutte et al. Combining structural and statistical features for the recognition of handwritten characters
JPS61271586A (ja) 文字認識方式
Phuong et al. An efficient model for isolated Vietnamese handwritten recognition
KR910000786B1 (ko) 패턴인식방식
Hebert et al. Writing type and language identification in heterogeneous and complex documents
JPH0740288B2 (ja) パターン認識方法
JPS63269267A (ja) 文字認識方法
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
Rios et al. An OCR Free Method for Word Spotting in Printed Documents: the Evaluation of Different Feature Sets.
JP3867237B2 (ja) 文字認識方法および装置および文字認識プログラムを記録した記録媒体
JPH0562021A (ja) 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム
JP3290110B2 (ja) 手書き文字認識装置
JPH04280392A (ja) 文字認識方式
JPH03126188A (ja) 文字認識装置
JPH07107698B2 (ja) 文字認識方法
JPS62271190A (ja) セグメント数字認識方式
JPH05120483A (ja) 文字認識装置
JPH031712B2 (ja)
JPH0795336B2 (ja) 文字認識方式
Kim et al. Recognition of handwritten phrases as applied to street name images
JPS6198487A (ja) 辞書選択方式
JPH0792819B2 (ja) パターン切出しおよび認識方法とそのシステム