JPS6239794B2 - - Google Patents

Info

Publication number
JPS6239794B2
JPS6239794B2 JP55105490A JP10549080A JPS6239794B2 JP S6239794 B2 JPS6239794 B2 JP S6239794B2 JP 55105490 A JP55105490 A JP 55105490A JP 10549080 A JP10549080 A JP 10549080A JP S6239794 B2 JPS6239794 B2 JP S6239794B2
Authority
JP
Japan
Prior art keywords
character
partial pattern
feature
partial
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55105490A
Other languages
English (en)
Other versions
JPS5730087A (en
Inventor
Osamu Kato
Koya Fujita
Haruo Akimoto
Tetsuji Morishita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP10549080A priority Critical patent/JPS5730087A/ja
Publication of JPS5730087A publication Critical patent/JPS5730087A/ja
Publication of JPS6239794B2 publication Critical patent/JPS6239794B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は、文字特徴登録処理方式、特に文字の
構成要素である部分についての手書き部分パター
ンを入力し、手書きに起因するストロークに特徴
を有する上記部分パターンを保持すると共に予め
文字を構成する部分パターンの結合関係を示す文
字合成コードにもとずいて上記部分パターンで文
字を構成し該文字を文字登録部に登録するように
した文字特徴登録処理方式に関するものである。
手書き文字の特徴を辞書に登録する方式として
従来は文字記入枠に1文字づつ記入された手書き
文字の文字単位で文字の特徴を抽出し、筆記者の
手書き特徴を保持した状態で登録する方法が採用
されていた。
文字種の多い漢字にあつては例えば2000種以上
の漢字を認識する場合これらすべての文字を筆記
者は記入しなければならない欠点があつた。
本発明は、上記欠点の解決することを目的とし
ており、漢子の構成に着目し文字を構成する構成
要素の最小数の部分パターンを筆記者に記入して
もらい、当該部分パターンを合成して文字種を構
成させそれを登録することにより、筆記者の手書
き特徴を保持した形で文字登録が行なわれるよう
にすると共に、認識対象文字をすべて記入しても
らう筆記者の負担を大幅に軽減させることを目的
としている。そしてそのため本発明の文字特徴登
録処理方式は、 部分パターンの合成によつて表現される複数個
の文字について筆記者の手書き特徴を保持した形
で文字登録部に上記複数個の文字を登録する文字
特徴登録処理方式において、上記部分パターンを
手書き入力すると共に当該部分パターンを構成す
るストロークを抽出する部分パターン入力部、該
部分パターン入力部に入力された部分パターンに
ついて当該部分パターンを構成する個々のストロ
ークの特徴を抽出し当該ストロークの特徴系列に
よつて上記入力された部分パターンの特徴を抽出
し当該部分パターンの特徴を保持する特徴抽出
部、上記文字登録部に登録されるべき複数個の各
文字について予め各文字対応に部分パターンの結
合状態が文字合成コードとして登録されている文
字合成・コード辞書部、および該文字合成・コー
ド辞書部から読出された文字合成コードにもとづ
いて上記特徴抽出部に保持されている部分パター
ンの特徴を抽出しかつ上記文字合成コードに対応
して上記部分パターンの特徴を特徴系列にまとめ
る特徴合成部をそなえ、上記文字を構成する部分
パターンを入力することによつて当該部分パター
ンの特徴を保持した形で複数個の文字を上記文字
登録部に登録するようにしたことを特徴としてい
る。以下図面を参照しつつ説明する。
第1図は文字を構成する部分パターン分解図、
第2図は部分パターンを構成するストローク分解
図、第3図は部分パターン{Bi}およびその特
徴集合{bi}を説明する説明図、第4図は本発
明の文字特徴登録処理方式の一実施例構成、第5
図は第4図の部分パターン入力部を説明する説明
図、第6図は第4図の特徴抽出部を説明する説明
図を示している。
一般に文字、特に漢子は偏(へん)或は旁(つ
くり)のような字体構成要素の部分パターンから
構成されている。従がつて漢字はこれらの偏や旁
等の部分パターンを適当に組合せることによつて
数々の文字を合成することができる。
ところで文字認識における文字の特徴は文字全
体で定まるのが一般的であり、当該文字を構成す
る上記偏や旁等の部分パターンの特徴の組合せだ
けでは決定できない。しかしながら文字を構成す
る部分パターンについて特徴があり、これらの特
徴を有する部分パターンを合成することによつて
出来上がる文字は特徴のある文字を構成すること
になり、このような特徴ある部分パターンの集合
を識別のため記入することにより文字の特徴を記
述することができる。即ち文字の特徴として部分
パターンの特徴を組合わせることにより文字の特
徴が合成できるような特徴を用いることができれ
ば、部分パターンの集合を記入することにより文
字の特徴を記述することができる。例えば手書き
文字特に実時間手書き文字においては、ストロー
クおよびストロークの筆順情報が上記部分パター
ンの特徴として利用することができる。上述の条
件を満足する文字を記述する特徴としてストロー
ク形状特徴の系列を採用すれば、当該ストローク
形状特徴がストローク単独で定まる特徴であり、
他のストロークの存在に影響されないため、文字
を構成するストロークの幾つかで構成される部分
パターンの特徴、即ち部分パターンを構成するス
トロークの形状特徴の系列もまた他の部分パター
ンの特徴に影響されず、文字の特徴が部分パター
ンの特徴の系列で記述される。
具体的に説明すると文字Pは幾つかの部分パタ
ーンBiの系列で記述され次式で記される。
P={B1,B2,…,Bi,…,Bo} …… 但しここでnは部分パターン数を表わす 第1図の文字を構成する部分パターン分解図は
上式を示しており、文字「部」=Pは部分パタ
ーン「立」=B1,「口」=B2,「〓」=B3のn=3か
ら成立していることを表わしている。さらに個々
の部分パターンBiは当該部分パターンBiを構成
するストロークSjの系列で記述され次式で記され
る。
i={Si1,Si2,…,Sij,…,Sin(i)} …… 但しm(i)は第i番目の部分パターンのストロー
ク数を表わす。
第2図の部分パターンを構成するストローク分
解図は上式を示しており、第1番目i=1の部
分パターン「立」=B1はストロークS11ないしS15
から成立していることを示している。このときm
(i)=m(1)=5である。
従がつて文字は一般にストロークの系列で記述
されることになる。ストローク数をK1とおくと
次式で与えられる。
例えば上記例の文字「部」についてのストロー
クは P={B1,B2,B3} ={S11,S12,S13,S14,S15,S21, S22,S23,S31,S32} と表現される。
さて文字の特徴としてストロークの方向、スト
ロークの始点と終点との相対的な位置の関係、ス
トロークの途中の曲り具合等ストローク形状特徴
の系列を採用すればこれらの特徴については次の
ような性質がある。
(i) ストローク形状特徴はストロークの文字内に
おける存在の位置、大きさおよび他のストロー
クの存在に依存することなく独立的である。
(ii) 部分パターンの特徴も部分パターンを構成す
るストロークの形状特徴の系列で表現できる。
(iii) 部分パターンの特徴は他の部分パターンの存
在に影響されることなく独立的である。
(iv) 文字の特徴は部分パターンの特徴の系列で記
述される。
今文字Pの特徴をp(以下特徴については小文
字で表現される)、部分パターンの特徴をbi、ス
トロークの形状特徴をsijで表現すると bi=(si1,si2,…,sij,…,sim(i)) …… p=(b1,b2,……,bi,……bo) …… となる。
次に筆記者が記入した部分パターンの幾つかか
ら筆記者の特徴を保持した形で文字を合成する方
法について説明する。筆記者の記入した部分パタ
ーンの特徴を抽出する、即ち部分パターンを構成
する上記ストロークの形状特徴系列を抽出する。
そしてこの部分パターン名Biに対する特徴をbi
とする(ただしこのときi=1,2,……,l、
lは部分パターンの種類の数)。
また文字種pkに対してパターン系列は予かじ
め定まつており、例えば文字種pk=「部」ならば
部分パターン系列は「立」と「口」と「〓」の部
分パターンから構成され、それらの部分パターン
の配置は文字「部」の有する特質で予かじめ定ま
つている。従がつて文字種pkは次式で記され
る。
k=(Bk1,Bk2,…,Bki,…,Bko(k))
……′ ここでn(k)は文字種pkを構成する部分パター
ン数を表わす。
上記部分パターンBkiに対応する部分パターン
特徴bkiを部分パターン特徴{bi}の中から選択
し、当該選択された部分パターン特徴を組合わせ
即ち合成することによつて筆記者の記入した部分
パターンの特徴を保持した合成文字pkの合成特
徴pkは次式で表現される。
k=(bk1,bk2,bk3,……bko(k)) …… 上記具体例について第3図の部分パターン{B
i}およびその特徴集合{bi}を説明する説明図
を用いて説明する。
同図の枠内の文字は部分パターンの多種類の中
から抜粋した1部を示している。
例えば文字種P1=「部」を合成する場合を考え
てみる。当該文字種P1=「部」は次式によつて
合成され、その特徴p1はB4,B5,B1のそれぞれ
の特徴の系列により次式に示す特徴系列の合成
されたものである。
(B4,B5,B1)=P1=「部」 …… (b4,b5,b1)=p1 …… ここで b4=(s41,s42,s43,s44,s45) b5=(s51,s52,s53) b1=(s11,s12) 即ち部分パターンの特徴b4を有する部分パター
ンB4の「立」と、部分パターンの特徴b5を有する
部分パターンB5の「口」と、部分パターンの特
徴b1を有する部分パターンB1の「〓」とを合成す
れば文字「部」が合成され、その合成された文字
「部」には第3図枠内の数字によつて表わされる
各ストロークの特徴系列の部分パターンの特徴
b4,b5,b1を保持した形で合成されていることを
意味している。
第4図は本発明の文字特徴登録処理方式の一実
施例構成を示しており、1は部分パターン入力
部、2は特徴抽出部、3は文字合成・コード辞書
部、4は特徴合成部、5は文字登録部を表わして
いる。
部分パターン入力部1は第5図に示す如く部分
パターン記入シート6とストローク抽出部7とか
ら構成されている。そして部分パターン記入シー
ト6には筆記者が自筆で部分パターン即ち文字を
構成する偏や旁等を記入する記入枠8が設けら
れ、その下には予め文字を合成するのに必要な部
分パターンの種類が印刷されている。第5図の部
分パターン記入シート6内には8個の部分パター
ンの記入枠8が例示されており、部分パターン
B8の記入枠8に旁「〓」が記入されている。ス
トローク抽出部7は部分パターン記入シート6内
の部分パターン単位Biについて各々のストロー
クを抽出し、ストロークの系列Bi=(Si1,Si2
…,Sin(i))のコードおよびその情報を出力す
る。第5図においては例えばストローク抽出部7
から部分パターンB8についてのストロークな
いし(S81,S82,S83)のコードおよびその情報
を出力する。
第4図の特徴抽出部2は第6図に示す如くスト
ローク形状特徴抽出部9と部分パターン特徴記憶
部10とから構成される。ストローク形状特徴抽
出部9は上記ストローク抽出部7からのストロー
クの系列情報を受けてストロークSijに対するそ
の特徴sijを抽出する。即ち抽出された部分パタ
ーンBiのストローク系列(Si1,Si2,…,Sin
(i))に対してストロークの形状特徴(si1,si2
……sim(i))を抽出し、部分パターンの特徴bi
決める。これは上式に対応している。そしてこ
れら部分パターンの特徴系列{bi}はその対応
コード{Xi}と共に部分パターン特徴記憶部1
0に記憶される。
第4図の文字合成・コード辞書部3には文字P
を構成する部分パターンの系列{Bi}に対する
コードと例えばその位置関係を指示する情報が各
文字P毎に格納されている。例えば文字「部」に
ついては部分パターン「立」、「口」、「〓」に対応
するコードX1,X2,X3およびその位置関係を指
示する情報が格納されている。これは上式に対
応し、各文字カテゴリ毎に部分パターン名の系列
が記憶されると共に、その文字の部分パターンの
位置関係の情報も当該文字合成・コード辞書部3
には記憶されている。
第4図の特徴合成部4は各文字カテゴリに対す
る部分パターン系列の対応コード及びその位置関
係を指示する情報を上記文字合成・コード辞書部
3から読出すと共に、当該読出されたコードで上
記特徴抽出部2内の部分パターン特徴記憶部10
から上記部分パターン系列に対応する部分パター
ンの特徴系列を読出す機能を有する。これは上式
に対応する。
第4図の登録部5には上記特徴合成部4で読出
された部分パターンの特徴系列の各部分パターン
の特徴についてのストローク形状特徴と部分パタ
ーン系列の位置関係を指示する情報とが文字カテ
ゴリ毎に記憶される。
以上の如き各機能を有する本発明の文字特徴登
録処理方式について、例えば文字「部」を用いて
その処理を説明すると次のようである。
筆記者は入力部1の部分パターン記入シート6
内に設けられている枠8に文字を合成するのに必
要な部分パターンの種類が印刷されている部分パ
ターンを記入する。このとき文字「部」の部分パ
ターンB4の「立」、B5の「口」、B1の「〓」も含
まれている。ストローク抽出部7は部分パターン
単位Biについて各々ストロークを抽出し、スト
ロークの系列Bi=(Si1,Si2,…Sin(i))のコード
およびその情報を出力するから、上記B4=(S41
S42,S43,S44,S45),B5=(S51,S52,S53),B1
=(S11,S12)の各々のコード及びその情報も特徴
抽出部2に向けて出力する。特徴抽出部2内のス
トローク特徴抽出部9ではストロークの系列情報
を受けてストロークSijに対するその特徴sijを抽
出し、部分パターンの特徴biを決めるから、上
記「部」についてb4=(s41,s42,s43,S44
s45),b5=(s51,s52,s53),b1=(s11,s12)が求

られる。部分パターンの特徴biに対応するコー
ドXiが付されて部分パターン特徴記憶部10に
部分パターンの特徴biは格納されるから、、上記
部分パターンの特徴b4はコードX4、部分パター
ンの特徴b5はコードX5、部分パターンの特徴b1
コードX1が付され、上記それぞれのストローク
の形状特徴系列が部分パターン特徴記憶部10に
格納される。
一方、文字合成・コード辞書3には文字「部」
を合成するコードX4,X5,X1およびこれらのコ
ードの位置関係を指示する情報が格納されている
から、特徴合成部4は文字合成・コード辞書3か
ら文字「部」を合成するために上記コードX4
X5,X1およびこれらのコードの位置関係を指示
する情報を読出し、コードX4,X5,X1をもつて
特徴抽出部2内の部分パターン特徴記憶部10か
ら部分パターンの特徴系列(b4,b5,b1)を読出
し、これらの部分パターンの特徴b4,b5,b1の位
置関係を指示する情報と共に文字登録部5に格納
される。該文字登録部5に格納された文字「部」
は部分パターンの特徴についてのストロークの特
徴を持つているから即ちb4=(s41,s42,s43
s44,s45),b5=(s51,s52,s53),b1=(S11,s12

を持つているから、これらの特徴を持つ合成文字
「部」は、筆記者が「部」を書いた文字と同等の
特徴を有することとなり、筆記者は部分「部」を
書かなくてもそれと同等の文字がその構成要素の
「立」,「口」,「〓」の部分パターンを書くだけで
得られることができる。
以上説明した如く、本発明によれば、文字の特
徴の登録のために、文字を構成する部分パターン
の集合のみを記入すればそれらを組合せた文字種
は筆記者が書いた文字と同等の文字が得られるこ
とになり、認識対象文字総べてを書く必要性がな
くなるので筆記者の負担を大幅に軽減することが
できる。
【図面の簡単な説明】
第1図は文字を構成する部分パターン分解図、
第2図は部分パターンを構成するストローク分解
図、第3図は部分パターン{Bi}およびその特
徴集合{bi}を説明する説明図、第4図は本発
明の文字特徴登録処理方式の一実施例構成、第5
図は第4図の部分パターン入力部を説明する説明
図、第6図は第4図の特徴抽出部を説明する説明
図を各々示している。 図中、1は部分パターン入力部、2は特徴抽出
部、3は文字合成・コード辞書部、4は特徴合成
部、5は文字登録を表わしている。

Claims (1)

    【特許請求の範囲】
  1. 1 部分パターンの合成によつて表現される複数
    個の文字について筆記者の手書き特徴を保持した
    形で文字登録部に上記複数個の文字を登録する文
    字特徴登録処理方式において、上記部分パターン
    を手書き入力すると共に当該部分パターンを構成
    するストロークを抽出する部分パターン入力部、
    該部分パターン入力部に入力された部分パターン
    について当該部分パターンを構成する個々のスト
    ロークの特徴を抽出し当該ストロークの特徴系列
    によつて上記入力された部分パターンの特徴を抽
    出し当該部分パターンの特徴を保持する特徴抽出
    部、上記文字登録部に登録されるべき複数個の各
    文字について予め各文字対応に部分パターンの結
    合状態が文字合成コードとして登録されている文
    字合成・コード辞書部、および該文字合成・コー
    ド辞書部から読出された文字合成コードにもとづ
    いて上記特徴抽出部に保持されている部分パター
    ンの特徴を抽出しかつ上記文字合成コードに対応
    して上記部分パターンの特徴を特徴系列にまとめ
    る特徴合成部をそなえ、上記文字を構成する部分
    パターンを入力することによつて当該部分パター
    ンの特徴を保持した形で複数個の文字を上記文字
    登録部に登録するようにしたことを特徴とする文
    字特徴登録処理方式。
JP10549080A 1980-07-31 1980-07-31 Character characteristic registration processing system Granted JPS5730087A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10549080A JPS5730087A (en) 1980-07-31 1980-07-31 Character characteristic registration processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10549080A JPS5730087A (en) 1980-07-31 1980-07-31 Character characteristic registration processing system

Publications (2)

Publication Number Publication Date
JPS5730087A JPS5730087A (en) 1982-02-18
JPS6239794B2 true JPS6239794B2 (ja) 1987-08-25

Family

ID=14409030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10549080A Granted JPS5730087A (en) 1980-07-31 1980-07-31 Character characteristic registration processing system

Country Status (1)

Country Link
JP (1) JPS5730087A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6446097U (ja) * 1987-09-17 1989-03-22
JPH0210873U (ja) * 1988-07-04 1990-01-24

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS595390A (ja) * 1982-06-30 1984-01-12 Fujitsu Ltd 辞書生成方式
JPS60200383A (ja) * 1984-03-24 1985-10-09 Oki Electric Ind Co Ltd オンライン文字認識装置
JPS63155389A (ja) * 1986-12-19 1988-06-28 Toshiba Corp オンライン文字認識装置
JPH04337891A (ja) * 1991-05-15 1992-11-25 Sharp Corp オンライン文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6446097U (ja) * 1987-09-17 1989-03-22
JPH0210873U (ja) * 1988-07-04 1990-01-24

Also Published As

Publication number Publication date
JPS5730087A (en) 1982-02-18

Similar Documents

Publication Publication Date Title
Sethi et al. Machine recognition of constrained hand printed Devanagari
KR100292098B1 (ko) 문자 인식 장치 및 방법
JP3452774B2 (ja) 文字認識方法
Siromoney et al. Computer recognition of printed Tamil characters
Sagheer et al. A new large Urdu database for off-line handwriting recognition
JPH03161891A (ja) 表形式文書読取装置
CN114730241B (zh) 触摸式用户界面输入中的手势笔画识别
Mozaffari et al. IfN/Farsi-Database: a database of Farsi handwritten city names
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
JPS6239794B2 (ja)
JPH07182453A (ja) パターン認識方法及び装置及び辞書作成方法
Chandrasekaran et al. Computer recognition of Tamil, Malayalam and Devanagari characters
Nadeem et al. Character recognition using template matching
Halder et al. Individuality of isolated Bangla characters
Dzuba et al. Handwritten word recognition—the approach proved by practice
US20020126903A1 (en) Word recognizing apparatus for dynamically generating feature amount of word and method thereof
US6665437B1 (en) Method for recognizing multi-language printed documents using strokes and non-strokes of characters
Siromoney et al. Machine recognition of Brahmi script
JP2712260B2 (ja) 文字認識装置
Chatwiriya Off-line Thai handwriting recognition in legal amount
Dhurke et al. Intelligent Dictionary Elements Extraction using Optical Character Recognition and Deep Learning based Object Detection
JPS6095689A (ja) 光学的文字読取装置
CN116129446A (zh) 基于深度学习的手写中文字体识别方法
Tierney et al. Printed Cyrillic character recognition system
JP2886690B2 (ja) 光学的文字読取装置における文字認識方法