JP2962984B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2962984B2
JP2962984B2 JP5311249A JP31124993A JP2962984B2 JP 2962984 B2 JP2962984 B2 JP 2962984B2 JP 5311249 A JP5311249 A JP 5311249A JP 31124993 A JP31124993 A JP 31124993A JP 2962984 B2 JP2962984 B2 JP 2962984B2
Authority
JP
Japan
Prior art keywords
character
character string
stroke
unit
basic segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5311249A
Other languages
English (en)
Other versions
JPH07141466A (ja
Inventor
健治 岡野
浩司 松本
英理 一井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5311249A priority Critical patent/JP2962984B2/ja
Publication of JPH07141466A publication Critical patent/JPH07141466A/ja
Application granted granted Critical
Publication of JP2962984B2 publication Critical patent/JP2962984B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、手書き文字等から文字
認識を行う文字認識装置に関し、特に、文字列から各文
字切出しのための文字列ブロックに分割する構成に関す
る。
【0002】
【従来の技術】筆記された文字を認識する文字認識技術
として、オンライン文字認識技術がある。このオンライ
ン文字認識技術とは、筆記された文字の軌跡をタブレッ
ト等により一定時間毎にx,y方向の座標として抽出
し、この座標列データを用いて、ほぼ実時間で文字を認
識する技術である。即ち、このようなオンライン文字認
識技術は、筆記入力の始点(ペンオン)から終点(ペン
オフ)までを1ストロークとし、この1ストローク毎の
座標列データから文字認識を行うものである。
【0003】このようなオンライン文字認識技術におい
て、従来の文字認識装置では、筆記された文字を1文字
に切出す場合、筆記時に文字枠を予め設けておき、この
文字枠内に、1文字を記入し、この枠内の情報を基に切
出しを行う方法が行われていた。
【0004】ところが、このような文字枠を設ける方法
は、筆記者にとって入力時の負担が大きく、その結果、
筆記文字の入力効率を下げることにもつながる。そこ
で、例えば、特開昭61−123988号公報や特開昭
61−29982号公報等に示されているように、文字
枠を設けることなく文字認識を行う方法が考えられてい
る。
【0005】ここで、特開昭61−123988号公報
に記載されている方法(これを方法1とする)は、一つ
の文字幅の上限値を定め、この文字幅によって、1文字
ずつの切出しを行おうとするものであり、また、特開昭
61−29982号公報に記載されている方法(これを
方法2とする)は、先ず、筆記された文字から分割した
各ストロークの組を基本セグメントとし、この基本セグ
メントを組み合わせて候補文字とし、次に、この候補文
字を標準文字と比較し、それらの相違度が最小となる文
字を筆記された文字とする文字認識技術である。
【0006】
【発明が解決しようとする課題】しかしながら、上記方
法1では、文字幅情報のみで切出しを行っているため、
筆記された文字の文字幅が所定の範囲から外れてしまっ
た場合では、誤った切出しを行ってしまうという問題点
があった。また、方法2においても、文字幅に加えて文
字認識を用いて切出し性能の向上を図ってはいるが、候
補文字の作成を機械的に行っているために、余分な組合
せを作成してしまい、筆記条件によっては誤った切出し
を行ってしまうという問題点があった。更に、余分な組
合せが多ければ多いほど処理量が増大してしまうという
問題点もあった。
【0007】本発明は、上記従来の問題点を解決するた
めになされたもので、切出しミスが少なく、かつ、処理
量の増大を抑制することのできる文字認識装置を提供す
ることを目的とする。
【0008】
【課題を解決するための手段】本発明の文字認識装置
は、筆記文字の始点から終点までの1ストロークの座標
データを入力するための座標入力部と、前記座標入力部
で入力された座標データに基づき、筆記された文字列
を、複数の基本セグメントに分割する基本セグメント分
割部と、前記基本セグメントに含まれる各ストローク
を、各々の特徴に基づき分類したストロークコードに変
換するストロークコード化部と、前記基本セグメントに
含まれるストローク数と、各ストロークコードとに基づ
き、前記文字列を文字列ブロックに分割する文字列分割
部と、前記文字列分割部で分割された文字列ブロック毎
に文字切出しを行う文字切出し部を備えたことを特徴と
するものである。
【0009】
【作用】本発明の文字認識装置において、各構成部分は
以下の通り動作を行う。先ず、基本セグメント分割部
は、座標入力部により入力された筆記文字列を構成する
各ストロークを、例えばX軸上に投影し、重なりあった
ストローク群を一つの基本セグメントとし、ストローク
コード化部に出力する。ストロークコード化部は、基本
セグメントに含まれる各ストロークのコード化を行う。
このコード化を行う方法としては、1ストローク分の入
力データ列の特徴点に基づき、ストロークを分類し、コ
ード化する。このコード化されたストロークデータ列は
文字列分割部に出力される。
【0010】文字列分割部は、基本セグメントが文字列
ブロック分割の条件を満たすかをチェックする。この分
割条件とは、例えば、「この基本セグメントの直前で必
ず分離する(文字列分割条件1)」「この基本セグメン
トの直後で必ず分離する(文字列分割条件2)」「この
基本セグメントは1文字である(文字列分割条件3)」
という三つの可能性を調べるための条件で、ストローク
数とストロークコードより記述されている。
【0011】もし、基本セグメントが文字列分割条件1
を満たした場合、直前までに入力された基本セグメント
を文字切出し部に出力する。また、文字列分割条件2を
満たした場合には現在の基本セグメントまでを出力す
る。文字列分割条件3を満たした場合は、先ず直前まで
に入力された基本セグメントを文字切出し部に出力し、
次に現在の基本セグメントのみを出力する。文字切出し
部は、文字列分割部より入力された文字列ブロックに基
づいて文字切出しを行う。文字切出しの方法としては、
例えば基本セグメント毎に相違度を計算し、相違度の組
合せが最小になるものを切出し結果とする。
【0012】従って、筆記された文字列は、文字列分割
部によって分離すべき箇所は必ず分割されているので、
文字切出し部において誤って結合することがない。ま
た、余分な結合処理を行わないため、処理量が軽減され
る。また、文字列分割部は、ストローク数とストローク
コードのみで処理を行うため、処理が容易でかつ高速に
実行される。
【0013】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。図1は本発明の文字認識装置の実施例を示す
ブロック図である。図の装置は、座標入力部1、基本セ
グメント分割部2、ストロークコード化部3、文字列分
割辞書4、文字列分割部5、文字切出し部6、出力端子
7からなる。
【0014】座標入力部1は、タブレット、マウス、ラ
イトペン、タッチパネル等からなり、筆記者が文字を入
力し、この入力された文字からデータ列を抽出して基本
セグメント分割部2に出力するものである。基本セグメ
ント分割部2は、座標入力部1で入力された座標データ
列の情報から、各ストロークデータの、例えばX軸方向
への重なりを検出し、この重なりあったストロークを一
つの基本セグメントととして検出する機能を備えてい
る。ストロークコード化部3は、基本セグメント分割部
2で分割された基本セグメントに含まれる各ストローク
を、各々の特徴に基づき分類した識別のためのコードに
変換するものである。
【0015】文字列分割辞書4は、基本セグメントに含
まれるストローク数と、各ストロークのコードとに対応
した文字列分割条件を格納する辞書である。図2に文字
列分割辞書4の構成を示す。図示のように、この辞書に
は、文字列分割条件1(注目している基本セグメントの
直前で行を分割するための条件)、文字列分割条件2
(注目している基本セグメントの直後で行を分割するた
めの条件)、文字列分割条件3(注目している基本セグ
メントが1文字であるための条件)が格納されている。
そして、各々の条件は、ストローク数とストロークコー
ドによって記述されている。
【0016】文字列分割部5は、ストロークコード化部
3でコード化された各セグメントのストロークを、文字
列分割辞書4に基づき、文字列ブロックに分割するため
の機能を備えている。文字切出し部6は、文字列分割部
5で分割された文字列ブロック毎に文字切出しを行い、
出力端子7に出力するものである。
【0017】次に、上記構成の文字認識装置の動作につ
いて説明する。尚、以下の動作は文字列が横書きの場合
である。図3、4は、上記装置の動作フローチャートで
ある。尚、図示フローチャートにおいて、基本セグメン
ト分割部2は、ステップS101を実行し、以下、スト
ロークコード化部3はステップS102を、文字列分割
部5はステップS103〜113を、文字切出し部6は
ステップS201〜204を実行する。
【0018】先ず、座標入力部1で文字が入力される
と、そのデータ列{(xi ,yi ):i=1,2,…,
jj {但し、jは画数(1〜j)を示す}が抽出さ
れ、基本セグメント分割部2に送られる。基本セグメン
ト分割部2は、座標入力部1から得られたストローク列
をX座標に投影し、重なりが連続しているものを一つの
基本セグメントとする(ステップS101)。
【0019】図5は、基本セグメント分割の一例を示す
図である。このような分割を行う場合は、先ず、ストロ
ーク毎にX方向の最大値、最小値を求める。各々の値を
Xmaxi 、Ymini {iはストロークの番号:i=
1〜Smax(Smaxは手書き文字列に含まれるスト
ローク数)}とする。
【0020】最初に各々のストロークを一つのセグメン
トと仮定する。例えば、k番目のセグメントの処理を行
う場合、そのセグメントのX方向の最小値(Xmin
K )が、それ以前のセグメント(それまでの処理結果が
反映される)のX方向の最大値(Xmaxi :i<k)
を下回らないか(XminK ≦Xmaxi )をチェック
する。ここで、iは1から順に変化させ、最初に条件を
満たしたものを採用する。もし、条件を満たした場合に
は、第iセグメントから第kセグメントまでを一つのセ
グメントとする。以上の操作を、kを1からSmaxま
で変化させて順次処理することにより、基本セグメント
の分割を行うことができる。
【0021】分割して生成された基本セグメントは、ス
トロークコード化部3に出力される。ここで、生成され
た基本セグメントの数をSEGn、各基本セグメントに
含まれるストロークの数をSTRni (i=1〜SEG
n)とする。また、この基本セグメント分割部2の分割
動作において、マイナス方向に移動して生成された空白
は空白とは見なさない。図6は、このような例を示した
ものである。即ち、「小」のように、筆順がマイナス方
向(左方向)移動する部分がある文字では、その部分の
空白は空白とはみなさないものである。
【0022】次に、ストロークコード化部3の動作につ
いて説明する。ストロークコード化部3は、ストローク
毎の特徴点情報(特徴点は、例えば入力データ列のデー
タ間のX,Y方向のサインを求め、このサインの状態の
変化点を特徴点とする等の方法により抽出することがで
きる)に基づき、各ストロークをその形状により、予め
用意された数種類のコードに割り当てる(ステップS1
02)。このコード化の方法としては、例えば各セグメ
ントのX,Yサイン、セグメントの角度、セグメント間
の回転角度により分類し、コード化を行う。尚、ここ
で、サインとは各データ間の差分の符号(+、−)であ
り、また、セグメントとは、ストロークの曲線を複数の
直線で近似した場合の各々の直線を指している。
【0023】この処理により、各基本セグメント毎に、
ストロークコード{S-1,S-2,…,S-STRnii (i
=1〜SEGn)が得られる(ここで、S-iとは、i番
目のストロークに割り当てられたストロークコードであ
る)。そしてコード化されたストロークデータは文字列
分割部5に出力される。
【0024】文字列分割部5は、各基本セグメントに含
まれるストロークコードと基本セグメントに含まれるス
トロークの数の両方が文字列分割辞書4に記述された条
件を満たすかを判定する。先ず、文字列分割条件1(基
本セグメントの直前で分割する条件)を満たすかを調べ
る(ステップS103)。実際に一致するものを検索す
る場合、処理の増加を抑えるため、先ずストローク数の
一致するものを探し出す。一致するものが存在した場
合、次に辞書に筆記されたストロークコードSdic と一
致するストロークコードが基本セグメントに含まれるか
を調べる(Si =Sdic :i=1〜STRnj ;jは注
目している基本セグメント)。
【0025】以上の操作で条件が一致した場合には、直
前の基本セグメントまでを文字切出し部6に出力する
(ステップS104)。もし、一致する条件が存在しな
かった場合には、次に文字列分割条件2(基本セグメン
トの直後で分割する条件)を満たすかを調べる(ステッ
プS105)。尚、調べる方法は文字列分割条件1と同
様である。
【0026】ここで、文字列分割条件2を満たした場
合、現在注目している基本セグメントまでを文字切出し
部6に出力する(ステップS106)。一方、文字列分
割条件2を満たさない場合、次に文字列分割条件3を満
たすかを調べる(ステップS107)。また、ここでも
調べる方法は文字列分割条件1の方法と同様である。も
し、文字列分割条件3を満たした場合、先ず直前の基本
セグメントまでを文字切出し部6に出力し(ステップS
108)、これによって、文字切出し部6が、分割され
た文字列ブロックの文字切出しを行う(ステップS20
2)。次に、文字列分割部5は、注目している現在の基
本セグメントのみを出力し(ステップS109)、文字
切出し部6は、この基本セグメントの文字切出しを行う
(ステップS203)。図7に、文字列分割の一例を示
す。
【0027】次に、文字切出し部6の動作について説明
する。文字切出し部6は、文字列分割部5より送られき
た各文字列ブロック毎に、文字切出しを行う(ステップ
S201、S202、S203)。この文字切出しとし
ては、既知の方法を用いることができる。例えば、従来
の技術で述べた方法2を適用することが考えられる。先
ず、基本セグメント毎に文字辞書との相違度を計算し、
各々を組み合わせた場合の相違度の合計が最小となるよ
うな組合せを探し出し、最小となったものを各々文字候
補とする。あるいは、方法1に示されているような文字
幅のみを用いる方法や、ペンアップ時間を検出して切出
しを行う等、様々な文字切出し方法を用いることができ
る。
【0028】尚、図3、4のフローチャートにおいて、
ステップS201で文字切出しを行った後、およびステ
ップS107で文字列分割条件3を満たさなかった場合
(即ち、文字列分割条件1〜3を全て満たさなかった場
合)は、その基本セグメントが最後か否かを判定し(ス
テップS110)、最後であった場合は、残りの基本セ
グメントを出力し(ステップS111)、これを文字切
出し部6が文字切出しを行い(ステップS204)、文
字認識処理を終了する。一方、ステップS110で最後
の基本セグメントでない場合は、文字列の分割処理を次
の基本セグメントとして(ステップS113)、ステッ
プS103に戻る。
【0029】また、ステップS203の文字切出しが終
了すると、それが最後の基本セグメントか否かを判定し
(ステップS112)、最後でない場合は、次の基本セ
グメントとして(ステップS113)、ステップS10
3に戻り、最後であった場合は文字認識処理を終了す
る。
【0030】尚、上記実施例では、文字列が横書きの場
合を説明したが、これに限定されるものではなく、縦書
き等の場合も同様に適用可能である。例えば、縦書きの
場合では、基本セグメントの分割をY軸方向への投影に
よる重なりに基づいて行い、文字列分割辞書4も、この
ような分割に対応したストローク数およびストロークコ
ードとすることで、容易に適用することができる。
【0031】
【発明の効果】以上説明したように、本発明の文字認識
装置によれば、入力された文字列を複数の基本セグメン
トに分割し、この基本セグメントに含まれるストローク
の数と、各ストロークの特徴とに基づき文字列を文字列
ブロックに分割し、これら文字列ブロック毎に文字切出
しを行うようにしたので、以下のような効果がある。 文字列分割部によって、文字列の分離すべき箇所のう
ち分割条件を満たしたものは必ず分割されるため、文字
切出し部で誤って結合される箇所が減少し、従って切出
し性能が向上する。 文字切出し部で余分な結合処理を行わなくて良いの
で、処理量を軽減することができる。 文字列分割部は、ストローク数とストロークコードの
二つのみで処理を行うため、処理が容易で、かつ高速に
実行することができる。
【図面の簡単な説明】
【図1】本発明の文字認識装置の構成を示すブロック図
である。
【図2】本発明の文字認識装置における文字列分割辞書
の内容を示す説明図である。
【図3】本発明の文字認識装置の動作フローチャート
(その1)である。
【図4】本発明の文字認識装置の動作フローチャート
(その2)である。
【図5】本発明の文字認識装置における基本セグメント
分割の説明図である。
【図6】本発明の文字認識装置における筆順を考慮した
セグメント分割の説明図である。
【図7】本発明の文字認識装置における文字列ブロック
分割の一例を示す図である。
【符号の説明】
1 座標入力部 2 基本セグメント分割部 3 ストロークコード化部 4 文字列分割辞書 5 文字列分割部 6 文字切出し部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/00 - 9/82

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 筆記文字の始点から終点までの1ストロ
    ークの座標データを入力するための座標入力部と、 前記座標入力部で入力された座標データに基づき、筆記
    された文字列を、複数の基本セグメントに分割する基本
    セグメント分割部と、 前記基本セグメントに含まれる各ストロークを、各々の
    特徴に基づき分類したストロークコードに変換するスト
    ロークコード化部と、 前記基本セグメントに含まれるストローク数と、各スト
    ロークコードとに基づき、前記文字列を文字列ブロック
    に分割する文字列分割部と、 前記文字列分割部で分割された文字列ブロック毎に文字
    切出しを行う文字切出し部を備えたことを特徴とする文
    字認識装置。
JP5311249A 1993-11-17 1993-11-17 文字認識装置 Expired - Fee Related JP2962984B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5311249A JP2962984B2 (ja) 1993-11-17 1993-11-17 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5311249A JP2962984B2 (ja) 1993-11-17 1993-11-17 文字認識装置

Publications (2)

Publication Number Publication Date
JPH07141466A JPH07141466A (ja) 1995-06-02
JP2962984B2 true JP2962984B2 (ja) 1999-10-12

Family

ID=18014888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5311249A Expired - Fee Related JP2962984B2 (ja) 1993-11-17 1993-11-17 文字認識装置

Country Status (1)

Country Link
JP (1) JP2962984B2 (ja)

Also Published As

Publication number Publication date
JPH07141466A (ja) 1995-06-02

Similar Documents

Publication Publication Date Title
Cheung et al. An Arabic optical character recognition system using recognition-based segmentation
US7756335B2 (en) Handwriting recognition using a graph of segmentation candidates and dictionary search
JP4350109B2 (ja) 走査された及びリアルタイムの手書き文字の識別を行う文字認識システム
US5515455A (en) System for recognizing handwritten words of cursive script
WO1995008158A1 (en) Universal symbolic handwriting recognition system
JPH02266485A (ja) 情報認識装置
CN111340020A (zh) 一种公式识别方法、装置、设备及存储介质
US5659633A (en) Character recognition method utilizing compass directions and torsion points as features
Kerrick et al. Microprocessor-based recognition of handprinted characters from a tablet input
JP3216800B2 (ja) 手書き文字認識方法
JP2962984B2 (ja) 文字認識装置
JP2002063548A (ja) 手書き文字認識方法
KR100301216B1 (ko) 온라인문자인식장치
JPH06295356A (ja) オンライン文字認識装置
Airphaiboon et al. Recognition of handprinted Thai characters using loop structures
JP3897999B2 (ja) 手書き文字認識方法
JP2671984B2 (ja) 情報認識装置
JP3066530B2 (ja) オンライン手書文字認識装置
KR960013818B1 (ko) 다중획인식을 이용한 한글조합인식장치
JP2851865B2 (ja) 文字認識装置
CN113902704A (zh) 一种基于八邻域方向编码的汉字骨架拐点检测方法及系统
JP3015137B2 (ja) 手書文字認識装置
JP2930996B2 (ja) 画像認識方法および画像認識装置
JPH0950490A (ja) 手書き文字認識装置
JP3290097B2 (ja) ストロークの判定方法および判定装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees