JPH0797396B2 - 連続文字認識装置 - Google Patents

連続文字認識装置

Info

Publication number
JPH0797396B2
JPH0797396B2 JP62142788A JP14278887A JPH0797396B2 JP H0797396 B2 JPH0797396 B2 JP H0797396B2 JP 62142788 A JP62142788 A JP 62142788A JP 14278887 A JP14278887 A JP 14278887A JP H0797396 B2 JPH0797396 B2 JP H0797396B2
Authority
JP
Japan
Prior art keywords
character
pattern
input
stroke
pen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62142788A
Other languages
English (en)
Other versions
JPS63307593A (ja
Inventor
洋 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62142788A priority Critical patent/JPH0797396B2/ja
Publication of JPS63307593A publication Critical patent/JPS63307593A/ja
Publication of JPH0797396B2 publication Critical patent/JPH0797396B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、入力された文字の筆跡に基づき1個以上連続
して書かれた文字を認識する手段に関する。
〔概要〕
本発明は、連続して筆記された文字列を孤立文字パター
ンと文字間ストロークパターンの合成パターンに基づき
認識する手段において、 文字列を複数の部分文字列に分割することにより、 認識に伴う演算量を低減することができるようにしたも
のである。
〔従来の技術〕
連続して書かれた文字列中から使用者が1文字の終わり
を指示することなしにその文字列を認識する従来例装置
には、例えば、「特願昭61-053397号」(以下、文献
(1)という。)記載の連続文字認識装置があった。以
下、この装置を例にとって従来の連続文字認識装置を説
明する。
この装置では切れ目なく書かれた文字をも含む連続して
書かれた文字を入力パターンとし、このパターンとあら
かじめ認識装置内に保持されている標準パターンとをパ
ターンマッチングして文字を認識する。このようなパタ
ーンマッチングで1文字ずつ独立して筆記された孤立文
字を認識する方法としては、例えば電子通信学会技術研
究報告PRL83-29(1983年8月27日)の1ページから8ペ
ージに「スタックDPマッチングによるオンライン手書き
文字認識」と題して発表された論文(以下、文献(2)
という。)に示されている方式がある。
この方式では、まず入力された文字は、文字を構成する
線分の方向角の時系列パターンA=(ai|1≦i≦I)に
変換される。ここで、aiは方向角、Iは線分数を表す。
この時系列パターンを入力パターンAとする。標準パタ
ーンは、入力パターンと同様の方向角の時系列パターン
としてあらかじめ認識装置内に保持されている。これ
は、標準パターンBk=(bj|1≦j≦Jk)と表される。こ
こで、k(1≦k≦K)は標準パターンカテゴリ、bjは
方向角、Jkはカテゴリkの標準パターンの線分数を表
す。入力パターンAのi番目のデータと標準パターンBk
のj番目のデータとの間の距離を方向角aiとbjの間のな
す角度で定義する。この距離をd(i,j)とする。入力
パターンAと標準パターンBkのパターン間距離Dkは、こ
の距離d(i,j)を時間軸方向に累積した値が最小とな
るように、入力パターンAと標準パターンBkを時間軸に
ついて整合させたときの距離d(i,j)の累積値とす
る。この時間軸についての整合は文献(2)に述べられ
ているDPマッチング法により以下のように行われる。
入力パターンAの各時刻iに対する漸化式 を1≦j≦Jkの間で解くことによって時刻iまでの最小
累積距離を求めることができる。ここで、g(i,j)は
カテゴリk、時刻i、jにおける漸化式値を表す。ただ
し、初期値としてg(0、0)=0、g(0、j)=∞
(1≦j≦Jk)とする。
(1)式の漸化式演算を入力パターンの時刻i(1≦i
≦I)まで行うことによってパターン間距離Dkが Dk=g(I,Jk) …(2) のように求まる。このようにして求められたパターン間
距離Dkが最小となるカテゴリkを認識結果とする。
以上の孤立文字の認識を連続文字の認識へ拡張するに
は、孤立文字を連結した連続文字の標準パターンを用
い、連続文字の入力パターンとパターンマッチングを行
えば良い。標準パターンとしては、一文字の書き始めか
ら書き終わりまでの筆跡を表す孤立文字パターンと、そ
の孤立文字パターンどうしの終点と始点を連結するよう
な文字間ストロークパターンを用いる。以下、これら文
字パターンの書き始めの点を始点、書き終わりの点を終
点という。これらの孤立文字パターンと文字間ストロー
クパターンを交互に連結させ、連続文字の標準パターン
を合成する。このような、複数の標準パターンをあらか
じめ定められた順序に連結して効率よく認識するには特
願昭55-83199号に記載されている有限状態オートマトン
を使用する。
このように、孤立文字パターンと文字間ストロークパタ
ーンとを交互に連結し合成した標準パターンをもとにパ
ターンマッチングを行うことによって、連続文字を認識
することができる。
〔発明が解決しようとする問題点〕
このような従来の連続文字認識装置では、(1)式に示
す漸化式演算を各標準パターンごとに入力パターンの時
刻iについて行っている。そこで、入力される文字数が
増えて入力パターンの線分数Iが増えると、漸化式の演
算量が増加することになる。さらに、連続文字では孤立
文字パターンと文字間ストロークパターンを組合わせて
文字列の標準パターンを合成しているので、組合わせの
数が増えることでさらに演算量が増加する。このよう
に、入力される文字数が増えると演算量も増加してしま
う。
また、入力される文字列の中でペンが筆記面を離れ移動
する部分(以下、ペンアップストロークという。)が文
字間に対応する可能性は高い。しかし、入力パターンと
合成した標準パターンをパターンマッチングする場合
に、必ずしもペンアップストロークと文字間ストローク
が対応するとは限らない。そこで、従来の連続文字認識
装置ではこの文字間情報に十分にいかされていない。
このように、従来の連続文字認識装置では入力文字数に
従って演算量が増加してしまい、またその認識に文字間
情報が十分にいかされていない欠点があった。
本発明はこの問題点を解決するもので、少い演算量で文
字分割精度の高い連続文字認識装置を提供することを目
的とする。
〔問題点を解決するための手段〕
本発明は、筆記された文字列の筆跡を時系列の入力パタ
ーンとして読み込む入力手段と、一文字の書き始めから
書き終わりまでの筆跡を表す孤立文字パターンを保持す
る孤立文字パターン記憶部と、一文字の書き終わりから
次の文字の書き始めまでの筆跡を表す文字間ストローク
パターンを保持する文字間ストロークパターン記憶部
と、1個以上の孤立文字パターンと0個以上の文字間ス
トロークパターンを交互に矛盾なく連結させたパターン
に基づきこの手段に与えられるパターンを認識する認識
手段とを備えた連続文字認識装置において、上記入力手
段からの入力パターンのペンアップストローク部分を検
出しこのペンアップストロークに基づいて文字ピッチを
求め、この文字ピッチ情報に基づきこの入力パターンを
複数の部分文字列に分割して上記認識手段に与える部分
文字列分割部を備えたことを特徴とする。
〔発明の原理〕
本発明では、入力された文字列を文字間の情報を用い
て、複数の部分文字列に分割し、その後従来と同様なパ
ターンマッチングで部分文字列ごとに認識を行う。この
文字間情報とは、一つの文字列中の文字と文字との間隔
(以下、文字ピッチという。)はほぼ等しく、また文字
と文字の間にはペンアップストロークが存在する可能性
が高いとすることである。
以下にこの入力文字列を部分文字列に分割する過程を説
明する。入力された文字列が次のようなxy座標の時系列
である入力パターンAに変換される。
A={(xi,yi,pi)|1≦i≦I} …(3) xiはx座標、yiはy座標、またpiはペンのアップ、ダウ
ンを時刻iにおいて表す。piはペンがアップからダウン
に変化したときにはpi=1、またダウンからアップに変
化したときにはpi=2、その他のときにはpi=0にな
る。まず、入力パターンAの中から文字間となる可能性
が高いペンアップストローク部分を探す。すなわち、時
刻i=mでpi=2、かつi=m+1でpi=1に変化した
ならば、この時刻mからm+1の間がペンアップストロ
ークになる。また、このときのペンアップストロークの
x方向の変化量を文字ピッチと仮定する。すなわち、u
番目のペンアップストロークに対する文字ピッチdx
(u)とその時の時刻s(u)は次のように表される。
dx(u)=Xm+1-Xm …(4) s(u)=m(1≦u≦U) …(5) 次に、これらU個の文字間候補の中で文字ピッチが正の
ものだけを探し、負のものは除く。すなわち、 dx(u)>0 …(6) が成り立つペンアップストロークのみを残し、文字間の
候補とする。また、(6)式を満たす文字ピッチdx
(u)と時刻s(u)を更新して、 dx(v)=dx(u) …(7) s(v)=s(u) (1≦u≦U,1≦v≦V,V≦U) …(8) とする。ここで、これらのV個の文字ピッチの平均値Pa
vを求めると、 となる。この文字ピッチの平均値Pavより小さな文字ピ
ッチdx(v)は再び候補から除く。すなわち、 dx(v)>Pav …(10) を満たすペンアップストロークのみを文字間の候補とす
る。また、(10)式を満たす文字ピッチdx(v)と時刻
s(v)を更新して、 dx(w)=dx(v) …(11) s(w)=s(v) (1≦v≦V,1≦w≦W,W≦V) …(12) とする。
ここで、入力パターンAをこの文字間の候補で分割す
る。すなわち、時刻s(w)で入力パターンAを区切る
と、 Aw={(xi,yi,pu)|s(w)≦i≦s(w+1)} …
(13) ただし、1≦w≦W、W+1=I のようにW個の部分文字列に分割される。この各部分文
字列に従来と同様なパターンマッチングを行うことによ
って入力文字列を認識することができる。
たとえば、n個の文字からなる文字列が入力され、標準
パターンのカテゴリ数がK個とすると、従来の方法では
合成する標準パターンの組合わせ数は Kn …(14) となる。しかし、これが等しくn/W文字ずつW個の部分
文字列に分割されたとすると、部分文字列ごとの組合わ
せ数は Kn/w …(15) となり、入力文字列全体では W・Kn/w …(16) となる。Kn≧2のとき(通常、K>2、n>1であるの
でこれは成り立つ。) Kn≧W・Kn/w …(17) が成り立ち、入力文字列を分割することで標準パターン
の組合わせ数が減少する。そこで、各標準パターンごと
に行う(1)式の漸化式演算の回数も減少し、パターン
マッチングのための演算量が減少する。
また、入力文字列中の全てのペンアップストロークは文
字間となる可能性を必ず試されており、文字間情報が使
用される。
以上、本発明の原理について説明した。以上の説明では
文字間ピッチのペンアップストロークのx方向の変化量
で定義したが、この他にもペンアップストロークで分離
された部分文字列間のx方向の間隔で定義するなどの方
法がある。
また、文字間候補を求めるために文字間ピッチの平均値
Pavを用いたが、平均値だけでなく分散などの統計量や
文字列のy方向の高さから求めた値を用いることもでき
る。
さらに、基本的な孤立文字の認識方式について、方向角
データを用いた場合について述べたが、この他にもたと
えば、日経エレクトロニクス誌昭和58年12月5日号115
ページから133ページに「くずし字など筆記制限を緩和
する方向に進むオンライン手書き漢字認識」と題されて
発表されている文献中に述べられている様々な方式が使
用できる。また、連続文字認識の方式についても、たと
えば電子通信学会技術研究報告PRL84-13の67ページから
76ページに「候補文字ラティス法によるオンライン手書
き文字列の認識」と題して発表された論文の方式など他
に様々なものが使用できる。
〔作用〕
入力手段で、文字列データは入力パターンに変換され、
この入力パターンは部分文字列分割部で文字ピッチ情報
を用いて複数の部分文字列に分割され認識手段に送られ
る。認識手段では、孤立文字パターン記憶部と文字間ス
トロークパターン記憶部に保持されているパターンを合
成し、部分文字列とパターンマッチングを行って入力パ
ターンを認識する。これにより演算量をいちじるしく低
減できる。
〔実施例〕
以下、本発明の一実施例を図面に基づき説明する。第1
図は、この実施例の構成を示すブロック構成図である。
第2図は、第1図に示す部分文字列分割部の構成を示す
ブロック構成図である。
この実施例は、筆記された文字列の筆跡を時系列の入力
パターンとして読み込む入力手段であるタブレット100
および前処理部200と、一文字の書き始めから書き終わ
りまでの筆跡を表す孤立文字パターンを保持する孤立文
字パターン記憶部600と、一文字の書き終わりから次の
文字の書き始めまでの筆跡を表す文字間ストロークパタ
ーンを保持する文字間ストロークパターン記憶部700
と、1個以上の孤立文字パターンと0個以上の文字間ス
トロークのパターンを交互に矛盾なく連結させたパター
ンに基づきこの手段に与えられるパターンを認識する認
識手段であるデータ変換部400および認識部500と、入力
手段からの入力パターンの文字ピッチ情報に基づきこの
入力パターンを複数の部分文字列に分割して上記認識手
段に与える部分文字列分割部300とを備え、この部分文
字列分割部300が本発明の特徴とするところである。
第1図で、タブレット100から入力された文字列データ
は前処理部200で(3)式に示されるx座標、y座標お
よびペンデータの時系列である入力パターンAに変換さ
れ、部分文字列分割部300に送られる。部分文字列分割
部300は文字ピッチ情報を用いて入力パターンAを複数
の部分文字列Awに分割し、順次データ変換部400に転送
する。データ変換部400ではx座標、y座標およびペン
データの時系列で構成される部分文字列を文献(2)に
示される方向角の時系列データに変換し、認識部500に
送る。認識部500は文献(1)に示されているように孤
立文字パターン記憶部600と文字間ストロークパターン
記憶部700に保持されている標準パターンを合成し、部
分文字列とパターンマッチングを行うことによって入力
パターンを認識し、結果Rを出力する。この結果Rは部
分文字列Awの認識結果を合わせたものになる。
第2図を用いて部分文字列分割部300の動作を詳細に説
明する。前処理部200から送られてくる入力パターンA
はいったんデータバッファ301に格納される。ここで、
制御部311から時刻信号iがデータバッファ301およびペ
ンアップ検出部302に送られる。データバッファ301はこ
の時刻信号iに同期して入力パターンA=(xi,yi,pi)
を順次ペンアップ検出部302に送る。ペンアップ検出部3
02は入力パターンAの中でpi=2かつpi+1=1となる
ペンアップストロークを検出し、その時刻信号i=mを
スイッチ304に送り、またそのx座標xm、xm+1を減算器3
03に送る。減算器303では減算d=xm+1-xmを計算し、d
≧0が成り立つときに減算結果dをDメモリ305に送
る。同時に、減算器303はd≧0が成り立つときに切替
信号swをスイッチ304に送り、線路を導通させる。そこ
で、ペンアップ検出部302から送られてくる時刻信号m
がスイッチ304を通してVメモリ306に送られ、ここに保
持される。
Dメモリ305とVメモリ306はどちらも一次元配列のメモ
リであり、入力パターンAがペンアップとなる時刻mと
そのときの文字ピッチdとが互いに対応付けられて記憶
される。時刻信号iが1からIまで変化すると、
(7)、(8)式におけるdx(v)がDメモリに、s
(v)がVメモリに格納される。
時刻信号iが1からIまで変化し終わると、制御部311
は信号t1をDメモリ305と平均化部307に送る。この信号
t1に対応してDメモリ305からは文字ピッチdが順次読
み出され、平均化部307に送られる。平均化部307は
(9)式のような演算を行い、文字ピッチdの平均値Pa
vをPavメモリ309に送り、ここに記憶される。
平均値Pavが決定されると、制御部311は信号t2をDメモ
リ305、Vメモリ306および比較部308に送る。この信号t
2に対応し、Dメモリ305からは文字ピッチdが、またV
メモリ306からは時刻mが順次読み出され、比較部308に
送られる。比較部308はPavメモリ309に記憶されているP
avの値とDメモリ305から読み出される文字ピッチdの
値を比較し、d>Pavすなわち(10)式が成り立つとき
にその時刻mをWメモリ310に送る。
Wメモリ310はDメモリ305やVメモリ306と同様な一次
元配列のメモリであり、文字間の候補となる時刻すなわ
ち(12)式のs(w)が記憶される。Wメモリ310に文
字間の候補がすべてそろうと、制御部311は信号t3をW
メモリ310に送る。データバッファ301はこの時刻で入力
パターンAを区切って(13)式のような部分文字配列Aw
としてデータ変換部400に送る。
以上説明したように、部分文字列分割部300に入力され
た入力パターンAが部分文字列Awに分割される。この部
分文字列Awがデータ変換部400を通して認識部500に入力
され、認識結果Rが出力される。この認識部500の構成
は文献(1)の中に示されている。
〔発明の効果〕
本発明は以上説明したように、使用者による文字を分割
するための特別な操作を必要とせずに、かつ演算量を低
減し文字分割精度を向上するので、高速で認識精度の高
い連続文字認識装置が得られる効果がある。
【図面の簡単な説明】
第1図は本発明の連続文字認識装置の一実施例の構成を
示す構成図。 第2図は第1図の部分文字列分割部の構成を示す詳細構
成図。 100……タブレット、200……前処理部、300……部分文
字列分割部、301……データバッファ、302……ペンアッ
プ検出部、303……減算器、304……スイッチ、305……
Dメモリ、306……Vメモリ、307……平均化部、308…
…比較部、309……Pavメモリ、310……Wメモリ、311…
…制御部、400……データ変換部、500……認識部、600
……孤立文字パターン記憶部、700……文字間ストロー
クパターン記憶部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】筆記された文字列の筆跡を時系列の入力パ
    ターンとして読み込む入力手段(100、200)と、 一文字の書き始めから書き終わりまでの筆跡を表す孤立
    文字パターンを保持する孤立文字パターン記憶部(60
    0)と、 一文字の書き終わりから次の文字の書き始めまでの筆跡
    を表す文字間ストロークパターンを保持する文字間スト
    ロークパターン記憶部(700)と、 1個以上の孤立文字パターンと0個以上の文字間ストロ
    ークパターンを交互に矛盾なく連結させたパターンに基
    づきこの手段に与えられるパターンを認識する認識手段
    (500)と を備えた連続文字認識装置において、 上記入力手段からの入力パターンのペンアップストロー
    ク部分を検出しこのペンアップストロークに基づいて文
    字ピッチを求め、この文字ピッチ情報に基づきこの入力
    パターンを複数の部分文字列に分割して上記認識手段に
    与える部分文字列分割部(300) を備えたことを特徴とする連続文字認識装置。
JP62142788A 1987-06-08 1987-06-08 連続文字認識装置 Expired - Lifetime JPH0797396B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62142788A JPH0797396B2 (ja) 1987-06-08 1987-06-08 連続文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62142788A JPH0797396B2 (ja) 1987-06-08 1987-06-08 連続文字認識装置

Publications (2)

Publication Number Publication Date
JPS63307593A JPS63307593A (ja) 1988-12-15
JPH0797396B2 true JPH0797396B2 (ja) 1995-10-18

Family

ID=15323620

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62142788A Expired - Lifetime JPH0797396B2 (ja) 1987-06-08 1987-06-08 連続文字認識装置

Country Status (1)

Country Link
JP (1) JPH0797396B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58214969A (ja) * 1982-06-09 1983-12-14 Nec Corp 文字読取装置
JPS5991582A (ja) * 1982-11-16 1984-05-26 Nec Corp 文字読取装置
JPS59119485A (ja) * 1982-12-27 1984-07-10 Fujitsu Ltd 文字切出し方式
JPS6232588A (ja) * 1985-08-06 1987-02-12 Nec Corp オンライン連続文字認識装置

Also Published As

Publication number Publication date
JPS63307593A (ja) 1988-12-15

Similar Documents

Publication Publication Date Title
JP3176023B2 (ja) 手書き入力照合方法および装置
EP1564675B1 (en) Apparatus and method for searching for digital ink query
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
US6144764A (en) Method and apparatus for on-line handwritten input character recognition and recording medium for executing the method
US4573196A (en) Confusion grouping of strokes in pattern recognition method and system
JPH0139154B2 (ja)
JPH06176199A (ja) パターン認識方法及び装置
JP3761937B2 (ja) パターン認識方法及び装置及びコンピュータ制御装置
Khan Online Urdu handwritten character recognition: Initial half form single stroke characters
Singh et al. A bilingual (Gurmukhi-Roman) online handwriting identification and recognition system
JPH0797396B2 (ja) 連続文字認識装置
JPH09319828A (ja) オンライン文字認識装置
JP2000105798A (ja) 手書き文字認識装置及び記録媒体
KR0126800B1 (ko) 한글필기체 온라인 문자인식 장치 및 방법
JP2633523B2 (ja) 手書き画入力装置
Yin et al. Lexicon-driven recognition of one-stroke character strings in visual gesture
CN112183538B (zh) 一种满文识别方法及系统
KR940001048B1 (ko) 온라인 필기체문자인식방법
JP3066530B2 (ja) オンライン手書文字認識装置
JP3198218B2 (ja) オンライン手書き文字認識方法
JP3221488B2 (ja) 検証機能付きオンライン文字認識装置
JPH0210473B2 (ja)
JPS6129982A (ja) オンライン手書き文字列認識方式
JPH0922443A (ja) オンライン手書き文字認識方法
JP3015137B2 (ja) 手書文字認識装置