JPH06203208A - オンライン文字認識機能を持つ情報処理装置 - Google Patents

オンライン文字認識機能を持つ情報処理装置

Info

Publication number
JPH06203208A
JPH06203208A JP5000727A JP72793A JPH06203208A JP H06203208 A JPH06203208 A JP H06203208A JP 5000727 A JP5000727 A JP 5000727A JP 72793 A JP72793 A JP 72793A JP H06203208 A JPH06203208 A JP H06203208A
Authority
JP
Japan
Prior art keywords
character
stroke
function
coordinate
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5000727A
Other languages
English (en)
Inventor
Koji Yura
浩司 由良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5000727A priority Critical patent/JPH06203208A/ja
Publication of JPH06203208A publication Critical patent/JPH06203208A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】文字間が接近、重複した文字列から文字を分離
するための文字の区切り位置の候補の抽出が、少ない候
補数で、しかも本来は文字の区切りとなる箇所が候補外
とされることを招くことなく実現できるようにすること
である。 【構成】タブレット面に筆記された文字列の筆跡情報か
らストローク毎に行方向の最小値と最大値を求め、予め
定義された、ストローク行方向の最小値と最大値により
定まるxの関数であるストローク重み定義関数をもと
に、ストローク毎に求められた最小値および最大値から
評価関数生成部4にて各ストローク毎のストローク重み
関数を求め、この各ストロークについてのストローク重
み関数を全て加算して文字区切り評価関数を求め、この
文字区切り評価関数が極値をとる行方向の全ての座標値
を文字区切り候補検出部5にて抽出して文字列中の文字
区切り候補とするものである。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、オンライン手書き認
識機能を持つ情報処理装置に関する。
【0002】
【従来の技術】オンライン手書き文字認識はタブレット
(座標入力装置)上に筆記された文字を認識する技術で
ある。このタブレットに筆記された文字は筆跡の点列
(時系列の位置座標)として得られる。オンライン文字
認識は、この点列を解析し、状態遷移や辞書として蓄え
られた基準と照合することで文字の認識を行うものであ
る。
【0003】さて、文字を筆記する場合、1文字だけを
筆記することは希であり、通常は文章などの文字列を筆
記する。一方、文字認識では、認識すべき文字種の多さ
と、認識に要する計算量の関係とにより、文字列を予め
文字毎に分離して、各文字毎に文字認識を行い、文字認
識の結果から文字列の認識結果を得る方式が一般的であ
る。
【0004】そこで従来は、文字列を文字毎に分離する
ために、文字枠(文字の記入枠)などを設け、その文字
枠に1文字ずつ筆記してもらうなどの方法が採られてい
た。しかし、この方法は、筆記する人に文字枠を意識さ
せるので負担がかかり、能率も悪く、問題であった。こ
のため近年は、通常紙に書く場合と同様に下線を与えて
書かれた文字列を認識する方式が求められている。
【0005】さて文字列を認識する方式として、「候補
文字ラティス法による枠無し筆記文字列のオンライン認
識」(村瀬他、電子通信学会論文誌 85/4 Vol.J68-D N
o.4pp.765-772)が提案されている。この方式は、文字
列から1通りでなく複数の可能性で文字画像を切り出
し、認識結果から最も適当な文字列を選択して文字列の
認識とするものである。
【0006】上記の方式では、文字画像の区切り位置
(文字を分離する境界位置)の候補を、ストローク(筆
記の1画)の重複の大きさ(小ささ)を基準として選択
するようにしている。このため、文字間に空きがある場
合には隣接する文字のストロークは相互に重複していな
いので、候補を抽出することは容易である。
【0007】しかし、隣接する文字同士が接近している
文字列では、隣接する文字のストローク相互の重複が大
きく、全ての文字の区切りを抽出することは困難であ
る。このため上記の方式では、ある程度の大きさの重複
がある部分も文字の区切り候補として抽出しなければな
らない。しかし、このようにすると、本来は文字の区切
りでない多くの箇所が文字区切り候補に含まれてしまう
ため、文字の区切り候補が不要に多くなる。こうなる
と、即ち文字の区切り候補が多くなると、文字認識を行
う領域が多くなり、認識の処理量、性能の面で不利な条
件となる。
【0008】
【発明が解決しようとする課題】上述したように従来の
オンライン文字認識方式では、隣接する文字が接近した
文字列(特に隣接文字が重複した文字列)から文字を分
離するための文字区切り位置の候補を抽出することは困
難であり、候補が多くなって認識の性能低下や処理量の
増大を招くという問題があった。
【0009】この発明は上記事情に鑑みてなされたもの
でその目的は、従来のオンライン文字認識で問題とされ
ていた、文字間が接近、重複した文字列から文字を分離
するための文字の区切り位置の候補の抽出が、少ない候
補数で、しかも本来は文字の区切りとなる箇所が候補外
とされることを招くことなく実現できるオンライン文字
認識機能を持つ情報処理装置を提供することにある。
【0010】
【課題を解決するための手段】この発明は、タブレット
等の座標入力装置に筆記された文字を時系列の位置座
標、即ち点列として入力し認識を行うオンライン文字認
識機能を持つ情報処理装置において、上記点列で示され
る文字の各ストロークS(i) 毎に、文字列の並ぶ方向
(行方向)の座標値xの最小値a(i) および最大値b
(i) を求めるストローク範囲検出手段と、予め定義され
た、ストロークの行方向の最小値aと最大値bにより定
まるxの関数であるストローク重み定義関数f
a,b (x)をもとに、各ストロークS(i) 毎のストロー
ク重み関数g(i) (x)を求め、更にこのストローク重
み関数g(i) (x)を全てのストロークについて加算し
て文字区切り評価関数F(x)を求める評価関数生成手
段と、上記文字区切り評価関数F(x)の極値を与える
x座標値を検出して文字区切り候補とする文字区切り候
補検出手段と、上記文字区切り候補をもとに文字画像の
領域(1文字領域)を抽出する文字領域候補抽出手段
と、抽出された各1文字領域を文字認識する文字認識手
段とを備え、上記文字認識手段にて得られる各1文字領
域の文字認識結果を評価して文字列の認識結果を得るよ
うにしたことを特徴とするものである。
【0011】
【作用】上記の構成において、タブレット面上にペンを
用いて筆記された文字の筆跡は一定時間毎に面上の位置
座標として検出され、文字の各ストローク(ペンがタブ
レット面についてから離れるまでの位置座標からなる文
字の1画)S(i) 単位で座標記憶手段に記憶される。
【0012】ストローク範囲検出手段は、座標記憶手段
に記憶された座標データを読み取り、各ストロークS
(i) 毎のx方向(行方向)の最小値a(i) および最大値
(i)を求める。
【0013】評価関数生成手段は、予め定義された、ス
トロークの最小値aおよび最大値bより定まるストロー
ク重み定義関数fa,b (x)をもとに、ストローク範囲
検出手段で得られた各ストロークS(i) の最小値a(i)
および最大値b(i) によりストローク重み関数g
(i) (x)=fa(i),b(i) (x)を求め、このストロー
ク重み関数g(i) (x)を全てのストロークS(i) につ
いて加算して文字区切り評価関数F(x)=Σi (i)
(x)を求める。
【0014】文字区切り候補検出手段は、評価関数生成
手段で得られた文字区切り評価関数F(x)の極値(極
大値または極小値のうちのいずれか一方であり、ストロ
ーク重み定義関数の定義により決定される)を与えるx
座標値を検出して文字区切り候補とする。
【0015】文字領域候補抽出手段は、まず上記座標記
憶手段に記憶された座標データを読み取り、行幅(行と
垂直な方向をyとすると、文字列のy方向の最小値と最
大値との差)などから、推定文字幅wを決定する。次に
文字領域候補抽出手段は、上記文字区切り候補検出手段
によって求められた任意の文字区切り候補2つに挟まれ
た領域のうち、推定文字幅wに対応する幅内の領域を1
文字領域候補として抽出する。文字認識手段は、文字領
域候補抽出手段によって抽出された1文字領域候補の文
字認識を行う。この文字認識手段で得られる各1文字領
域候補の文字認識結果をもとに、文字列としての評価が
行われ、文字列の認識結果が求められる。
【0016】
【実施例】図1はこの発明の一実施例に係るオンライン
文字認識機能を持つ情報処理装置の構成を示すブロック
図である。なお、図1の装置は、住所認識装置に実施し
た場合である。
【0017】図1において、1はタブレット面を持つ座
標入力装置(以下、タブレット部と称する)である。タ
ブレット部1は、ペン(例えばスタイラスペン)を用い
てタブレット面上に筆記された文字の筆跡を一定時間毎
に面上の位置座標として検出すると共に、ペンがタブレ
ット面上に置かれていない場合にはペンオフとして検出
するようになっている。
【0018】さて、タブレット部1のタブレット面上に
筆記された筆跡は、一定時間毎にに検知され、ペンの位
置情報またはペンオフの情報が得られる。本実施例にお
いて、ペンの位置座標は、タブレット面の左端からの横
方向(x方向)の距離と、上端からの縦方向(y方向)
の距離とで、1/10mm単位で得られる。
【0019】タブレット部1には座標記憶部2が接続さ
れており、上記のようにしてタブレット部1で得られた
筆跡(を表わす点列を含む)情報は座標記憶部2に記憶
される。この筆跡情報は、図2に示すように、ペンがオ
ンかオフかの情報(マーク)と、オンのときにはペンの
位置座標(x,y座標値)とで構成され、一定時間毎に
座標記憶部2に記憶される。このようにして、例えば図
3(a)に示すような住所を表わす文字列「東京都港区
芝浦1−1−1」の筆跡情報が、座標記憶部2に記憶さ
れたものとする。
【0020】座標記憶部2にはストローク範囲検出部3
が接続されている。ストローク範囲検出部3は、座標記
憶部2に記憶された筆跡情報(座標データ)を読み取
り、連続するペンオンの範囲の座標データで示される点
列からなる各ストロークS(i)毎に、x方向の座標値x
の最小値a(i) および最大値b(i) を求める。
【0021】ストローク範囲検出部3には評価関数生成
部4が接続されている。評価関数生成部4では、ストロ
ーク重み定義関数fa,b (x)と称される関数が、例え
ば次のように定義されている。 fa,b (x)=0 (x<aまたはx>b) fa,b (x)=x−a (a≦x≦c) fa,b (x)=b−x (c<x≦b) 但し、c=(a+b)/2
【0022】評価関数生成部4は、ストローク範囲検出
部3で得られた各ストロークS(i)毎の最小値a(i)
よび最大値b(i) をもとに、上記のストローク重み定義
関数fa,b (x)に従い、各ストロークS(i) 毎のスト
ローク重み関数 g(i) (x)=fa(i),b(i) (x) を求める。次に評価関数生成部4は、上記全てのストロ
ークS(i) について求めた各ストローク重み関数g(i)
(x)を加算して文字区切り評価関数 F(x)=Σi (i) (x) を求める。図3(a)に示す文字列が筆記された場合に
おいて、評価関数生成部4で求められる文字区切り評価
関数F(x)を図3(b)に示す。
【0023】評価関数生成部4には文字区切り候補検出
部5が接続されている。文字区切り候補検出部5は、評
価関数生成部4で得られた図3(b)に示すような文字
区切り評価関数F(x)をもとに、同関数F(x)の極
小値を与えるx座標値(図において矢印で示す位置のx
座標値)を全て検出して、それらを文字区切り候補(文
字を分離する境界位置の候補)とする。さて、上記評価
関数生成部4で求められた各ストロークS(i) 毎のスト
ローク重み関数g(i) (x)は g(i) (x)=0 (x<a(i) またはx>
(i) ) g(i) (x)=x−a(i) (a(i) ≦x≦c(i) ) g(i) (x)=b(i) −x (c(i) <x≦b(i) ) 但し、c(i) =(a(i) +b(i) )/2 となる。
【0024】即ちg(i) (x)は、ストロークS(i)
領域のx方向座標の最小値a(i) より小さいx座標範囲
と、x方向座標の最大値b(i) より大きいx座標範囲で
は0となり、a(i) 以上c(i) 以下のx座標範囲、即ち
(i) と(a(i) +b(i) )/2の間のx座標範囲では
単調増加となりc(i) 以上b(i) 以下のx座標範囲、即
ち(a(i) +b(i) )/2とb(i) の間のx座標範囲で
は単調減少となる。したがって、このようなg
(i) (x)を全てのストロークS(i) について加算して
得られる文字区切り評価関数F(x)は、たとえ隣接文
字が重複していても、その重複部分で極小値をとるの
で、この極小値を与えるx座標値を文字区切り候補とす
ることにより、必要な候補だけを適切に抽出することが
できる。
【0025】文字区切り候補検出部5には文字領域候補
抽出部6が接続されている。文字領域候補抽出部6は座
標記憶部2とも接続されている。文字領域候補抽出部6
は、まず座標記憶部2に記憶された座標データを読み取
り、行と垂直な方向をyとすると、文字列のy方向の最
小値と最大値との差をもとに行の幅を求め、求めた行幅
を推定文字幅wとする。
【0026】次に文字領域候補抽出部6は、文字区切り
候補検出部5で抽出された文字区切り候補のうちの任意
の文字区切り候補2つに挟まれた領域の中から、推定文
字幅wにより決定される1文字領域最大幅wmax を越え
ない領域を、1文字領域候補として決定する。本実施例
では、1文字領域最大幅wmax を推定文字幅wの1.5
倍としているが、これに限るものではない。
【0027】文字領域候補抽出部6には文字認識部7が
接続されている。文字認識部7は座標記憶部2とも接続
されている。文字認識部7はまず、文字領域候補抽出部
6によって決定(抽出)された各1文字領域(の候補)
毎に、その1文字領域内の文字画像を構成するストロー
クを座標記憶部2から抽出する。この際、文字認識部7
は、その1文字領域候補内にストロークS(i) のx方向
(行方向)の例えば中点c(i) 、即ち(a(i)
(i) )/2の点が含まれるストロークS(i) のみを抽
出する。これにより、対象としている1文字領域候補内
に入り込んでいる隣接文字のストロークを、この1文字
領域候補内のストロークであるものとして誤って抽出す
ることが防止できる。
【0028】文字認識部7は、文字領域候補抽出部6に
よって抽出された各1文字領域(の候補)毎に、その領
域内の文字画像を構成するストロークを座標記憶部2か
ら抽出すると、抽出したストロークにより構成される文
字画像について周知の文字認識を行う。
【0029】文字認識部7には住所認識部8が接続さ
れ、この住所認識部8には住所の情報が、例えば最上位
層に都道府県名、次の層に市、群、区名といったよう
に、階層的に記憶された住所記憶部9が接続されてい
る。住所認識部8は、住所記憶部9の情報をもとに、文
字認識部7によって認識された文字列の先頭から順に認
識結果を参照してまず都道府県名を認識し、次に認識さ
れた都道府県名に矛盾しない市、群、区名等を順に認識
して、文字列全体を住所として認識する。
【0030】なお、ストローク重み定義関数f
a,b (x)は前記実施例に限定されるものではなく、f
a,b (x)の1次微分係数(d/dx)fa,b (x)が
下記式 (d/dx)fa,b (x)=0 (x<aまたはx>
b) (d/dx)fa,b (x)=K (a≦x≦c) (d/dx)fa,b (x)=−K (c<x≦b) 但し、Kは0でない定数、cは最小値aと最大値bとで
定まる a≦c≦bを満たす点
【0031】を満たす連続関数であればよい。前記実施
例は定数Kが正(K=1)の場合であるが、負であって
も構わない。但し、Kが負の場合には、文字区切り候補
検出部5は、文字区切り評価関数F(x)の極大値(前
記実施例では極小値)を与えるx座標値を検出して、そ
れらを文字区切り候補とする必要がある。
【0032】更に、前記実施例では、1文字領域候補か
ら文字画像を構成するストロークを抽出する際、その1
文字領域候補内にストロークS(i) のx方向(行方向)
の中点c(i) =(a(i) +b(i) )/2が含まれるスト
ロークS(i) のみを抽出するようにしたが、その領域の
x方向最小値をxl、x方向最大値をxr、c(i) を各
ストロークS(i) 毎にそのx方向最小値a(i) およびx
方向最大値b(i) により定まるa(i) ≦c(i) ≦b(i)
を満足する値とすると、xl≦c(i) ≦xrを満足する
ストロークS(i) のみを抽出するようにしてもよい。
【0033】
【発明の効果】以上詳述したようにこの発明によれば、
タブレット面に筆記された文字列を構成する各文字の各
ストローク毎に、文字が並ぶ行方向の座標値xの最小値
および最大値を求めるストローク範囲検出手段と、予め
定義された、ストロークの行方向の最小値と最大値によ
り定まるxの関数であるストローク重み定義関数をもと
に、各ストローク毎に求められた最小値および最大値か
ら各ストローク毎のストローク重み関数を求め、求めた
全てのストロークについてのストローク重み関数を加算
して文字区切り評価関数を求める評価関数生成手段と、
文字区切り評価関数が極値をとる行方向の全ての座標値
を文字列中の文字区切り候補とする文字区切り候補検出
手段とを備えた構成としたので、特に隣接文字間が接
近、重複した文字列から、必要な候補だけを適切に抽出
することができる。
【0034】即ち、この発明によれば、タブレット面に
筆記された文字列を文字毎に分離するための文字の区切
り位置の候補の抽出が、少ない候補数で、しかも本来は
文字の区切りとなる箇所が候補外とされることを招くこ
となく実現でき、特に隣接文字間が接近、重複した文字
列を少ない処理量で効率的に高性能に認識することがて
きる。
【図面の簡単な説明】
【図1】この発明の一実施例に係るオンライン文字認識
機能を持つ情報処理装置の構成を示すブロック図。
【図2】図1の座標記憶部2に記憶された筆跡情報の一
例を示す図。
【図3】同実施例における文字区切り候補抽出の基礎と
なる関数の具体例を、認識の対象となる文字列と対応さ
せて示す図。
【符号の説明】
1…タブレット部、2…座標記憶部、3…ストローク範
囲検出部、4…評価関数生成部、5…文字区切り候補検
出部、6…文字領域候補抽出部、7…文字認識部、8…
住所認識部、9…住所記憶部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 タブレット面上にペンを用いて筆記され
    た文字の筆跡を一定時間毎に面上の位置座標として検出
    し、上記ペンがタブレット面上に置かれていない場合に
    はペンオフとして検出する座標入力手段と、 この座標入力手段から上記位置座標またはペンオフ検出
    通知を受け取り記憶するための座標記憶手段と、 この座標記憶手段に記憶された座標データを読み取り、
    各ペンオフまでの期間に入力される座標データで示され
    る文字のストロークS(i) 毎に、文字列の並ぶ方向であ
    る行方向の座標値xの最小値a(i) および最大値b(i)
    を求めるストローク範囲検出手段と、 予め定義された、ストロークの行方向の最小値aと最大
    値bとで定まるxの関数であるストローク重み定義関数
    a,b (x)であって、 (d/dx)fa,b (x)=0 (x<aまたはx>
    b) (d/dx)fa,b (x)=K (a≦x≦c) (d/dx)fa,b (x)=−K (c<x≦b) 但し、Kは0でない定数、cは最小値aと最大値bとで
    定まる a≦c≦bを満たす点 を満たす連続関数で定義されたストローク重み定義関数
    a,b (x)をもとに、上記ストローク範囲検出手段に
    よって各ストロークS(i) 毎に求められた上記最小値a
    (i) および最大値b(i) から各ストロークS(i) 毎のス
    トローク重み関数 g(i) (x)=fa(i),b(i) (x) を求め、この全てのストロークS(i) について求めたス
    トローク重み関数g(i)(x)を加算して文字区切り評
    価関数 F(x)=Σi (i) (x) を求める評価関数生成手段と、 この評価関数生成手段によって求められた文字区切り評
    価関数F(x)が極大値または極小値のいずれか一方の
    極値をとる行方向の座標値を検出して文字列中の文字区
    切り候補とする文字区切り候補検出手段と、 この文字区切り候補検出手段によって検出された文字区
    切り候補をもとに文字画像の領域を決定して文字画像を
    抽出する文字領域候補抽出手段と、 この文字領域候補抽出手段によって抽出された各文字画
    像を認識する文字認識手段と、 を具備し、上記文字認識手段の文字認識結果を統合して
    文字列の認識結果とすることを特徴とする情報処理装
    置。
  2. 【請求項2】 上記文字領域候補抽出手段は、上記文字
    画像の抽出の際には、文字画像の領域がxl≦x≦xr
    であるものとすると、文字画像を構成するストロークの
    選択を xl≦c(i) ≦xr 但し、c(i) は各ストローク毎に上記a(i) とb(i)
    で定まる a(i) ≦c(i) ≦b(i) を満たす値 なる条件を満たすか否かにより行うことを特徴とする請
    求項1記載の情報処理装置。
JP5000727A 1993-01-06 1993-01-06 オンライン文字認識機能を持つ情報処理装置 Pending JPH06203208A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5000727A JPH06203208A (ja) 1993-01-06 1993-01-06 オンライン文字認識機能を持つ情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5000727A JPH06203208A (ja) 1993-01-06 1993-01-06 オンライン文字認識機能を持つ情報処理装置

Publications (1)

Publication Number Publication Date
JPH06203208A true JPH06203208A (ja) 1994-07-22

Family

ID=11481772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5000727A Pending JPH06203208A (ja) 1993-01-06 1993-01-06 オンライン文字認識機能を持つ情報処理装置

Country Status (1)

Country Link
JP (1) JPH06203208A (ja)

Similar Documents

Publication Publication Date Title
Chaudhuri et al. A complete printed Bangla OCR system
JP2700130B2 (ja) 手書き文字の認識システム及び認識方法
KR100412317B1 (ko) 문자인식/수정방법및장치
EP1564675B1 (en) Apparatus and method for searching for digital ink query
US6137908A (en) Handwriting recognition system simultaneously considering shape and context information
Yadav et al. Optical character recognition for Hindi language using a neural-network approach
CN103577818A (zh) 一种图像文字识别的方法和装置
WO2005106771A1 (en) Apparatus and method for handwriting recognition
WO2007070662A1 (en) Script recognition for ink notes
JP6492894B2 (ja) 認識プログラム、認識方法及び認識装置
CN111488732A (zh) 一种变形关键词检测方法、系统及相关设备
JP2007220145A (ja) オンライン文字認識装置
JPH08320914A (ja) 表認識方法および装置
JPH06203208A (ja) オンライン文字認識機能を持つ情報処理装置
Mashiyat et al. Bangla off-line handwritten character recognition using superimposed matrices
JPH11184971A (ja) 手書き文字認識機能を持つ文字入力装置及び方法
JPS592191A (ja) 手書き日本語文の認識処理方式
Nguyen et al. Semi-incremental recognition of on-line handwritten Japanese text
Bhattacharya et al. Cleaning of online Bangla free-form handwritten text
JP3187182B2 (ja) 光学的手書き文字列認識方法および装置
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
Rao et al. Font and size identification in Telugu printed document
JP2962911B2 (ja) 文字認識装置
JP3069771B2 (ja) パターン認識方法及び装置
JP2013246721A (ja) 文字列認識装置、文字列認識プログラム、及び記録媒体