JPH0850632A - 手書き文字切り出し方法および装置 - Google Patents

手書き文字切り出し方法および装置

Info

Publication number
JPH0850632A
JPH0850632A JP6183140A JP18314094A JPH0850632A JP H0850632 A JPH0850632 A JP H0850632A JP 6183140 A JP6183140 A JP 6183140A JP 18314094 A JP18314094 A JP 18314094A JP H0850632 A JPH0850632 A JP H0850632A
Authority
JP
Japan
Prior art keywords
ink data
character
search range
width
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6183140A
Other languages
English (en)
Inventor
Yoshifumi Sakai
良文 坂井
Yoshitaka Ikeda
佳隆 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP6183140A priority Critical patent/JPH0850632A/ja
Publication of JPH0850632A publication Critical patent/JPH0850632A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 入力枠を設けないオンライン手書き文字認識
において、文字切り出しを正確に行なう。 【構成】 一連のインクデータ群の文字列高Hを求め、
この文字列幅Hに基づいて幅Lを決定し、基点Oから水
平方向に幅Lの範囲を予備探索範囲30とする。予備探
索範囲30内において、インクデータのストロークの数
Sと、インクデータの最大高さ(文字高)hと、形状特
徴量x(ここでは空白長の最大のもの)とを求め、変数
S,h,xとに応じて探索範囲31を決定する。探索範囲
31内でインクデータのヒストグラムが最小値をとる区
間を探索し、区間のうち最長のものが後続の文字との間
の切れ目であるとして1文字分のインクデータの切り出
しを行なう。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、オンライン手書き文字
認識に関し、特に、入力枠を指定しないオンライン手書
き文字認識を行なう際に、入力した手書き文字データを
1文字分ずつのデータに分割する手書き文字切り出し方
法および装置に関する。
【0002】
【従来の技術】従来のオンライン手書き文字認識におけ
る入力インタフェースでは、入力装置上に予め設定され
た概四角形の領域(入力枠)ごとに、利用者が1字ずつ
手書き文字を入力するようになっている。指定された枠
に1字ずつ入力するという作業は、利用者にかなりのス
トレスを与えるとともに、通常の紙に対して字を書く作
業とはかなり異なる動作であり、この入力インタフェー
スは、決してよいユーザインタフェースであるとはいえ
ない。このような問題点を解決するため、現在、入力枠
を設けることなく文字認識が可能となるようなオンライ
ン文字認識方法が開発されつつある。
【0003】1字ごとの入力枠を設けない場合、文字認
識に先立って、連続して入力される複数の手書き文字デ
ータから1字分ずつのデータを順次切り出す処理を実行
しなければならない。現在、この切り出しの方法として
は、2次元平面内のデータとして入力された手書き文字
データをこの平面内で各種の方向に射影し、文字間に存
在するスペースを探索して文字の切れ目とする方法が用
いられている。典型的には、文字の入力方向(左横書き
とか縦書き)を指定した上で、この入力方向に平行な直
線上に手書き文字データを正射影してヒストグラムを得
てそのヒストグラムの値がゼロとなる位置を探索し、1
字分の区画の形状が最も正方形に近くなるような場所を
文字切り出しの位置としていた。
【0004】以下の説明において、「文字」とは、文字
コードと1対1に対応するともに、それぞれ固有の字形
と関連づけられるもののことを指し、「インクデータ」
とは、利用者がペンなどの入力デバイスによって入力し
た軌跡データを指し、「ストローク」とは一筆分(一画
分)の軌跡データを指し、「手書き文字入力」とは、文
字認識の対象となるインクデータを入力する作業を指
し、「手書き文字」とは、手書き文字認識処理を施すこ
とを意図して利用者が入力したインクデータのことを指
し、「文字切り出し」とは、手書き文字のインクデータ
群の中から、1文字に相当するインクデータを抽出する
ことを指す。
【0005】
【発明が解決しようとする課題】射影によってヒストグ
ラムを求めて切り出し位置を決定する従来の方法では、
切り出された区画がほぼ正方形になるように文字切り出
しが行なわれるので、縦長の文字や横長の文字を正確に
切り出すことが難しく、特に、縦長、横長の文字が混在
している場合には正確な切り出しを行なうことが困難で
あった。すなわち、入力枠が設けられていないので、原
稿用紙のマス目に1字ずつ書かれたような入力を期待す
ることはできず、例えば「1」や「言」といった文字は
縦長の、「二」などの横長のインクデータとして入力さ
れる。また、文字ごとのインクデータの間隔も、左側の
文字のインクデータの右端と右側の文字の左端の間隔が
ほぼ一定になるように入力される傾向にある。したがっ
て、縦長の文字が連続した場合には、1文字分として切
り出された中に実際には2文字分のインクデータが含ま
れていることがある。また、ある場合には、本来なら1
文字(例えば「記」)が2文字(「言」+「己」)に切
り出されることもある。
【0006】本発明の目的は、入力枠を設けないオンラ
イン手書き文字認識において、文字切り出しを正確に行
なうことのできる切り出し方法および装置を提供するこ
とにある。
【0007】
【課題を解決するための手段】本発明の手書き文字切り
出し方法は、一定の入力方向に沿って入力する一連の手
書き文字からなるインクデータ群から1文字分ずつのイ
ンクデータを切り出す手書き文字切り出し方法におい
て、前記入力方向に対して垂直な方向に関する前記イン
クデータ群の最大幅を第1の幅(H)として前記第1の
幅(H)に基づいて第2の幅(L)を決定し、文字切り
出しの開始点から前記入力方向と同方向に前記第2の幅
(L)の範囲を予備探索範囲とし、前記予備探索範囲内
に存在するインクデータのストロークの数(S)と、前
記入力方向に対して垂直な方向に関する前記予備探索範
囲における前記インクデータの最大幅である第3の幅
(h)と、前記予備探索範囲内に存在する前記インクデ
ータの形状特徴量(x)とを求め、前記ストロークの数
(S)と前記第3の幅(h)と前記形状特徴量(x)と
に応じて定まる範囲を探索範囲とし、前記入力方向に垂
直な方向に前記インクデータを射影したヒストグラムを
算出して前記探索範囲内で前記ヒストグラムが最小値を
とる区間を探索し、前記区間のうち最長のものが後続の
手書き文字との間の切れ目であるとして1文字分のイン
クデータの切り出しを行なう。
【0008】本発明の手書き文字切り出し方法におい
て、形状特徴量(x)は、予備探索範囲内におけるヒス
トグラムの値が最小値となる区間のうちの最長の区間の
長さによって表わされることができる。また、インクデ
ータ群に対して文字切り出しを行なったのちに利用者に
よって切り出し位置の修正が行なわれた場合に、予備探
索範囲内のストロークの数、第3の幅(h)および形状
特徴量(x)から探索範囲を決定する際に使用されるパ
ラメータを当該修正に適合するように変更するようにし
てもよい。
【0009】本発明の手書き文字切り出し装置は、一定
の入力方向に沿って入力する一連の手書き文字からなる
インクデータ群から1文字分ずつのインクデータを切り
出す手書き文字切り出し装置において、前記インクデー
タ群の入力が行なわれる入力手段と、入力されたインク
データ群を格納するインクデータ格納手段と、パラメー
タを格納するパラメータ格納手段と、前記インクデータ
格納手段を参照し、前記入力方向に対して垂直な方向に
関する前記インクデータ群の最大幅を第1の幅(H)と
して前記第1の幅(H)に基づいて第2の幅(L)を決
定し、文字切り出しの開始点から前記入力方向と同方向
に前記第2の幅(L)の範囲を予備探索範囲とし、前記
予備探索範囲内に存在するインクデータのストロークの
数(S)と、前記入力方向に対して垂直な方向に関する
前記予備探索範囲における前記インクデータの最大幅で
ある第3の幅(h)と、前記予備探索範囲内に存在する
前記インクデータの形状特徴量(x)とを求め、前記ス
トロークの数(S)と前記第3の幅(h)と前記形状特
徴量(x)とに応じ前記パラメータを使用して探索範囲
を決定し、前記入力方向に垂直な方向に前記インクデー
タを射影したヒストグラムを算出して前記探索範囲内で
前記ヒストグラムが最小値をとる区間を探索し、前記区
間のうち最長のものが後続の文字との間の切れ目である
として1文字分のインクデータの切り出しを行なう切り
出し手段と、を有する。
【0010】本発明の手書き文字切り出し装置では、切
り出し手段による切り出し位置を格納する切り出し位置
格納手段と、切り出し位置の修正の指示が入力した場合
に、当該指示によって指定された切り出し位置となるよ
うに切り出し位置格納手段内に格納された切り出し位置
を修正し、かつ指定された切り出し位置に適合するよう
にパラメータ格納手段内のパラメータを更新する切り出
し位置修正・学習手段とをさらに備え、入力手段はイン
クデータ群の入力が行なわれるとともに切り出し位置の
修正の指示が入力するものであるようにすることができ
る。
【0011】
【作用】本発明では、一連の手書き文字からなるインク
データ群の幅(第1の幅;横書きなら高さ、縦書きなら
横幅)から、第1の幅の関数である第2の幅を求めてそ
の切り出しの開始位置からその第2の幅の範囲内を予備
探索範囲とする。そして、この予備探索範囲内にあるス
トロークの数やインクデータの最大幅、インクデータの
示す形状特徴量などから空白の探索領域(探索範囲)を
決定する。このように予備探索範囲を求めた上で、文字
形などに応じて変化する値から探索範囲を決定すること
により、文字内の空白領域を文字間の空白領域であると
誤認することがなくなるとともに、横長あるいは縦長の
手書き文字に応じて空白の探索領域が定まるので、これ
ら横長あるいは縦長の文字が混在する場合であっても正
確に文字切り出しを行なうことが可能となる。また、ヒ
ストグラム値が最小となるところを探索するので、隣接
する手書き文字が重なり合う場合でも文字切り出しを行
なえる。形状特徴量としては、予備探索範囲内において
ヒストグラムが最小値をとる区間の数、この区間の中で
最大のものの長さ、ストロークの中で最も長いものの長
さなどを用いることができ、さらにはこれらのものを組
み合わせて形状特徴量を定義するようにしてもよい。
【0012】本発明では、予備探索範囲から探索範囲を
求める際に使用されるパラメータを利用者に応じて変化
させることで、さらに文字切り出しの正確さを向上させ
ることが可能である。この場合には、利用者に対して切
り出し結果を呈示した上で、利用者からの修正指示を受
け付け、修正された切り出し位置が得られるようにパラ
メータを変更すればよい。
【0013】
【実施例】次に、本発明の実施例について、図面を参照
して説明する。図1は本発明の一実施例の手書き文字認
識装置の構成を示すブロック図である。
【0014】この手書き文字認識装置は、入力するイン
クデータ群に対して文字切り出しを行なうとともに、切
り出し結果に応じて手書き文字認識を行なって結果を表
示し、さらには文字切り出しの修正が行なわれた場合に
はその修正に応じた学習が行なわれるように構成されて
いる。
【0015】この手書き文字認識装置は、文字認識処理
に使用される認識辞書21と、文字切り出しに使用され
るパラメータを格納するパラメータファイル22と、必
要な情報を利用者に呈示するとともに利用者によるイン
クデータや切り出し位置修正指示が入力する入力・表示
パネル11と、入力したインクデータを格納するインク
データ格納部13と、パラメータファイル22を参照し
てインクデータ格納部13に格納されたインクデータに
対して文字切り出し処理を施す切り出しエンジン部14
と、文字切り出し処理での切り出し結果を切り出し位置
情報として格納する切り出し位置格納部15と、インク
データ格納部13内のインクデータから切り出し位置情
報に応じて1文字分づつのインクデータを取り出し認識
辞書21を参照して手書き文字認識を行なう認識エンジ
ン部16と、認識エンジン部16による文字認識結果を
格納するとともに文字認識結果と切り出し位置とを入力
・表示パネル11に表示する認識結果格納部17と、切
り出し位置の修正の指示が入力した場合に、その指示に
よって指定された切り出し位置となるように、切り出し
位置格納部15内に格納された切り出し位置情報を修正
・更新し、かつこの指定された切り出し位置に適合する
ようにパラメータファイル22内のパラメータを更新す
る切り出し位置修正・学習部18とを備えている。
【0016】入力・表示パネル11は、表示部とインク
データや修正指示の入力部とが一体になったいわゆる表
示一体型入力パネルであり、例えば、液晶フラットディ
スプレイ上に透明型タブレットを積層した構成のものを
使用することができる。利用者は、ペン12でこの入力
・表示パネル11の入力・表示画面をなぞることによっ
て、所望のインクデータを入力を行なえるようになって
いる。入力したインクデータはインクデータ格納部13
に格納されるとともに、入力・表示画面でのそのインク
データの入力場所にそのまま表示されるようになってい
る。認識結果や文字切り出し位置も入力・表示画面に表
示されるから、文字切り出しの位置が誤っている場合に
は、利用者は、所定のジェスチュアを入力・表示画面に
入力したりドラッギングを行なうことによって、切り出
し位置の修正指示を行なえるようになっている。なお本
実施例では、切り出し位置の修正指示があった場合には
それに応じて切り出し位置格納部15内の切り出し位置
情報も更新されるので、認識エンジン部16はその更新
の影響が及ぶ範囲で文字認識をやり直すようになってい
る。
【0017】次に、切り出しエンジン部14について説
明する。図2(a),(b)は、それぞれ、左横書き、縦書き
で一連の手書き文字の入力がなされた場合において切り
出しエンジン部14が求める各変数の関係を示す図であ
る。以下においては、左横書きに手書き文字の入力がな
された場合を説明するが、縦書きで入力がなされた場合
であっても、入力方向に応じて方向を90°回転させる
ことにより(例えば高さとあれば横方向への幅と読み替
えることにより)、以下の説明をそのまま適用できる。
【0018】切り出しエンジン部14は、一連の手書き
文字の入力方向すなわち水平方向に対して垂直な方向へ
のインクデータ群の最大高さを文字列幅Hとしてこの文
字列幅Hに基づいて幅Lを決定し、文字切り出しの開始
点(基点O)から入力方向に沿って幅Lの範囲を予備探
索範囲30とし、予備探索範囲30内のインクデータを
垂直方向に正射影してヒストグラムを得るように構成さ
れている。さらに切り出しエンジン部14は、この予備
探索範囲30内に存在するインクデータのストロークの
数Sと、予備探索範囲30におけるインクデータの最大
高さ(文字高)hと、予備探索範囲30内に存在するイ
ンクデータの形状特徴量xとを求め、ストロークの数S
と高さhと形状特徴量xとに応じ、パラメータファイル
22内のパラメータを参照して探索範囲31を決定し、
探索範囲31内でヒストグラムが最小値をとる区間を探
索し、区間のうち最長のものが後続の手書き文字との間
の切れ目であるとして1文字分のインクデータの切り出
しを行なうように構成されている。ここでは探索範囲3
1は、基点Oから探索範囲31の始点までの距離Jと、
基点Oから探索範囲31の終点までの距離Jとによって
表現されている。また、本実施例では、形状特徴量x
は、予備探索範囲30内での空白区間(ヒストグラムが
最小値となる区間)のうちの最大のものの長さで表わさ
れている。
【0019】次に、本実施例の手書き文字認識装置にお
ける文字切り出し操作の詳細を図3のフローチャートに
基づいて説明する。
【0020】まず、利用者によるインクデータ群の入力
がなされ、インクデータ格納部13に格納される(ステ
ップ101)。次に、ほぼ直線的に、一列に、時間的に
も連続して入力されたインクデータを一連の入力として
区切る(ステップ102)。予め手書き文字の入力方向
が指定されている場合には、その入力方向への一列の入
力を一連の入力とすればよく、改行など、入力位置の大
きな変化が検出されたらそこで区切ればよい。また、時
間的に入力が途切れた場合にもそこで区切ればよい。
【0021】次に、一連のものとして区切られたインク
データ群に関し、そのインクデータ群の文字列幅Hを求
める(ステップ103)。文字列幅Hは、そのインクデ
ータ群がXY平面内(入力方向とX軸が平行とする)に
存在するとして、インクデータのY座標の最大値と最小
値との差として定義される。入力方向に垂直な方向にイ
ンクデータ群を正射影し、ヒストグラムを求めておく
(ステップ104)。
【0022】次に、文字列幅Hの関数である幅Lを求
め、文字切り出しの開始点(基点O)から入力方向に距
離Lの範囲を予備探索範囲[L(H)]とする。Lを表
わす関数はいろいろ考えられるが、探索範囲でなく予備
探索範囲を定めるだけなので、本実施例ではL=Hとす
る。そして、予備探索範囲内にあるインクデータのスト
ロークの数S、文字高h、形状特徴量xを求める(スト
ローク105)。ここで、予備探索範囲内にあるストロ
ークより時間的に前に入力されたストロークは、予備探
索範囲外にあるとしても、ストロークの数には含めるも
のとする。文字高hは、上述と同様にインクデータがX
Y平面内あるとして、予備探索範囲内のインクデータの
Y座標の最大値と最小値との差として定義される。ま
た、形状特徴量xは、本実施例では、予備探索範囲内に
おいてインクデータのヒストグラムが最小値をとる区間
(空白区間)のうちの最大のものの長さ(最大空白幅)
とする。形状特徴量xとしては、このほか、予備探索範
囲内のストロークのうちの最長のものの長さ、予備探索
範囲内での空白区間の数や、これらを組み合わせたもの
を採用することができる。
【0023】続いて、基点Oから探索範囲の始点までの
距離J、基点Oから探索範囲の始点までの距離Eを求め
ることによって、探索範囲を決定する(ステップ10
6)。ここでは、ストロークの数Sの関数として定義さ
れるパラメータj(S),e(S)を使用し、Pj=j(S),
e=e(S)+x/hとして、
【0024】
【数1】J=h×Pj, E=h×Pe …(1) によって、J,Eを求める。J,Eの定め方は、ストロー
クの数、文字高、形状特徴量の少なくともいずれかが反
映するものであれば、ここで述べたものに限られるもの
ではない。パラメータj(S),e(S)に関するデータ
は、パラメータファイル22中に格納されている。
【0025】J,Eが求められ探索範囲が定まったら、
探索範囲内において、ヒストグラムが最小値となる区間
(空白区間)を探し、これら空白区間の内で最長のもの
(最大幅空白)の位置を求め(ステップ107)、その
最大幅空白より前のインクデータを1字分のインクデー
タとして切り出す(ステップ108)。このとき、探索
された空白区間が探索範囲の境界をまたがる場合、すな
わち、空白区間に対応するヒストグラム値の領域が探索
範囲の境界を越えて探索範囲の外側にも連続することが
ある。このような場合、この空白区間については、探
索範囲外にあるとする、探索範囲外にある部分も含め
て考えたこの空白区間の重心、あるいはこの空白区間に
おける始終点など位置を特定できる点が探索範囲の内側
にあるか外側にあるかに応じて、探索範囲内にあるか探
索範囲外であるかを決定する、探索範囲内にある部分
区間だけを考慮する、などの取り扱いをすることがで
き、これらの取り扱い方法から適宜の方法を選択するよ
うにすればよい。本実施例では、探索範囲内にある部分
区間だけを考慮するようにした。
【0026】また、ステップ108において最大幅空白
より前のインクデータを切り出す場合、最大幅空白のど
こを切り出し位置にするかが問題となる。一般には、最
大幅空白の始点、中点、終点のいずれかを選択すること
になり、本実施例では、最大幅空白の終点をもって切り
出し位置とする。また、手書き文字が重なっているため
この最大幅空白内にもストロークが存在する場合、すな
わちこの最大幅空白のヒストグラム値が0でない場合が
ある。このときには、最大幅空白内にあるストロークを
切り出し対象とするかしないかを定める必要があるが、
本実施例では、最大幅空白の終点より基点O側にそのス
トロークの重心がある場合には、そのストロークも切り
出し対象とし、そうでない場合にはそのストロークを切
り出さないものとした。
【0027】以上説明したように、ステップ103〜1
08の処理を実行することで、一連の入力から1字分の
インクデータが切り出されたことになり、切り出された
結果は切り出し位置格納部15に切り出し位置情報とし
て格納される。そして、一連の入力インクデータ群の全
てに対して処理が行なわれたかどうかが判定され(ステ
ップ109)、未切り出しのインクデータが残っている
場合には、次の1文字分のインクデータを切り出すため
にステップ103に戻り、そうでない場合には、文字切
り出しの処理を終了する。
【0028】本実施例における文字切り出し処理は上述
した通りであるが、切り出し精度の向上をさらに図るた
め、文字認識結果と組み合わせて文字切り出しを行なう
ことも可能である。すなわち、認識誤差量が小さくなる
ように切り出し位置を定めるようにすればよい。ここで
認識誤差量とは、インクデータをもとに認識辞書21を
探索してそのインクデータに対応する候補文字を見つけ
出した場合に、認識辞書21中の候補文字の図形的デー
タと認識対象のインクデータとの差を定量的に表わす尺
度のことであり、認識誤差量が小さいほど、認識辞書中
のデータとよく一致している、すなわち、探索された候
補文字が利用者の意図した文字である可能性が高いとい
うこと意味している。このときの文字切り出しの具体的
手順は、以下の通りである。まず、切り出し結果に基づ
いて文字認識を行なって候補文字とその候補文字に対す
る認識誤差量とを求め、認識誤差量の値が所定のしきい
値よりも大きい場合には、探索範囲内にあって最大幅空
白に次に長い空白区間で文字切り出しをやり直し、やり
直し後の切り出し結果の基づいて文字認識を行ないその
ときの認識誤差量がしきい値より小さければ、やり直し
た文字切り出し位置を採用し、認識誤差量がしきい値よ
り大きい場合には、さらに次に長い空白区間を探すこと
を繰り返す。もし、発見された全ての空白区間に対して
認識誤差量がしきい値以下とならない場合には、最も認
識誤差量の小さかった時の空白区間を切り出し位置とす
る。
【0029】次に、切り出し位置の修正とパラメータフ
ァイル22内のパラメータの更新について説明する。
【0030】本実施例の手書き文字認識装置では、入力
・表示パネル11において、入力されたインクデータに
重畳するように、切り出し位置に関する情報が表示され
る。表示された切り出し位置に対して、ペン12によ
り、ドラッキングを行なったりジェスチュアを入力する
ことにより、切り出し位置の修正の入力を行なうことが
できるようになっている。例えば、図4(a)に示される
インクデータから「あ」、「い」、「た」の各文字に相
当するインクデータが切り出された場合には、図示太破
線で示されるアイコン41が、切り出し位置に応じて表
示される。ここで、実際には「あしけこ」と切り出され
るべきであった場合には、図4(b)のAで示されるよう
に、図示右側のアイコン41(「い」と「た」の間の切
り出し位置に対応)を移動させ、かつ、太点線で示され
るように、「た」を分割するように線分状のジェスチュ
ア42を入力すればよい。その結果、図4(c)に示され
るように、「あしけこ」となるように切り出し位置の修
正が入力される。また、切り出し位置を解除したい場合
には、その切り出し位置に対応するアイコン41を指定
したのち、ドラッキングによってそのアイコン41を表
示領域外に移動させてやればよい。
【0031】このように切り出し位置の修正が指示され
た場合、切り出し位置修正・学習部18は、その指示に
よって指定された切り出し位置となるように、切り出し
位置格納部15内に格納された切り出し位置情報を修正
・更新し、かつこの指定された切り出し位置に適合する
ようにパラメータファイル22内のパラメータを変更す
る。すなわち、修正された位置での切り出しが可能とな
るように、探索範囲設定のためのパラメータが変更され
る。これにより、各利用者の書き癖に応じた切り出しが
行なわれるようになる。以下、パラメータの変更の手順
の一例について、図5のフローチャートを用い、空白区
間の最大のものの長さを形状特徴量xとし、かつ最大空
白幅の終点を切り出し位置とする場合について説明す
る。なお、形状特徴量xの定義や切り出し位置の決定方
法が異なる場合には、それに応じてパラメータの変更の
手順を変化させる必要がある。図6(a),(b)および図7
(a),(b)は、このときのパラメータ変更を説明する図で
ある。
【0032】まず、パラメータ算出に必要な変数の算出
あるいは検索が行なわれる(ステップ111)。変数と
しては、修正前の切り出し位置C、修正後の切り出し位
置Z、修正前の探索範囲の始点と終点の基点Oからの距
離J,E、ストロークの数S、修正前の切り出し位置C
における最大幅空白の長さu、修正後の切り出し位置で
の空白区間の長さvである。位置C,Zは、基点Oから
の距離として表される。
【0033】次に、修正前の探索範囲内に、修正後の切
り出し位置よりヒストグラム値が小さい領域があるかど
うかを調べ(ステップ112)、そのような領域が存在
する場合には、そのヒストグラム値が小さい領域が探索
範囲内に含まれないように、J,Eを変更してJ',E'と
し、、このJ',E'の変更値に基づき、式(1)からPj,P
eの変更値を求める(ステップ120)。一方、ステッ
プ112においてヒストグラム値の小さい領域が存在し
ない場合には、基点Oを基準として、修正前の切り出し
位置Cと修正後の切り出し位置Zとの位置関係を求める
(ステップ113)。
【0034】Cの方が前(基点O側)にある場合は、本
来の切り出し位置よりも幅の広い空白区間があったこと
が原因で本来切り出されるべきインクデータの途中で切
り出してしまった場合であって、切り出されたインクデ
ータを結合すべき場合である。まず、変数uとvの大小
関係を調べ(ステップ114)、u<vである場合は、
図6(a)に示されるように、本来の切り出し位置Zが探
索範囲外であった場合なので、探索範囲を後ろ側に延長
して正しく切り出しが行なわれるようにする。具体的に
は、微小な正の数をδとして、変更後の探索範囲J',
E'について、J'=J(変化させない)、E'=Z−v
+u+δとする(ステップ115)。ドット単位でイン
クデータが扱われる場合には、δは1ドットとするのが
一般的である。そして修正後のJ',E'に基づき、Pj,
eの変更値を求める。
【0035】一方、ステップ114でu≧vである場合
は、図6(b)に示されるように、文字内にある空白が正
しい切り出し位置での空白よりも幅が広い場合であるの
で、その空白が範囲外になるか、あるいはその空白の幅
が正しい切り出し位置での空白の幅より小さくなるよう
に、探索位置の開始位置を後ろ側にずらし、かつ、探索
位置の終点が正しい切り出し位置より前であれば正しい
切り出し位置まで探索位置の終点を後ろ側にずらす。具
体的には、変更後の探索範囲J',E'を、J'=C−v+
δ、E'=max(E,Z)とする(ステップ116)。そ
して修正後のJ',E'に基づき、Pj,Peの変更値を求め
る。
【0036】ステップ113においてCの方が後ろ側に
ある場合は、本来の切り出し位置よりも幅の広い空白区
間があったことが原因で本来切り出されるべきインクデ
ータに引続くインクデータまで取り込んでしまった場合
であって、切り出されたインクデータを分離すべき場合
である。まず、変数uとvの大小関係を調べ(ステップ
117)、u<vである場合は、図7(a)に示されるよ
うに、本来の切り出し位置Zが探索範囲外にあるか本来
の切り出し位置に対応する最大幅空白が狭い場合である
ので、本来の切り出し位置が探索領域内にあってかつそ
こでの最大幅空白が文字内の空白よりも大きくなるよう
に、探索範囲を前側に延長して正しく切り出しが行なわ
れるようにする。具体的には、変更後の探索範囲J',
E'をJ'=Z−u−δ、E'=E(変化させない)とす
る(ステップ118)。そして修正後のJ',E'に基づ
き、Pj,Peの変更値を求める。
【0037】一方、ステップ117でu≧vである場合
は、図7(b)に示されるように、文字内にある空白が正
しい切り出し位置での空白よりも幅が広い場合であるの
で、その空白が範囲外になるか、あるいはその空白の幅
が正しい切り出し位置での幅より小さくなるように、探
索位置の終点を前側にずらす。具体的には、変更後の探
索範囲J',E'を、J'=J(変化させない)、E'=C
−u+v−δとする(ステップ119)。そして修正後
のJ',E'に基づき、Pj,Peの変更値を求める。
【0038】このようにステップ115,116,118
〜120において、Pj,Peの変更値が定まったら、こ
の変更値と対応するように、パラメータj(S),e(S)
を更新し(ステップ121)、パラメータの更新処理を
終了する。パラメータファイル22内のパラメータj
(S),e(S)が更新されたので、次回の文字切り出しか
らはこの更新後のパラメータj(S),e(S)が使用され
ることになる。すなわち、修正された切り出し位置に基
づく学習が行なわれたことになる。
【0039】以上、パラメータ変更の一例を説明した
が、例外的なインクデータに対して切り出し位置の修正
が行なわれた場合などにパラメータの大幅な変化が起こ
らないようにするために、Pj,Peの変化量に限界を設
けるとか、Pj,Peの変更値の平均に基づいてパラメー
タj(S),e(S)を更新するなどの方法を採用すること
が可能である。
【0040】
【発明の効果】以上説明したように本発明は、予備探索
範囲を求めた上で文字形などに応じて変化する値から探
索範囲を決定することにより、文字内の空白領域を文字
間の空白領域であると誤認することがなくなるととも
に、横長あるいは縦長の手書き文字に応じて空白の探索
領域が定まるので、これら横長あるいは縦長の文字が混
在する場合であっても正確に文字切り出しを行なうこと
が可能という効果がある。また、ヒストグラム値が最小
となるところを探索するので、隣接する手書き文字が重
なり合う場合でも文字切り出しを行なえるという効果が
ある。
【0041】また、利用者からの修正指示を受け付け、
予備探索範囲から探索範囲を求める際に使用されるパラ
メータを修正された切り出し位置が得られるように変化
させることにより、利用者の書き癖に応じた文字切り出
しが可能となって、さらに文字切り出しの正確さを向上
させることが可能であるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の手書き文字認識装置の構成
を示すブロック図である。
【図2】インクデータと各パラメータとの関係を示す図
であって、(a)は左横書き、(b)は縦書きに、ぞれぞれ対
応する図である。
【図3】図1の手書き文字認識装置における文字切り出
し処理を説明するフローチャートである。
【図4】図1の手書き文字装置におけるパラメータの修
正と学習の処理を説明するフローチャートである。
【図5】(a)〜(c)はそれぞれ切り出し位置の修正の手順
を説明する図である。
【図6】(a),(b)はそれぞれ結合タイプのパラメータの
修正を説明する図である。
【図7】(a),(b)はそれぞれ分離タイプのパラメータの
修正を説明する図である。
【符号の説明】
11 入力・表示パネル 12 ペン 13 インクデータ格納部 14 切り出しエンジン部 15 切り出し位置格納部 16 認識エンジン部 17 認識結果格納部 18 切り出し位置修正・学習部 21 認識辞書 22 パラメータファイル 30 予備探索範囲 31 探索範囲 101〜109,111〜121 ステップ
【手続補正書】
【提出日】平成6年11月24日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】図4
【補正方法】変更
【補正内容】
【図4】(a)〜(c)はそれぞれ切り出し位置の修正の手順
を説明する図である。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】図5
【補正方法】変更
【補正内容】
【図5】図1の手書き文字装置におけるパラメータの修
正と学習の処理を説明するフローチャートである。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 一定の入力方向に沿って入力する一連の
    手書き文字からなるインクデータ群から1文字分ずつの
    インクデータを切り出す手書き文字切り出し方法におい
    て、 前記入力方向に対して垂直な方向に関する前記インクデ
    ータ群の最大幅を第1の幅として前記第1の幅に基づい
    て第2の幅を決定し、文字切り出しの開始点から前記入
    力方向と同方向に前記第2の幅の範囲を予備探索範囲と
    し、 前記予備探索範囲内に存在するインクデータのストロー
    クの数と、前記入力方向に対して垂直な方向に関する前
    記予備探索範囲における前記インクデータの最大幅であ
    る第3の幅と、前記予備探索範囲内に存在する前記イン
    クデータの形状特徴量とを求め、 前記ストロークの数と前記第3の幅と前記形状特徴量と
    に応じて定まる範囲を探索範囲とし、前記入力方向に垂
    直な方向に前記インクデータを射影したヒストグラムを
    算出して前記探索範囲内で前記ヒストグラムが最小値を
    とる区間を探索し、前記区間のうち最長のものが後続の
    手書き文字との間の切れ目であるとして1文字分のイン
    クデータの切り出しを行なうことを特徴とする手書き文
    字切り出し方法。
  2. 【請求項2】 前記形状特徴量が、前記予備探索範囲内
    における前記ヒストグラムの値が最小値となる区間のう
    ちの最長の区間の長さによって表わされる請求項1に記
    載の手書き文字切り出し方法。
  3. 【請求項3】 インクデータ群に対して文字切り出しを
    行なったのちに利用者によって切り出し位置の修正が行
    なわれた場合に、前記ストロークの数、前記第3の幅お
    よび前記形状特徴量から探索範囲を決定する際に使用さ
    れるパラメータを当該修正に適合するように変更する請
    求項1または2に記載の手書き文字切り出し方法。
  4. 【請求項4】 一定の入力方向に沿って入力する一連の
    手書き文字からなるインクデータ群から1文字分ずつの
    インクデータを切り出す手書き文字切り出し装置におい
    て、 前記インクデータ群の入力が行なわれる入力手段と、 入力されたインクデータ群を格納するインクデータ格納
    手段と、 パラメータを格納するパラメータ格納手段と、 前記インクデータ格納手段を参照し、前記入力方向に対
    して垂直な方向に関する前記インクデータ群の最大幅を
    第1の幅として前記第1の幅に基づいて第2の幅を決定
    し、文字切り出しの開始点から前記入力方向と同方向に
    前記第2の幅の範囲を予備探索範囲とし、前記予備探索
    範囲内に存在するインクデータのストロークの数と、前
    記入力方向に対して垂直な方向に関する前記予備探索範
    囲における前記インクデータの最大幅である第3の幅
    と、前記予備探索範囲内に存在する前記インクデータの
    形状特徴量とを求め、前記ストロークの数と前記第3の
    幅と前記形状特徴量とに応じ前記パラメータを使用して
    探索範囲を決定し、前記入力方向に垂直な方向に前記イ
    ンクデータを射影したヒストグラムを算出して前記探索
    範囲内で前記ヒストグラムが最小値をとる区間を探索
    し、前記区間のうち最長のものが後続の文字との間の切
    れ目であるとして1文字分のインクデータの切り出しを
    行なう切り出し手段と、を有することを特徴とする手書
    き文字切り出し装置。
  5. 【請求項5】 前記切り出し手段による切り出し位置を
    格納する切り出し位置格納手段と、 切り出し位置の修正の指示が入力した場合に、当該指示
    によって指定された切り出し位置となるように前記切り
    出し位置格納手段内に格納された切り出し位置を修正
    し、かつ指定された切り出し位置に適合するように前記
    パラメータ格納手段内のパラメータを更新する切り出し
    位置修正・学習手段とをさらに備え、 前記入力手段は前記インクデータ群の入力が行なわれる
    とともに前記切り出し位置の修正の指示が入力するもの
    である請求項4に記載の手書き文字切り出し装置。
JP6183140A 1994-08-04 1994-08-04 手書き文字切り出し方法および装置 Withdrawn JPH0850632A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6183140A JPH0850632A (ja) 1994-08-04 1994-08-04 手書き文字切り出し方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6183140A JPH0850632A (ja) 1994-08-04 1994-08-04 手書き文字切り出し方法および装置

Publications (1)

Publication Number Publication Date
JPH0850632A true JPH0850632A (ja) 1996-02-20

Family

ID=16130509

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6183140A Withdrawn JPH0850632A (ja) 1994-08-04 1994-08-04 手書き文字切り出し方法および装置

Country Status (1)

Country Link
JP (1) JPH0850632A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6130962A (en) * 1997-06-06 2000-10-10 Matsushita Electric Industrial Co., Ltd. Information retrieval apparatus for enabling information retrieval with ambiguous retrieval key
US6177513B1 (en) 1998-08-28 2001-01-23 Toshifumi Takeuchi Method for evaluating artificial receptors
WO2007079009A1 (en) * 2005-12-29 2007-07-12 Microsoft Corporation Handwriting recognition training and synthesis

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6130962A (en) * 1997-06-06 2000-10-10 Matsushita Electric Industrial Co., Ltd. Information retrieval apparatus for enabling information retrieval with ambiguous retrieval key
US6177513B1 (en) 1998-08-28 2001-01-23 Toshifumi Takeuchi Method for evaluating artificial receptors
WO2007079009A1 (en) * 2005-12-29 2007-07-12 Microsoft Corporation Handwriting recognition training and synthesis
US7657094B2 (en) 2005-12-29 2010-02-02 Microsoft Corporation Handwriting recognition training and synthesis

Similar Documents

Publication Publication Date Title
US10437466B2 (en) Formula inputting method and apparatus
JPH06176188A (ja) 認識文字の情報作成方法及び装置
US6810147B2 (en) Document image processing apparatus for processing line portions manually input to document image, method therefor, and computer readable recording medium recorded with document image processing program therefor
JPH0850632A (ja) 手書き文字切り出し方法および装置
JP2992127B2 (ja) 文字認識方法及び装置
US5991440A (en) Method and apparatus for recognizing input handwritten characters associated with title information
JPH07220023A (ja) 表認識方法及びその装置
JP3422634B2 (ja) 手書き文字認識方法及び装置
JP2001351065A (ja) 文字認識方法、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置
JPH10307675A (ja) 手書き文字認識方法及び装置
EP0585610B1 (en) Method and apparatus for inputting handwritten alphanumeric characters and for displaying the input character
JP2984170B2 (ja) オンライン手書き文字認識装置
JP3305395B2 (ja) 図形分割装置
JPH08202856A (ja) 画像処理方法
JP3128357B2 (ja) 文字認識処理装置
JPH09305704A (ja) 文書処理装置
JPH08190603A (ja) 文字認識装置及びその候補文字表示方法
JPH0721311A (ja) オンライン文字切出し装置
JPH06295356A (ja) オンライン文字認識装置
JPH06251198A (ja) 文字入力装置
JPH096920A (ja) 手書き文字認識方法及びその装置
JPH06195519A (ja) 文字認識装置および文字認識方法
JPH0773172A (ja) データ加工方法、文字認識方法及び座標入力装置
JPH02207387A (ja) オンライン手書文字入力装置
JPH05120472A (ja) 文字認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20011106