JP2001256436A - 文字認識装置、方法、及び記録媒体 - Google Patents

文字認識装置、方法、及び記録媒体

Info

Publication number
JP2001256436A
JP2001256436A JP2000064106A JP2000064106A JP2001256436A JP 2001256436 A JP2001256436 A JP 2001256436A JP 2000064106 A JP2000064106 A JP 2000064106A JP 2000064106 A JP2000064106 A JP 2000064106A JP 2001256436 A JP2001256436 A JP 2001256436A
Authority
JP
Japan
Prior art keywords
character data
character
online
data
handwritten
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000064106A
Other languages
English (en)
Inventor
Gakuhei Riyuu
学平 劉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000064106A priority Critical patent/JP2001256436A/ja
Publication of JP2001256436A publication Critical patent/JP2001256436A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 オフライン的な認識手法だけで、オンライン
入力の手書き文字をも高い認識率で認識可能な文字認識
方法を提供する。 【解決手段】 例えば、デジタイザ上に紙を置いて文字
を書くことにより、同じ文字のオンライン筆跡データを
同時に採取し、それらを比較計算することにより、交換
パラメータを計算する。読み取ったデータがオンライン
文字データであれば、まず抽出した変換パラメータによ
り変換手段35にてオフラインデータに変換する。変換
した/読み取ったオフラインデータを認識辞書37を用
いて認識する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置、方
法、及び記録媒体に関し、より詳細には、オンライン入
力とオフライン入力の手書き文字を両方とも認識できる
文字認識装置、方法、及び記録媒体に関する。
【0002】
【従来の技術】電子ペンを用いてデジタイザから得られ
たオンライン手書き文字データは、書き順、書き方向な
どのオンライン情報を含めた筆跡情報である。ペンダウ
ンからペンアップの間に探知されたペン先の位置、つま
り点(X−Yの座標値で表す)、の時系列は一つのスト
ロークと呼ぶ。オンラインで入力された手書き文字のデ
ータは1個ないし複数個のストロークからなるものであ
る。
【0003】また、普通の筆記具で紙上に書いた文字を
スキャナで読み取って計算機が利用可能な形式のデータ
に変換されたオフライン文字データは文字の形を表すビ
ットマップのようなものである。例えば、2値化データ
で表現する場合、紙上にペンのインクのあるところ(黒
の部分)に対応するデータの値は1、インクのないとこ
ろ(白の部分)に対応するデータの値は0である。
【0004】オンライン入力とオフライン入力の手書き
文字を同時に認識できる文字認識装置は対応方法の相違
によって2種類に分別できる。一つはオンライン認識手
法とオフライン認識手法を同時に具備して対応するもの
である。もう一つは入力データを前処理して、一つの認
識手法で対処するものである。
【0005】
【発明が解決しようとする課題】特開平10−1246
11号公報は、オンライン認識手法とオフライン認識手
法を同時に具備して対応する発明が記載されている。こ
の方法は、システムの複雑化と冗長化の問題がある。
【0006】また、入力データを前処理して、一つの認
識手法で対処するものは、通常、オンラインの入力デー
タをオフラインデータに変形し、オフライン的な認識手
法で対処する。なぜならば、オフラインの文字データに
オンライン情報(書き順、書き方向)を追加することは
困難であるからである。
【0007】オンラインデータをオフラインデータに変
換するとき、筆跡の点と点の間に、一定の幅を持つ線分
で結ぶ方法が一般である。つまり、あるストロークの中
の隣接する2点の位置及びその間の場所に対応するデー
タの値を1にセットする。しかし、デジタイザ上に電子
ペンで文字を書くことと、紙に筆記具で文字を書くこと
とは物理的な条件が異なるため、得られたオンライン文
字の筆跡データを線で結んで得られた文字の形は、紙上
の文字の形とは形が異なる。故に、このような変換デー
タをオフライン文字認識手段に渡して得られる認識結果
の正読率は当然紙上に書いた文字データの認識結果の正
読率に及ばないといった問題が生じる。
【0008】本発明は、上述のごとき実情に鑑みてなさ
れたものであり、オフライン的な認識手法だけで、オン
ライン入力とオフライン入力の手書き文字を両方とも認
識でき、かつ、オンラインの入力手書き文字でも高い認
識率で処理できるような文字認識装置、方法、及び記録
媒体を提供することをその目的とする。
【0009】この発明は、オンラインの入力データを紙
に書かれた文字の形に近づけるようにオフラインデータ
に変形することで、一つの認識手法で、オンラインとオ
フラインの手書き文字を認識するものである。この方法
はシステムの構成が簡単にでき、高い認識率を得ること
もできる。しかし、この方法はオンラインデータをオフ
ラインデータに変換するとき、認識手法自身の特性を考
慮に入れなかったため、認識性能の向上に改善の余地が
残されている。本発明は、さらに、上記問題を解決する
ため、オンラインデータをオフラインデータに変換する
とき、認識手法自身の特性を考慮に入れ、認識性能を更
に向上できるような文字認識装置、方法、及び記録媒体
を提供することを他の目的とする。
【0010】
【課題を解決するための手段】本発明は、デジタイザか
ら手書き文字データを入力するオンライン入力手段と、
紙に書かれた文字データを入力するオフライン入力手段
と、手書き文字の認識辞書を格納する手段と、前記の認
識辞書を用いて前記入力された文字を認識する手段と、
認識の結果を出力する手段を具備する文字認識装置にお
いて、オンライン入力された手書き文字のデータと紙上
の文字データとを比較計算し、オンライン手書き文字デ
ータから紙上文字データへの変換パラメータの算出手段
を有することを特徴としたものである。
【0011】本発明は、前記算出手段で取得された変換
パラメータを使用し、オンライン入力された手書き文字
のデータを紙上の文字データに近付けるようなフィルタ
リング手段を有することを特徴としたものである。
【0012】本発明は、オンライン入力された文字デー
タに対し、請求項2記載の方法で前処理してオフライン
的な認識手段に入力し、オフライン入力された文字デー
タに対し直接にオフライン的な認識手段に入力して、文
字認識を行うことを特徴としたものである。
【0013】本発明は、デジタイザから手書き文字デー
タを入力するオンライン手書き文字入力手段と、紙に書
かれた文字データを入力するオフライン手書き文字入力
手段と、前記オンライン手書き文字データをオンライン
文字データベースに格納する手段と、前記オフライン手
書き文字データをオフライン文字データベースに格納す
る手段と、オフライン手書き文字のテンプレートを有す
る認識辞書を格納する手段と、オンライン手書き文字デ
ータをオフライン手書き文字データに変換する第1の文
字データ変換手段と、前記オンライン文字データベース
の文字データを前記第1の文字データ変換手段を用いて
オフライン文字データに変換し、変換後の文字データを
前記認識辞書で認識する手段及びその認識結果を格納す
る手段と、前記オフライン文字データベースの文字デー
タを前記認識辞書で認識する手段及びその認識結果を格
納する手段と、前記オンライン文字データの認識結果と
前記オフライン文字データの認識結果を用いて第1の文
字データ変換手段の変換パラメータを修正する手段とを
有することを特徴としたものである。
【0014】本発明は、前記オンライン手書き文字入力
手段とオフライン手書き文字入力手段は筆記者から手書
き文字データを採取する際、文字毎に、オンラインデー
タとオフラインデータをペアで入力し、ペアとなるオン
ライン手書き文字とオフライン手書き文字は書き順と画
数は同じく、形は同じになるようなものであり、前記文
字データ格納手段は手書き文字のオンラインデータとオ
フラインデータの対応関係を付けてカテゴリ別に格納す
ることを特徴としたものである。
【0015】本発明は、前記第1の文字データ変換手段
は、前記格納されたオンライン文字データベースとオフ
ライン文字データベース中の対応している手書き文字デ
ータを比較計算し、算出されたオンライン手書き文字デ
ータからオフライン文字データへの変換パラメータを用
いてオンライン手書き文字データをオフライン手書き文
字データに変換することを特徴としたものである。
【0016】本発明は、前記文字データ格納手段は手書
き文字のオンラインデータとオフラインデータの対応関
係を付けてカテゴリ別に格納することを特徴としたもの
である。そして、各請求項の発明は、以下の特徴を有す
るものとする。
【0017】請求項1の発明は、デジタイザから手書き
文字データを入力するオンライン入力手段と、紙に書か
れた手書き文字データを入力するオフライン入力手段
と、手書き文字の認識辞書を用いて入力された文字を認
識する手段と、該認識した結果を出力する手段とを有
し、前記オンライン入力された手書き文字データと前記
オフライン入力された手書き文字データとを比較計算
し、オンライン入力された手書き文字データからオフラ
イン入力された手書き文字データへの変換パラメータを
算出する算出手段とを有することを特徴としたものであ
る。
【0018】請求項2の発明は、請求項1の発明におい
て、前記算出手段は、前記オフライン手書き文字データ
から得た各ストロークの長さ及び各ストローク上の各位
置に対する線幅の統計値を算出し、該算出した統計値に
したがって、前記オンライン手書き文字データにおける
各ストロークの長さに対応した前記変換パラメータを算
出することを特徴としたものである。
【0019】請求項3の発明は、請求項1の発明におい
て、前記算出手段は、前記オフライン手書き文字データ
から得た各ストロークの長さ及び各ストローク上の各位
置に対する線幅の統計値を文字種毎に算出し、該算出し
た統計値にしたがって、文字種毎の前記オンライン手書
き文字データにおける各ストロークの長さに対応した前
記変換パラメータを算出することを特徴としたものであ
る。
【0020】請求項4の発明は、請求項1の発明におい
て、前記算出手段は、前記オフライン手書き文字データ
から得た各ストロークの長さ及び各ストローク上の各位
置に対する線幅の統計値を各文字について各画数毎に算
出し、該算出した統計値にしたがって、各文字における
画毎の前記オンライン手書き文字データにおける各スト
ロークの長さに対応した前記変換パラメータを算出する
ことを特徴としたものである。
【0021】請求項5の発明は、請求項1乃至4のいず
れか1の発明において、前記算出手段で取得された変換
パラメータを使用し、前記オンライン入力された手書き
文字データを紙に書かれた文字データに近付けるような
フィルタリングを行うフィルタリング手段を有すること
を特徴としたものである。
【0022】請求項6の発明は、請求項5の発明におい
て、前記オンライン入力された手書き文字データに対
し、前記フィルタリング手段で前処理してオフライン的
な認識手段に入力する手段と、オフライン入力された手
書き文字データに対し、直接にオフライン的な認識手段
に入力する手段とを有し、入力された文字データに対し
文字認識を行うことを特徴としたものである。
【0023】請求項7の発明は、デジタイザから手書き
文字データを入力するオンライン入力手段と、紙に書か
れた文字データを入力するオフライン入力手段と、前記
オンライン入力された手書き文字データをオンライン文
字データベースに格納する手段と、前記オフライン入力
された手書き文字データをオフライン文字データベース
に格納する手段と、オフライン手書き文字のテンプレー
トを有する認識辞書を格納する手段と、オンライン手書
き文字データを、オフライン手書き文字データに変換す
るオンライン文字データ変換手段と、前記オンライン文
字データベースの文字データを、前記オンライン文字デ
ータ変換手段を用いてオフライン文字データに変換し、
変換後の文字データを前記認識辞書で認識する手段及び
該認識した結果を格納する手段と、前記オフライン文字
データベースの文字データを前記認識辞書で認識する手
段及び該認識した結果を格納する手段と、前記オンライ
ン文字データの認識結果と前記オフライン文字データの
認識結果を用いて前記オンライン文字データ変換手段の
変換パラメータを修正する手段とを有することを特徴と
したものである。
【0024】請求項8の発明は、請求項7の発明におい
て、前記変換パラメータを修正する手段は、前記オンラ
イン文字データの認識結果が前記オフライン文字データ
の認識結果と一致するように、かつ、以前に認識させた
文字に対する認識結果を生かすように、前記変換パラメ
ータを修正することを特徴としたものである。
【0025】請求項9の発明は、請求項7又は8の発明
において、前記文字データを格納する手段は、手書き文
字のオンラインデータとオフラインデータの対応関係を
付けてカテゴリ別に格納することを特徴としたものであ
る。
【0026】請求項10の発明は、請求項7又は8の発
明において、前記オンライン入力手段及びオフライン入
力手段は、筆記者から手書き文字データを採取する際、
文字毎に、オンライン手書き文字データとオフライン手
書き文字データをペアで入力し、ペアとなるオンライン
手書き文字とオフライン手書き文字は書き順と画数は同
じく、形は同じになるようなものであり、前記文字デー
タを格納する手段は、手書き文字のオンラインデータと
オフラインデータの対応関係を付けてカテゴリ別に格納
することを特徴としたものである。
【0027】請求項11の発明は、請求項7又は8の発
明において、前記オンライン文字データ変換手段は、前
記格納されたオンライン文字データベースとオフライン
文字データベース中の対応している手書き文字データを
比較計算し、算出されたオンライン手書き文字データか
らオフライン手書き文字データへの変換パラメータを用
いてオンライン手書き文字データをオフライン手書き文
字データに変換することを特徴としたものである。
【0028】請求項12の発明は、デジタイザから手書
き文字データを入力するオンライン入力ステップと、紙
に書かれた手書き文字データを入力するオフライン入力
ステップと、手書き文字の認識辞書を用いて入力された
文字を認識するステップと、該認識した結果を出力する
ステップとを有し、前記オンライン入力された手書き文
字データと前記オフライン入力された手書き文字データ
とを比較計算し、オンライン入力された手書き文字デー
タからオフライン入力された手書き文字データへの変換
パラメータを算出する算出ステップとを有することを特
徴としたものである。
【0029】請求項13の発明は、請求項12の発明に
おいて、前記算出ステップは、前記オフライン手書き文
字データから得た各ストロークの長さ及び各ストローク
上の各位置に対する線幅の統計値を算出し、該算出した
統計値にしたがって、前記オンライン手書き文字データ
における各ストロークの長さに対応した前記変換パラメ
ータを算出することを特徴としたものである。
【0030】請求項14の発明は、請求項12の発明に
おいて、前記算出ステップは、前記オフライン手書き文
字データから得た各ストロークの長さ及び各ストローク
上の各位置に対する線幅の統計値を文字種毎に算出し、
該算出した統計値にしたがって、文字種毎の前記オンラ
イン手書き文字データにおける各ストロークの長さに対
応した前記変換パラメータを算出することを特徴とした
ものである。
【0031】請求項15の発明は、請求項12の発明に
おいて、前記算出ステップは、前記オフライン手書き文
字データから得た各ストロークの長さ及び各ストローク
上の各位置に対する線幅の統計値を各文字について画数
毎に算出し、該算出した統計値にしたがって、各文字に
おける画毎の前記オンライン手書き文字データにおける
各ストロークの長さに対応した前記変換パラメータを算
出することを特徴としたものである。
【0032】請求項16の発明は、請求項12乃至15
のいずれか1の発明において、前記算出ステップで取得
された変換パラメータを使用し、前記オンライン入力さ
れた手書き文字データを紙に書かれた文字データに近付
けるようなフィルタリングを行うフィルタリングステッ
プを有することを特徴としたものである。
【0033】請求項17の発明は、請求項16の発明に
おいて、前記オンライン入力された手書き文字データに
対し、前記フィルタリングステップを用いた方法で前処
理してオフライン的な認識ステップに入力するステップ
と、オフライン入力された手書き文字データに対し、直
接にオフライン的な認識ステップに入力するステップと
を有し、入力された文字データに対し文字認識を行うこ
とを特徴としたものである。
【0034】請求項18の発明は、デジタイザから手書
き文字データを入力するオンライン入力ステップと、紙
に書かれた文字データを入力するオフライン入力ステッ
プと、前記オンライン入力された手書き文字データをオ
ンライン文字データベースに格納するステップと、前記
オフライン入力された手書き文字データをオフライン文
字データベースに格納するステップと、オフライン手書
き文字のテンプレートを有する認識辞書を格納するステ
ップと、オンライン手書き文字データを、オフライン手
書き文字データに変換するオンライン文字データ変換ス
テップと、前記オンライン文字データベースの文字デー
タを、前記オンライン文字データ変換ステップを用いて
オフライン文字データに変換し、変換後の文字データを
前記認識辞書で認識するステップ及び該認識した結果を
格納するステップと、前記オフライン文字データベース
の文字データを前記認識辞書で認識するステップ及び該
認識した結果を格納するステップと、前記オンライン文
字データの認識結果と前記オフライン文字データの認識
結果を用いて前記オンライン文字データ変換ステップの
変換パラメータを修正するステップとを有することを特
徴としたものである。
【0035】請求項19の発明は、請求項18の発明に
おいて、前記変換パラメータを修正するステップは、前
記オンライン文字データの認識結果が前記オフライン文
字データの認識結果と一致するように、かつ、以前に認
識させた文字に対する認識結果を生かすように、前記変
換パラメータを修正することを特徴としたものである。
【0036】請求項20の発明は、請求項18又は19
の発明において、前記文字データを格納するステップ
は、手書き文字のオンラインデータとオフラインデータ
の対応関係を付けてカテゴリ別に格納することを特徴と
したものである。
【0037】請求項21の発明は、請求項18又は19
の発明において、前記オンライン入力ステップ及びオフ
ライン入力ステップは、筆記者から手書き文字データを
採取する際、文字毎に、オンライン手書き文字データと
オフライン手書き文字データをペアで入力し、ペアとな
るオンライン手書き文字とオフライン手書き文字は書き
順と画数は同じく、形は同じになるようなものであり、
前記文字データを格納するステップは、手書き文字のオ
ンラインデータとオフラインデータの対応関係を付けて
カテゴリ別に格納することを特徴としたものである。
【0038】請求項22の発明は、請求項18又は19
の発明において、前記オンライン文字データ変換ステッ
プは、前記格納されたオンライン文字データベースとオ
フライン文字データベース中の対応している手書き文字
データを比較計算し、算出されたオンライン手書き文字
データからオフライン手書き文字データへの変換パラメ
ータを用いてオンライン手書き文字データをオフライン
手書き文字データに変換することを特徴としたものであ
る。
【0039】請求項23の発明は、請求項1乃至11の
いずれか1に記載の文字認識装置として機能させるため
のプログラムを記録したことを特徴としたものである。
【0040】請求項24の発明は、請求項12乃至22
のいずれか1に記載の文字認識方法を実行するためのプ
ログラムを記録したことを特徴としたものである。
【0041】
【発明の実施の形態】図1は、本発明の一実施形態にお
ける文字認識装置の構成を示すブロック図で、図中、3
はタブレットから筆跡データ、またはスキャナから紙上
の文字形状データを入力する入力インタフェース(I/
F)であり、5はオフライン的な認識手法のプログラム
や認識辞書などを格納するROM、2はプログラム実行
時のワークエリアとなるRAM、1はROM5にあるプ
ログラムを実行するCPU、4は認識の結果を出力する
出力I/Fである。本実施形態においては、本発明の機
能を実行させるためのプログラムをCPU1により実行
させるように実装した文字認識装置を説明する。
【0042】まず、オンライン入力された手書き文字の
データと紙上の文字データとを比較計算し、オンライン
手書き文字データから紙上文字データへ変換する際の変
換パラメータを算出する手段を説明する。図2は、本発
明の一実施形態における文字認識装置の変換パラメータ
算出処理を説明するためのフロー図で、図3は、オンラ
イン文字データとオフライン文字データとの対応を示す
図である。図2において、ステップS1で紙上に書いた
文字をスキャナで読み取り、オフライン文字データベー
ス34を構築する。次に、ステップS2でデジタイザか
らオンライン手書き文字データを採取し、オンライン文
字データベース33を構築する。最後に、ステップS3
でオンライン文字データベース33とオフライン文字デ
ータベース34を元に、オンライン文字データからオフ
ライン文字データへの変換パラメータを抽出し、変換パ
ラメータデータベース39を構築する。
【0043】ステップS1,S2において、データ採取
に当たっては、同一筆記者による同じ文字のオンライン
入力と紙上記入が必要不可欠である。理想環境として、
デジタイザ上に紙を置き、電子ペンの先に筆記具を付け
て、紙上に文字を記入すると同じ文字のオンライン筆跡
データも同時に採取される。紙上に書いた文字をスキャ
ナで読み取り、オフライン文字データベース34を構築
するときには、「同一筆記者から採取した同じ文字のオ
ンライン文字のサイズとオフライン文字のサイズが同じ
である」の原則で、スキャナの解像度や明るさなどパラ
メータを調整する。
【0044】ステップS3における変換パラメータの抽
出に当たっては、まず、オンライン文字データベース3
3中の文字の各ストロークの長さを調べる。最大の長さ
Lmaxをm等分にし、d=Lmax/m,d>1とす
る。ストロークを長さで分類するための測定区間L1=
[1,d),L2=[d,2d),...,Lm=
[(m−1)d,m*d]を決める。
【0045】次に、オンライン文字データベース33と
オフライン文字データベース34の対応文字(即ち、同
一筆記者の同じ文字のオンラインデータとオフラインデ
ータ)をペアで取り出し、オンライン文字データをベー
スに、両者の対応点を付ける。あるn書のオンライン文
字の筆跡データはCh=(S_1,...,S_n)と
する。k番目のストロークS_kの点列はSk=((x
_k_1,y_k_1),...,(x_k_m,y_
k_m))とする。S_k中のある前後2点,(x_k
_j,y_k_j)と(x_k_(j+1),y_k_
(j+1))の間を幅1の線分で結び、内挿点(x_k
_j_1,y_k_j_1),...,(x_k_j_
w,y_k_j_w)が得られる。このように、オンラ
イン文字データの全てのストローク上の点と内挿点につ
いて、オフライン文字データと対応させる(図3参
照)。
【0046】上記オンライン文字データの全てのストロ
ーク上の点と内挿点について、オフライン文字データで
の対応点での線幅を求め、ストロークの長さをw等分に
し、各部分での幅の平均値と標準偏差を求める。次にオ
ンライン文字データベース33中の全ての文字データに
対して、オフライン文字データの幅の平均値と標準偏差
を文字種毎(数字,英字,記号,カタカナ,平仮名,漢
字)、画数文字毎(1画文字,2画文字,...,(n
−1)書文字,n書以上文字)について、長さがL1,
L2,...,Lmの区間内ストローク毎に統計する。
これらの統計データを変換パラメータとして、変換パラ
メータデータベース39に保存する。つまり、文字種,
画数,ストロークの長さ,ストローク中の場所の線幅の
平均値と標準偏差の値が保存される。なお、帳票分析
等、字種毎の変換パラメータを用いた方が認識率が上が
るので、文字種毎にも、統計値をとり、パラメータを作
成する。
【0047】次に、上述の算出手段で取得された変換パ
ラメータを使用し、オンライン入力された手書き文字の
データを紙上の文字データに近付けるようなフィルタリ
ング手段を説明する。オンライン入力された文字データ
について、上述の変換パラメータを用いて、文字種,画
数,ストロークの長さ,ストローク中の場所によって、
オンライン文字データの各ストロークの各点と内挿点に
幅を付けて、オフライン文字データに変換する。幅の付
け方は、デフォルト的には平均値を用いる。システム運
用によって、平均値と標準偏差で決めることもできる。
【0048】最後に、オンライン入力された文字データ
に対し、上述の方法で前処理してオフライン的な認識手
段に入力し、オフライン入力された文字データに対し直
接にオフライン的な認識手段に入力して、文字認識を行
う文字認識装置を説明する。図4は、本発明の一実施形
態における文字認識装置の処理を説明するためのフロー
図である。まず、ステップS11で認識すべき文字デー
タを入力する。ステップS12でオンラインデータかオ
フラインデータかを判断する。オンラインデータの場
合、ステップS13で変換パラメータデータベース39
中の変換パラメータを用いて線幅を付けてオフラインデ
ータへ変換する。元々オフライン入力された文字データ
またはオンラインデータから変換されたオフライン文字
データを認識辞書37を用いて認識して結果を出力し
(ステップS14)処理を終了する。
【0049】図5は、本発明の他の実施形態における文
字認識装置のハードウェア構成を示すブロック図で、図
中、11は装置全体の制御及びプログラムの実行を行う
CPUである。RAM21はプログラムの格納場所及び
実行時のワークエリアである。オンライン入力デバイス
31はタブレットから筆跡データを入力し、オフライン
入力デバイス32はスキャナから紙上の文字形状データ
を入力する。ディスプレイ41は入力された文字の形状
及び認識結果を表示し、ディスク51は文字データ及び
認識結果を格納する。
【0050】図6は、図5の文字認識装置の要素的特徴
を説明するための図である。本実施形態の文字認識装置
は、デジタイザから手書き文字データを入力するオンラ
イン手書き文字入力手段(オンライン入力手段)31
と、紙に書かれた文字データを入力するオフライン手書
き文字入力手段(オフライン入力手段)32と、オンラ
イン手書き文字データをオンライン文字データベース3
3に格納する手段と、オフライン手書き文字データをオ
フライン文字データベース34に格納する手段と、オフ
ライン手書き文字のテンプレートを有する認識辞書(文
字辞書)37を格納する手段と、オンライン手書き文字
データをオフライン手書き文字データに変換する第1の
文字データ変換手段35と、オンライン文字データベー
ス33の文字データを第1の文字データ変換手段35を
用いてオフライン文字データに変換し、変換後の文字デ
ータを認識辞書37で認識する手段36及びその認識結
果を格納する手段と、オフライン文字データベース34
の文字データを認識辞書37で認識する手段及びその認
識結果を格納する手段と、オンライン文字データの認識
結果とオフライン文字データの認識結果を用いて第1の
文字データ変換手段35の変換パラメータを修正する手
段38とを有する手書き文字変換パラメータ算出装置を
具備するようにしたものである。
【0051】上述の手書き文字変換パラメータ算出装置
は、例えば一般の人から採取して作成した認識辞書を用
いてあるユーザのサンプルを認識させ、そのサンプルに
よって変換パラメータを修正しようとするものであり、
そのユーザのサンプルが多数ある場合、この修正を繰り
返すことにより、そのユーザ専用の変換パラメータの作
成が可能となる。また、オンライン手書き文字データの
認識率が最大となるように、以前の認識結果を生かしな
がらパラメータを修正していく。
【0052】図7は、本実施形態における文字認識装置
の変換パラメータ修正処理を説明するためのフロー図で
ある。ステップS21でデジタイザからオンライン手書
き文字データを採取し、ステップS22でオンライン文
字データベース33を構築する。ステップS23で紙上
に書いた文字をスキャナで読み取り、ステップS24で
オフライン文字データベース34を構築する。なお、ス
テップS21,S22,S23,S24の詳細は後述す
る。採取されたオンライン文字データについて、ステッ
プS25の第1文字データ変換ステップによってオフラ
イン文字データに変換し、ステップS26でオフライン
方式の認識を行い、その結果を保存する。なお、ステッ
プS25で使用される第1パラメータは、前述のステッ
プS3における方法と同様の方法で抽出する。また、採
取されたオフライン文字データについて、ステップS2
6でオフライン方式の認識を行い、その結果を保存す
る。ステップS27でオンライン文字データの認識結果
とオフライン文字データの認識結果を元に、オンライン
文字データからオフライン文字データへの変換パラメー
タを修正し、修正後の変換パラメータデータベースを構
築する。ステップS27における変換パラメータの修正
とは、オンライン手書き文字データの認識率が最大化に
なるように、この幅の平均値に対する修正のことであ
る。この修正後の変換パラメータは認識手法自身の特性
に適応したものであり、認識性能の更なる向上に貢献で
きる。
【0053】ここで、ステップS21,S22,S2
3,S24に関し、手書き文字変換パラメータ算出装置
を詳細に説明する。オンライン入力手段31とオフライ
ン入力手段32は、筆記者から手書き文字データを採取
する際、文字毎に、オンラインデータとオフラインデー
タをペアで入力し、ペアとなるオンライン手書き文字と
オフライン手書き文字は書き順と画数は同じく、形は同
じになるようにする。文字データ格納手段は、手書き文
字のオンラインデータとオフラインデータの対応関係を
付けてカテゴリ別に格納する。
【0054】ステップS25に関し、第1の文字データ
変換手段35は、格納されたオンライン文字データベー
ス33とオフライン文字データベース34中の対応して
いる手書き文字データを比較計算し、算出されたオンラ
イン手書き文字データからオフライン文字データへの変
換パラメータを用いてオンライン手書き文字データをオ
フライン手書き文字データに変換するようにする。
【0055】図8は、本発明の一実施形態におけるオン
ライン文字データとオフライン文字データを同時に採取
する方法を説明するための図である。データ採取に当た
って、同一筆記者による同じ文字のオンライン入力と紙
上記入が必要不可欠である。理想環境として、図8のよ
うに、デジタイザ上に紙を置き、電子ペンの先に筆記具
を付けて、紙上に文字を記入すると、同じ文字のオンラ
イン筆跡データも同時に採取される。
【0056】図9は、本発明の一実施形態におけるオン
ライン文字データとオフライン文字データを別々に採取
する方法を説明するための図である。次に、手書き文字
のオンラインデータとオフラインデータが同時に採取で
きない場合、先にオンライン手書きデータを採取する。
次に、採取されたオンライン文字データの形状,書き
順,画数をディスプレイに表示しながら、同じ筆記者が
同じ文字を紙に記入する。このように採取された手書き
文字のオンラインデータとオフラインデータについて、
データベースを構築するとき、その対応関係をも保存す
る。
【0057】以上で説明した実施形態は、各機能を有す
る各種モジュールからなる装置としても、各機能を実行
させるためのプログラムを記録したコンピュータ読み取
り可能な記録媒体としても、実装可能である。
【0058】
【発明の効果】本発明によれば、オンライン文字データ
をオフライン文字データへ変換するとき、文字種,画
数,ストロークの長さ,ストローク中の場所などの要素
を考慮して、細かく制御でき、紙上に書かれた文字に近
い形に変換できる。
【0059】本発明によれば、オフライン的な認識手法
だけで、オンライン入力とオフライン入力の手書き文字
を両方とも認識でき、かつ、オンラインの入力手書き文
字でも高い認識率で処理できる。
【0060】本発明によれば、第1文字データ変換手段
を用いて、オンライン文字データをオフライン文字デー
タへ変換するとき、文字種,画数,ストロークの長さ,
ストローク中の場所などの要素を考慮して、細かく制御
でき、紙上に書かれた文字に近い形に変換できる。
【0061】本発明によれば、さらに、認識手法自身の
特性を考慮し、第1文字データ変換手段で使用されてい
る変換パラメータを修正しており、この修正後の変換パ
ラメータは認識手法自身の特性に適応したものであり、
認識性能の更なる向上に貢献できる。
【図面の簡単な説明】
【図1】 本発明の一実施形態における文字認識装置の
構成を示すブロック図である。
【図2】 本発明の一実施形態における文字認識装置の
変換パラメータ算出処理を説明するためのフロー図であ
る。
【図3】 オンライン文字データとオフライン文字デー
タとの対応を示す図である。
【図4】 本発明の一実施形態における文字認識装置の
処理を説明するためのフロー図である。
【図5】 本発明の他の実施形態における文字認識装置
のハードウェア構成を示すブロック図である。
【図6】 図5の文字認識装置の要素的特徴を説明する
ための図である。
【図7】 図5の文字認識装置の変換パラメータ修正処
理を説明するためのフロー図である。
【図8】 本発明の一実施形態におけるオンライン文字
データとオフライン文字データを同時に採取する方法を
説明するための図である。
【図9】 本発明の一実施形態におけるオンライン文字
データとオフライン文字データを別々に採取する方法を
説明するための図である。
【符号の説明】
1,11…CPU、2,21…RAM、3…入力I/
F、4…出力I/F、5…ROM、31…オンライン入
力デバイス、32…オフライン入力デバイス、33オン
ライン文字データベース、34…オフライン文字データ
ベース、35…第1の文字データ変換手段、36…オフ
ライン文字認識手段、37…認識辞書、38…文字デー
タ変換パラメータ修正手段、39…変換パラメータデー
タベース、41…ディスプレイ、51…ディスク。

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 デジタイザから手書き文字データを入力
    するオンライン入力手段と、紙に書かれた手書き文字デ
    ータを入力するオフライン入力手段と、手書き文字の認
    識辞書を用いて入力された文字を認識する手段と、該認
    識した結果を出力する手段とを有し、前記オンライン入
    力された手書き文字データと前記オフライン入力された
    手書き文字データとを比較計算し、オンライン入力され
    た手書き文字データからオフライン入力された手書き文
    字データへの変換パラメータを算出する算出手段とを有
    することを特徴とする文字認識装置。
  2. 【請求項2】 前記算出手段は、前記オフライン手書き
    文字データから得た各ストロークの長さ及び各ストロー
    ク上の各位置に対する線幅の統計値を算出し、該算出し
    た統計値にしたがって、前記オンライン手書き文字デー
    タにおける各ストロークの長さに対応した前記変換パラ
    メータを算出することを特徴とする請求項1記載の文字
    認識装置。
  3. 【請求項3】 前記算出手段は、前記オフライン手書き
    文字データから得た各ストロークの長さ及び各ストロー
    ク上の各位置に対する線幅の統計値を文字種毎に算出
    し、該算出した統計値にしたがって、文字種毎の前記オ
    ンライン手書き文字データにおける各ストロークの長さ
    に対応した前記変換パラメータを算出することを特徴と
    する請求項1記載の文字認識装置。
  4. 【請求項4】 前記算出手段は、前記オフライン手書き
    文字データから得た各ストロークの長さ及び各ストロー
    ク上の各位置に対する線幅の統計値を各文字について各
    画数毎に算出し、該算出した統計値にしたがって、各文
    字における画毎の前記オンライン手書き文字データにお
    ける各ストロークの長さに対応した前記変換パラメータ
    を算出することを特徴とする請求項1記載の文字認識装
    置。
  5. 【請求項5】 前記算出手段で取得された変換パラメー
    タを使用し、前記オンライン入力された手書き文字デー
    タを紙に書かれた文字データに近付けるようなフィルタ
    リングを行うフィルタリング手段を有することを特徴と
    する請求項1乃至4のいずれか1記載の文字認識装置。
  6. 【請求項6】 前記オンライン入力された手書き文字デ
    ータに対し、前記フィルタリング手段で前処理してオフ
    ライン的な認識手段に入力する手段と、オフライン入力
    された手書き文字データに対し、直接にオフライン的な
    認識手段に入力する手段とを有し、入力された文字デー
    タに対し文字認識を行うことを特徴とする請求項5記載
    の文字認識装置。
  7. 【請求項7】 デジタイザから手書き文字データを入力
    するオンライン入力手段と、紙に書かれた文字データを
    入力するオフライン入力手段と、前記オンライン入力さ
    れた手書き文字データをオンライン文字データベースに
    格納する手段と、前記オフライン入力された手書き文字
    データをオフライン文字データベースに格納する手段
    と、オフライン手書き文字のテンプレートを有する認識
    辞書を格納する手段と、オンライン手書き文字データ
    を、オフライン手書き文字データに変換するオンライン
    文字データ変換手段と、前記オンライン文字データベー
    スの文字データを、前記オンライン文字データ変換手段
    を用いてオフライン文字データに変換し、変換後の文字
    データを前記認識辞書で認識する手段及び該認識した結
    果を格納する手段と、前記オフライン文字データベース
    の文字データを前記認識辞書で認識する手段及び該認識
    した結果を格納する手段と、前記オライン文字データの
    認識結果と前記オフライン文字データの認識結果を用い
    て前記オンライン文字データ変換手段の変換パラメータ
    を修正する手段とを有することを特徴とする文字認識装
    置。
  8. 【請求項8】 前記変換パラメータを修正する手段は、
    前記オンライン文字データの認識結果が前記オフライン
    文字データの認識結果と一致するように、かつ、以前に
    認識させた文字に対する認識結果を生かすように、前記
    変換パラメータを修正することを特徴とする請求項7記
    載の文字認識装置。
  9. 【請求項9】 前記文字データを格納する手段は、手書
    き文字のオンラインデータとオフラインデータの対応関
    係を付けてカテゴリ別に格納することを特徴とする請求
    項7又は8記載の文字認識装置。
  10. 【請求項10】 前記オンライン入力手段及びオフライ
    ン入力手段は、筆記者から手書き文字データを採取する
    際、文字毎に、オンライン手書き文字データとオフライ
    ン手書き文字データをペアで入力し、ペアとなるオンラ
    イン手書き文字とオフライン手書き文字は書き順と画数
    は同じく、形は同じになるようなものであり、前記文字
    データを格納する手段は、手書き文字のオンラインデー
    タとオフラインデータの対応関係を付けてカテゴリ別に
    格納することを特徴とする請求項7又は8記載の文字認
    識装置。
  11. 【請求項11】 前記オンライン文字データ変換手段
    は、前記格納されたオンライン文字データベースとオフ
    ライン文字データベース中の対応している手書き文字デ
    ータを比較計算し、算出されたオンライン手書き文字デ
    ータからオフライン手書き文字データへの変換パラメー
    タを用いてオンライン手書き文字データをオフライン手
    書き文字データに変換することを特徴とする請求項7又
    は8記載の文字認識装置。
  12. 【請求項12】 デジタイザから手書き文字データを入
    力するオンライン入力ステップと、紙に書かれた手書き
    文字データを入力するオフライン入力ステップと、手書
    き文字の認識辞書を用いて入力された文字を認識するス
    テップと、該認識した結果を出力するステップとを有
    し、前記オンライン入力された手書き文字データと前記
    オフライン入力された手書き文字データとを比較計算
    し、オンライン入力された手書き文字データからオフラ
    イン入力された手書き文字データへの変換パラメータを
    算出する算出ステップとを有することを特徴とする文字
    認識方法。
  13. 【請求項13】 前記算出ステップは、前記オフライン
    手書き文字データから得た各ストロークの長さ及び各ス
    トローク上の各位置に対する線幅の統計値を算出し、該
    算出した統計値にしたがって、前記オンライン手書き文
    字データにおける各ストロークの長さに対応した前記変
    換パラメータを算出することを特徴とする請求項12記
    載の文字認識方法。
  14. 【請求項14】 前記算出ステップは、前記オフライン
    手書き文字データから得た各ストロークの長さ及び各ス
    トローク上の各位置に対する線幅の統計値を文字種毎に
    算出し、該算出した統計値にしたがって、文字種毎の前
    記オンライン手書き文字データにおける各ストロークの
    長さに対応した前記変換パラメータを算出することを特
    徴とする請求項12記載の文字認識方法。
  15. 【請求項15】 前記算出ステップは、前記オフライン
    手書き文字データから得た各ストロークの長さ及び各ス
    トローク上の各位置に対する線幅の統計値を各文字につ
    いて画毎に算出し、該算出した統計値にしたがって、各
    文字における画数毎の前記オンライン手書き文字データ
    における各ストロークの長さに対応した前記変換パラメ
    ータを算出することを特徴とする請求項12記載の文字
    認識方法。
  16. 【請求項16】 前記算出ステップで取得された変換パ
    ラメータを使用し、前記オンライン入力された手書き文
    字データを紙に書かれた文字データに近付けるようなフ
    ィルタリングを行うフィルタリングステップを有するこ
    とを特徴とする請求項12乃至15のいずれか1記載の
    文字認識方法。
  17. 【請求項17】 前記オンライン入力された手書き文字
    データに対し、前記フィルタリングステップを用いた方
    法で前処理してオフライン的な認識ステップに入力する
    ステップと、オフライン入力された手書き文字データに
    対し、直接にオフライン的な認識ステップに入力するス
    テップとを有し、入力された文字データに対し文字認識
    を行うことを特徴とする請求項16記載の文字認識方
    法。
  18. 【請求項18】 デジタイザから手書き文字データを入
    力するオンライン入力ステップと、紙に書かれた文字デ
    ータを入力するオフライン入力ステップと、前記オンラ
    イン入力された手書き文字データをオンライン文字デー
    タベースに格納するステップと、前記オフライン入力さ
    れた手書き文字データをオフライン文字データベースに
    格納するステップと、オフライン手書き文字のテンプレ
    ートを有する認識辞書を格納するステップと、オンライ
    ン手書き文字データを、オフライン手書き文字データに
    変換するオンライン文字データ変換ステップと、前記オ
    ンライン文字データベースの文字データを、前記オンラ
    イン文字データ変換ステップを用いてオフライン文字デ
    ータに変換し、変換後の文字データを前記認識辞書で認
    識するステップ及び該認識した結果を格納するステップ
    と、前記オフライン文字データベースの文字データを前
    記認識辞書で認識するステップ及び該認識した結果を格
    納するステップと、前記オンライン文字データの認識結
    果と前記オフライン文字データの認識結果を用いて前記
    オンライン文字データ変換ステップの変換パラメータを
    修正するステップとを有することを特徴とする文字認識
    方法。
  19. 【請求項19】 前記変換パラメータを修正するステッ
    プは、前記オンライン文字データの認識結果が前記オフ
    ライン文字データの認識結果と一致するように、かつ、
    以前に認識させた文字に対する認識結果を生かすよう
    に、前記変換パラメータを修正することを特徴とする請
    求項18記載の文字認識方法。
  20. 【請求項20】 前記文字データを格納するステップ
    は、手書き文字のオンラインデータとオフラインデータ
    の対応関係を付けてカテゴリ別に格納することを特徴と
    する請求項18又は19記載の文字認識方法。
  21. 【請求項21】 前記オンライン入力ステップ及びオフ
    ライン入力ステップは、筆記者から手書き文字データを
    採取する際、文字毎に、オンライン手書き文字データと
    オフライン手書き文字データをペアで入力し、ペアとな
    るオンライン手書き文字とオフライン手書き文字は書き
    順と画数は同じく、形は同じになるようなものであり、
    前記文字データを格納するステップは、手書き文字のオ
    ンラインデータとオフラインデータの対応関係を付けて
    カテゴリ別に格納することを特徴とする請求項18又は
    19記載の文字認識方法。
  22. 【請求項22】 前記オンライン文字データ変換ステッ
    プは、前記格納されたオンライン文字データベースとオ
    フライン文字データベース中の対応している手書き文字
    データを比較計算し、算出されたオンライン手書き文字
    データからオフライン手書き文字データへの変換パラメ
    ータを用いてオンライン手書き文字データをオフライン
    手書き文字データに変換することを特徴とする請求項1
    8又は19記載の文字認識方法。
  23. 【請求項23】 請求項1乃至11のいずれか1に記載
    の文字認識装置として機能させるためのプログラムを記
    録したコンピュータ読み取り可能な記録媒体。
  24. 【請求項24】 請求項12乃至22のいずれか1に記
    載の文字認識方法を実行するためのプログラムを記録し
    たコンピュータ読み取り可能な記録媒体。
JP2000064106A 2000-03-08 2000-03-08 文字認識装置、方法、及び記録媒体 Pending JP2001256436A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000064106A JP2001256436A (ja) 2000-03-08 2000-03-08 文字認識装置、方法、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000064106A JP2001256436A (ja) 2000-03-08 2000-03-08 文字認識装置、方法、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2001256436A true JP2001256436A (ja) 2001-09-21

Family

ID=18583860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000064106A Pending JP2001256436A (ja) 2000-03-08 2000-03-08 文字認識装置、方法、及び記録媒体

Country Status (1)

Country Link
JP (1) JP2001256436A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007509418A (ja) * 2003-10-24 2007-04-12 マイクロソフト コーポレーション 手書き認識をパーソナル化するシステムと方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007509418A (ja) * 2003-10-24 2007-04-12 マイクロソフト コーポレーション 手書き認識をパーソナル化するシステムと方法

Similar Documents

Publication Publication Date Title
JP2667954B2 (ja) 静的及び動的パラメータを使用する自動手書き文字認識装置及び方法
JP2749020B2 (ja) ダイアグラム認識システム
CN113901933B (zh) 基于人工智能的电子发票信息抽取方法、装置及设备
US6567548B2 (en) Handwriting recognition system and method using compound characters for improved recognition accuracy
CN113569677B (zh) 一种基于扫描件的纸质试验报告生成方法
JP2001256436A (ja) 文字認識装置、方法、及び記録媒体
CN114038000A (zh) 一种图像表格的结构化方法、系统和电子设备
Kumar et al. Size of training set vis-a-vis recognition accuracy of handwritten character recognition system
JPH05274481A (ja) 手書き認識の加速方法と装置
JPH06231308A (ja) 手書き文書処理方法および手書き文書処理装置
CN117894030B (zh) 一种校园智慧纸笔的文本识别方法及系统
Kankhar et al. Two-Pass Segmentation For Marathi Character Extraction
JP3221488B2 (ja) 検証機能付きオンライン文字認識装置
JPH1196302A (ja) 手書き文字認識装置
Perea et al. Syntactic modeling and recognition of document images
Bhuvaneswari et al. Recognition of ancient stone inscription characters using normalized positional distance metric features
CN113128603A (zh) 一种文本分类方法、装置、设备和存储介质
Huzaimi et al. An Enhanced Handwriting Recognition Tool for the Visually Impaired
JP4011859B2 (ja) 単語画像正規化装置,単語画像正規化プログラム記録媒体および単語画像正規化プログラム
JP2003099709A (ja) 誤読文字修正方法及び光学的文字認識装置
Rakate et al. Integrated approach to handwritten character recognition using ANN and it's implementation on ARM
JPH04293185A (ja) ファイリング装置
CN117275026A (zh) 基于卷积神经网络的对投资金额类表格识别方法
JPH11232381A (ja) 文字読取装置
Tiwari et al. A novel technique to read small and capital handwritten character