JP2004110529A - Handwritten character recognition system, handwritten character recognition program, and business form for electronic pen - Google Patents

Handwritten character recognition system, handwritten character recognition program, and business form for electronic pen Download PDF

Info

Publication number
JP2004110529A
JP2004110529A JP2002273485A JP2002273485A JP2004110529A JP 2004110529 A JP2004110529 A JP 2004110529A JP 2002273485 A JP2002273485 A JP 2002273485A JP 2002273485 A JP2002273485 A JP 2002273485A JP 2004110529 A JP2004110529 A JP 2004110529A
Authority
JP
Japan
Prior art keywords
character
data
electronic pen
character recognition
entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002273485A
Other languages
Japanese (ja)
Inventor
Hirosuke Sugihara
杉原 弘祐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2002273485A priority Critical patent/JP2004110529A/en
Publication of JP2004110529A publication Critical patent/JP2004110529A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a handwritten character recognition system for designing a business form without restriction by specification of character recognition software by using an electronic pen and a special business form. <P>SOLUTION: In this handwritten character recognition system, a user writes required matters in a character input area on the special business form with the electronic pen. The electronic pen generates entry data such as stroke data corresponding to the entered matters and supplies the same to a character recognizing device. In the character recognizing device, first the entered data is subjected to variable magnification processing, thereby adjusting the size of the entered data, and the adjusted entered data are supplied to a character recognition means. Thus, by the variable magnification processing, the size of the entered data is changed into the size to be accurately recognized by the character recognizing means, the character can be accurately recognized by the character recognizing means. Concurrently the size of the character input area provided on the business form should not be the size required by the character recognizing means, whereby the degree of freedom in designing the character input area on the business form can be heightened. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、電子ペンを利用して専用帳票に記入した事項に対応する記入データの文字認識処理に関する。
【0002】
【従来の技術】
従来、官公庁や金融機関その他に提出する申込書、申請書などの各種書類には利用者がボールペンなどを利用して必要事項を記入し、記入済みの書類を提出していた。提出された書類を電子データとして管理するためには、オペレータがその内容をキーボードなどを利用して入力し、電子化データとする必要があった。
【0003】
一方、手書きの文字を電子データ化する手法として、文字認識システム(OCRシステム)が知られている。OCRシステムでは、利用者がペンで帳票上に記入した手書き文字をスキャナなどの光学機器で読み取って電子データ化し、さらに文字認識ソフトウェアによりテキストデータに変換する処理を行う。利用者は、端末に接続されたキーボードからデータを入力するのではなく、使い慣れた紙とペンにより情報を記入するだけで、名前や住所など、帳票の後処理で必要な電子データを得ることができる。
【0004】
【発明が解決しようとする課題】
しかし、従来のOCRシステムは、「紙の上のどの部分に記入したストロークを手書き文字として認識するか」を定義した専用用紙(OCR帳票)を利用することが必要となる。また、現在の文字認識技術では、メモ書きのように大きさが一定でない一連の文字群をまとめて認識することが難しい。即ち、文字認識ソフトウェアは、一定のサイズの手書き文字データでなければ認識することができないため、専用用紙には1文字単位で記入枠が設けられているものが多い。この記入枠については、文字認識ソフトウェアが正しく文字として認識できるような色、太さ、サイズ、枠と枠の間隔、余白などの条件が予め細かく決められており、これが帳票のデザイン上の大きな制約となっていた。つまり、文字認識ソフトウェア側で要求するサイズなどの条件を満足するように帳票上に記入枠を配置しなければならず、帳票のデザイン上の自由度が制限される。また、文字認識ソフトウェアの能力上、ある程度のサイズの手書き文字でなければ認識精度が確保できないため、帳票上にある程度大きな記入枠を設けざるを得ない。このように、文字認識ソフトウェアの仕様を考慮して専用用紙の設計を行わなければならず、設計上の負荷も大きかった。
【0005】
本発明は、以上の点に鑑みてなされたものであり、入力手段として電子ペンを利用して電子帳票を作成する際に、文字認識ソフトウェアの仕様などによる制約を受けずに帳票を設計することを可能とすることを課題とする。
【0006】
【課題を解決するための手段】
本発明の1つの観点では、手書き文字認識システムは、電子ペンと、前記電子ペンにより認識可能に印刷されたドットパターンと、文字入力エリアを有する帳票と、利用者が前記電子ペンにより前記帳票上に記入した記入内容に対応する記入データに基づいて、前記記入内容に対応するテキストデータを生成する文字認識装置と、を備え、前記文字認識装置は、前記記入データに対して変倍処理を施して、文字認識可能な所定サイズの記入データを生成するサイズ調整手段と、前記所定サイズの記入データに基づいて文字認識処理を行い、前記テキストデータを生成する文字認識手段と、を備える。
【0007】
上記の手書き文字認識システムにおいては、利用者は専用の帳票上の文字入力エリアに電子ペンにより必要事項を記入する。電子ペンは、記入事項に対応するストロークデータなどの記入データを生成し、文字認識装置に供給する。文字認識装置においては、まず、記入データに対して変倍処理を行って、記入データのサイズを調整し、調整後の記入データを文字認識手段に供給する。変倍処理によって、記入データのサイズを文字認識手段による認識が正しく行えるサイズに変更することにより、文字認識手段により正しく認識が行われるようにする。これにより、帳票上に設ける文字入力エリアのサイズを文字認識手段が要求するサイズと一致させる必要が無くなり、帳票の設計、デザインの自由度が増す。
【0008】
上記の手書き文字認識システムの一態様では、前記記入データはストロークデータであり、前記文字認識装置は、前記記入データをベクトルデータに変換するデータ変換手段をさらに備える。記入データをベクトルデータに変換してからサイズ調整を行うことにより、サイズ調整によって記入データが不適切に変形して文字認識精度が低下することを防止することができる。
【0009】
上記の手書き文字認識システムの他の一態様では、前記記入データは、前記帳票上における前記記入内容の位置情報を含み、前記文字認識装置は、前記記入内容の位置情報に基づいて、前記記入データを1文字毎の記入データに分割する文字区切り手段をさらに備える。これにより、帳票上に記入された記入データを、1文字単位の記入データに分割し、文字認識手段に供給することができる。
【0010】
本発明の他の観点では、手書き文字認識プログラムは、コンピュータ上で実行することにより、前記コンピュータを、電子ペンと、前記電子ペンにより認識可能に印刷されたドットパターンと、文字入力エリアを有する帳票とを利用して利用者が前記電子ペンにより前記帳票上に記入した記入内容に対応する記入データを受信する記入データ受信手段、前記記入データに対して変倍処理を施して、文字認識可能な所定サイズの記入データを生成するサイズ調整手段、前記所定サイズの記入データに基づいて文字認識処理を行い、前記記入内容に対応するテキストデータを生成する文字認識手段、として機能させる。
【0011】
上記の手書き文字認識プログラムをコンピュータ上で実行することにより、前述の手書き文字認識システムを実現することができる。
【0012】
本発明のさらに他の観点では、インクペンユニット及び光学的にドットパターンを読み取る読取ユニットを備える電子ペンにより記入される電子ペン用帳票は、前記電子ペンにより認識可能に印刷され、前記帳票上における位置情報を示すドットパターンと、前記ドットパターン上に、文字入力エリアと、を有し、前記帳票上における位置情報により規定され、前記電子ペンにより記入された記入データに基づいて1文字としての認識を行う単位認識文字エリアを有し、前記単位認識文字エリアは前記文字入力エリアと同一であるか又は前記文字入力エリアより広い。これにより、利用者が文字入力エリアに対して記入した事項の記入データを、文字毎に区切ることができ、文字単位で後段の文字認識処理を行うことが可能となる。
【0013】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施の形態について説明する。
【0014】
[電子ペン]
まず始めに、電子ペンについて説明する。図1は電子ペンの使用形態を模式的に示す図であり、図2は電子ペンの構造を示す機能ブロック図である。図1に示すように、電子ペン10は、ドットパターンがプリントされた専用ペーパー20と組み合わせて使用される。電子ペン10は、通常のインクペンと同様のペン先部17を備えており、利用者は通常のインクペンと同様に専用ペーパー20上に文字などを書くことになる。
【0015】
図2に示すように、電子ペン10は、その内部にプロセッサ11、メモリ12、Bluetoothトランシーバ13、バッテリー14、赤外線LED15、カメラ16及び圧力センサ18を備える。また、電子ペン10は通常のインクペンと同様の構成要素としてインクカートリッジ(図示せず)などを有する。
【0016】
電子ペン10は、ペン先部17により専用ペーパー20上に描かれたインクの軌跡をデータ化するのではなく、専用ペーパー20上で電子ペン10が移動した軌跡座標をデータ化する。赤外線LED15が専用ぺーパー20上のペン先部17近傍を照明しつつ、カメラ16が専用ペーパー20にプリントされているドットパターンを読み取り、データ化する。つまり、電子ペン10は専用ペーパー20上で利用者が電子ペン10を移動させることにより生じるストロークを画像データ又はベクトルデータとして取得することができる。
【0017】
圧力センサ18は、利用者が電子ペン10により専用ペーパー上に文字などを書く際にペン先部17に与えられる圧力、即ち筆圧を検出し、プロセッサ11へ供給する。プロセッサ11は、圧力センサ18から与えられる筆圧データに基づいて、赤外線LED15及びカメラ16のスイッチオン/オフの切換を行う。即ち、利用者が電子ペン10で専用ペーパー20上に文字などを書くと、ペン先部17には筆圧がかかる。よって、所定値以上の筆圧が検出されたときに、利用者が記述を開始したと判定して、赤外線LED15及びカメラ16を作動する。
【0018】
カメラ16は専用ペーパー20上のドットパターンを読み取り、そのパターンデータをプロセッサ11に供給する。プロセッサ11は、供給されたドットパターンから、専用ペーパー20上でのX/Y座標を算出する。
【0019】
プロセッサ11は、利用者の記述が行われる間に、筆圧の配列データ及びX/Y座標データを取得し、タイムスタンプ(時間情報)と関連付けてメモリ12に記憶していく。よって、メモリ12内には利用者の記述内容に対応するデータが時系列で記憶されていく。メモリ12の容量は例えば1Mバイト程度とすることができる。
【0020】
利用者により送信指示がなされるまでは、取得された全てのデータはメモリ12内に保持される。そして、利用者が送信指示を行うと、Bluetoothトランシーバ13により、電子ペン10と所定距離内にある端末装置25へメモリ12内のデータが送信される。基本的には、一度送信指示がなされると、電子ペン10はメモリ12内に記憶していた全てのデータを端末装置25へ送信するため、メモリ12内はクリアされる。よって、送信後にもう一度同じ情報を端末装置25へ送信したい場合には、利用者は専用ペーパー20上に再度記述を行う必要がある。なお、この場合、利用者は専用ペーパー20上にインクペンで書かれた文字などをなぞればよいことになる。
【0021】
電子ペン10自体は、送信ボタンなどの機能ボタンを備えておらず、送信指示その他の指示は、利用者が専用ペーパー20上の所定位置に設けられた専用ボックスを電子ペン10でチェックすることにより実行される。専用ボックスの位置座標には、予め送信指示が対応付けられており、プロセッサ11は専用ボックスの位置座標を受信すると、Bluetoothトランシーバ13にメモリ12内のデータを供給し、端末装置25への送信を行わせる。なお、電子ペン10はディスプレイやボタンなどを持たないが、データの送信完了を電子ペンの振動により示すことができる。
【0022】
バッテリー14は電子ペン10内の各要素に電源供給するためのものであり、例えば電子ペンのキャップ(図示せず)により電子ペン10自体の電源のオン/オフを行うことができる。
【0023】
このように、電子ペン10は利用者が専用ペーパー20上に記述した文字などに対応する座標データ及び筆圧データを取得して近傍の端末装置25へ送信する機能を有するが、電子ペン10のペン先部17は通常のインクペンとなっているため、専用ペーパー20上に記述した内容はオリジナルの原本として残るという特徴がある。即ち、紙の原本に対して記述するのと同時に、その内容を座標データなどの形態でリアルタイムに電子化することができる。
【0024】
なお、電子ペン10の標準機能によれば、電子ペン10により得られるデータは、原則として座標データ又はベクトルデータの形態であり、テキストデータではない。但し、電子ペン10は標準機能として、専用ペーパー20上に設けられた専用エリアに記述することにより、英数字に限りテキスト化する機能は備えている。なお、端末装置25などにおいて、電子ペン10から送信された座標データやベクトルデータから、文字認識アプリケーションを利用してテキストデータを得ることはもちろん可能である。
【0025】
また、電子ペン10内には、ペン自体及びその所有者に関するプロパティ情報(ペン情報及びペン所有者情報)を保持することができ、アプリケーションから参照することができる。ペン情報としては、バッテリーレベル、ペンID、ペン製造者番号、ペンソフトウェアのバージョン、サブスクリプションプロバイダのIDなどを保持できる。また、ペン所有者情報としては、国籍、言語、タイムゾーン、emailアドレス、空きメモリ容量、名前、住所、ファックス/電話番号、携帯電話番号などを保持することができる。
【0026】
次に、電子ペンにより利用者が記述した内容のX/Yデータを取得する方法について説明する。前述のように専用ペーパー20には、所定のドットパターンが印刷されている。電子ペン10のカメラ16は、利用者が専用ペーパー20上に記述したインクの軌跡を読み取るのではなく、専用ペーパー20上のドットパターンを読み取る。実際、図1に示すように、赤外線LED15による照明領域及びカメラ16の撮影領域(照明領域内に位置する)は、ペン先部17が専用ペーパー20に接触する位置とはずれている。
【0027】
ドットパターンはカーボンを含む専用インキなどで印刷されており、カメラ16はその専用インキによるパターンのみを認識することができる。専用インキ以外のインキ(カーボンを含まない)により、専用ペーパー上に罫線や枠などを印刷しても、電子ペンはそれらを認識することはない。よって、専用ペーパーを利用して各種申請書などの帳票を作成する際は、専用インキ以外のインキで入力枠や罫線、注意書きなどを印刷する。
【0028】
ドットパターンは、図3に例示するように、各ドットの位置がデータに対応付けされている。図3の例では、ドットの位置を格子の基準位置(縦線及び横線の交差点)から上下左右にシフトすることにより、0〜3の2ビット情報を表示した例である。このようにして表現された情報の組み合わせにより、専用ペーパー上の位置座標が決定される。図4(a)に例示するように、縦横2mmの範囲内に36個のドットが格子状に配置され、これらのドットにより示されるデータの配列(図4(b))が、その専用ペーパー上の位置座標と対応付けされている。よって、電子ペン10のカメラ16が図4(a)に示すようなドットパターンを撮影すると、プロセッサ11はカメラ16から入力されるドットパターンのデータに基づいて図4(b)に示すデータ配列を取得し、それに対応する専用ペーパー上の位置座標(即ち、そのドットパターンがその専用ペーパー上のどの位置にあるのか)をリアルタイムで算出する。なお、ドットパターンを認識する最小単位は2mm×2mmであり、カメラ16は毎秒100回程度の撮影を行う。
【0029】
次に、専用ペーパーについて説明する。専用ペーパーの構造の一例を図5に示す。図示のように、専用ペーパー20は、台紙30上にドットパターン32が印刷され、その上に罫線などの図案34が印刷されている。台紙30は通常は紙であり、ドットパターン32は前述のようにカーボンを含んだ専用インキにより印刷される。また、通常のインキなどにより図案34が印刷される。ドットパターンと図案とは同時に印刷してもよいし、いずれかを先に印刷してもよい。
【0030】
図案34の例を図6に示す。図6は、ある申込書36の例であり、複数の記入欄38や送信ボックス39が印刷されている。図6には明確に図示されていないが、実際にはドットパターンが申込書36の全面に印刷されており、その上に記入欄38や送信ボックス39が通常のインキにより印刷されている。利用者は、ドットパターンを意識することなく、従来からある申込書と同様に、電子ペン10を使用して必要事項を申込書36の各記入欄38に記入すればよい。
【0031】
専用ペーパー20上の領域は大きく2種類の領域に分けることができる。1つは記入エリアであり、電子ペン10による記述内容をそのまま情報として取り扱うエリアである。図6の例では複数の記入欄38がこれに該当する。もう1つは機能エレメントであり、対応するエリア内を電子ペン10でチェックした際に、予めそのエリアに対して定義されているアクション、指示などを実行するようになっている。図6の例における送信ボックス39がこれに該当する。
【0032】
送信ボックス39は前述したように電子ペン10内に記憶されているデータを近傍の端末装置25へ送信するための指示を行う際に使用される。利用者が送信ボックス39内に電子ペン10でチェックを入れると、電子ペン10が送信ボックス内のドットパターンを読み取る。当該パターンは送信指示に対応付けられており、電子ペン10内のプロセッサ11はBluetoothトランシーバ13にメモリ12内の記憶データの送信命令を発する。
【0033】
ドットパターンの割り当ては、通常、アプリケーション(用紙の種類)毎に行われる。即ち、ある申込書内のドットパターンは1枚の用紙の中で重複することはないが、同一の申込書には全て同じドットパターンが印刷されている。よって、利用者が電子ペン10で必要事項を入力すると、その入力事項がその申込書のどの項目に対するものであるかを、申込書上の座標データから特定することができる。
【0034】
このように、ドットパターンを印刷した専用ペーパー上に所定の図案を印刷することにより、専用ペーパーを利用した各種申請書が作成できる。利用者は電子ペン10を使用して通常の要領で必要事項を記入すれば、その電子データが自動的に取得される。
【0035】
上記の例では、ドットパターンは専用ペーパー上にカーボンを含むインキにより印刷されているが、プリンタ及びカーボンを含むインクを使用してドットパターンを通常の紙上にプリントすることも可能である。さらに、専用ペーパー上の図案も印刷ではなく、プリンタにより形成することも可能である。ドットパターンをプリンタにより紙上に形成する場合には、1枚1枚に異なるドットパターンを形成することが可能である。よって、形成されたドットパターンの違いにより、それらの用紙1枚1枚を識別し、区別することが可能となる。
【0036】
なお、本明細書においては、「印刷」の語は、通常の印刷のみならず、プリンタによるプリントも含む概念とする。
【0037】
次に、電子ペンにより取得したデータの送信処理について説明する。前述のように、電子ペン10の通信機能はBluetoothによるものであり、専用ペーパー20に入力したデータを取り扱うサービスサーバ(特定の申込書であれば、その申込先のサーバということになる)に対して電子ペン10から直接的にデータを送信することはできない。よって、電子ペン10により取得したデータは、端末装置25からサービスサーバへ送信される。
【0038】
その際の処理を図2を参照して説明する。電子ペン10が取得したデータは、主として利用者が入力した事項のデータであるが、通常はそのデータの送信先であるサービスサーバがどこであるかの情報は含まれていない。その代わりに、その専用ペーパーに関するアプリケーションやサービスを特定する情報が専用ペーパー上のドットパターンに含まれており、利用者の入力作業中に専用ペーパーからその情報が取得されている。よって、電子ペン10から入力データを受け取った端末装置25は、まず、問い合わせサーバ26に対して、その専用ペーパーに対して入力されたデータをどのサービスサーバ27へ送信すべきかの問い合わせを行う。問い合わせサーバ26は、専用ペーパー毎に、対応するサービスサーバの情報を有しており、端末装置25からの問い合わせに応じて、当該専用ペーパーに関するサービスなどを行うサービスサーバ27の情報(URLなど)を端末装置25へ回答する。それから、端末装置25は、電子ペンから取得した入力データをそのサービスサーバ27へ送信することになる。
【0039】
なお、上記の例では端末装置25、問い合わせサーバ26及びサービスサーバ27が別個に構成されているが、これらの幾つか又は全てを1つの装置として構成することも可能である。
【0040】
[手続システムの構成]
次に、本発明の手書き文字認識システムの実施形態として、専用ペーパーにより作成された申込書に対して利用者が電子ペンを利用して必要事項を記入し、記入データをサーバにて受け付けるという一連の手続を行うための手続システムについて説明する。
【0041】
図7に、電子ペンを利用した手続システムの概略構成を示す。利用者は前述の電子ペン10を使用して、帳票(本例では、ある申込書とする)4に対して入力を行う。帳票4は、図5及び6を参照して説明した専用ペーパーにより作られている。帳票4に対して記入された内容は、電子ペン10によりストロークデータとして取得され、Bluetooth通信により端末装置25へ送信される。以下、電子ペン10が出力するストロークデータを「記入データ」とも呼ぶ。記入データは端末装置25からネットワーク2を介して、サーバ3へ送信される。サーバ3は、利用者が作成した申込書による申込手続を受け付けるサーバであり、申込内容などを記録した申込データなどを保管するためのデータベース8を備えている。
【0042】
上記の手続システムを利用する手続の概要について説明すると、まず、利用者は電子ペン10を用いて、専用ペーパーからなる帳票4に必要事項を記入する。ここで、帳票4は後述するように本発明の手書き文字認識システムに対応した構成を有している。利用者が電子ペン10を利用して帳票に対して必要事項を記入すると、それに対応するストロークデータ(座標データの集合)が記入データとして電子ペン10から端末装置25へ送信され、端末装置25はそのストロークデータをサーバ3へ送信する。サーバ3は、受信した記入データに対して文字認識処理を行って、利用者が帳票4に記入した記入内容のテキストデータを取得する。そして、サーバ3は、記入内容のテキストデータを、その帳票4に対応する電子フォームに埋め込むなどして電子帳票として必要な処理を行う。
【0043】
[専用帳票の構成]
次に、帳票4の構成について説明する。図8(a)に、本発明の手書き文字認識システムの専用帳票の構成を模式的に示す。まず、図8(a)に示す帳票4は、先に図5を参照して説明した専用ペーパーとして構成されている。即ち、台紙30上に、電子ペン10が認識可能なインキにより所定のドットパターン32が印刷され、さらに電子ペン10が認識不能なインキにより帳票としての図案34が印刷されている。
【0044】
図8(a)は、図案34の例を示す。図8(a)に示す帳票4は特定の申込書の例であり、記入事項として氏名欄を含む。氏名欄には、利用者が自己の氏名を1文字ずつ記入するための文字入力エリア41が設けられている。ここで、文字入力エリア41は、帳票の図案34の一部であり、電子ペン10が認識不能なインキにより印刷されている。
【0045】
また、帳票4においては、単位認識文字エリア42が規定されている。単位認識文字エリア42は、利用者が記入した一連の文字列を1文字毎の単位に区切るために規定される。即ち、サーバ3による文字認識処理においては、単位認識文字エリア42内に記入されたストロークから構成されるストロークデータの集合を1文字のストロークデータであると判断する。
【0046】
単位文字認識エリア42は、実際には帳票4上における座標として規定されている。例えば、図8(a)における氏名の1文字目の単位認識文字エリア42aは、帳票42上の座標(x1,y1)〜(x2,y2)、2文字目の単位認識文字エリア42bは帳票42上の座標(x3,y3)〜(x4,y4)という具合に予め帳票4上の位置として規定されている。なお、このような、各文字と、それに対応する帳票4上の位置情報との対応関係は、後述する文字エリア位置情報56としてサーバ3内に記憶されている。単位認識文字エリア42は、実際には利用者には見えないのであるが、説明の便宜上、帳票4上の対応する各位置に波線で単位認識文字エリア42を示している。
【0047】
図8(a)においては、人間に見える文字入力エリア41と、帳票4の位置情報により規定されている(人間には見えない)単位認識文字エリア42とがほぼ一致している。即ち、利用者が文字入力エリア41を見て、その内側に文字を記入すると、その文字入力エリア41とほぼ等しい単位認識文字エリア42内に記入されたストロークのデータを電子ペン10が取得し、文字認識処理の対象とする。
【0048】
一方、図8(b)の例では、人間に見える文字入力エリア41に対して、単位認識文字エリア42を大きく設定している。こうすることにより、利用者が文字入力エリア41から多少はみ出して文字を記入した場合でも、それが単位認識文字エリア42内であれば、利用者の記入したストロークデータを欠落なく取得することが可能となる。なお、利用者が、電子ペン10により文字入力エリア41の枠に重なったり、枠からはみ出して文字を記入したとしても、電子ペン10は文字入力エリア41を認識しないので文字入力エリア41の枠が邪魔になることはなく、正しく記入文字のストロークデータを取得することができる。
【0049】
なお、図8に示す例では、文字入力エリア41はほぼ正方形の枠として構成しているが、文字入力エリア41を例えば下線、括弧、などの形態で帳票上に印刷しても構わない。また、帳票4上において、文字入力エリア41を他のエリアと色を変えて印刷することにより帳票上に示してもよい。
【0050】
[文字認識システムの機能]
次に、本発明による文字認識システムの機能構成を図9を参照して説明する。図9において、利用者による記入データを電子ペン10から受信する端末装置25は、記入データ送受信機能25aを有する。記入データ送受信機能25aは、電子ペン10から記入データ(ストロークデータ)をBluetooth通信により受信し、さらにそれをネットワーク2を介してサーバ3へ送信する機能である。なお、ストロークデータ送受信機能25aは、予め用意されたプログラムを端末装置25が実行することにより実現される。
【0051】
一方、サーバ3は、本発明による文字認識システムとして必要な機能構成要素として、データ受信機能51、文字区切り機能52、データ変換機能53、サイズ調整機能54及び文字認識機能55を備える。なお、これら各機能は、サーバ3が予め用意されたプログラムを実行することにより実現される。また、サーバ3は、文字エリア位置情報56を記憶している。
【0052】
データ受信機能51は、ネットワーク2などを通じて端末装置25から送信される記入データ(ストロークデータ)を受信する。
【0053】
文字区切り機能52は、データ受信機能51により受信した記入データを、1文字毎の記入データの単位に分割する。データ受信機能51が受信した時点では、記入データは複数文字分の記入データ(ストロークデータ)の集合となっている。従って、文字区切り機能52は、複数文字分の記入データから、1文字毎の記入データを分割して、文字認識可能な状態とする。
【0054】
先に図8を参照して述べたように、帳票4には、帳票4上の位置情報により単位認識文字エリア42が規定されており、1つの単位認識文字エリア42内に記入されたストロークの集合が1文字分のストロークデータである。帳票4上に印刷された各文字入力エリア41に対応する単位認識文字エリア42を示す位置情報(座標データなど)は、文字エリア位置情報56としてサーバ3内に記憶されている。帳票4上には、前述のようにドットパターン32が印刷されており、1枚の帳票上ではドットパターンは重複しないので、ドットパターンを認識することにより、文字区切り機能52は、帳票4上における位置情報を取得することができる。よって、文字区切り機能52は、まず、データ受信機能51が受信した記入データ(ストロークデータ)から、各ストロークデータの位置情報を取得し、次に文字エリア位置情報56を参照して、各ストロークデータを1文字分のストロークデータの集合に分割する。これにより、1文字単位のストロークデータが生成される。
【0055】
データ変換機能53は、ストロークデータをベクトルデータに変換する機能である。電子ペン10から得られるストロークデータは座標データの集合であり、その座標データをイメージデータに変換して後述のサイズ調整処理によって拡大、縮小などを行うと文字認識精度が落ちてしまう可能性が高い。よって、データ変換機能53は、1文字毎の単位に区切られたストロークデータを、それぞれベクトルデータに変換する。
【0056】
サイズ調整機能54は、データ変換機能53により得られた1文字毎のベクトルデータを、所定の倍率で変倍する。ここで、変倍とは、拡大、縮小及び1倍の変倍(即ち、同一サイズの維持)を含む。変倍処理の倍率は、文字認識機能55が要求する文字サイズに従って決まる。即ち、帳票4に対する記入データから得られた1文字毎のストロークデータのサイズは、帳票4上の文字入力エリア41のサイズに依存している。これは、利用者が帳票4上の文字入力エリア41内に収まるように文字を記入するからである。一方、文字認識機能55により文字認識可能なサイズは、予め決まっている。よって、サイズ調整機能54は、帳票4上の文字入力エリア41のサイズに応じて入力されたストロークデータを、文字認識機能55により文字認識が可能なサイズに変換する処理を行う。例えば、文字認識機能55により文字認識処理が可能なサイズの1/2のサイズで帳票4上の文字入力エリア41が設けられている場合、サイズ調整機能54は1文字毎のストロークデータのサイズを2倍にする処理を行う。
【0057】
このように、本発明ではサイズ調整機能54を利用することにより、文字認識機能55が文字認識可能なサイズにとらわれることなく、帳票4上の文字入力エリア41のサイズを決定することが可能となる。一般的には、文字認識機能55として使用する文字認識エンジンが要求する文字のサイズは、ある程度の認識精度を確保するために比較的大きく設定されている。よって、そのままのサイズで帳票4上に文字入力エリア41を設けると、帳票4上の専有面積は大きくなり、多数の記入欄や情報を帳票4上に設けることが難しくなる。この点、本発明によれば、帳票4上に設ける文字入力エリア41のサイズを小さくしても、サイズ調整機能54により必要な倍率で拡大処理を行って文字認識機能55が要求する文字サイズに変換した上で文字認識処理を行えばよい。よって、帳票4上に形成する文字入力エリア41のサイズに制約が無くなり、帳票のデザイン上の自由度が増加する。
【0058】
なお、このようにサイズ調整機能54によるサイズ調整を正しく行うためには、その前処理として、データ変換機能53によりストロークデータがベクトルデータに変換されていることが好ましい。これは、ストロークデータをイメージ化してサイズ調整(特に拡大処理)を行うと、各ドットがそのまま拡大されて文字が変形し(例えば、斜線や曲線などがギザギザになるなど)文字認識率が低下することがあるからである。その点、ベクトルデータに変換した後で拡大などの変倍処理を行えば、そのような不具合は生じない。
【0059】
こうして、サイズ調整機能54によりサイズ調整がなされた1文字毎のベクトルデータは、文字認識機能55により文字認識処理が施され、テキストデータとして出力される。
【0060】
[文字認識処理]
次に、サーバ3を含む手続システムにより実行される文字認識処理の流れについて説明する。図10は文字認識処理のフローチャートである。図10において、まず、利用者は電子ペン10と帳票4を使用して、申込に必要な事項を帳票4上に記入する。
【0061】
利用者は、必要事項の記入を完了すると、帳票4の送信ボックスをチェックし、端末装置25を介して記入データをサーバ3へ送信する(ステップS2)。つまり、利用者が帳票4の送信チェックボックスをチェックすると、その時点で電子ペン10のメモリ12に蓄積されていたストロークデータが、1枚の帳票4に対する記入データとして端末装置25へ送信される。端末装置25は、この記入データを、ネットワーク2を介してサーバ3へ送信する。
【0062】
サーバ3は、記入データを端末装置25から受信すると(ステップS3)、まず文字区切り機能52により、複数の文字分の記入データを1文字毎のストロークデータに区切る(ステップS4)。次に、データ変換機能53は、1文字毎のストロークデータをベクトルデータに変換する(ステップS5)。
【0063】
次に、サイズ調整機能54は、ステップS5で生成されたベクトルデータに変倍処理を施し、文字認識機能55により文字認識処理が可能なサイズに変換する(ステップS6)。そして、文字認識機能55は、文字認識処理を行い、テキストデータを出力する(ステップS7)。こうして、利用者が帳票4上の記入欄などに記入した内容に対応するテキストデータが得られる。
【0064】
その後、サーバ34は、必要に応じて、ステップS7で得られたテキストデータを、帳票4に対応する電子フォームに読み込み、電子帳票として所定の処理を実行する(ステップS8)。
【0065】
[変形例]
上記の例では、図10に示すように、端末装置25から受信した記入データを、文字区切り処理により1文字毎のストロークデータに分割してから、データ変換処理、サイズ調整処理などを経て文字認識処理している。しかし、最近の文字認識エンジンなどでは、1文字毎に区切る機能を併せ持つものもある。即ち、文字認識エンジンに対して、文字列のデータを入力しても、文字認識エンジン側で文字認識処理に加えて文字毎に区切る処理を行い、文字列に対応するテキストデータを出力するものもある。そのような文字認識エンジンなどを採用する場合には、ステップS10における文字区切り処理を省略することができる。
【0066】
また、上記の実施形態では、記入データを文字認識するための各機能、即ち、文字区切り機能52、データ変換機能53、サイズ調整機能54及び文字認識機能55をサーバ3に設けた例であったが、これらの機能を端末装置25内に設けることもできる。その場合には、端末装置25は、文字認識処理により取得したテキストデータをサーバ3へ送信することができる。また、電子ペン10内の記憶容量やプロセッサの能力が許せば、上記の各機能を電子ペン10内に設けることも可能である。
【0067】
【発明の効果】
以上説明したように、本発明の文字認識システムによれば、電子ペンを使用して記入した記入データを、文字認識プログラムが要求するサイズに調整してから文字認識プログラムに入力する。よって、帳票上に設ける文字入力欄のサイズは、文字認識プログラムが要求するサイズによる影響を受けなくなる。また、電子ペンを利用することにより、帳票上のデザインに影響されずに記入事項の座標データを取得することができるので、帳票上に設ける文字入力エリアの色、サイズ、枠の太さなどに制約が生じない。これにより、帳票設計、デザイン上の自由度が増す。
【0068】
また、電子ペンにより利用者が記入を行うと、同時に記入データが取得できるので、従来のOCRシステムのように利用者が記入したOCR用紙を物理的に収集する必要がない。よって、帳票を利用する処理の迅速化、効率化が可能となる。
【図面の簡単な説明】
【図1】電子ペンの使用形態を模式的に示す図である。
【図2】電子ペンの構造を示す機能ブロック図である
【図3】専用ペーパーにプリントされたドットパターンによる情報の表現方法を説明する図である。
【図4】ドットパターン及びそれに対応する情報の例を示す。
【図5】専用ペーパーにより構成される帳票の構造を示す。
【図6】帳票の例を示す。
【図7】本発明の手書き文字認識システムを適用した手続システムの概略構成を示す図である。
【図8】図7に示す手続システムで使用される帳票の例を示す。
【図9】本発明の手書き文字認識システムを適用した手続システムの機能構成を示す図である。
【図10】本発明の手書き文字認識システムを利用した手続のフローチャートである。
【符号の説明】
2 ネットワーク
3 受付サーバ
4 申込書
8 データベース
10 電子ペン
11 プロセッサ
12 メモリ
13 トランシーバ
14 バッテリー
15 LED
16 カメラ
17 ペン先部
20 専用ペーパー
25 端末装置
51 データ受信機能
52 文字区切り機能
53 データ変換機能
54 サイズ調整機能
55 文字認識機能
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to character recognition processing of entry data corresponding to items entered in a dedicated form using an electronic pen.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, a user has to fill in various required documents, such as application forms and application forms, to be submitted to government agencies, financial institutions, and the like using a ball-point pen or the like, and submit the completed documents. In order to manage the submitted documents as electronic data, it is necessary for an operator to input the contents using a keyboard or the like and to make the data electronic.
[0003]
On the other hand, a character recognition system (OCR system) is known as a technique for converting handwritten characters into electronic data. In the OCR system, a handwritten character written on a form by a user with a pen is read by an optical device such as a scanner, converted into electronic data, and further converted into text data by character recognition software. Users can obtain necessary electronic data in post-processing of forms, such as names and addresses, simply by entering information with a familiar paper and pen, instead of entering data from a keyboard connected to the terminal. it can.
[0004]
[Problems to be solved by the invention]
However, in the conventional OCR system, it is necessary to use a special paper (OCR form) which defines "where on the paper the stroke written should be recognized as a handwritten character". Further, with current character recognition technology, it is difficult to collectively recognize a series of character groups having a non-uniform size such as a memo. In other words, since character recognition software can only recognize handwritten character data of a certain size, the dedicated paper is often provided with an entry frame for each character. With regard to this entry frame, conditions such as color, thickness, size, spacing between frames, margins, etc., which character recognition software can correctly recognize as characters, are predetermined in advance, which is a major constraint on form design. It was. That is, it is necessary to arrange the entry frames on the form so as to satisfy the conditions such as the size required by the character recognition software, and the degree of freedom in designing the form is limited. In addition, due to the capability of the character recognition software, recognition accuracy cannot be ensured unless handwritten characters of a certain size are used. As described above, the special paper must be designed in consideration of the specifications of the character recognition software, and the design load is large.
[0005]
The present invention has been made in view of the above points, and when creating an electronic form using an electronic pen as an input means, designing the form without being restricted by the specifications of character recognition software and the like. The task is to make it possible.
[0006]
[Means for Solving the Problems]
In one aspect of the present invention, a handwritten character recognition system includes an electronic pen, a dot pattern printed so as to be recognizable by the electronic pen, a form having a character input area, and a user using the electronic pen on the form. A character recognizing device that generates text data corresponding to the entry content based on the entry data corresponding to the entry content entered in the character recognition device, wherein the character recognition device performs a scaling process on the entry data. And a character recognizing means for performing character recognition processing based on the predetermined-size entry data to generate the text data.
[0007]
In the above-described handwritten character recognition system, a user enters necessary items in a character input area on a dedicated form using an electronic pen. The electronic pen generates entry data such as stroke data corresponding to the entry and supplies the entry data to the character recognition device. In the character recognition device, first, a scaling process is performed on the entry data to adjust the size of the entry data, and the adjusted entry data is supplied to the character recognition unit. By changing the size of the entry data to a size that can be correctly recognized by the character recognizing means by the scaling process, the character recognizing means performs the correct recognition. This eliminates the need to match the size of the character input area provided on the form with the size required by the character recognition means, and increases the degree of freedom in designing and designing the form.
[0008]
In one aspect of the above handwritten character recognition system, the entry data is stroke data, and the character recognition device further includes data conversion means for converting the entry data into vector data. By performing the size adjustment after converting the entry data into the vector data, it is possible to prevent the entry data from being inappropriately deformed due to the size adjustment and to reduce the character recognition accuracy.
[0009]
In another aspect of the above handwritten character recognition system, the entry data includes position information of the entry on the form, the character recognition device, based on the position information of the entry, the entry data Is further provided with a character delimiter for dividing the data into entry data for each character. Thus, the entry data entered on the form can be divided into entry data in units of one character and supplied to the character recognition means.
[0010]
According to another aspect of the present invention, a handwritten character recognition program is executed on a computer so that the computer has an electronic pen, a dot pattern printed recognizable by the electronic pen, and a form having a character input area. Entry data receiving means for receiving entry data corresponding to the entry contents entered on the form by the user with the electronic pen using the electronic pen, performing magnification processing on the entry data to enable character recognition A size adjusting unit that generates entry data of a predetermined size, and a character recognition unit that performs character recognition processing based on the entry data of the predetermined size and generates text data corresponding to the entry content.
[0011]
By executing the above-described handwritten character recognition program on a computer, the above-described handwritten character recognition system can be realized.
[0012]
In still another aspect of the present invention, a form for an electronic pen written by an electronic pen including an ink pen unit and a reading unit that optically reads a dot pattern is printed so as to be recognizable by the electronic pen, and is positioned on the form. It has a dot pattern indicating information, and a character input area on the dot pattern, is defined by position information on the form, and recognizes one character based on entry data entered by the electronic pen. The unit recognition character area is the same as or larger than the character input area. As a result, the entry data of the items entered by the user in the character input area can be separated for each character, and the subsequent character recognition processing can be performed for each character.
[0013]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, preferred embodiments of the present invention will be described with reference to the drawings.
[0014]
[Electronic pen]
First, the electronic pen will be described. FIG. 1 is a diagram schematically showing a usage form of the electronic pen, and FIG. 2 is a functional block diagram showing a structure of the electronic pen. As shown in FIG. 1, the electronic pen 10 is used in combination with a special paper 20 on which a dot pattern is printed. The electronic pen 10 has a pen tip 17 similar to a normal ink pen, and a user writes characters and the like on the special paper 20 in the same manner as a normal ink pen.
[0015]
As shown in FIG. 2, the electronic pen 10 includes a processor 11, a memory 12, a Bluetooth transceiver 13, a battery 14, an infrared LED 15, a camera 16, and a pressure sensor 18 therein. The electronic pen 10 has an ink cartridge (not shown) as a component similar to a normal ink pen.
[0016]
The electronic pen 10 does not convert the locus of the ink drawn on the special paper 20 by the pen tip portion 17 into data, but converts the locus coordinates of the movement of the electronic pen 10 on the special paper 20 into data. While the infrared LED 15 illuminates the vicinity of the pen tip 17 on the dedicated paper 20, the camera 16 reads the dot pattern printed on the dedicated paper 20 and converts it into data. That is, the electronic pen 10 can acquire, as image data or vector data, a stroke generated when the user moves the electronic pen 10 on the special paper 20.
[0017]
The pressure sensor 18 detects the pressure applied to the pen tip portion 17 when the user writes a character or the like on the special paper with the electronic pen 10, that is, the pen pressure, and supplies the detected pressure to the processor 11. The processor 11 switches on / off the infrared LED 15 and the camera 16 based on the pen pressure data provided from the pressure sensor 18. That is, when a user writes a character or the like on the dedicated paper 20 with the electronic pen 10, pen pressure is applied to the pen tip portion 17. Therefore, when the writing pressure equal to or more than the predetermined value is detected, it is determined that the user has started the description, and the infrared LED 15 and the camera 16 are operated.
[0018]
The camera 16 reads the dot pattern on the special paper 20 and supplies the pattern data to the processor 11. The processor 11 calculates X / Y coordinates on the dedicated paper 20 from the supplied dot pattern.
[0019]
The processor 11 acquires the pen pressure array data and the X / Y coordinate data while the user is being described, and stores them in the memory 12 in association with the time stamp (time information). Therefore, data corresponding to the description content of the user is stored in the memory 12 in chronological order. The capacity of the memory 12 can be, for example, about 1 Mbyte.
[0020]
All acquired data is held in the memory 12 until a transmission instruction is issued by the user. When the user gives a transmission instruction, the data in the memory 12 is transmitted by the Bluetooth transceiver 13 to the terminal device 25 located within a predetermined distance from the electronic pen 10. Basically, once a transmission instruction is given, the electronic pen 10 transmits all data stored in the memory 12 to the terminal device 25, so that the memory 12 is cleared. Therefore, when the user wants to transmit the same information to the terminal device 25 again after the transmission, the user needs to write the information on the special paper 20 again. In this case, the user only has to trace characters written with the ink pen on the dedicated paper 20.
[0021]
The electronic pen 10 itself does not have a function button such as a transmission button, and a transmission instruction and other instructions are provided by a user checking a special box provided at a predetermined position on the special paper 20 with the electronic pen 10. Be executed. A transmission instruction is previously associated with the position coordinates of the dedicated box. When the processor 11 receives the position coordinates of the dedicated box, the processor 11 supplies the data in the memory 12 to the Bluetooth transceiver 13 and transmits the data to the terminal device 25. Let it do. Note that the electronic pen 10 does not have a display, buttons, or the like, but the completion of data transmission can be indicated by vibration of the electronic pen.
[0022]
The battery 14 is for supplying power to each element in the electronic pen 10, and for example, the power of the electronic pen 10 itself can be turned on / off by a cap (not shown) of the electronic pen.
[0023]
As described above, the electronic pen 10 has a function of acquiring coordinate data and writing pressure data corresponding to characters written on the dedicated paper 20 by the user and transmitting the data to the nearby terminal device 25. Since the pen tip portion 17 is a normal ink pen, the contents described on the special paper 20 remain as original originals. That is, at the same time as describing the original paper, the contents can be digitized in real time in the form of coordinate data or the like.
[0024]
According to the standard functions of the electronic pen 10, the data obtained by the electronic pen 10 is in principle in the form of coordinate data or vector data, not text data. However, the electronic pen 10 has a function of converting only alphanumeric characters into text by describing it in a dedicated area provided on the dedicated paper 20 as a standard function. In the terminal device 25 and the like, it is of course possible to obtain text data from the coordinate data and vector data transmitted from the electronic pen 10 using a character recognition application.
[0025]
The electronic pen 10 can hold property information (pen information and pen owner information) on the pen itself and its owner, and can be referred to from an application. As the pen information, a battery level, a pen ID, a pen manufacturer number, a pen software version, a subscription provider ID, and the like can be held. The pen owner information can include a nationality, a language, a time zone, an email address, a free memory capacity, a name, an address, a fax / telephone number, a mobile phone number, and the like.
[0026]
Next, a method of acquiring X / Y data of the content described by the user using the electronic pen will be described. As described above, a predetermined dot pattern is printed on the dedicated paper 20. The camera 16 of the electronic pen 10 reads a dot pattern on the special paper 20 instead of reading a locus of ink written on the special paper 20 by the user. Actually, as shown in FIG. 1, the illumination area by the infrared LED 15 and the imaging area of the camera 16 (located in the illumination area) are shifted from the position where the pen tip 17 contacts the special paper 20.
[0027]
The dot pattern is printed with a special ink containing carbon or the like, and the camera 16 can recognize only the pattern using the special ink. Even when the ruled lines and frames are printed on the special paper with an ink (not including carbon) other than the special ink, the electronic pen does not recognize them. Therefore, when creating forms such as various application forms using the special paper, input frames, ruled lines, notes, and the like are printed with ink other than the special ink.
[0028]
In the dot pattern, as illustrated in FIG. 3, the position of each dot is associated with data. In the example of FIG. 3, two-bit information of 0 to 3 is displayed by shifting the position of the dot vertically and horizontally from the grid reference position (the intersection of the vertical line and the horizontal line). The position coordinates on the dedicated paper are determined by the combination of the information thus expressed. As illustrated in FIG. 4A, 36 dots are arranged in a grid within a range of 2 mm in length and width, and an array of data indicated by these dots (FIG. 4B) is printed on the dedicated paper. Are associated with the position coordinates. Therefore, when the camera 16 of the electronic pen 10 captures a dot pattern as shown in FIG. 4A, the processor 11 changes the data array shown in FIG. The acquired position coordinates on the dedicated paper (that is, the position of the dot pattern on the dedicated paper) corresponding thereto are calculated in real time. Note that the minimum unit for recognizing the dot pattern is 2 mm × 2 mm, and the camera 16 shoots about 100 times per second.
[0029]
Next, the special paper will be described. FIG. 5 shows an example of the structure of the special paper. As shown in the drawing, the special paper 20 has a dot pattern 32 printed on a backing sheet 30, and a pattern 34 such as a ruled line printed thereon. The backing paper 30 is usually paper, and the dot pattern 32 is printed with a special ink containing carbon as described above. In addition, the design 34 is printed with ordinary ink or the like. The dot pattern and the design may be printed at the same time, or one of them may be printed first.
[0030]
An example of the design 34 is shown in FIG. FIG. 6 shows an example of a certain application form 36 in which a plurality of entry fields 38 and a transmission box 39 are printed. Although not clearly shown in FIG. 6, a dot pattern is actually printed on the entire surface of the application form 36, and an entry field 38 and a transmission box 39 are printed thereon with ordinary ink. The user may use the electronic pen 10 to fill in the required items in the entry fields 38 of the application form 36 in the same manner as a conventional application form, without being conscious of the dot pattern.
[0031]
The area on the special paper 20 can be roughly divided into two types of areas. One is an entry area, in which the contents described by the electronic pen 10 are directly handled as information. In the example of FIG. 6, a plurality of entry fields 38 correspond to this. The other is a functional element, which executes an action, an instruction, and the like defined in advance for the area when the corresponding area is checked with the electronic pen 10. The transmission box 39 in the example of FIG. 6 corresponds to this.
[0032]
The transmission box 39 is used when giving an instruction to transmit data stored in the electronic pen 10 to the nearby terminal device 25 as described above. When the user checks the transmission box 39 with the electronic pen 10, the electronic pen 10 reads the dot pattern in the transmission box. The pattern is associated with the transmission instruction, and the processor 11 in the electronic pen 10 issues a transmission command of the data stored in the memory 12 to the Bluetooth transceiver 13.
[0033]
The assignment of the dot pattern is usually performed for each application (type of paper). That is, the dot patterns in a certain application do not overlap in one sheet, but the same application is printed with the same dot pattern. Therefore, when the user inputs necessary items with the electronic pen 10, it is possible to specify which item of the application is for the input item from the coordinate data on the application.
[0034]
As described above, by printing a predetermined design on the special paper on which the dot pattern is printed, various applications using the special paper can be created. If the user uses the electronic pen 10 to fill in the necessary items in the usual manner, the electronic data is automatically obtained.
[0035]
In the above example, the dot pattern is printed on the dedicated paper with ink containing carbon, but it is also possible to print the dot pattern on ordinary paper using a printer and ink containing carbon. Further, the design on the special paper can be formed not by printing but by a printer. When dot patterns are formed on paper by a printer, different dot patterns can be formed on each sheet. Therefore, it is possible to identify and discriminate these sheets one by one based on the difference between the formed dot patterns.
[0036]
In the present specification, the term “print” is a concept that includes not only normal printing but also printing by a printer.
[0037]
Next, transmission processing of data acquired by the electronic pen will be described. As described above, the communication function of the electronic pen 10 is based on Bluetooth. The communication function of the electronic pen 10 is based on a service server that handles data input to the dedicated paper 20 (in the case of a specific application, the application server is the server of the application). Therefore, data cannot be transmitted directly from the electronic pen 10. Therefore, the data acquired by the electronic pen 10 is transmitted from the terminal device 25 to the service server.
[0038]
The process at that time will be described with reference to FIG. The data obtained by the electronic pen 10 is mainly data of items input by the user, but usually does not include information on the service server to which the data is transmitted. Instead, information for specifying an application or service related to the special paper is included in a dot pattern on the special paper, and the information is obtained from the special paper during a user input operation. Therefore, the terminal device 25 that has received the input data from the electronic pen 10 first makes an inquiry to the inquiry server 26 to which service server 27 the data input for the dedicated paper should be transmitted. The inquiry server 26 has information of a corresponding service server for each dedicated paper, and in response to an inquiry from the terminal device 25, stores information (a URL or the like) of the service server 27 that performs services related to the dedicated paper. Reply to terminal device 25. Then, the terminal device 25 transmits the input data obtained from the electronic pen to the service server 27.
[0039]
In the above example, the terminal device 25, the inquiry server 26, and the service server 27 are configured separately, but some or all of them may be configured as one device.
[0040]
[Procedure system configuration]
Next, as an embodiment of the handwritten character recognition system of the present invention, a series of steps in which a user fills in an application created using a dedicated paper with necessary information using an electronic pen and accepts the entry data in a server. A procedure system for performing the above procedure will be described.
[0041]
FIG. 7 shows a schematic configuration of a procedure system using an electronic pen. The user uses the above-described electronic pen 10 to input a form (in this example, a certain application form) 4. The form 4 is made of the special paper described with reference to FIGS. The contents entered in the form 4 are acquired as stroke data by the electronic pen 10 and transmitted to the terminal device 25 by Bluetooth communication. Hereinafter, the stroke data output by the electronic pen 10 is also referred to as “entry data”. The entry data is transmitted from the terminal device 25 to the server 3 via the network 2. The server 3 is a server that receives an application procedure based on an application form created by a user, and includes a database 8 for storing application data and the like in which application contents are recorded.
[0042]
The outline of the procedure using the above-described procedure system will be described. First, the user uses the electronic pen 10 to fill out a form 4 made of dedicated paper. Here, the form 4 has a configuration corresponding to the handwritten character recognition system of the present invention as described later. When the user fills in a form using the electronic pen 10, necessary stroke data (a set of coordinate data) is transmitted from the electronic pen 10 to the terminal device 25 as entry data. The stroke data is transmitted to the server 3. The server 3 performs a character recognition process on the received entry data, and acquires text data of the entry content entered in the form 4 by the user. Then, the server 3 performs necessary processing as an electronic form by, for example, embedding the text data of the entry content in an electronic form corresponding to the form 4.
[0043]
[Configuration of dedicated report]
Next, the configuration of the form 4 will be described. FIG. 8A schematically shows a configuration of a dedicated form of the handwritten character recognition system of the present invention. First, the form 4 shown in FIG. 8A is configured as the dedicated paper described above with reference to FIG. That is, a predetermined dot pattern 32 is printed on the mount 30 with ink that the electronic pen 10 can recognize, and a design 34 as a form is printed with ink that the electronic pen 10 cannot recognize.
[0044]
FIG. 8A shows an example of the design 34. A form 4 shown in FIG. 8A is an example of a specific application, and includes a name field as an entry. The name field is provided with a character input area 41 for the user to enter his / her name one character at a time. Here, the character input area 41 is a part of the form 34 of the form, and is printed with ink that the electronic pen 10 cannot recognize.
[0045]
In the form 4, a unit recognition character area 42 is defined. The unit recognition character area 42 is defined for dividing a series of character strings entered by the user into units of one character. That is, in the character recognition process by the server 3, it is determined that a set of stroke data composed of strokes entered in the unit recognition character area 42 is one-character stroke data.
[0046]
The unit character recognition area 42 is actually defined as coordinates on the form 4. For example, in FIG. 8A, the unit recognition character area 42a of the first character of the name is the coordinates (x1, y1) to (x2, y2) on the form 42, and the unit recognition character area 42b of the second character is the form 42. The upper coordinates (x3, y3) to (x4, y4) are defined in advance as positions on the form 4. The correspondence between each character and the corresponding position information on the form 4 is stored in the server 3 as character area position information 56 described later. Although the unit recognition character area 42 is not actually visible to the user, the unit recognition character area 42 is indicated by a wavy line at each corresponding position on the form 4 for convenience of explanation.
[0047]
In FIG. 8A, a character input area 41 visible to humans almost coincides with a unit recognition character area 42 defined by position information of the form 4 (not visible to humans). That is, when the user looks at the character input area 41 and writes a character inside the character input area 41, the electronic pen 10 acquires stroke data written in a unit recognition character area 42 substantially equal to the character input area 41, Target for character recognition processing.
[0048]
On the other hand, in the example of FIG. 8B, the unit recognition character area 42 is set to be larger than the character input area 41 that can be seen by a human. By doing so, even if the user writes a character that slightly protrudes from the character input area 41, if the character is within the unit recognition character area 42, the stroke data written by the user can be obtained without omission. It becomes. In addition, even if the user overlaps the frame of the character input area 41 with the electronic pen 10 or enters a character outside the frame, the electronic pen 10 does not recognize the character input area 41, so the frame of the character input area 41 is not recognized. The stroke data of the entered character can be correctly obtained without being in the way.
[0049]
In the example shown in FIG. 8, the character input area 41 is configured as a substantially square frame, but the character input area 41 may be printed on a form in the form of, for example, underlining or parentheses. In addition, on the form 4, the character input area 41 may be indicated by changing the color of the character input area 41 and printing the other areas.
[0050]
[Function of character recognition system]
Next, a functional configuration of the character recognition system according to the present invention will be described with reference to FIG. In FIG. 9, a terminal device 25 that receives entry data by a user from the electronic pen 10 has an entry data transmission / reception function 25a. The entry data transmission / reception function 25a is a function of receiving entry data (stroke data) from the electronic pen 10 via Bluetooth communication, and transmitting the entry data (stroke data) to the server 3 via the network 2. Note that the stroke data transmission / reception function 25a is realized by the terminal device 25 executing a prepared program.
[0051]
On the other hand, the server 3 includes a data receiving function 51, a character separating function 52, a data converting function 53, a size adjusting function 54, and a character recognizing function 55 as functional components necessary for the character recognition system according to the present invention. Each of these functions is realized by the server 3 executing a prepared program. The server 3 stores character area position information 56.
[0052]
The data receiving function 51 receives entry data (stroke data) transmitted from the terminal device 25 via the network 2 or the like.
[0053]
The character separation function 52 divides the entry data received by the data reception function 51 into entry data units for each character. At the time when the data receiving function 51 receives, the entry data is a set of entry data (stroke data) for a plurality of characters. Therefore, the character delimiter function 52 divides the entry data for each character from the entry data for a plurality of characters so that the character can be recognized.
[0054]
As described above with reference to FIG. 8, the form 4 defines the unit recognition character area 42 based on the position information on the form 4, and the stroke of the stroke written in one unit recognition character area 42. The set is stroke data for one character. Position information (such as coordinate data) indicating the unit recognition character area 42 corresponding to each character input area 41 printed on the form 4 is stored in the server 3 as character area position information 56. The dot pattern 32 is printed on the form 4 as described above, and the dot pattern does not overlap on one form. By recognizing the dot pattern, the character delimiter 52 performs Location information can be obtained. Therefore, the character delimiter function 52 first obtains the position information of each stroke data from the entry data (stroke data) received by the data receiving function 51, and then refers to the character area position information 56 to obtain each stroke data. Is divided into a set of stroke data for one character. Thereby, stroke data in units of one character is generated.
[0055]
The data conversion function 53 is a function for converting stroke data into vector data. The stroke data obtained from the electronic pen 10 is a set of coordinate data. If the coordinate data is converted into image data and enlarged or reduced by size adjustment processing described later, the character recognition accuracy is likely to be reduced. . Therefore, the data conversion function 53 converts the stroke data divided into units of one character into vector data.
[0056]
The size adjustment function 54 scales the vector data for each character obtained by the data conversion function 53 at a predetermined magnification. Here, the scaling includes enlargement, reduction, and 1-time scaling (that is, maintaining the same size). The magnification of the scaling process is determined according to the character size required by the character recognition function 55. That is, the size of the stroke data for each character obtained from the entry data for the form 4 depends on the size of the character input area 41 on the form 4. This is because the user writes characters so as to fit in the character input area 41 on the form 4. On the other hand, the size at which characters can be recognized by the character recognition function 55 is predetermined. Therefore, the size adjustment function 54 performs a process of converting the stroke data input according to the size of the character input area 41 on the form 4 into a size that allows the character recognition function 55 to perform character recognition. For example, if the character input area 41 on the form 4 is provided with a size that is half the size that can be subjected to the character recognition processing by the character recognition function 55, the size adjustment function 54 determines the size of the stroke data for each character. A process for doubling is performed.
[0057]
As described above, by using the size adjustment function 54 in the present invention, it is possible to determine the size of the character input area 41 on the form 4 without being limited to the size in which the character recognition function 55 can recognize characters. . Generally, the size of a character required by the character recognition engine used as the character recognition function 55 is set relatively large in order to secure a certain degree of recognition accuracy. Therefore, if the character input area 41 is provided on the form 4 with the same size, the occupied area on the form 4 becomes large, and it becomes difficult to provide many entry fields and information on the form 4. In this regard, according to the present invention, even if the size of the character input area 41 provided on the form 4 is reduced, the size adjustment function 54 performs enlargement processing at a required magnification to obtain the character size required by the character recognition function 55. The character recognition processing may be performed after the conversion. Therefore, there is no restriction on the size of the character input area 41 formed on the form 4, and the degree of design freedom of the form is increased.
[0058]
In order to correctly perform the size adjustment by the size adjustment function 54, it is preferable that the stroke data is converted into the vector data by the data conversion function 53 as preprocessing. This is because if the stroke data is imaged and the size is adjusted (especially enlargement processing), each dot is enlarged as it is, and the character is deformed (for example, oblique lines or curves are jagged), and the character recognition rate is reduced. This is because there are times. In this regard, if a scaling process such as enlargement is performed after conversion into vector data, such a problem does not occur.
[0059]
Thus, the vector data for each character, the size of which has been adjusted by the size adjustment function 54, is subjected to character recognition processing by the character recognition function 55, and is output as text data.
[0060]
[Character recognition processing]
Next, a flow of a character recognition process executed by the procedure system including the server 3 will be described. FIG. 10 is a flowchart of the character recognition process. In FIG. 10, first, the user uses the electronic pen 10 and the form 4 to enter items necessary for application on the form 4.
[0061]
When completing the necessary items, the user checks the transmission box of the form 4 and transmits the entry data to the server 3 via the terminal device 25 (step S2). That is, when the user checks the transmission check box of the form 4, the stroke data stored in the memory 12 of the electronic pen 10 at that time is transmitted to the terminal device 25 as entry data for one form 4. The terminal device 25 transmits the entry data to the server 3 via the network 2.
[0062]
When receiving the entry data from the terminal device 25 (step S3), the server 3 first divides the entry data for a plurality of characters into stroke data for each character by the character delimiter function 52 (step S4). Next, the data conversion function 53 converts the stroke data for each character into vector data (step S5).
[0063]
Next, the size adjustment function 54 performs scaling processing on the vector data generated in step S5, and converts the vector data into a size that allows character recognition processing by the character recognition function 55 (step S6). Then, the character recognition function 55 performs a character recognition process and outputs text data (step S7). In this way, text data corresponding to the content entered by the user in the entry column on the form 4 is obtained.
[0064]
Thereafter, the server 34 reads the text data obtained in step S7 into an electronic form corresponding to the form 4, as necessary, and executes a predetermined process as an electronic form (step S8).
[0065]
[Modification]
In the above example, as shown in FIG. 10, the entry data received from the terminal device 25 is divided into stroke data for each character by character delimitation processing, and then character recognition is performed through data conversion processing, size adjustment processing, and the like. Processing. However, some recent character recognition engines also have a function of separating each character. That is, even when character string data is input to the character recognition engine, the character recognition engine performs a process of delimiting each character in addition to the character recognition processing, and outputs text data corresponding to the character string. is there. When such a character recognition engine or the like is employed, the character delimiting process in step S10 can be omitted.
[0066]
Further, in the above embodiment, the server 3 is provided with the functions for character recognition of the entry data, that is, the character separation function 52, the data conversion function 53, the size adjustment function 54, and the character recognition function 55. However, these functions may be provided in the terminal device 25. In that case, the terminal device 25 can transmit the text data acquired by the character recognition processing to the server 3. Further, if the storage capacity of the electronic pen 10 and the capability of the processor allow, the above-described functions can be provided in the electronic pen 10.
[0067]
【The invention's effect】
As described above, according to the character recognition system of the present invention, the entry data entered using the electronic pen is adjusted to the size required by the character recognition program and then input to the character recognition program. Therefore, the size of the character input field provided on the form is not affected by the size required by the character recognition program. In addition, by using an electronic pen, it is possible to acquire the coordinate data of the entry without being affected by the design on the form, so that the color, size, frame thickness, etc. of the character input area provided on the form There are no restrictions. This increases the degree of freedom in form design and design.
[0068]
In addition, when the user makes an entry with the electronic pen, the entry data can be obtained at the same time, so that there is no need to physically collect the OCR sheet filled in by the user as in a conventional OCR system. Therefore, the processing using the form can be speeded up and made more efficient.
[Brief description of the drawings]
FIG. 1 is a diagram schematically showing a usage pattern of an electronic pen.
FIG. 2 is a functional block diagram illustrating the structure of an electronic pen. FIG. 3 is a diagram illustrating a method of expressing information by a dot pattern printed on a dedicated paper.
FIG. 4 shows an example of a dot pattern and information corresponding to the dot pattern.
FIG. 5 shows a structure of a form formed of dedicated paper.
FIG. 6 shows an example of a form.
FIG. 7 is a diagram showing a schematic configuration of a procedure system to which the handwritten character recognition system of the present invention is applied.
8 shows an example of a form used in the procedure system shown in FIG. 7;
FIG. 9 is a diagram showing a functional configuration of a procedure system to which the handwritten character recognition system of the present invention is applied.
FIG. 10 is a flowchart of a procedure using the handwritten character recognition system of the present invention.
[Explanation of symbols]
2 Network 3 Reception server 4 Application form 8 Database 10 Electronic pen 11 Processor 12 Memory 13 Transceiver 14 Battery 15 LED
16 Camera 17 Pen Tip 20 Special Paper 25 Terminal Device 51 Data Receiving Function 52 Character Separation Function 53 Data Conversion Function 54 Size Adjustment Function 55 Character Recognition Function

Claims (5)

電子ペンと、
前記電子ペンにより認識可能に印刷されたドットパターンと、文字入力エリアとを有する帳票と、
利用者が前記電子ペンにより前記帳票上に記入した記入内容に対応する記入データに基づいて、前記記入内容に対応するテキストデータを生成する文字認識装置と、を備え、
前記文字認識装置は、
前記記入データに対して変倍処理を施して、文字認識可能な所定サイズの記入データを生成するサイズ調整手段と、
前記所定サイズの記入データに基づいて文字認識処理を行い、前記テキストデータを生成する文字認識手段と、を備えることを特徴とする手書き文字認識システム。
An electronic pen,
A dot pattern printed recognizable by the electronic pen, and a form having a character input area,
A character recognition device that generates text data corresponding to the entry based on entry data corresponding to the entry entered by the user on the form with the electronic pen,
The character recognition device,
Size adjustment means for performing scaling processing on the entry data to generate entry data of a predetermined size that allows character recognition,
A character recognition unit that performs a character recognition process based on the entry data of the predetermined size to generate the text data.
前記記入データはストロークデータであり、前記文字認識装置は、前記記入データをベクトルデータに変換するデータ変換手段をさらに備えることを特徴とする請求項1に記載の手書き文字認識システム。2. The handwritten character recognition system according to claim 1, wherein the entry data is stroke data, and the character recognition device further includes a data conversion unit that converts the entry data into vector data. 前記記入データは、前記帳票上における前記記入内容の位置情報を含み、
前記文字認識装置は、前記記入内容の位置情報に基づいて、前記記入データを1文字毎の記入データに分割する文字区切り手段をさらに備えることを特徴とする請求項1又は2に記載の手書き文字認識システム。
The entry data includes position information of the entry content on the form,
3. The handwritten character according to claim 1, wherein the character recognition device further includes a character delimiter that divides the entry data into entry data for each character based on position information of the entry content. Recognition system.
コンピュータ上で実行することにより、前記コンピュータを、
電子ペンと、前記電子ペンにより認識可能に印刷されたドットパターンと、文字入力エリアを有する帳票とを利用して利用者が前記電子ペンにより前記帳票上に記入した記入内容に対応する記入データを受信する記入データ受信手段、
前記記入データに対して変倍処理を施して、文字認識可能な所定サイズの記入データを生成するサイズ調整手段、
前記所定サイズの記入データに基づいて文字認識処理を行い、前記記入内容に対応するテキストデータを生成する文字認識手段、として機能させることを特徴とする手書き文字認識プログラム。
By running on a computer, the computer
Using an electronic pen, a dot pattern recognizablely printed by the electronic pen, and a form having a character input area, the user can enter entry data corresponding to the contents entered on the form with the electronic pen using the electronic pen. Entry data receiving means to receive,
Size adjusting means for performing scaling processing on the entry data to generate entry data of a predetermined size capable of character recognition;
A handwritten character recognition program for performing a character recognition process based on entry data of a predetermined size, and functioning as character recognition means for generating text data corresponding to the entry content.
インクペンユニット及び光学的にドットパターンを読み取る読取ユニットを備える電子ペンにより記入される電子ペン用帳票であって、
前記電子ペンにより認識可能に印刷され、前記帳票上における位置情報を示すドットパターンと、
前記ドットパターン上に、文字入力エリアと、を有し、
前記帳票上における位置情報により規定され、前記電子ペンにより記入された記入データに基づいて1文字としての認識を行う単位認識文字エリアを有し、前記単位認識文字エリアは、前記文字入力エリアと同一であるか又は前記文字入力エリアより広いことを特徴とする電子ペン用帳票。
An electronic pen form written by an electronic pen including an ink pen unit and a reading unit that optically reads a dot pattern,
A dot pattern that is printed so as to be recognizable by the electronic pen and indicates position information on the form;
A character input area on the dot pattern;
A unit recognition character area defined by position information on the form and performing recognition as one character based on entry data entered by the electronic pen, wherein the unit recognition character area is the same as the character input area; Or an electronic pen form wider than the character input area.
JP2002273485A 2002-09-19 2002-09-19 Handwritten character recognition system, handwritten character recognition program, and business form for electronic pen Pending JP2004110529A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002273485A JP2004110529A (en) 2002-09-19 2002-09-19 Handwritten character recognition system, handwritten character recognition program, and business form for electronic pen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002273485A JP2004110529A (en) 2002-09-19 2002-09-19 Handwritten character recognition system, handwritten character recognition program, and business form for electronic pen

Publications (1)

Publication Number Publication Date
JP2004110529A true JP2004110529A (en) 2004-04-08

Family

ID=32270227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002273485A Pending JP2004110529A (en) 2002-09-19 2002-09-19 Handwritten character recognition system, handwritten character recognition program, and business form for electronic pen

Country Status (1)

Country Link
JP (1) JP2004110529A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009086857A (en) * 2007-09-28 2009-04-23 Im & T:Kk Handwritten information processing system
JP2012104028A (en) * 2010-11-12 2012-05-31 Sharp Corp Image processor, image reading device, image forming device, image processing method, and program and recording medium therefor
CN113011412A (en) * 2021-04-15 2021-06-22 深圳市鹰硕云科技有限公司 Character recognition method, device, equipment and storage medium based on stroke order and OCR (optical character recognition)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009086857A (en) * 2007-09-28 2009-04-23 Im & T:Kk Handwritten information processing system
JP4688855B2 (en) * 2007-09-28 2011-05-25 有限会社Im&T Handwritten information processing system
JP2012104028A (en) * 2010-11-12 2012-05-31 Sharp Corp Image processor, image reading device, image forming device, image processing method, and program and recording medium therefor
CN113011412A (en) * 2021-04-15 2021-06-22 深圳市鹰硕云科技有限公司 Character recognition method, device, equipment and storage medium based on stroke order and OCR (optical character recognition)

Similar Documents

Publication Publication Date Title
JP4137566B2 (en) Electronic pen, form processing system, and unit data division processing program
JP2004127197A (en) Reception system, terminal equipment for reception system, input check program, and document for electronic pen
JP4770332B2 (en) Card application form for electronic pens
JP4752565B2 (en) Electronic pen form manufacturing method
JP4220206B2 (en) PROCEDURE SYSTEM, SERVER DEVICE THEREOF, AND COMPUTER PROGRAM
JP2004259009A (en) Business form for electronic pen, creation device of business form for electronic pen, and general processing system
JP2004265003A (en) Recognition server, program and recognition system
JP2004021899A (en) Contents providing system, contents providing method and contents providing program
JP2004110529A (en) Handwritten character recognition system, handwritten character recognition program, and business form for electronic pen
JP4212863B2 (en) Form entry content text system and car maintenance form
JP2004127200A (en) Form for electronic pen, system for providing verification data, server device, and program for obtaining verification data
JP2006119712A (en) Information management terminal device and program, and document for electronic pen
JP2007316795A (en) Copy form for electronic pen
JP4629303B2 (en) Calculation processing system, calculation processing system server device, calculation processing program, and electronic pen form
JP4565975B2 (en) Electronic pen form and its creation method
JP4087204B2 (en) Calculation system, calculation program and calculation form
JP4984590B2 (en) Electronic pen form manufacturing system and program
JP2005037990A (en) Item specifying system and program
JP4811228B2 (en) Processing apparatus and program
JP4689491B2 (en) Server, user terminal, processing system and program
JP4362323B2 (en) Electronic form design system and program
JP2004110499A (en) Time information input system, time information acquiring device and program, and business form for electronic pen
JP2004302608A (en) Information processor for electronic pen
JP4443983B2 (en) Bookmark processing system and program
JP4957296B2 (en) Terminal device, processing system, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050914

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080717

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080722

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090901