JP2006134104A - Form reader - Google Patents
Form reader Download PDFInfo
- Publication number
- JP2006134104A JP2006134104A JP2004322802A JP2004322802A JP2006134104A JP 2006134104 A JP2006134104 A JP 2006134104A JP 2004322802 A JP2004322802 A JP 2004322802A JP 2004322802 A JP2004322802 A JP 2004322802A JP 2006134104 A JP2006134104 A JP 2006134104A
- Authority
- JP
- Japan
- Prior art keywords
- data
- character
- image
- character image
- management table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
Description
本発明は、例えば帳票に文字を記入したときに文字の筆跡情報を取得するデジタルペン等の手書き文字入力装置を利用する帳票読取システム、帳票読取方法に関する。 The present invention relates to a form reading system and a form reading method that use a handwritten character input device such as a digital pen that acquires character handwriting information when a character is entered in a form.
現在、表面にドットを印刷した帳票に文字を書き込むペンの機能と、ペンでドットをなぞった部分を光学的に読取り帳票より筆跡情報を得る機能とを備えたデジタルペンが開発されている。
このデジタルペンで得られたデータを修正する先行技術としては、例えばデジタルペンに消しゴムをつける技術(例えば特許文献1参照)、および二重線や塗りつぶしを削除部分として認識させる技術(例えば特許文献2参照)等が公開されている。
これら先行技術は、いずれもデジタルペン側で削除部分を認識する技術である。
As prior arts for correcting the data obtained with the digital pen, for example, a technique for putting an eraser on the digital pen (see, for example, Patent Document 1), and a technique for recognizing a double line or a fill as a deleted part (for example, Patent Document 2) Etc.) are open to the public.
Each of these prior arts is a technique for recognizing a deletion part on the digital pen side.
しかしながら、上記先行技術においては、文字を実際にボールペンや万年筆、インク等で帳票自体に記入するため、帳票の文字を訂正する場合、記載部分の上から訂正を行うと、元の文字と重畳してしまい訂正内容が判らなくなる等、帳票に一度書き込んでしまった文字を修正することは難しく、デジタルペンで得た筆跡情報より手書き文字のイメージを生成した場合も削除部分については人手による訂正作業が必要になるという問題があった。 However, in the above prior art, since characters are actually entered on the form itself with a ballpoint pen, fountain pen, ink, etc., when correcting the characters on the form, if the correction is made from above, the original characters are superimposed. It is difficult to correct the characters once written in the form, such as making the correction contents unknown, and even if handwritten character images are generated from handwriting information obtained with a digital pen, manual correction work is required for the deleted part There was a problem that it was necessary.
本発明はこのような課題を解決するためになされたもので、帳票に文字を消すことができない状態で書き込んでしまった際に、帳票とそれから得たデータにそれぞれ文字の削除、書換え、追記等の修正を容易に行うことのできる帳票読取システム、帳票読取方法を提供することを目的としている。 The present invention has been made to solve such problems, and when characters are written in a form that cannot be erased, characters are deleted, rewritten, added to the data obtained from the form, and the like. It is an object of the present invention to provide a form reading system and a form reading method capable of easily correcting the above.
上記した目的を達成するために、本発明の帳票読取システムは、文字記入欄に文字が未記入の状態の帳票のフォームデータを記憶した帳票フォームデータ記憶手段と、前記帳票の文字記入欄に筆記された文字の筆跡情報を取得するデジタルペンと、前記文字の筆跡情報と前記帳票フォームデータ記憶手段の帳票のフォームデータとを基に前記帳票の各文字記入欄に筆記された文字のイメージデータを生成し、生成した文字のイメージデータに前記帳票を特定する帳票識別情報を付与する文字イメージ生成手段と、前記文字イメージ生成手段により生成されたイメージデータを前記帳票の各文字記入欄の単位に管理するためのイメージ管理テーブルと、前記文字イメージ生成手段により生成された文字のイメージデータと、前記帳票識別情報と、前記文字の記入時刻とを対応させて前記イメージ管理テーブルに登録する手段と、複数の帳票のデータをマージするための入力操作を受け付ける入力手段と、前記入力手段により複数の帳票のデータをマージするための入力操作が受け付けられた場合、前記イメージ管理テーブルの記入時刻に基づき複数の帳票のデータについて各文字記入欄の単位で文字のイメージデータをマージし、一つの帳票のデータを生成する帳票データ集約手段とを具備したことを特徴とする。 In order to achieve the above object, the form reading system of the present invention comprises a form form data storage means for storing form form data in a state in which no characters are entered in the character entry field, and a writing in the character entry field of the form. Image data of characters written in each character entry column of the form on the basis of the digital pen for obtaining the handwritten information of the written characters, the form handwriting information of the characters and the form data of the form of the form form data storage means A character image generation unit that generates and identifies image data for identifying the form in the generated character image data, and manages the image data generated by the character image generation unit in units of each character entry column of the form An image management table, character image data generated by the character image generation means, the form identification information, Means for registering the character entry times in correspondence with the image management table; input means for accepting an input operation for merging a plurality of form data; and merging a plurality of form data by the input means. Form data that merges character image data in units of each character entry column and generates data for one form based on the entry time of the image management table when the input operation for the form is received And an aggregation means.
本発明の帳票読取方法は、デジタルペンから受信された文字の筆跡情報と予め記憶部に記憶されている帳票のフォームデータとを基に帳票の各文字記入欄に筆記された文字のイメージデータを生成し、生成した文字のイメージデータに前記帳票を特定する帳票識別情報を付与するステップと、生成した文字のイメージデータと、前記帳票識別情報と、前記文字の記入時刻とを対応させて前記記憶部に登録するステップと、複数の帳票のデータをマージするための入力操作を受け付けるステップと、前記入力操作を受け付けた場合、前記記憶部に記憶されている記入時刻に基づき、複数の帳票のデータについて各文字記入欄の単位で文字のイメージデータをマージし、一つの帳票のデータを生成するステップとを有することを特徴とする The form reading method of the present invention is based on character handwriting information received from a digital pen and form form data stored in a storage unit in advance, and image data of characters written in each character entry column of the form. Generating and generating the form identification information for identifying the form to the generated character image data, the generated character image data, the form identification information, and the character entry time in association with each other in the storage A step of registering with the copy unit, a step of receiving an input operation for merging the data of a plurality of forms, and a data of a plurality of forms based on the entry time stored in the storage unit when the input operation is received. Merging character image data in units of each character entry field and generating one form data.
本発明では、デジタルペンを用いて第1帳票の文字記入欄に筆記された文字の筆跡情報を取得すると、帳票読取装置では、その筆跡情報から第1帳票の文字イメージを文字記入欄の単位、つまりフィールド単位に生成し、これを第1帳票のデータとしてイメージ管理テーブルに登録する。
そして、第1帳票の文字記入欄に記入した文字のうち、ある文字記入欄に記載した文字が間違っていた場合や追記が必要に場合に、訂正あるいは追記する文字を第2帳票の該当文字記入欄に記載する。
帳票読取装置では、第2帳票から得られた訂正箇所、追記箇所の文字イメージを生成し、イメージ管理テーブルを参照し第1帳票と第2帳票との帳票識別情報が同じ場合、あるいは第2帳票のデータと第1帳票のデータとが同じ帳票から得られるべきものの場合に、第1帳票から得られた文字イメージと第2帳票から得られた訂正箇所の文字イメージとをフィールド単位でマージすることで、訂正あるいは追記対象のフィールドの文字イメージを正しいデータに訂正する。これにより、帳票および文字イメージともに訂正あるいは追記した正しい情報で保存することができる。
In the present invention, when handwriting information of characters written in the character entry field of the first form is obtained using a digital pen, the form reading device uses the handwriting information to obtain the character image of the first form from the unit of the character entry field. That is, it is generated for each field and is registered in the image management table as the data of the first form.
Then, among the characters entered in the character entry field of the first form, if the character entered in a certain character entry field is wrong or additional writing is required, enter the character to be corrected or added to the corresponding character in the second form. Enter in the column.
In the form reading device, a character image of a correction part and an additional part obtained from the second form is generated, and the form identification information of the first form and the second form is the same by referring to the image management table, or the second form. If the data of the first form and the data of the first form should be obtained from the same form, the character image obtained from the first form and the character image of the corrected part obtained from the second form are merged in field units. Then, correct the character image of the field to be corrected or added to correct data. As a result, both the form and the character image can be stored with the correct information corrected or added.
本発明によれば、帳票に文字を消すことができない状態で書き込んでしまった際に、帳票とそれから得たデータにそれぞれ文字の削除、書換え、追記等の修正を容易に行うことができる。 According to the present invention, when a character is written in a form that cannot be erased, it is possible to easily delete, rewrite, and add characters to the form and data obtained from the form.
以下、本発明の実施の形態を図面を参照して詳細に説明する。図1は本発明に係る一つの実施形態の帳票読取システムの構成を示すブロック図である。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing the configuration of a form reading system according to one embodiment of the present invention.
図1に示す帳票読取システムは、帳票4への筆記と筆跡情報の取得とを同時に行う機能を備えるデジタルペン2と、このデジタルペン2にUSBケーブル3を介して接続された帳票読取装置1とを備えている。帳票読取装置1は、例えばコンピュータなどである。
帳票4の表面全体には、特殊な配置形態の複数のドット(黒点)からなるドットパターンが薄い黒色で印刷されている。ドットパターンのドットは、約0.3mmの間隔で、格子状に配置されている。それぞれのドットは、格子状の交点より上下左右にわずかにずれた位置に配置されている(図4参照)。
The form reading system shown in FIG. 1 includes a
On the entire surface of the
図2に示すように、帳票4には、スタートマーク41、エンドマーク42、文字記入欄43が薄い青色で印刷されている。文字記入欄43は、例えば郵便番号、住所、電話番号等の項目毎に複数設けられている。利用者は、それぞれ該当項目の文字記入欄43に文字を記入する。デジタルペン2では、帳票4の表面に印刷されたドットパターンが光学読取りの処理対象とされる。帳票4の表面に印刷されたスタートマーク41、エンドマーク42、文字記入欄43等の薄い青色の部分は、人がペン部25(図3参照)で所定の位置に文字を記入するためのガイド線であり、デジタルペン2での光学読取りの処理対象からは除外される。
As shown in FIG. 2, a
帳票読取装置1は、制御部10、通信インターフェース11(以下、「通信I/F11」という。)、メモリ12、帳票作成部13、OCR処理部14、辞書15、データ記憶部16、入力部17、データ処理部18、表示部19を備えている。メモリ12、OCR処理部14、OCR処理部14、データ処理部18等は、CPU、メモリ、ハードディスク装置等のハードウェア、ハードディスク装置にインストールされたオペレーティングシステム(以下「OS」という。)および制御ソフトウェア等が協働して実現されるものである。辞書15は、ハードディスク装置等に格納されている。データ記憶部16は、ハードディスク装置に構築された、例えばデータベース等である。
The form reading apparatus 1 includes a
通信I/F11は、デジタルペン2から送信された情報をUSBケーブル3を通じて受信しメモリ12に展開する。通信I/F11は、帳票4の文字記入欄43に筆記された文字の筆跡情報、ペンID、帳票IDをデジタルペン2より取得する手段として機能する。
メモリ12は、デジタルペン2から受信された筆跡情報を記憶する。筆跡情報とは、デジタルペン2のペン先の軌跡、書き順、スピード等のストローク情報、筆圧、筆記時刻等を含む情報である。また、メモリ12は、これだけでなく、OCR処理部14が筆跡情報より生成した文字イメージの記憶およびデータ記憶部16が複数の文字イメージをマージする際の文字イメージの記憶、OCR処理部14による文字イメージ生成および文字認識処理、OCR処理部14による帳票モデルデータ35からのイメージの切り出し処理、OCR処理部14により切り出された各フィールド(枠)に、データ処理部18が、文字イメージを重畳して訂正画面を表示する処理等を行う作業エリアとして機能する。
The communication I / F 11 receives the information transmitted from the
The
OCR処理部14は、制御部10に制御されて、メモリ12に記憶された筆跡情報に含まれるストローク情報(ペン先の軌跡(位置データ)、書き順、記入時刻、スピード等)と、データ記憶部16の帳票モデルデータ35の座標情報とから、文字の単位で文字イメージを生成し、メモリ12へ記憶する。デジタルペン2が帳票4の表面を筆圧検知期間内になぞった位置データ(X座標、Y座標)の集合を軌跡といい、位置データ(X座標、Y座標)のうち、同じ筆圧検知期間内に区分されるものを書き順という。位置データ(X座標、Y座標)には、記入時刻が対応付けられており、帳票4がペン先でなぞられた位置(座標)が変わる順序と時刻の移り変わりがが分るので、これらの情報からスピードおよび筆記方向(書き順)が得られる。
The
OCR処理部14は、筆跡情報(位置データ(X座標、Y座標)と時刻)を基に座標上でドットデータを文字の単位で滑らかにつなげて文字イメージを生成する。OCR処理部14は、生成した文字イメージの帳票上の座標とデータ記憶部16に記憶されている帳票モデルデータ35(イメージデータ)の座標とを対応させて、帳票4の各文字記入欄43を特定し、そのフィールド毎に文字イメージをイメージ管理テーブル34へ登録する。
つまり、OCR処理部14は、デジタルペン2より受信されメモリ12へ記憶された文字の筆跡情報と帳票モデルデータ35とを基に帳票4の各文字記入欄43に筆記された文字のイメージデータを生成し、生成した文字のイメージデータに帳票4を特定する帳票識別情報を付与する文字イメージ生成手段として機能する。
Based on the handwriting information (position data (X coordinate, Y coordinate) and time), the
That is, the
OCR処理部14は、生成した文字イメージと帳票モデルデータ35の文字記入欄に相当するフィールドのイメージとを重畳して表示部19へ出力する表示イメージを生成する。
The
辞書15には、多数の文字画像(以下「文字イメージ」という。)と各文字イメージに対応付けられた文字コード(テキストデータ)とが保存されている。
The
OCR処理部14は、OCR処理部14が生成しメモリ12に記憶した文字イメージに対して辞書15を参照して文字認識処理を実行し、文字認識結果として文字コード、つまりテキストデータを出力する。
The
OCR処理部14は、文字イメージに対する文字認識の際に文字認識が不可能であったものについては「?」等の文字コード(テキストデータ)を付与し文字認識結果とする。OCR処理部14は、帳票より読み取ったテキストデータ、つまり帳票テキストデータ32と読取元の手書き文字イメージ31とをデータ記憶部16に保存する。
つまり、OCR処理部14は、OCR処理部14により生成された文字のイメージデータと辞書15の文字イメージとをマッチングさせてテキストデータを出力する。
The
That is, the
データ記憶部16には、帳票4より読み取った手書き文字イメージ31と、この手書き文字イメージ31から文字認識して得た文字認識結果のファイルである帳票テキストデータ32とが対応して保存される。
The
データ記憶部16には、帳票の種別を特定する情報(帳票ID等)に対応して少なくとも1つの帳票フォームのイメージデータ35(以下、「帳票モデルデータ35」という。)が記憶されている。帳票モデルデータ35は、文字が未記入の状態の帳票をイメージスキャナ等で予め読み取っておいた帳票のイメージであり、座標を指定(範囲を指定)することで部分的に切り出すことができる。この例では、各文字記入欄43が文字イメージのフィールドとして切り出される。データ記憶部16は、ユーザにより文字が記入されていない帳票モデルデータ35を記憶した帳票フォームデータ記憶手段である。
The
データ記憶部16は、文字記入欄に文字が記入された帳票4よりの筆跡情報を基に生成した文字イメージを文字認識して得たテキストデータを記憶するテキストデータ記憶手段である。
データ記憶部16には、帳票IDと帳票モデルデータ35を対応付けた帳票情報テーブル(図示せず)が記憶されている。帳票情報テーブルは、デジタルペン2より受信された帳票IDに対して、どの帳票モデルデータ35を使うかを決定するためのテーブルである。
入力部17は、例えばキーボート、マウス、およびそのインターフェースモジュール等であり、複数の帳票4のデータをマージするための入力操作を受け付ける入力手段として機能する。なお、この入力手段の機能は、デジタルペン2による帳票の指定操作で代用可能である。
The
The
The
データ処理部18は、帳票4を読み取る毎に、郵便番号、住所、電話番号等の各文字記入欄43の各項目毎にOCR処理部14によって生成された手書き文字イメージを並べて表示する画面を表示する手段として機能する。
データ処理部18は、入力部17により複数の帳票4のデータをマージするための入力操作が受け付けられた場合、イメージ管理テーブル34の該当帳票の記入時刻であるスタート時間に基づき各文字記入欄43の単位で文字のイメージデータをマージし、一つの帳票にデータを集約する帳票データ集約手段として機能する。
つまり、データ処理部18は、初めの帳票(第1帳票)から読み取った手書き文字イメージと、その後、読み取った帳票(第2帳票)の手書き文字イメージとをフィールド単位(文字記入欄43の単位)でマージして、データを1つの帳票に集約する。表示部19は、画面を表示するモニタ等である。
Each time the
When an input operation for merging data of a plurality of
That is, the
図3に示すように、デジタルペン2は、ペン型の外形をなすケース部20と、このケース部20に備えられたカメラ21、セントラル・プロセッシング・ユニット22(以下「CPU22」という。)、メモリ23、通信部24、ペン部25、インクタンク26、筆圧センサ27等から構成されている。この例のデジタルペン2は、帳票4のドットを光学的に読取り、帳票上の位置を検出する手書き入力装置の1つである。この他、超音波方式のものも利用できる。
As shown in FIG. 3, the
カメラ21は、発光ダイオード等の照明部と、CCDイメージセンサと、レンズ等の光学系とを備えたものである。赤外線発光部は、紙に対する照明として機能する。カメラ21は6×6ドット分の視野があり、筆圧検知により毎秒50以上のスナップショットを撮影する。 The camera 21 includes an illumination unit such as a light emitting diode, a CCD image sensor, and an optical system such as a lens. The infrared light emitting unit functions as illumination for paper. The camera 21 has a field of view of 6 × 6 dots, and takes 50 or more snapshots per second by detecting pen pressure.
ペン部25は、先端部よりインクタンク26からのインクが滲み出し、ユーザがその先端部を帳票4の紙面に当接させた際に、帳票4の紙面にインクを付着させ、これにより文字を帳票4に筆記および図形を描画できる。ペン部25は、先端部への圧力の印加に応じて伸縮する感圧タイプのものである。ペン部25の先端部を帳票4に押し付けると(ポイントすると)、筆圧センサ27により筆圧が検知され、CPU22は、カメラ21で撮影された紙面のドットパターンを読取る。つまりペン部25は、ボールペンの機能と筆圧検知機能とを備えている。
The
CPU22は、帳票4からのドットパターンの読取りを、あるサンプリングレートで行うことで、読取動作に伴う膨大な情報(ペン部21の軌跡、書き順スピード等のストローク情報、筆圧、筆記時刻等を含む筆跡情報)を瞬時に認識する。
CPU22は、スタートマーク41の位置がポイントされたときに読取りの開始を判定し、エンドマーク42の位置がポイントされたときに読取りの終了を判定する。CPU22は、読取りの開始から終了までの期間、筆圧検知によりカメラ21から取得された情報の画像処理を行い位置情報を生成し記入時刻と共にメモリ23へ筆跡情報として記憶する。
The CPU 22 reads the dot pattern from the
The CPU 22 determines the start of reading when the position of the
メモリ23には、帳票4に印刷されているドットパターンに対応する座標情報が記憶されている。またメモリ23には、スタートマーク41の位置の座標を読み取った際に帳票4の種類を識別するための情報として帳票ID、このペン自体を特定するための情報としてペンID等が記憶されている。
メモリ23は、エンドマーク42の位置がポイントされたときにCPU22が処理した筆跡情報を帳票読取装置1へ送信するまで保存する。
通信部24は、帳票読取装置1と接続されたUSBケーブル3を介して、メモリ23の情報を帳票読取装置1へ送信する。USBケーブル3を使った有線通信の他、筆圧センサ24の情報の転送方法としては、例えば無線通信(IrDA通信、Bluetooth通信等)がある。Bluetoothは登録商標である。このデジタルペン2への電源供給は帳票読取装置1からUSBケーブル3を通じて行われる。
The memory 23 stores coordinate information corresponding to the dot pattern printed on the
The memory 23 stores handwriting information processed by the CPU 22 when the position of the
The
なお、手書き入力装置(デジタイザ)としては、上記デジタルペン2と帳票4の組み合わせの他、ペン先方向へ超音波を発信する発信部と紙あるいはタブレットに反射した超音波を受信する受信部とを備え、ペン先の動いた軌跡(位置座標)を順次取得するようなデジタルペンでも良く、本発明は上記実施形態の光学式のデジタルペン2のみに限定されるものではない。
In addition, as a handwriting input device (digitizer), in addition to the combination of the
図4はデジタルペン2のカメラ21で撮像される帳票4の範囲を示す図である。
デジタルペン2に内蔵されたカメラ21が1回に読み取ることができる帳票4上の範囲は、ドットの間隔が約0.3mmの場合、格子状に配置された6×6ドットの範囲、つまり36ドットである。36ドットの上下左右のずれの組み合わせを全て網羅すると、例えば6,000万平方キロメートル程度の巨大な座標平面からなる紙(敷地)を作り出すことができる。このような巨大な座標平面のどの6×6ドット(正方形)をとってもそのドットパターンは異なる。従って、予め個々のドットパターンに対応する紙面データ(位置座標)をメモリ23に格納しておくことで、帳票4の表面上(ドットパターン上)のデジタルペン2の軌跡は、帳票4の表面上ですべて異なる位置として認識できる。
FIG. 4 is a diagram showing the range of the
The range on the
図5に示すように、帳票管理テーブル33は、証券番号を主キーとして、帳票モデル番号、帳票仮番号、手書き文字イメージ番号、帳票テキスト番号を対応させて管理するためのテーブルである。 As shown in FIG. 5, the form management table 33 is a table for managing a form model number, a form provisional number, a handwritten character image number, and a form text number in association with a securities number as a main key.
図6に示すように、イメージ管理テーブル34には、帳票識別番号に対して、帳票に文字の記入が行われたスタート時間、フィールド、フラグ等の項目で情報が記憶されている。
帳票仮番号は、帳票4からの筆跡情報を基に手書き文字イメージを作成した際にOCR処理部14によって自動的に付与される連続番号であり、手書き文字イメージを主キー(証券番号等)に関連付ける際の情報となる。
帳票識別番号は、例えば「001−1」などのように、主番号「001」に枝番号「1」が付加されたものであり、主番号「001」は、帳票4の種類を示し、枝番号「1」は、文字が記載された帳票を示す。つまり、主番号と枝番号で同じ帳票か異なる帳票かを特定できる。例えば主番号から枝番号までが同じ帳票識別番号は、同一帳票を示す。
As shown in FIG. 6, the image management table 34 stores information on items such as a start time, a field, and a flag when characters are entered in the form with respect to the form identification number.
The temporary form number is a serial number automatically given by the
The form identification number is obtained by adding the branch number “1” to the main number “001” such as “001-1”, for example. The main number “001” indicates the type of the
スタート時間の欄には、帳票4に文字が記入されたスタート時間が登録される。フィールドの欄には、帳票4の各文字入力欄43にそれぞれ対応する手書き文字イメージの内容が登録される。なお、手書き文字イメージが得られなかったフィールドについては「NULL」が設定される。フラグの欄は、帳票データを「使用可能」か「使用不可」かを示す情報が設定される。フラグとして例えば「使用不可」が設定された場合、その帳票データを他のデータとマージするような使い方ができなくなる。この例では、帳票Aのデータと帳票Bのデータとをマージした後に、データ処理部18によってマージ元の帳票A,Bのデータに対して「使用不可」のフラグが付与(設定)されたものである。
In the start time column, the start time in which characters are entered in the
ここで、図7乃至図9を参照してこの帳票読取システムによる帳票データの紐付け動作と修正動作について説明する。
この帳票読取システムでは、利用者が、デジタルペン2を帳票4のスタートマーク41の位置でポイントすると、筆圧センサ27により筆圧が検知され、CPU22へ通知される。これにより、CPU22は、カメラ21を駆動し、ドットパターンの読取り動作を開始し、カメラ21によってその位置のドットパターンが読み取られる。CPU22は、カメラ21によって読み取られたドットパターンを基にポイントされた紙面上の位置座標と、メモリ23に記憶されている帳票IDの中から該当する帳票IDを特定し、帳票4のスタートマーク41の位置がポイントされたことを検知する。
Here, the operation of associating and correcting the form data by the form reading system will be described with reference to FIGS.
In this form reading system, when the user points the
その後、帳票4の文字記入欄43へ文字が筆記(記入)されると、CPU22は、カメラ21により撮像された画像を処理し、画像処理により得られた筆跡情報を順次メモリ23へ記憶する(図7、図8のステップS101)。ここでの画像処理では、カメラ21により撮像された所定エリアの画像のドットパターンを解析し位置情報に変換する等の処理が行われる。CPU22は、エンドマーク42がポイントされたことを検知するまで上記画像処理を繰り返す。
Thereafter, when a character is written (filled) in the
CPU22は、エンドマーク42がポイントされたことを検知すると、メモリ23に記憶されていた筆跡情報、ペンID、帳票IDをUSBケーブル3を通じて帳票読取装置1へ送信する(ステップS102)。帳票IDは、例えば「001」等の主番号である。
When detecting that the
帳票読取装置1では、デジタルペン2より送信された筆跡情報、ペンID、帳票ID等の情報を通信I/F11が受信し、メモリ12に記憶する。
In the form reading device 1, the communication I / F 11 receives information such as handwriting information, pen ID, and form ID transmitted from the
OCR処理部14は、メモリ12の帳票IDを基にデータ記憶部16の帳票情報テーブル(図示せず)を参照し、該当する帳票モデルデータ35を読み出す。
The
次に、OCR処理部14は、データ記憶部16から読み出した帳票モデルデータ35と、メモリ12に記憶された筆跡情報とを用いて文字単位のイメージ、つまり手書き文字イメージを生成、つまりイメージ化し(ステップS103)、各文字記入欄43の単位で位置座標のデータ(位置情報)と共にメモリ12に記憶する。
Next, the
すべての文字記入欄43について文字イメージを生成した後、OCR処理部14は、それらの手書き文字イメージを特定するための帳票仮番号を付与した上でメモリ12の手書き文字イメージを並べた確認画面を表示部19に表示し、確認された帳票のデータ(スタート時間、帳票識別番号、各フィールドの内容等)をイメージ管理テーブル34に登録する(ステップS104)。帳票識別番号とは、帳票IDに枝番号を付与したものである。なお、確認画面に表示された文字イメージが誤っていた場合は修正等が行われる。
After generating the character images for all the character entry fields 43, the
その後、OCR処理部14は、メモリ12の手書き文字イメージと辞書15の文字イメージとのイメージマッチングによる文字認識処理を行い(ステップS105)、一致あるいは類似する文字イメージに対応する文字コード、つまりテキストデータを辞書15より読み出して文字認識結果とする。なお、一致あるいは類似する文字イメージがヒットしなかった場合は、その文字イメージの文字認識結果として「?」を付与する。
After that, the
続いて、データ処理部18は、文字認識結果のデータに対して、証券番号等の手書きされた帳票固有の識別情報である主キーを付与して、文字認識結果のテキストデータを用いた帳票データを作成し(ステップS106)、その帳票データをデータ記憶部16に記憶すると共に、主キーである証券番号を帳票管理テーブル33の該当帳票データの証券番号の項目欄に登録する(ステップS107)。これにより、一連の帳票データが証券番号により紐付けられる。
Subsequently, the
その後、帳票4の記載内容に誤り等が発見された場合、利用者は、既に文字を書き込んだ帳票識別番号「001−1」の帳票(以下、「帳票Aデータ」という。)を用いずに、他の帳票(以下、「帳票Bデータ」という。)に、帳票Aの帳票識別番号である「001−1」を記入した後、訂正箇所に正しい文字を記入する。
すると、上記ステップS101からステップS107の処理を経て、図9に示すように、イメージ管理テーブル34に、帳票識別番号「001−2」という項目で、帳票Bデータが追加される。
この図9の例では、帳票識別番号「001−1」の帳票Aデータの住所の項目の欄に記載した「東京都聖丘1−23」が誤りであり、帳票識別番号「001−2」の帳票Bデータの住所の項目の欄に正しい文字を「東京都聖丘1−2−3」と記載したものとする。
Thereafter, when an error or the like is found in the description content of the
Then, through the processing from step S101 to step S107, as shown in FIG. 9, form B data is added to the image management table 34 in the item of form identification number “001-2”.
In the example of FIG. 9, “Tokyo Seigaoka 1-23” described in the column of the address item of the form A data of the form identification number “001-1” is an error, and the form identification number “001-2”. It is assumed that the correct character is described as “Tokyo Seiki 1-2-3” in the address field of the form B data.
一方、メモリ12には、ステップS103の処理により、手書き文字イメージの文字認識結果として、帳票Aデータの帳票識別番号である「001−1」が記憶される。
ここで、利用者が、キーボード等から、複数の帳票のデータ編集操作を行うと、入力部17は、複数の帳票のデータ編集操作を受け付け、それを制御部10を通じてデータ処理部18へ通知する。
On the other hand, in the
Here, when the user performs a data editing operation for a plurality of forms from the keyboard or the like, the
データ処理部18は、この通知により、複数の帳票のデータ編集操作ありと判定し(ステップS108のYes)、メモリ12に記憶されていた帳票Aの帳票識別番号「001−1」と同じ帳票識別番号を持つ帳票データがイメージ管理テーブル34にあるかどうかをチェックする(ステップS109)。
このチェックの結果、帳票識別番号「001−1」の帳票データが存在した場合(ステップS109のYes)、データ処理部18は、イメージ管理テーブル34の該当データどうしを比較し、それぞれの手書き文字イメージをフィールド単位にマージする(ステップS110)。
Based on this notification, the
As a result of the check, if the form data having the form identification number “001-1” exists (Yes in step S109), the
マージを行う条件としては、図6のイメージ管理テーブル34のスタート時間を比較して、スタート時間の早いもの(帳票識別番号「001−1」)のデータをベースに、スタート時間の遅いもの(帳票識別番号「001−2」)のデータの「NULL」となっていない部分を上書きする形にする。この他、帳票のある位置に手書きされたサイン等の手書き文字のイメージの一致度を確認することで、2つの帳票が同じ人によって記載されたことを確認(正当性確認)しても良い。 As conditions for merging, the start times of the image management table 34 in FIG. 6 are compared, and the data with the earlier start time (form identification number “001-1”) is used as the base (form form). The portion of the data having the identification number “001-2”) that is not “NULL” is overwritten. In addition, it may be confirmed (validity confirmation) that two forms are described by the same person by checking the degree of coincidence of images of handwritten characters such as signatures handwritten at a certain position of the form.
そして、データ処理部18は、マージした帳票のデータ(マージデータ)を、新たな帳票データとしてイメージ管理テーブル34に登録すると共に、イメージ管理テーブル34のマージ元(帳票Aデータ,帳票Bデータ)の各フラグの欄に「使用不可」を設定する。新たな帳票データとしてイメージ管理テーブル34に登録する上では、マージ元の帳票Aデータの帳票識別番号を付与することで、帳票データを1つのデータとして保全できる。
これと同時に、データ処理部18は、マージデータの実体のデータをデータ記憶部16に保存する(ステップS111)。
Then, the
At the same time, the
このようにこの実施形態の帳票読取システムによれば、デジタルペン2等のペン型の手書き入力装置と帳票4のドットパターンとを組み合わせたデジタイザから得られる筆跡情報を利用し文字イメージを生成し、帳票のデータを保存する際に、初めの帳票Aの文字の記載に誤りが発見された場合、初めの帳票Aとは別の帳票Bに訂正内容を記載することで、元の帳票Aから読み取った手書き文字イメージを訂正し、帳票Aのデータとして管理できるので、帳票に文字を消すことができない状態で書き込んだ際に、帳票とそれから得たデータにそれぞれ文字の削除、書換え、追記等の修正を容易に行え、しかも帳票データの訂正履歴を残したまま帳票データを保全および管理することができる。
この発明は、例えば銀行等の金融機関への申込書、保険会社、電話会社への契約書、申込書等のように、ボールペン、万年筆等で文字を記入する帳票に適用できる。
Thus, according to the form reading system of this embodiment, a character image is generated using handwriting information obtained from a digitizer that combines a pen-type handwriting input device such as the
The present invention can be applied to a form in which characters are entered with a ballpoint pen, a fountain pen, or the like, such as an application form to a financial institution such as a bank, a contract form to an insurance company or a telephone company, or an application form.
本発明は上記実施形態のみに限定されるものではない。
上記実施形態では、初めに文字を記入した帳票とは別の帳票に訂正内容を記入し、互いの帳票データをマージしたが、追記の場合は、初めに文字を記入した帳票を再度利用することができる。
この場合、図10に示すように、イメージ管理テーブル34において、初めに文字を記入した帳票Aと後から文字を追記した帳票A’とで帳票識別番号は同じになるものの、データ処理として図7に示したステップS108以降の処理と同じである。
つまり、データ処理部18は、イメージ管理テーブル34の該当データどうしを比較し、スタート時間の早いものをベースに、スタート時間の遅いものを上書きする形でそれぞれの手書き文字イメージをフィールド単位にマージする。但し、この場合、図11に示すように、スタート時間の早い帳票Aのデータのうち、「NULL」が設定されているフィールドについてのみ、スタート時間の遅い帳票A’の対応フィールドの手書き文字イメージ「03−0000−0000」をマージすることで、マージデータを作成する。
The present invention is not limited to the above embodiment.
In the above embodiment, the correction contents are entered in a form different from the form in which characters are initially entered, and the forms data are merged. However, in the case of additional writing, the form in which characters are initially entered should be used again. Can do.
In this case, as shown in FIG. 10, in the image management table 34, the form identification number is the same for the form A in which the character is first entered and the form A ′ in which the character is added later. This is the same as the processing after step S108 shown in FIG.
In other words, the
1…帳票読取装置、2…デジタルペン、3…USBケーブル、4…帳票、10…制御部、11…通信I/F、12…メモリ、14…OCR処理部、15…辞書、16…データ記憶部、17…入力部、18…データ処理部、19…表示部、20…ケース部、21…カメラ、22…CPU、23…メモリ、24…通信部、25…ペン部、26…インクタンク、27…筆圧センサ、41…スタートマーク、42…エンドマーク、43…文字記入欄 DESCRIPTION OF SYMBOLS 1 ... Form reading apparatus, 2 ... Digital pen, 3 ... USB cable, 4 ... Form, 10 ... Control part, 11 ... Communication I / F, 12 ... Memory, 14 ... OCR process part, 15 ... Dictionary, 16 ... Data storage , 17 ... Input unit, 18 ... Data processing unit, 19 ... Display unit, 20 ... Case unit, 21 ... Camera, 22 ... CPU, 23 ... Memory, 24 ... Communication unit, 25 ... Pen unit, 26 ... Ink tank, 27 ... writing pressure sensor, 41 ... start mark, 42 ... end mark, 43 ... text entry field
Claims (2)
前記帳票の文字記入欄に筆記された文字の筆跡情報を取得するデジタルペンと、
前記文字の筆跡情報と前記帳票フォームデータ記憶手段の帳票のフォームデータとを基に前記帳票の各文字記入欄に筆記された文字のイメージデータを生成し、生成した文字のイメージデータに前記帳票を特定する帳票識別情報を付与する文字イメージ生成手段と、
前記文字イメージ生成手段により生成されたイメージデータを前記帳票の各文字記入欄の単位に管理するためのイメージ管理テーブルと、
前記文字イメージ生成手段により生成された文字のイメージデータと、前記帳票識別情報と、前記文字の記入時刻とを対応させて前記イメージ管理テーブルに登録する手段と、
複数の帳票のデータをマージするための入力操作を受け付ける入力手段と、
前記入力手段により複数の帳票のデータをマージするための入力操作が受け付けられた場合、前記イメージ管理テーブルの記入時刻に基づき複数の帳票のデータについて各文字記入欄の単位で文字のイメージデータをマージし、一つの帳票のデータを生成する帳票データ集約手段と
を具備したことを特徴とする帳票読取システム。 A form data storage means for storing form data of a form in which no characters are entered in the character entry field;
A digital pen that obtains handwriting information of characters written in the character entry field of the form;
Based on the handwriting information of the character and the form data of the form of the form form data storage means, the image data of the character written in each character entry column of the form is generated, and the form is added to the generated character image data. A character image generation means for adding form identification information to be identified;
An image management table for managing the image data generated by the character image generation means in units of each character entry column of the form;
Means for registering in the image management table the character image data generated by the character image generating means, the form identification information, and the entry time of the character in association with each other;
Input means for accepting an input operation for merging data of a plurality of forms;
When an input operation for merging a plurality of form data is accepted by the input means, the character image data is merged in units of each character entry column for the plurality of form data based on the entry time of the image management table. And a form reading system comprising a form data aggregating means for generating data of one form.
生成した文字のイメージデータと、前記帳票識別情報と、前記文字の記入時刻とを対応させて前記記憶部に登録するステップと、
複数の帳票のデータをマージするための入力操作を受け付けるステップと、
前記入力操作を受け付けた場合、前記記憶部に記憶されている記入時刻に基づき、複数の帳票のデータについて各文字記入欄の単位で文字のイメージデータをマージし、一つの帳票のデータを生成するステップと
を有することを特徴とする帳票読取方法。 Based on the handwriting information of characters received from the digital pen and the form data of the form stored in advance in the storage unit, the image data of the characters written in each character entry column of the form is generated, and the generated character image Providing form identification information for identifying the form to data;
Registering the generated character image data, the form identification information, and the entry time of the character in the storage unit;
Receiving an input operation for merging data of a plurality of forms;
When the input operation is accepted, based on the entry time stored in the storage unit, the character image data is merged in units of each character entry column for a plurality of form data to generate one form data. A form reading method comprising: steps.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004322802A JP2006134104A (en) | 2004-11-05 | 2004-11-05 | Form reader |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004322802A JP2006134104A (en) | 2004-11-05 | 2004-11-05 | Form reader |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006134104A true JP2006134104A (en) | 2006-05-25 |
Family
ID=36727596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004322802A Withdrawn JP2006134104A (en) | 2004-11-05 | 2004-11-05 | Form reader |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006134104A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009193234A (en) * | 2008-02-13 | 2009-08-27 | Dainippon Printing Co Ltd | Terminal device, program used for the same, and information-processing system |
CN111062377A (en) * | 2019-12-18 | 2020-04-24 | 广东小天才科技有限公司 | Question number detection method, system, storage medium and electronic equipment |
JP6870137B1 (en) * | 2020-04-06 | 2021-05-12 | 株式会社Alconta | Data utilization system, data utilization method and program |
-
2004
- 2004-11-05 JP JP2004322802A patent/JP2006134104A/en not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009193234A (en) * | 2008-02-13 | 2009-08-27 | Dainippon Printing Co Ltd | Terminal device, program used for the same, and information-processing system |
CN111062377A (en) * | 2019-12-18 | 2020-04-24 | 广东小天才科技有限公司 | Question number detection method, system, storage medium and electronic equipment |
CN111062377B (en) * | 2019-12-18 | 2024-02-23 | 广东小天才科技有限公司 | Question number detection method, system, storage medium and electronic equipment |
JP6870137B1 (en) * | 2020-04-06 | 2021-05-12 | 株式会社Alconta | Data utilization system, data utilization method and program |
JP2021165911A (en) * | 2020-04-06 | 2021-10-14 | 株式会社Alconta | Data utilization system, data utilization method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007079943A (en) | Character reading program, character reading method and character reader | |
RU2669717C2 (en) | Handbook input / output system, digital ink sheet, information intake system and sheet supporting information input | |
US6722574B2 (en) | Business card | |
JP4244614B2 (en) | Handwriting input device, program, and handwriting input method system | |
US20050060644A1 (en) | Real time variable digital paper | |
US7898685B2 (en) | Image generating/reading apparatus and methods and storage media storing programs therefor | |
US20080089586A1 (en) | Data processing system, data processing terminal and data processing program of digital pen | |
US8418052B2 (en) | Processing of documents | |
JP4687324B2 (en) | Information processing apparatus and association method | |
JP6464504B6 (en) | Electronic device, processing method and program | |
CN107369097B (en) | Insurance policy based on optical dot matrix technology and information input method and device thereof | |
JP2008257530A (en) | Electronic pen input data processing system | |
JP4083724B2 (en) | Character reader | |
JP2006134104A (en) | Form reader | |
JP2006134105A (en) | Device for reading form | |
JP2009048655A (en) | Handwriting input device, program, and handwriting input method system | |
JP4919089B2 (en) | Electronic pen and program | |
JP2004094419A (en) | Form for electronic pen | |
JP2011181043A (en) | Handwriting input system | |
JP4693825B2 (en) | Information processing apparatus and program | |
JP5906608B2 (en) | Information processing apparatus and program | |
US8028898B2 (en) | Double conversion cheque-clearing process and system | |
JP4654906B2 (en) | Computer system, reference information registration device, and program | |
JP2005275599A (en) | Handwriting output device, handwriting output method, and program | |
JP2007102265A (en) | Identification card recognition device and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080108 |