JP2005038077A - 筆記データ入力装置 - Google Patents

筆記データ入力装置 Download PDF

Info

Publication number
JP2005038077A
JP2005038077A JP2003198278A JP2003198278A JP2005038077A JP 2005038077 A JP2005038077 A JP 2005038077A JP 2003198278 A JP2003198278 A JP 2003198278A JP 2003198278 A JP2003198278 A JP 2003198278A JP 2005038077 A JP2005038077 A JP 2005038077A
Authority
JP
Japan
Prior art keywords
entry
input device
writing data
data input
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003198278A
Other languages
English (en)
Inventor
Teruyuki Yamaguchi
輝幸 山口
Mitsuhisa Himaga
充寿 日間賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003198278A priority Critical patent/JP2005038077A/ja
Publication of JP2005038077A publication Critical patent/JP2005038077A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • User Interface Of Digital Computer (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

【課題】帳票に筆記された筆記データを、別途用意された帳票の表示用データの記入欄に位置合わせして表示させる。
【解決手段】筆記データ取得デバイス20によって、利用者が帳票に筆記した文字列を筆記データとしてコンピュータ100に取り込む。コンピュータ100は、文字列について文字認識および内容解析を行うとともに、フォーマット定義120を参照して、その文字列が記入されるべき記入欄を特定する。コンピュータ100は、この特定結果に基づいて、筆記データの表示位置を記入欄に一致させるためのずれ量を特定し、筆記データを補正する。こうすることで、利用者が位置合わせのための特別な操作を行うまでなく、筆記データを帳票と適切に重ね合わせて表示させることができる。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、記入欄を有する帳票に筆記された文字列を、入力する筆記データ入力装置に関する。
【0002】
【従来の技術】
金融機関や役所などでは、種々の手続きの申請に、種々の形式の帳票が利用されている。申請者は、帳票の指定された記入欄に、住所、氏名などの指定された項目を記入して手続きを申請する。近年では、こうして記入された帳票の処理効率の向上、保存の容易化を図るため、筆記内容をストロークデータ(以下、「筆記データ」と称する)として保管する提案がなされている。こうして取得された筆記データを、別途保管された帳票の表示データと重ね合わせて表示することにより、筆記された状態の帳票をコンピュータで表示させることが可能となる。
【0003】
かかる提案の一つとして、特許文献1では、帳票をタブレットに重ね合わせた状態で、筆記入力することで、筆記データとして取得する筆記データ入力装置を開示している。帳票は常にタブレットの一定の位置に載置されるとは限らないから、帳票と的確に重ね合わせた状態を再現するためには、帳票の載置位置に応じて、筆記データの座標値を補正する必要がある。特許文献1では、筆記データを記入欄に対して相対的に複数方向に移動させて、記入欄内の文字認識を行い、適切な結果を利用者に選択させることで、補正に適用する移動量を確定している。
【0004】
【特許文献1】
特開平10−254611号公報
【0005】
【発明が解決しようとする課題】
このように従来は、補正に適用する移動量を確定するために、利用者に特別な操作を強要していた。こうした操作に不慣れな利用者が多数訪れる機関では、従来技術における筆記データ入力装置は、十分に活用することができなかった。本発明では、かかる課題を考慮し、筆記データ入力装置において、特別な操作を利用者に強要することなく、筆記データの座標値の補正を実現することを目的とする。
【0006】
【課題を解決するための手段】
上記課題の少なくとも一部を解決するため、本発明における筆記データ入力装置について説明する。筆記データ入力装置とは、記入欄を有する帳票に筆記された文字列を、入力するための装置である。本発明の筆記データ入力装置は、入力用に既定された入力座標系で筆記された文字列を表す筆記データを取り込む。本発明の筆記データ入力装置によって入力されるデータの形式としては、文字列を表現するための画素の座標値の集合;かかる座標値を時系列的に配列したデータなどの形式を採ることができる。筆記データ入力装置は、記入対象となった帳票の様式を既定の帳票座標系で記憶した帳票データを参照し、帳票座標系において文字列が記入欄に収まるように、筆記データの座標値を補正する。この補正は、筆記された文字列を帳票中のいずれかの記入欄に対応付けるための所定の規則に基づいて行われる。かかる規則としては、例えば、「各行を上方または下方の記入欄から順に割り当てる」、「筆記された文字列の長さまたは行に含まれる文字数に応じて記入欄を対応づける」など、種々の規則を用いることができる。記入欄とは、必ずしも罫線でわく囲みされている必要はなく、下線のみの記入箇所、日付欄のように帳票に既に印刷されている「年、月、日」などの文字や見出しから記入位置が特定できる記入箇所も含む。
【0007】
本発明によれば、上述の規則に基づいて、入力された筆記データの補正によって、利用者が特別な操作を行うまでなく、筆記データの座標を、帳票座標系に適合させることができる。この結果、帳票データに基づいて表される帳票イメージの記入欄内に、筆記データを収めた状態で、帳票の出力を行うことが可能となる。
【0008】
本発明において筆記データは、種々のデバイス(以下、「筆記データ取得デバイス」と称する)によって取得することが可能である。筆記データ取得デバイスとしては、例えば、帳票を載置した状態で筆記可能なタブレット、帳票に筆記するペンの2次元的な位置を超音波、赤外線などを用いて遠隔的に取得可能な装置を用いることができる。筆記データ取得デバイスは、これらのデバイスで取得された筆記データを、リアルタイムで入力するものとしてもよいし、一旦、記録媒体に記録された筆記データを入力するものとしてもよい。前者の態様を採る場合、本発明は、筆記データ入力装置と筆記データ取得デバイスを有する筆記データ入力システムとして構成することもできる。
【0009】
本発明の筆記データ入力装置において、各記入欄に記載すべき内容を考慮して文字列と記入欄との対応づけを行ってもよい。かかる対応づけを可能とするため、筆記データ入力装置に、筆記データに基づき、文字列の文字認識を行って、文字列の記載内容を解析する機能を設ける。また、帳票データでは、記入欄に対して、その記入欄に記入すべき内容を表す属性データを対応づけておく。筆記データ入力装置は、こうして構成された帳票データを参照することで、解析された記載内容と属性データが一致するよう文字列と記入欄とを対応づけることができる。例えば、「氏名」という属性データが付された記入欄については、文字数や記載内容によって氏名であると判断される文字列を対応づけることができる。こうすることにより、文字列と記入欄の対応づけの精度を向上することができる。
【0010】
文字列の内容解析を行うために、属性データに対応した種々の知識を予め記憶する知識データベースを参照してもよい。例えば、「氏名」という属性については、氏名として用いられる文字列の例を知識データベースとして記憶しておけばよい。文字認識によって得られた文字列が、この知識データベースに存在する場合には、その文字列は氏名を表していると推測することが可能となる。
【0011】
文字列の内容は、その他、記載内容の規則性に基づいて解析しても良い。例えば、10〜11桁の数字列であれば「電話番号」と推測することができる。7桁の数字列であれば、「郵便番号」と推測することができる。「市」、「町」、「区」などの行政界を表す文字が含まれている場合には、「住所」であると推測することができる。
【0012】
特定の人物、建造物、物品など、一つの対象物について複数種類の情報を記入するための記入欄を有する帳票を対象とする場合、文字列の内容解析には、複数の記入欄に記載された内容相互の関係を考慮してもよい。例えば、上述の複数種類の情報を、複数の対象物について登録した登録データベースを用意し、筆記データ入力装置は、このデータベースを参照可能とする。登録データベースには、例えば、所定の地域内の氏名、住所等を登録した住民データベースなどが含まれる。筆記データ入力装置は、複数箇所に記載された文字列について、登録データベースを参照して、文字認識および内容の解析を行うことにより、解析の精度を向上することができる。
【0013】
一例として、氏名と住所を含む帳票に記入された文字列の解析を行う場合を考える。氏名の文字認識が正常に終了した場合には、登録データベースを参照することにより、その氏名に該当する住所を特定することができる。筆記データから認識された住所の一部が、この特定された住所と一致する場合には、筆記データ中に認識不能な文字が含まれていたとしても、その文字列は「住所」であると判断することが可能となる。
【0014】
帳票には、予め帳票に印刷された選択枝に所定のマークを記載するマーク欄が含まれる場合がある。マーク欄には、例えば、「男」、「女」に対応するチェックボックス等が設けられた性別欄などが含まれる。かかる帳票を対象とする場合、筆記データ入力装置は、マーク欄とは異なる記入欄の記載内容に基づいて登録データベースを参照して、マーク欄に記載されるべき内容を特定してもよい。筆記データ入力装置は、筆記されたマークが、特定された内容に対応する選択枝に一致するように補正を行うことにより、補正の精度を向上することができる。
【0015】
帳票には、例えば、氏名のふりがな欄や、電話番号、郵便番号の記入欄のように、記入欄に対して、文字列の記入位置が規定されている場合がある。かかる帳票を対象とする場合、筆記データ入力装置は、各文字列がこの記入位置に適合するように補正を行ってもよい。こうすることにより、補正精度を向上することができる。
【0016】
帳票には、複数の記入欄が用意されている場合がある。かかる場合に、帳票データとして、記入欄の相対的な位置関係を特定可能な情報を記憶し、文字列の相対的な位置関係と、記入欄の相対的な位置関係に基づいて両者の対応付けを行うようにしてもよい。例えば、複数の記入欄について、相対的な位置関係に基づき、代表点間の距離が特定可能な場合には、これらの記入欄には、この距離に近い距離で記入されている文字列をそれぞれ対応づける方法を採ることができる。相対的な位置関係は、距離のみならず、方向を考慮してもよい。この態様において、相対的な位置関係を特定可能な情報は、例えば、一つの記入欄を基準とする相対的な距離および方向などの形で記憶しておいてもよいし、各記入欄の絶対座標を記憶しておいてもよい。
【0017】
文字列と記入欄の対応付けは、上述の位置関係のみに基づいて特定するようにしてもよいし、他の規則を併せて考慮して特定するようにしてもよい。例えば、先に説明した種々の規則に基づいて文字列と記入欄の対応付けについて、上述の位置関係に基づいて、誤りの有無を確認する方法を採っても良い。対応付けが誤っている場合には、自動的に対応関係を修正してもよいし、オペレータに警告を報知した後、対応関係を修正するようにしてもよい。
【0018】
帳票に複数の記入欄が用意されている場合、記入欄について想定される記入順序に基づいて対応付けを行うようにしてもよい。記入順序は、例えば、「1番目」、「2番目」などの形で記入欄ごとに特定してもよいし、「上から」、「下から」、「大きい順」などの規則で特定してもよい。不特定の利用者が帳票への記入を行う場合、記入順序については、必ずしも遵守されるとは限らないことを考慮し、上述した種々の規則を併用して、対応づけの修正を行うようにしてもよい。
【0019】
各記入欄について想定される文字数の範囲、文字の種別、記入方向の少なくとも一つで特定される記入態様に基づき、文字列と記入欄の対応付けを行うようにしてもよい。文字数の範囲は、例えば、氏名欄については「2〜6文字」など、各記入欄に記入すべき事項について、妥当な文字数を適宜、設定すればよい。文字の種別とは、漢字、ひらがな、カタカナ、数字などを意味し、「フリガナ」欄についてはカタカナ、電話番号欄については数字のように、記入欄の内容に応じて設定することができる。記入方向とは、縦書き、横書きの区別を意味し、記入欄の内容に応じて設定することができる。
【0020】
文字列と記入欄とを対応付けるための規則は、上述した規則以外にも種々の設定が可能である。例えば、各文字列を最も近傍の記入欄に対応づけるようにしてもよい。同一の記入欄に重複して対応づけられた文字列の有無に基づいて、対応関係の適否を判断するようにしてもよい。
【0021】
帳票に複数の記入欄が設けられている場合、筆記データ入力装置は、必ずしも全記入欄の筆記データを考慮して補正を行う必要はなく、複数の記入欄のうち予め指定された記入欄に基づいて補正を行うようにしてもよい。この記入欄は、筆記データ入力装置のユーザが帳票に応じて指定可能とすることが好ましい。補正に使用する記入欄は、筆記データの入力時にユーザが指定してもよいし、帳票データに登録可能としてもよい。
【0022】
本発明では、筆記データに含まれるいずれかの文字列について、文字列の並ぶ方向と記入欄との偏角を推定可能とすることが好ましい。筆記データ入力装置は、平行移動だけでなく、偏角に応じたスキュー補正を行うことにより、筆記データを更に精度良く、記入欄に一致させることが可能となる。スキュー補正は、種々のタイミングで行うことができる。筆記データの文字認識を行う場合には、文字認識前にスキュー補正を行うことにより、認識精度を向上させることができる。
【0023】
帳票が複数の記入欄を有する場合、本発明の筆記データ入力装置は、筆記データ全体を一体的に補正してもよい。この場合の補正量は、例えば、いずれか一つの記入欄の補正量を適用してもよいし、それぞれの記入欄について定まる補正量を総合的に考慮して決定してもよい。後者の態様としては、例えば、各記入欄の補正量の平均値を、全体の補正に適用する補正量、即ち全体補正量とする方法が挙げられる。
【0024】
全体の補正量は、種々のタイミングで決定することができる。例えば、一つの記入欄に対する補正量が決定される度に、全体補正量を更新する方法を採ってもよい。全記入欄に対する補正量が決定された後、全体補正量を求める方法を採ってもよい。
【0025】
本発明の筆記データ入力装置は、必ずしも筆記データ全体を一体的に補正するもの必要はなく、各記入欄に対する文字列について、個別に補正を施してもよい。こうすれば、各記入欄について、より精度の高い補正が可能となる。
【0026】
帳票データが、帳票を画像として出力可能な帳票画像データを含んでいる場合、本発明の筆記データ入力装置は、帳票画像データとストロークデータとを重ね合わせた合成画像を表す合成画像データを、所定の出力装置に出力したり、所定の記憶装置に記憶したりできるようにしてもよい。出力装置としてはディスプレイその他の表示装置、プリンタなどの印刷装置が挙げられる。記憶装置は、筆記データ入力装置内に供えられたハードディスクなどのメモリとしてもよいし、ネットワーク等で接続された外部のサーバであってもよい。記憶装置への保存時には、合成画像データを、圧縮してもよい。こうすることで、筆記された状態の帳票データを電子的に保存し、活用することができる。表示装置に合成画像データを表示する場合、オペレータが結果を確認した上で、必要に応じて、ストロークデータの位置を微修正できるようにしてもよい。
【0027】
本発明は、上述した自動取引装置および管理装置に限らず種々の態様で構成することが可能である。例えば、筆記データ入力方法として構成してもよい。コンピュータにインストールすることで、筆記データ入力装置を実現するためのコンピュータプログラム、およびこれを記録した記憶媒体として構成してもよい。ここで、記憶媒体としては、フレキシブルディスクやCD−ROM、DVD、光磁気ディスク、ICカード、ROMカートリッジ、パンチカード、バーコードなどの符号が印刷された印刷物、コンピュータの内部記憶装置(RAMやROMなどのメモリ)および外部記憶装置などコンピュータが読取り可能な種々の媒体を利用できる。
【0028】
【発明の実施の形態】
以下、本発明の実施の形態について、以下の項目に分けて説明する。
A.システム構成:
B.機能ブロック:
C.入力処理:
D.変形例:
【0029】
A.システム構成:
図1は実施例としての筆記データ入力システムの概略構成を示す説明図である。このシステムは、筆記データ入力装置として機能する汎用のパーソナルコンピュータ100に、筆記データ取得デバイス20を接続して構成される。本システムは、帳票Pに筆記されたデータをコンピュータ100に取り込み、ディスプレイ上に表示させることができる。本実施例では、帳票Pとして、役所での住民が記入するための申請書を例にとって、装置構成および処理内容を説明する。
【0030】
筆記データ取得デバイス20は、帳票Pを挟むことができるクリップ状の装置であり、帳票Pを挟む辺上には、超音波センサ21L、21Rが設けられている。通常のペンのように筆記することができるとともに、ペン先近傍から超音波を発信する機能を有するディジタルペン10で、帳票Pに筆記すると、超音波センサ21L、21Rは、この超音波に基づいてペン先の位置を、既定されたx、y軸に基づき二次元的に特定する。筆記データ取得デバイス20は、ペン先の位置を数十ヘルツの周波数で取得することにより、筆記された文字を表す筆記データを取得することができる。この筆記データは、ケーブル22を介してコンピュータ100に伝送される。
【0031】
コンピュータ100は、帳票Pを表示するためのデータであるフォーマット定義120を参照することができる。コンピュータ100は、図中に例示するように、フォーマット定義120に基づいて再現される帳票Pの画像と、筆記データ取得デバイス20から取得された筆記データとを重ね合わせて表示する。この際、コンピュータ100は、筆記データの座標系(以下、「入力座標系」と称する)とフォーマット定義120で既定された帳票Pの座標系(以下、「帳票座標系」と称する)を一致させる補正を施すことにより、記入欄内に筆記データが収まった状態での表示を実現する。
【0032】
B.機能ブロック:
図2は筆記データ入力システムを実現するための機能ブロックを示す説明図である。コンピュータ100内の各機能は、本実施例では、筆記データ入力装置としての機能を実現するためのコンピュータプログラムをインストールすることにより、ソフトウェア的に構成される。
【0033】
筆記データの処理に際し、コンピュータ100は、フォーマット定義120および住民データベース122を参照する。フォーマット定義120は、帳票Pの記入欄の構成、記入すべき内容などを記憶したデータベースである。住民データベース122は、帳票Pへの記入を行う住民について、氏名、住所などの基本的な情報を記憶したデータベースである。本実施例では、これらのデータベースは、コンピュータ100にネットワーク接続されたサーバによって提供するものとした。DB参照部108は、ネットワークを介して、これらのデータベースの情報を参照する機能を奏する。これらのデータベースは、CD−ROMなどの記録媒体によって提供してもよいし、コンピュータ100のハードディスク内に保持しておいてもよい。
【0034】
筆記データ入力部102は、筆記データ取得デバイス20から筆記データを入力する。筆記データの入力は、帳票Pへの記入が完了した時点で行うことも可能ではあるが、本実施例では、記入中に随時、入力するものとした。
【0035】
筆記データ保存部112は、この筆記データをハードディスク等に保存、管理する。保存された筆記データには、解析部104および補正部106によって、種々の処理が施される。解析部104は、筆記データに含まれる文字列について、文字認識を行い、記載内容を解析し、入力座標系と帳票座標系を一致させるための補正量を決定する。文字認識辞書114は、文字認識時に参照されるデータベースであり、筆記データとしての文字の形状と、文字コードとを対応づけて記憶している。知識辞書116は、同じく、文字認識時に参照されるデータベースであり、氏名として使用される単語、住所として使用される単語などを、これらのグループに分類して記憶している。解析部104は、文字認識および記載内容の解析時に、フォーマット定義120、住民データベース122を参照する。後で詳述するように、知識辞書116、フォーマット定義120、住民データベース122を参照することにより、文字の形状のみならず、単語としての成否、記入欄間の記載内容の関係などを併せて判断することができるため、識字率を向上させることができる。
【0036】
補正部106は、解析部によって決定された補正量を受けて、筆記データの補正を行う。本実施例では、文字列の傾きの補正(以下、「スキュー補正」と称する)、および文字列の平行移動の2種類の補正が行われる。
【0037】
表示部110は、筆記データ保存部112のデータおよびフォーマット定義120に基づき、帳票Pに筆記された文字を重ね合わせた状態でディスプレイ上に表示させる。本実施例では、補正部106の表示が完了するか否かに関わらず、随時、筆記データ保存部112のデータを用いて表示を行うものとした。従って、補正完了前は、文字が本来の位置からずれて、記入欄からはみ出した状態で表示される場合もある。補正部106による補正が施されることにより、このずれは修正され、記入欄内に文字が収まった状態での表示が行われる。表示部110は、補正が完了した後にのみ表示を行うよう構成しても構わない。
【0038】
図3はフォーマット定義120のデータ構造を示す説明図である。図の上方には、説明の便宜上、帳票Pの記入欄を例示した。「**申請書」なるこの帳票には、氏名欄、性別欄、住所欄、電話番号欄などが含まれている。性別欄には、性別に応じたチェックマークが用意されており、電話番号欄には、電話番号を一桁ずつ記入するための個別文字枠が用意されている。
【0039】
フォーマット定義120は、図の下方に示すように、記入欄構造120aと表示データ120bを含んでいる。これらのデータは、複数種類の帳票について、帳票ごとに用意されている。
【0040】
記入欄構造120aでは、利用者が文字を記入する記入欄について、位置、属性、規則が規定されている。記入欄の位置としては、帳票の左上角を原点とするx、y座標系、即ち帳票座標系において枠の左上および右下の座標値が記憶されている。属性は、各記入欄に記入されるべき内容を特定する情報である。規則は、記入欄への記入時の規則である。本実施例では、氏名、住所については規則なし、電話番号については、12桁の個別文字枠に対して左詰で記入する規則が設定されている場合を例示した。
【0041】
表示データ120bは、帳票の種類ごとに、表示時に使用する表示用データのファイルを対応づけている。このデータファイルは、例えば、ビットマップその他の画像ファイルであってもよいし、ワープロソフトや表計算ソフトのデータファイルであってもよい。表示用データは、記入欄の位置の他、「**申請書」、「氏名」、「住所」等の見出しなども表示できるよう作成されている。
【0042】
図4は住民データベース122のデータ構造を示す説明図である。住民データベース122は、住民ごとに、識別番号、氏名、住所、電話番号、性別などの基本的な情報を記録したレコードを格納している。
【0043】
C.入力処理:
図5は筆記データ入力処理のフローチャートである。筆記データ取得デバイス20からの筆記データ受信をトリガとして、コンピュータ100が実行する処理である。
【0044】
この処理が開始されると、コンピュータ100は、筆記データを読み込む(ステップS10)。本実施例では、次の行の筆記が開始された時点で、1行分の筆記データの読み込みが完了したと判断し、次の処理に移行する。
【0045】
コンピュータ100は、スキュー補正、即ち入力された文字列の傾きの補正を行う(ステップS12)。図中に傾き補正の方法を模式的に示した。入力された文字列については、その下側に接する線を求めることにより、文字列の記載されている方向を特定することができる。この方向と帳票座標系におけるx軸となす角度が、文字列の傾き角θである。コンピュータ100は、所定の原点周りに文字列を「−θ」回転することで傾きの補正を行う。回転時の原点は任意に設定可能であり、例えば、帳票座標系の原点としてもよいし、文字列の左下としてもよい。文字列の傾き角θは、上述の方法のみならず、種々の方法で推定可能である。
【0046】
コンピュータ100は、スキュー補正が完了すると、記入された文字列の文字認識および内容解析を行う(ステップS14)。この処理では、コンピュータ100は、文字認識辞書114を参照して文字単位での認識候補を選択するとともに、知識辞書116を参照して、単語としての成否を確認し、候補の絞り込みを行う。知識辞書116の内容は、氏名として使用される単語、住所として使用される単語などに分類されているため、知識辞書116を参照することで、筆記データの記載内容が氏名、住所のいずれに該当するかを特定することができる。
【0047】
文字認識の際に、住民データベース122を併せて参照してもよい。例えば、氏名が既に特定されている場合には、その氏名に該当する住所を住民データベース122から検索することにより、住所の文字認識に有効活用することができる。住民データベース122は、性別のチェックマークように、その欄の筆記データだけからは、記載内容の特定ができない場合にも有効活用することができる。例えば、性別については、筆記データではなく、氏名に基づいて住民データベース122を検索して特定するようにしてもよい。
【0048】
文字認識の際に、フォーマット定義120を併せて参照してもよい。フォーマット定義120を参照すれば、帳票に含まれている記入欄の種類を特定することができる。この特定結果により、コンピュータ100は、知識辞書116を参照する分類を際の絞り込むことができ、処理の高速化を図ることができる。例えば、住所の記入欄を有しない帳票については、コンピュータ100は、知識辞書116について、住所に関する分類の参照を省略することが可能となる。
【0049】
文字認識および内容解析が完了すると、コンピュータ100は、この結果に基づいて、文字列の記載内容に対応する記入欄を特定する(ステップS16)。この処理では、コンピュータ100は、フォーマット定義120を参照する。フォーマット定義120には、図3に示した通り、各記入欄の記載内容を表す属性データが保持されている。コンピュータ100は、解析された記載内容に対応する属性を有する記入欄を選択する。
【0050】
次に、コンピュータ100は、特定された記入欄と文字列とのずれ量を求め(ステップS18)、このずれの補正および表示を行う(ステップS20)。ずれ量は、例えば、文字列の代表点の座標値と、記入欄の代表点の座標値との差分によって特定される。これらの代表点は、任意に設定可能であり、例えば、文字列の代表点は文字列の左下、記入欄の代表点は左下角から任意幅だけずらした位置とすることができる。コンピュータ100は、以上の処理を全行にわたって行い(ステップS22)、筆記データ入力処理を完了する。帳票の表示に代えて、または帳票の表示と共に、筆記データを重ね合わせた帳票の印刷、座標を補正した筆記データの保存を行っても良い。
【0051】
ずれ量の補正時には、記入欄ごとの規則を考慮してもよい。例えば、電話番号のように左詰の個別文字枠が用意されている場合には、各文字ごとに、個別文字枠内にいれるための補正量を求め、この平均値を文字列に対する補正量とすることができる。
【0052】
本実施例では、文字列の行間なども含めて筆記データを原状に近い状態で保存するため、傾き補正(ステップS12)、ずれ補正(ステップS20)は、筆記データ全体について一体的に施すものとした。このため、コンピュータ100は、2行目以降の処理時には、処理対象となっている文字列について傾き角、ずれ量を求め、従前の処理で設定された値との平均値を、全体の補正に用いる傾き角θ、ずれ量に設定する。補正に用いる傾き角θ、ずれ量は、必ずしも平均値とする必要はなく、記入欄ごとに重みを加えた加重平均など、種々の算出結果を用いることができる。
【0053】
図6はずれ量の補正例を示す説明図である。帳票の氏名、住所、電話、性別欄を拡大した状態を例示した。図中には、ずれ補正を施す前の筆記データを併せて例示した。コンピュータ100は、知識辞書116を参照することにより、「山田」を含む文字列は「氏名」であると判断することができる。コンピュータ100は、フォーマット定義120を参照して、「山田一」という文字列と氏名欄とを対応づけると、ずれ量を決定する。図の例では、「山田一」という文字列の上下左右に所定の余白を見込んで設定された文字枠の左下を代表点とし、この代表点を記入欄の代表点P2に移動させるためのベクトル(cx1、cy1)がずれ量となる。この例では、代表点P2は、記入欄左下角P1からx方向に「dx」、y方向に「−dy」だけずらした点と規定した。右詰で記入すべき記入欄については、文字列の右下、記入欄の右下に基づいて代表点を設定してもよい。同様にして住所欄については、ベクトル(cx2、cy2)がずれ量となる。文字列の代表点、記入欄の代表点は、それぞれ左下に限らず、左上、高さ中心など任意に設定可能である。
【0054】
性別について、コンピュータ100は、住民データベース122(図4)を参照することにより、「山田一」なる人物は「男」であると特定することができる。従って、コンピュータ100は、記入されたマークの重心および帳票における破線の円の中心を代表点とし、両者を一致させるためのベクトル(cx3、cy3)をずれ量として決定する。
【0055】
コンピュータ100は、こうして求められた各ずれ量の平均値、即ち( (cx1+cx2+cx3)/3、(cy1+cy2+cy3)/3 )を全体のずれ量として設定し、補正を施す。ずれ量は、必ずしも平均値とする必要はなく、記入欄ごとに重みを加えた加重平均など、種々の算出結果を用いることができる。
【0056】
図7は補正後の帳票画像の表示例を示す説明図である。パーソナルコンピュータ100に表示されたウィンドウDISP内に、図6に対応する帳票画像IMGが表示されている状態を示した。この帳票画像IMGは、フォーマット定義120の表示データ120bと、筆記データを合成して生成される。帳票画像IMGでは、上述の補正により、氏名、住所、性別の筆記データは、それぞれ帳票内の所定の枠内に記入されている。このように、本実施例の筆記データ入力システムによれば、利用者が、帳票に一行記入するごとに、文字列の表示位置全体が補正される。この補正により、筆記データ入力システムは、筆記データが記入欄に収まった状態での帳票を表示することができる。表示データ120bと筆記データを合成した帳票画像IMGは、プリンタで印刷可能としてもよいし、この状態で画像データとして保存可能としてもよい。保存先としては、パーソナルコンピュータ100のハードディスク、フレキシブルディスクなどの記憶媒体、ネットワークで接続されたサーバなどが挙げられる。保存時の画像データとしては、ビットマップ、JPEG、GIFなどの種々のフォーマットを適用可能である。
【0057】
D.変形例:
(1) 実施例では、各行から得られた傾き角、ずれ量の平均値で全体の補正量を決定した。全体の補正量は、種々の方法で設定可能である。例えば、記入欄からの文字のはみ出しが最も少なくなるよう補正量を設定してもよい。かかる補正は次の方法で実現することができる。コンピュータ100は、例えば、各行については、実施例で求めた補正量の他、記入欄から文字がはみださないように補正するための下限値、上限値を求めておく。図6の例では、氏名の文字列の代表点と、氏名欄の左下の代表点P1のずれ量がy方向についての下限値、およびx方向の下限値となる。また、この文字列の右上の角と氏名欄の右上の角のずれ量がy方向についての上限値、およびx方向についての上限値となる。こうして設定された上下限値で規定される範囲から逸脱する量が十分小さくなるよう、全体の補正量を設定すればよい。
【0058】
(2) 実施例では、筆記データ全体について一体的に補正を施す場合を例示した。本発明は、各行が入力されるごとに、行単位で個別に補正を施しても良い。
【0059】
(3) 文字列と記入欄とを対応づけるための規則は、必ずしも記入欄の属性を参照しなくてもよい。例えば、一般には帳票の上側の記入欄から記入が行われるという仮定の下、入力された文字列を順に上方の記入欄から対応づけてもよい。図6の例では、最初に記入された文字列を「氏名」、2番目に記入された文字列を「住所」に対応づけることになる。かかる規則では、例えば、利用者が住所欄への記入を最初に行った場合、その時点では、文字列は「氏名」欄に誤って対応づけられるが、その後、氏名の記入を行った時点で、正しい対応づけに修正することができる。想定される記入順序は帳票の内容に応じて任意に設定可能である。
【0060】
(4) 文字列と記入欄は、記載された文字数に基づいて対応づけても良い。一般に氏名欄は住所欄よりも記載される文字数が少ない。従って、複数行の文字列に対して、文字数の少ない順に「氏名」、「住所」を対応づけるようにしてもよい。また、文字数の他、文字の種別、記入方向などに基づいて対応付けを行うようにしてもよい。
【0061】
(5) 実施例では、役所で記入する帳票を例にとって説明したが、本発明は、金融機関で使用される帳票など、種々の帳票を対象とすることができる。知識辞書116および住民データベース122は、帳票の種類に応じて、適切なものを選択すればよい。例えば、金融機関で使用される帳票を対象とする場合には、住民データベース122に代えて、顧客の氏名、口座番号等を管理する顧客データベースを用いることができる。
【0062】
(6) 実施例では、図1に示した遠隔的に筆記データを取得するデバイスを用いる例を示した。筆記データ取得デバイス20は、この他、タブレットなど種々のデバイスが利用可能である。
【0063】
(7) 実施例では、傾き角θやずれ量は各行について求めるものとしたが、いずれか一つの行を対象として求めても良い。例えば、一般に傾き角θの精度は、文字数が多い文字列の方が高いため、住所など、既定数以上の文字が記入されている行について傾き角θを求め、この値を各行の補正に適用してもよい。このように代表的に使用される行については、予め固定としてもよいし、筆記データ入力装置100のオペレータが指定可能としてもよい。後者の場合、筆記データの入力を行うたびに、オペレータが指定するようにしてもよいし、フォーマット定義120に、他の情報と併せて登録しておいてもよい。
【0064】
(8) 記入欄の相対的な位置関係を特定可能な情報を記憶し、文字列の相対的な位置関係と、記入欄の相対的な位置関係に基づいて、次の手順で、両者の対応付けを行うようにしてもよい。例えば、各記入欄の代表点を左上の角とする場合、図3に示したフォーマット定義によれば、氏名欄を基準とする住所欄の相対的な位置は(x3−x1,y3−y1)と求められる。こうして求められた位置関係に近い文字列を特定することにより、これらの文字列を氏名欄、住所欄に対応づけることができる。相対的な位置関係は、方向、距離など種々のパラメータによって表すことができる。
【0065】
(9) 相対的な位置関係による対応付けは、文字列と記入欄の対応付けの適否の判断に利用してもよい。つまり、文字列と記入枠についての相対的な位置関係が一致しない場合には、対応関係が誤っていると判断することができる。対応付けが誤っている場合には、自動的に対応関係を修正してもよいし、オペレータに警告を報知した後、対応関係を修正するようにしてもよい。
【0066】
(10) 文字列と記入欄は、他にも種々の規則に基づいて対応づけることが可能である。例えば、各文字列を最も近傍の記入欄に対応づけるようにしてもよい。一つの記入欄に重複して対応づけられる文字列の有無によって、対応関係の適否を判断するようにしてもよい。
【0067】
以上、本発明の種々の実施例について説明したが、本発明はこれらの実施例に限定されず、その趣旨を逸脱しない範囲で種々の構成を採ることができることはいうまでもない。
【0068】
【発明の効果】
本発明によれば、入力された筆記データの補正によって、利用者が特別な操作を行うまでなく、筆記データの座標を、帳票座標系に適合させることができる。この結果、記入欄内に、筆記データを収めた状態で、帳票の出力を行うことが可能となる。
【図面の簡単な説明】
【図1】実施例としての筆記データ入力システムの概略構成を示す説明図である。
【図2】筆記データ入力システムを実現するための機能ブロックを示す説明図である。
【図3】フォーマット定義120のデータ構造を示す説明図である。
【図4】住民データベース122のデータ構造を示す説明図である。
【図5】筆記データ入力処理のフローチャートである。
【図6】ずれ量の補正例を示す説明図である。
【図7】補正後の帳票画像の表示例を示す説明図である。
【符号の説明】
10…ディジタルペン
20…筆記データ取得デバイス
21R、21L…超音波センサ
22…ケーブル
100…コンピュータ
102…筆記データ入力部
104…解析部
106…補正部
108…DB参照部
110…表示部
112…筆記データ保存部
114…文字認識辞書
116…知識辞書
120…フォーマット定義
120a…記入欄構造
120b…表示データ
122…住民データベース

Claims (15)

  1. 記入欄を有する帳票に筆記された文字列を、入力する筆記データ入力装置であって、
    入力用に既定された入力座標系で前記筆記された文字列を表すストロークデータを取り込むストロークデータ入力部と、
    前記帳票の様式を既定の帳票座標系で記憶した帳票データを参照する帳票データ参照部と、
    該筆記された文字列を帳票中のいずれかの記入欄に対応付ける所定の規則に基づいて、前記帳票座標系において、前記文字列が前記記入欄に収まるよう前記ストロークデータの座標値を補正する補正部とを備える筆記データ入力装置。
  2. 請求項1記載の筆記データ入力装置であって、
    前記ストロークデータに基づき、前記文字列の文字認識を行って、該文字列の記載内容を解析する内容解析部を備え、
    前記帳票データは、前記記入欄に対して、該記入欄に記入すべき内容を表す属性データを記憶しており、
    前記補正部は、前記解析された記載内容と前記属性データが一致するよう前記文字列と記入欄とを対応づけて、前記補正を行う筆記データ入力装置。
  3. 請求項2記載の筆記データ入力装置であって、
    前記帳票に含まれる複数の記入欄は、一つの対象物に関する複数種類の情報を記入するために設けられており、
    複数の対象物について、前記複数種類の情報を登録した登録データベースを参照する登録データ参照部を備え、
    前記内容解析部は、複数箇所の文字列について、前記登録データベースを参照して、前記文字認識および記載内容の解析を行う筆記データ入力装置。
  4. 請求項3記載の筆記データ入力装置であって、
    前記帳票に含まれる複数の記入欄は、更に、予め帳票に印刷された選択枝に所定のマークを記載するマーク欄を有しており、
    前記内容解析部は、前記マーク欄とは異なる記入欄の記載内容に基づいて前記登録データベースを参照し、該マーク欄に記載されるべき内容を特定し、
    前記補正部は、前記マーク欄について、前記筆記されたマークが、前記特定された内容に対応する選択枝に一致するよう、前記補正を行う筆記データ入力装置。
  5. 請求項1記載の筆記データ入力装置であって、
    前記帳票データには、前記記入欄に対して、文字列の記入位置が規定されており、
    前記補正部は、更に、前記記入位置に適合するように前記補正を行う筆記データ入力装置。
  6. 請求項1記載の筆記データ入力装置であって、
    前記帳票は複数の記入欄を有しており、
    前記帳票データは、該記入欄の相対的な位置関係を特定可能な情報を記憶しており、
    前記補正部は、前記文字列の相対的な位置関係と、前記記入欄の相対的な位置関係に基づいて前記対応付けを行う筆記データ入力装置。
  7. 請求項1記載の筆記データ入力装置であって、
    前記帳票は複数の記入欄を有しており、
    前記帳票データは、該記入欄について想定される記入順序を記憶しており、
    前記補正部は、前記文字列の記入順序に基づいて前記対応付けを行う筆記データ入力装置。
  8. 請求項1記載の筆記データ入力装置であって、
    前記帳票データは、該記入欄について想定される文字数の範囲、文字の種別、記入方向の少なくとも一つで特定される記入態様を記憶しており、
    前記補正部は、前記文字列の記入態様に基づいて前記対応付けを行う筆記データ入力装置。
  9. 請求項1記載の筆記データ入力装置であって、
    前記帳票は複数の記入欄を有しており、
    前記補正部は、該複数の記入欄のうち予め指定された記入欄に基づいて前記補正を行う筆記データ入力装置。
  10. 請求項1記載の筆記データ入力装置であって、
    前記ストロークデータに含まれるいずれかの文字列について、文字列の並ぶ方向と前記記入欄との偏角を推定する偏角推定部を備え、
    前記補正部は、前記ストロークデータに対し、該偏角に応じたスキュー補正、および平行移動を行う筆記データ入力装置。
  11. 請求項1記載の筆記データ入力装置であって、
    前記帳票は複数の記入欄を有し、
    前記補正部は、それぞれの記入欄について前記所定の規則によって定まる補正量に基づいて、前記ストロークデータ全体に施すべき補正量を決定する筆記データ入力装置。
  12. 請求項1記載の筆記データ入力装置であって、
    前記帳票は複数の記入欄を有し、
    前記補正部は、各記入欄に対する文字列について、個別に前記補正を施す筆記データ入力装置。
  13. 請求項1〜12いずれか記載の筆記データ入力装置であって、
    前記帳票データは、前記帳票を画像として出力可能な帳票画像データを含んでおり、
    該帳票画像データと前記ストロークデータとを重ね合わせた合成画像を表す合成画像データを、所定の出力装置に出力、または所定の記憶装置に記憶させる出力部を供える筆記データ入力装置。
  14. 記入欄を有する帳票に筆記された文字列を、コンピュータが取り込む筆記データ入力方法であって、
    入力用に既定された入力座標系で前記筆記された文字列を表すストロークデータを取り込む工程と、
    前記帳票の様式を既定の帳票座標系で記憶した帳票データを参照する工程と、
    該筆記された文字列を帳票中のいずれかの記入欄に対応付ける所定の規則に基づいて、前記帳票座標系において、前記文字列が前記記入欄に収まるよう前記ストロークデータの座標値を補正する工程とを備える筆記データ入力方法。
  15. 記入欄を有する帳票に筆記された文字列を、取り込むためのコンピュータプログラムであって、
    入力用に既定された入力座標系で前記筆記された文字列を表すストロークデータを取り込む機能と、
    前記帳票の様式を既定の帳票座標系で記憶した帳票データを参照する機能と、
    該筆記された文字列を帳票中のいずれかの記入欄に対応付ける所定の規則に基づいて、該様式との関係で予め設定された所定の規則に基づいて、前記帳票座標系において、前記文字列が前記記入欄に収まるよう前記ストロークデータの座標値を補正する機能とをコンピュータに実現させるためのコンピュータプログラム。
JP2003198278A 2003-07-17 2003-07-17 筆記データ入力装置 Pending JP2005038077A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003198278A JP2005038077A (ja) 2003-07-17 2003-07-17 筆記データ入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003198278A JP2005038077A (ja) 2003-07-17 2003-07-17 筆記データ入力装置

Publications (1)

Publication Number Publication Date
JP2005038077A true JP2005038077A (ja) 2005-02-10

Family

ID=34208101

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003198278A Pending JP2005038077A (ja) 2003-07-17 2003-07-17 筆記データ入力装置

Country Status (1)

Country Link
JP (1) JP2005038077A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007293659A (ja) * 2006-04-26 2007-11-08 Hitachi Omron Terminal Solutions Corp 帳票処理装置
JP2011170547A (ja) * 2010-02-17 2011-09-01 Oki Electric Industry Co Ltd 情報処理システム、情報処理方法および情報処理装置
JP2013041388A (ja) * 2011-08-15 2013-02-28 Fujitsu Marketing Ltd レシート定義データ作成装置およびそのプログラム
JP2013509662A (ja) * 2009-11-02 2013-03-14 ビーデージービー・エンタープライズ・ソフトウェア・エスエーアールエル 動的変動ネットワークを使用するシステムおよび方法
JP2013134728A (ja) * 2011-12-27 2013-07-08 Ricoh Co Ltd 手書き文字入力装置並びにこれを構成する遠隔装置及び電子情報端末
JP2014215972A (ja) * 2013-04-30 2014-11-17 日本ユニシス株式会社 伝票重ね合せシステム
JP2015011587A (ja) * 2013-06-28 2015-01-19 キヤノン株式会社 情報処理装置、文書合成システム、情報処理方法、及びプログラム
US9141691B2 (en) 2001-08-27 2015-09-22 Alexander GOERKE Method for automatically indexing documents
US9152883B2 (en) 2009-11-02 2015-10-06 Harry Urbschat System and method for increasing the accuracy of optical character recognition (OCR)
US9159584B2 (en) 2000-08-18 2015-10-13 Gannady Lapir Methods and systems of retrieving documents
US9158833B2 (en) 2009-11-02 2015-10-13 Harry Urbschat System and method for obtaining document information
WO2016174952A1 (ja) * 2015-04-27 2016-11-03 ブラザー工業株式会社 筆記データ処理装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9159584B2 (en) 2000-08-18 2015-10-13 Gannady Lapir Methods and systems of retrieving documents
US9141691B2 (en) 2001-08-27 2015-09-22 Alexander GOERKE Method for automatically indexing documents
JP2007293659A (ja) * 2006-04-26 2007-11-08 Hitachi Omron Terminal Solutions Corp 帳票処理装置
JP2013509662A (ja) * 2009-11-02 2013-03-14 ビーデージービー・エンタープライズ・ソフトウェア・エスエーアールエル 動的変動ネットワークを使用するシステムおよび方法
US9152883B2 (en) 2009-11-02 2015-10-06 Harry Urbschat System and method for increasing the accuracy of optical character recognition (OCR)
US9158833B2 (en) 2009-11-02 2015-10-13 Harry Urbschat System and method for obtaining document information
US9213756B2 (en) 2009-11-02 2015-12-15 Harry Urbschat System and method of using dynamic variance networks
JP2011170547A (ja) * 2010-02-17 2011-09-01 Oki Electric Industry Co Ltd 情報処理システム、情報処理方法および情報処理装置
JP2013041388A (ja) * 2011-08-15 2013-02-28 Fujitsu Marketing Ltd レシート定義データ作成装置およびそのプログラム
JP2013134728A (ja) * 2011-12-27 2013-07-08 Ricoh Co Ltd 手書き文字入力装置並びにこれを構成する遠隔装置及び電子情報端末
JP2014215972A (ja) * 2013-04-30 2014-11-17 日本ユニシス株式会社 伝票重ね合せシステム
JP2015011587A (ja) * 2013-06-28 2015-01-19 キヤノン株式会社 情報処理装置、文書合成システム、情報処理方法、及びプログラム
WO2016174952A1 (ja) * 2015-04-27 2016-11-03 ブラザー工業株式会社 筆記データ処理装置
JP2016207092A (ja) * 2015-04-27 2016-12-08 ブラザー工業株式会社 筆記データ処理装置
US10551942B2 (en) 2015-04-27 2020-02-04 Brother Kogyo Kabushiki Kaisha Writing data processing device for correcting position discrepancies in characters

Similar Documents

Publication Publication Date Title
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
US11182604B1 (en) Computerized recognition and extraction of tables in digitized documents
US7926732B2 (en) OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
US20090226090A1 (en) Information processing system, information processing apparatus, information processing method, and storage medium
JP4183527B2 (ja) 帳票定義データ作成方法および帳票処理装置
JP2008276766A (ja) フォーム自動埋込方法及び装置
CN108597565B (zh) 一种基于ocr与命名实体提取技术的临床队列数据协同校验方法
JP2005038077A (ja) 筆記データ入力装置
US11120256B2 (en) Method of meta-data extraction from semi-structured documents
US9298685B2 (en) Automatic creation of multiple rows in a table
JPH1011531A (ja) 帳票読取装置
JP2019185137A (ja) 画像処理装置、画像処理方法およびプログラム
WO2019194026A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
US20110225526A1 (en) System and Method for Processing Objects
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
JP2008234291A (ja) 文字認識装置及び文字認識方法
WO2019194052A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
JP4474231B2 (ja) 文書リンク情報取得システム
JP6784274B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2021012741A (ja) 画像処理装置、画像処理方法およびプログラム
EP3287952A1 (en) Input control program, input control device, input control method, character correction program, character correction device, and character correction method
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2021152696A (ja) 情報処理装置及びプログラム
JP2007280413A (ja) 財務諸表自動入力装置
JP4213558B2 (ja) 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050124