JP2005209076A - 文字認識システム、文字認識方法およびそのプログラム - Google Patents
文字認識システム、文字認識方法およびそのプログラム Download PDFInfo
- Publication number
- JP2005209076A JP2005209076A JP2004016940A JP2004016940A JP2005209076A JP 2005209076 A JP2005209076 A JP 2005209076A JP 2004016940 A JP2004016940 A JP 2004016940A JP 2004016940 A JP2004016940 A JP 2004016940A JP 2005209076 A JP2005209076 A JP 2005209076A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image data
- entry
- information
- external
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【課題】 電子ペンを用いて入力された外字を含んだ筆記イメージを文字コードに変換する方法において、効率の良い文字コードへの変換を可能とする文字認識手段を提供すること
【解決手段】 帳票の記入項目に対応させて当該記入項目に外字が含まれるか否かに関する情報を保持した文字認識装置を用いて、電子ペンから送られる帳票に記入された筆記情報を、記入項目ごとにイメージデータに変換して、標準の文字が格納された辞書を参照してこのイメージデータを文字コードに変換し、このとき文字コードに変換されないイメージデータがある場合は、この未変換のイメージデータに対応する記入項目に外字が含まれるか否かを判定し、外字が含まれると判定した場合は、標準の文字以外の外字が格納された外字辞書を参照してこの未変換のイメージデータを文字コードに変換する文字認識システムを前記課題の解決手段とする。
【選択図】 図1
【解決手段】 帳票の記入項目に対応させて当該記入項目に外字が含まれるか否かに関する情報を保持した文字認識装置を用いて、電子ペンから送られる帳票に記入された筆記情報を、記入項目ごとにイメージデータに変換して、標準の文字が格納された辞書を参照してこのイメージデータを文字コードに変換し、このとき文字コードに変換されないイメージデータがある場合は、この未変換のイメージデータに対応する記入項目に外字が含まれるか否かを判定し、外字が含まれると判定した場合は、標準の文字以外の外字が格納された外字辞書を参照してこの未変換のイメージデータを文字コードに変換する文字認識システムを前記課題の解決手段とする。
【選択図】 図1
Description
本発明は、電子ペンを用いて取得した筆記イメージを文字コードに変換する文字認識技術に関し、殊に筆記イメージに外字が含まれる場合の文字認識システム、文字認識方法およびそのプログラムに関する。
近年、自治体の窓口などにおいて申請業務の電子化が進み、申請書をはじめとする帳票への記載事項を、電子データとして効率的に取得する方法が求められている。例えば、記載事項が記入された帳票を、イメージデータとして取得し、OCR(Optical Character Recognition)技術を用いて記載事項を文字コードに変換する方法が広く用いられており、電子ペンなどにより、帳票フォーマットと筆記イメージデータを直接対応付けて記載事項を電子データとして取得することも可能となっている。
また、最近では特許文献1に示すような記入位置を特定するためのドットパターンが形成された帳票の記入欄に、このドットパターンの読み取り機能を備えた電子ペンを用いて記入することで、申請者が記入した筆記イメージを直接、帳票の記入項目の電子データとして取得する方法が提案されている。
ところで、このように電子ペンを用いて取得したイメージデータを、OCR技術を用いて文字コードに変換する際には、文字のイメージデータと文字コードを対応付けて格納した辞書を参照するが、帳票の記入項目には人名や住所が含まれることが多く、これらにはJIS(Japan Industrial Standard)などの規格によりコンピュータシステムで用いる文字として定められた標準文字以外の「外字」と呼ばれる通常の辞書に無い文字が含まれることがある。
このような外字を含むイメージデータを文字に変換する場合、外字は通常の辞書には登録されていないため変換できない文字または誤認識文字として出力されてしまうという問題がある。この問題点に鑑み、特許文献2には、外字を含む文字列を正確に認識する文字認識システムが提案されている。
特許文献2に開示された文字認識システムは、標準の文字のイメージデータを格納した辞書(以下、本字辞書と呼ぶ)の他に、外字として登録した文字のイメージデータを格納した辞書を備え、入力されたイメージデータについて、本字辞書に該当のなかったイメージデータを標準の文字以外の文字のイメージデータを格納した辞書(以下、外字辞書と呼ぶ)から検索し、該当した文字イメージデータを外字の文字コードに変換して、さらに該当する文字のイメージデータが無い場合は、新たな外字として外字の文字コードと文字のイメージデータを割り当てて登録する。
特開2003−200677(段落0027〜0029、図2)
特開平9−245118(段落0029〜0034、図4)
しかしながら、特許文献2に開示された文字認識システムでは、帳票に記入された全てのイメージデータについて本字辞書に該当する文字がなかった場合は、外字辞書で文字のイメージデータの検索を行っているので、外字の含まれる可能性の無い帳票の記入項目に、認識が困難な記入されたイメージデータがあった場合でも、外字辞書の検索を行うことになり、文字認識に時間がかかるという問題点があった。
したがって、本発明の課題は、電子ペンを用いて入力された外字を含んだ帳票への記入イメージデータを文字コードに変換して取得する方法において、効率の良い文字コードへの変換を可能とする文字認識手段を提供することにある。
前記した課題を解決するためになされた、本発明は、帳票の記入項目に対応させて当該記入項目に外字が含まれるか否かに関する情報を保持した文字認識装置を用いて、電子ペンから送られる帳票に記入された筆記情報を、帳票の記入項目ごとに記入イメージデータに変換して、標準の文字が格納された辞書を参照してこの記入イメージデータを文字コードに変換し、このとき文字コードに変換されない記入イメージデータがある場合は、この未変換の記入イメージデータに対応する記入項目に外字が含まれるか否かを判定し、外字が含まれると判定した場合は、標準の文字以外の文字が格納された外字辞書を参照してこの未変換の記入イメージデータを文字コードに変換する文字認識システムを提供する。
本発明によると、帳票の記入項目に外字が含まれるか否かに関する情報を対応付けることにより、記入イメージデータを文字コードに変換する際に不要な外字辞書を参照する処理を省略することで、文字認識に要する時間を大幅に短縮することができる。
(第1実施形態例)
本発明の第1実施形態例を、添付した図面を参照して説明する。はじめに、例えば図1は、本発明に係る文字認識システムが適用される第1実施形態例の構成図である。図1を参照して、本実施形態例における文字認識システムは、帳票2に記入するストロークデータを取得してペンサーバ3に送信する電子ペン1と、記入する位置を特定可能に特殊なドットパターンが印刷された帳票2と、電子ペン1から送信されるストロークデータを、帳票2の位置と対応付けて文字コードに変換して格納するペンサーバ3とから主に構成されている。
本発明の第1実施形態例を、添付した図面を参照して説明する。はじめに、例えば図1は、本発明に係る文字認識システムが適用される第1実施形態例の構成図である。図1を参照して、本実施形態例における文字認識システムは、帳票2に記入するストロークデータを取得してペンサーバ3に送信する電子ペン1と、記入する位置を特定可能に特殊なドットパターンが印刷された帳票2と、電子ペン1から送信されるストロークデータを、帳票2の位置と対応付けて文字コードに変換して格納するペンサーバ3とから主に構成されている。
次に、図1に示した文字認識システムの各構成要素について詳しく説明する。
(電子ペン)
本実施形態例で用いる電子ペン1は、使用者が帳票2に記入した情報をストロークデータに変換して、ペンサーバ3に送信する。
詳しく説明すると、図2は、本実施形態例で用いる電子ペン1の構成を例示した図である。図2に示すように、電子ペン1は、特殊なドットパターンが記録された帳票2に必要事項を記入するための筆記手段であるペン10と、帳票2に印刷されたドットパターンを読取るカメラ11と、記入時にペン10に作用する筆圧を検出する圧電素子12と、カメラ11及び圧電素子12からのデータを処理して、記入により移動するペン先の位置をドットパターンと関連付けた情報であるストロークデータを作成する処理装置13と、作成されたストロークデータの蓄積などを行うメモリ14と、位置情報を他の装置などに送信するための伝送装置16とを有している。さらに、入力状況や入力エラーを表示する表示画面15や、入力エラーを利用者に振動で伝える振動モータ17なども有している。
(電子ペン)
本実施形態例で用いる電子ペン1は、使用者が帳票2に記入した情報をストロークデータに変換して、ペンサーバ3に送信する。
詳しく説明すると、図2は、本実施形態例で用いる電子ペン1の構成を例示した図である。図2に示すように、電子ペン1は、特殊なドットパターンが記録された帳票2に必要事項を記入するための筆記手段であるペン10と、帳票2に印刷されたドットパターンを読取るカメラ11と、記入時にペン10に作用する筆圧を検出する圧電素子12と、カメラ11及び圧電素子12からのデータを処理して、記入により移動するペン先の位置をドットパターンと関連付けた情報であるストロークデータを作成する処理装置13と、作成されたストロークデータの蓄積などを行うメモリ14と、位置情報を他の装置などに送信するための伝送装置16とを有している。さらに、入力状況や入力エラーを表示する表示画面15や、入力エラーを利用者に振動で伝える振動モータ17なども有している。
この伝送装置16の例としては、前記した短距離無線伝送技術の一種であるブルートゥース(登録商標)の通信プロトコルに従い、所定の周波数帯域の電波を利用してデータを送受信する装置があげられるが、その他の無線技術や、無線LAN(Local Area Network)、あるいは、有線通信技術の通信プロトコルに従ってデータを送受信する装置であってもよい。また、処理装置13は、CPU(Central Processing Unit)やROM(Read Only Memory)等の電気・電子回路から構成されており、電子ペン1を統括的に制御する。具体的には、カメラ11において取得した画像情報に含まれる帳票2のドットパターンからストロークデータを作成することや、このストロークデータをペンサーバ3に送信することや、表示画面15および振動モータ17を制御することなどがあげられる。
(帳票)
電子ペン1により記入される帳票2は、特殊なドットパターンが印刷されることで、電子処理用ペーパとして機能する。このドットパターンは、紙面を所定サイズの格子に区切った場合に、その位置を特定できるようにドットが配置されており、このドットパターンから帳票2上の位置を特定することができる。さらに帳票2の上面には、帳票2の紙面情報が印刷されており、帳票2の記入者は、この紙面情報を目視して、記入内容や記入位置などを特定して帳票2に記入することができる。
電子ペン1により記入される帳票2は、特殊なドットパターンが印刷されることで、電子処理用ペーパとして機能する。このドットパターンは、紙面を所定サイズの格子に区切った場合に、その位置を特定できるようにドットが配置されており、このドットパターンから帳票2上の位置を特定することができる。さらに帳票2の上面には、帳票2の紙面情報が印刷されており、帳票2の記入者は、この紙面情報を目視して、記入内容や記入位置などを特定して帳票2に記入することができる。
(ペンサーバ)
再び図1を参照してペンサーバ3の構成について説明する。ペンサーバ3は、CPU30、RAM31、電子ペン1から送信されるストロークデータなどを受信するペンレシーバ32およびストレージ33から主に構成され、例えばサーバ用コンピュータにより実現される。ペンサーバ3のストレージ33には、ストロークデータ処理プログラム34、外字作成プログラム35、表示作成プログラム36およびデータ登録プログラム37と、帳票定義ファイル38、本字辞書ファイル39および外字辞書ファイル40とが格納され、帳票データ格納部41として区画された領域を含んで構成される。
再び図1を参照してペンサーバ3の構成について説明する。ペンサーバ3は、CPU30、RAM31、電子ペン1から送信されるストロークデータなどを受信するペンレシーバ32およびストレージ33から主に構成され、例えばサーバ用コンピュータにより実現される。ペンサーバ3のストレージ33には、ストロークデータ処理プログラム34、外字作成プログラム35、表示作成プログラム36およびデータ登録プログラム37と、帳票定義ファイル38、本字辞書ファイル39および外字辞書ファイル40とが格納され、帳票データ格納部41として区画された領域を含んで構成される。
次にストレージ33に格納された各プログラムを説明すると、ストロークデータ処理プログラム34は、電子ペン1から送信された帳票2に記入されたストロークデータを帳票2の帳票項目ごとにイメージデータに変換し、このイメージデータ(以下、記入イメージデータと呼ぶ)を帳票2の帳票項目と対応付けて文字コードに変換する機能を実現する。また、外字作成プログラム35は、記入イメージデータから登録されていない外字を新たに作成する機能を実現する。また、表示作成プログラム36は、記入イメージデータの変換結果を確認する表示画面を作成する機能を実現する。そして、データ登録プログラム37は、ストロークデータ処理プログラム34で変換された記入イメージデータやこの記入イメージデータから変換された文字コードなどを帳票データ格納部41に登録する機能を有する。
なお、ストロークデータ処理プログラム34、外字作成プログラム35、表示作成プログラム36およびデータ登録プログラム37は、ペンサーバ3のRAM31に展開されてCPU30が実行することで、それぞれストロークデータ処理手段、外字作成手段、表示作成手段およびデータ登録手段として機能する。以下の説明において、各プログラムの名称は、各手段と同じ意味で用いることとする。
なお、ストロークデータ処理プログラム34、外字作成プログラム35、表示作成プログラム36およびデータ登録プログラム37は、ペンサーバ3のRAM31に展開されてCPU30が実行することで、それぞれストロークデータ処理手段、外字作成手段、表示作成手段およびデータ登録手段として機能する。以下の説明において、各プログラムの名称は、各手段と同じ意味で用いることとする。
そしてストレージ33に格納された各ファイルを説明すると、帳票定義ファイル38は、帳票2のドットパターンと帳票2の上面に印刷された紙面情報を対応付けた情報を含み、この情報は、電子ペン1から送信されるストロークデータと帳票2の帳票項目の対応付けを行う際に利用される。
ここで、例えば図3は、自治体などの窓口において公文書の開示を請求する際に記入する帳票2である公文書公開請求書を例として、帳票定義ファイル38の構造を説明する図である。図3を参照して、帳票2には、図示しない特殊なドットパターンが印刷されており、さらにその上には氏名や住所などの帳票項目を目視にて確認できる紙面情報が印刷されている。また、帳票2の帳票項目には、記入領域を示す破線の枠が設定されており、この破線の枠の位置に記入されたストロークデータは、この帳票項目と対応付けて記入イメージデータに変換されて帳票データ格納部41に格納される。なお、実際の帳票2には、この破線は印刷されていない。また、帳票2の下部には、この帳票2への記入終了時に記入するチェックボックス21が設けられており、記入者は、このチェックボックス21にチェックを記入することで、帳票2への記入終了をペンサーバ3に送信することができる。
さらに、この破線で囲まれた領域には、それぞれ、その領域に記入される情報を定義した項目属性情報381が設定されており、図3に示した例では、氏名の「名」を記入する領域について、この帳票項目を特定できるIDである帳票項目ID、帳票項目名、この帳票項目への記入が必須であるか否かを示す情報、この帳票項目に記入される情報の種類を示す情報、この帳票項目に入力される最大の文字数を示す情報、この帳票項目に記入可能な行数を示す情報および符号382で示したこの帳票項目に入力される情報が外字を含むか否かを示す情報を含んで構成されていることがわかる。
図3に示した項目属性情報381の中で、符号382で示した「外字使用」の項目に、外字を含むか否かを示す情報を設定することで、記入イメージデータを文字コードに変換する際に、外字辞書ファイル40を参照するか否かを設定することが可能となる。
なお、項目属性情報381に含まれる情報のうち、「属性」の欄には、その帳票項目に記入される情報の種類を示しており、図3に示した例では、「名」の帳票項目に記入される情報が「文字」であることを示している。例えば、この「属性」の欄を「画像」と設定することで、記入イメージデータを文字コードに変換せず、そのまま格納する設定にすることも可能である。
そして、本字辞書ファイル39には、文字コードへの変換の際にストロークデータ処理プログラム34が参照する標準の文字(例えば、JIS第1水準およびJIS第2水準の文字)のイメージデータが、文字コードと対応付けられて格納されている。なお、以下においてこの標準の文字のイメージデータを本字イメージデータと呼ぶ。
また、外字辞書ファイル40には、本字辞書ファイル39に格納されていない文字のイメージデータが、文字コードと対応付けられて格納されている。なお、以下においてこの本字辞書ファイル39に格納されていない文字のイメージデータを外字イメージデータと呼ぶ。
また、外字辞書ファイル40には、本字辞書ファイル39に格納されていない文字のイメージデータが、文字コードと対応付けられて格納されている。なお、以下においてこの本字辞書ファイル39に格納されていない文字のイメージデータを外字イメージデータと呼ぶ。
さらにストレージ33に含まれる帳票データ格納部41は、電子ペン1から送信されたストロークデータを変換した記入イメージデータおよびこの記入イメージデータを変換した文字コードを、帳票2の記入項目欄と対応付けて格納するデータベースである。
(帳票入力データの取得方法)
次に、前記した文字認識システムを用いて、電子ペン1を用いて帳票2に記入された情報を、ペンサーバ3において文字コードに変換して格納する過程を、図4に示したフローチャートを参照して説明する(適宜、図1、図3参照)。ここでは、公文書の公開を請求する請求者が、図3に示した帳票2である公文書公開請求書(以下、帳票2と省略する)に電子ペン1を用いて記入した情報を、本実施形態例の文字認識システムを用いて文字コードに変換して格納する過程を説明する。
次に、前記した文字認識システムを用いて、電子ペン1を用いて帳票2に記入された情報を、ペンサーバ3において文字コードに変換して格納する過程を、図4に示したフローチャートを参照して説明する(適宜、図1、図3参照)。ここでは、公文書の公開を請求する請求者が、図3に示した帳票2である公文書公開請求書(以下、帳票2と省略する)に電子ペン1を用いて記入した情報を、本実施形態例の文字認識システムを用いて文字コードに変換して格納する過程を説明する。
はじめに、自治体などの窓口で、公文書の公開請求をする請求者は、図3に示した帳票2に、電子ペン1を用いて必要事項を記入する。この帳票2に電子ペン1を用いて記入された情報は、電子ペン1によりストロークデータとしてペンサーバ3に送信される。
ペンサーバ3は、この電子ペン1を用いて入力されたストロークデータを受信し(ステップS100)、受信したストロークデータをストロークデータ処理プログラム34により記入イメージデータに変換して、データ登録プログラム37により、帳票データ格納部41に格納する(ステップS101)。なお、このイメージデータの格納は、図3に示した帳票2の破線で囲った領域の各帳票項目に対応付けられて格納される。
そして、ペンサーバ3は、図3に示した帳票2の記入終了を示すチェックボックス21にチェックが記入されたか否かを判定し(ステップS102)、チェックボックス21にチェックが記入されるまで、ステップS100およびステップS101を繰り返す。
次に、帳票2のチェックボックス21にチェックが記入されると(ステップS102においてYesの場合)、ペンサーバ3のストロークデータ処理プログラム34により、帳票データ格納部41に格納された帳票項目ごとの記入イメージデータを本字辞書ファイル39と照合し、この記入イメージデータを文字コードに変換する(ステップS103)。
そして、文字コードに変換されていない記入イメージデータがあるか否かを判定し(ステップS104)、変換されていない記入イメージデータがない場合には(ステップS104においてNoの場合)、文字コードへの変換を終了して後記するステップS109に進む。
そして、文字コードに変換されていない記入イメージデータがあるか否かを判定し(ステップS104)、変換されていない記入イメージデータがない場合には(ステップS104においてNoの場合)、文字コードへの変換を終了して後記するステップS109に進む。
そして、変換されていない記入イメージデータがある場合には(ステップS104においてYesの場合)、ストロークデータ処理プログラム34は、帳票定義ファイル38に格納された当該帳票項目の項目属性情報381の符号382で示した外字を含むか否かを示す情報(「外字使用」の項目)を参照して、現在処理対象の帳票項目が外字を含む帳票項目と定義されているか否かを判定する(ステップS105)。
その帳票項目が、外字を含む帳票項目と定義されていない場合は(ステップS105においてNoの場合)、変換できない記入イメージデータであるとして、この記入イメージデータに文字コードへの変換を行わないことを示すフラグを設定して、文字コードへの変換の処理を終了して後記するステップS109に進む。これにより、外字の存在しない帳票項目において本字辞書ファイル39と類似度が低い文字が検出された場合には、それは外字ではなく筆記が不正確であるという判断が自動的に可能となり、文字変換の時間を大幅に短縮できる。
また、この帳票項目が、外字を含む帳票項目と定義されている場合は(ステップS105においてYesの場合)、後段側のステップに進み、ペンサーバ3のストロークデータ処理プログラム34により、未変換の記入イメージデータを、外字辞書ファイル40と照合し、この記入イメージデータを文字コードに変換する(ステップS106)。なお、このとき、外字辞書ファイル40と照合した結果、外字辞書ファイル40に該当する文字が存在した場合、ペンサーバ3の表示作成プログラム36により、図示しない、変換候補の外字イメージデータと記入イメージデータとを表示する表示画面を作成し、ペンサーバ3の操作者が変換の可否を決定する構成とすることもできる。
そして、ペンサーバ3は、文字コードに変換されていない記入イメージデータがあるか否かを判定し(ステップS107)、変換されていない記入イメージデータがない場合には(ステップS107においてNoの場合)、文字コードへの変換の処理を終了して後記するステップS109に進む。また、変換されていない記入イメージデータがある場合には(ステップS107においてYesの場合)、後段側のステップに進み、外字作成プログラム35の機能により、未変換の記入イメージデータを新規の外字イメージデータとして外字辞書ファイル40に格納する(ステップS108)。なお、このとき、外字作成プログラム35は、この新規の外字イメージデータに対応付ける文字コードを新たに作成し、外字辞書ファイル40に格納する。
なお、ステップS108において、ペンサーバ3の操作者がこの新規外字の読みなどの属性情報およびこの新規の外字イメージデータに対応付ける文字コードを入力する構成や、この新規の外字イメージデータの形状を修正して外字辞書ファイル40に登録する構成とすることも可能である。
次に、ペンサーバ3は、全ての帳票項目に対応付けられた記入イメージデータの文字コードへの変換が終了したか判定する(ステップS109)。ここで、変換が終了していない帳票項目がある場合は(ステップS109においてNoの場合)、ステップS103に戻って、文字コードへの変換処理を繰り返す。また、変換が終了していない帳票項目がない場合は(ステップS109においてYesの場合)、後段側のステップに進み、変換結果を帳票確認画面として出力する(ステップS110)。ただし、ステップS105においてNoの場合に該当する記入イメージデータは、変換を行わないことを示すフラグを識別子として、記入イメージデータの文字コードへの変換が終了したものとみなす。
ここで、図5は、ペンサーバ3の表示作成プログラム36によって作成される帳票確認画面411の例である。図5に示した帳票確認画面411は、画面左側の符号412で示した帳票2の紙面情報に、記入イメージデータを合成した表示領域と、画面右側の符号413で示した帳票2の帳票項目ごとに、記入イメージデータおよびそれを変換した文字コードに対応する本字イメージデータまたは外字イメージデータを表示した表示領域と、記入イメージデータの変換結果を帳票データ格納部41に登録する際にクリックする確認ボタン415とから主に構成される。
ここで、帳票確認画面411の符号414で示した電話番号の帳票項目は、記入された電話番号の最後の文字が文字コードに変換されなかったため、記入イメージデータが破線で囲まれて、そのまま表示されている。これは、この記入項目欄が、電話番号の情報が入力されるため、外字を含む記入項目欄とは設定されていないことにより、変換不能な文字であることを示すための表示である。なお、これは、ステップS105においてNoの場合に相当する。この場合、ペンサーバ3の操作者が、この記入イメージデータを目視して、適当な数字を入力して修正することができる。
また、符号413に示した領域において、記入イメージデータから変換された外字イメージデータには、識別可能な色を付けて区別して表示することもできる。
また、符号413に示した領域において、記入イメージデータから変換された外字イメージデータには、識別可能な色を付けて区別して表示することもできる。
この帳票確認画面411により、記入イメージデータが正しく文字コードに変換されたかを確認することができ、ペンサーバ3の操作者は、記入イメージデータの文字コードへの変換を確認すると、確認ボタン415をクリックする。これにより、ペンサーバ3のデータ登録プログラム37の機能により、変換結果は帳票入力データとして帳票データ格納部41に格納される(ステップS111)。なお、帳票データ格納部41に帳票入力データを格納する際に、帳票定義ファイル38に基づいて、帳票2の帳票項目と対応付けて格納されている記入イメージデータを消去する構成としてもよい。これにより、帳票データ格納部41の容量を小さく抑えることができる。
前記した過程を経て、電子ペン1を用いて入力されたストロークデータは、ペンサーバ3において、帳票2の帳票項目と対応付けて記入イメージデータに変換され、本字辞書ファイル39および外字辞書ファイル40を参照して最終的に文字コードに変換されて帳票データ格納部41に格納される。また、帳票2の帳票項目に、外字を含むか否かを示す情報を付加することで、記入イメージデータの文字コードへの変換時間を短縮することが可能となる。
(第2実施形態例)
次に、本発明の第2実施形態例について説明する。本実施形態例では、第1実施形態例と同様の構成の文字認識システムを用いて、帳票に外字を含むか否かを示す情報を入力する記入欄を設けることで、予め帳票定義ファイルに帳票項目ごとの外字を含むか否かの情報を持たせない構成とする。
なお、前記したように本実施形態例で用いる文字認識システムは、第1実施形態例と同様であるため、その説明を省略し、第1実施形態例と違いのある部分について説明する。
次に、本発明の第2実施形態例について説明する。本実施形態例では、第1実施形態例と同様の構成の文字認識システムを用いて、帳票に外字を含むか否かを示す情報を入力する記入欄を設けることで、予め帳票定義ファイルに帳票項目ごとの外字を含むか否かの情報を持たせない構成とする。
なお、前記したように本実施形態例で用いる文字認識システムは、第1実施形態例と同様であるため、その説明を省略し、第1実施形態例と違いのある部分について説明する。
(帳票)
ここで、図6は本実施形態例で用いる帳票2’を示した図である。本実施形態例で用いる帳票2’は、第1実施形態例で用いた帳票2(図3参照)と比べて、氏名の姓を記入する帳票項目、氏名の名を記入する帳票項目および住所を記入する帳票項目の右下にチェックボックスが追加されていることがわかる。帳票2’の記入者は、これらの帳票項目に外字が含まれる場合は、該当する帳票項目のチェックボックスにチェックを入れる。図6に示した帳票2’では、住所を記入する帳票項目に外字が含まれているとして、符号22で示したチェックボックスにチェックが入っている。
ここで、図6は本実施形態例で用いる帳票2’を示した図である。本実施形態例で用いる帳票2’は、第1実施形態例で用いた帳票2(図3参照)と比べて、氏名の姓を記入する帳票項目、氏名の名を記入する帳票項目および住所を記入する帳票項目の右下にチェックボックスが追加されていることがわかる。帳票2’の記入者は、これらの帳票項目に外字が含まれる場合は、該当する帳票項目のチェックボックスにチェックを入れる。図6に示した帳票2’では、住所を記入する帳票項目に外字が含まれているとして、符号22で示したチェックボックスにチェックが入っている。
図6に示した帳票2’を用いることで、本実施形態例では、図3に示した項目属性情報381のうち、「外字使用」の項目は含まない構成とする。また、電子ペン1を用いてこの帳票2’に記入された情報を、ペンサーバ3において文字コードに変換して格納する過程は、図4に示したフローチャートと同様であるが、ステップS105における、その帳票項目が外字を含むか否かの判定は、図6に示した帳票項目のチェックボックスにチェックが入っているか否かによって判定される。
本実施形態例によると、帳票2’の記入者が自分で外字の有無を入力するため不要な照合を省くことができ、変換時間をさらに短縮することが可能となる。
以上、説明した実施の形態は、本発明の一実施形態例を示したものであり、本発明は、特許請求の範囲に記載された技術的思想の範囲内において様々に変形して実施可能である。たとえば、ペンサーバ3の帳票定義ファイル38において、帳票項目ごとに外字辞書ファイル40を参照するか否かを示す情報を保持する構成としたが、帳票定義ファイル38に、別途に外字辞書ファイル40を参照する帳票項目を示すテーブルデータを含んで構成し、ペンサーバ3が、このテーブルデータを参照して図4に示したフローチャートのステップS105の判定を行う構成としてもよい。
また、変換した文字が本字辞書ファイル39または外字辞書ファイル40と類似度が低い文字の場合に、ペンサーバ3の表示作成プログラム36により、外字辞書ファイル40内の変換候補の外字イメージデータと記入イメージデータを並べて表示する表示画面を作成する機能を含んで構成し、この表示画面上で、変換する文字を確認して決定する機能を含んで構成してもよい。さらに該当する文字が登録されていない場合に、次に類似度の高いイメージデータを表示する機能を含んでもよい。
また、本実施の形態では、本字辞書ファイル39に登録される文字をJIS第1水準およびJIS第2水準とし、外字辞書ファイル40に登録される文字をそれ以外の文字としたが、本発明で用いる外字辞書ファイル40は、外字のみを登録した辞書ファイルであっても、本字および外字を合わせて格納した辞書であっても良い。後者の場合、別に本字辞書ファイルを備えても、辞書ファイルに本字部分と外字部分を識別する情報を備え、外字参照の必要が無い場合には本字部分のみを参照することとしても良い。さらに外字辞書ファイルが複数であっても、コード体系の異なる本字辞書ファイル・外字辞書ファイルを複数備える構成であっても、帳票定義ファイル38に帳票項目ごとに文字コードへの変換の際に参照する辞書ファイルを対応付ける情報を格納して、対応付けられた辞書ファイルを参照してイメージデータを文字コードに変換する手段を備える構成とすることもできる。
これにより、記入イメージデータを文字コードに変換する際に参照する辞書として、独自に作成された辞書や外字を含む汎用の辞書など、複数設けて必要に応じて用いることが可能であり、異なる文字コード体系の文字コード辞書を備えることにより、文字コード体系の異なる業務システムにそれぞれ対応する帳票入力インタフェースとして設定することも可能となる。
以上のように本発明は、特許請求の範囲に記載された技術的思想によって定められる。
1 電子ペン
2、2’ 帳票
3 ペンサーバ
32 ペンレシーバ
34 ストロークデータ処理プログラム
35 外字作成プログラム
36 表示作成プログラム
37 データ登録プログラム
38 帳票定義ファイル
39 本字辞書ファイル
40 外字辞書ファイル
41 帳票データ格納部
2、2’ 帳票
3 ペンサーバ
32 ペンレシーバ
34 ストロークデータ処理プログラム
35 外字作成プログラム
36 表示作成プログラム
37 データ登録プログラム
38 帳票定義ファイル
39 本字辞書ファイル
40 外字辞書ファイル
41 帳票データ格納部
Claims (7)
- 記入位置を特定可能に作成された帳票に、手書きで記入する情報を筆記情報として取得する電子ペンと、前記電子ペンが取得した前記筆記情報を文字コードに変換する文字認識装置とを含んで構成される文字認識システムであって、
前記文字認識装置は、
文字コードおよびそれに対応するイメージデータを格納した1以上の文字格納手段と、
前記帳票上の記入位置と記入項目とを対応させる情報と、前記帳票の記入項目ごとに文字コードに変換する際に参照する前記文字格納手段を対応させる情報とを含んだ帳票定義情報が格納された帳票定義情報格納手段と、
前記筆記情報を前記帳票定義情報に基づいて、前記帳票の記入項目ごとにイメージデータに変換して、このイメージデータを、前記帳票定義情報に基づいて対応付けられた文字格納手段を参照して文字コードに変換する筆記情報処理手段とを含んで構成されること、
を特徴とする文字認識システム。 - 記入位置を特定可能に作成された帳票に、手書きで記入する情報を筆記情報として取得する電子ペンと、前記電子ペンが取得した前記筆記情報を文字コードに変換する文字認識装置とを含んで構成される文字認識システムであって、
前記文字認識装置は、
標準的な文字コードおよびそれに対応するイメージデータを格納した標準文字格納手段と、
前記標準文字格納手段に格納されない文字コードおよびそれに対応するイメージデータを格納した外字格納手段と、
前記帳票上の記入位置と記入項目とを対応させる情報と、前記帳票の記入項目ごとに前記電子ペンを用いて記入される文字に外字が含まれるか否かの情報とを含んだ帳票定義情報が格納された帳票定義情報格納手段と、
前記筆記情報を前記帳票定義情報に基づいて、前記帳票の記入項目ごとにイメージデータに変換して、このイメージデータを、前記標準文字格納手段を参照して文字コードに変換し、文字コードに変換できないイメージデータがあると、前記帳票定義情報を参照して、当該記入項目に外字が含まれるか否かを判定し、当該記入項目に外字が含まれると判定すると、前記外字格納手段を参照してこのイメージデータを文字コードに変換する筆記情報処理手段とを含んで構成されること、
を特徴とする文字認識システム。 - 記入位置を特定可能に作成された帳票に、手書きで記入する情報を筆記情報として取得する電子ペンと、前記電子ペンが取得した筆記情報を文字コードに変換する文字認識装置とを含んで構成される文字認識システムであって、
前記帳票は、
記入項目ごとに当該記入項目に外字を含むか否かの情報を記入する記入欄を有し、
前記文字認識装置は、
標準的な文字コードおよびそれに対応するイメージデータを格納した標準文字格納手段と、
前記標準文字格納手段に格納されない文字コードおよびそれに対応するイメージデータを格納した外字格納手段と、
前記帳票上の記入位置と記入項目とを対応させる情報を含んだ帳票定義情報が格納された帳票定義情報格納手段と、
前記筆記情報を前記帳票定義情報に基づいて、前記帳票の記入項目ごとにイメージデータに変換して、このイメージデータを、前記標準文字格納手段を参照して文字コードに変換し、文字コードに変換できないイメージデータがあると、前記帳票の前記記入欄に外字を含むという情報が記入された場合は、前記外字格納手段を参照してこのイメージデータを文字コードに変換する筆記情報処理手段とを含んで構成されること、
を特徴とする文字認識システム。 - 前記文字認識装置は、
前記筆記情報処理手段が前記筆記情報から変換したイメージデータと、このイメージデータから変換した文字コードに対応するイメージデータとを、前記帳票定義情報に基づいて前記帳票の記入項目ごとに対応させて表示し、さらに前記筆記情報処理手段で文字コードに変換されなかったイメージデータがある場合は、当該イメージデータを併せて表示する表示画面を作成する表示作成手段をさらに含むこと、
を特徴とする請求項2または請求項3に記載の文字認識システム。 - 前記文字認識装置は、
前記筆記情報処理手段が、前記外字格納手段を参照しても変換されないイメージデータを、新規に発生させた文字コードと対応付けて前記外字格納手段に登録する外字登録手段をさらに含むこと、
を特徴とする請求項2ないし請求項4のいずれか1項に記載の文字認識システム。 - 記入位置を特定可能に作成された帳票に、手書きで記入する情報を筆記情報として取得する電子ペンと、前記電子ペンが取得した筆記情報を文字コードに変換する文字認識装置とを含んで構成される文字認識システムにおける文字認識方法であって、
a)前記電子ペンから筆記情報を取得する手順、
b)取得した筆記情報を、前記帳票上の記入位置と記入項目とを対応させる情報に基づいて、前記帳票の記入項目ごとに記入イメージデータに変換する手順、
c)前記記入イメージデータを、標準的な文字コードおよびそれに対応するイメージデータを格納した標準文字格納ファイルを参照して文字コードに変換する手順、
d)前記帳票の記入項目ごとに前記電子ペンを用いて記入される文字に外字が含まれるか否かの情報に基づいて、前記手順cで変換されない前記記入イメージデーデータに外字が含まれるか否かを判定する手順、
e)前記記入イメージデータに外字が含まれると判定した場合、前記標準文字格納ファイルに格納されない文字コードおよびそれに対応するイメージデータを格納した外字格納ファイルを参照して、前記記入イメージデータを文字コードに変換する手順、
を含んで構成されることを特徴とする文字認識方法。 - 記入位置を特定可能に作成された帳票に手書きで記入する情報を筆記情報として取得する電子ペンが取得した筆記情報を文字コードに変換するコンピュータを、
標準的な文字コードおよびそれに対応するイメージデータを格納させる標準文字格納手段、
前記標準文字格納手段に格納されない文字コードおよびそれに対応するイメージデータを格納させる外字格納手段、
前記帳票上の記入位置と記入項目とを対応させる情報と、前記帳票の記入項目ごとに前記電子ペンを用いて記入される文字に外字が含まれるか否かの情報とを含んだ帳票定義情報を格納させる帳票定義情報格納手段、
前記筆記情報を前記帳票定義情報に基づいて、前記帳票の記入項目ごとにイメージデータに変換して、このイメージデータを、前記標準文字格納手段を参照して文字コードに変換し、文字コードに変換できないイメージデータがあると、前記帳票定義情報を参照して、当該記入項目に外字が含まれるか否かを判定し、当該記入項目に外字が含まれると判定すると、前記外字格納手段を参照してこのイメージデータを文字コードに変換する筆記情報処理手段、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004016940A JP2005209076A (ja) | 2004-01-26 | 2004-01-26 | 文字認識システム、文字認識方法およびそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004016940A JP2005209076A (ja) | 2004-01-26 | 2004-01-26 | 文字認識システム、文字認識方法およびそのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005209076A true JP2005209076A (ja) | 2005-08-04 |
Family
ID=34901932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004016940A Pending JP2005209076A (ja) | 2004-01-26 | 2004-01-26 | 文字認識システム、文字認識方法およびそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005209076A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008252680A (ja) * | 2007-03-30 | 2008-10-16 | Omron Corp | 携帯端末装置用のプログラムおよび携帯端末装置 |
CN108664966A (zh) * | 2017-04-02 | 2018-10-16 | 田雪松 | 一种笔记记录方法和装置 |
-
2004
- 2004-01-26 JP JP2004016940A patent/JP2005209076A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008252680A (ja) * | 2007-03-30 | 2008-10-16 | Omron Corp | 携帯端末装置用のプログラムおよび携帯端末装置 |
CN108664966A (zh) * | 2017-04-02 | 2018-10-16 | 田雪松 | 一种笔记记录方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7100110B2 (en) | System for filling in documents using an electronic pen | |
US20080181501A1 (en) | Methods, Apparatus and Software for Validating Entries Made on a Form | |
US20120223920A1 (en) | System, computer program product, and method for capturing and processing form data | |
JP4676798B2 (ja) | 手書き情報更新システム、手書き情報更新方法および手書き情報更新装置 | |
US20060159345A1 (en) | System and method for associating handwritten information with one or more objects | |
JP4669381B2 (ja) | 地図情報システム、地図情報処理方法およびそのプログラム | |
JP2004127197A (ja) | 受付システム、受付システムの端末装置、入力チェックプログラム、及び電子ペン用帳票 | |
US20080147687A1 (en) | Information Management System and Document Information Management Method | |
JP6253354B2 (ja) | 帳票読取装置、プログラムおよび帳票読取システム | |
JP4770332B2 (ja) | 電子ペン用カード申込書 | |
JP4673542B2 (ja) | 書類引継装置、書類引継システム及び書類引継方法 | |
JP2004259009A (ja) | 電子ペン用帳票、電子ペン用帳票作成装置および汎用処理システム | |
JP4220206B2 (ja) | 手続システム及びそのサーバ装置、並びにコンピュータプログラム | |
JP2004013813A (ja) | 情報管理システムおよび情報管理方法 | |
JP2005209076A (ja) | 文字認識システム、文字認識方法およびそのプログラム | |
JP2004127200A (ja) | 電子ペン用帳票、確認用データ提供システム、サーバ装置及び確認用データ取得プログラム | |
JP3902163B2 (ja) | 関連帳票判定システム、電子ペン及びプログラム | |
JP2008097404A (ja) | 電子ペンを利用したスケジュール管理システム、方法、サーバ及びコンピュータプログラム | |
JP2004127199A (ja) | 電子ペン用帳票、及び帳票記入内容テキスト化システム | |
JP4362323B2 (ja) | 電子フォーム設計システム及びプログラム | |
JP5169506B2 (ja) | 作業管理装置、作業時間管理装置及びプログラム | |
JP2015082725A (ja) | 情報処理装置及びプログラム | |
JP4227057B2 (ja) | 階層型データベース入力装置および方法 | |
JPH1063813A (ja) | イメージ文書管理方法及びその装置 | |
JP2004110529A (ja) | 手書き文字認識システム、手書き文字認識プログラム、並びに電子ペン用帳票 |