JP2010277168A - データ入力システム、データ入力受付装置及びプログラム - Google Patents

データ入力システム、データ入力受付装置及びプログラム Download PDF

Info

Publication number
JP2010277168A
JP2010277168A JP2009126649A JP2009126649A JP2010277168A JP 2010277168 A JP2010277168 A JP 2010277168A JP 2009126649 A JP2009126649 A JP 2009126649A JP 2009126649 A JP2009126649 A JP 2009126649A JP 2010277168 A JP2010277168 A JP 2010277168A
Authority
JP
Japan
Prior art keywords
original image
image data
character
data
divided original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009126649A
Other languages
English (en)
Inventor
Junichi Tamura
純一 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2009126649A priority Critical patent/JP2010277168A/ja
Priority to US12/619,200 priority patent/US8254721B2/en
Priority to CN200910225481.5A priority patent/CN101902541B/zh
Publication of JP2010277168A publication Critical patent/JP2010277168A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/127Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/0034Details of the connection, e.g. connector, interface
    • H04N2201/0037Topological details of the connection
    • H04N2201/0039Connection via a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

【課題】筆記者によって記入された文字を参照して、データ入力者がデータ入力を行う際に、そのデータ入力者に対し、筆記された文字列によって表される内容を知られにくくするデータ入力システムを提供する。
【解決手段】画像読取装置100は、帳票毎に読み取った原画像データを一文字単位に分割した分割原画像データを抽出し、各分割原画像データの抽出順序を含む識別情報を設定して記憶すると共に、各分割原画像データの文字に対応する文字対応情報を抽出し、その分割原画像データの識別情報と文字対応情報とを関連づけて出力する。データ入力受付装置200は、画像読取装置100により出力される分割原画像データから予め定めた手順に従って分割原画像データを抽出して表示し、表示した分割原画像データに対してデータ入力者が入力した文字データを、表示した分割原画像データ及び当該分割原画像データの識別情報と関連づけて記憶する。
【選択図】図3

Description

本発明は、データ入力システム、データ入力受付装置及びプログラムに関する。
従来、住所や氏名等の個人情報が記入された帳票をデータ入力する場合に、個人情報の漏洩を防止するための種々の技術が提案されている。下記特許文献1には、帳票をスキャナで読み取り、帳票の項目単位やユーザが任意に選択した単位に画像を分割してデータ化し、分割した各データをシャッフルして保存する技術が開示されている。また、下記特許文献2には、読み取った原稿の文字認識ができない場合に、その部分の画像を切り取り、その画像に識別情報等を設定して記憶し、画像に秘密事項が含まれていれば、その原稿をデータ入力する際に秘密事項をカットして印刷したものに基づいて、データ入力者がデータ入力を行う技術が開示されている。
特開2006−244315号公報 特開平08−272908号公報
本発明は、筆記者によって記入された帳票上の文字をデータ入力者がデータ入力する際、その入力者に対し、記入された文字列によって表される内容を知られにくくすることを目的とする。
本発明の請求項1に係るデータ入力システムは、(A)文字が記載された帳票の原画像を帳票毎に読み取る読取手段と、前記読取手段により読み取られた前記帳票の原画像のデータから1文字単位に分割した分割原画像データを抽出し、当該分割原画像データの前記帳票上の位置を特定する識別情報を当該分割原画像データに設定する設定手段と、前記設定手段により抽出された前記各分割原画像データに対応した文字対応情報を前記分割原画像データ毎に生成する生成手段と、前記各分割原画像データ、前記各分割原画像データについて設定された識別情報、および前記各分割原画像データの前記文字について生成された前記文字対応情報を各々関連づけて出力する出力制御手段とを備える画像読取装置と、(B)前記出力制御手段が出力する前記各分割原画像データの中から、予め定められた手順に従って選択した前記分割原画像データを表示する表示制御手段と、前記表示制御手段により表示された前記分割原画像データに対し、文字を特定する文字データの入力を受付ける受付手段と、前記表示制御手段により表示された前記分割原画像データおよび当該分割原画像データの前記識別情報に、前記受付手段が受付けた文字データを対応付けて記憶する記憶制御手段とを備えるデータ入力受付装置とを備えることを特徴とする。
本発明の請求項2に係るデータ入力システムは、請求項1に係る構成において、前記予め定められた手順は、前記各分割原画像データの中からランダムに予め定められた数の前記分割原画像データを選択することを特徴とする。
本発明の請求項3に係るデータ入力システムは、請求項1又は2に係る構成において、前記記憶制御手段は、前記表示制御手段により表示された前記分割原画像データと同種の内容の前記文字対応情報を有している前記分割原画像データについても、前記受付手段が受付けた前記文字データを対応付けることを特徴とする。
本発明の請求項4に係るデータ入力システムは、請求項1〜3のいずれかの構成において、前記表示制御手段は、前記記憶制御手段によって前記文字データの対応付けがなされた前記分割原画像データについては選択から除外することを特徴とする。
本発明の請求項5に係るデータ入力システムは、請求項1〜4のいずれかの構成において、前記生成手段は、前記各分割原画像データの前記文字対応情報として、当該分割原画像データの文字の特徴を表す特徴情報を生成し、前記記憶制御手段は、前記表示制御手段により表示された前記各分割原画像データに対して、前記受付手段が受付けた前記文字データの特徴情報を生成し、生成した当該特徴情報と当該分割原画像データの前記特徴情報とが予め定められた条件を満たす場合に、当該分割原画像データ及び当該分割原画像データの前記識別情報に、前記文字データを対応づけて記憶することを特徴とする。
本発明の請求項6に係るデータ入力システムは、請求項1〜4のいずれかの構成において、前記画像読取装置は、予め定めた複数の文字を照合用文字として記憶する照合用文字記憶手段を備え、前記生成手段は、前記各分割原画像データの前記文字対応情報として、当該分割原画像データと、前記照合用文字記憶手段に記憶されている前記複数の照合用文字とを照合し、当該分割原画像データに対応する前記照合用文字を特定し、前記表示制御手段は、前記各分割原画像データに対応する前記照合用文字の種類毎に、前記種類に応じて予め定められた並び替え順序に従って前記照合用文字を並び替え、並び替えた前記照合用文字に対応する前記分割原画像データを表示することを特徴とする。
本発明の請求項7に係るデータ入力システムは、請求項1〜4のいずれかの構成において、前記画像読取装置は、予め定めた複数の文字を照合用文字として記憶する照合用文字記憶手段を備え、前記生成手段は、前記各分割原画像データの前記文字対応情報として、当該分割原画像データと、前記照合用文字記憶手段に記憶されている前記複数の照合用文字とを照合し、当該分割原画像データに対応する前記照合用文字を特定し、前記データ入力受付装置は、予め定めた複数の単語を記憶する単語記憶手段を備え、前記表示制御手段は、前記単語記憶手段に記憶された前記複数の単語から、前記分割原画像データに対応する前記照合用文字で構成された前記単語を抽出し、抽出した前記単語を構成する前記照合用文字の順序で、当該照合用文字に対応する前記分割原画像データを表示することを特徴とする。
本発明の請求項8に係るデータ入力受付装置は、データを記憶する記憶手段と、文字が記載された帳票の原画像を帳票毎に読み取る読取手段と、前記読取手段により読み取られた前記帳票の原画像のデータを1文字単位に分割した分割原画像データを抽出し、当該分割原画像データの前記帳票上の位置を特定する識別情報を当該分割原画像データに設定する設定手段と、前記設定手段により抽出された前記各分割原画像データに対応した文字対応情報を前記分割原画像データ毎に生成する生成手段と、前記各分割原画像データ、前記各分割原画像データについて設定された識別情報、および前記各分割原画像データの前記文字について生成された前記文字対応情報を各々関連づけて前記記憶手段に記憶させる原画像データ記憶制御手段と、前記記憶手段に記憶されている前記各分割原画像データの中から、予め定められた手順に従って選択した前記分割原画像データを表示する表示制御手段と、前記表示手制御手段により表示された前記分割原画像データに対し、文字を特定する文字データの入力を受付ける受付手段と、前記表示制御手段により表示された前記分割原画像データおよび当該分割原画像データの前記識別情報に、前記受付手段が受付けた文字データを対応付けて前記記憶手段に記憶させる文字データ記憶制御手段とを備えることを特徴とする。
本発明の請求項9に係るプログラムは、文字が記載された帳票の原画像を読み取る読取手段を備えたコンピュータに、前記読取手段により読み取られた前記帳票の原画像のデータから1文字単位に分割した分割原画像データを抽出し、当該分割原画像データの前記帳票上の位置を特定する識別情報を当該分割原画像データに設定する設定ステップと、前記設定ステップにより抽出された前記各分割原画像データに対応した文字対応情報を前記分割原画像データ毎に生成する生成ステップと、前記各分割原画像データ、前記各分割原画像データについて設定された識別情報、および前記各分割原画像データの前記文字について生成された前記文字対応情報を各々関連づけて出力する出力制御ステップとを実行させるプログラムであることを特徴とする。
本発明の請求項10に係るプログラムは、文字が記載された帳票の原画像を1文字単位に分割した分割原画像データ、前記各分割原画像データの識別情報、当該分割原画像データに対応した文字対応情報を各々関連づけて記憶する画像データ記憶装置と接続され、データの入力を受付ける受付手段を備えるコンピュータに、前記画像データ記憶装置に記憶されている前記各分割原画像データの中から、予め定められた手順に従って選択した前記分割原画像データを表示する表示制御ステップと、前記表示制御ステップにより表示された前記分割原画像データに対し、前記受付手段により受付けた文字データを、当該分割原画像データおよび当該分割原画像データの前記識別情報に対応付けて前画像データ記憶装置に記憶させる記憶制御ステップとを実行させるプログラムであることを特徴とする。
請求項1に係る発明によれば、帳票に記入された複数の文字からなる文字列を表示して、それらの各文字のデータをデータ入力者に入力させる場合に比べ、その文字列によって表される内容がデータ入力者に知られにくい。
請求項2に係る発明によれば、帳票に記入された連続する文字列が表示される場合と比べて、データ入力者に帳票の内容が認識されにくい。
請求項3に係る発明によれば、データ入力者は、表示された文字について文字データの入力作業を行えば、表示された文字と同種の文字の入力作業を行うことなく、それらの文字についても文字データが入力される。
請求項4に係る発明によれば、データ入力者によって文字データが入力された文字が再び入力対象の文字として表示されず、重複したデータ入力が避けられる。
請求項5に係る発明によれば、文字の特徴情報に基づいて、入力された文字データに対応する帳票上の記入された文字を特定しうる。
請求項6に係る発明によれば、並び替えによりデータ入力作業が行いやすい種類の文字の場合、並び替えを行わずに表示された文字列を参照してデータ入力者にデータ入力を行わせる場合と比べ、その種類のデータ入力作業が行いやすい。
請求項7に係る発明によれば、意味を有さない文字列を参照してデータ入力作業を行う場合に比べ、データ入力作業が行いやすい。
請求項8に係る発明によれば、帳票に記入された複数の文字からなる文字列を表示して、それらの各文字のデータをデータ入力者に入力させる場合に比べ、その文字列によって表される内容がデータ入力者に知られにくい。
請求項9に係る発明によれば、帳票における項目等の単位で帳票に記入された文字列を分割する場合と比べ、分割された一部のデータが外部へ流出しても帳票の内容が第三者に知られにくい。
請求項10に係る発明によれば、帳票に記入された複数の文字からなる文字列を表示して、それらの各文字のデータをデータ入力者に入力させる場合に比べ、その文字列によって表される内容がデータ入力者に知られにくい。
本発明のデータ入力システム1の構成例を示す図である。 実施形態1における帳票のデータ例を示す図である。 実施形態1に係る画像読取装置100及びデータ入力受付装置200のブロック図である。 実施形態1における原画像情報の概念図である。 実施形態1における帳票情報テーブルのデータ例である。 実施形態1における画像読取装置100の動作フロー図である。 実施形態1におけるデータ入力受付装置200の動作フロー図である。 (a)は、実施形態1における文字入力画面の例を示す図である。(b)は、(a)の文字入力画面に文字入力された画面例を示す図である。 実施形態1における帳票情報テーブルのデータ例を示す図である。 実施形態2における帳票例を示す図である。 実施形態2における帳票情報テーブルのデータ例である。 実施形態2における画像読取装置100の動作フロー図である。 実施形態2におけるデータ入力受付装置200の動作フロー図である。 (a)は、実施形態2における文字入力画面の例を示す図である。(b)は、(a)の文字入力画面に文字入力された画面例を示す図である。 実施形態2における帳票情報テーブルのデータ例である。 実施形態3における単語テーブルのデータ例である。 実施形態3における帳票情報テーブルのデータ例である。 実施形態3におけるデータ入力受付装置200の動作フロー図である。 (a)は、実施形態3における文字入力画面の例を示す図である。(b)は、(a)の文字入力画面に文字入力された画面例を示す図である。 実施形態3における帳票情報テーブルのデータ例である。
以下、図面を参照して本発明の実施形態に係るデータ入力システムについて説明する。
<実施形態1>
<概要>
図1は、本実施形態におけるデータ入力システムの構成例を示している。図1に示すように、データ入力システム1は、画像読取装置100とデータ入力受付装置200a〜200n(以下、各データ入力受付装置を区別しないときはデータ入力受付装置200と言う)とで構成されており、画像読取装置100と各データ入力受付装置200とはLAN(Local Area Network)等の通信手段を介して接続されている。
本実施形態におけるデータ入力システム1は、図2に示す、住所、氏名、電話等の項目301〜303毎に記入位置が予め定められている形式の帳票30に記入された筆記文字を画像読取装置100において読み取り、データ入力受付装置200においては、読み取られた筆記文字を参照しながら、当該文字を特定する文字データ(文字コードなど)をワードプロセッサ機能(仮名漢字変換機能)等を用いて入力する。この入力は、帳票についてデータの入力を行うデータ入力者により行われる。
なお、本実施形態における帳票は、予め記載内容が項分けされて記入位置が定められた紙媒体である例について説明するが、帳票は、予め筆記者によって文字が記載されている媒体であればこれに限らない。
<構成>
図3は、データ入力システム1を構成する画像読取装置100とデータ入力受付装置200の各々の構成を示すブロック図である。以下、各装置の構成について説明する。
(画像読取装置100)
画像読取装置100は、スキャナ装置で実現され、CPU(Central Processing Unit)110、ROM(Read Only Memory)111、RAM(Random Access Memory)112、受付部113、画像読取部114、記憶部115、及び通信部116を含んで構成されている。CPU110は、ROM111に記憶されている制御プログラムを、RAM112をワークエリアとして実行することにより、設定手段110a、生成手段110b、出力制御手段110cの各機能を実現し、CPU110に接続されている各部を制御する。
即ち、後述の画像読取部114で帳票毎に読み取られた画像データ(以下、原画像データと言う)を、設定手段110aが予め定めた画素単位で分割して抽出し、抽出した原画像データ(以下、分割原画像データと言う)を識別するための識別情報を分割原画像データに設定する。また、生成手段110bは、設定手段110aにより抽出された各分割原画像データに含まれる筆記文字を示す文字対応情報として、各筆記文字の特徴を抽出して特徴情報を生成する。出力制御手段110cは、設定手段110aにより抽出された各分割原画像データと識別別情報を含む原画像情報を記憶部115に記憶し、生成手段110bにより生成された各分割画像データに対する特徴情報を識別情報と対応づけて帳票情報テーブルに書き込む。なお、分割の単位と筆記文字の特徴については後述する。
受付部113は、画像読取装置100の電源スイッチや画像読取部114を操作するための操作スイッチ等を含み、ユーザによって操作された内容を示す情報をCPU110へ送出する。画像読取部114は、画像読取装置100にセットされた帳票30の記載面に光を照射してスキャンし、帳票から反射された光をCCD(charge Coupled Device)により受光して光電変換した電気信号をCPU110へ遂次送出する。
記憶部115は、ハードディスク等の不揮発性記憶媒体で構成されており、原画像情報と帳票情報テーブルなどのデータを記憶する。なお、原画像情報及び帳票情報テーブルの詳細については後述する。通信部116は、CPU110の制御の下、データ入力受付装置200とデータを送受信する。
(データ)
次に、記憶部115に記憶されるデータについて説明する。まず、本実施形態における分割原画像データについて説明する。
図2に示すように、帳票30には、項目301〜303毎に破線で区分された1文字ずつの記入領域311〜313が設けられている。帳票30の原画像データは、左上の画素から順次ラスタ走査され、項目毎にこの記入領域の大きさの単位で分割されて、1文字単位の分割原画像データが抽出される。なお、抽出される分割原画像データは、筆記文字が記載された画像データであり、記入領域において黒画素が予め定められた数以上含まれているか否かを自動判定して、筆記文字の有無が判断される。また、抽出される分割原画像データには、各分割原画像データを識別するための識別情報が設定される。この識別情報は、分割原画像データが含まれる帳票を示す帳票ID、項目を示す項目ID、項目において分割原画像データが抽出された抽出順序とで構成されており、分割原画像データが抽出された際に設定される。そして、抽出された各分割原画像データと識別情報は原画像情報として記憶部115の予め定めた領域に格納される。このように、本実施形態における識別情報は、帳票をラスタ走査することにより抽出した順序で構成されており、帳票における分割原画像データの位置を示す情報を含むものである。
なお、識別情報を構成する帳票IDとしては、帳票に記載されているID等の文字を文字認識して取得してもよいし、帳票に印刷されているバーコード等を読み取って取得してもよく、画像読取装置100が、読み取り処理を行った日付や順番から帳票IDを設定してもよい。また、項目IDは、帳票内の記入枠の位置に応じてラスタ走査された順に予め定めた項目IDを設定するようにしてもよい。
図4は、図2の帳票30から抽出された分割原画像データと識別情報とを対応づけた原画像情報の概念図である。図4に示すように、例えば、図2の帳票30の「帳票001」における住所301の記入領域311の分割原画像データ311a「東」の場合には、帳票ID「A001」と項目ID「a」と抽出順序「1」で構成された識別情報31aが設定される。また、分割原画像データ311b「京」の場合には、帳票ID「A001」と項目ID「a」と抽出順序「2」とで構成された識別情報31bが設定される。
次に、帳票情報テーブルについて説明する。図5は、帳票情報テーブルのデータ例を示している。帳票情報テーブル32は、各分割原画像データに含まれている筆記文字の特徴を表す特徴情報と、その分割原画像データの識別情報とを対応づけて構成されている。この帳票情報テーブル32には、分割原画像データの特徴情報が抽出された際に、抽出された各特徴情報と識別情報のデータが格納される。
なお、本実施形態における筆記文字の特徴情報は、筆記文字を構成する垂直線分と水平線分の線分数を特定することにより抽出される。例えば、図4の分割原画像データ311a「東」の文字の場合、この文字の特徴情報として、垂直線分数1、水平線分数4が抽出される。そして、図5に示すように、この分割原画像データの識別情報、帳票ID「A001」、項目ID「a」、抽出順序「1」と対応づけて、垂直線分数を表す縦1:水平線分数を表す横4の特徴情報が生成されて格納される。
(データ入力受付装置200)
次にデータ入力受付装置200の構成について説明する。データ入力受付装置200は、パソコン等で実現され、CPU210、ROM211、RAM212、記憶部213、受付部214、表示部215、及び通信部216を含んで構成されている。CPU210は、ROM211に記憶されている制御プログラムを、RAM212をワークエリアとして実行することにより、抽出手段210a、表示制御手段210b、記憶制御手段210cの各機能を実現し、CPU210と接続されている各部を制御する。即ち、抽出手段210aは、データ入力対象となる帳票の帳票情報と原画像情報を画像読取装置100が読み取った画像データから抽出する。表示制御手段210bは、抽出手段210aにより抽出された帳票情報からランダムに選択した一文字の分割原画像データを表示部215に表示する。記憶制御手段210cは、データ入力者が入力した文字データのキャラクタの特徴情報を生成し、表示部215に表示された分割原画像データの特徴情報と照合し、照合結果に応じた処理を行う。
記憶部213は、ハードディスク等の不揮発性記憶媒体で構成されており、アプリケーションプログラムやユーザデータ等の各種データを記憶する。受付部214は、テンキーやキーボード、マウス等で実現され、データ入力者からの入力操作を受付け、入力操作を示す情報をCPU210へ送出する。
表示部215は、液晶等のディスプレイで実現され、CPU210の制御の下、データ入力者から文字入力操作を受付ける文字入力画面など、各種画像を表示する。通信部216は、CPU210の制御の下、画像読取装置100との間でデータを送受信する。
<動作>
次に、本実施形態に係るデータ入力システム1の動作について説明する。まず、図6を用いて画像読取装置100の動作を説明する。
(画像読取装置100の動作)
ユーザによって画像読取装置100に帳票30がセットされ、受付部113を介して帳票30の画像読取操作がなされた場合に、画像読取装置100のCPU110は、画像読取部114により帳票毎に光を照射して各帳票に記載された文字を読み取り(ステップS110)、読み取った画像の電気信号に基づいて原画像データを生成する(ステップS111)。
CPU110は、ステップS111で生成した原画像データにおいて、予め項目毎に設定されている記入領域の画素単位で原画像データを順次走査して分割し、分割した分割原画像データの識別情報を設定する(ステップS112)。即ち、各帳票における各項目の記入領域毎の画素値を抽出し、抽出した各画素値における黒画素が予め定めた数以上である記入領域のデータを分割原画像データとして抽出する。そして、その分割原画像データの識別情報として、分割原画像データの抽出元である帳票及び項目を識別する帳票ID及び項目IDと、当該項目において分割原画像データが抽出された順序を示す抽出順序とを当該分割原画像データと対応づけてRAM112に記憶する。
CPU110は、RAM112に記憶された各分割原画像データと識別情報を順次読み出し、読み出した分割原画像データに含まれる筆記文字の特徴情報を分割原画像データ毎に抽出する(ステップS113)。即ち、CPU110は、分割原画像データに含まれている文字の垂直線分数と水平線分数を検出し、検出した垂直線分数と水平線分数をその分割原画像データの特徴情報として生成する。そして、CPU110は、各分割原画像データと各識別情報とを対応づけた原画像情報を記憶部115へ記憶すると共に、各分割原画像データに設定された識別情報とステップS113において各分割原画像データについて抽出された特徴情報とを対応づけて帳票情報テーブル32に格納する(ステップS114)。
(データ入力受付装置200の動作)
次に、図7を用いてデータ入力受付装置200の動作について説明する。
データ入力受付装置200において、データ入力者が受付部214を介してデータ入力を行うための指示操作を行うと(ステップS210:YES)、CPU210は、通信部216を介して画像読取装置100の記憶部115にアクセスし、帳票情報テーブル32からデータが未入力の帳票情報を帳票IDの順に読み出してRAM212に記憶する(ステップS211)。
ここで、上記のアクセスの処理は、画像読取装置100の記憶部115からデータを読み出す場合には、データ入力受付装置200から読み出すべきデータを指定してデータの読み出し要求を画像読取装置100へ送出し、画像読取装置100のCPU110により読み出し要求のデータを記憶部115から読み出し、通信部116を介してデータ入力受付装置200へ渡す処理である。また、記憶部115にデータを書き込む場合には、データ入力受付装置200から書き込むデータと書き込み場所を指定したデータの書き込み要求を画像読取装置100へ送出し、画像読取装置100のCPU110により書き込み要求のデータを指定場所に格納する。以下、アクセスと言う場合には、上記の処理内容の意味で用いる。
CPU210は、ステップS211においてRAM212に記憶した帳票情報の識別情報から一の識別情報をランダムに選択し、通信部216を介して画像読取装置100の記憶部115にアクセスして、その選択した識別情報と対応づけられている分割原画像データを読み出し、読み出した分割原画像データを入力対象とする文字入力画面を表示する(ステップS212)。
ここで、文字入力画面について図8を用いて説明する。図8(a)は、ステップS212において表示される文字入力画面33の例を示している。図8(a)に示す文字入力画面33では、識別情報として、帳票ID「A001」、項目「住所」に対応する項目ID「a」、抽出順序「1」が設定された分割原画像データ311aの文字「東」が入力対象33aとして表示されている。データ入力者は、図8(b)に示すように、この文字入力画面33において、入力対象33aと同じ文字「東」を入力データ欄33bに入力する。
図7に戻り、CPU210は、文字入力画面33において、データ入力者から受付部214を介して文字入力操作を受付けると(ステップS213:YES)、入力された「東」の文字の垂直線分数及び水平線分数を検出して特徴情報を生成する(ステップS214)。なお、図8(b)の例の場合、入力された「東」の特徴情報は、垂直線分数が1、水平線分数が4であるので、「縦1:横4」が生成される。そして、CPU210は、RAM212に記憶されている帳票情報の特徴情報を読み出し、入力対象の文字の特徴情報と入力された文字の特徴情報とが予め定められた照合条件を満たすか否か判断する(ステップS215)。なお、この照合条件は、本実施形態においては、入力された文字の特徴情報と、表示されている分割原画像データについて設定されている特徴情報が合致するか否かの条件である。
CPU210は、ステップS215において各特徴情報が照合条件を満たす、即ち、特徴情報が合致すると判断した場合には(ステップS215:YES)、RAM212に記憶されている帳票情報において、ステップS215において判断された特徴情報と同一の特徴情報が対応づけられている識別情報の入力データとして、文字入力画面33で入力された文字「東」を記憶し、通信部216を介して画像読取装置100の記憶部115へアクセスし、その帳票情報を帳票情報テーブル32に書き込んで更新する(ステップS216)。
図9は、このようにして更新された帳票情報テーブル32の例を示している。同図に示すように、帳票ID“A001”の帳票情報において、特徴情報「縦1:横4」を有する入力データ321には、文字入力画面33において入力された「東」を示す文字データが各々格納されて更新される。
図7に戻り、ステップS217において、RAM212に記憶されている帳票情報に入力データが全て格納された場合、又は、データ入力者によってデータ入力処理を終了する終了操作が受付部214を介してなされた場合に(ステップS217:YES)、CPU210は、選択されている帳票のデータ入力処理を終了する。
また、ステップS217において、RAM212に記憶されている帳票情報に入力データが格納されていない場合、又は、データ入力者によって終了操作がなされていなければ(ステップS217:NO)、CPU210は、ステップS212に戻り、通信部216を介して画像読取装置100の記憶部115にアクセスし、入力データが格納されていない識別情報に対応する分割原画像データをランダムに読み出し、文字入力画面33において読み出した分割原画像データの文字を表示し、ステップS212以下の処理を繰り返し行う。
また、CPU210は、ステップS210において、データ入力処理の指示操作がなされるまでは待機する(ステップS210:NO)。また、ステップS213において、データ入力者が文字入力画面33において文字入力操作を行うまで(ステップS213:NO)、CPU210は、文字入力画面33を表示した状態で待機する。また、ステップS215において、入力対象の分割原画像データの特徴情報と入力された文字の特徴情報が照合条件を満たさない、つまり、各特徴情報が合致しないと判断した場合には(ステップS215:NO)、CPU210は、ステップS213以下の処理を繰り返し行う。なお、この場合には、文字入力画面33において文字入力操作を再度行うことを示すメッセージを表示してデータ入力者から文字入力操作を再度受付けるようにする。
上述した実施形態では、帳票毎に記入された文字の分割原画像データを1文字単位でランダムに表示され、帳票の各項目に記載された住所や氏名等の内容がデータ入力者に認識されにくい。また、データ入力者が、例えば、「東」という分割原画像データの文字に対して1度の入力作業を行えば、同じ帳票における他の分割原画像データの文字「東」についても同時にデータ入力が行われ、重複したデータ入力が避けられる。
<実施形態2>
次に、本発明の実施形態2に係るデータ入力システムについて説明する。
本実施形態では、原画像データを文字認識し、認識した文字(以下、認識文字と言う)の種類(数字、アルファベットなど)に応じた既定の並び順で、その認識文字に対応する分割原画像データを表示してデータ入力者から文字入力操作を受付ける。以下、上述した実施形態1と同様の構成については、実施形態1と同じ符号を用いて説明する。
図10は、本実施形態における帳票の例を示している。図10に示す帳票40は、実施形態1と同様、予め郵便番号401、住所402、及び氏名403の各項目が配置され、各項目には破線で一文字ずつ区分された記入領域411〜413が設けられている。
本実施形態では、画像読取装置200は、数字が記入される郵便番号401の項目IDが付与された分割原画像データについて、生成手段110bによりパターンマッチングを行って、分割原画像データに対応する数字を特定し、出力制御手段110cにより特定した数字を当該分割原画像データの文字情報として帳票情報テーブル42に記憶する。図11は、本実施形態における帳票情報テーブルの例を示している。同図に示すように、帳票情報テーブル42は、上述した実施形態1と同様、分割原画像データに設定された識別情報(帳票ID、項目ID、及び抽出順序)と認識文字が対応付けられている。この認識文字は、分割原画像データの筆記文字についてパターンマッチングを行って特定された文字を示し、各筆記文字に対応する文字対応情報である。この帳票情報テーブル42には、各分割原画像データについて文字認識処理を行った際に、文字認識された識別情報と認識文字が格納される。
なお、記憶部115には、実施形態1と同様に、分割原画像データと識別情報とを対応づけた原画像情報が記憶され、パターンマッチングを行うためのデータ(以下、照合用文字データと言う)が予め記憶されている。
<動作>
以下、図12及び13を用い、本実施形態に係るデータ入力システム1の動作について説明する。なお、図12及び13において、上述した実施形態1と同じ処理については、実施形態1と同様のステップ番号を付しており、実施形態1と異なる動作について図10及び図11の例を用いて説明する。まず、画像読取装置100の動作について説明する。
(画像読取装置100の動作)
図12において、画像読取装置100のCPU110は、ステップS110〜S112の各処理を行う。そして、記憶部115から照合用文字データを読み出し、項目ID「a」の各分割原画像データについて照合用文字データを用いてパターンマッチングを行って文字認識を行い、文字認識した数字を特定する(ステップS123)。CPU110は、各分割原画像データとその識別情報とを対応づけた原画像情報を記憶部115へ記憶すると共に、項目ID「a」の各分割原画像データの識別情報と、その分割原画像データについて特定した数字を帳票情報テーブル32に格納する(ステップS124)。
(データ入力受付装置200の動作)
図13において、データ入力受付装置200のCPU210は、実施形態1と同様に、ステップS210、S211の処理を行い、帳票ID「B001」の帳票情報を画像読取装置100から読み出してRAM212に記憶する。
CPU210は、RAM212に記憶されている帳票情報の項目ID「a」と対応づけられている認識文字を昇順に並び替え、通信部216を介して画像読取装置100の記憶部115にアクセスして項目ID「a」の分割原画像データを読み出し、並び替えた各認識文字の識別情報に対応する分割原画像データを文字入力画面に表示する(ステップS221)。
ここで、本実施形態における文字入力画面について図14を用いて説明する。図14(a)は、ステップS221において表示される文字入力画面43の例を示している。文字入力画面43には、帳票ID「B001」の項目ID「a」と対応づけられている認識文字「5」「6」「7」「1」「2」「4」「3」が昇順に並び替えられ、各認識文字に対応する筆記数字の分割原画像データ“1”“2”“3”“4”“5”“6”“7”が入力対象43aに表示される。データ入力者は、図14(b)に示すように、この文字入力画面43において、入力データ欄43bに入力対象43aで示された各数字を入力する。
図13に戻り、CPU210は、文字入力画面43において、データ入力者により受付部214を介して文字入力操作がなされると(ステップS213:YES)、RAM212に記憶されている帳票情報において、文字入力画面43において表示した分割原画像データの識別情報の入力データとして入力された数字データを記憶し、通信部216を介して画像読取装置100の記憶部115にアクセスして帳票情報テーブル42にその帳票情報を書き込み、更新する(ステップS216)。
このようにして更新された帳票情報テーブル42の例を図15に示す。図15に示すように、帳票情報テーブル42の帳票ID「B001」の項目ID「a」の入力データ欄421には、文字入力画面43において入力された数字データが各々格納される。
上述した本実施形態は、このように、帳票に記載された数字等の文字が昇順や降順等の予め定められた順序に並び替えられて表示され、データ入力者は、並び替えられた文字を参照しながらデータ入力を行う。
なお、上記実施形態では、数字について文字認識を行う場合について説明したが、アルファベットや漢字等の文字についても文字認識を行うようにしてもよい。例えば、ある項目の分割原画像データについて文字認識を行った結果、特定された文字がアルファベットである場合には、その認識文字をアルファベット順に並び替えて表示するようにしてもよい。また、漢字の場合には、文字コード順に並び替えたり、漢数字である場合には漢数字の昇順や降順で並び替えたりするなど、認識文字に応じて予め定めた順序で並び替えを行って分割原画像データを表示する。
<実施形態3>
上述した実施形態2では、数字の分割原画像データを既定の順序で並び替えて提示し、データを入力する例であったが、本実施形態では、数字以外の文字について文字認識を行い、データ入力受付装置200に予め記憶している単語テーブルの中から認識文字を含む単語を抽出し、抽出した単語の並び順で分割原画像データを表示する例について説明する。以下、上述した実施形態1と同様の構成については同じ符号を用いて説明し、上述した実施形態と異なる部分について説明を行う。
図16は、上述した本実施形態における単語テーブルの例を示している。同図に示すように、単語テーブル50には、各単語を識別する単語IDと、名詞、形容詞、動詞等の意味を有する各単語が含まれており、この単語テーブル50は、データ入力受付装置200の記憶部213に予め記憶されている。
また、図17は、実施形態2と同様の帳票情報テーブル42を示している。この帳票情報テーブル42は、住所402と氏名403の各分割原画像データについて文字認識を行った結果、特定された認識文字が記憶された例を示している。なお、画像読取装置100の記憶部115には、実施形態2と同様、分割原画像データと識別情報を対応付けた原画像情報が記憶され、また、パターンマッチングの為の照合用文字データが予め記憶されている。
<動作>
本実施形態に係るデータ入力システム1の動作について説明する。なお、本実施形態における画像読取装置100は、上述した実施形態2と同様であるため、データ入力受付装置200の動作についてのみ説明を行う。図18は、データ入力受付装置200の動作フロー図である。以下、図10、図16、図17の例を用いて説明する。
データ入力受付装置200のCPU210は、実施形態2と同様、ステップS210、S211の処理を行い、帳票ID「B001」の帳票情報を帳票情報テーブル42から読み出して、RAM212へ記憶する。そして、CPU210は、帳票情報の識別情報のうち、入力データが未入力である識別情報(帳票ID「B001」、項目ID「c」、抽出順序「3」)に対応する認識文字(以下、未入力認識文字と言う)「静」を一つ選択する(ステップS231)。そして、CPU210は、記憶部213から単語テーブル50を読み出して、選択した未入力認識文字を含む単語「静岡県」を抽出する(ステップS232)。
CPU210は、RAM212に記憶されている帳票情報において、選択した未入力認識文字「静」と異なる項目IDの識別情報と対応付けられた未入力認識文字を用い、抽出した単語「静岡県」が構成できるか否か判断する(ステップS233)。
ステップS233において、CPU210は、抽出した単語「静岡県」が、未入力認識文字「静」と、帳票ID「B001」,項目ID「d」,抽出順序「1」に対応づけられた未入力認識文字「岡」と、帳票ID「B001」,項目ID「c」,抽出順序「4」と対応づけられた未入力認識文字「県」を用いて構成できると判断すると(ステップS233:YES)、通信部216を介して画像読取装置100の記憶部115にアクセスし、その各未入力認識文字に対応する分割原画像データを読み出し、読み出した各分割原画像データを単語の文字の並び順で文字入力画面に表示する(ステップS234)。
図19(a)は、このようにして表示された文字入力画面51の例を示している。入力対象511〜513には、選択された単語の並び順で分割原画像データが表示される。そして、図19(b)に示すように、入力対象511〜513の各々に対応する入力データ521〜523の各欄に、入力対象511〜513の各文字と同じ文字が入力される。
図18に戻り、ステップS213において、CPU210は、ステップS236で表示された文字入力画面51に文字が入力されると(ステップS213:YES)、実施形態2と同様、ステップS216以下の処理を行う。図20は、上記の例でステップS216の処理を行った後の帳票情報テーブル42の例を示している。同図に示すように、文字入力画面51においてデータ入力者により入力された「静」「岡」「県」の文字データが、提示された分割原画像データの識別情報に対応する入力データ422に各々格納される。
図18に戻り、ステップS233において、CPU210は、抽出した単語を構成できないと判断した場合(ステップS233:NO)、単語テーブル50の全ての単語について上記ステップS233の判断を行うまで(ステップS235:NO)、単語テーブル50から単語を順次抽出し(ステップS232)、ステップS233の処理を行う。
また、ステップS235において、単語テーブル50の全ての単語について上記ステップS233の判断を行った場合には(ステップS235:YES)、通信部216を介して画像読取装置100の記憶部115にアクセスし、抽出した単語の一部を構成可能な未入力認識文字及び入力済の認識文字に対応する分割原画像データを、その単語の並び順で文字入力画面に提示する(ステップS236)。即ち、例えば、最後に抽出した単語が「静岡県」である場合において、この単語を未入力認識文字で構成できなければ、入力済の認識文字と組み合わせて単語を構成し、各認識文字に対応する分割原画像データを表示する。この場合には、文字入力画面において、入力済の分割原画像データに対応する入力データ欄に入力済のデータを表示する。また、入力済の認識文字を組み合わせても単語を構成できない場合には、単語を構成可能な一部の認識文字に対応する分割原画像データを表示するようにする。この場合、例えば、「静岡県」のうち、認識文字「岡」が帳票情報に含まれていなければ、「静」「県」の分割原画像データのみを表示する。
上述した本実施形態では、このように、意味のある単語の並び順で帳票に記載された文字が表示される。
<変形例>
以下、本発明の変形例について説明する。
(1)上述した実施形態1では、特徴情報として文字の垂直線分数と水平線分数を抽出する例について説明したが、文字の特徴を抽出する方法であればこれに限らず、以下の方法を用いてもよい。例えば、記入領域に記載された文字と背景との濃度の変化を抽出して文字の輪郭を検出し、検出した輪郭の情報を特徴情報として抽出する。また、記入領域内における文字の周囲四辺に現れる黒画素の密度を検出して文字を分類し、その分類情報を特徴情報として生成するようにしてもよい。また、上記のようにして生成された特徴情報を実施形態1の特徴情報と組み合わせて記憶し、入力された文字の特徴情報と分割原画像データの特徴情報が、予め定めた類似範囲に含まれる等の照合条件を満たす場合に、その入力された文字を分割原画像データの識別情報と関連づけて記憶するようにしてもよい。
(2)上述した実施形態1では、1文字単位で分割原画像データをランダムに表示する例であったが、項目IDが異なる分割原画像データを複数並べて表示するようにしてもよい。
(3)また、上述した実施形態2では、入力された数字を同じ帳票IDの対応する認識文字の識別情報と対応づけて記憶する例であったが、他の帳票IDの認識文字のうち、入力された数字と同じ認識文字の識別情報と対応づけて記憶するようにしてもよい。
(4)また、上述した実施形態2では、同じ項目IDの認識文字を既定の順序で並び替え、その並び替えた順序で分割原画像データを表示する例であったが、複数項目に数字の認識文字が記憶されている場合、全ての項目の認識文字を既定の順序で並び替え、その並び替えた順序で分割原画像データを予め定められた数の単位で表示するようにしてもよい。
(5)また、上述した実施形態3では、項目が異なる認識文字を組み合わせた単語を抽出する例であったが、同一項目内の認識文字を組み合わせ、その項目に含まれていない単語を抽出するようにしてもよい。
(6)上述した実施形態1〜3は、データ入力受付装置200毎に一帳票のデータ入力を行う例であったが、例えば、データ入力受付装置200aと200bが、同じ帳票の文字データの入力を各々のデータ入力者から受付けてもよい。この場合、実施形態1及び実施形態3の例では、データ入力受付装置200aと200bは、帳票情報テーブルにおいてデータが未入力の識別情報に対応する分割原画像データを各々抽出した際、帳票情報テーブルにその識別情報を使用していることを示す使用フラグを設定し、抽出した分割原画像データを表示する。また、実施形態2の例では、データ入力受付装置200a及び200bは、一帳票中の項目単位で文字データの入力を受付け、帳票情報テーブルにおいて、入力対象の項目IDを含む識別情報に使用フラグを設定し、入力対象の項目IDに対応する分割原画像データを既定の順序で並び替えて表示する。
(7)上述した実施形態1〜3では、分割原画像データを含む帳票において、当該分割原画像データが抽出された順序に応じた識別情報が当該分割原画像データに設定される例について説明したが、例えば、帳票における分割原画像データの座標など、分割原画像データの位置を示す情報を識別情報として設定するようにしてもよい。
(8)上述した実施形態1では、データ入力受付装置200は、表示部215に表示された分割原画像データに対してデータ入力者により入力された文字データを、表示された分割原画像データに対応する文字対応情報を有する他の分割原画像データの識別情報についても対応づけて記憶する例であったが、表示された分割原画像データの識別情報についてだけ入力された文字データを対応づけて記憶するようにしてもよい。また、この場合において、データ入力者によって入力された文字データと、当該他の分割原画像データを表示部215に表示し、当該他の分割原画像データに対応する文字データとして、入力された文字データを入力するか否かの選択をデータ入力者から受付け、入力する旨の選択を受付けた場合に、その入力された文字データを当該他の分割原画像データの識別情報と対応づけて記憶するようにしてもよい。
(9)上述した実施形態1〜3は、画像読取装置100は、読み取った各帳票の分割原画像データ、各分割原画像データに設定した識別情報、各分割原画像データに対応する文字対応情報(特徴情報や認識文字)を関連づけて自装置内の記憶部115に出力して記憶する例であったが、画像読取装置100は、画像読取装置100とデータ入力受付装置200と接続された別の装置にこれらのデータを出力し、その装置に記憶させるように構成してもよい。この場合には、データ入力受付装置200は、分割原画像データ、各分割原画像データに設定した識別情報、各分割原画像データに対応する文字対応情報(特徴情報や認識文字)が関連付けて記憶されている装置にアクセスして、これらのデータの読み出し及び入力された文字データの書き込みを行う。
(10)上述した実施形態1〜3のデータ入力システム1は、画像読取装置100とデータ入力受付装置200で構成されている例であったが、画像読取装置100がデータ入力受付装置200の機能を備えるように構成し、画像読取装置100においてデータ入力者から文字データの入力を受付けてデータ入力を行うように構成してもよい。
(11)上述した実施形態1〜3で用いた帳票は、予め記載内容が項分けされて記入領域が定められた帳票の例について説明したが、記入領域が定められていない媒体である場合には、以下のように分割原画像データを抽出するようにしてもよい。例えば、画像読取装置100は、文字が記載された媒体を予め定めた間隔でスキャンして黒画素の分布を検出することにより、記載されている文字間隔を特定し、特定した文字間隔に基づいて、媒体の原画像データから一文字単位の分割原画像データを抽出する。
(12)上述した実施形態1〜3のデータ入力受付装置200は、表示部215を備える構成の例であったが、データ入力受付装置200に液晶ディスプレイなどの表示装置を外付けして接続する構成であってもよい。この場合には、データ入力受付装置200のCPU210は、実施形態で示した文字入力画面等の画像を、その表示装置に表示するよう制御する。
(13)上述の実施形態1〜3における画像読取装置100及びデータ入力受付装置200のCPU110及びCPU210によって実行されるプログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータが読取可能な記録媒体に記憶した状態で提供し得る。また、インターネット等の通信手段を用いて画像読取装置100及びデータ入力受付装置200にダウンロードさせることも可能である。
1・・・データ入力システム、100・・・画像読取装置、110,210・・・CPU、112,212・・・RAM、113,214・・・受付部、114・・・画像読取部、115,213・・・記憶部、116,216・・・通信部、200・・・データ入力受付装置、215・・・表示部

Claims (10)

  1. (A)文字が記載された帳票の原画像を帳票毎に読み取る読取手段と、
    前記読取手段により読み取られた前記帳票の原画像のデータから1文字単位に分割した分割原画像データを抽出し、当該分割原画像データの前記帳票上の位置を特定する識別情報を当該分割原画像データに設定する設定手段と、
    前記設定手段により抽出された前記各分割原画像データに対応した文字対応情報を前記分割原画像データ毎に生成する生成手段と、
    前記各分割原画像データ、前記各分割原画像データについて設定された識別情報、および前記各分割原画像データの前記文字について生成された前記文字対応情報を各々関連づけて出力する出力制御手段とを備える画像読取装置と、
    (B)前記出力制御手段が出力する前記各分割原画像データの中から、予め定められた手順に従って選択した前記分割原画像データを表示する表示制御手段と、
    前記表示制御手段により表示された前記分割原画像データに対し、文字を特定する文字データの入力を受付ける受付手段と、
    前記表示制御手段により表示された前記分割原画像データおよび当該分割原画像データの前記識別情報に、前記受付手段が受付けた文字データを対応付けて記憶する記憶制御手段とを備えるデータ入力受付装置と、
    を備えることを特徴とするデータ入力システム。
  2. 前記予め定められた手順は、前記各分割原画像データの中からランダムに予め定められた数の前記分割原画像データを選択することを特徴とする請求項1記載のデータ入力システム。
  3. 前記記憶制御手段は、前記表示制御手段により表示された前記分割原画像データと同種の内容の前記文字対応情報を有している前記分割原画像データについても、前記受付手段が受付けた前記文字データを対応付けることを特徴とする請求項1又は2記載のデータ入力システム。
  4. 前記表示制御手段は、前記記憶制御手段によって前記文字データの対応付けがなされた前記分割原画像データについては選択から除外することを特徴とする請求項1〜3のいずれか一項に記載のデータ入力システム。
  5. 前記生成手段は、前記各分割原画像データの前記文字対応情報として、当該分割原画像データの文字の特徴を表す特徴情報を生成し、
    前記記憶制御手段は、前記表示制御手段により表示された前記各分割原画像データに対して、前記受付手段が受付けた前記文字データの特徴情報を生成し、生成した当該特徴情報と当該分割原画像データの前記特徴情報とが予め定められた条件を満たす場合に、当該分割原画像データ及び当該分割原画像データの前記識別情報に、前記文字データを関連づけて記憶することを特徴とする請求項1〜4のいずれか一項に記載のデータ入力システム。
  6. 前記画像読取装置は、予め定めた複数の文字を照合用文字として記憶する照合用文字記憶手段を備え、
    前記生成手段は、前記各分割原画像データの前記文字対応情報として、当該分割原画像データと、前記照合用文字記憶手段に記憶されている前記複数の照合用文字とを照合し、当該分割原画像データに対応する前記照合用文字を特定し、
    前記表示制御手段は、前記各分割原画像データに対応する前記照合用文字の種類毎に、前記種類に応じて予め定められた並び替え順序に従って前記照合用文字を並び替え、並び替えた前記照合用文字に対応する前記分割原画像データを表示することを特徴とする請求項1〜4のいずれか一項に記載のデータ入力システム。
  7. 前記画像読取装置は、予め定めた複数の文字を照合用文字として記憶する照合用文字記憶手段を備え、
    前記生成手段は、前記各分割原画像データの前記文字対応情報として、当該分割原画像データと、前記照合用文字記憶手段に記憶されている前記複数の照合用文字とを照合し、当該分割原画像データに対応する前記照合用文字を特定し、
    前記データ入力受付装置は、予め定めた複数の単語を記憶する単語記憶手段を備え、
    前記表示制御手段は、前記単語記憶手段に記憶された前記複数の単語から、前記分割原画像データに対応する前記照合用文字で構成された前記単語を抽出し、抽出した前記単語を構成する前記照合用文字の順序で、当該照合用文字に対応する前記分割原画像データを表示することを特徴とする請求項1〜4のいずれか一項に記載のデータ入力システム。
  8. データを記憶する記憶手段と、
    文字が記載された帳票の原画像を帳票毎に読み取る読取手段と、
    前記読取手段により読み取られた前記帳票の原画像のデータを1文字単位に分割した分割原画像データを抽出し、当該分割原画像データの前記帳票上の位置を特定する識別情報を当該分割原画像データに設定する設定手段と、
    前記設定手段により抽出された前記各分割原画像データに対応した文字対応情報を前記分割原画像データ毎に生成する生成手段と、
    前記各分割原画像データ、前記各分割原画像データについて設定された識別情報、および前記各分割原画像データの前記文字について生成された前記文字対応情報を各々関連づけて前記記憶手段に記憶させる原画像データ記憶制御手段と、
    前記記憶手段に記憶されている前記各分割原画像データの中から、予め定められた手順に従って選択した前記分割原画像データを表示する表示制御手段と、
    前記表示手制御手段により表示された前記分割原画像データに対し、文字を特定する文字データの入力を受付ける受付手段と、
    前記表示制御手段により表示された前記分割原画像データおよび当該分割原画像データの前記識別情報に、前記受付手段が受付けた文字データを対応付けて前記記憶手段に記憶させる文字データ記憶制御手段と
    を備えることを特徴とするデータ入力受付装置。
  9. 文字が記載された帳票の原画像を読み取る読取手段を備えたコンピュータに、
    前記読取手段により読み取られた前記帳票の原画像のデータから1文字単位に分割した分割原画像データを抽出し、当該分割原画像データの前記帳票上の位置を特定する識別情報を当該分割原画像データに設定する設定ステップと、
    前記設定ステップにより抽出された前記各分割原画像データに対応した文字対応情報を前記分割原画像データ毎に生成する生成ステップと、
    前記各分割原画像データ、前記各分割原画像データについて設定された識別情報、および前記各分割原画像データの前記文字について生成された前記文字対応情報を各々関連づけて出力する出力制御ステップと
    を実行させるためのプログラム。
  10. 文字が記載された帳票の原画像を1文字単位に分割した分割原画像データ、前記各分割原画像データの識別情報、当該分割原画像データに対応した文字対応情報を各々関連づけて記憶する画像データ記憶装置と接続され、文字データの入力を受付ける受付手段を備えるコンピュータに、
    前記画像データ記憶装置に記憶されている前記各分割原画像データの中から、予め定められた手順に従って選択した前記分割原画像データを表示する表示制御ステップと、
    前記表示制御ステップにより表示された前記分割原画像データに対し、前記受付手段により受付けた文字データを、当該分割原画像データおよび当該分割原画像データの前記識別情報に関連付けて前記画像データ記憶装置に記憶させる記憶制御ステップとを
    を実行させるためのプログラム。
JP2009126649A 2009-05-26 2009-05-26 データ入力システム、データ入力受付装置及びプログラム Pending JP2010277168A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009126649A JP2010277168A (ja) 2009-05-26 2009-05-26 データ入力システム、データ入力受付装置及びプログラム
US12/619,200 US8254721B2 (en) 2009-05-26 2009-11-16 Data input system, data input receiving device, data input receiving method and computer readable medium
CN200910225481.5A CN101902541B (zh) 2009-05-26 2009-12-16 数据输入系统,数据输入接收装置,数据输入读取方法,以及数据输入接收方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009126649A JP2010277168A (ja) 2009-05-26 2009-05-26 データ入力システム、データ入力受付装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2010277168A true JP2010277168A (ja) 2010-12-09

Family

ID=43220308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009126649A Pending JP2010277168A (ja) 2009-05-26 2009-05-26 データ入力システム、データ入力受付装置及びプログラム

Country Status (3)

Country Link
US (1) US8254721B2 (ja)
JP (1) JP2010277168A (ja)
CN (1) CN101902541B (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103077389A (zh) * 2013-01-07 2013-05-01 华中科技大学 一种结合字符级分类和字符串级分类的文本检测和识别方法
JP2017182276A (ja) * 2016-03-29 2017-10-05 株式会社東芝 画像処理システム、画像処理装置、および画像処理プログラム
JP2018066930A (ja) * 2016-10-21 2018-04-26 三菱電機インフォメーションシステムズ株式会社 データ保管装置及びデータ保管プログラム
US20180276461A1 (en) 2017-03-21 2018-09-27 Casio Computer Co., Ltd. Ledger document processing device, ledger document processing method and storage medium

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5606385B2 (ja) * 2011-04-28 2014-10-15 楽天株式会社 サーバ装置、サーバ装置の制御方法、及び、プログラム
JP2014078168A (ja) * 2012-10-11 2014-05-01 Fuji Xerox Co Ltd 文字認識装置及びプログラム
JP6025803B2 (ja) * 2014-11-06 2016-11-16 京セラドキュメントソリューションズ株式会社 画像処理装置
JP6488729B2 (ja) * 2015-01-29 2019-03-27 富士ゼロックス株式会社 記入フォーム提供装置、画像形成装置及びプログラム
CN105808742A (zh) * 2016-03-11 2016-07-27 北京天创征腾信息科技有限公司 一种影像池系统及使用影像池的方法
JP6701932B2 (ja) * 2016-05-06 2020-05-27 コニカミノルタ株式会社 画像形成装置、プログラム、会議システム
JP7095345B2 (ja) * 2018-03-22 2022-07-05 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
JP7275617B2 (ja) * 2019-02-06 2023-05-18 日本電信電話株式会社 情報処理装置、判別方法および判別プログラム
CN110598186A (zh) * 2019-07-31 2019-12-20 浙江口碑网络技术有限公司 图像识别的辅助处理方法、装置及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006315A (ja) * 2001-06-21 2003-01-10 Ricoh Co Ltd 情報入力支援サービスシステム
JP2003029910A (ja) * 2001-07-10 2003-01-31 Toshiba Corp 秘匿情報入力方法および装置ならびにプログラム
JP2005202773A (ja) * 2004-01-16 2005-07-28 Trans Cosmos Inc イメージ処理装置、方法及びプログラム並びにイメージ処理システム
JP2006244315A (ja) * 2005-03-04 2006-09-14 Aidekku:Kk データエントリーシステム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5821929A (en) * 1994-11-30 1998-10-13 Canon Kabushiki Kaisha Image processing method and apparatus
JP3167578B2 (ja) 1995-03-30 2001-05-21 沖電気工業株式会社 帳票分類処理方法およびシステム
JP3422897B2 (ja) * 1996-05-17 2003-06-30 株式会社テクノクラフト 文字列抽出システム及び文字列抽出方法
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
US7836010B2 (en) * 2003-07-30 2010-11-16 Northwestern University Method and system for assessing relevant properties of work contexts for use by information services
JP2007304864A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 文字認識処理システムおよび文字認識処理プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006315A (ja) * 2001-06-21 2003-01-10 Ricoh Co Ltd 情報入力支援サービスシステム
JP2003029910A (ja) * 2001-07-10 2003-01-31 Toshiba Corp 秘匿情報入力方法および装置ならびにプログラム
JP2005202773A (ja) * 2004-01-16 2005-07-28 Trans Cosmos Inc イメージ処理装置、方法及びプログラム並びにイメージ処理システム
JP2006244315A (ja) * 2005-03-04 2006-09-14 Aidekku:Kk データエントリーシステム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103077389A (zh) * 2013-01-07 2013-05-01 华中科技大学 一种结合字符级分类和字符串级分类的文本检测和识别方法
JP2017182276A (ja) * 2016-03-29 2017-10-05 株式会社東芝 画像処理システム、画像処理装置、および画像処理プログラム
JP2018066930A (ja) * 2016-10-21 2018-04-26 三菱電機インフォメーションシステムズ株式会社 データ保管装置及びデータ保管プログラム
US20180276461A1 (en) 2017-03-21 2018-09-27 Casio Computer Co., Ltd. Ledger document processing device, ledger document processing method and storage medium
JP2018157472A (ja) * 2017-03-21 2018-10-04 カシオ計算機株式会社 帳簿書類処理装置、帳簿書類処理方法、及びプログラム
US11010603B2 (en) 2017-03-21 2021-05-18 Casio Computer Co., Ltd. Ledger document processing device, ledger document processing method and storage medium

Also Published As

Publication number Publication date
CN101902541A (zh) 2010-12-01
US20100303382A1 (en) 2010-12-02
US8254721B2 (en) 2012-08-28
CN101902541B (zh) 2015-08-19

Similar Documents

Publication Publication Date Title
JP2010277168A (ja) データ入力システム、データ入力受付装置及びプログラム
JP2005108254A (ja) アイコン生成方法、アイコン選択方法及び文書検索方法
US8429154B2 (en) Document search device, imaging forming apparatus, and document search system
JP2713622B2 (ja) 表形式文書読取装置
JP2006209353A (ja) 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体
JP2011128924A (ja) マンガ画像からテキストを抽出するマンガ画像解析装置、プログラム、検索装置及び方法
JP7208771B2 (ja) 情報処理装置、情報処理方法およびプログラム、並びに、画像形成システム
JPH09204492A (ja) 帳票処理装置
CN108875570B (zh) 信息处理装置、存储介质和信息处理方法
CN106339726A (zh) 用于手写识别的方法及装置
US11508139B2 (en) Information processing apparatus and non-transitory computer readable medium
JP6542546B2 (ja) 文書データ処理方法およびシステム
US10657404B2 (en) Character recognition device, character recognition method, and character recognition program
KR20150053483A (ko) 사전 문자열의 자동 조합을 이용한 패스워드 탐색 장치 및 방법
JP7351159B2 (ja) 情報処理装置及びプログラム
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
CN112560849A (zh) 基于神经网络算法的文理分割方法及系统
JPH1021043A (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
JP2009182530A (ja) 業務処理遂行支援装置
KR102673900B1 (ko) 표 데이터 추출 시스템 및 그 방법
JPH07152856A (ja) 光学的文字読取装置
JP3548233B2 (ja) 文字認識装置及び方法
JP4697387B2 (ja) 原稿画像判定装置、原稿画像判定方法及びそのプログラム
US20220309272A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP5298830B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120418

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131015

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140415