JP2001092912A - Device and method for inputting data - Google Patents

Device and method for inputting data

Info

Publication number
JP2001092912A
JP2001092912A JP27126399A JP27126399A JP2001092912A JP 2001092912 A JP2001092912 A JP 2001092912A JP 27126399 A JP27126399 A JP 27126399A JP 27126399 A JP27126399 A JP 27126399A JP 2001092912 A JP2001092912 A JP 2001092912A
Authority
JP
Japan
Prior art keywords
format
paper
input
data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP27126399A
Other languages
Japanese (ja)
Inventor
Mieko Matsuda
三恵子 松田
Hiroaki Kubota
浩明 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP27126399A priority Critical patent/JP2001092912A/en
Publication of JP2001092912A publication Critical patent/JP2001092912A/en
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To easily discriminate and select the class of an input document even when the list of a lot of similar documents is displayed concerning a data input device for efficiently inputting data in the predetermined format of a document or the like. SOLUTION: When the image data of a paper sheet having a predetermined format are inputted (step S1) and plural features such as ruled line frame, ruled line color and intensified character string in the format of the relevant paper sheet are extracted from these input image data (steps S2-S6), the formats of paper sheets composed of these extracted plural features are registered concerning plural kinds of paper sheets (step S7). Then, these registered formats for plural kinds of paper sheets are respectively displayed as images on which features thereof are reflected and the class of a paper sheet format to become the target of data input is determined out of these displayed formats for plural kinds of paper sheets.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、帳票等の予め定め
られた書式上でデータを効率よく入力するためのデータ
入力装置及びデータ入力方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data input device and a data input method for efficiently inputting data in a predetermined format such as a form.

【0002】[0002]

【従来の技術】一般に、銀行や郵便局等の公的機関で
は、顧客による各種の手続きのために多種多様な帳票が
用意されている。そして、この帳票の予め定められた書
式に従って配置された各項目に書き込まれた種々のデー
タは、まず、帳票全体の画像データとして読み込まれ、
各項目エリア毎に文字認識されてデータ化されること
で、当該各項目に応じて予め設定されたデータ管理形式
で大容量メモリに保存されるようになっている。
2. Description of the Related Art Generally, in public institutions such as banks and post offices, various forms are prepared for various procedures by customers. Then, various data written in each item arranged according to a predetermined format of the form are first read as image data of the entire form,
By character recognition and data conversion for each item area, data is stored in a large-capacity memory in a data management format set in advance according to each item.

【0003】この場合、各種の帳票毎にそれぞれ対応す
るデータ管理形式で認識データの保存管理を行うために
は、入力しようとする帳票の種別を、予め登録されてい
る多数の帳票の種別の中から選択して指定する必要があ
る。
In this case, in order to store and manage the recognition data in a data management format corresponding to each of various forms, the type of the form to be input must be changed among a number of pre-registered forms. It is necessary to select from and specify.

【0004】従来、入力帳票の帳票種別を選択,指定す
る場合には、データ入力可能な帳票として予め登録され
ている多数の帳票の画像を、そのまま縮小して一覧表示
するか、又は、同登録されている各帳票の罫線枠のみを
二値化した線画として縮小し一覧表示することにより、
前記入力帳票と同じ種別の登録帳票を選択して指定して
いた。
Conventionally, when a form type of an input form is selected and designated, images of a large number of forms registered in advance as forms to which data can be input are reduced and displayed as a list, By reducing only the ruled line frame of each form as a binarized line drawing and displaying it in a list,
A registration form of the same type as the input form is selected and designated.

【0005】図10は登録されている帳票画像の従来の
表示例を示す図である。
FIG. 10 is a view showing a conventional display example of a registered form image.

【0006】しかしながら、登録されている各取り扱い
帳票が類似している場合には、前記帳票画像をそのまま
縮小して一覧表示したり、二値化した罫線枠の線画のみ
を縮小して一覧表示したりするやり方では、登録帳票の
特徴が把握しにくく、入力すべき帳票がどの種別の帳票
であるのかを判別するのが難しいという問題がある。
However, if the registered forms are similar, the form image is reduced and displayed as a list, or only the binarized ruled line drawing is reduced and displayed as a list. However, there is a problem that it is difficult to grasp the characteristics of the registered form, and it is difficult to determine which type of form is to be input.

【0007】[0007]

【発明が解決しようとする課題】すなわち、従来は、登
録されている帳票画像をそのまま縮小表示することによ
って、画像そのものがボケてしまったり、あるいは登録
帳票の罫線枠を二値化した線画で縮小表示することによ
って、帳票の種別を判別するのに有効な色情報が欠落し
てしまったりしたため、各帳票の種別を判別するのが難
しくなっている。
That is, conventionally, the registered form image is reduced and displayed as it is, so that the image itself is blurred or the ruled line frame of the registered form is reduced by a binarized line drawing. The display makes it difficult to determine the type of each form, because color information effective for determining the type of the form is missing.

【0008】大量の登録帳票の画像の中から入力帳票に
該当する帳票を選択するには、複数の登録帳票を同時に
一覧表示することが必要になるが、各帳票の種別を判別
できるように一覧表示するためには、できるだけ各帳票
画像それぞれの特徴を損なわずに縮小表示することが要
求される。
In order to select a form corresponding to an input form from a large number of registered form images, it is necessary to simultaneously display a plurality of registered forms in a list. In order to display the form images, it is required to display the form images in a reduced size as much as possible without impairing the characteristics of each form image.

【0009】本発明は、上記事情を考慮してなされたも
ので、罫線枠の色情報やプレ印字文字等、登録されてい
る各種帳票の特徴を表示することによって、多数の類似
帳票を一覧表示した場合でも、容易に入力帳票の種別を
判別し選択することが可能になるデータ入力装置及びデ
ータ入力方法を提供することを目的とする。
The present invention has been made in consideration of the above circumstances, and displays a large number of similar forms in a list by displaying features of various registered forms such as color information of ruled lines and preprinted characters. It is an object of the present invention to provide a data input device and a data input method that can easily determine and select the type of an input form even when the input form is input.

【0010】[0010]

【課題を解決するための手段】すなわち、本発明に係る
データ入力装置は、予め定められたフォーマットを有す
る用紙に対し記入された記述内容を、そのフォーマット
に従ってデータ化して入力するデータ入力装置であっ
て、前記予め定められたフォーマットを有する用紙の画
像データを読み込む画像入力手段と、この画像入力手段
により読み込まれた用紙の画像データから当該用紙のフ
ォーマットにおける複数の特徴を抽出する特徴抽出手段
と、この特徴抽出手段により抽出された複数の特徴から
なる用紙のフォーマットを複数種類の用紙について登録
するフォーマット登録手段と、このフォーマット登録手
段に登録された複数種類の用紙のフォーマットをそれぞ
れその特徴を反映させた画像として表示する登録フォー
マット表示手段と、この登録フォーマット表示手段によ
り表示された複数種類の用紙のフォーマットの中から、
データ入力の対象となる用紙フォーマットの種別を確定
するフォーマット確定手段とを具備したことを特徴とす
る。
That is, a data input device according to the present invention is a data input device for converting description contents written on a sheet having a predetermined format into data according to the format and inputting the data. An image input unit that reads image data of a sheet having the predetermined format; a feature extraction unit that extracts a plurality of features in the format of the sheet from image data of the sheet read by the image input unit; A format registration unit for registering a format of a plurality of types of paper extracted from the plurality of features extracted by the feature extraction unit, and a format of the plurality of types of paper registered in the format registration unit reflecting the characteristics of the respective types. Registration format display means for displaying as an image, From the format of the plurality of types displayed in the sheet by the registration format display means,
A format determining unit for determining a type of a paper format for which data is to be input.

【0011】このような構成のデータ入力装置では、画
像入力手段により読み込まれた予め定められたフォーマ
ットを有する用紙の画像データから、特徴抽出手段によ
り当該用紙のフォーマットにおける罫線枠や罫線色,強
調文字列等の複数の特徴が抽出されると、この特徴抽出
された複数の特徴からなる用紙のフォーマットは、フォ
ーマット登録手段により複数種類の用紙について登録さ
れる。そして、このフォーマット登録された複数種類の
用紙のフォーマットは、登録フォーマット表示手段によ
りそれぞれその特徴を反映させた画像として表示され、
このフォーマット表示された複数種類の用紙のフォーマ
ットの中から、フォーマット確定手段によりデータ入力
の対象となる用紙フォーマットの種別が確定されるの
で、データ入力すべき用紙フォーマットの選択確定が容
易に行われ、効率のよいデータ入力が行えることにな
る。
In the data input device having such a configuration, the image data of the sheet having a predetermined format read by the image input means is extracted by the characteristic extracting means into the ruled line frame, the ruled line color, the emphasized characters in the format of the paper. When a plurality of features such as columns are extracted, the format of the paper including the plurality of extracted features is registered for a plurality of types of paper by the format registration unit. Then, the formats of the plurality of types of paper registered in the format are displayed as images in which the characteristics are reflected by the registered format display means, respectively.
Since the type of the paper format for which data is to be input is determined by the format determination means from the plurality of types of paper formats displayed in the format, the selection and determination of the paper format to be input can be easily performed. Efficient data input can be performed.

【0012】[0012]

【発明の実施の形態】以下図面により本発明の実施の形
態について説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0013】図1は本発明のデータ入力装置の実施形態
に係る帳票データを分類して保存するため帳票入力装置
の構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a form input device for classifying and storing form data according to an embodiment of the data input device of the present invention.

【0014】この帳票入力装置は、制御部(CPU)1
0と画像入力部11とディスプレイ装置16と指示デバ
イス17と各種記憶手段(入力データメモリ12、フォ
ーマット情報記憶部14、保存部18)をバス19に接
続して構成される。
The form input device includes a control unit (CPU) 1
0, an image input unit 11, a display device 16, a pointing device 17, and various storage means (input data memory 12, format information storage unit 14, storage unit 18) are connected to a bus 19.

【0015】図1では、帳票フォーマット登録部13と
フォーマット確定部15を、ハードウエア資源として示
しているが、画像入力部11とディスプレイ装置16と
指示デバイス17と各記憶手段(入力データメモリ1
2、フォーマット情報記憶部14、保存部18)とを接
続したCPUからなる制御部10(コンピュータ)に実
行させることのできるプログラムとしてフロッピーディ
スク、CD−ROM等の記憶媒体に記録して頒布するこ
ともできる。
In FIG. 1, the form format registration unit 13 and the format determination unit 15 are shown as hardware resources. However, the image input unit 11, the display device 16, the pointing device 17, and each storage means (input data memory 1)
2. Recording and distributing on a storage medium such as a floppy disk or a CD-ROM as a program that can be executed by the control unit 10 (computer) including a CPU connected to the format information storage unit 14 and the storage unit 18). Can also.

【0016】この帳票入力装置は、前記帳票フォーマッ
ト登録部13による帳票フォーマット登録処理に従い当
該装置で取り扱いの対象となる帳票のフォーマットを予
め登録するための帳票登録モードと、前記フォーマット
確定部16によるフォーマット確定処理に従い前記帳票
登録モードにおいて登録された各種の帳票からデータ入
力すべき帳票の種別を選択,確定するためのフォーマッ
ト確定モードとの2種類の動作モードを有する。
The form input device includes a form registration mode for pre-registering a format of a form to be handled by the apparatus in accordance with a form format registration process by the form format registration unit 13, and a format by the format determination unit 16. There are two types of operation modes, a format determination mode for selecting and determining the type of form to be input data from the various forms registered in the form registration mode in accordance with the determination processing.

【0017】帳票登録モードにおいては、以下のように
動作する。
The operation in the form registration mode is as follows.

【0018】すなわち、画像入力部11は、登録する帳
票(登録帳票)を画像スキャナによりスキャンして、得
られた画像を帳票フォーマット登録部13に与える。入
力データメモリ12は、前記画像入力部11により入力
された帳票の画像を記憶しておくものである。
That is, the image input unit 11 scans a form (registration form) to be registered with an image scanner, and provides the obtained image to the form format registration unit 13. The input data memory 12 stores an image of a form input by the image input unit 11.

【0019】前記帳票フォーマット登録部13は、画像
入力部11により入力された帳票の画像に対し、カラー
分離、線分抽出、文字枠抽出、文字認識、罫線枠抽出等
の特徴認識処理を施し、その認識結果をディスプレイ装
置16に表示してユーザに提示した後に、指示デバイス
17の操作によるユーザとの対話的な処理によって、前
記特徴認識された登録帳票の各種特徴の構成要素を任意
に追加・修正する処理を行うもので、この帳票フォーマ
ット登録部13によって特徴抽出された帳票のフォーマ
ットデータは、フォーマット情報記録部4に登録され
る。
The form format registration unit 13 performs a characteristic recognition process such as color separation, line segment extraction, character frame extraction, character recognition, and ruled line frame extraction on the form image input by the image input unit 11. After displaying the recognition result on the display device 16 and presenting it to the user, the user can arbitrarily add components of the various features of the registered form that has been feature-recognized by interactive processing with the user by operating the instruction device 17. The format data of the form extracted by the form format registration unit 13 is registered in the format information recording unit 4.

【0020】一方、フォーマット確定モードにおいて
は、以下のように動作する。
On the other hand, the operation in the format determination mode is as follows.

【0021】すなわち、画像入力部11は、各項目毎に
必要な文字の記入が為されたファイリング(入力)すべ
き帳票を画像スキャナによりスキャンして、得られた画
像を入力データメモリ12に記憶させる。
That is, the image input unit 11 scans a form to be filed (inputted) in which necessary characters are entered for each item by an image scanner, and stores the obtained image in the input data memory 12. Let it.

【0022】フォーマット確定部15は、前記帳票フォ
ーマット登録部13による帳票フォーマット登録処理に
よってフォーマット情報記憶部14に登録された複数の
帳票のフォーマット情報を基にして、各登録帳票それぞ
れの特徴データを反映させた帳票画像を作成してディス
プレイ16上に一覧表示させる。ユーザは、一覧表示さ
れた複数の登録帳票の画像を、指示デバイス17の操作
に基づく対話的な処理によって判別確認し、例えばマウ
スのような指示デバイス17によって入力すべき帳票の
種別に対応する登録帳票を判別して指定する。
The format determination unit 15 reflects the characteristic data of each registered form based on the format information of a plurality of forms registered in the format information storage unit 14 by the form format registration processing by the form format registration unit 13. The created form image is created and displayed as a list on the display 16. The user discriminates and confirms the images of the plurality of registered forms displayed in a list by interactive processing based on the operation of the pointing device 17, and registers the images corresponding to the type of the form to be input by the pointing device 17 such as a mouse, for example. Determine and specify the form.

【0023】このフォーマット確定部15によるフォー
マット確定処理により選択指定された登録帳票のフォー
マットに従って、前記入力データメモリ12に記憶され
た入力帳票の各項目に記入されている文字データが認識
抽出され、保存部18において所定のデータ管理形式で
保存される。
According to the format of the registration form selected and designated by the format decision processing by the format decision unit 15, the character data written in each item of the input form stored in the input data memory 12 is recognized and extracted and stored. The data is stored in a predetermined data management format in the unit 18.

【0024】次に、前述の各動作モードにおいて行われ
る処理を、より詳細に説明する。
Next, the processing performed in each of the above-described operation modes will be described in more detail.

【0025】まず、帳票登録モードの処理について説明
する。
First, the processing in the form registration mode will be described.

【0026】図2は前記帳票入力装置の帳票登録モード
における処理動作を示すフローチャートである。
FIG. 2 is a flowchart showing the processing operation of the form input device in the form registration mode.

【0027】まず、画像入力部11の画像スキャナによ
って登録すべき帳票の画像が入力されると、この入力さ
れた帳票の画像はディスプレイ装置16の表示画面上に
表示されると共に、帳票フォーマット登録部13に与え
られる(ステップS1)。
First, when an image of a form to be registered is input by the image scanner of the image input unit 11, the input image of the form is displayed on the display screen of the display device 16, and the form format registration unit 13 (step S1).

【0028】すると、この帳票フォーマット登録部13
では、前記入力表示された登録すべき帳票の画像データ
に対して、カラー分離処理が行われ、背景画像、罫線及
びプレ印字部の抽出が行われる(ステップS2)。
Then, the form format registration unit 13
In step S2, a color separation process is performed on the input and displayed image data of the form to be registered, and a background image, ruled lines, and a preprint portion are extracted (step S2).

【0029】さらに、罫線,プレ印字部として抽出され
たデータに対しては、二値化が行われた後(ステップS
3)、罫線,罫線枠,文字枠,文字コード等の帳票の種
別を識別する際に用いられる特徴的な要素(特徴量)の
抽出が行われ(ステップS4)、その特徴要素毎に色解
析処理(ステップS5)が施される。
Further, the data extracted as the ruled line and the pre-printing section is binarized (step S).
3) A characteristic element (characteristic amount) used for identifying a form type such as a ruled line, a ruled line frame, a character frame, and a character code is extracted (step S4), and color analysis is performed for each characteristic element. Processing (step S5) is performed.

【0030】この際、ディスプレイ16には、前記入力
された帳票の画像が、前記ステップS2〜S5の処理に
従って特徴抽出された形態の画像に変換されて表示され
る。
At this time, the input form image is converted into an image in a form in which features are extracted according to the processing in steps S2 to S5 and displayed on the display 16.

【0031】そして、指示デバイス17の操作によるユ
ーザからのマニュアルでの指示に従って、前記特徴抽出
された帳票の画像に対して、例えば不要な特徴部を削除
したり、その他の特徴部を加えたりする等の追加・修正
処理(ステップS6)が必要に応じて行われ、最終的な
登録帳票のフォーマット情報としてフォーマット情報記
憶部14に登録される(ステップS7)。
Then, according to a manual instruction from the user by operating the instruction device 17, for example, unnecessary characteristic parts are deleted or other characteristic parts are added to the image of the form from which the characteristic has been extracted. And the like (step S6) are performed as necessary, and registered in the format information storage unit 14 as final format information of the registration form (step S7).

【0032】なお、前記背景画像,罫線及びプレ印字抽
出,色解析等(ステップS2〜S5)を自動で行わず、
ユーザが対話的に入力指示してもよい(ステップS
8)。
The background image, ruled lines and pre-print extraction, color analysis, etc. (steps S2 to S5) are not automatically performed.
The user may interactively give an input instruction (step S
8).

【0033】さらに、前記登録帳票のフォーマット情報
には、データ入力すべき同種の帳票上で文字認識すべき
領域や画像を切り出す領域等、その帳票によって処理し
たい内容を付加して登録してもよく、入力帳票に対する
データ入力処理手順の登録には、処理を行いたい領域の
位置情報と処理内容を記述しておけばよい。
Further, in the format information of the registration form, contents to be processed by the form such as an area for character recognition and an area for cutting out an image on the same type of form to which data is input may be added and registered. In registering the data input processing procedure for the input form, the position information of the area to be processed and the processing content may be described.

【0034】ここで、前記帳票フォーマット登録処理に
伴うカラー分離処理(ステップS2)における背景画像
の検出及びその除去処理について説明する。
Here, the detection and removal of the background image in the color separation process (step S2) accompanying the form format registration process will be described.

【0035】入力された帳票画像に対して、RGBの値
をHSV(色相,彩度,明度)の値に変換する。この値
から、ヒストグラムを採って、最も画素数の多い値を背
景色値とする。背景色が決定されたら、この値に基づい
て背景部分を画像全体から除去する。もちろん、背景色
の検出は他の方法を用いてもよい。
The RGB values of the input form image are converted into HSV (hue, saturation, lightness) values. From this value, a histogram is taken, and the value having the largest number of pixels is set as the background color value. When the background color is determined, the background portion is removed from the entire image based on this value. Of course, other methods may be used to detect the background color.

【0036】入力画像は、帳票の背景部分、罫線部分、
文字部分が存在すると考えることができるので、前記背
景画像が除去された時点で残された画像は、罫線,プレ
印字文字部と考えられる。従って、これら罫線,プレ印
字文字部が残された画像について二値化し(ステップS
3)、この2値化画像から図形特徴や文字コード等の各
種要素を抽出した後(ステップS4)、この罫線あるい
は文字等の各抽出要素の色解析を行い、そのそれぞれの
色特徴の抽出を行う(ステップS5)。
The input image includes a background portion, a ruled line portion,
Since it can be considered that a character portion exists, the image left when the background image is removed is considered to be a ruled line and a preprinted character portion. Therefore, the image in which these ruled lines and the preprinted character portion are left is binarized (step S).
3) After extracting various elements such as graphic features and character codes from the binarized image (step S4), the extracted elements such as the ruled lines and the characters are subjected to color analysis, and the respective color features are extracted. Perform (Step S5).

【0037】前記ステップS4における要素抽出では、
上述した通り、罫線,文字枠,文字コード等を抽出する
が、罫線の抽出は例えば以下の方法により行う。
In the element extraction in step S4,
As described above, a ruled line, a character frame, a character code, and the like are extracted. The ruled line is extracted by, for example, the following method.

【0038】すなわち、ここでは、罫線は4点から構成
される枠情報であると考えて抽出を行う。
That is, here, the ruled line is extracted assuming that it is frame information composed of four points.

【0039】まず、入力された帳票の画像データをラス
タスキャンして追跡開始点を検出した後、その追跡開始
点から時計周りあるいは反時計周りに図形境界がつくる
閉曲線を追跡することによって輪郭線の抽出が行われ
る。このような閉曲線追跡により抽出された輪郭の情報
は座標点列、あるいは方向コードの列であるチェインコ
ードとして保存される。この輪郭抽出処理については、
種々公知である他の輪郭抽出の手法を用いてもよい。
First, after a tracking start point is detected by raster-scanning the input image data of a form, a closed curve having a figure boundary formed clockwise or counterclockwise from the tracking start point is traced to thereby obtain a contour line. An extraction is performed. The information on the contour extracted by such closed curve tracking is stored as a coordinate point sequence or a chain code which is a sequence of direction codes. Regarding this contour extraction processing,
Various other known contour extraction techniques may be used.

【0040】次に、前記輪郭線データをもとに、罫線画
像の交差部や角点という特徴点を検出する。これは、例
えば輪郭点列から凸点列を検出し、それに対応付く凹点
列を抽出する。この特徴点の検出は、例えば曲率算出処
理によって求められた曲率kを所定の閾値K0,K1と
比較し、(k≦K0)なる点列を凹点列、(k≧K1)
となる点を凸点列とすることにより実現される。
Next, feature points such as intersections and corner points of the ruled line image are detected based on the contour data. In this method, for example, a sequence of convex points is detected from a sequence of contour points, and a sequence of concave points corresponding to the sequence is extracted. The feature point is detected by, for example, comparing the curvature k obtained by the curvature calculation processing with predetermined threshold values K0 and K1, and converting a point sequence (k ≦ K0) into a concave point sequence and (k ≧ K1).
This is realized by setting a point to be a sequence of convex points.

【0041】このような特徴点の検出により、罫線画像
の特徴点が抽出される。
By detecting such characteristic points, characteristic points of the ruled line image are extracted.

【0042】なお、この特徴点の抽出処理は、図形の細
線化処理や芯線化処理によって実現してもよい。例え
ば、細線化データでは線分の端点には凸点が存在し、細
線の交差点には凹点が存在することから、特徴抽出が可
能となる。
The feature point extracting process may be realized by a graphic thinning process or a centering process. For example, in the thinned data, a convex point exists at the end point of the line segment, and a concave point exists at the intersection of the thin line, so that feature extraction becomes possible.

【0043】次に、これらの点列の組合せから枠を抽出
する。
Next, a frame is extracted from the combination of these point sequences.

【0044】枠の抽出は、例えば注目点近郊にある4点
の座標の組合せから、図形が長方形又は平行四辺形をな
すかどうかを判断することにより容易に枠領域が抽出可
能である。このとき、枠の抽出は他の手法を用いてもよ
い。
In the extraction of the frame, the frame area can be easily extracted by judging whether or not the figure forms a rectangle or a parallelogram from, for example, a combination of the coordinates of four points near the point of interest. At this time, another method may be used to extract the frame.

【0045】文字枠の抽出は、例えば以下の方法により
行う。
The extraction of the character frame is performed by, for example, the following method.

【0046】画像を連結領域毎にラベル付けし、外接図
形を求める。次に隣接する外接図形がある閾値内の距離
にある場合には併合してみる。併合を行った場合に再度
外接図形を計算し、下線の方向(傾き)の変動がある閾
値以内の場合には同一文字列であるとする。なお、文字
枠の抽出方法についても、種々公知である他の手法を用
いてもよい。
The image is labeled for each connected area, and a circumscribed figure is obtained. Next, when adjacent circumscribed figures are within a certain threshold distance, they are merged. When the merging is performed, the circumscribed figure is calculated again. If the change in the direction of the underline (inclination) is within a certain threshold, it is determined that the character strings are the same. It should be noted that various known methods may also be used for extracting the character frame.

【0047】文字の抽出は、例えば以下の方法で行う。The extraction of characters is performed, for example, by the following method.

【0048】画像を連結領域毎にラベル付けし、外接図
形を求める。外接図形の大きさがある閾値内である場合
には文字候補として文字認識を行う。なお、文字の抽出
方法についても、種々公知である他の手法を用いてもよ
い。
The image is labeled for each connected region, and a circumscribed figure is obtained. If the size of the circumscribed figure is within a certain threshold, character recognition is performed as a character candidate. It should be noted that various known methods may be used for the method of extracting characters.

【0049】次に、前記帳票フォーマット登録処理に伴
う色解析処理(ステップS5)は、例えば以下の方法で
行う。
Next, the color analysis processing (step S5) accompanying the form format registration processing is performed by the following method, for example.

【0050】この場合、前記ステップS2において、既
に入力画像の中から背景部分が削除されているので、色
部分についてのみ処理を行う。
In this case, in step S2, since the background portion has already been deleted from the input image, only the color portion is processed.

【0051】罫線枠毎にその罫線付近の画素値を、RG
B空間もしくはH(色相)−S(彩度)空間に投票し、
クラスタリングにより帳票画像に存在する色を判定す
る。
For each ruled line frame, the pixel value near the ruled line is
Vote in B space or H (hue)-S (saturation) space,
A color existing in the form image is determined by clustering.

【0052】図3は前記帳票入力装置の帳票フォーマッ
ト登録処理における色解析処理に伴う色判定のためのH
−S投票空間の一例を示す図である。
FIG. 3 shows an H for color determination in the form analysis process of the form input device.
It is a figure showing an example of -S voting space.

【0053】例えば、図3に示すように、予め帳票に使
われるような罫線の色成分に相当する投票箱をHSの色
空間に配置しておいて、入力画像から抽出された画素に
対して色成分を計算し、順次その抽出画素毎に投票箱に
投票していく方法をとる。例えば、赤に相当する投票
箱、青に相当する投票箱を設けて、各抽出画素毎の色成
分で投票を行い、最終的に投票数や投票画素全体に対し
て占める割合を算出して、当選か落選かを決定する。こ
の方法によって対象罫線枠の代表色を記録する。この
他、罫線枠の枠線1辺毎に罫線色を判定してもよい。
For example, as shown in FIG. 3, a ballot box corresponding to a color component of a ruled line used in a form is previously arranged in an HS color space, and pixels extracted from an input image are A method of calculating color components and sequentially voting in the ballot box for each extracted pixel is used. For example, a voting box corresponding to red and a voting box corresponding to blue are provided, voting is performed with a color component for each extracted pixel, and finally the number of votes and the ratio of the voting pixels to the total are calculated. Decide whether you will win or lose. With this method, the representative color of the target ruled line frame is recorded. In addition, the ruled line color may be determined for each side of the ruled line frame.

【0054】また、罫線上の画素のRGB値の各平均を
求め、この罫線あるいは罫線枠の代表色とすることも可
能である。このとき、罫線上のどの点をサンプル点にと
るかは自由である。勿論、自動で罫線色を抽出せず、ユ
ーザがフォーマット登録時に罫線あるいは罫線枠色をマ
ニュアル登録してもよい。すなわち、帳票の特徴を表わ
す罫線色を抽出しその罫線をベクトル表示することによ
って、罫線枠の特徴が鮮明に表示できればよい。
It is also possible to calculate the average of the RGB values of the pixels on the ruled line and use the average as the representative color of the ruled line or ruled line frame. At this time, any point on the ruled line can be freely selected as a sample point. Of course, instead of automatically extracting the ruled line color, the user may manually register the ruled line or ruled line frame color at the time of format registration. That is, it is only necessary to extract the ruled line colors representing the features of the form and to display the ruled lines in a vector so that the features of the ruled line frame can be clearly displayed.

【0055】このように、前記カラー分離処理(ステッ
プS2)、2値化処理(ステップS3)、罫線,プレ文
字の要素抽出処理(ステップS4)、罫線枠の色解析処
理(ステップS5)によって特徴抽出された登録すべき
帳票の画像データは、次に追加・修正処理(ステップS
6)に渡される。
As described above, the color separation process (step S2), the binarization process (step S3), the ruled line and pre-character element extraction process (step S4), and the color analysis process of the ruled line frame (step S5). The extracted image data of the form to be registered is then added / corrected (step S
6).

【0056】この場合、特徴抽出された帳票画像は、そ
の抽出された特徴が重畳されてディスプレイ16に表示
され、ユーザによるマニュアル操作でのデータ修正が行
われる。各特徴要素のマニュアル修正は、広く公知の図
形作成ツール等と同様に行うことが可能である。
In this case, the extracted form image is displayed on the display 16 with the extracted features superimposed thereon, and the data is manually corrected by the user. Manual correction of each feature element can be performed in the same manner as a widely known graphic creation tool or the like.

【0057】そして、前記ステップS1〜S6の処理を
経て特徴抽出及び特徴設定された登録すべき帳票のフォ
ーマット情報は、フォーマット登録処理(ステップS
7)においてその帳票フォーマットに対応付けるキーワ
ード又はファイル名が付与され保存部18に保存され
る。
Then, the format information of the form to be registered, which has been subjected to the feature extraction and the feature setting through the processes of steps S1 to S6, is subjected to a format registration process (step S6).
In 7), a keyword or a file name corresponding to the form format is given and stored in the storage unit 18.

【0058】図4は前記帳票入力装置の帳票フォーマッ
ト登録処理に従ってフォーマット情報を登録すべきカラ
ー帳票の具体例を示す図である。
FIG. 4 is a diagram showing a specific example of a color form in which format information is to be registered in accordance with the form format registration processing of the form input device.

【0059】すなわち、図4に示すように、カラー帳票
には、その抽出すべき特徴のある構成要素として、罫線
枠、罫線色、そして予め印字されている文字列(プレ印
字文字列)領域R1,R2が存在する。
That is, as shown in FIG. 4, the color form includes, as constituent elements having characteristics to be extracted, a ruled line frame, a ruled line color, and a character string (pre-printed character string) region R1 which is printed in advance. , R2 are present.

【0060】図5は前記帳票入力装置の帳票フォーマッ
ト登録処理に従ってフォーマット情報記憶部14に記憶
された登録帳票のフォーマット情報をイメージで示す図
である。
FIG. 5 is a diagram showing the format information of a registered form stored in the format information storage unit 14 in accordance with the form format registration processing of the form input device.

【0061】すなわち、図5に示すように、各登録帳票
には、色情報の違いも含めて特徴量となる構成要素[罫
線枠,文字列(プレ印字文字列)等]がある。これらの
帳票には、色情報のみ共通のもの、プレ印字の一部が共
通のもの、罫線枠の一部が共通のものが存在する。一般
的には、ユーザがデータ入力したい帳票の種別を、前記
登録帳票から目視で選択する場合には、罫線枠の色や、
キーになる文字列を比較していることが多い。
That is, as shown in FIG. 5, each registration form has a component [ruled line frame, character string (pre-print character string), etc.] which is a feature amount including a difference in color information. In these forms, there are a form in which only color information is common, a form in which a part of preprinting is common, and a form in which a part of a ruled line frame is common. In general, when the type of a form that the user wants to input data is visually selected from the registered form, the color of the ruled line frame,
They often compare key strings.

【0062】従って、本実施形態の帳票入力装置では、
これら一見して類似の帳票でもそれぞれ特徴のある帳票
を選択する場合に、その特徴的な要素を分かり易く表示
するために、前記図2における帳票フォーマット登録処
理に従った各帳票の特徴抽出によるフォーマット情報の
登録を行うものである。
Therefore, in the form input device of this embodiment,
In order to display the characteristic elements in a manner that is easy to understand when selecting a characteristic form even among these seemingly similar forms, a format is extracted by extracting the characteristic of each form according to the form format registration process in FIG. It registers information.

【0063】次に、フォーマット確定モードの処理につ
いて説明する。
Next, the processing in the format determination mode will be described.

【0064】図6は前記帳票入力装置のフォーマット確
定モードにおける処理動作を示すフローチャートであ
る。
FIG. 6 is a flowchart showing a processing operation in the format determination mode of the form input device.

【0065】まず、各項目に必要事項が記入されたデー
タ入力すべき帳票が、画像入力部11のスキャナによっ
て入力されると、この入力帳票の画像は入力データメモ
リ12に記憶され、ディスプレイ装置16の表示画面上
に表示されると共に、フォーマット確定部15に与えら
れる(ステップS9)。
First, when a form in which necessary information is entered in each item to be input is input by the scanner of the image input unit 11, the image of the input form is stored in the input data memory 12, and the display device 16 Is displayed on the display screen and is given to the format determination unit 15 (step S9).

【0066】すると、前記入力データメモリ12に記憶
された入力帳票の画像に対して、前記図2における帳票
フォーマット登録処理での各特徴抽出処理(ステップS
2〜S6)と同様にした罫線枠の位置及び色、プレ印字
文字列等の特徴抽出が行われ、この入力帳票の特徴と照
合一致する特徴を有するフォーマット情報の登録帳票
が、前記フォーマット情報記憶部14に記憶された登録
帳票の中から選定される(ステップS10)。
Then, with respect to the image of the input form stored in the input data memory 12, each feature extraction process (step S) in the form format registration process in FIG.
Features such as the position and color of the ruled line frame and the pre-printed character string are extracted in the same manner as in 2 to S6), and a registration form of format information having a feature that matches and matches the feature of the input form is stored in the format information storage. It is selected from the registration forms stored in the section 14 (step S10).

【0067】そして、前記入力帳票の抽出特徴に照合一
致させて前記フォーマット情報記憶部14から選定され
た登録帳票が読み出され、ディスプレイ16において一
覧表示される(ステップS11)。
Then, the registered form selected from the format information storage unit 14 is read out from the format information storage unit 14 by collating and matching the extracted form of the input form, and is displayed in a list on the display 16 (step S11).

【0068】すなわち、入力帳票の特徴として、例えば
罫線枠毎に色が指定してあればその枠毎に、線分毎に色
が指定してあればその線分毎に、指定された色に対応し
た特徴を有する登録帳票が呼び出されて表示される。勿
論、線幅や線種等も指定されていれば、その入力帳票が
有する特徴に従った登録帳票が呼びされて表示される。
That is, as a feature of the input form, for example, if a color is designated for each ruled line frame, the designated color is assigned to each frame if a color is designated for each line segment. A registration form having the corresponding features is called and displayed. Of course, if the line width, line type, and the like are also specified, a registered form according to the characteristics of the input form is called and displayed.

【0069】この入力帳票に応じた登録帳票の選定,呼
び出し一覧表示(ステップS10,S11)では、例え
ば、罫線枠の位置、罫線色、キーワード等のユーザによ
りマニュアル指定された特徴を用いて検索されたものの
みを表示してもよい。
In the selection of a registered form according to the input form and display of a list of calls (steps S10 and S11), a search is performed using features manually specified by the user, such as the position of the ruled line frame, the ruled line color, and keywords. May be displayed.

【0070】また、前記特徴選定されて呼び出された登
録帳票が大量に存在する場合には、複数ページ渡って表
示するようにしてもよい。
When there are a large number of registered forms called out with the selected features, a plurality of pages may be displayed.

【0071】図7は前記帳票入力装置のフォーマット確
定処理に従って選定された罫線枠毎に代表色を異ならせ
た特徴を有する登録帳票の表示例を示す図である。
FIG. 7 is a diagram showing a display example of a registered form having a characteristic in which a representative color is different for each ruled line frame selected according to the format determination processing of the form input device.

【0072】図8は前記帳票入力装置のフォーマット確
定処理に従って選定された罫線枠毎に異なる色の特徴を
有する登録帳票の表示例を示す図である。
FIG. 8 is a diagram showing a display example of a registered form having different color characteristics for each ruled line frame selected according to the format determination processing of the form input device.

【0073】図9は前記帳票入力装置のフォーマット確
定処理に従いプレ印字文字の特徴のみがマニュアル指定
されて選定された登録帳票の表示例を示す図である。
FIG. 9 is a diagram showing a display example of a registered form in which only the characteristics of preprinted characters are manually designated and selected in accordance with the format determination processing of the form input device.

【0074】そして、このように入力帳票の特徴に応じ
て選定され一覧表示された複数の登録帳票の中から、当
該入力帳票の種別に対応する登録帳票が選択されて指定
される(ステップS11)。
Then, a registration form corresponding to the type of the input form is selected and designated from among the plurality of registration forms selected and displayed according to the characteristics of the input form (step S11). .

【0075】したがって、前記構成の帳票入力装置にお
ける帳票フォーマットの登録機能及びその選択確定機能
によれば、登録帳票の構成要素毎の色情報等の特徴を抽
出付加して表示するようにしたので、複数の登録帳票か
ら入力帳票の種別を選択する場合の、帳票フォーマット
の選択作業を大幅に軽減することができる。
Therefore, according to the form format registration function and its selection and determination function in the form input device having the above-described configuration, features such as color information for each component of the registered form are extracted and displayed. When the type of the input form is selected from a plurality of registered forms, the task of selecting the form can be greatly reduced.

【0076】なお、前記実施形態では、データ入力のた
めに扱われる用紙として、帳票のみを例に取り、その帳
票フォーマットの登録処理及び入力帳票に応じた登録帳
票フォーマットの選択確定処理について説明したが、予
め定められたフォーマットを有するデータ入力のための
用紙媒体としては、前記帳票に限らず、例えば各種の申
請用紙や届け出用紙等、複数の記入項目が所定の位置に
配置されてなる用紙、つまり予め定められたフォーマッ
トを有する用紙であれば、如何なる種類の用紙でも前記
同様の特徴抽出によるフォーマット登録を行い、データ
入力すべき用紙の特徴に応じた登録フォーマットの選択
確定を行うことにより、データ入力すべき用紙フォーマ
ットの選択性を向上させ、効率のよいデータ入力を行う
ことができる。
In the above-described embodiment, only a form is taken as an example of a sheet handled for data input, and the process of registering the form and the process of selecting and confirming the registered form according to the input form have been described. The paper medium for data input having a predetermined format is not limited to the above-mentioned form, but is a paper on which a plurality of entry items are arranged at predetermined positions, such as various application papers and notification papers, that is, As long as the paper has a predetermined format, any type of paper is subjected to format registration by the same feature extraction as described above, and the registration format is selected and confirmed in accordance with the characteristics of the paper to be data-input, thereby enabling data input. The selectivity of the paper format to be improved can be improved, and efficient data input can be performed.

【0077】[0077]

【発明の効果】以上のように、本発明に係るデータ入力
装置によれば、画像入力手段により読み込まれた予め定
められたフォーマットを有する用紙の画像データから、
特徴抽出手段により当該用紙のフォーマットにおける罫
線枠や罫線色,強調文字列等の複数の特徴が抽出される
と、この特徴抽出された複数の特徴からなる用紙のフォ
ーマットは、フォーマット登録手段により複数種類の用
紙について登録される。そして、このフォーマット登録
された複数種類の用紙のフォーマットは、登録フォーマ
ット表示手段によりそれぞれその特徴を反映させた画像
として表示され、このフォーマット表示された複数種類
の用紙のフォーマットの中から、フォーマット確定手段
によりデータ入力の対象となる用紙フォーマットの種別
が確定されるので、例えば前記用紙が帳票である場合に
は、大量,多品種の帳票に対して、性能のよい登録帳票
の表示によるフォーマット選択が可能になり、効率よく
帳票データを入力処理することができる。
As described above, according to the data input device of the present invention, the image data of a sheet having a predetermined format read by the image input means can be obtained.
When a plurality of features such as a ruled line frame, a ruled line color, an emphasized character string, and the like in the format of the paper are extracted by the feature extracting means, a plurality of types of paper having the extracted features are provided by the format registration means. Is registered for. Then, the format of the plurality of types of paper registered in the format is displayed as an image reflecting the characteristics thereof by the registered format display means. Determines the type of paper format for which data is to be input. For example, if the paper is a form, it is possible to select a format by displaying a registered form with high performance for a large number of types of forms. Thus, the form data can be input efficiently.

【0078】すなわち、多数の類似帳票を一覧表示した
場合でも、容易に入力帳票の種別を判別し選択すること
が可能になる。
That is, even when a large number of similar forms are displayed in a list, the type of the input form can be easily determined and selected.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のデータ入力装置の実施形態に係る帳票
データを分類して保存するため帳票入力装置の構成を示
すブロック図。
FIG. 1 is a block diagram showing a configuration of a form input device for classifying and storing form data according to an embodiment of the data input device of the present invention.

【図2】前記帳票入力装置の帳票登録モードにおける処
理動作を示すフローチャート。
FIG. 2 is a flowchart showing a processing operation in a form registration mode of the form input device.

【図3】前記帳票入力装置の帳票フォーマット登録処理
における色解析処理に伴う色判定のためのH−S投票空
間の一例を示す図。
FIG. 3 is a diagram showing an example of an HS voting space for color determination accompanying color analysis processing in a form format registration processing of the form input device.

【図4】前記帳票入力装置の帳票フォーマット登録処理
に従ってフォーマット情報を登録すべきカラー帳票の具
体例を示す図。
FIG. 4 is a diagram showing a specific example of a color form in which format information is to be registered according to a form format registration process of the form input device.

【図5】前記帳票入力装置の帳票フォーマット登録処理
に従ってフォーマット情報記憶部に記憶された登録帳票
のフォーマット情報をイメージで示す図。
FIG. 5 is a view showing, as an image, format information of a registered form stored in a format information storage unit in accordance with a form format registration process of the form input device.

【図6】前記帳票入力装置のフォーマット確定モードに
おける処理動作を示すフローチャート。
FIG. 6 is a flowchart showing a processing operation in a format determination mode of the form input device.

【図7】前記帳票入力装置のフォーマット確定処理に従
って選定された罫線枠毎に代表色を異ならせた特徴を有
する登録帳票の表示例を示す図。
FIG. 7 is a view showing a display example of a registered form having a characteristic in which a representative color is different for each ruled line frame selected according to the format determination processing of the form input device.

【図8】前記帳票入力装置のフォーマット確定処理に従
って選定された罫線枠毎に異なる色の特徴を有する登録
帳票の表示例を示す図。
FIG. 8 is a diagram showing a display example of a registered form having different color characteristics for each ruled line frame selected according to the format determination processing of the form input device.

【図9】前記帳票入力装置のフォーマット確定処理に従
いプレ印字文字の特徴のみがマニュアル指定されて選定
された登録帳票の表示例を示す図。
FIG. 9 is a view showing a display example of a registered form in which only features of preprinted characters are manually designated and selected in accordance with a format finalizing process of the form input device.

【図10】登録されている帳票画像の従来の表示例を示
す図。
FIG. 10 is a diagram showing a conventional display example of a registered form image.

【符号の説明】[Explanation of symbols]

10 …制御部(CPU)、 11 …画像入力部、 12 …帳票フォーマット登録部、 13 …入力データメモリ、 14 …フォーマット情報記憶部、 15 …フォーマット確定部、 16 …ディスプレイ装置、 17 …指示デバイス、 18 …保存部、 19 …バス。 DESCRIPTION OF SYMBOLS 10 ... Control part (CPU), 11 ... Image input part, 12 ... Form format registration part, 13 ... Input data memory, 14 ... Format information storage part, 15 ... Format determination part, 16 ... Display device, 17 ... Instruction device, 18 ... storage unit, 19 ... bus.

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 予め定められたフォーマットを有する用
紙に対し記入された記述内容を、そのフォーマットに従
ってデータ化して入力するデータ入力装置であって、 前記予め定められたフォーマットを有する用紙の画像デ
ータを読み込む画像入力手段と、 この画像入力手段により読み込まれた用紙の画像データ
から当該用紙のフォーマットにおける複数の特徴を抽出
する特徴抽出手段と、 この特徴抽出手段により抽出された複数の特徴からなる
用紙のフォーマットを複数種類の用紙について登録する
フォーマット登録手段と、 このフォーマット登録手段に登録された複数種類の用紙
のフォーマットをそれぞれその特徴を反映させた画像と
して表示する登録フォーマット表示手段と、 この登録フォーマット表示手段により表示された複数種
類の用紙のフォーマットの中から、データ入力の対象と
なる用紙フォーマットの種別を確定するフォーマット確
定手段と、を具備したことを特徴とするデータ入力装
置。
1. A data input device for inputting a description content written on a sheet having a predetermined format in the form of data according to the format, wherein the image data of the sheet having the predetermined format is inputted. Image input means to be read, feature extracting means for extracting a plurality of features in the format of the paper from the image data of the paper read by the image input means, and a paper comprising a plurality of features extracted by the feature extracting means. Format registration means for registering a format for a plurality of types of paper; registered format display means for displaying formats of the plurality of types of paper registered in the format registration means as images reflecting the characteristics thereof; Multiple types displayed by means From the format of the paper, the data input device characterized by being provided with format determining means for determining the type of paper format to be data input, a.
【請求項2】 前記特徴抽出手段は、前記画像入力手段
により読み込まれた用紙の画像データから当該用紙のフ
ォーマットにおける罫線枠と該罫線枠の色を含んだ複数
の特徴を抽出する特徴抽出手段であり、 前記登録フォーマット表示手段は、前記フォーマット登
録手段に登録された複数種類の用紙のフォーマットをそ
れぞれその少なくとも罫線枠と該罫線枠の色の特徴を反
映させた画像として表示する登録フォーマット表示手段
である、ことを特徴とする請求項1に記載のデータ入力
装置。
2. The image processing apparatus according to claim 1, wherein the feature extracting unit extracts, from the image data of the sheet read by the image input unit, a plurality of features including a ruled line frame and a color of the ruled line frame in the format of the sheet. The registered format display means is a registered format display means for displaying formats of a plurality of types of paper registered in the format registration means as images reflecting at least a ruled line frame and a color characteristic of the ruled line frame. 2. The data input device according to claim 1, wherein:
【請求項3】 前記特徴抽出手段は、前記画像入力手段
により読み込まれた用紙の画像データから当該用紙のフ
ォーマットにおける強調文字列を含んだ複数の特徴を抽
出する特徴抽出手段であり、 前記登録フォーマット表示手段は、前記フォーマット登
録手段に登録された複数種類の用紙のフォーマットをそ
れぞれその少なくとも強調文字列の特徴を反映させた画
像として表示する登録フォーマット表示手段である、こ
とを特徴とする請求項1に記載のデータ入力装置。
3. The feature extraction means for extracting a plurality of features including an emphasized character string in a format of the sheet from the image data of the sheet read by the image input means, wherein the registration format 2. The registration format display unit, wherein the display unit is a registered format display unit that displays a plurality of types of paper formats registered in the format registration unit as images reflecting at least the characteristics of the emphasized character strings. 2. A data input device according to claim 1.
【請求項4】 前記フォーマット確定手段は、 データ入力の対象となる用紙の画像データを読み込む入
力用紙画像入力手段と、 この入力用紙画像入力手段により読み込まれたデータ入
力の対象となる用紙の画像データから当該入力用紙のフ
ォーマットにおける複数の特徴を抽出する入力用紙特徴
抽出手段とを備え、 前記登録フォーマット表示手段により表示された複数種
類の用紙のフォーマットの中から、前記入力用紙特徴抽
出手段により抽出されたデータ入力の対象となる用紙フ
ォーマットにおける特徴と同じ特徴を有する用紙フォー
マットの種別を確定するフォーマット確定手段である、
ことを特徴とする請求項1に記載のデータ入力装置。
4. An input paper image input means for reading image data of a paper as a data input target, and an image data of a paper as a data input target read by the input paper image input means. And input paper feature extraction means for extracting a plurality of features in the format of the input paper from the input paper feature extraction means, from among a plurality of types of paper formats displayed by the registered format display means. Format determination means for determining the type of the paper format having the same characteristics as the characteristics of the paper format to be input data.
The data input device according to claim 1, wherein:
【請求項5】 予め定められたフォーマットを有する用
紙に対し記入された記述内容を、そのフォーマットに従
ってデータ化して入力するためのデータ入力方法であっ
て、 前記予め定められたフォーマットを有する用紙の画像デ
ータを読み込む画像入力ステップと、 この画像入力ステップにより読み込まれた用紙の画像デ
ータから当該用紙のフォーマットにおける複数の特徴を
抽出する特徴抽出ステップと、 この特徴抽出ステップにより抽出された複数の特徴から
なる用紙のフォーマットを複数種類の用紙について登録
するフォーマット登録ステップと、 このフォーマット登録ステップにて登録された複数種類
の用紙のフォーマットをそれぞれその特徴を反映させた
画像として表示する登録フォーマット表示ステップと、 この登録フォーマット表示ステップにより表示された複
数種類の用紙のフォーマットの中から、データ入力の対
象となる用紙フォーマットの種別を確定するフォーマッ
ト確定ステップと、 からなることを特徴とするデータ入力方法。
5. A data input method for converting a description content written on a sheet having a predetermined format into data according to the format and inputting the data, wherein an image of the sheet having the predetermined format is provided. An image input step of reading data; a feature extraction step of extracting a plurality of features in the format of the sheet from the image data of the sheet read by the image input step; and a plurality of features extracted by the feature extraction step. A format registration step of registering the paper format for a plurality of types of paper; a registration format display step of displaying the formats of the plurality of types of paper registered in the format registration step as images reflecting their characteristics, respectively; Registration Former From the format of the plurality of types displayed in the sheet by preparative display step, the data input method of a format determination step of determining the type of paper format to be data input, in that it consists characterized.
JP27126399A 1999-09-24 1999-09-24 Device and method for inputting data Pending JP2001092912A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27126399A JP2001092912A (en) 1999-09-24 1999-09-24 Device and method for inputting data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27126399A JP2001092912A (en) 1999-09-24 1999-09-24 Device and method for inputting data

Publications (1)

Publication Number Publication Date
JP2001092912A true JP2001092912A (en) 2001-04-06

Family

ID=17497653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27126399A Pending JP2001092912A (en) 1999-09-24 1999-09-24 Device and method for inputting data

Country Status (1)

Country Link
JP (1) JP2001092912A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7324692B2 (en) 2004-03-10 2008-01-29 Fujitsu Limited Character recognition method
JP7487520B2 (en) 2020-03-27 2024-05-21 富士フイルムビジネスイノベーション株式会社 Information processing device, image reading device, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7324692B2 (en) 2004-03-10 2008-01-29 Fujitsu Limited Character recognition method
JP7487520B2 (en) 2020-03-27 2024-05-21 富士フイルムビジネスイノベーション株式会社 Information processing device, image reading device, and program

Similar Documents

Publication Publication Date Title
US5818978A (en) Image pre-processor for character image recognition system
US5867277A (en) Reduced resolution document storage and retrieval system
US5809167A (en) Page segmentation and character recognition system
JP3088019B2 (en) Medium processing apparatus and medium processing method
US5619594A (en) Image processing system with on-the-fly JPEG compression
US20050238257A1 (en) Form search apparatus and method
US5650799A (en) Programmable function keys for a networked imaging computer system
JP3294995B2 (en) Form reader
JPH07107694B2 (en) Document processor
WO2000052645A1 (en) Document image processor, method for extracting document title, and method for imparting document tag information
JP3485020B2 (en) Character recognition method and apparatus, and storage medium
JP3851742B2 (en) Form processing method and apparatus
JPH08235341A (en) Method and device for document filing
JP2003242441A (en) Document processing method, apparatus and program
Shweka et al. Automatic extraction of catalog data from digital images of historical manuscripts
JP2001092912A (en) Device and method for inputting data
JP3463008B2 (en) Medium processing method and medium processing apparatus
JPH06103411A (en) Document reader
JP3276555B2 (en) Format recognition device and character reader
JP2001034763A (en) Document image processor, method for extracting its document title and method for attaching document tag information
JP3090070B2 (en) Form identification method and device
JPH07152856A (en) Optical character reader
JPS61190676A (en) Document registering system
JP3276554B2 (en) Format recognition device and character reader
JP2643092B2 (en) Method and system for processing non-standard data located outside predefined fields on a document form

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060418

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060602

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060620

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060815

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060913

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20061208