JPH11175742A - Character reader, layout information setting means, and recording medium - Google Patents

Character reader, layout information setting means, and recording medium

Info

Publication number
JPH11175742A
JPH11175742A JP9346368A JP34636897A JPH11175742A JP H11175742 A JPH11175742 A JP H11175742A JP 9346368 A JP9346368 A JP 9346368A JP 34636897 A JP34636897 A JP 34636897A JP H11175742 A JPH11175742 A JP H11175742A
Authority
JP
Japan
Prior art keywords
layout
information
image
attribute
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9346368A
Other languages
Japanese (ja)
Inventor
Kazuaki Yokota
和章 横田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP9346368A priority Critical patent/JPH11175742A/en
Publication of JPH11175742A publication Critical patent/JPH11175742A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To easily specify layout information even if a form shifts when an image is read by a scanner. SOLUTION: In this character reader which extracts a character pattern from an image according to attribute information and performs a recognizing process, an attribute palette where attribute information set for an area to be processed is registered and a layout palette for registering layout information are displayed. In the processing object area in the image, the attribute information is set by being selected out of the attribute palette. The layout information where the area and attribute information are related can be registered in an arbitrary place in the layout palette as a component for layout specification. The layout information registered in the layout palette can be specified for the image to be processed at the time of the recognizing process by selecting it out of the layout palette.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、レイアウト、領域
属性等の情報をもとに、文書等の画像から文字パターン
を抽出して認識する文字読取装置、レイアウト情報設定
方法、及び記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character reading apparatus, a layout information setting method, and a recording medium that extract and recognize a character pattern from an image of a document or the like based on information such as a layout and an area attribute.

【0002】[0002]

【従来の技術】光学的文字読取装置は、スキャナによっ
て文書等の画像を読取り、この画像から文字のパターン
を抽出して文字認識処理を実行し、文字コード列に変換
する装置である。光学的文字読取装置は、文字認識処理
を実行する際に、画像(文書)中のどの領域に文字が記
述されているかを示すレイアウト(領域情報)、及び対
象とする領域中にどのような文字が記述されているかと
いう領域属性等の情報を必要とする。以下、これらの情
報をレイアウト情報と呼ぶ。
2. Description of the Related Art An optical character reading device is a device for reading an image of a document or the like by a scanner, extracting a character pattern from the image, executing a character recognition process, and converting the image into a character code string. When performing the character recognition process, the optical character reading device performs a layout (region information) indicating in which region in the image (document) the character is described, and a description of the character in the target region. Is required such as an area attribute indicating whether or not is described. Hereinafter, such information is referred to as layout information.

【0003】従来、光学的文字読取装置には、文書から
読み取った画像を解析することにより、レイアウト情報
を自動的に抽出する自動レイアウト解析機能を搭載する
ものもある。しかしながら、現在の自動レイアウト解析
の性能は、技術的に不十分な部分があり、人手によるレ
イアウトの指定または修正が必要となっている。従っ
て、効率的な光学的文字読取装置による文字認識処理を
実行するためには、レイアウト情報の指定または修正を
いかに容易にできるか、すなわちユーザインタフェース
がいかに使い易いかが重要となってくる。
Conventionally, some optical character reading apparatuses are equipped with an automatic layout analyzing function for automatically extracting layout information by analyzing an image read from a document. However, the performance of the current automatic layout analysis is technically inadequate, and it is necessary to manually specify or correct the layout. Therefore, in order to execute the character recognition processing by the efficient optical character reading device, it is important how to easily designate or correct the layout information, that is, how easy to use the user interface.

【0004】従来、光学的文字読取装置においてレイア
ウト情報を指定する場合、ユーザインタフェースは、文
書から読み取った画像を表示させ、その画像中に処理対
象とする領域を表す線など引いていくものが主流となっ
ている。また、画像中に線を引くなどして指定したレイ
アウトを、ファイルに保存しておき、同じレイアウトの
他の文書についても適用して文字認識処理を実行できる
光学的文字読取装置も考えられている。
Conventionally, when designating layout information in an optical character reading apparatus, the mainstream of a user interface is to display an image read from a document and draw a line representing an area to be processed in the image. It has become. Further, an optical character reading apparatus that can store a layout specified by drawing a line in an image in a file and execute character recognition processing by applying the layout to another document having the same layout has also been considered. .

【0005】[0005]

【発明が解決しようとする課題】このように従来の光学
的文字読取装置では、文書の画像に対して領域を表す線
を引くことでレイアウトを設定し、このレイアウトを保
存しておくことで、同じレイアウトの他の文書について
処理を行なう際に適用することにより、各文書について
逐次、レイアウト設定をしなくてすむ。
As described above, in the conventional optical character reading apparatus, a layout is set by drawing a line representing an area on a document image, and the layout is saved. By applying this method when processing is performed on another document having the same layout, it is not necessary to sequentially set the layout for each document.

【0006】しかしながら、従来の光学的文字読取装置
では、スキャナによって文書の画像を読み取る際に、例
えば文書(用紙)が傾くなどしてずれていた場合、保存
してあるレイアウト指定が正しく適用されなくなり、手
作業によって大幅なレイアウト指定の変更を行なう、あ
るいは別の文書のレイアウトを指定する場合と同様の作
業を行なう必要があった。
However, in the conventional optical character reading apparatus, when the image of the document is read by the scanner, for example, if the document (paper) is displaced due to inclination or the like, the saved layout designation is not correctly applied. It has been necessary to manually change the layout specification by hand or to perform the same operation as when specifying the layout of another document.

【0007】特に、光学的文字読取装置による処理対象
が帳票等であり、複数枚の種類の異なる帳票を所定の順
番で配置することで1セットとして扱われるような場合
には、それぞれの帳票が異なるずれが生ずることがあ
る。こうした場合、異なる種類のそれぞれの帳票に対し
て、レイアウト情報の設定を行なう必要があり、多大な
作業が必要となってしまう。
[0007] In particular, when the object to be processed by the optical character reading apparatus is a form or the like and a plurality of forms of different types are arranged in a predetermined order and are treated as one set, each form is treated as a set. Different shifts may occur. In such a case, it is necessary to set the layout information for each of the different types of forms, and a large amount of work is required.

【0008】本発明は前記のような事情を考慮してなさ
れたもので、スキャナにおける画像の読取り時に用紙が
ずれていても容易にレイアウト情報の指定が可能な文字
読取装置、レイアウト情報設定方法、及び記録媒体を提
供することを目的とする。
The present invention has been made in view of the above-mentioned circumstances, and a character reading apparatus, a layout information setting method, and a character reading apparatus capable of easily specifying layout information even when a sheet is misaligned when an image is read by a scanner. And a recording medium.

【0009】[0009]

【課題を解決するための手段】本発明は、画像中から属
性情報をもとにして文字パターンを抽出して認識処理を
実行する文字読取装置において、画像中の処理対象とす
る領域に対して設定される属性情報を登録するための属
性情報格納手段と、前記属性情報格納手段に登録された
属性情報を選択するための属性パレットを表示する属性
パレット表示手段と、前記属性パレット表示手段によっ
て表示された属性情報と共に、処理対象とする画像を表
示する画像表示手段と、前記画像表示手段によって表示
された画像中から処理対象とする少なくとも1つの領域
を設定し、この設定した領域のそれぞれに対して前記属
性パレット表示手段によって表示された中から指定され
た属性情報を関連付けるレイアウト設定手段と、前記レ
イアウト設定手段によって関連付けられた領域と属性情
報とによるレイアウト情報を登録するためのレイアウト
情報格納手段とを具備したことを特徴とする。
SUMMARY OF THE INVENTION The present invention relates to a character reading device for extracting a character pattern from an image based on attribute information and executing a recognition process. Attribute information storage means for registering attribute information to be set, attribute palette display means for displaying an attribute palette for selecting attribute information registered in the attribute information storage means, and display by the attribute palette display means Image display means for displaying an image to be processed together with the attribute information thus set, and at least one area to be processed from the image displayed by the image display means is set, and for each of the set areas Layout setting means for associating attribute information designated from among those displayed by the attribute palette display means, and the layout setting means Accordingly, it characterized associated area and the attribute information that includes a layout information storing means for registering the layout information by.

【0010】このような構成によれば、処理対象とする
画像と共に、属性情報が登録されている属性パレットが
表示され、この属性パレットから認識処理を行なうべき
領域に対して属性情報を指定することができる。従っ
て、複数の処理対象とする領域に対して共通する属性を
指定することで、認識処理の結果を属性に応じて分類し
て出力することもできる。
According to such a configuration, the attribute palette in which the attribute information is registered is displayed together with the image to be processed, and the attribute information is designated from the attribute palette to the area to be recognized. Can be. Therefore, by specifying a common attribute for a plurality of areas to be processed, the result of the recognition processing can be classified and output according to the attribute.

【0011】また、前記レイアウト情報格納手段によっ
て登録されたレイアウト情報を選択するためのレイアウ
トパレットを、前記画像表示手段によって表示された画
像、及び前記属性パレット表示手段によって表示された
属性パレットと共に表示するレイアウトパレット表示手
段と、前記レイアウトパレット表示手段によって表示さ
れたレイアウト情報から選択されたレイアウト情報を、
前記前記画像表示手段によって表示された画像の特定の
領域に対して設定するレイアウト指定手段とを具備し、
前記レイアウト指定手段によって設定されたレイアウト
情報に基づいて認識処理を実行することを特徴とする。
[0011] Also, a layout palette for selecting layout information registered by the layout information storage means is displayed together with the image displayed by the image display means and the attribute palette displayed by the attribute palette display means. Layout palette display means, and layout information selected from layout information displayed by the layout palette display means,
Layout designation means for setting a specific area of the image displayed by the image display means,
A recognition process is performed based on the layout information set by the layout designating means.

【0012】これにより、属性パレットを用いて処理対
象とする画像に対して設定されたレイアウト情報(処理
対象とする領域、領域に対して設定された属性情報)が
レイアウト指定のために利用する部品として登録され、
レイアウト指定に利用するためにレイアウトパレットと
して表示することができる。
Thus, the layout information set for the image to be processed using the attribute palette (the area to be processed, the attribute information set for the area) is used to specify the layout. Registered as
It can be displayed as a layout palette for use in layout specification.

【0013】また、前記レイアウト格納手段は、複数の
レイアウト情報を階層的に格納し、前記レイアウトパレ
ット表示手段は、前記レイアウト格納手段の階層構造に
応じてレイアウト情報を配置したレイアウトパレットを
表示することを特徴とする。
The layout storage means stores a plurality of layout information hierarchically, and the layout palette display means displays a layout palette in which layout information is arranged according to a hierarchical structure of the layout storage means. It is characterized by.

【0014】これにより、処理対象とする画像に対して
レイアウト指定を行なう際に、利用しようとするレイア
ウト情報を即時に選択することができる。また、前記レ
イアウト指定手段は、前記レイアウトパレット表示手段
によって表示されたレイアウト情報を表す項目が、ポイ
ンティングデバイスを用いた指示に応じて、前記画像表
示手段によって表示された画像中の特定の領域にドラッ
グ、及びドロップされることでレイアウト情報を設定す
ることを特徴とする。
Thus, when designating a layout for an image to be processed, layout information to be used can be immediately selected. Also, the layout designating means may drag an item representing layout information displayed by the layout palette display means to a specific area in the image displayed by the image display means in response to an instruction using a pointing device. , And the layout information is set by being dropped.

【0015】これにより、ポインティングデバイスのド
ラッグ及びドロップの操作のみで、レイアウトパレット
を利用したレイアウト指定ができるので、操作数が低減
され、操作性が向上する。
[0015] Thus, the layout can be designated using the layout palette only by dragging and dropping the pointing device, so that the number of operations is reduced and the operability is improved.

【0016】また、前記レイアウトパレット表示手段に
よって表示されたレイアウト情報を表す項目がドラッグ
された際に、この項目のレイアウト情報が示す領域のパ
ターンを表示することを特徴とする。
When an item representing layout information displayed by the layout palette display means is dragged, a pattern of an area indicated by the layout information of the item is displayed.

【0017】これにより、レイアウトパレットから選択
したレイアウト情報がどのようなレイアウトに対する情
報であるかを視覚的に確認することができ、処理対象と
する画像に対する適用を容易にすることができる。
This makes it possible to visually confirm the layout information selected from the layout pallet for what kind of layout, and to facilitate application to an image to be processed.

【0018】[0018]

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。図1は本実施形態に係わる
文字読取装置のシステム構成を示すブロック図である。
文字読取装置は、文書や帳票等の用紙を光学的に走査す
ることによって読み取った画像に対して、読取りの対象
する各領域について文字認識、イメージ切り出しの処理
を実行するものである。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a system configuration of the character reading device according to the present embodiment.
The character reading device performs character recognition and image cutout processing for each area to be read from an image read by optically scanning a sheet such as a document or a form.

【0019】本文字読取装置は、例えばCD−ROM、
DVD、磁気ディスク等の記録媒体に記録されたプログ
ラムを読み込み、このプログラムによって動作が制御さ
れるコンピュータによって実現される。
The character reading apparatus is, for example, a CD-ROM,
It is realized by a computer which reads a program recorded on a recording medium such as a DVD or a magnetic disk and whose operation is controlled by the program.

【0020】図1に示すように、本実施形態における文
字読取装置は、CPU10、メモリ12、表示装置1
4、キーボード16、マウス18、スキャナ装置20、
及び記憶装置22によって構成されている。
As shown in FIG. 1, the character reading device according to the present embodiment includes a CPU 10, a memory 12,
4, keyboard 16, mouse 18, scanner device 20,
And a storage device 22.

【0021】CPU10は、装置全体の制御を司るもの
で、メモリ12に格納されたプログラム及びデータに基
づいて実行することにより各種機能を実現する。本実施
形態では、メモリ12に格納されたレイアウト登録プロ
グラム12a1を実行することで文字認識処理に必要な
レイアウト情報(レイアウト(領域情報)、領域属性)
を登録するレイアウト登録処理が実行され、また文字読
取りプログラム12a2を実行することでレイアウト登
録処理によって設定されたレイアウト情報を用いた文字
認識を行なう文字読取り処理が実行される。
The CPU 10 controls the entire apparatus, and realizes various functions by executing based on programs and data stored in the memory 12. In the present embodiment, by executing the layout registration program 12a1 stored in the memory 12, the layout information (layout (area information) and area attributes) necessary for the character recognition processing is executed.
Is executed, and by executing the character reading program 12a2, a character reading process for performing character recognition using the layout information set by the layout registering process is executed.

【0022】メモリ12は、CPU10等による読み込
み専用もしくは読み書き可能なメモリ装置であり、プロ
グラムやデータが格納される。メモリ12に設けられる
プログラム領域には、レイアウト登録プログラム12a
1、文字読取りプログラム12a2等の各種プログラム
が格納される。また、メモリ12には、スキャナ装置2
0から読み取った画像、あるいは記憶装置22から読み
出された画像の画像データが、文字認識処理の対象とし
て格納される。
The memory 12 is a read-only or readable / writable memory device by the CPU 10 or the like, and stores programs and data. The program area provided in the memory 12 includes a layout registration program 12a
1. Various programs such as a character reading program 12a2 are stored. Also, the memory 12 stores the scanner device 2
Image data of an image read from 0 or an image read from the storage device 22 is stored as a target of the character recognition processing.

【0023】表示装置14は、液晶ディスプレイやCR
Tにおいて表示を行なうもので、レイアウト登録処理、
及び文字読取り処理におけるユーザインタフェースを提
供する。
The display device 14 includes a liquid crystal display and a CR.
Display at T, layout registration processing,
And a user interface in the character reading process.

【0024】キーボード16は、処理対象となるデータ
や装置に対する命令等を入力するためのものである。マ
ウス18は、処理対象となるデータや装置に対する命令
等を入力するためのポインティングデバイスであり、レ
イアウト登録処理、及び文字読取り処理のそれぞれにお
いて、表示装置14に表示されたユーザインタフェース
画面を利用した操作に用いられる。
The keyboard 16 is for inputting data to be processed, commands for the apparatus, and the like. The mouse 18 is a pointing device for inputting data to be processed and instructions to the device, and the like. In each of the layout registration process and the character reading process, an operation using the user interface screen displayed on the display device 14 is performed. Used for

【0025】スキャナ装置20は、文書や帳票等の用紙
を光学的に走査することにより、文字認識処理の対象と
する画像を読み取る。記憶装置22は、各種データやプ
ログラム等が記憶される装置である。各種データには、
文字認識処理の対象となる画像ファイル22a、レイア
ウト登録処理及び文字読取り処理において利用されるレ
イアウトパレット22b、属性パレット22cと(詳細
については後述する)、文字認識処理の処理結果である
出力ファイル22dが含まれる。なお、記憶装置18
は、ハードディスク、CD−ROM、DVD、フロッピ
ーディスク等の記録媒体に記録されたプログラムを読み
込んで、文字読取装置によって実行させることができ
る。
The scanner device 20 reads an image to be subjected to a character recognition process by optically scanning a sheet such as a document or a form. The storage device 22 is a device that stores various data, programs, and the like. Various data include
An image file 22a to be subjected to the character recognition processing, a layout palette 22b and an attribute palette 22c used in the layout registration processing and the character reading processing (details will be described later), and an output file 22d which is a processing result of the character recognition processing are included. included. The storage device 18
Can read a program recorded on a recording medium such as a hard disk, a CD-ROM, a DVD, or a floppy disk, and can be executed by a character reading device.

【0026】次に、本実施形態における動作について説
明する。本実施形態における文字読取装置では、文書や
帳票等の用紙に記入された文字の読取りを開始する前に
予めレイアウト情報を作成し、レイアウトパレットと呼
ぶデータベースに登録しておく、レイアウトパレットに
登録するレイアウト情報は、用紙全体についてのレイア
ウト情報だけでなく、用紙の一部分の領域についてのレ
イアウト情報を部品化して登録することができる。
Next, the operation of this embodiment will be described. In the character reading device according to the present embodiment, layout information is created in advance before reading characters written on a paper such as a document or a form, and registered in a database called a layout palette. As the layout information, not only the layout information of the entire sheet but also the layout information of a partial area of the sheet can be registered as a component.

【0027】部品化されたレイアウト情報は、文字読取
りを実行する際に、処理対象とする画像上に、各部品を
組合わせて手作業によって配置する。本実施形態では、
部品の配置時が、レイアウトパレットから部品をマウス
等のポインティングデバイスを用いてドラッグするだけ
で可能なユーザインタフェースを提供しており、ステッ
プ数の少ない簡単なオペレーションによって指定するこ
とができる。従って、スキャナ装置20による用紙の画
像の読取り時に位置ずれがある場合であっても、簡単に
レイアウト情報の指定が可能であり、また複雑な形式の
レイアウトを持つ帳票等の用紙等であっても、部品を組
合わせることにより同じ操作によって簡単にレイアウト
情報の設定ができる。
The componentized layout information is arranged manually on an image to be processed in combination with each component when reading characters. In this embodiment,
A user interface is provided that allows the user to place a component by simply dragging the component from the layout palette using a pointing device such as a mouse, and the component can be designated by a simple operation with a small number of steps. Therefore, even when there is a displacement when the image of the sheet is read by the scanner device 20, the layout information can be easily specified, and even if the sheet is a sheet having a complicated layout, such as a form. By combining parts, layout information can be easily set by the same operation.

【0028】まず、図2に示すフローチャートを参照し
ながら、レイアウト登録処理について説明する。レイア
ウト登録処理の実行が指示されると、CPU10は、メ
モリ12に格納されたレイアウト登録プログラム12a
1を起動して、レイアウト登録処理を開始する。
First, the layout registration processing will be described with reference to the flowchart shown in FIG. When the execution of the layout registration process is instructed, the CPU 10 executes the layout registration program 12 a stored in the memory 12.
1 to start the layout registration process.

【0029】レイアウト登録処理では、まずレイアウト
設定の処理対象とする用紙の画像が、スキャナ装置20
または記憶装置22に格納されている画像ファイル22
aから読み込まれ、メモリ12に格納される(ステップ
A1)。CPU10は、処理対象とする画像を、表示装
置14によってレイアウト設定画面中のレイアウト設定
用ウィンドウにおいて表示させると共に(ステップA
2)、レイアウトパレット用、属性パレット用のウィン
ドウを表示する(ステップA3)。
In the layout registration processing, first, an image of a sheet to be processed for layout setting is input to the scanner device 20.
Alternatively, the image file 22 stored in the storage device 22
a and is stored in the memory 12 (step A1). The CPU 10 causes the display device 14 to display the image to be processed in the layout setting window in the layout setting screen (step A).
2) Display windows for the layout palette and the attribute palette (step A3).

【0030】図3には、レイアウト設定画面の一例を示
している。図3に示すように、レイアウト設定用画面に
は、左側に処理対象となる画像が表示されるレイアウト
設定用ウィンドウ、右上にレイアウトパレット用ウィン
ドウ、右下に属性パレット用ウィンドウが設けられてい
る。
FIG. 3 shows an example of the layout setting screen. As shown in FIG. 3, the layout setting screen includes a layout setting window on the left side on which an image to be processed is displayed, a layout palette window on the upper right, and an attribute palette window on the lower right.

【0031】レイアウトパレットは、部品化されたレイ
アウト情報を階層的に分類して登録するためのデータベ
ースである。階層構造は、利用者が任意に設定すること
ができる。図3に示す例では、「プロフィール」「領収
書」「請求書」の項目(ホルダ)が作成され、それぞれ
にレイアウト情報が既に登録されていることを示してい
る。なお、「新規レイアウト」の項目は、レイアウト情
報の新規作成の実行が指示された場合に設けられる。
The layout pallet is a database for hierarchically classifying and registering componentized layout information. The hierarchical structure can be arbitrarily set by the user. In the example illustrated in FIG. 3, items (holders) of “profile”, “receipt”, and “invoice” are created, and the layout information is already registered for each item. The item “new layout” is provided when execution of new creation of layout information is instructed.

【0032】属性パレットは、文字認識処理やイメージ
切り取り処理を行なう際に参照される、処理対象とする
領域に対して設定される属性情報を階層的に登録するた
めのデータベースである。階層構造は、利用者が任意に
設定することができる。属性情報としては、処理対象が
「テキスト」(文字)と「イメージ」の何れであるか、
またテキストの場合には記入される文字列の種類が何で
あるかが指定される。文字列の種類としては、記述され
る内容による指定、例えば「住所」「氏名」「電話番
号」「年齢」「郵便番号」「会社名」などのように指定
することができる。この場合、例えば「住所」であれ
ば、対象とする文字種として、漢字、かな、数字が設定
され、「電話番号」であれば数字が設定される。なお、
記述される内容による指定ではなく、「漢字」「ひらが
な」「カタカナ」「数字」「英字」などの文字種を任意
に指定することができる。図3に示す例では、「住所」
「氏名」「電話番号」「年齢」の項目が設けられてお
り、この項目の指定によって各属性を選択することがで
きる。
The attribute palette is a database for hierarchically registering attribute information set for an area to be processed, which is referred to when performing character recognition processing or image cutting processing. The hierarchical structure can be arbitrarily set by the user. As the attribute information, whether the processing target is “text” (character) or “image”
In the case of text, the type of character string to be entered is specified. The type of the character string can be specified by the content to be described, for example, “address”, “name”, “telephone number”, “age”, “zip code”, “company name”, and the like. In this case, for example, in the case of "address", kanji, kana, and numbers are set as target character types, and in the case of "telephone number", numbers are set. In addition,
Instead of the specification based on the content to be described, it is possible to arbitrarily specify a character type such as “Kanji”, “Hiragana”, “Katakana”, “Numeric”, “English character”. In the example shown in FIG.
Items such as “name”, “telephone number”, and “age” are provided, and each attribute can be selected by designating this item.

【0033】まず、レイアウト情報を登録するために、
レイアウト登録処理のメニュー(図示せず)から新規登
録が選択されると、CPU10は、レイアウトパレット
において、図3に示すように、新規のレイアウト情報を
登録するための「新規レイアウト」の項目を設ける。
First, in order to register layout information,
When new registration is selected from a layout registration processing menu (not shown), the CPU 10 provides a “new layout” item for registering new layout information in the layout palette, as shown in FIG. .

【0034】ここで、「新規レイアウト」の項目がマウ
ス18の操作によってドラッグされ、レイアウトパレッ
ト中のレイアウト情報を登録しようとする任意の項目に
移動されドロップされると、CPU10は、移動先の項
目においてレイアウト情報を登録するための空の項目を
設ける(ステップA4)。ここで、キーボード16から
項目の名前を表す文字列が入力されると、CPU10
は、入力された文字列による項目を設定する。
Here, when the "new layout" item is dragged by operating the mouse 18, moved to an arbitrary item for which layout information is to be registered in the layout palette, and dropped, the CPU 10 sets the destination item. A blank item for registering layout information is provided in (Step A4). Here, when a character string representing the name of the item is input from the keyboard 16, the CPU 10
Sets the item by the input character string.

【0035】図4には、新規のレイアウト情報を登録す
るための項目が設定された一例を示している。図4に示
す例は、「新規レイアウト」の項目が「プロフィール」
の項目にドラッグアンドドロップされ、項目の名前とし
て「プロフィールB」が入力された場合を示している。
FIG. 4 shows an example in which items for registering new layout information are set. In the example shown in FIG. 4, the item of “new layout” is “profile”.
Is dragged and dropped to the item of "", and "profile B" is input as the name of the item.

【0036】次に、レイアウト設定用ウィンドウに表示
された画像に対するレイアウト設定が実行される(ステ
ップA5)。ここで、レイアウト設定の対象となる領域
には、図4に示すように、氏名、住所、電話、年齢のそ
れぞれについて記入される領域と、写真(イメージ)の
領域が含まれているものとする。
Next, layout setting for the image displayed in the layout setting window is executed (step A5). Here, as shown in FIG. 4, the areas to be set for the layout setting include an area in which each of a name, an address, a telephone, and an age is entered, and an area for a photograph (image). .

【0037】レイアウト設定では、まず、領域属性の指
定対象となる領域設定が行われる(ステップA51)。
例えば、レイアウト設定用ウィンドウ中の画面中におい
て、マウス18の操作によって領域(矩形領域とする)
の範囲が対角の2点の位置によって指定される。ここで
指定される領域は、文字認識処理の対象とする文字が記
入される領域、または保存するイメージが記録される領
域である。また、文字が記入される領域については、文
字認識結果を所定の項目毎に分類可能な範囲が指定され
る(例えば、氏名が記述される領域については、氏名の
文字列が全て含まれるような範囲)。
In the layout setting, first, an area to be designated as an area attribute is set (step A51).
For example, in the screen in the layout setting window, an area (a rectangular area) is operated by operating the mouse 18.
Is specified by the positions of two diagonal points. The area specified here is an area where characters to be subjected to the character recognition processing are written or an area where an image to be stored is recorded. In addition, for a region where characters are written, a range in which the character recognition result can be classified for each predetermined item is specified (for example, in a region where a name is described, the entire character string of the name is included). range).

【0038】CPU10は、領域の範囲が指定される
と、領域範囲を示す領域情報を格納すると共に、指定さ
れた領域の表示色を変えるなどして表示させる。なお、
マウス18の操作による領域範囲の指定に対して補正を
加えるようにしても良い。一般に、帳票等においては、
文字が記入される領域が矩形枠等によって区切られてい
る。そこで、処理対象とする画像から枠位置を予め検出
しておき、領域の範囲の指定が、矩形枠によって示され
る何れの領域に対する指定であるかを判別し、該当する
矩形枠によって示される領域を指定された領域として扱
う。
When the range of the area is specified, the CPU 10 stores the area information indicating the area range and displays the area by changing the display color of the specified area. In addition,
A correction may be made to the specification of the area range by operating the mouse 18. In general, in forms, etc.,
The area in which characters are to be written is separated by a rectangular frame or the like. Therefore, the frame position is detected in advance from the image to be processed, and it is determined which of the areas indicated by the rectangular frame is specified for the area range, and the area indicated by the corresponding rectangular frame is determined. Treat as a specified area.

【0039】これにより、領域の範囲の指定を厳密に行
なう必要がないために操作が容易となり、また処理対象
とする画像が傾くなどして本来の位置からずれている場
合であっても領域指定が簡単に行われる。
This makes it easy to operate because there is no need to strictly specify the range of the area. Even when the image to be processed is displaced from the original position due to inclination or the like, the area can be specified. Is easily done.

【0040】次に、領域設定に対して、属性パレットに
おいて用意された領域属性(属性情報)が指定される。
例えば、属性パレット用ウィンドウに表示された特定の
領域属性を示す項目が、マウス18の操作によってドラ
ッグされ、領域設定の位置でドロップされることにより
指定される(ステップA52)。これにより、CPU1
0は、属性パレットから選択された領域属性を、先に指
定された領域設定と関連づける。
Next, an area attribute (attribute information) prepared in the attribute palette is designated for the area setting.
For example, an item indicating a specific area attribute displayed in the attribute palette window is designated by being dragged by operating the mouse 18 and dropped at the area setting position (step A52). Thereby, the CPU 1
0 associates the area attribute selected from the attribute palette with the previously specified area setting.

【0041】図5には、1つの領域に対して領域属性が
設定された状態の一例を示している。図5に示す例は、
氏名の文字列が記入される領域について領域設定が行わ
れ、属性パレット用ウィンドウに表示された属性パレッ
トの「氏名」の項目が領域設定された位置までドラッ
グ、及びドロップされた状態を示している。領域属性が
指定されると、図5に示すように、レイアウト設定用ウ
ィンドウ中の領域設定された位置に、指定された領域属
性の項目名を表示している。
FIG. 5 shows an example of a state where an area attribute is set for one area. The example shown in FIG.
The area in which the character string of the name is entered is set, and the item of "Name" of the attribute palette displayed in the attribute palette window is dragged and dropped to the position where the area is set. . When the area attribute is specified, as shown in FIG. 5, the item name of the specified area attribute is displayed at the position where the area is set in the layout setting window.

【0042】以下、同様にして、他の処理対象とする領
域についても、それぞれ領域設定及び領域属性の指定が
実行される。図6には、氏名の文字列が記入される領域
の他に、住所、電話番号、年齢の文字列が記入される領
域、及び写真の領域に対しても、同様にしてそれぞれ領
域設定及び領域属性の指定がされた状態を示している。
In the same manner, the setting of the area and the designation of the area attribute are executed for the other areas to be processed. In FIG. 6, in addition to the area in which the character string of the name is entered, the area, the area in which the character string of the address, the telephone number, and the age are entered, and the area of the photograph are similarly set, respectively. This indicates that the attribute has been specified.

【0043】なお、「写真」の領域属性は、属性パレッ
トの「イメージ」の下位に設けられているものとする。
「写真」の領域属性を利用する際、属性パレット用ウィ
ンドウにおいて「イメージ」の項目が選択されること
で、下位に設けられた項目が表示される。
It is assumed that the area attribute of "photo" is provided below "image" in the attribute palette.
When the area attribute of “photo” is used, an item of “image” is selected in the attribute palette window, so that lower-level items are displayed.

【0044】また、複数の領域設定された範囲は、画像
中における絶対的な位置ではなく、各領域の相対的な位
置によって管理される。例えば、最初に領域設定された
位置を基準とする相対位置によって、その他の領域設定
された範囲が管理されるものとする。
The range in which a plurality of areas are set is managed by the relative position of each area, not the absolute position in the image. For example, it is assumed that the range in which other areas are set is managed by a relative position based on the position where the area is set first.

【0045】こうして、レイアウト設定用ウィンドウに
表示された画像に対して、処理対象とする領域に対し
て、領域範囲及び領域属性が設定され、レイアウト登録
処理のメニュー(図示せず)から保存が選択されると
(ステップA6)、CPU10は、画像上で設定された
内容をレイアウト情報として、レイアウトパレットの所
定の場所、この場合では「プロフィールB」に登録する
(ステップA7)。レイアウトパレットに登録されたレ
イアウト情報は、文字読取り処理時のレイアウト指定に
用いられる部品として利用できる。
In this way, for the image displayed in the layout setting window, the area range and area attribute are set for the area to be processed, and save is selected from the layout registration processing menu (not shown). When this is done (step A6), the CPU 10 registers the content set on the image as layout information in a predetermined location of the layout palette, in this case, "profile B" (step A7). The layout information registered in the layout pallet can be used as components used for layout specification at the time of character reading processing.

【0046】次に、図7に示すフローチャートを参照し
ながら、文字読取り処理について説明する。文字読取り
処理の実行が指示されると、CPU10は、メモリ12
に格納された文字読取りプログラム12a2を起動し
て、文字読取り処理を開始する。
Next, the character reading process will be described with reference to the flowchart shown in FIG. When the execution of the character reading process is instructed, the CPU 10
Is started and the character reading process is started.

【0047】文字読取り処理を実行する際には、レイア
ウト登録処理においてレイアウト情報が登録されたレイ
アウトパレットを利用して、手作業によって処理対象と
する画像に対して領域を指定する。
When executing the character reading process, an area for an image to be processed is manually designated by using a layout palette in which layout information is registered in the layout registration process.

【0048】文字読取り処理では、まず処理対象とする
用紙の画像が、スキャナ装置20または記憶装置22に
格納されている画像ファイル22aから読み込まれ、メ
モリ12に格納される(ステップB1)。CPU10
は、処理対象とする画像を、表示装置14によって文字
読取り画面中の文字認識用ウィンドウに画面に表示させ
ると共に(ステップB2)、レイアウトパレット用ウィ
ンドウを表示する(ステップB3)。
In the character reading process, first, an image of a sheet to be processed is read from the image file 22a stored in the scanner device 20 or the storage device 22, and stored in the memory 12 (step B1). CPU10
Displays the image to be processed on the character recognition window in the character reading screen on the screen by the display device 14 (step B2) and displays the layout palette window (step B3).

【0049】文字読取り画面には、左側に処理対象とな
る画像が表示される文字認識ウィンドウ、右上にレイア
ウトパレット用ウィンドウが設けられている。レイアウ
トパレット用ウィンドウに表示されるレイアウトパレッ
トには、レイアウト登録処理によってレイアウト情報が
階層的に分類して登録されている。
On the character reading screen, a character recognition window for displaying an image to be processed is provided on the left side, and a layout palette window is provided on the upper right side. In the layout palette displayed in the layout palette window, layout information is hierarchically classified and registered by layout registration processing.

【0050】ここで、マウス18が操作されてレイアウ
トパレット中の項目がドラッグされると、CPU10
は、ドラッグされた項目に登録されているレイアウト情
報の領域情報をもとに、レイアウトの領域を示す格子パ
ターンをカーソル位置に表示する(ステップB5)。
Here, when the mouse 18 is operated and an item in the layout palette is dragged, the CPU 10
Displays a grid pattern indicating the layout area at the cursor position based on the area information of the layout information registered in the dragged item (step B5).

【0051】すなわち、CPU10は、レイアウトパレ
ット中の項目がドラッグされると、ドラッグされた項目
に対応するレイアウト情報を読出し、複数の領域の相対
的な位置によって管理されている領域情報をもとにして
格子パターンを生成し、カーソル位置(例えばカーソル
位置が全領域の右下頂点とする)に応じて表示させる。
That is, when an item in the layout palette is dragged, the CPU 10 reads out the layout information corresponding to the dragged item, and based on the area information managed by the relative positions of the plurality of areas. To generate a grid pattern and display it according to the cursor position (for example, the cursor position is the lower right vertex of the entire area).

【0052】図8には、レイアウトパレットの項目がド
ラッグされて、レイアウトを示す格子パターンが表示さ
れた状態の一例を示している。図8は、「プロフィール
B」の項目に登録されたレイアウト情報(領域情報)を
もとにして、格子パターンが表示された状態を示してい
る。
FIG. 8 shows an example of a state in which a grid pattern indicating a layout is displayed by dragging an item on the layout palette. FIG. 8 shows a state in which a grid pattern is displayed based on the layout information (area information) registered in the item of “Profile B”.

【0053】格子パターンは、複数の領域の組み合わせ
(レイアウト)を表すと共に、各領域に付加されている
領域属性を表す項目名(「写真」「氏名」等)が表示さ
れている。
The grid pattern represents a combination (layout) of a plurality of areas, and item names (such as “photograph” and “name”) indicating the area attributes added to each area are displayed.

【0054】なお、レイアウトパレットに多数のレイア
ウト情報が登録されている場合、レイアウト登録処理時
に入力した項目名をもとにして、必要なレイアウト情報
が何れに登録されているか判別することができるが、項
目名を忘れたとしても各項目をわずかにドラッグするだ
けで、それぞれに登録されたレイアウト情報に対応する
格子パターンが表示されるので、任意に項目をドラッグ
しながら必要なレイアウト情報を簡単に探し出すことが
できる。
When a lot of layout information is registered in the layout palette, it is possible to determine which necessary layout information is registered on the basis of the item name input during the layout registration process. Even if you forget the item name, just drag each item slightly and the grid pattern corresponding to the registered layout information will be displayed. I can find it.

【0055】マウス18が操作されてカーソルが表示画
面上で移動されると、CPU10は、移動されるカーソ
ルに追随するように格子パターンを表示させる。そし
て、任意の位置でドロップされると(ステップB6)、
CPU10は、ドロップされた画像に格子パターンが示
す領域情報に該当するレイアウトの領域が存在するかを
判別する(ステップB7)。
When the mouse 18 is operated and the cursor is moved on the display screen, the CPU 10 displays a lattice pattern so as to follow the moved cursor. Then, when dropped at an arbitrary position (step B6),
The CPU 10 determines whether or not the dropped image has a layout area corresponding to the area information indicated by the lattice pattern (step B7).

【0056】例えば、一般に、帳票等においては、文字
が記入される領域が矩形枠等によって区切られているの
で、処理対象とする画像から枠位置を予め検出してお
き、この枠位置と格子パターンとが一致するかを判別す
る。なお、ここでの一致の判別は、厳密に行なう必要が
なく、許容範囲をもたせておくものとする。
For example, generally, in a form or the like, an area in which characters are to be written is separated by a rectangular frame or the like. Therefore, a frame position is detected in advance from an image to be processed, and the frame position and the grid pattern are detected. Is determined to match. It should be noted that it is not necessary to strictly determine the coincidence here, and an allowance is provided.

【0057】この判別の結果、格子パターンが示す領域
情報に該当するレイアウトの領域が存在しないと判別さ
れた場合、CPU10は、レイアウトパレットから指定
されたレイアウト情報をキャンセルする。
When it is determined that there is no layout area corresponding to the area information indicated by the lattice pattern, the CPU 10 cancels the layout information specified from the layout palette.

【0058】一方、図8に示すように、該当するレイア
ウトの領域が存在すると判別された場合、CPU10
は、文字認識用ウィンドウに表示された画像中の該当す
る領域に対して、レイアウトパレットから指定されたレ
イアウト情報の領域属性を設定する(ステップB9)。
On the other hand, as shown in FIG. 8, when it is determined that the corresponding layout area exists, the CPU 10
Sets the area attribute of the layout information specified from the layout palette for the corresponding area in the image displayed in the character recognition window (step B9).

【0059】図8に示す例では、文字認識の対象とする
画像には、レイアウトパレットの「プロフィールB」に
登録されたレイアウト情報が適用される特定の領域が3
つ含まれている。従って、この画像に対しては、レイア
ウトパレットの「プロフィールB」の項目を、それぞれ
の領域に対してドラッグ及びドロップ、すなわち3回、
ドラッグ及びドロップするだけで全ての領域に対するレ
イアウト指定が完了する(ステップB10)。
In the example shown in FIG. 8, the image to be subjected to character recognition has three specific areas to which the layout information registered in “profile B” of the layout palette is applied.
One is included. Therefore, for this image, drag and drop the item of “Profile B” of the layout palette to each area, that is, three times,
By simply dragging and dropping, layout designation for all areas is completed (step B10).

【0060】レイアウト指定が完了した後、文字認識処
理の実行が指示されると、CPU10は、領域属性が設
定された各領域毎に文字認識処理を実行する(ステップ
B11)。
When the execution of the character recognition processing is instructed after the layout designation is completed, the CPU 10 executes the character recognition processing for each area for which the area attribute is set (step B11).

【0061】例えば、「住所」の領域属性が設定された
領域については、この領域内に含まれる文字パターンを
切り出し、各文字パターン毎に、「住所」の指定によっ
て特定される文字種(漢字、かな、数字)を対象とした
文字認識用の辞書を参照して文字認識処理を実行する。
同様にして、各領域について、それぞれの領域属性に応
じた文字認識処理を実行する。
For example, for an area where the area attribute of “address” is set, a character pattern included in this area is cut out, and for each character pattern, the character type (kanji, kana, , Numbers) with reference to a character recognition dictionary.
Similarly, a character recognition process corresponding to each area attribute is executed for each area.

【0062】また、「イメージ」の領域属性が設定され
た写真の領域については、例えば画像中から切り出し、
所定の圧縮処理(例えばJPEG等)を施して、別の画
像ファイルを生成して保存する。
Further, the region of the photograph in which the region attribute of “image” is set is cut out, for example, from the image.
A predetermined compression process (for example, JPEG) is performed to generate and save another image file.

【0063】図8に示す画像の例では、「プロフィール
B」に登録されたレイアウト情報が設定された特定の領
域が3つあるので、この3つの領域のそれぞれについて
同様にして文字認識処理、画像の切り出しが実行され
る。
In the example of the image shown in FIG. 8, since there are three specific areas in which the layout information registered in "profile B" is set, the character recognition processing and the image processing are similarly performed for each of these three areas. Is executed.

【0064】CPU10は、各特定の領域の文字認識処
理結果を項目別に分類して出力ファイルを生成する(ス
テップB12)。この場合、属性パレットによって、各
領域に対して、氏名、住所、電話番号、年齢、及び写真
が設定されているので、これらの項目によって文字認識
結果を格納する。なお、写真の項目については、別に生
成された画像ファイルのファイル名を登録する。
The CPU 10 generates an output file by classifying the result of the character recognition processing of each specific area by item (step B12). In this case, since a name, an address, a telephone number, an age, and a photograph are set for each area by the attribute palette, the character recognition result is stored by these items. For the item of the photograph, the file name of an image file generated separately is registered.

【0065】図9には、認識結果である出力ファイルの
内容が表示された状態の一例を示している。図9に示す
ように、項目毎に分類されて文字認識結果が表示され、
写真の項目については画像ファイルのファイル名が表示
されている。
FIG. 9 shows an example of a state in which the contents of the output file as the recognition result are displayed. As shown in FIG. 9, the result of character recognition is displayed for each item.
For the photo item, the file name of the image file is displayed.

【0066】このようにして、図8に示すように、レイ
アウトパレットに登録されたレイアウト情報がレイアウ
ト指定のための部品として提供されるために、スキャナ
装置20での画像の読み込み時にずれなどが生じてしま
っても、特定の領域毎に部品としてのレイアウト情報を
適用することができる。
In this way, as shown in FIG. 8, since the layout information registered in the layout palette is provided as a component for specifying the layout, a shift or the like occurs when the image is read by the scanner device 20. In this case, the layout information as a component can be applied to each specific area.

【0067】特に、図8に示すように、複数枚の帳票を
所定の順番で配置することで1セットとして扱われるよ
うな場合に、各帳票がずれていたとしても、同じ操作に
よってレイアウト指定を行なうことができる。
In particular, as shown in FIG. 8, when a plurality of forms are arranged in a predetermined order and handled as one set, even if each form is shifted, the layout is designated by the same operation. Can do it.

【0068】また、図10に示すように、種類の異なる
帳票(2番目の領域)が混在していたとしても、レイア
ウト登録処理によってレイアウトパレットに登録してお
けば、文字読取り処理の際に、レイアウトパレットの所
定の項目、例えば「プロフィールA」の項目を、ドラッ
グ及びドロップという同じ操作によってレイアウト指定
することができる。
As shown in FIG. 10, even if forms (second areas) of different types are mixed, if the forms are registered in the layout palette by the layout registration processing, the character reading processing can be performed. A predetermined item of the layout palette, for example, an item of “profile A” can be designated by the same operation of drag and drop.

【0069】また、レイアウトパレットに登録されたレ
イアウト情報が、属性パレットの同じ領域属性が設定さ
れていれば、図10に示すように、種類の異なる帳票が
混在していても、特別な操作を行なうことなく、図9に
示すように、共通した項目毎に文字認識処理の結果を分
類して出力することができる。
If the layout information registered in the layout pallet has the same area attribute set in the attribute pallet, as shown in FIG. 10, even if forms of different types are mixed, a special operation is performed. Without performing, as shown in FIG. 9, the result of the character recognition process can be classified and output for each common item.

【0070】なお、前述した説明では、文書や帳票等に
ついて文字認識処理を実行するために必要なレイアウト
情報を指定する場合について説明しているが、文字認識
処理以外の分野においても、レイアウト情報の設定が必
要な状況があれば適用することができる。
In the above description, a case is described in which layout information necessary for performing character recognition processing on a document, a form, or the like is described. If there is a situation that requires setting, it can be applied.

【0071】また、上述した実施形態において記載した
手法は、コンピュータに実行させることのできるプログ
ラムとして、例えば磁気ディスク(フロッピーディス
ク、ハードディスク等)、光ディスク(CD−ROM、
DVD等)、半導体メモリなどの記録媒体に書き込んで
各種装置に提供することができる。また、通信媒体によ
り伝送して各種装置に提供することも可能である。本装
置を実現するコンピュータは、記録媒体に記録されたプ
ログラムを読み込み、または通信媒体を介してプログラ
ムを受信し、このプログラムによって動作が制御される
ことにより、上述した処理を実行する。
Further, the method described in the above-described embodiment can be executed by a computer as a program such as a magnetic disk (floppy disk, hard disk, etc.), an optical disk (CD-ROM,
DVD and the like, and can be written to a recording medium such as a semiconductor memory and provided to various devices. Further, it is also possible to transmit the data via a communication medium and provide it to various devices. A computer that implements the present apparatus reads the program recorded on a recording medium or receives the program via a communication medium, and executes the above-described processing by controlling the operation of the program.

【0072】[0072]

【発明の効果】以上詳述したように本発明によれば、処
理対象とする画像と共に、属性情報が登録されている属
性パレットが表示され、この属性パレットから認識処理
を行なうべき領域に対して属性情報を指定することがで
きる。また、属性パレットを用いて処理対象とする画像
に対して設定されたレイアウト情報(処理対象とする領
域、領域に対して設定された属性情報)がレイアウト指
定のために利用する部品としてレイアウトパレットに登
録することができ、このレイアウトパレットを表示させ
て、その中からレイアウト情報を選択してレイアウト指
定に利用することができる。従って、スキャナにおける
画像の読取り時に用紙がずれていても容易にレイアウト
情報の指定が可能となる。
As described above in detail, according to the present invention, an attribute palette in which attribute information is registered is displayed together with an image to be processed, and an area to be subjected to a recognition process from this attribute palette is displayed. Attribute information can be specified. Also, the layout information set for the image to be processed using the attribute palette (the area to be processed, the attribute information set for the area) is stored in the layout palette as a component used for layout specification. This layout can be registered, the layout palette is displayed, and layout information can be selected from the layout palette and used for layout specification. Therefore, it is possible to easily specify the layout information even if the sheet is misaligned when the image is read by the scanner.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施形態に係わる文字読取装置のシス
テム構成を示すブロック図。
FIG. 1 is a block diagram showing a system configuration of a character reading device according to an embodiment of the present invention.

【図2】本実施形態におけるレイアウト登録処理につい
て説明するためのフローチャート。
FIG. 2 is a flowchart illustrating a layout registration process according to the embodiment;

【図3】レイアウト設定画面の一例を示す図。FIG. 3 is a view showing an example of a layout setting screen.

【図4】レイアウトパレットに新規のレイアウト情報を
登録するための項目が設定された一例を示す図。
FIG. 4 is a diagram showing an example in which items for registering new layout information in a layout palette are set.

【図5】レイアウト登録処理により1つの領域に対して
領域属性が設定された状態の一例を示す図。
FIG. 5 is a diagram showing an example of a state in which an area attribute is set for one area by a layout registration process.

【図6】レイアウト登録処理により複数の領域に対して
領域属性が設定された状態の一例を示す図。
FIG. 6 is a diagram showing an example of a state in which region attributes have been set for a plurality of regions by layout registration processing.

【図7】本実施形態における文字読取り処理について説
明するためのフローチャート。
FIG. 7 is a flowchart illustrating a character reading process according to the embodiment.

【図8】文字読取り処理の際にレイアウト指定を行なう
ための格子パターンが表示された状態の一例を示す図。
FIG. 8 is a diagram showing an example of a state in which a grid pattern for designating a layout in a character reading process is displayed.

【図9】認識結果である出力ファイルの内容が表示され
た状態の一例を示す図。
FIG. 9 is a diagram showing an example of a state in which the contents of an output file as a recognition result are displayed.

【図10】種類の異なる帳票が混在している画像に対す
る文字読取り処理を説明するための図。
FIG. 10 is a view for explaining character reading processing for an image in which forms of different types are mixed.

【符号の説明】[Explanation of symbols]

10…CPU 12…メモリ 12a1…レイアウト登録プログラム 12a2…文字読取りプログラム 14…表示装置 16…キーボード 18…マウス 20…スキャナ装置 22…記憶装置 22a…画像ファイル 22b…レイアウトパレット 22c…属性パレット DESCRIPTION OF SYMBOLS 10 ... CPU 12 ... Memory 12a1 ... Layout registration program 12a2 ... Character reading program 14 ... Display device 16 ... Keyboard 18 ... Mouse 20 ... Scanner device 22 ... Storage device 22a ... Image file 22b ... Layout palette 22c ... Attribute palette

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 画像中から属性情報をもとにして文字パ
ターンを抽出して認識処理を実行する文字読取装置にお
いて、 画像中の処理対象とする領域に対して設定される属性情
報を登録するための属性情報格納手段と、 前記属性情報格納手段に登録された属性情報を選択する
ための属性パレットを表示する属性パレット表示手段
と、 前記属性パレット表示手段によって表示された属性情報
と共に、処理対象とする画像を表示する画像表示手段
と、 前記画像表示手段によって表示された画像中から処理対
象とする少なくとも1つの領域を設定し、この設定した
領域のそれぞれに対して前記属性パレット表示手段によ
って表示された中から指定された属性情報を関連付ける
レイアウト設定手段と、 前記レイアウト設定手段によって関連付けられた領域と
属性情報とによるレイアウト情報を登録するためのレイ
アウト情報格納手段とを具備したことを特徴とする文書
作成装置。
1. A character reading device that extracts a character pattern from an image based on attribute information and executes a recognition process registers attribute information set for a region to be processed in the image. Attribute information storage means for displaying, an attribute palette display means for displaying an attribute palette for selecting attribute information registered in the attribute information storage means, and attribute information displayed by the attribute palette display means. Image display means for displaying an image to be set; and at least one area to be processed is set from the image displayed by the image display means, and each of the set areas is displayed by the attribute palette display means. Layout setting means for associating the specified attribute information from the selected ones, and Document creating apparatus characterized by comprising a layout information storing means for registering the layout information by the band and the attribute information.
【請求項2】 前記レイアウト情報格納手段によって登
録されたレイアウト情報を選択するためのレイアウトパ
レットを、前記画像表示手段によって表示された画像、
及び前記属性パレット表示手段によって表示された属性
パレットと共に表示するレイアウトパレット表示手段
と、 前記レイアウトパレット表示手段によって表示されたレ
イアウト情報から選択されたレイアウト情報を、前記前
記画像表示手段によって表示された画像の特定の領域に
対して設定するレイアウト指定手段とを具備し、 前記レイアウト指定手段によって設定されたレイアウト
情報に基づいて認識処理を実行することを特徴とする請
求項1記載の文字読取装置。
2. A layout palette for selecting layout information registered by the layout information storage means, the image being displayed by the image display means,
Layout pallet display means for displaying together with the attribute pallet displayed by the attribute pallet display means; and layout information selected from the layout information displayed by the layout pallet display means, and an image displayed by the image display means. 2. The character reading apparatus according to claim 1, further comprising: a layout designating unit configured to set a specific region, wherein the recognition processing is performed based on the layout information set by the layout designating unit.
【請求項3】 前記レイアウト格納手段は、複数のレイ
アウト情報を階層的に格納し、 前記レイアウトパレット表示手段は、前記レイアウト格
納手段の階層構造に応じてレイアウト情報を配置したレ
イアウトパレットを表示することを特徴とする請求項2
記載の文字読取装置。
3. The layout storage means stores a plurality of layout information hierarchically, and the layout palette display means displays a layout palette in which layout information is arranged according to a hierarchical structure of the layout storage means. 3. The method according to claim 2, wherein
The character reading device according to the above.
【請求項4】 前記レイアウト指定手段は、前記レイア
ウトパレット表示手段によって表示されたレイアウト情
報を表す項目が、ポインティングデバイスを用いた指示
に応じて、前記画像表示手段によって表示された画像中
の特定の領域にドラッグ、及びドロップされることでレ
イアウト情報を設定することを特徴とする請求項2記載
の文字読取装置。
4. The layout designating means, wherein the item representing the layout information displayed by the layout palette display means is a specific item in the image displayed by the image display means in response to an instruction using a pointing device. 3. The character reading device according to claim 2, wherein the layout information is set by being dragged and dropped on the area.
【請求項5】 前記レイアウトパレット表示手段によっ
て表示されたレイアウト情報を表す項目がドラッグされ
た際に、この項目のレイアウト情報が示す領域のパター
ンを表示することを特徴とする請求項4記載の文字読取
装置。
5. The character according to claim 4, wherein when an item representing layout information displayed by said layout palette display means is dragged, a pattern of an area indicated by the layout information of the item is displayed. Reader.
【請求項6】 画像中から属性情報をもとにして文字パ
ターンを抽出して認識処理を実行する文字読取装置のレ
イアウト情報設定方法であって、 画像中の処理対象とする領域に対して設定される属性情
報を登録し、 この登録された属性情報を選択するための属性パレット
を表示し、 この表示された属性情報と共に、処理対象とする画像を
表示し、 この表示された画像中から処理対象とする少なくとも1
つの領域を設定し、この設定した領域のそれぞれに対し
て、表示された中から指定された属性情報を関連付け、 この関連付けられた領域と属性情報とによるレイアウト
情報を登録し、 この登録されたレイアウト情報を選択するためのレイア
ウトパレットを、処理対象とする画像、及び属性パレッ
トと共に表示し、 この表示されたレイアウト情報から選択されたレイアウ
ト情報を、表示された画像の特定の領域に対して設定
し、 この設定されたレイアウト情報に基づいて認識処理を実
行することを特徴とするレイアウト情報設定方法。
6. A layout information setting method for a character reader that extracts a character pattern from an image based on attribute information and executes a recognition process, wherein the layout information is set for an area to be processed in the image. Register the attribute information to be displayed, display an attribute palette for selecting the registered attribute information, display an image to be processed together with the displayed attribute information, and perform processing from the displayed image. At least one subject
One area is set, attribute information specified from the displayed area is associated with each of the set areas, layout information based on the associated area and the attribute information is registered, and the registered layout is registered. A layout palette for selecting information is displayed together with an image to be processed and an attribute palette, and layout information selected from the displayed layout information is set for a specific area of the displayed image. A layout information setting method for performing a recognition process based on the set layout information.
【請求項7】 画像中から属性情報をもとにして文字パ
ターンを抽出して認識処理を実行するためのプログラム
が記録された記録媒体であって、 画像中の処理対象とする領域に対して設定される属性情
報を登録し、 この登録された属性情報を選択するための属性パレット
を表示し、 この表示された属性情報と共に、処理対象とする画像を
表示し、 この表示された画像中から処理対象とする少なくとも1
つの領域を設定し、この設定した領域のそれぞれに対し
て、表示された中から指定された属性情報を関連付け、 この関連付けられた領域と属性情報とによるレイアウト
情報を登録し、 この登録されたレイアウト情報を選択するためのレイア
ウトパレットを、処理対象とする画像、及び属性パレッ
トと共に表示し、 この表示されたレイアウト情報から選択されたレイアウ
ト情報を、表示された画像の特定の領域に対して設定
し、 この設定されたレイアウト情報に基づいて認識処理を実
行するようにコンピュータを制御するためのプログラム
が記録されたコンピュータ読取り可能な記録媒体。
7. A recording medium on which a program for extracting a character pattern from an image based on attribute information and executing a recognition process is recorded. Registers the attribute information to be set, displays an attribute palette for selecting the registered attribute information, displays an image to be processed together with the displayed attribute information, and displays an image to be processed from among the displayed images. At least one to be processed
One area is set, attribute information specified from the displayed area is associated with each of the set areas, layout information based on the associated area and the attribute information is registered, and the registered layout is registered. A layout palette for selecting information is displayed together with an image to be processed and an attribute palette, and layout information selected from the displayed layout information is set for a specific area of the displayed image. A computer-readable recording medium on which a program for controlling a computer to execute a recognition process based on the set layout information is recorded.
JP9346368A 1997-12-16 1997-12-16 Character reader, layout information setting means, and recording medium Pending JPH11175742A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9346368A JPH11175742A (en) 1997-12-16 1997-12-16 Character reader, layout information setting means, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9346368A JPH11175742A (en) 1997-12-16 1997-12-16 Character reader, layout information setting means, and recording medium

Publications (1)

Publication Number Publication Date
JPH11175742A true JPH11175742A (en) 1999-07-02

Family

ID=18382949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9346368A Pending JPH11175742A (en) 1997-12-16 1997-12-16 Character reader, layout information setting means, and recording medium

Country Status (1)

Country Link
JP (1) JPH11175742A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280285A (en) * 2006-04-11 2007-10-25 Denso Wave Inc Image scanner, information medium and image information processing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280285A (en) * 2006-04-11 2007-10-25 Denso Wave Inc Image scanner, information medium and image information processing system

Similar Documents

Publication Publication Date Title
JP4970714B2 (en) Extract metadata from a specified document area
CN108762743B (en) Data table operation code generation method and device
JP2973913B2 (en) Input sheet system
JPH0689324A (en) Tool kit and method for establishing form
JPH0388087A (en) Document reader
JP3189182B2 (en) Information processing device
JPH11175742A (en) Character reader, layout information setting means, and recording medium
US20030154462A1 (en) Software maintenance material generation apparatus and generation program therefor
JPH11191159A (en) Image output device and program recording medium therefor
JP2020190843A (en) Document conversion device
JP2002298081A (en) Optical character recognition device and field definition method of document reading definition body
JP3733725B2 (en) Form overlay apparatus, form overlay method, and computer-readable recording medium recording overlay printing control program
JP3157917B2 (en) Data processing method and data processing device
JP2001297080A (en) Read assisting device
JP2002259173A (en) File management program, computer readable recording medium in which file management program is recorded, file managing device and file managing method
JP7446558B2 (en) Document editing device, editing method for document editing device, document editing program for document editing device
JPH0728801A (en) Image data processing method and device therefor
JP7404943B2 (en) Information processing device and information processing program
JPH0635987A (en) Device and mehtod for preparing circuit diagram
JPH0660136A (en) Drawing edit device
JP4755622B2 (en) Multilingual display device and multilingual display method
US20090241063A1 (en) Information processing apparatus, information processing method, and computer readable medium for designing a gui
JP3815044B2 (en) Input data processing apparatus and program recording medium thereof
JP4452867B2 (en) Form creation method and apparatus, and recording medium
CN114699769A (en) Game interface generation method, device, equipment and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040924

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070320

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070821