JPH11224308A - Device and method for recognizing character - Google Patents

Device and method for recognizing character

Info

Publication number
JPH11224308A
JPH11224308A JP10024884A JP2488498A JPH11224308A JP H11224308 A JPH11224308 A JP H11224308A JP 10024884 A JP10024884 A JP 10024884A JP 2488498 A JP2488498 A JP 2488498A JP H11224308 A JPH11224308 A JP H11224308A
Authority
JP
Japan
Prior art keywords
character recognition
area
color information
data attribute
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10024884A
Other languages
Japanese (ja)
Inventor
Kazuyuki Saito
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP10024884A priority Critical patent/JPH11224308A/en
Publication of JPH11224308A publication Critical patent/JPH11224308A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To flexibly deal with the difference of a document format when performing character recognition concerning a prescribed item in a document through a character recognizing device. SOLUTION: The image inputted in a step S201 is divided into plural areas based on the color information of the background color of that image in a step S202, and color information corresponding to the background color is applied to each area. In a step S203, data attributes are set to the respective areas based on the color information in the respective areas provided in the step S202. This is performed by referring to an item converting table for storing the color information and the item information while pairing them. In a step S204, character recognizing processing is performed according to the data attributes set in the step S203.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は文字認識装置に関
し、特に帳票等の所定のフォーマットを有する文書に対
して文字認識をおこなう文字認識装置及びその方法に関
するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition apparatus, and more particularly to a character recognition apparatus and method for performing character recognition on a document such as a form having a predetermined format.

【0002】[0002]

【従来の技術】従来の文字認識装置において、帳票等の
罫線に囲まれた画像を読み取って文字認識を行うものが
ある。この種の装置においては、読取対象の文書のもつ
フォーマットを1つのフォーマットに限定し、当該文書
の特定の場所(即ち、特定の項目)のみを認識させるよ
うにすることが行われている。
2. Description of the Related Art In a conventional character recognition apparatus, there is an apparatus which performs character recognition by reading an image surrounded by ruled lines such as a form. In this type of apparatus, the format of a document to be read is limited to one format, and only a specific location (that is, a specific item) of the document is recognized.

【0003】また、文字領域の座標の異なるフォーマッ
トに対応させるために、罫線を抽出し、罫線に囲まれた
場所を認識させるようにするものも提案されている。
In order to correspond to a format having different coordinates of a character area, a method has been proposed in which a ruled line is extracted and a portion surrounded by the ruled line is recognized.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、上述の
ように文書の特定の場所について文字認識を行う技術で
は、複数種類のフォーマットに対応出来なかったり、ス
キャナ等でイメージを読み取る際に読取対象の項目の位
置が、所定の位置以外にずれないようにする等の手間が
必要となる。
However, the technique of performing character recognition at a specific location in a document as described above cannot support a plurality of types of formats, and cannot read an item to be read when an image is read by a scanner or the like. Is required to prevent the position from being shifted to a position other than the predetermined position.

【0005】また、罫線を抽出して文字認識位置を特定
する技術では、複雑な表等の罫線を有する文書を処理す
る場合において、そのフォーマットが予めわかっていて
も、傾斜、かすれ、位置のずれ、大きさの違い等の要因
があると罫線の抽出ができなくなったり、テキスト等を
誤って罫線としてしまうこと等があり、正確な文字認識
が困難となるといった問題があった。
In the technique of extracting a ruled line to specify a character recognition position, when processing a document having a ruled line such as a complicated table, even if the format is known in advance, the inclination, the blur, and the displacement of the position are determined. If there are factors such as differences in size, ruled lines cannot be extracted, or text or the like may be erroneously formed as ruled lines, which makes accurate character recognition difficult.

【0006】本発明は上記の問題に鑑みてなされたもの
であり、文書中の所定の項目について文字認識を行うよ
うな場合に、文書フォーマットの相違に柔軟に対応でき
る文字認識装置及びその方法を提供することを目的とす
る。
SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and has an object to provide a character recognition apparatus and method capable of flexibly coping with a difference in document format when character recognition is performed on a predetermined item in a document. The purpose is to provide.

【0007】[0007]

【課題を解決するための手段】上記の目的を達成するた
めの本発明の一態様である文字認識装置は例えば以下の
構成を備えるものである。すなわち、画像を色情報に基
づいて複数の領域に分割する領域分割手段と、前記領域
分割手段によって得られた各領域の色情報に基づいて各
領域にデータ属性を設定する設定手段と、前記設定手段
によって設定されたデータ属性に従って文字認識処理を
おこなう文字認識手段とを備える。
Means for Solving the Problems A character recognition device according to one embodiment of the present invention for achieving the above object has, for example, the following configuration. That is, an area dividing means for dividing an image into a plurality of areas based on color information, a setting means for setting a data attribute to each area based on the color information of each area obtained by the area dividing means, Character recognition means for performing a character recognition process in accordance with the data attribute set by the means.

【0008】また、上記の目的を達成するための本発明
の他の態様である文字認識方法は例えば以下の工程を備
える。すなわち、画像を色情報に基づいて複数の領域に
分割する領域分割工程と、前記領域分割工程によって得
られた各領域の色情報に基づいて各領域にデータ属性を
設定する設定工程と、前記設定工程によって設定された
データ属性に従って文字認識処理をおこなう文字認識工
程とを備える。
A character recognition method according to another embodiment of the present invention for achieving the above object includes, for example, the following steps. That is, an area dividing step of dividing an image into a plurality of areas based on color information, a setting step of setting a data attribute to each area based on color information of each area obtained in the area dividing step, A character recognition step of performing a character recognition process according to the data attribute set in the step.

【0009】[0009]

【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な一実施形態を説明する。
Preferred embodiments of the present invention will be described below with reference to the accompanying drawings.

【0010】図1は本実施形態の文字認識装置の構成を
表すブロック図である。図1において、101は画像原
稿に光を照射し、その反射光を読み取り、電気信号に変
換するスキャナ、102はスキャナ101で得られた電
気信号を2値のデジタル電気信号に変換し他の装置構成
要素に伝送するためのスキャナインタフェース回路であ
る。103はディスプレイのウィンドウ上で所望とする
座標を入力するためのポインティングデバイス(本例で
はマウス)、104はポインティングデバイス103か
らの信号を受け、それを他の装置構成要素に伝送するた
めのインターフェース回路である。105は装置全体の
制御及び項目識別処理等を実行するためのCPU、10
6はCPU105が実行する制御プログラム、各種処理
プログラムやフォントデータなどを格納しているRO
M、107はCPU105による文書画像の展開処理や
項目識別処理のための作業領域などとして用いられるR
AMである。
FIG. 1 is a block diagram showing the configuration of the character recognition device of the present embodiment. In FIG. 1, reference numeral 101 denotes a scanner which irradiates an image original with light, reads reflected light thereof, and converts the reflected light into an electric signal. A scanner interface circuit for transmitting to a component. Reference numeral 103 denotes a pointing device (mouse in this example) for inputting desired coordinates on a window of the display, and 104 denotes an interface circuit for receiving a signal from the pointing device 103 and transmitting the signal to another device component. It is. A CPU 105 controls the entire apparatus and executes an item identification process and the like.
Reference numeral 6 denotes an RO storing control programs executed by the CPU 105, various processing programs, font data, and the like.
Reference numerals M and 107 denote R used as a work area for document image development processing and item identification processing by the CPU 105.
AM.

【0011】また、108は入力イメージ等を表示する
ためのディスプレイ、109はディスプレイインターフ
ェース回路である。ディスプレイ108には、RAM1
07の所定アドレスエリアであるVRAM領域に格納さ
れているイメージが表示される。110は、登録された
データが格納されるハードディスク等の外部記憶装置
で、111はそのインタフェースである。そして112
は各装置構成要素を接続するバスである。なお、CPU
105が実行する制御プログラムを外部記憶装置110
に格納しておき、必要に応じてRAM107にロード
し、これをCPU105が実行するように構成してもよ
い。
Reference numeral 108 denotes a display for displaying an input image or the like, and reference numeral 109 denotes a display interface circuit. The display 108 has a RAM 1
The image stored in the VRAM area which is the predetermined address area 07 is displayed. 110 is an external storage device such as a hard disk in which registered data is stored, and 111 is its interface. And 112
Is a bus connecting each device component. In addition, CPU
Control program executed by the external storage device 110
May be stored in the RAM 107 and loaded into the RAM 107 as needed, and the CPU 105 may execute the program.

【0012】次に本実施形態の文字認識装置による処理
の流れについて図2のフローチャート、図3、図4、図
5、および図6を参照して説明する。図2は本実施形態
による文字認識装置の動作手順を説明するフローチャー
トである。図3は、本実施形態のブロック領域データの
構造例を示す図である。また、図4は、本実施形態の項
目変換データベースにおける項目変換テーブル例を示す
図である。図5は、本実施形態の文字認識装置で読取を
行う文書の例を示す図である。図6は、他の文書の例を
示す図である。
Next, the flow of processing by the character recognition device of the present embodiment will be described with reference to the flowchart of FIG. 2, and FIGS. 3, 4, 5, and 6. FIG. 2 is a flowchart illustrating the operation procedure of the character recognition device according to the present embodiment. FIG. 3 is a diagram illustrating a structure example of block area data according to the present embodiment. FIG. 4 is a diagram illustrating an example of an item conversion table in the item conversion database according to the present embodiment. FIG. 5 is a diagram illustrating an example of a document to be read by the character recognition device of the present embodiment. FIG. 6 is a diagram illustrating an example of another document.

【0013】まず、ステップS201で認識しようとす
る文書(図5)をスキャナで読み込み、nビットのカラ
ー画像データに変換する。得られた入力画像データに対
してステップS202で領域識別処理を行い、バックグ
ラウンドのカラー毎にブロック領域を抽出し、その色情
報並びにレイアウト情報をブロックデータとして記憶す
る。本実施形態では、図3に示す例のように、色情報と
して「色」、レイアウト情報として「座標」「属性」
「組方向」がブロックデータとして、領域識別処理後に
記憶される。
First, in step S201, a document (FIG. 5) to be recognized is read by a scanner and converted into n-bit color image data. In step S202, the obtained input image data is subjected to area identification processing, a block area is extracted for each background color, and its color information and layout information are stored as block data. In the present embodiment, as in the example shown in FIG. 3, “color” is used as color information, and “coordinates” and “attributes” are used as layout information.
The “set direction” is stored as block data after the area identification processing.

【0014】次に項目情報変換処理(ステップS20
3)によって各ブロック領域の色情報を項目変換データ
ベースに従って項目情報に変換する。本実施形態の場
合、認識しようとする文書(図5)は「住所録」である
ので、項目変換データベースの「住所録」用の項目変換
テーブル(図4)を用いる。例えば図5のブロック50
2は色情報がカラーDであるので、項目変換テーブル
(図4)により項目「住所」に変換され、ブロックデー
タの項目番号に「4」というデータがセットされる。
Next, item information conversion processing (step S20)
According to 3), the color information of each block area is converted into item information according to the item conversion database. In the case of the present embodiment, since the document to be recognized (FIG. 5) is “address book”, the item conversion table for “address book” of the item conversion database is used (FIG. 4). For example, block 50 in FIG.
Since the color information 2 is color D, it is converted to the item “address” by the item conversion table (FIG. 4), and the data “4” is set to the item number of the block data.

【0015】なお、本実施形態では項目番号をブロック
データの認識順序としてセットすることで認識順序の設
定を同時に実行している。すなわち、ブロックデータに
おいて項目番号と同じ値が認識順序にセットされる。次
に、文字認識処理(ステップS204)において、設定
されたブロックデータの認識順序の順番、すなわち項目
番号順に、各ブロック領域内の文字の認識処理を実行し
ていく。
In this embodiment, the setting of the recognition order is performed simultaneously by setting the item numbers as the recognition order of the block data. That is, the same value as the item number in the block data is set in the recognition order. Next, in the character recognition process (step S204), the character recognition process in each block area is executed in the order of the set block data recognition order, that is, in the order of the item numbers.

【0016】以上のような本実施形態の文字認識装置に
よれば、たとえフォーマットの形状が異なる帳票等の文
書について処理を行うとしても、項目情報(色と項目の
対応)が同じものであれば、同じ種類のフォーマットと
して文字認識処理が可能である。
According to the character recognition apparatus of the present embodiment as described above, even if processing is performed on documents such as forms having different formats, if the item information (correspondence between colors and items) is the same, The character recognition processing can be performed as the same type of format.

【0017】例えば、図5と図6の文書は、同じ「住所
録」というフォーマットの種類であるにも関わらず、フ
ォーマット形状が異なる。このため、従来の文字認識装
置では、文字認識処理に際して異なるフォーマットとし
て扱わなければならなかった。しかしながら本実施形態
によれば、ともに同じ「住所録」であるので、「住所
録」用の項目変換テーブル(図4)を用いることによ
り、同一の項目情報に変換することが可能である。
For example, the documents in FIG. 5 and FIG. 6 have different format shapes, although they have the same format type of “address book”. For this reason, in the conventional character recognition device, it was necessary to treat the character recognition processing as a different format. However, according to the present embodiment, since both are the same “address book”, they can be converted into the same item information by using the item conversion table for “address book” (FIG. 4).

【0018】例えば、図5のブロック503と図6のブ
ロック602は、レイアウト情報の座標は異なるが、共
に色情報が「カラーB」であるので、項目変換データベ
ース(図4)により項目「氏名」に変換され、ブロック
データに項目番号「2」というデータがセットされる。
そして、文字認識処理(S204)によって、「氏名」
という項目のデータとして、ブロック領域内の文字が認
識される。
For example, the block 503 in FIG. 5 and the block 602 in FIG. 6 have different coordinates of the layout information, but both have color information of “color B”. Therefore, the item “name” is obtained from the item conversion database (FIG. 4). And the data having the item number “2” is set in the block data.
Then, by the character recognition processing (S204), "name"
The character in the block area is recognized as the data of the item of.

【0019】なお、項目変換データベースには複数種類
のフォーマット(住所録、帳票等)に対応する項目変換
テーブルが格納されており、ユーザはマウス103等の
入力装置を介して使用する項目変換テーブルを指定する
ことが可能である。
Note that the item conversion database stores item conversion tables corresponding to a plurality of types of formats (address book, form, etc.), and the user converts the item conversion table used via an input device such as the mouse 103. It is possible to specify.

【0020】以上説明した様に上記実施形態によれば、
入力画像を背景色に基づいて複数の領域に分割し、各領
域の背景色に従って夫々の項目を決定し、各項目毎の文
字認識を実行するので、 帳票等の文書の文字認識処理が正確になる、 文字領域の座標の異なりや罫線等の形状の異なりのあ
るフォーマットの文書の文字認識処理が可能になる、 スキャナ等でイメージを読み取る際の項目のずれに影
響されなくなるので操作性が向上する、 処理全体の時間の短縮等が図れるといった効果があ
る。
As described above, according to the above embodiment,
The input image is divided into multiple areas based on the background color, each item is determined according to the background color of each area, and character recognition is performed for each item, so that character recognition processing of documents such as forms can be performed accurately. Yes, it is possible to perform character recognition processing on documents in formats with different character area coordinates or different shapes such as ruled lines.Improved operability because it is not affected by item deviation when reading images with a scanner etc. This has the effect of reducing the time required for the entire processing.

【0021】なお、本発明は、複数の機器(例えばホス
トコンピュータ,インタフェイス機器,リーダ,プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機,ファクシミリ装置
など)に適用してもよい。
The present invention can be applied to a system including a plurality of devices (for example, a host computer, an interface device, a reader, a printer, etc.), but can be applied to a single device (for example, a copier, a facsimile) Device).

【0022】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
Another object of the present invention is to provide a storage medium storing a program code of software for realizing the functions of the above-described embodiments to a system or apparatus, and to provide a computer (or CPU) of the system or apparatus.
And MPU) read and execute the program code stored in the storage medium.

【0023】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiment, and the storage medium storing the program code constitutes the present invention.

【0024】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
As a storage medium for supplying the program code, for example, a floppy disk, hard disk, optical disk, magneto-optical disk, CD-ROM, CD
-R, a magnetic tape, a nonvolatile memory card, a ROM, or the like can be used.

【0025】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
When the computer executes the readout program code, not only the functions of the above-described embodiment are realized, but also the OS (Operating System) running on the computer based on the instruction of the program code. ) May perform some or all of the actual processing, and the processing may realize the functions of the above-described embodiments.

【0026】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
Further, after the program code read from the storage medium is written into a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, based on the instructions of the program code, It goes without saying that the CPU included in the function expansion board or the function expansion unit performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.

【0027】[0027]

【発明の効果】以上説明したように、本発明によれば、
文書中の所定の項目について文字認識を行うような場合
に、文書フォーマットの相違に対して柔軟に対応するこ
とが可能となる。
As described above, according to the present invention,
When character recognition is performed on a predetermined item in a document, it is possible to flexibly cope with a difference in document format.

【0028】[0028]

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施形態の文字認識装置の構成を表すブロッ
ク図である。
FIG. 1 is a block diagram illustrating a configuration of a character recognition device according to an embodiment.

【図2】本実施形態による文字認識装置の動作手順を説
明するフローチャートである。
FIG. 2 is a flowchart illustrating an operation procedure of the character recognition device according to the embodiment.

【図3】本実施形態のブロック領域データの構造例を示
す図である。
FIG. 3 is a diagram illustrating a structure example of block area data according to the embodiment;

【図4】本実施形態の項目変換データベースにおける変
換テーブル例を示す図である。
FIG. 4 is a diagram showing an example of a conversion table in an item conversion database according to the embodiment.

【図5】本実施形態の文字認識装置で読取を行う文書の
例を示す図である。
FIG. 5 is a diagram showing an example of a document to be read by the character recognition device of the embodiment.

【図6】他の文書の例を示す図である。FIG. 6 is a diagram illustrating an example of another document.

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 画像を色情報に基づいて複数の領域に分
割する領域分割手段と、 前記領域分割手段によって得られた各領域の色情報に基
づいて各領域にデータ属性を設定する設定手段と、 前記設定手段によって設定されたデータ属性に従って文
字認識処理をおこなう文字認識手段とを備えることを特
徴とする文字認識装置。
A region dividing unit that divides an image into a plurality of regions based on color information; and a setting unit that sets a data attribute to each region based on color information of each region obtained by the region dividing unit. A character recognition unit that performs a character recognition process according to the data attribute set by the setting unit.
【請求項2】 前記設定手段は、色情報とデータ属性と
を対応させた変換テーブルを有し、前記領域分割手段に
よって得られた各領域の色情報に対応するデータ属性を
該変換テーブルを参照して獲得し、該各領域に設定する
ことを特徴とする請求項1に記載の文字認識装置。
2. The image processing apparatus according to claim 1, wherein the setting unit has a conversion table in which color information and data attributes are associated with each other, and refers to the conversion table for a data attribute corresponding to the color information of each area obtained by the area dividing unit. The character recognition device according to claim 1, wherein the character recognition device obtains the information and sets the obtained region.
【請求項3】 前記データ属性は処理順序を含み、 前記文字認識手段は、前記データ属性で示される処理順
序に従って各領域に対する文字認識処理を実行すること
を特徴とする請求項1に記載の文字認識装置。
3. The character according to claim 1, wherein the data attribute includes a processing order, and the character recognizing means executes a character recognition process for each area in accordance with the processing order indicated by the data attribute. Recognition device.
【請求項4】 前記データ属性は各領域のデータ項目を
表すことを特徴とする請求項1に記載の文字認識装置。
4. The character recognition device according to claim 1, wherein the data attribute represents a data item of each area.
【請求項5】 複数種類の文書フォーマットに対応する
複数種類の変換テーブルと、 前記複数種類の変換テーブルのうちの所望の一つを選択
する選択手段とを更に備え、 前記設定手段は、前記領域分割手段によって得られた各
領域の色情報に対応するデータ属性を前記選択手段で選
択された変換テーブルを参照して獲得し、該各領域に設
定することを特徴とする請求項1に記載の文字認識装
置。
5. The apparatus according to claim 1, further comprising: a plurality of types of conversion tables corresponding to a plurality of types of document formats; and a selection unit for selecting a desired one of the plurality of types of conversion tables. The data attribute corresponding to the color information of each area obtained by the dividing means is obtained by referring to the conversion table selected by the selecting means, and is set in each of the areas. Character recognition device.
【請求項6】 画像を色情報に基づいて複数の領域に分
割する領域分割工程と、 前記領域分割工程によって得られた各領域の色情報に基
づいて各領域にデータ属性を設定する設定工程と、 前記設定工程によって設定されたデータ属性に従って文
字認識処理をおこなう文字認識工程とを備えることを特
徴とする文字認識方法。
6. An area dividing step of dividing an image into a plurality of areas based on color information; and a setting step of setting a data attribute to each area based on the color information of each area obtained in the area dividing step. A character recognizing step of performing a character recognizing process according to the data attribute set in the setting step.
【請求項7】 前記設定工程は、色情報とデータ属性と
を対応させた変換テーブルを有し、前記領域分割工程に
よって得られた各領域の色情報に対応するデータ属性を
該変換テーブルを参照して獲得し、該各領域に設定する
ことを特徴とする請求項6に記載の文字認識方法。
7. The setting step includes a conversion table in which color information and data attributes are associated with each other, and refers to the conversion table for a data attribute corresponding to the color information of each area obtained in the area dividing step. The character recognition method according to claim 6, wherein the character is acquired and set in each of the areas.
【請求項8】 前記データ属性は処理順序を含み、 前記文字認識工程は、前記データ属性で示される処理順
序に従って各領域に対する文字認識処理を実行すること
を特徴とする請求項6に記載の文字認識方法。
8. The character according to claim 6, wherein the data attribute includes a processing order, and the character recognition step executes a character recognition process for each area in accordance with the processing order indicated by the data attribute. Recognition method.
【請求項9】 前記データ属性は各領域のデータ項目を
表すことを特徴とする請求項6に記載の文字認識方法。
9. The character recognition method according to claim 6, wherein the data attribute represents a data item of each area.
【請求項10】 複数種類の文書フォーマットに対応す
る複数種類の変換テーブルと、 前記複数種類の変換テーブルのうちの所望の一つを選択
する選択工程とを更に備え、 前記設定工程は、前記領域分割工程によって得られた各
領域の色情報に対応するデータ属性を前記選択工程で選
択された変換テーブルを参照して獲得し、該各領域に設
定することを特徴とする請求項6に記載の文字認識方
法。
10. The method according to claim 1, further comprising: a plurality of types of conversion tables corresponding to a plurality of types of document formats; and a selecting step of selecting a desired one of the plurality of types of conversion tables. The data attribute corresponding to the color information of each area obtained in the dividing step is obtained by referring to the conversion table selected in the selecting step, and is set in each of the areas. Character recognition method.
【請求項11】 文字認識処理のための制御プログラム
を格納する記憶媒体であって、該制御プログラムが画像
を色情報に基づいて複数の領域に分割する領域分割工程
のコードと、 前記領域分割工程によって得られた各領域の色情報に基
づいて各領域にデータ属性を設定する設定工程のコード
と、 前記設定工程によって設定されたデータ属性に従って文
字認識処理をおこなう文字認識工程のコードとを備える
ことを特徴とする記憶媒体。
11. A storage medium for storing a control program for character recognition processing, wherein the control program divides an image into a plurality of areas based on color information; A code of a setting step of setting a data attribute in each area based on the color information of each area obtained by the above, and a code of a character recognition step of performing a character recognition process according to the data attribute set in the setting step. A storage medium characterized by the above-mentioned.
JP10024884A 1998-02-05 1998-02-05 Device and method for recognizing character Withdrawn JPH11224308A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10024884A JPH11224308A (en) 1998-02-05 1998-02-05 Device and method for recognizing character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10024884A JPH11224308A (en) 1998-02-05 1998-02-05 Device and method for recognizing character

Publications (1)

Publication Number Publication Date
JPH11224308A true JPH11224308A (en) 1999-08-17

Family

ID=12150623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10024884A Withdrawn JPH11224308A (en) 1998-02-05 1998-02-05 Device and method for recognizing character

Country Status (1)

Country Link
JP (1) JPH11224308A (en)

Similar Documents

Publication Publication Date Title
JP3996579B2 (en) Form processing system for identifying active areas of machine-readable forms
JP4100746B2 (en) Image processing apparatus and method
CN107133615B (en) Information processing apparatus, information processing method, and computer program
JP2005536783A (en) Section extraction tool for pdf documents
US7453594B2 (en) Document filing apparatus for storing information added to a document file
US6968501B2 (en) Document format identification apparatus and method
US8533590B2 (en) Information processing apparatus and layout processing method
JP2000322417A (en) Device and method for filing image and storage medium
JP2009031937A (en) Form image processing apparatus and form image processing program
JPH08329187A (en) Document reader
JP3171626B2 (en) Character recognition processing area / processing condition specification method
JPH11224308A (en) Device and method for recognizing character
JP3412998B2 (en) Image processing apparatus and method
JPH11187231A (en) Image retrieving device and image retrieval method
JPH09288728A (en) Picture processor and method therefor
JPH11224306A (en) Device and method for recognizing character
JP5361315B2 (en) Information processing apparatus and information processing method
JP2001028032A (en) Image information processor and mark sheet
JPH11203402A (en) Image processor and its method
US20090241063A1 (en) Information processing apparatus, information processing method, and computer readable medium for designing a gui
JPS61131082A (en) Rejected character display system of ocr
JPH11224307A (en) Device and method for recognizing document
JPH11339041A (en) Color image processing method and device therefor and recording medium
JPH09146947A (en) Method and device for sequencing character area
JP2007148585A (en) Image processor and program

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050405