JPH11184966A - Device and method for recognizing character - Google Patents

Device and method for recognizing character

Info

Publication number
JPH11184966A
JPH11184966A JP9353894A JP35389497A JPH11184966A JP H11184966 A JPH11184966 A JP H11184966A JP 9353894 A JP9353894 A JP 9353894A JP 35389497 A JP35389497 A JP 35389497A JP H11184966 A JPH11184966 A JP H11184966A
Authority
JP
Japan
Prior art keywords
area
character recognition
step
original image
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9353894A
Other languages
Japanese (ja)
Inventor
Yasumasa Sakai
康真 坂井
Original Assignee
Canon Inc
キヤノン株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc, キヤノン株式会社 filed Critical Canon Inc
Priority to JP9353894A priority Critical patent/JPH11184966A/en
Publication of JPH11184966A publication Critical patent/JPH11184966A/en
Application status is Withdrawn legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To save labor in area designation at a character reader device by specifying an area on an original image based on the position of a detected prescribed color make on the original image and applying a prescribed attribute to that area. SOLUTION: An original is read by a color scanner 1 and divided into areas, it is checked whether the previously designated marker color is included in that original or not, a marker designated area is retrieved and the detection of the designated area is checked. When there is the marker designated area, that area is defined as a character recognition object area. When there is no marker designated area, the operator of an OCR device designates the character recognition area on the original image displayed on a display 4 using a pointing device such as a mouse. Character recognition is performed to that character recognition area, and the recognized result is written out on a hard disk device 2 as a text file. Based on the position of the prescribed color mark detected like this on the original image, an area is specified on the original image and the prescribed attribute is applied to that area.

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【発明の属する技術分野】本発明は文字認識装置及びその方法に関するものである。 BACKGROUND OF THE INVENTION The present invention relates to character recognition apparatus and method.

【0002】 [0002]

【従来の技術】従来より、原稿画像を光学的に読み取って文字認識を行う(OCR処理)文字認識装置が知られている。 Conventionally, it performs character recognition by reading a document image optically (OCR processing) character recognition apparatus is known. 文字認識装置では、雑誌や新聞等をOCR処理する際には、その前処理として、認識させたい原稿の領域を指定する必要があった。 The character recognition device, when the OCR processing the magazines and newspapers, etc., as the pre-treatment, there was a need to specify the area of ​​the document you want to recognize. この操作は例えば読み込まれた原稿イメージをCRT等のモニタ画面に表示して、 This operation is displayed on the monitor screen of the CRT such as a document image read for example,
マウス等のポインティングデバイスによって矩形を指定し、文字認識装置に対して認識すべき領域を入力していた。 Specifies the rectangle by a pointing device such as a mouse, you have entered the area to be recognized with respect to the character recognition device.

【0003】 [0003]

【発明が解決しようとする課題】しかしながら、上記のような文字認識装置では、文字認識装置を操作する人が認識対象原稿のどの部分を文字認識の対象とするかを把握している必要がある。 The object of the invention is to, however, by the character recognition device as described above, there is a need for people to manipulate the character recognition device knows whether the object of character recognition which part of the recognition target document . 文字認識装置を操作する人と原稿のどの部分を文字認識の対象とすべきかを知っている人が異なる場合には、両者がともに文字認識装置のところに居らねばならない。 If the person who is any part of a person and a document to operate the character recognition device know what should be subject to character recognition is different, both must be folded to both at the character recognition device.

【0004】あるいは、認識対象原稿を持つ人が、その原稿に対してマーカ等で認識対象領域を指定するため印を付けておき、文字認識装置を操作する人にこれを渡す方法も考えられる。 [0004] Alternatively, a person with a recognized document, and mark for specifying a recognition object region in the marker or the like to the document, how to pass it to the person operating the character recognition device can also be considered. しかしながら、文字認識装置の操作者は、そのマークに従って画面上で再度領域指定を操作する必要があった。 However, the operator of the character recognition apparatus, it is necessary to operate again region specified on the screen according to the mark. このため、操作が煩わしくなるとともに、文字認識対象位置を間違えてしまう危険性も生じていた。 Thus, operation with becomes cumbersome, have occurred also risk that the wrong character recognition target position.

【0005】本発明は上記の問題に鑑みてなされたものであり、その目的とするところは、文字認識装置における領域指定の省力化を実現する文字認識装置及びその制御方法を提供することにある。 [0005] The present invention has been made in view of the above problems, and an object is to provide a character recognition device and a control method for realizing a labor saving of a range in the character recognition device .

【0006】 [0006]

【課題を解決するための手段】上記の目的を達成するための本発明の文字認識装置は以下の構成を備える。 Means for Solving the Problems The character recognition apparatus of the present invention for achieving the above object comprises the following arrangement. すなわち、原稿画像を読み取って得られた原稿画像データを格納する格納手段と、前記原稿画像データより所定色のマークを検出する検出手段と、前記検出手段によって検出された所定色マークの前記原稿画像上の位置に基づいて、該原稿画像上に領域を特定する特定手段と、前記特定手段によって特定された領域に所定の属性を付与する属性付与手段とを備える。 In other words, storage means and a detecting means for detecting a mark of a predetermined color from the original image data, the document image of a predetermined color marks detected by said detecting means for storing the original image data obtained by reading an original image based on the position of the upper, comprising a specifying means for specifying an area on said document image, and attribute assigning means for assigning predetermined attribute in a specific area by the specifying means.

【0007】また、上記の目的を達成するための本発明の一態様による文字認識装置方法は、原稿画像を読み取って得られた原稿画像データをメモリに格納する格納工程と、前記原稿画像データより所定色のマークを検出する検出工程と、前記検出工程によって検出された所定色マークの前記原稿画像上の位置に基づいて、該原稿画像上に領域を特定する特定工程と、前記特定工程によって特定された領域に所定の属性を付与する属性付与工程とを備える。 Further, the character recognition apparatus method according to an aspect of the present invention for achieving the above object, a storage step of storing the original image data obtained by reading a document image in the memory, from the document image data a detection step of detecting a mark of a predetermined color, on the basis of the position on the original image of a predetermined color marks detected by the detection step, a specifying step of specifying an area on the document image, specified by the specifying step and a attribute step of applying a predetermined attribute in an area that is.

【0008】 [0008]

【発明の実施の形態】以下、添付の図面を参照して本発明の好適な実施形態を説明する。 BEST MODE FOR CARRYING OUT THE INVENTION The following describes the preferred embodiments of the present invention with reference to the accompanying drawings.

【0009】図1は本実施形態による文字認識装置(以下OCR装置という)の構成を示すブロック図である。 [0009] Figure 1 is a block diagram showing a structure of a character recognizing apparatus according to this embodiment (hereinafter referred to as OCR device).
図1において、1はカラーマーカで印の付けられた原稿を読み込むためのカラースキャナ、2は認識結果の格納されるハードディスク装置、3はOCR装置の操作のためのキーボード、4はOCR装置の動作状況をモニタするためのディスプレイ装置、5はOCR処理に使われる作業領域としてのRAM、6はOCR装置の処理プログラムが納められているROM、7は上記プログラムに従って装置全体を制御するマイクロプロセッサ(MPU) In Figure 1, 1 color scanner for reading a document attached marked in color marker, 2 hard disk device is stored in the recognition result, 3 the operation of the keyboard, 4 the OCR device for operating the OCR device display device for monitoring the situation, microprocessor (MPU 5 is for controlling the entire apparatus according ROM, 7 is the program RAM, 6 as a working area used for OCR processing program of the OCR device is housed )
である。 It is.

【0010】以上のような構成を備えた本実施形態のO O of this embodiment having [0010] the above configuration
CR装置の動作について説明する。 A description will be given of the operation of the CR apparatus. 図2は本実施形態のOCR装置の動作を表すフローチャートである。 Figure 2 is a flowchart showing the operation of the OCR apparatus of the present embodiment.

【0011】まず、ステップS10でカラースキャナ1 [0011] First, the color scanner 1 in step S10
より原稿を読み込む。 More reading the manuscript. ステップS11では、カラー領域分割技術を用いて、領域分割を行うとともに、予め指定されたマーカ色が当該原稿に含まれているかどうかを調べ、マーカ指定領域を検索する。 In step S11, using color region segmentation technique, performs area division marker color specified in advance is checked whether it is included in the document, it searches the marker designated region. ステップS12では、 In the step S12,
ステップS11におけるマーカ指定領域の検索によって指定領域が検出できたかどうかをチェックする。 Designated area by the search of the marker designated region in step S11 it is checked whether or not detected. ここで、マーカ指定領域があればステップS13に進み、その領域を文字認識対象領域とする。 Here, the process proceeds to step S13 if the marker designated region, to the region as character recognition target area. マーカ指定領域が無い場合は、ステップS14に進み、従来通りOCR装置の操作者がマウス等のポインティングデバイスを用いて、ディスプレイ4に表示された原稿画像上で文字認識領域を指定する。 If the marker designated region is not, the process proceeds to step S14, the operator of the conventional OCR apparatus using a pointing device such as a mouse, to specify the character recognition area on the displayed document image on the display 4. ステップS15では指定された文字認識領域に対して、文字認識を行い、ステップS16でその認識結果がテキストファイルとしてハードディスク装置2に書き出される。 Step S15 for the specified character recognition area in, performs character recognition, the recognition result in step S16 is written to the hard disk drive 2 as a text file.

【0012】図3は、マーカ指定領域の指定方法を説明する図である。 [0012] Figure 3 is a view for explaining how to specify the marker designated region. 図3の(a)では、抽出すべき矩形領域の対角線上の2頂点の位置を指定色マーカでマークした状態を示している。 In the FIG. 3 (a), it shows a state marked with a designated color marker two positions of vertices on the diagonal line of the to be extracted rectangular region. この場合、OCR装置は、上述のステップS11におけるマーカ領域検索で、マークされた2つの位置を対角線上の頂点とする矩形領域を特定して、指定領域として抽出する。 In this case, OCR device is a marker area search in step S11 described above, by specifying a rectangular region having vertices on a diagonal the marked two positions is extracted as the specified region. また、図3の(b)では、指定色マーカによって記入されている閉図形を検出し、この閉図形に外接する矩形を検出して、当該矩形領域を指定領域として抽出する。 Further, in FIG. 3 (b), detecting a closed figure which is filled in by the designated color marker detects a rectangle circumscribing the closed figure, and extracts the rectangular region as a designated region.

【0013】なお、指定色マーカに基づく領域の特定方法は上記に限らない。 [0013] It should be noted that the method of identifying the area based on the specified color marker is not limited to the above. また、上記実施形態では、1つの指定色を用いて文字領域を特定しているが、複数の指定色を用いて複数種類の領域属性を特定するようにしてもよい。 Further, in the above embodiment, and identifies a character region using one specified color, it may be specified multiple kinds of area attribute using a plurality of designated colors. 例えば、赤色マーカによって文字認識対象領域を指定し、緑色マーカによって図形領域を指定するというように構成してもよい。 For example, to specify the character recognition target area by the red marker may be configured that specify the graphic region by green marker. この場合、図3の(c)に示されるように、緑色マーカ101で囲まれた領域内に赤色マーカ102で囲まれた文字認識対象領域を指定することもできるし、その逆も可能である。 In this case, as shown in FIG. 3 (c), also to be able to specify the character recognition target area surrounded by red marker 102 in the area having a green marker 101, or vice versa .

【0014】以上説明したように、本実施形態によれば、原稿にマーカで指定した領域に対して、文字認識が実行されるので、OCR装置の操作者が再度認識領域を指定する手間が省けるようになる。 [0014] As described above, according to this embodiment, the region specified by the marker on the document, since the character recognition is performed, Habukeru the trouble of specifying the operator again recognition region of the OCR device so as to.

【0015】なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPU [0015] The object of the present invention, a storage medium storing software program codes for realizing the functions of the above embodiments is supplied to a system or an apparatus and a computer (or CPU
やMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。 Or MPU) also by reading out and executing the program code stored in the storage medium, it is needless to say that is achieved.

【0016】この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。 [0016] In this case, the program codes read from the storage medium realizes the functions of the embodiments and the storage medium storing the program code constitutes the present invention.

【0017】プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD [0017] As the storage medium for supplying the program codes, a floppy disk, hard disk, optical disk, magnetooptical disk, CD-ROM, CD
−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。 -R, magnetic tape, nonvolatile memory card, ROM, and the like.

【0018】また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Further, by a computer executing the read program code, as well as functions of the above embodiments are realized on the basis of the instructions of the program code, OS (operating system running on the computer ) performs a part or all of the processing but also to a case where the functions of the above-described embodiments are realized by those processes like.

【0019】さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Furthermore, the program code read from the storage medium are written in a memory of a function expansion unit connected to a function expansion board inserted into the computer or on the basis of the instructions of the program code, its function expansion board or function expansion unit CPU performs a part or all of the processing but also to a case where the functions of the above embodiments are realized by those processes.

【0020】 [0020]

【発明の効果】以上説明したように本発明によれば、文字認識装置における領域指定の省力が実現される。 According to the present invention as described in the foregoing, labor areas designated in the character recognition device can be realized.

【0021】 [0021]

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】本実施形態による文字認識装置(以下OCR装置という)の構成を示すブロック図である。 1 is a block diagram showing a structure of a character recognizing apparatus according to this embodiment (hereinafter referred to as OCR device).

【図2】本実施形態のOCR装置の動作を表すフローチャートである。 2 is a flowchart showing the operation of the OCR apparatus of the present embodiment.

【図3】マーカ指定領域の指定方法を説明する図である。 3 is a diagram for explaining how to specify the marker designated region.

【符号の説明】 DESCRIPTION OF SYMBOLS

1 カラースキャナ 2 ハードディスク装置 3 キーボード 4 ディスプレイ 5 RAM 6 ROM 7 マイクロプロセッサ 1 color scanner 2 hard disk device 3 keyboard 4 display 5 RAM 6 ROM 7 Microprocessor

Claims (11)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】 原稿画像を読み取って得られた原稿画像データを格納する格納手段と、 前記原稿画像データより所定色のマークを検出する検出手段と、 前記検出手段によって検出された所定色マークの前記原稿画像上の位置に基づいて、該原稿画像上に領域を特定する特定手段と、 前記特定手段によって特定された領域に所定の属性を付与する属性付与手段とを備えることを特徴とする文字認識装置。 And 1. A storage means for storing the original image data obtained by reading an original image, and detecting means for detecting a mark of a predetermined color from the original image data, has been predetermined color mark detected by said detecting means characters on the basis of the position on the document image, characterized by comprising a specifying means for specifying an area on said document image, and attribute assigning means for assigning a predetermined attribute in an area identified by the identifying means recognition device.
  2. 【請求項2】 前記属性付与手段で付与される属性が文字認識対象であることを示すことを特徴とする請求項1 2. A method according to claim 1, characterized in that indicating that the attribute is assigned by the attribute assigning means is a character recognition object
    に記載の文字認識装置。 Character recognition apparatus according to.
  3. 【請求項3】 前記特定手段は、前記検出手段によって2つの所定色マークを検出した場合、当該2つの所定色マークを対角線上の頂点とする矩形領域を特定することを特徴とする請求項1に記載の文字認識装置。 Wherein said specifying means, when detecting two predetermined color mark by said detection means, according to claim 1, characterized in that identifying the rectangular region having vertices on a diagonal the two predetermined color mark character recognition apparatus according to.
  4. 【請求項4】 前記特定手段は、前記検出手段によって所定色マークによって描かれた閉図形が検出された場合、該閉図形に外接する矩形領域を特定することを特徴とする請求項1に記載の文字認識装置。 Wherein said specifying means, if the closed figure drawn by a predetermined color mark by said detecting means is detected, according to claim 1, characterized in that identifying the rectangular region circumscribing the closed-figure character recognition device.
  5. 【請求項5】 前記属性付与手段で文字認識対象であることを示す属性が付与された領域について文字認識処理を実行する認識手段を更に備えることを特徴とする請求項2に記載の文字認識装置。 5. A character recognition apparatus according to claim 2, further comprising a recognition unit for executing character recognition processing for the area where the attribute is assigned indicating that the character recognition target by the attribute assigning means .
  6. 【請求項6】 原稿画像を読み取って得られた原稿画像データをメモリに格納する格納工程と、 前記原稿画像データより所定色のマークを検出する検出工程と、 前記検出工程によって検出された所定色マークの前記原稿画像上の位置に基づいて、該原稿画像上に領域を特定する特定工程と、 前記特定工程によって特定された領域に所定の属性を付与する属性付与工程とを備えることを特徴とする文字認識方法。 6. A storage step of storing the original image data obtained by reading a document image in the memory, a detection step of detecting a mark of a predetermined color from the original image data, a predetermined color detected by said detecting step based on the position on the original image of the mark, and comprising: a specifying step of specifying an area on the document image and attributes step of applying a predetermined attribute in an area identified by the identifying step character recognition method to.
  7. 【請求項7】 前記属性付与工程で付与される属性が文字認識対象であることを示すことを特徴とする請求項6 7. A claim, characterized in that to indicate that attributes granted by the attribute assigning step is a character recognition target 6
    に記載の文字認識方法。 Character recognition method as claimed in.
  8. 【請求項8】 前記特定工程は、前記検出工程によって2つの所定色マークを検出した場合、当該2つの所定色マークを対角線上の頂点とする矩形領域を特定することを特徴とする請求項6に記載の文字認識方法。 Wherein said specifying step, when detecting two predetermined color marked by the detection step, claim and identifies a rectangular area having vertices on a diagonal the two predetermined color mark 6 character recognition method as claimed in.
  9. 【請求項9】 前記特定工程は、前記検出工程によって所定色マークによって描かれた閉図形が検出された場合、該閉図形に外接する矩形領域を特定することを特徴とする請求項6に記載の文字認識方法。 Wherein said specifying step, when the closed figure drawn by a predetermined color mark by said detecting step is detected, according to claim 6, characterized in that identifying the rectangular region circumscribing the closed-figure character recognition method.
  10. 【請求項10】 前記属性付与工程で文字認識対象であることを示す属性が付与された領域について文字認識処理を実行する認識工程を更に備えることを特徴とする請求項7に記載の文字認識方法。 10. A character recognizing method according to claim 7, further comprising a recognition step of performing character recognition processing for the area where the attribute is assigned indicating that said attribute assigning step in character recognition target .
  11. 【請求項11】 文字認識処理のための制御プログラムを格納する記憶媒体であって、 原稿画像を読み取って得られた原稿画像データをメモリに格納する格納工程とのコード、 前記原稿画像データより所定色のマークを検出する検出工程のコードと、 前記検出工程によって検出された所定色マークの前記原稿画像上の位置に基づいて、該原稿画像上に領域を特定する特定工程のコードと、 前記特定工程によって特定された領域に所定の属性を付与する属性付与工程のコードとを備えることを特徴とする記憶媒体。 11. A storage medium storing a control program for character recognition, the code of the storage step of storing the original image data obtained by reading a document image in the memory, given from the document image data and code detection step of detecting a mark color, based on the position on the original image of a predetermined color marks detected by the detection step, a code specifying step of specifying an area on the document image, the specific storage medium characterized by comprising a code attributes step of applying a predetermined attribute in an area identified by the process.
JP9353894A 1997-12-22 1997-12-22 Device and method for recognizing character Withdrawn JPH11184966A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9353894A JPH11184966A (en) 1997-12-22 1997-12-22 Device and method for recognizing character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9353894A JPH11184966A (en) 1997-12-22 1997-12-22 Device and method for recognizing character

Publications (1)

Publication Number Publication Date
JPH11184966A true JPH11184966A (en) 1999-07-09

Family

ID=18433942

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9353894A Withdrawn JPH11184966A (en) 1997-12-22 1997-12-22 Device and method for recognizing character

Country Status (1)

Country Link
JP (1) JPH11184966A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241355A (en) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd Image processor and image processing program
US7965293B2 (en) * 2000-09-04 2011-06-21 Minolta Co., Ltd. Image processing device, image processing method, and image processing program for reconstructing data

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7965293B2 (en) * 2000-09-04 2011-06-21 Minolta Co., Ltd. Image processing device, image processing method, and image processing program for reconstructing data
JP2007241355A (en) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd Image processor and image processing program

Similar Documents

Publication Publication Date Title
US5025484A (en) Character reader device
US5331547A (en) Process and computer system for control of interface software and data files
KR100674402B1 (en) Image processing apparatus, image processing method and storage medium
US5907835A (en) Electronic filing system using different application program for processing drawing commands for printing
JP3895492B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium storing program for causing computer to execute the method
EP0738987B1 (en) Processing machine readable forms
CA2396766C (en) Storing and retrieving the visual form of data
US5960448A (en) System and method for displaying a graphically enhanced view of a region of a document image in which the enhanced view is correlated with text derived from the document image
US6996276B2 (en) Method and apparatus for discriminating between documents in batch scanned document files
US5502800A (en) Graphic data processing apparatus using displayed graphics for application program selection
JP3805005B2 (en) Image processing apparatus, optical character recognition apparatus, and methods thereof
US8203748B2 (en) Image processing apparatus, control method therefor, and program
JP2005536783A (en) Section extraction tool for pdf documents
US20010004256A1 (en) Display system, display control method and computer readable medium storing display control program code
JPH08255236A (en) Device and method for filing image
US5123062A (en) OCR for sequentially displaying document layout according to recognition process
JP2002278984A (en) Document managing device
JP2002312777A (en) Image processor and method therefor
JPH06337896A (en) Device and method for retrieving electronic book display
JP3210102B2 (en) Electronic document filing apparatus and filing document search method
JP2001005599A (en) Information processor and information processing method an d recording medium recording information processing program
JPH10162150A (en) Page analysis system
US6510243B1 (en) Image processing apparatus for managing image data
JPH11341292A (en) Device and method for processing image and storage medium
KR950025582A (en) Character recognition apparatus having a registration method and user dictionary as the user dictionary character patterns

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050301