JP2001101338A - Picture processor, picture processing method and computer readable memory - Google Patents

Picture processor, picture processing method and computer readable memory

Info

Publication number
JP2001101338A
JP2001101338A JP27514499A JP27514499A JP2001101338A JP 2001101338 A JP2001101338 A JP 2001101338A JP 27514499 A JP27514499 A JP 27514499A JP 27514499 A JP27514499 A JP 27514499A JP 2001101338 A JP2001101338 A JP 2001101338A
Authority
JP
Japan
Prior art keywords
character
candidate character
image
character pattern
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP27514499A
Other languages
Japanese (ja)
Inventor
Junnosuke Kataoka
淳之介 片岡
Izuru Horiuchi
出 堀内
Nagakazu Honda
永和 本田
Makoto Kobayashi
誠 小林
Hiroshi Tanioka
宏 谷岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP27514499A priority Critical patent/JP2001101338A/en
Publication of JP2001101338A publication Critical patent/JP2001101338A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a picture processor and a picture processing method, which can efficiently execute a post-processing on a character recognition result, and to provide a computer readable memory. SOLUTION: A character recognition circuit 109 recognizes a character in an inputted original picture. A character code corresponding to the recognized character and plural candidate character codes corresponding to an indefinite character having plural recognition candidates are stored in a picture buffer memory 118. A character pattern corresponding to the character code and plural candidate character patterns corresponding to the plural candidate character code are generated in a image data coversion part 110. The character pattern and plural candidate character patterns are stored in the picture buffer memory 118. A content stored in the picture buffer memory is displayed. An operation part 116 designates the desired candidate character pattern from the plural displayed candidate character patterns. The designated candidate character pattern and the character pattern are outputted from a recording part 117.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、入力された原稿画
像中の文字を認識する画像処理装置及びその方法、コン
ピュータ可読メモリに関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing apparatus and method for recognizing characters in an input document image, and a computer-readable memory.

【0002】[0002]

【従来の技術】一般に、原稿画像中の文字を認識した情
報を基に記録紙に画像を記録する画像処理装置において
は、認識対象の原稿画像を読み取り、その読み取った原
稿画像中の所定領域画像を切り出して、所定領域画像の
文字認識を行う。
2. Description of the Related Art Generally, in an image processing apparatus for recording an image on a recording sheet based on information obtained by recognizing characters in a document image, a document image to be recognized is read, and a predetermined area image in the read document image is read. And character recognition of the predetermined area image is performed.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、所定領
域画像内の文字を認識できなかった場合、あるいは、同
レベルの認識候補が複数発生して認識結果を特定できな
いような場合、その所定領域画像内の文字画像に該当す
る画像を表示し、それに対する正式な文字コードをキー
ボード等で入力していた。この場合、特に、認識結果が
特定できない文字画像が多いと、1つ1つの文字画像に
対する正規な文字コードを入力するために、いくつもの
操作を行わねばならず、非常に面倒であった。また、操
作を軽減するために、専用の表示装置やキーボードを備
えると、装置が複雑になり、コストもかかってしまう。
However, if a character in a predetermined area image cannot be recognized, or if a plurality of recognition candidates at the same level are generated and the recognition result cannot be specified, the predetermined area image cannot be identified. Has been displayed, and a formal character code for the character image has been input using a keyboard or the like. In this case, especially when there are many character images for which the recognition result cannot be specified, a number of operations must be performed in order to input a proper character code for each character image, which is very troublesome. Further, if a dedicated display device or keyboard is provided to reduce the number of operations, the device becomes complicated and costs increase.

【0004】本発明は上記の問題点に鑑みてなされたも
のであり、文字認識結果に対する後処理を効率良く、か
つ低コストで実行することができる画像処理装置及びそ
の方法、コンピュータ可読メモリを提供することを目的
とする。
SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and provides an image processing apparatus, a method thereof, and a computer-readable memory capable of efficiently and at low cost performing post-processing on a character recognition result. The purpose is to do.

【0005】[0005]

【課題を解決するための手段】上記の目的を達成するた
めの本発明による画像処理装置は以下の構成を備える。
即ち、入力された原稿画像中の文字を認識する画像処理
装置であって、前記入力された原稿画像中の文字を認識
する認識手段と、前記認識手段で認識された認識文字に
対応する文字コードと、認識候補を複数有する不確定文
字に対応する複数の候補文字コードを記憶する第1メモ
リ手段と、前記文字コードに対応する文字パターンと、
前記複数の候補文字コードに対応する複数の候補文字パ
ターンを発生する発生手段と、前記文字パターンと前記
複数の候補文字パターンを記憶する第2メモリ手段と、
前記第2メモリ手段に記憶される内容を表示する表示手
段と、前記表示手段で表示される複数の候補文字パター
ンより所望の候補文字パターンを指定する指定手段と、
前記指定手段で指定された候補文字パターンと、前記文
字パターンを出力する出力手段とを備える。
An image processing apparatus according to the present invention for achieving the above object has the following arrangement.
That is, an image processing apparatus for recognizing characters in an input document image, a recognition unit for recognizing characters in the input document image, and a character code corresponding to the recognition character recognized by the recognition unit First memory means for storing a plurality of candidate character codes corresponding to uncertain characters having a plurality of recognition candidates, and a character pattern corresponding to the character code;
Generating means for generating a plurality of candidate character patterns corresponding to the plurality of candidate character codes; second memory means for storing the character pattern and the plurality of candidate character patterns;
Display means for displaying the contents stored in the second memory means; designation means for designating a desired candidate character pattern from a plurality of candidate character patterns displayed on the display means;
A candidate character pattern designated by the designation means; and an output means for outputting the character pattern.

【0006】また、好ましくは、前記表示手段は、前記
指定手段の指定に応じて、前記複数の候補文字パターン
の各候補文字パターンをその認識確率の高い順に表示す
る。
Preferably, the display means displays the candidate character patterns of the plurality of candidate character patterns in descending order of their recognition probabilities in accordance with the designation by the designation means.

【0007】また、好ましくは、前記表示手段は、前記
候補文字パターンを、該候補文字パターンであることを
示す所定画像を合成して表示する。
[0007] Preferably, the display means displays the candidate character pattern by synthesizing a predetermined image indicating the candidate character pattern.

【0008】また、好ましくは、前記所定画像は、前記
候補文字パターンの反転画像である。
Preferably, the predetermined image is an inverted image of the candidate character pattern.

【0009】また、好ましくは、前記所定画像は、網点
画像である。
Preferably, the predetermined image is a halftone image.

【0010】また、好ましくは、前記所定画像は、アン
ダーラインである。
Preferably, the predetermined image is an underline.

【0011】また、好ましくは、前記第1メモリ手段
は、更に、前記認識手段で認識不能な不明文字を示す所
定文字コードを記憶し、前記発生手段は、更に、前記所
定文字コードに対応する所定文字パターンを発生し、前
記第2メモリ手段は、前記所定文字パターンと前記不明
文字に対応する前記原画像中の部分画像を記憶する。
Preferably, the first memory means further stores a predetermined character code indicating an unknown character which cannot be recognized by the recognition means, and the generation means further includes a predetermined character code corresponding to the predetermined character code. A character pattern is generated, and the second memory means stores the predetermined character pattern and a partial image in the original image corresponding to the unknown character.

【0012】また、好ましくは、前記表示手段は、前記
不明文字の表示位置に前記所定文字パターンを表示し、
前記指定手段の指定に応じて、前記部分画像を表示す
る。
Preferably, the display means displays the predetermined character pattern at a display position of the unknown character,
The partial image is displayed according to the designation by the designation means.

【0013】また、好ましくは、前記出力手段は、更
に、前記指定手段の指定に応じて前記部分画像を出力す
る。
Preferably, the output means further outputs the partial image in accordance with the designation by the designation means.

【0014】また、好ましくは、前記表示手段は、前記
複数の候補文字パターンの内の注目候補文字パターンの
位置に基づいて決定される前記第2メモリ手段の所定領
域に含まれる文字パターン及び候補文字パターンを表示
する。
[0014] Preferably, the display means includes a character pattern and a candidate character included in a predetermined area of the second memory means, which are determined based on a position of a noticeable candidate character pattern among the plurality of candidate character patterns. Display a pattern.

【0015】また、好ましくは、前記指定手段は、少な
くとも第1キー、第2キー、第3キー、第4キー、確定
キーを有し、前記第1キーが押下された場合、前記表示
手段は、表示している候補文字パターンより後ろに位置
する候補文字パターンを表示し、前記第2キーが押下さ
れた場合、前記表示手段は、表示している候補文字パタ
ーンの前に位置する候補文字パターンを表示し、前記第
3キーが押下された場合、前記表示手段は、表示してい
る候補文字パターンの次の候補文字パターンを表示し、
前記第4キーが押下された場合、前記表示手段は、表示
している候補文字パターンの前の候補文字パターンを表
示し、前記確定キーが押下された場合、前記表示手段
は、表示対象となる各候補文字パターンを前記出力手段
の出力対象に確定する。
Preferably, the designation means has at least a first key, a second key, a third key, a fourth key, and an enter key, and when the first key is pressed, the display means is provided. Displaying the candidate character pattern located behind the displayed candidate character pattern, and when the second key is pressed, the display means displays the candidate character pattern located before the displayed candidate character pattern. Is displayed, and when the third key is pressed, the display means displays a candidate character pattern next to the displayed candidate character pattern,
When the fourth key is pressed, the display unit displays a candidate character pattern before the displayed candidate character pattern, and when the enter key is pressed, the display unit is a display target. Each candidate character pattern is determined as an output target of the output means.

【0016】また、好ましくは、前記指定手段は、更
に、前記表示手段で表示対象とする候補文字パターンの
数を指定可能とする。
[0016] Preferably, the designation means can further designate the number of candidate character patterns to be displayed on the display means.

【0017】上記の目的を達成するための本発明による
画像処理方法は以下の構成を備える。即ち、入力された
原稿画像中の文字を認識する画像処理方法であって、前
記入力された原稿画像中の文字を認識する認識工程と、
前記認識工程で認識された認識文字に対応する文字コー
ドと、認識候補を複数有する不確定文字に対応する複数
の候補文字コードを第1メモリに記憶する第1記憶工程
と、前記文字コードに対応する文字パターンと、前記複
数の候補文字コードに対応する複数の候補文字パターン
を発生する発生工程と、前記文字パターンと前記複数の
候補文字パターンを第2メモリに記憶する第2記憶工程
と、前記第2メモリに記憶される内容を表示する表示工
程と、前記表示工程で表示される複数の候補文字パター
ンより所望の候補文字パターンを指定する指定工程と、
前記指定工程で指定された候補文字パターンと、前記文
字パターンを出力する出力工程とを備える。
An image processing method according to the present invention for achieving the above object has the following arrangement. That is, an image processing method for recognizing characters in an input document image, a recognition step for recognizing characters in the input document image,
A first storage step of storing, in a first memory, a character code corresponding to the recognized character recognized in the recognition step and a plurality of candidate character codes corresponding to an uncertain character having a plurality of recognition candidates; Generating a plurality of candidate character patterns corresponding to the plurality of candidate character codes, a second storing step of storing the character pattern and the plurality of candidate character patterns in a second memory, A display step of displaying the content stored in the second memory; a designation step of designating a desired candidate character pattern from a plurality of candidate character patterns displayed in the display step;
A candidate character pattern designated in the designation step; and an output step of outputting the character pattern.

【0018】上記の目的を達成するための本発明による
コンピュータ可読メモリは以下の構成を備える。即ち、
入力された原稿画像中の文字を認識する画像処理のプロ
グラムコードが格納されたコンピュータ可読メモリであ
って、前記入力された原稿画像中の文字を認識する認識
工程のプログラムコードと、前記認識工程で認識された
認識文字に対応する文字コードと、認識候補を複数有す
る不確定文字に対応する複数の候補文字コードを第1メ
モリに記憶する第1記憶工程のプログラムコードと、前
記文字コードに対応する文字パターンと、前記複数の候
補文字コードに対応する複数の候補文字パターンを発生
する発生工程のプログラムコードと、前記文字パターン
と前記複数の候補文字パターンを第2メモリに記憶する
第2記憶工程のプログラムコードと、前記第2メモリに
記憶される内容を表示する表示工程のプログラムコード
と、前記表示工程で表示される複数の候補文字パターン
より所望の候補文字パターンを指定する指定工程のプロ
グラムコードと、前記指定工程で指定された候補文字パ
ターンと、前記文字パターンを出力する出力工程のプロ
グラムコードとを備える。
A computer readable memory according to the present invention for achieving the above object has the following configuration. That is,
A computer-readable memory storing a program code for image processing for recognizing characters in an input document image, wherein a program code for a recognition step for recognizing characters in the input document image; A character code corresponding to the recognized recognized character, a plurality of candidate character codes corresponding to an uncertain character having a plurality of recognition candidates in a first memory, a program code in a first storage step, and a code corresponding to the character code. A character pattern, a program code of a generating step of generating a plurality of candidate character patterns corresponding to the plurality of candidate character codes, and a second storage step of storing the character pattern and the plurality of candidate character patterns in a second memory. A program code, a program code of a display step of displaying contents stored in the second memory, and the display step A program code of a designation step of designating a desired candidate character pattern from a plurality of displayed candidate character patterns, a candidate character pattern designated in the designation step, and a program code of an output step of outputting the character pattern are provided. .

【0019】[0019]

【発明の実施の形態】以下、図面を参照して本発明の好
適な実施形態を詳細に説明する。 <実施形態1>図1は実施形態1の画像処理装置の機能
構成を示す図をである。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Preferred embodiments of the present invention will be described below in detail with reference to the drawings. <First Embodiment> FIG. 1 is a diagram showing a functional configuration of an image processing apparatus according to a first embodiment.

【0020】原稿1001は、画像読取部1002のレ
ンズ101よりイメージセンサ(CDD)102を通し
て画像信号となる。次に、この画像信号がA/Dコンバ
ータ103に入力されてA/D変換された後、画像処理
部1003に入力される。画像処理部1003では、入
力された画像信号に対しシェーディング補正回路104
でシェーディング補正を行った後、モード切替回路10
5へ入力する。
An original 1001 is converted into an image signal from a lens 101 of an image reading unit 1002 through an image sensor (CDD) 102. Next, the image signal is input to the A / D converter 103, A / D converted, and then input to the image processing unit 1003. The image processing unit 1003 applies a shading correction circuit 104 to the input image signal.
After the shading correction is performed, the mode switching circuit 10
Enter 5

【0021】モード切替回路105では、操作部116
による操作者の設定、つまり、文字認識複写モードであ
るか通常複写モードであるかに基づいて出力先を切り替
える。通常複写モードが設定された場合、光濃度変換回
路106で輝度データを記録濃度データに変換する。画
像編集部107では、CPU113内のRAM115に
記憶されている画像処理の設定内容に基づき、記録濃度
データに対し編集処理を行う。そして、その編集された
記録濃度データを画像記録部1004に出力する。
In the mode switching circuit 105, an operation unit 116
, The output destination is switched based on the character recognition copy mode or the normal copy mode. When the normal copy mode is set, the light density conversion circuit 106 converts the luminance data into recording density data. The image editing unit 107 performs an editing process on the recording density data based on the settings of the image processing stored in the RAM 115 in the CPU 113. Then, the edited recording density data is output to the image recording unit 1004.

【0022】画像記録部1004は、転写紙等の搬送を
行うモータ等の制御回路、画像処理部1003より入力
されたビデオ信号を感光ドラムに書き込むレーザ記録回
路部、及び現像を行う現像制御回路で構成される記録部
117を有し、記録部117によって記録紙等の記録媒
体上に画像を記録する。
An image recording unit 1004 includes a control circuit such as a motor for transporting transfer paper and the like, a laser recording circuit unit for writing a video signal input from the image processing unit 1003 to a photosensitive drum, and a development control circuit for performing development. The recording unit 117 is configured to record an image on a recording medium such as recording paper.

【0023】一方、モード切替回路105で、文字認識
複写モードが設定された場合、モード切替回路105の
出力先は画像認識部4000へと切り替えられる。画像
認識部4000では、画像バッファメモリ118を使っ
て、最初に、パターン認識部108でパターン認識を行
う。ここでは、認識不能文字の再入力用のパターン及び
複数候補の選択肢パターン、複数候補表示要求のマーキ
ング等のエリアを認識する。その後、文字認識回路10
9によって、入力された画像信号から1文字ずつのイメ
ージ(文字パターン)を切り出して文字認識を行う。
On the other hand, when the character recognition copy mode is set by the mode switching circuit 105, the output destination of the mode switching circuit 105 is switched to the image recognition unit 4000. In the image recognition unit 4000, first, the pattern recognition unit 108 performs pattern recognition using the image buffer memory 118. Here, an area such as a pattern for re-inputting an unrecognizable character, a plurality of option patterns, and a plurality of candidate display request markings is recognized. Then, the character recognition circuit 10
In step 9, an image (character pattern) of each character is cut out from the input image signal to perform character recognition.

【0024】文字認識回路109には、文字認識用の認
識辞書を内蔵している。文字認識回路109による認識
結果は、画像バッファメモリ118上の文字コード情報
記憶エリアに記憶すると共に、イメージデータ変換部1
10に渡される。イメージデータ変換部110では、認
識出力の文字コードを出力画像に変換し、画像バッファ
メモリ118上の画像情報記憶エリアに記憶する。ここ
で、認識不能文字についてはイメージ情報をそのまま記
憶し、複数候補がある文字については、複数の文字コー
ド情報を認識確率の高い順に記憶する。不確定文字の修
正作業時には、ポインタ画像生成部111によって修正
対象文字であることを示すポインタ画像をアドオンし
て、操作部116に備わる表示部に表示する。
The character recognition circuit 109 has a built-in recognition dictionary for character recognition. The recognition result by the character recognition circuit 109 is stored in a character code information storage area on the image buffer memory 118, and the image data conversion unit 1
Passed to 10. The image data conversion unit 110 converts the character code of the recognition output into an output image and stores it in the image information storage area on the image buffer memory 118. Here, for unrecognizable characters, the image information is stored as it is, and for characters having a plurality of candidates, a plurality of pieces of character code information are stored in the order of higher recognition probability. At the time of correcting an uncertain character, the pointer image generation unit 111 adds on a pointer image indicating that the character is a correction target character, and displays the pointer image on a display unit provided in the operation unit 116.

【0025】また、操作部116は、画像処理部100
3に対する画像編集内容、コピー枚数、変倍率等の画像
複写動作等を指示する各種キー群、各種LED群と、操
作時の内容を表示する表示部などを有している。
The operation unit 116 is connected to the image processing unit 100.
It has various key groups and various LED groups for instructing an image copy operation such as image editing contents, the number of copies, and a magnification ratio for 3 and a display unit for displaying the contents at the time of operation.

【0026】次に、実施形態1の画像処理装置のハード
ウェア構成について、図2を用いて説明する。
Next, a hardware configuration of the image processing apparatus according to the first embodiment will be described with reference to FIG.

【0027】図2は実施形態1の画像処理装置のハード
ウェア構成を示す断面図である。
FIG. 2 is a sectional view showing the hardware configuration of the image processing apparatus according to the first embodiment.

【0028】図2において、1は原稿給送手段となる原
稿給送装置であり、載置された原稿を1枚ずつ或いは2
枚連続に原稿台ガラス面2上の所定位置に給送する。4
はランプ3、走査ミラー5等で構成されるスキャナであ
り、原稿給送装置1により原稿台ガラス面2に載置され
る。そして、操作部116から例えば複写指示や文字認
識指示を与えると、スキャナ4が所定方向(図示の左右
方向)に走査して原稿反射光を走査ミラー5〜7を介し
てレンズ8を通過させ、イメージセンサ部9に結像させ
る。
In FIG. 2, reference numeral 1 denotes a document feeder serving as a document feeder, which feeds the placed documents one by one or two.
The sheet is fed to a predetermined position on the platen glass surface 2 continuously. 4
Reference numeral denotes a scanner including a lamp 3, a scanning mirror 5, and the like, which is placed on the platen glass surface 2 by the document feeder 1. When, for example, a copy instruction or a character recognition instruction is given from the operation unit 116, the scanner 4 scans in a predetermined direction (left and right directions in the drawing) to pass the original reflected light through the lens 8 via the scanning mirrors 5 to 7. An image is formed on the image sensor unit 9.

【0029】100は、図1に示した各種回路を搭載し
た制御部である。10は露光部であり、制御部100内
の画像編集部107からの画像データに基づいて画像信
号を発生する画像信号制御部(不図示)より画像信号を
受け、その画像信号に応じた光ビームを感光体11に照
射する。12、13は現像器であり、感光体11に形成
された静電潜像を所定色の現像剤(トナー)で可視化す
る。14、15は被転写紙積載部であり、定形サイズの
記録媒体を積載収納する。記録媒体は、給送ローラの駆
動によりレジストローラ配設位置まで給送され、感光体
11に形成される画像との画像先端合わせタイミングを
とられた状態で再給紙される。
Reference numeral 100 denotes a control unit on which the various circuits shown in FIG. 1 are mounted. Reference numeral 10 denotes an exposure unit that receives an image signal from an image signal control unit (not shown) that generates an image signal based on image data from the image editing unit 107 in the control unit 100, and a light beam corresponding to the image signal. Is irradiated on the photoconductor 11. Developing devices 12 and 13 visualize the electrostatic latent image formed on the photoreceptor 11 with a developer (toner) of a predetermined color. Reference numerals 14 and 15 denote transfer paper stacking units, which stack and store recording media of a fixed size. The recording medium is fed to the position where the registration roller is provided by driving the feeding roller, and is re-fed with the timing of aligning the leading edge of the image with the image formed on the photoconductor 11.

【0030】16は転写分離帯電器であり、感光体11
に現像されたトナー像を記録媒体に転写した後、感光体
11より分離して搬送ベルトを介して定着部17で定着
させる。18は排紙ローラであり、画像形成が終了した
記録媒体をトレー20に積載排紙する。19は方向フラ
ッパであり、画像形成の終了した被転写紙の搬送方向を
排紙口と内部搬送方向に切り替え、多重/両面画像形成
プロセスに備える。
Reference numeral 16 denotes a transfer separation charger, which is a photosensitive member 11
After the toner image developed on the recording medium is transferred to the recording medium, the toner image is separated from the photoreceptor 11 and fixed by the fixing unit 17 via the transport belt. Reference numeral 18 denotes a paper discharge roller, which stacks and discharges the recording medium on which the image formation has been completed on the tray 20. Reference numeral 19 denotes a directional flapper, which switches the transport direction of the transfer-receiving sheet on which the image formation has been completed between the paper discharge port and the internal transport direction, and prepares for the multiplex / double-side image forming process.

【0031】次に、実施形態1の操作部116の外観に
ついて、図3を用いて説明する。
Next, the appearance of the operation unit 116 according to the first embodiment will be described with reference to FIG.

【0032】図3は実施形態1の操作部の外観を示す図
である。
FIG. 3 is a view showing the appearance of the operation unit according to the first embodiment.

【0033】5001は装置本体への通電を制御する電
源スイッチである。5002はリセットキーであり、ス
タンバイ中は、標準モードに復帰させるキーとして動作
する。5003はコピースタートキーである。5004
はクリアキーであり、複写枚数等の数値をクリアすると
きに使用する。
Reference numeral 5001 denotes a power switch for controlling power supply to the apparatus main body. A reset key 5002 operates as a key for returning to the standard mode during standby. Reference numeral 5003 denotes a copy start key. 5004
Is a clear key used to clear numerical values such as the number of copies.

【0034】5005はIDキーであり、このIDキー
5005により特定の操作者に対して複写動作を可能に
し、特定の操作者以外の操作者に対しては、IDキー5
005によりIDを入力しない限り複写動作を禁止する
ことが可能となる。5006はストップキーであり、コ
ピーを中断したり、中止したりするときに用いるキーで
ある。5007はガイドキーであり、各機能を知りたい
ときに使用するキーである。
Reference numeral 5005 denotes an ID key. The ID key 5005 enables a specific operator to perform a copying operation.
005 makes it possible to prohibit a copying operation unless an ID is input. A stop key 5006 is used to interrupt or stop copying. Reference numeral 5007 denotes a guide key, which is used when the user wants to know each function.

【0035】5008は上カーソルキーであり、各機能
設定画面においてポインタを上に移動させるキーであ
る。5009は下カーソルキーであり、各機能設定画面
においてポインタを下に移動させるキーである。501
0は右カーソルキーであり、各機能設定画面においてポ
インタを右に移動させるキーである。5011は左カー
ソルキーであり、各機能設定画面においてポインタを左
に移動させるキーである。5012はOKキーであり、
各機能設定画面において、処理の確定を指示するキーで
ある。
An upper cursor key 5008 is a key for moving the pointer upward on each function setting screen. Reference numeral 5009 denotes a down cursor key which is used to move a pointer downward on each function setting screen. 501
A right cursor key 0 is a key for moving the pointer to the right on each function setting screen. A left cursor key 5011 is a key for moving the pointer to the left on each function setting screen. 5012 is an OK key,
This key is used to instruct the finalization of processing in each function setting screen.

【0036】また、実施形態1では、特に、5008〜
5012のキーに特定の動作を割り当ており、5008
は不確定文字の修正確定画面において複数の候補文字の
内の1つを表示させる際に上位の確定文字を表示させる
キーである。5009は不確定文字の修正確定画面にお
いて複数の候補文字の内の1つを表示させる際に下位の
確定文字を表示させるキーである。5010は不確定文
字の修正確定画面において修正対象となる文字のポイン
タを横書き原稿の場合は右下方向の次の文字へ移動さ
せ、縦書き原稿の場合は右上方向の前の文字へ移動さ
せ、その文字を表示させるキーである。5011は不確
定文字の修正確定画面において修正対象となる文字のポ
インタを横書き原稿の場合は左上方向の前の文字へ移動
させ、縦書き原稿の場合は左下方向の次の文字へ移動さ
せ、その文字を表示させるキーである。5012は不確
定文字の修正確定画面において修正対象となる文字を現
在表示している文字で確定させるOKキーである。
In the first embodiment, in particular,
A specific action is assigned to the key of the key 5012,
Is a key for displaying a higher-order confirmed character when one of a plurality of candidate characters is displayed on a correction / decision screen for an undefined character. Reference numeral 5009 denotes a key for displaying a lower-order confirmed character when displaying one of the plurality of candidate characters on the correction and confirmation screen for an uncertain character. 5010 moves the pointer of the character to be corrected on the correction confirmation screen of the uncertain character to the next character in the lower right direction in the case of the horizontal writing document, and to the previous character in the upper right direction in the case of the vertical writing document, This key is used to display that character. 5011 moves the pointer of the character to be corrected on the correction confirmation screen for uncertain characters to the previous character in the upper left direction in the case of a horizontal writing document, and to the next character in the lower left direction in the case of a vertical writing document. This key is used to display characters. Reference numeral 5012 denotes an OK key for confirming the character to be corrected on the correction confirmation screen for the unconfirmed character with the currently displayed character.

【0037】5013は指示キーであり、各機能設定画
面において画面5052の右下に出力された画像の内容
の実行を指示するキーである。5014は定形縮小キー
であり、定形サイズを他の定形サイズに縮小するときに
使用する。5015は等倍コピーキーであり、等倍コピ
ーを選択するときに使用する。5016は定形拡大キー
であり、定形サイズを他の定形サイズに拡大するときに
使用する。5017はカセット選択キーであり、コピー
するカセット段を選択するときに使用する。
An instruction key 5013 is a key for instructing execution of the contents of the image output to the lower right of the screen 5052 in each function setting screen. A standard size reduction key 5014 is used to reduce the standard size to another standard size. Reference numeral 5015 denotes a 1: 1 copy key, which is used to select 1: 1 copy. A standard enlargement key 5016 is used to enlarge the standard size to another standard size. A cassette selection key 5017 is used to select a cassette stage to be copied.

【0038】5018はコピー濃度調整キーであり、コ
ピー濃度を薄くするときに使用する。5019はAEキ
ーであり、原稿の濃度に対しコピー濃度を自動的に調整
するときに使用する。5020はコピー濃度調整キーで
あり、コピー濃度を濃くする。5021はソータの動作
を指定するキーである。5022は予熱キーであり、予
熱モードのON/OFFに使用する。5023は割り込
みキーであり、コピー中に割り込みしてコピーを行いた
いときに使用する。5024はテンキーであり、数値の
入力を行うときに使用する。
Reference numeral 5018 denotes a copy density adjustment key which is used to reduce the copy density. An AE key 5019 is used to automatically adjust the copy density with respect to the original density. A copy density adjustment key 5020 increases the copy density. 5021 is a key for specifying the operation of the sorter. Reference numeral 5022 denotes a preheating key, which is used to turn on / off a preheating mode. Reference numeral 5023 denotes an interrupt key, which is used when an interrupt is required to be performed during copying. Reference numeral 5024 denotes a numeric keypad, which is used to input numerical values.

【0039】5025はマーカー処理キーであり、トリ
ミング,マスキング,部分処理(輪郭処理,網処理,影
付け処理,ネガポジ処理)を設定する。5026はパタ
ーン可処理キーであり、色をパターン化して表現した
り、色を濃度差で表現したりするときに使用する。50
27は色消去キーであり、特定色を消去したいときに使
用する。5028は画質キーであり、画質の設定を行い
たいときに使用する。5029はネガポジキーであり、
ネガポジ処理を行うときに使用する。5030はイメー
ジクリエイトキーであり、輪郭処理,影付け処理,網処
理,斜体,ミラー処理,リピート処理を行うときに使用
する。
Reference numeral 5025 denotes a marker processing key for setting trimming, masking, and partial processing (contour processing, halftone processing, shadowing processing, negative / positive processing). Reference numeral 5026 denotes a pattern processable key which is used to express a color in a pattern or to express a color by a density difference. 50
A color erasing key 27 is used to erase a specific color. An image quality key 5028 is used to set the image quality. 5029 is a negative / positive key,
Used when performing negative / positive processing. Reference numeral 5030 denotes an image create key which is used when performing contour processing, shadowing processing, halftone processing, italic, mirror processing, and repeat processing.

【0040】5031はトリミングキーであり、エリア
を指定し、トリミングをするときに使用する。5032
はマスキングキーであり、エリアを指定し、マスキング
を行うときに使用する。5033は部分処理キーであ
り、エリアを指定し、その後、部分処理(輪郭処理,網
処理,影付け処理,ネガポジ処理)を行うときに使用す
る。5034は枠消しキーであり、モードに合わせて枠
消しを行うときに使用する。モードには、シート枠消し
(シートサイズに対して枠を作成する)、原稿枠消し
(原稿サイズに合わせて枠を作成する。原稿サイズ指定
有り)、ブック枠消し(ブックの見開きサイズに合わせ
て枠と中央に空白を作成する。ブック見開きサイズ指定
有り)がある。5035は綴じ代キーであり、用紙の一
端に綴じ代を作成したいときに使用する。
Reference numeral 5031 denotes a trimming key used to designate an area and perform trimming. 5032
A masking key is used to designate an area and perform masking. Reference numeral 5033 denotes a partial processing key, which is used to designate an area and then perform partial processing (contour processing, halftone processing, shadowing processing, negative / positive processing). Reference numeral 5034 denotes a frame erasing key, which is used when erasing a frame in accordance with a mode. The modes include sheet frame erasing (creating a frame for the sheet size), document frame erasing (creating a frame in accordance with the document size. Document size is specified), and book frame erasing (according to the spread size of the book). Create a blank in the frame and center. Book spread size specified). A binding margin key 5035 is used to create a binding margin at one end of a sheet.

【0041】5036は所望とする領域の画像を移動さ
せる移動キーであり、移動を行いたいときに使用する。
移動には、平行移動(上下左右),センター移動,コー
ナー移動,指定移動(ポイント指定)がある。5037
はズームキーであり、複写倍率を25%〜400%ま
で、1%刻みで設定できる。また、主走査,副走査を独
立に設定できる。尚、画像の変倍は、原稿の副走査方向
に関しては、スキャナ4の移動速度を制御することで行
ない、原稿の主走査方向に関しては、スキャナ4より読
出した画像データの間引き、あるいは補間処理で行う。
Reference numeral 5036 denotes a move key for moving an image in a desired area, which is used when moving is desired.
The movement includes parallel movement (up, down, left and right), center movement, corner movement, and designated movement (point designation). 5037
Is a zoom key, which can set a copy magnification from 25% to 400% in increments of 1%. Further, the main scanning and the sub-scanning can be set independently. The magnification of the image is controlled by controlling the moving speed of the scanner 4 in the sub-scanning direction of the document, and by thinning out or interpolating the image data read from the scanner 4 in the main scanning direction of the document. Do.

【0042】5038はオート変倍キーであり、複写紙
のサイズに合わせて自動的に拡大縮小する。また、主走
査,副走査を独立にオート変倍できる。5039は拡大
連写キーであり、1枚の原稿を複数枚に拡大して複写を
行うときに使用する。5040は縮小レイアウトキーで
あり、複数の原稿を1枚に拡大縮小して複写を行うとき
に使用する。5043は連写キーであり、原稿台ガラス
面の複写領域を左右に2分割し、自動的に2枚のコピー
をする連続複写(ページ連写,両面連写)を行いたいと
きに使用する。5044は両面キーであり、両面(片面
両面,ページ連写両面,両面両面)の出力を行いたいと
きに使用する。
Reference numeral 5038 denotes an automatic scaling key, which automatically enlarges or reduces the size according to the size of the copy sheet. In addition, the main scanning and the sub-scanning can be automatically scaled independently. Reference numeral 5039 denotes an enlargement continuous shooting key, which is used when one original is enlarged to a plurality of copies and copied. Reference numeral 5040 denotes a reduced layout key, which is used when copying a plurality of originals by enlarging / reducing them. Reference numeral 5043 denotes a continuous shooting key which is used to divide a copy area on the glass surface of the original platen into two right and left sides and perform continuous copying (page continuous shooting, double-side continuous shooting) for automatically making two copies. Reference numeral 5044 denotes a double-sided key which is used to output both sides (single-sided double-sided, page continuous double-sided, double-sided double-sided).

【0043】5045は多重キーであり、多重(多重,
ページ連写多重)を行いたいときに使用する。5046
はメモリキーであり、メモリを使用したモード(メモリ
合成,エリア合成,すかし合成)を行いたいときに使用
する。5047はプロジェクタキーであり、プロジェク
タを使用するときに使用する。5048はプリンタキー
であり、プリンタ時の設定を行うときに使用する。50
50は、原稿混載キーであり、フィーダを使用してコピ
ーを取るとき原稿サイズが混載しているときに使用す
る。5051はモードメモリキーであり、複写設定され
た複写モードを登録するため、登録された複写モードを
呼び出すときに使用する。
Reference numeral 5045 denotes a multiplex key.
Use when you want to perform (page continuous multiplexing). 5046
Is a memory key, which is used to perform a mode using a memory (memory synthesis, area synthesis, watermark synthesis). A projector key 5047 is used when using the projector. Reference numeral 5048 denotes a printer key, which is used when setting for a printer. 50
Reference numeral 50 denotes a mixed original key, which is used when originals are mixed when taking a copy using a feeder. Reference numeral 5051 denotes a mode memory key, which is used for registering the copy mode set for copy, when calling the registered copy mode.

【0044】5052はタッチパネル付きの液晶表示器
であり、装置の状態,複写枚数,複写倍率,複写用紙サ
イズを表示し、文字認識複写モードあるいは通常複写モ
ードのモード設定及び設定された複写モードの内容を表
示する。また、文字認識複写モード設定時の不確定文字
の修正作業中では、修正対象文字及び周辺の複数の文字
を表示する。5053は複写モードか画像処理設定モー
ドかの切り換えを行うキーである。
Reference numeral 5052 denotes a liquid crystal display with a touch panel, which displays the status of the apparatus, the number of copies, the copy magnification, and the copy paper size, and sets the character recognition copy mode or the normal copy mode and the contents of the set copy mode. Is displayed. Further, during the operation of correcting the uncertain character when the character recognition copy mode is set, the correction target character and a plurality of surrounding characters are displayed. Reference numeral 5053 denotes a key for switching between a copy mode and an image processing setting mode.

【0045】次に、原稿画像の文字認識を行う場合の画
像認識部4000の処理フローについて、図4を用いて
説明する。
Next, a processing flow of the image recognizing unit 4000 when character recognition of a document image is performed will be described with reference to FIG.

【0046】図4は実施形態1の画像認識部の処理フロ
ーを示すフローチャートである。
FIG. 4 is a flowchart showing the processing flow of the image recognition unit of the first embodiment.

【0047】まず、文字認識回路109において文字認
識を行う(ステップS5001)。尚、文字認識回路1
09の処理の詳細については、後述する。次に、文字が
確定したか否かを判定する(ステップS5002)。確
定した場合(ステップS5002でYES)、その文字
の文字コードを(画像バッファメモリ118内に設けら
れている)文字コード情報記憶エリアに記憶する(ステ
ップS5003)。次に、その文字コードに対応するイ
メージデータをイメージデータ変換部110で生成する
(ステップS5004)。次に、それを(画像バッファ
メモリ118内に設けられている)画像情報記憶エリア
に記憶する(ステップS5005)。
First, character recognition is performed in the character recognition circuit 109 (step S5001). Note that the character recognition circuit 1
The details of the process 09 are described later. Next, it is determined whether or not the character is determined (step S5002). If determined (YES in step S5002), the character code of the character is stored in the character code information storage area (provided in the image buffer memory 118) (step S5003). Next, the image data conversion unit 110 generates image data corresponding to the character code (step S5004). Next, it is stored in the image information storage area (provided in the image buffer memory 118) (step S5005).

【0048】一方、文字が確定しない場合(ステップS
5002でNO)、ステップS5006に進む。複数の
候補文字が存在する場合(ステップS5006でYE
S)、複数の候補文字の文字コードを(画像バッファメ
モリ118内に設けられている)文字コード情報記憶エ
リアに記憶する(ステップS5007)。次に、複数の
候補文字の第一候補文字の文字コードに対応するイメー
ジデータをイメージデータ変換部110で生成する。ま
た、その文字が修正対象文字(不確定文字)であること
を示すポインタ画像をポインタ画像生成部111で生成
する(ステップS5008)。次に、そのイメージデー
タとポインタ画像を(画像バッファメモリ118内に設
けられている)画像情報記憶エリアに記憶する(ステッ
プS5009)。
On the other hand, if the character is not fixed (step S
(NO in 5002), the process proceeds to step S5006. When a plurality of candidate characters exist (YE in step S5006)
S), the character codes of the plurality of candidate characters are stored in the character code information storage area (provided in the image buffer memory 118) (step S5007). Next, the image data conversion unit 110 generates image data corresponding to the character code of the first candidate character of the plurality of candidate characters. The pointer image generation unit 111 generates a pointer image indicating that the character is a correction target character (undefined character) (step S5008). Next, the image data and the pointer image are stored in the image information storage area (provided in the image buffer memory 118) (step S5009).

【0049】一方、候補文字がない場合(ステップS5
006でNO)、不明文字であることを示す文字(例え
ば、?マーク)の文字コードを(画像バッファメモリ1
18内に設けられている)文字コード情報記憶エリアに
記憶する(ステップS5010)。次に、その不明文字
に対応する範囲の読み取りイメージデータを(画像バッ
ファメモリ118内に設けられている)画像情報記憶エ
リアに記憶する(ステップS5011)。
On the other hand, when there is no candidate character (step S5)
006), the character code of a character (for example,?
18 is provided in the character code information storage area (step S5010). Next, the read image data in the range corresponding to the unknown character is stored in the image information storage area (provided in the image buffer memory 118) (step S5011).

【0050】以上の処理を文字数分繰り返して、1ペー
ジ分の文字コードデータ及び出力画像データが生成さ
れ、次に不確定文字の修正処理に移行する。
The above process is repeated for the number of characters to generate one page of character code data and output image data, and then the process proceeds to the process of correcting an uncertain character.

【0051】次に、文字認識回路109の詳細な処理フ
ローについて、図5を用いて説明する。
Next, a detailed processing flow of the character recognition circuit 109 will be described with reference to FIG.

【0052】図5は実施形態1の文字認識回路の詳細な
処理フローを示すフローチャートである。 尚、実施形
態1では、認識対象として入力される画像は、縦書きの
文書画像であるとする。また、認識対象の文章が横書き
の場合には、以下に説明する「文字幅」を「文字高さ」
と読み替えて処理すれば良い。
FIG. 5 is a flowchart showing a detailed processing flow of the character recognition circuit according to the first embodiment. In the first embodiment, it is assumed that the image input as a recognition target is a vertically written document image. When the text to be recognized is written horizontally, the “character width” described below is changed to “character height”.
What is necessary is just to read and process.

【0053】まず、入力画像から垂直方向のイメージの
有無(例えば、ヒストグラム)によって、入力画像の文
字方向を判定し、その行幅hを求める(ステップS40
02)。次に、求めた行毎に水平方向のイメージの有無
(ヒストグラム)によって、文字パターンを切り出して
いき、各文字パターンの文字幅W(i)及び位置座標X
(i)を記憶する(ステップS4003)。ここで、切
り出された文字パターンの文字幅W(i)が h−Δa≦W(i)≦h+Δa…(1) (但し、Δa:行幅hからの許容範囲値,i:文字パタ
ーン番号)を満たす文字パターンを抽出し、それらの平
均をとることにより標準文字幅Wを求める(ステップS
4004)。
First, the character direction of the input image is determined based on the presence or absence of an image in the vertical direction (for example, a histogram) from the input image, and the line width h thereof is obtained (step S40).
02). Next, character patterns are cut out according to the presence / absence of a horizontal image (histogram) for each of the obtained lines, and the character width W (i) and position coordinates X of each character pattern are extracted.
(I) is stored (step S4003). Here, the character width W (i) of the cut-out character pattern is h-Δa ≦ W (i) ≦ h + Δa (1) (where, Δa: allowable range value from line width h, i: character pattern number) Are extracted, and the standard character width W is obtained by averaging them (step S).
4004).

【0054】次に、その求めた標準文字幅Wと切り出さ
れた各文字パターンの文字幅W(i)とを比較する。文
字幅W(i)が標準文字幅Wよりも著しく大きい場合、
すなわち、 W+Δb<W(i)…(2) (但し、Δb:標準文字幅からの許容範囲)を満たす文
字パターンを探す(ステップS4005)。
Next, the obtained standard character width W is compared with the character width W (i) of each cut character pattern. If the character width W (i) is significantly larger than the standard character width W,
That is, a character pattern that satisfies W + Δb <W (i) (2) (where Δb is an allowable range from the standard character width) is searched for (step S4005).

【0055】注目文字パターンの文字幅W(i)が上記
(2)式を満たさない場合(ステップS4005でN
O)、ステップS4009に進む。一方、注目文字パタ
ーンの文字幅W(i)が上記(2)式を満たす場合(ス
テップS4005でYES)、その注目文字パターンよ
り前後に標準文字幅Wを持つ文字パターンまで、すなわ
ち、この条件を満たす文字パターンを含み、かつ、これ
に最も近い場所の標準文字幅Wを持つ文字パターンに挟
まれた間の文字パターンについて水平方向に射影をと
り、ヒストグラムを作成する(ステップS4006)。
When the character width W (i) of the target character pattern does not satisfy the above expression (2) (N in step S4005)
O), and proceed to step S4009. On the other hand, when the character width W (i) of the target character pattern satisfies the above expression (2) (YES in step S4005), up to the character pattern having the standard character width W before and after the target character pattern, A character pattern that includes the character pattern to be satisfied and that is located between the character patterns having the standard character width W closest thereto is projected in the horizontal direction to create a histogram (step S4006).

【0056】横軸の位置をx、縦軸のドット数をyと
し、値yに対して所定のしきい値zを設けて、文字パタ
ーン番号iの最も小さなものの位置を基準に(x=
0)、標準文字幅W付近で、かつしきい値zより小さな
値xを求める(ステップS4007)。
The position of the horizontal axis is x, the number of dots on the vertical axis is y, a predetermined threshold value z is provided for the value y, and (x =
0), a value x near the standard character width W and smaller than the threshold value z is obtained (step S4007).

【0057】ここで射影をとった長さをLとすると、x
を求める途中がほば標準文字幅Wで切れて、かつ、最後
の切れ幅がほぼ標準文字幅Wである場合(ステップS4
007でYES)、求めたxにおいて新たに文字切り処
理を実行する(ステップS4008)。一方、xを求め
る途中がほぼ標準文字幅W付近で切れ目が見つからなか
った場合や、最後まで切れたとしても、最後の文字パタ
ーンの文字幅が著しく標準文字幅Wに満たない場合(ス
テップS4007でNO)、ステップS4009に進
む。
If the length of the projection is L, x
In the process of obtaining is approximately the standard character width W, and the last width is almost the standard character width W (step S4).
(YES in 007), a new character segmentation process is performed at the obtained x (step S4008). On the other hand, when a break is not found in the vicinity of the standard character width W in the middle of obtaining x, or when the character width of the last character pattern is significantly less than the standard character width W even if it is cut to the end (step S4007) NO), and proceed to step S4009.

【0058】最後に、切り出された文字パターンについ
て、文字認識処理を実行し、文字パターンに対応する文
字コードを生成する(ステップS4009)。
Finally, a character recognition process is performed on the extracted character pattern to generate a character code corresponding to the character pattern (step S4009).

【0059】次に、不確定文字の修正処理について、そ
の処理フロー及び具体例について、図6、図7〜図9を
用いて説明する。
Next, a processing flow and a specific example of the correction processing of the uncertain character will be described with reference to FIGS. 6, 7 to 9.

【0060】図6は実施形態1の不確定文字の修正処理
の処理フローを示すフローチャートであり、図7〜図9
は実施形態1の文字コードデータ及び出力画像データと
不確定文字の修正作業の際の表示部の遷移を示す図であ
る。
FIG. 6 is a flowchart showing the processing flow of the correction processing of the uncertain character according to the first embodiment.
FIG. 8 is a diagram showing transition of the display unit at the time of correcting the character code data, the output image data, and the uncertain character according to the first embodiment.

【0061】図7の800は読み取りと文字認識終了
後、生成された文字コードデータ及び出力画像データを
示す図であり、画像バッファメモリ118の文字コード
情報記憶エリアには文字コードで記憶される。また、図
8の801は不確定文字に対する複数の候補文字の文字
コードを示す図であり、画像バッファメモリ118の文
字コード情報記憶エリアにはそれぞれの文字コードで記
憶される。また、画像バッファメモリ118の画像情報
記憶エリアには、各文字コードをイメージデータに展開
して記憶し、不確定文字に対する複数の文字コードに対
しては不確定であることを示すポインタ画像と共に第一
候補文字の文字コードをイメージデータに展開して記憶
する。
FIG. 7 shows the character code data and output image data generated after reading and character recognition are completed. The character code data is stored in the character code information storage area of the image buffer memory 118. 801 of FIG. 8 is a diagram showing the character codes of a plurality of candidate characters for the uncertain character, and the character codes are stored in the character code information storage area of the image buffer memory 118. Further, in the image information storage area of the image buffer memory 118, each character code is developed into image data and stored, and a plurality of character codes corresponding to an undefined character are stored together with a pointer image indicating that the character code is undefined. The character code of one candidate character is developed into image data and stored.

【0062】不確定文字の修正作業を開始すると、ま
ず、図3の表示部5052に、座標に従った順番で最初
の不確定文字を中心にn×m(例えば、3×3とする)
文字を表示する(ステップS6001)。この時、不確
定文字を示すポインタ画像も重畳して表示する(ステッ
プS6002)。ここで、ポインタ画像とは文字の背景
をグレーにしたり、文字の白黒を反転して表示したり、
網点画像やアンダーラインを追加したり、またはそれら
の表示を点滅させたり、ユーザに対し不確定文字である
ことを報知するものである(図9の802)。
When the uncertain character correction operation is started, first, n × m (for example, 3 × 3) is displayed on the display unit 5052 in FIG.
Characters are displayed (step S6001). At this time, a pointer image indicating an undefined character is also displayed in a superimposed manner (step S6002). Here, the pointer image may be a gray background for the text, a black and white display of the text,
A halftone dot image or underline is added, or the display thereof is blinked, or the user is notified that the character is an uncertain character (802 in FIG. 9).

【0063】操作者は表示部5052の表示内容を確認
し、その表示内容に応じてキー操作を行う(ステップS
6003)。ここでは、第一候補の「痛」の文字が間違
いであると判断し↓キー(5009)を押す(ステップ
S6003)。それを受けて、現在の修正対象文字
「痛」を次の候補文字「病」に変更する(図9の80
3)。すなわち、文字コード情報記憶エリアの複数の候
補文字に対するポインタ画像を1つ移動すると共に(ス
テップS6011)、その文字コードをイメージデータ
に展開し表示を入れ替える(ステップS6009)。こ
の時、不確定文字を示すポインタ画像も同様に重畳して
表示する(ステップS6010)。
The operator checks the display contents of the display section 5052 and performs a key operation according to the display contents (step S).
6003). Here, it is determined that the first candidate “pain” is incorrect, and the ↓ key (5009) is pressed (step S6003). In response, the current correction target character “pain” is changed to the next candidate character “disease” (80 in FIG. 9).
3). That is, the pointer image for the plurality of candidate characters in the character code information storage area is moved by one (step S6011), and the character code is developed into image data and the display is switched (step S6009). At this time, the pointer image indicating the uncertain character is also displayed in a superimposed manner (step S6010).

【0064】次に、操作者は表示部5052の表示内容
を確認し、第二候補の「病」の文字が間違いであると判
断し↓キー(5010)を押す(ステップS600
3)。それを受けて、現在の修正対象文字「病」を次の
候補文字「療」に変更する(図9の804)。すなわ
ち、文字コード情報記憶エリア内の複数の候補文字に対
するポインタ画像を1つ移動すると共に(ステップS6
011)、その文字コードをイメージデータに展開し表
示を入れ替える(ステップS6009)。この時、不確
定文字を示すポインタ画像も同様に重畳して表示する
(ステップS6010)。
Next, the operator checks the display content of the display section 5052, judges that the character of the second candidate "disease" is incorrect, and presses the ↓ key (5010) (step S600).
3). In response, the current correction target character "disease" is changed to the next candidate character "saku" (804 in FIG. 9). That is, the pointer image for the plurality of candidate characters in the character code information storage area is moved by one (step S6).
011), the character code is developed into image data and the display is switched (step S6009). At this time, the pointer image indicating the uncertain character is also displayed in a superimposed manner (step S6010).

【0065】次に、操作者は表示部5052の表示内容
を確認し、第三候補の「療」の文字が正しいと判断し←
キー(5011)を押す。それを受けて、現在の修正対
象文字「療」を仮に確定する(ステップS6004)。
修正対象文字「療」をイメージデータに変換し、画像情
報記憶エリアに記憶する(ステップS6005)。次
に、座標に沿った順番で次の不確定文字である「障」の
第一候補文字「障」をイメージデータに変換し、そこを
中心にn×m(ここでは3×3)文字を表示する(ステ
ップS6006、図9の805)。この時、不確定文字
を示すポインタ画像も重畳して表示する(ステップS6
007)。
Next, the operator checks the display content of the display unit 5052, and judges that the character of the third candidate “Mr.” is correct.
Press the key (5011). In response thereto, the current correction target character “Sai” is provisionally determined (step S6004).
The correction target character “Sai” is converted into image data and stored in the image information storage area (step S6005). Next, in the order along the coordinates, the first candidate character of the next uncertain character, “Shi”, is converted into image data, and n × m (here, 3 × 3) characters are converted to the image data. It is displayed (step S6006, 805 in FIG. 9). At this time, a pointer image indicating an undefined character is also displayed in a superimposed manner (step S6).
007).

【0066】以下、同様に1文字ずつ修正と仮確定を繰
り返し(図9の806〜810)、操作者がOKキー
(5012)を押したら1ページ全体に渡って最終的に
確定とする(ステップS6014)。尚、OKキー(5
012)を押すまでは、修正対象文字を前に戻して、仮
に確定した候補文字を再び変更することが可能である
(ステップS6008〜ステップS6012)。
Hereinafter, similarly, the correction and provisional determination are repeated one character at a time (806 to 810 in FIG. 9), and when the operator presses the OK key (5012), the final determination is made over the entire page (step). S6014). Note that the OK key (5
Until (012) is pressed, the correction target character can be returned to the previous position and the provisionally determined candidate character can be changed again (steps S6008 to S6012).

【0067】そして、1ページ全体に渡って全ての文字
を確定した後、画像記録部117にてプリントアウトす
る。
After all characters are determined over the entire page, the image is printed out by the image recording unit 117.

【0068】以上、文字認識後、不確定文字の候補文字
が複数個ある場合の不確定文字の修正処理について説明
したが、不確定文字の候補文字が全くない場合の不明文
字の修正処理について、図4を用いて以下に説明する。
As described above, the process of correcting an uncertain character when there are a plurality of candidate characters for an uncertain character after character recognition has been described. This will be described below with reference to FIG.

【0069】候補文字が全く無かった場合、不明文字で
あることを示す文字(例えば、?マーク)の文字コード
を(画像バッファメモリ118内に設けられている)文
字コード情報記憶エリアに記憶する(ステップS501
0)。次に、不明文字に対応する範囲の読み取りイメー
ジデータを(画像バッファメモリ118内に設けられて
いる)画像情報記憶エリアに記憶する(ステップS50
11)。
If there is no candidate character, the character code of a character (for example,? Mark) indicating that the character is unknown is stored in the character code information storage area (provided in the image buffer memory 118) ( Step S501
0). Next, the read image data in the range corresponding to the unknown character is stored in the image information storage area (provided in the image buffer memory 118) (step S50).
11).

【0070】そして、更に不明文字の前後の文字から文
脈や単語を推定し、確率的に高いと思われる文字を複数
個候補文字として、文字コード情報記憶エリアにその文
字コードを記憶する。不明文字の修正処理としては、図
6で説明したものと同様である。但し、この場合、ポイ
ンタ画像の代りに、不明文字あることを示す文字を表示
する。また、候補文字の最後に不明文字に対応する範囲
の読み取りイメージデータをそのまま選択するオプショ
ンを設け(図8の801の各候補文字列の最後の文
字)、推定した候補文字が全て該当しなかった場合は、
読み取りイメージデータをそのまま出力画像データとし
て確定する。
Then, the context and the word are further estimated from the characters before and after the unknown character, and a plurality of characters considered to have a high probability are set as candidate characters, and the character codes are stored in the character code information storage area. The process of correcting an unknown character is the same as that described with reference to FIG. However, in this case, a character indicating that there is an unknown character is displayed instead of the pointer image. At the end of the candidate character, an option is provided for directly selecting the read image data in the range corresponding to the unknown character (the last character of each candidate character string 801 in FIG. 8), and all the estimated candidate characters did not correspond. If
The read image data is determined as output image data as it is.

【0071】以上説明したように、実施形態1によれ
ば、入力された原稿画像に対し、認識できた文字に関し
ては正規の文字パターンを発生し、認識候補を絞り込め
なかった文字に対しては認識確率の高い順に複数の候補
文字パターンを択一選択できる形式で発生する。そし
て、発生された候補文字パターンと、認識不能文字に対
応する原稿画像のドット情報を記憶する。また、記憶さ
れたページ情報の一部を表示し、認識候補を絞り込めな
かった文字に対しては、まず、初めに認識確率の最も高
い候補文字をポインタ画像と共に表示し、操作者が簡単
なキー操作で次々に候補文字の表示を変更しながら選択
し確定することにより、文字認識に係る操作性を向上さ
せることができる。 <実施形態2>実施形態1と同じ構成で、読み取りイメ
ージデータの出力を高速に行う実施形態2について、以
下に説明する。実施形態1において、読み取りイメージ
データの1ページ内に不確定文字が数十個も在るような
場合は、修正確定作業にたいへん手間と時間がかかって
しまう。そこで、実施形態2では、認識の正確さよりも
読み取りイメージデータの出力を速く行なうことを優先
する場合、以下の手段を設けることで、それを実現す
る。
As described above, according to the first embodiment, a regular character pattern is generated for characters that can be recognized in an input document image, and characters that cannot be narrowed down for recognition candidates. It occurs in a format in which a plurality of candidate character patterns can be selected and selected in descending order of recognition probability. Then, the generated candidate character pattern and the dot information of the document image corresponding to the unrecognizable character are stored. Also, a part of the stored page information is displayed, and for characters for which recognition candidates could not be narrowed down, first, candidate characters having the highest recognition probability are displayed together with the pointer image, so that the operator can easily display the candidate characters. The operability related to character recognition can be improved by successively changing the display of the candidate characters by key operation and selecting and confirming them. <Second Embodiment> A second embodiment which has the same configuration as the first embodiment and outputs read image data at high speed will be described below. In the first embodiment, when there are dozens of uncertain characters in one page of the read image data, it takes a lot of trouble and time to correct and fix the work. Therefore, in the second embodiment, when priority is given to outputting read image data faster than accuracy of recognition, this is realized by providing the following means.

【0072】まず、図4のステップS5002で、文字
が確定せず複数個の不確定文字が上げられる場合でも、
この不確定文字の個数(図7においては3個)を操作者
が設定する任意のx個以下に限定する手段を設け、例え
ば、それが2個であれば認識確率のより低い方から2個
の文字を選択し、それ以外の不明文字は第一候補の文字
で予め確定する。(図8において、例えば「障」の文字
は修正作業を行わす、予め第一の候補文字「障」で確定
してしまう)。図10は不確定文字の文字数を設定する
際の表示部に表示される設定画面を示す図であり、図
4、図5で示した原稿読み取り処理と文字認識処理と、
図6に示す不確定文字の修正処理との間に表示部505
2に表示する。
First, at step S5002 in FIG. 4, even if a character is not fixed and a plurality of undefined characters are raised,
Means for limiting the number of uncertain characters (three in FIG. 7) to an arbitrary number x or less set by the operator is provided. For example, if the number is two, two from the lower recognition probability are used. Is selected, and the other unknown characters are determined in advance as the first candidate characters. (In FIG. 8, for example, the character of "failure" is subjected to correction work, and is determined in advance by the first candidate character "failure"). FIG. 10 is a diagram showing a setting screen displayed on the display unit when setting the number of characters of uncertain characters. The document reading process and the character recognition process shown in FIGS.
A display unit 505 is provided between the processing for correcting the uncertain character shown in FIG.
2 is displayed.

【0073】ここで、図10に示す設定画面について説
明する。
Here, the setting screen shown in FIG. 10 will be described.

【0074】図10は不明文字の文字数を設定する際の
表示部5052に表示される設定画面を示す図であり、
図4、図5に示した原稿読み取り処理と文字認識動作
と、図6に示す不確定文字の修正確定作業との間に表示
部5052に表示する。
FIG. 10 is a diagram showing a setting screen displayed on the display unit 5052 when the number of unknown characters is set.
It is displayed on the display unit 5052 between the document reading process and the character recognition operation shown in FIGS. 4 and 5 and the uncertain character correction / fixing operation shown in FIG.

【0075】操作者は図5で示した文字認識処理の終了
後、図10の表示部に示された不確定文字の最大数が多
過ぎると考えた場合、↑キーまたは↓キーまたは数字キ
ーで希望する数を設定する。そして、設定内容を確定す
る場合には「yes」ボタン、取り消す場合には「n
o」ボタンを押下する。この設定内容によっては、間違
った文字に確定されたり、未認識で読み取った画像情報
のまま確定される文字が増加してしまうが、修正対象の
不明文字が減るので、画像データの出力までの時間は短
縮される。
After finishing the character recognition processing shown in FIG. 5, if the operator considers that the maximum number of uncertain characters shown in the display section of FIG. Set the desired number. Then, the “yes” button is used to confirm the settings, and “n” is used to cancel the settings.
Press the "o" button. Depending on this setting, the number of characters that are determined as wrong characters or that are determined as unrecognized image information increases, but the number of unknown characters to be corrected decreases, so the time until image data is output is reduced. Is shortened.

【0076】また、1つの不確定文字を操作者が仮に確
定した時に、ページ内の以降の他の不確定文字の内、第
一候補が操作者が確定した文字と類似している不確定文
字に対する候補文字の順位を入れ替え、操作者が仮に確
定した文字をそれ以降の他の類似した不確定文字の第一
候補文字とする。例えば、図7、図8において、1行め
の不確定文字「痛」は操作者が「療」で仮に確定する
と、ページ内の他の不確定文字で第一候補が「痛」や
「病」の文字は候補文字の順位を入れ替え「療」を第一
候補にする。こうすることで、以降の類似した不確定文
字が仮に全て「療」が正解であれば←キーを1度押下す
るだけで仮に確定することができる。
Further, when the operator temporarily determines one undetermined character, among the other undetermined characters on the page, the first candidate is an undetermined character similar to the character determined by the operator. The order of the candidate characters with respect to is replaced, and the character temporarily determined by the operator is set as the first candidate character of other similar uncertain characters thereafter. For example, in FIG. 7 and FIG. 8, if the operator determines that the uncertain character “pain” on the first line is “medical”, the first candidate is “pain” or “disease” with other uncertain characters on the page. The character "" changes the order of the candidate characters and makes "Sai" the first candidate. By doing so, if all similar uncertain characters thereafter are correct for “medical”, it can be temporarily determined by pressing the ← key once.

【0077】また、1つの不確定文字を操作者が仮に確
定した時に、ページ内の以降の他の不確定文字の内、前
後の文字が操作者が仮に確定した文字の前後の文字と等
しい場合、その文字に対する候補文字の順位を入れ替
え、操作者が仮に確定した文字をそれ以降の他の前後の
文字が等しい不確定文字の第一候補文字とする。例え
ば、図7、図8において、1行めの不確定文字「痛」は
操作者が「療」で仮に確定すると、ページ内の他の不確
定文字の内、前の文字が「医」、後の文字が「、」とな
る不確定文字は候補文字の順位を入れ替え「療」を第一
候補にする。こうすることで、以降の「医?、」となる
不確定文字が仮に全て「療」が正解であれば←キーのみ
で仮に仮に確定することができる。
Further, when one uncertain character is temporarily determined by the operator, the characters before and after the other undetermined characters in the page are equal to the characters before and after the character temporarily determined by the operator. Then, the order of the candidate characters for the character is changed, and the character temporarily determined by the operator is set as the first candidate character of the uncertain character in which other characters before and after the character are equal. For example, in FIGS. 7 and 8, if the operator determines that the uncertain character “pain” on the first line is “medical”, among the other uncertain characters on the page, the previous character is “medical”, For the uncertain character in which the subsequent character is “,”, the order of the candidate characters is switched, and “Sai” is made the first candidate. In this way, if all of the uncertain characters that become “medicine?” Are correct for “medical”, it can be provisionally determined only with the ← key.

【0078】また、候補文字が全く無い不明文字の場
合、画像情報記憶エリアには、不明文字に対応する範囲
の読み取りイメージデータをそのまま記憶し(図4のス
テップS5011)、不明文字の修正は行なわずに読み
取りイメージデータをそのまま出力画像データとして確
定することにより、誤認識率は高くなってしまうが画像
データの出力は速くなる。
In the case of an unknown character having no candidate character at all, the read image data in the range corresponding to the unknown character is stored as it is in the image information storage area (step S5011 in FIG. 4), and the unknown character is corrected. If the read image data is determined as output image data as it is, the erroneous recognition rate increases, but the output of the image data becomes faster.

【0079】以上説明したように、実施形態2によれ
ば、不確定の文字の個数を操作者が設定可能とすること
により、設定数以上の不確定文字があっても第一候補の
文字で予め確定する。また、1つの不確定文字を操作者
が仮に確定した時に、ページ内の以降の他の不確定文字
の内、第一候補が操作者が確定した文字と類似している
不確定文字に対する候補文字の順位を入れ替える。ま
た、1つの不確定文字を操作者が仮に確定した時に、ペ
ージ内の以降の他の不確定文字の内、前後の文字が操作
者が仮に確定した文字の前後の文字と等しい場合、その
文字に対する候補文字の順位を入れ替える。また、候補
文字が全く無い不明文字の場合、画像情報記憶エリアに
は不明文字に対応する範囲の読み取りイメージデータを
そのまま出力画像データとして確定する。これにより、
認識の正確さは下がるが、画像データの出力は速くする
ことが可能になる。
As described above, according to the second embodiment, by allowing the operator to set the number of indeterminate characters, even if there are more indeterminate characters than the set number, the first candidate character can be used. Determine in advance. In addition, when the operator temporarily determines one uncertain character, the first candidate is a candidate character for an undetermined character similar to the character determined by the operator among other undetermined characters on the page. Swap the rankings. Further, when one uncertain character is temporarily determined by the operator, when the characters before and after the other undetermined characters in the page are equal to the characters before and after the character temporarily determined by the operator, the character is determined. Swap the order of candidate characters for. In the case of an unknown character having no candidate character at all, read image data in a range corresponding to the unknown character is determined as output image data in the image information storage area. This allows
Although the accuracy of recognition is reduced, the output of image data can be made faster.

【0080】尚、実施形態1、2では、複写機に適応さ
せ、最終的に認識された結果は印刷出力させたが、例え
ば、それをメモリに記憶しておき文書編集に使用した
り、場合によってはフロッピー(登録商標)ディスク装
置などの記憶媒体に記憶させるようにしても良い。
In the first and second embodiments, the result of adaptation to the copying machine and the finally recognized result are printed out. However, for example, the result is stored in a memory and used for document editing. Depending on the case, it may be stored in a storage medium such as a floppy (registered trademark) disk device.

【0081】また、単独の複写機に適応させた例を説明
したが、例えば、イメージリーダと、文字認識処理を行
うホストコンピュータ、更には、印刷出力するプリンタ
を備えるシステムでも同様の作用効果を得ることができ
る。この場合には、ホストコンピュータに上記処理を実
現させるためのプログラムコードをロードさせれば良
い。このように、本発明は単独の装置であっても、複数
の装置の組みあわせであっても、更には、プログラムコ
ードを供給させることで実現させる場合であっても実現
できる。
In the above description, an example in which the present invention is applied to a single copying machine has been described. For example, a system having an image reader, a host computer for performing character recognition processing, and a printer having a printer for printing out can also obtain the same operation and effect. be able to. In this case, the host computer may be loaded with a program code for implementing the above processing. As described above, the present invention can be realized by a single device, a combination of a plurality of devices, and a case where the present invention is realized by supplying a program code.

【0082】尚、本発明は、複数の機器(例えばホスト
コンピュータ、インタフェース機器、リーダ、プリンタ
など)から構成されるシステムに適用しても、一つの機
器からなる装置(例えば、複写機、ファクシミリ装置な
ど)に適用してもよい。
Even if the present invention is applied to a system including a plurality of devices (for example, a host computer, an interface device, a reader, a printer, etc.), a device including one device (for example, a copying machine, a facsimile machine) Etc.).

【0083】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
An object of the present invention is to provide a storage medium storing a program code of software for realizing the functions of the above-described embodiments to a system or an apparatus, and to provide a computer (or CPU) of the system or apparatus.
And MPU) read and execute the program code stored in the storage medium.

【0084】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
In this case, the program code itself read from the storage medium implements the functions of the above-described embodiment, and the storage medium storing the program code constitutes the present invention.

【0085】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−R、磁気テープ、不揮発性のメモリカード、ROMな
どを用いることができる。
Examples of a storage medium for supplying the program code include a floppy disk, hard disk, optical disk, magneto-optical disk, CD-ROM, and CD.
-R, a magnetic tape, a nonvolatile memory card, a ROM, or the like can be used.

【0086】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
When the computer executes the readout program code, not only the functions of the above-described embodiment are realized, but also the OS (Operating System) running on the computer based on the instruction of the program code. ) May perform some or all of the actual processing, and the processing may realize the functions of the above-described embodiments.

【0087】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれることは言うまでもない。
Further, after the program code read from the storage medium is written into a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, based on the instruction of the program code, It goes without saying that the CPU included in the function expansion board or the function expansion unit performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.

【0088】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明した図4、図5、図6に示す
フローチャートに対応するプログラムコードが格納され
ることになる。
When the present invention is applied to the storage medium, the storage medium stores program codes corresponding to the flowcharts shown in FIGS. 4, 5 and 6 described above.

【0089】[0089]

【発明の効果】以上説明したように、本発明によれば、
文字認識結果に対する後処理を効率良く実行することが
できる画像処理装置及びその方法、コンピュータ可読メ
モリを提供できる。
As described above, according to the present invention,
An image processing apparatus and method capable of efficiently executing post-processing on a character recognition result, and a computer-readable memory can be provided.

【図面の簡単な説明】[Brief description of the drawings]

【図1】実施形態1の画像処理装置の機能構成を示す図
をである。
FIG. 1 is a diagram illustrating a functional configuration of an image processing apparatus according to a first embodiment.

【図2】実施形態1の画像処理装置のハードウェア構成
を示す断面図である。
FIG. 2 is a cross-sectional view illustrating a hardware configuration of the image processing apparatus according to the first embodiment.

【図3】実施形態1の操作部の外観を示す図である。FIG. 3 is a diagram illustrating an appearance of an operation unit according to the first embodiment.

【図4】実施形態1の画像認識部の処理フローを示すフ
ローチャートである。
FIG. 4 is a flowchart illustrating a processing flow of an image recognition unit according to the first embodiment.

【図5】実施形態1の文字認識回路の詳細な処理フロー
を示すフローチャートである。
FIG. 5 is a flowchart illustrating a detailed processing flow of the character recognition circuit according to the first embodiment.

【図6】実施形態1の不確定文字の修正処理の処理フロ
ーを示すフローチャートである。
FIG. 6 is a flowchart illustrating a processing flow of an indeterminate character correcting process according to the first embodiment.

【図7】実施形態1の文字コードデータ及び出力画像デ
ータと不確定文字の修正作業の際の表示部の遷移を示す
図である。
FIG. 7 is a diagram illustrating transitions of the display unit when correcting the character code data, output image data, and uncertain characters according to the first embodiment.

【図8】実施形態1の文字コードデータ及び出力画像デ
ータと不確定文字の修正作業の際の表示部の遷移を示す
図である。
FIG. 8 is a diagram illustrating transition of the display unit when correcting the character code data, output image data, and uncertain characters according to the first embodiment.

【図9】実施形態1の文字コードデータ及び出力画像デ
ータと不確定文字の修正作業の際の表示部の遷移を示す
図である。
FIG. 9 is a diagram illustrating transition of a display unit when correcting character code data, output image data, and uncertain characters according to the first embodiment.

【図10】実施形態2の不確定文字の文字数を設定する
際の表示部に表示される設定画面を示す図である。
FIG. 10 is a diagram illustrating a setting screen displayed on a display unit when setting the number of undefined characters according to the second embodiment.

【符号の説明】[Explanation of symbols]

101 レンズ 102 イメージセンサ 103 ADコンバータ 104 シェーディング補正回路 105 モード切替回路 106 光濃度変換回路 107 画像編集部 108 パターン認識部 109 文字認識回路 110 イメージデータ変換部 111 ポインタ画像生成部 113 CPU 114 ROM 115 RAM 116 操作部 117 記録部 118 画像バッファメモリ 1001 原稿 1002 画像読取部 1003 画像処理部 1004 画像記録部 4000 画像認識部 Reference Signs List 101 lens 102 image sensor 103 AD converter 104 shading correction circuit 105 mode switching circuit 106 light density conversion circuit 107 image editing unit 108 pattern recognition unit 109 character recognition circuit 110 image data conversion unit 111 pointer image generation unit 113 CPU 114 ROM 115 RAM 116 Operation unit 117 Recording unit 118 Image buffer memory 1001 Document 1002 Image reading unit 1003 Image processing unit 1004 Image recording unit 4000 Image recognition unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 本田 永和 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 小林 誠 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 谷岡 宏 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 Fターム(参考) 5B064 AA01 AA07 BA01 EA12 EA14 FA04 FA09 FA11  ────────────────────────────────────────────────── ─── Continuing on the front page (72) Inventor Eiwa, Honda 3- 30-2 Shimomaruko, Ota-ku, Tokyo Inside Canon Inc. (72) Inventor Makoto Kobayashi 3- 30-2, Shimomaruko, Ota-ku, Tokyo Canon Incorporated (72) Inventor Hiroshi Tanioka 3-30-2 Shimomaruko, Ota-ku, Tokyo F-term in Canon Inc. (reference) 5B064 AA01 AA07 BA01 EA12 EA14 FA04 FA09 FA11

Claims (25)

【特許請求の範囲】[Claims] 【請求項1】 入力された原稿画像中の文字を認識する
画像処理装置であって、 前記入力された原稿画像中の文字を認識する認識手段
と、 前記認識手段で認識された認識文字に対応する文字コー
ドと、認識候補を複数有する不確定文字に対応する複数
の候補文字コードを記憶する第1メモリ手段と、 前記文字コードに対応する文字パターンと、前記複数の
候補文字コードに対応する複数の候補文字パターンを発
生する発生手段と、 前記文字パターンと前記複数の候補文字パターンを記憶
する第2メモリ手段と、 前記第2メモリ手段に記憶される内容を表示する表示手
段と、 前記表示手段で表示される複数の候補文字パターンより
所望の候補文字パターンを指定する指定手段と、 前記指定手段で指定された候補文字パターンと、前記文
字パターンを出力する出力手段とを備えることを特徴と
する画像処理装置。
1. An image processing apparatus for recognizing a character in an input document image, comprising: a recognizing means for recognizing a character in the input document image; First memory means for storing a plurality of candidate character codes corresponding to uncertain characters having a plurality of recognition candidates, a character pattern corresponding to the character code, and a plurality of characters corresponding to the plurality of candidate character codes. Generating means for generating a candidate character pattern, a second memory means for storing the character pattern and the plurality of candidate character patterns, a display means for displaying contents stored in the second memory means, and the display means. A designating means for designating a desired candidate character pattern from a plurality of candidate character patterns displayed by the user; a candidate character pattern designated by the designating means; The image processing apparatus according to an outputting means for outputting the over down.
【請求項2】 前記表示手段は、前記指定手段の指定に
応じて、前記複数の候補文字パターンの各候補文字パタ
ーンをその認識確率の高い順に表示することを特徴とす
る請求項1に記載の画像処理装置。
2. The apparatus according to claim 1, wherein the display unit displays the candidate character patterns of the plurality of candidate character patterns in descending order of their recognition probabilities in accordance with the designation by the designation unit. Image processing device.
【請求項3】 前記表示手段は、前記候補文字パターン
を、該候補文字パターンであることを示す所定画像を合
成して表示することを特徴とする請求項1に記載の画像
処理装置。
3. The image processing apparatus according to claim 1, wherein the display unit displays the candidate character pattern by synthesizing a predetermined image indicating the candidate character pattern.
【請求項4】 前記所定画像は、前記候補文字パターン
の反転画像であることを特徴とする請求項3に記載の画
像処理装置。
4. The image processing apparatus according to claim 3, wherein the predetermined image is an inverted image of the candidate character pattern.
【請求項5】 前記所定画像は、網点画像であることを
特徴とする請求項3に記載の画像処理装置。
5. The image processing apparatus according to claim 3, wherein the predetermined image is a halftone image.
【請求項6】 前記所定画像は、アンダーラインである
ことを特徴とする請求項3に記載の画像処理装置。
6. The image processing apparatus according to claim 3, wherein the predetermined image is an underline.
【請求項7】 前記第1メモリ手段は、更に、前記認識
手段で認識不能な不明文字を示す所定文字コードを記憶
し、 前記発生手段は、更に、前記所定文字コードに対応する
所定文字パターンを発生し、 前記第2メモリ手段は、前記所定文字パターンと前記不
明文字に対応する前記原画像中の部分画像を記憶するこ
とを特徴とする請求項1に記載の画像処理装置。
7. The first memory unit further stores a predetermined character code indicating an unknown character that cannot be recognized by the recognition unit, and the generation unit further stores a predetermined character pattern corresponding to the predetermined character code. 2. The image processing apparatus according to claim 1, wherein the second memory unit stores a partial image in the original image corresponding to the predetermined character pattern and the unknown character.
【請求項8】 前記表示手段は、前記不明文字の表示位
置に前記所定文字パターンを表示し、前記指定手段の指
定に応じて、前記部分画像を表示することを特徴とする
請求項7に記載の画像処理装置。
8. The display device according to claim 7, wherein the display unit displays the predetermined character pattern at a display position of the unknown character, and displays the partial image in accordance with the designation of the designation unit. Image processing device.
【請求項9】 前記出力手段は、更に、前記指定手段の
指定に応じて前記部分画像を出力することを特徴とする
請求項1に記載の画像処理装置。
9. The image processing apparatus according to claim 1, wherein the output unit further outputs the partial image in accordance with the designation of the designation unit.
【請求項10】 前記表示手段は、前記複数の候補文字
パターンの内の注目候補文字パターンの位置に基づいて
決定される前記第2メモリ手段の所定領域に含まれる文
字パターン及び候補文字パターンを表示することを特徴
とする請求項1に記載の画像処理装置。
10. The display means displays a character pattern and a candidate character pattern included in a predetermined area of the second memory means determined based on a position of a noticeable candidate character pattern among the plurality of candidate character patterns. The image processing apparatus according to claim 1, wherein:
【請求項11】 前記指定手段は、少なくとも第1キ
ー、第2キー、第3キー、第4キー、確定キーを有し、 前記第1キーが押下された場合、前記表示手段は、表示
している候補文字パターンより後ろに位置する候補文字
パターンを表示し、 前記第2キーが押下された場合、前記表示手段は、表示
している候補文字パターンの前に位置する候補文字パタ
ーンを表示し、 前記第3キーが押下された場合、前記表示手段は、表示
している候補文字パターンの次の候補文字パターンを表
示し、 前記第4キーが押下された場合、前記表示手段は、表示
している候補文字パターンの前の候補文字パターンを表
示し、 前記確定キーが押下された場合、前記表示手段は、表示
対象となる各候補文字パターンを前記出力手段の出力対
象に確定することを特徴とする請求項1に記載の画像処
理装置。
11. The designating means has at least a first key, a second key, a third key, a fourth key, and an enter key, and when the first key is pressed, the display means displays a message. Displaying the candidate character pattern located after the candidate character pattern being displayed, and when the second key is pressed, the display means displays the candidate character pattern located before the displayed candidate character pattern. When the third key is pressed, the display means displays a candidate character pattern next to the displayed candidate character pattern, and when the fourth key is pressed, the display means displays Displaying the candidate character pattern preceding the candidate character pattern that is displayed, and when the determination key is pressed, the display unit determines each candidate character pattern to be displayed as an output target of the output unit. The image processing apparatus according to claim 1.
【請求項12】 前記指定手段は、更に、前記表示手段
で表示対象とする候補文字パターンの数を指定可能とす
ることを特徴とする請求項1に記載の画像処理装置。
12. The image processing apparatus according to claim 1, wherein the specifying unit can further specify the number of candidate character patterns to be displayed on the display unit.
【請求項13】 入力された原稿画像中の文字を認識す
る画像処理方法であって、 前記入力された原稿画像中の文字を認識する認識工程
と、 前記認識工程で認識された認識文字に対応する文字コー
ドと、認識候補を複数有する不確定文字に対応する複数
の候補文字コードを第1メモリに記憶する第1記憶工程
と、 前記文字コードに対応する文字パターンと、前記複数の
候補文字コードに対応する複数の候補文字パターンを発
生する発生工程と、 前記文字パターンと前記複数の候補文字パターンを第2
メモリに記憶する第2記憶工程と、 前記第2メモリに記憶される内容を表示する表示工程
と、 前記表示工程で表示される複数の候補文字パターンより
所望の候補文字パターンを指定する指定工程と、 前記指定工程で指定された候補文字パターンと、前記文
字パターンを出力する出力工程とを備えることを特徴と
する画像処理方法。
13. An image processing method for recognizing characters in an input document image, comprising: a recognition step of recognizing characters in the input document image; A first character code, a plurality of candidate character codes corresponding to an uncertain character having a plurality of recognition candidates in a first memory, a character pattern corresponding to the character code, and the plurality of candidate character codes Generating a plurality of candidate character patterns corresponding to the character pattern;
A second storage step of storing in a memory; a display step of displaying contents stored in the second memory; and a designation step of designating a desired candidate character pattern from a plurality of candidate character patterns displayed in the display step. An image processing method, comprising: a candidate character pattern designated in the designation step; and an output step of outputting the character pattern.
【請求項14】 前記表示工程は、前記指定工程の指定
に応じて、前記複数の候補文字パターンの各候補文字パ
ターンをその認識確率の高い順に表示することを特徴と
する請求項13に記載の画像処理方法。
14. The display step according to claim 13, wherein the displaying step displays the candidate character patterns of the plurality of candidate character patterns in descending order of their recognition probabilities in accordance with the designation in the designation step. Image processing method.
【請求項15】 前記表示工程は、前記候補文字パター
ンを、該候補文字パターンであることを示す所定画像を
合成して表示することを特徴とする請求項13に記載の
画像処理方法。
15. The image processing method according to claim 13, wherein in the displaying step, the candidate character pattern is displayed by synthesizing a predetermined image indicating the candidate character pattern.
【請求項16】 前記所定画像は、前記候補文字パター
ンの反転画像であることを特徴とする請求項15に記載
の画像処理方法。
16. The image processing method according to claim 15, wherein the predetermined image is an inverted image of the candidate character pattern.
【請求項17】 前記所定画像は、網点画像であること
を特徴とする請求項15に記載の画像処理方法。
17. The image processing method according to claim 15, wherein the predetermined image is a halftone image.
【請求項18】 前記所定画像は、アンダーラインであ
ることを特徴とする請求項15に記載の画像処理方法。
18. The method according to claim 15, wherein the predetermined image is an underline.
【請求項19】 前記第1記憶工程は、更に、前記認識
工程で認識不能な不明文字を示す所定文字コードを前記
第1メモリ記憶し、 前記発生工程は、更に、前記所定文字コードに対応する
所定文字パターンを発生し、 前記第2記憶工程は、前記所定文字パターンと前記不明
文字に対応する前記原画像中の部分画像を前記第2メモ
リ記憶することを特徴とする請求項13に記載の画像処
理方法。
19. The first storage step further stores a predetermined character code indicating an unknown character that cannot be recognized in the recognition step in the first memory, and the generating step further corresponds to the predetermined character code. The method according to claim 13, wherein a predetermined character pattern is generated, and wherein the second storage step stores the partial image in the original image corresponding to the predetermined character pattern and the unknown character in the second memory. Image processing method.
【請求項20】 前記表示工程は、前記不明文字の表示
位置に前記所定文字パターンを表示し、前記指定工程の
指定に応じて、前記部分画像を表示することを特徴とす
る請求項19に記載の画像処理方法。
20. The display device according to claim 19, wherein the display step displays the predetermined character pattern at a display position of the unknown character, and displays the partial image in accordance with the designation in the designation step. Image processing method.
【請求項21】 前記出力工程は、更に、前記指定工程
の指定に応じて前記部分画像を出力することを特徴とす
る請求項13に記載の画像処理方法。
21. The image processing method according to claim 13, wherein the output step further outputs the partial image in accordance with the designation in the designation step.
【請求項22】 前記表示工程は、前記複数の候補文字
パターンの内の注目候補文字パターンの位置に基づいて
決定される前記第2メモリの所定領域に含まれる文字パ
ターン及び候補文字パターンを表示することを特徴とす
る請求項13に記載の画像処理方法。
22. The display step displays a character pattern and a candidate character pattern included in a predetermined area of the second memory, which are determined based on a position of a target candidate character pattern among the plurality of candidate character patterns. 14. The image processing method according to claim 13, wherein:
【請求項23】 前記指定工程は、少なくとも第1キ
ー、第2キー、第3キー、第4キー、確定キーを有し、 前記第1キーが押下された場合、前記表示工程は、表示
している候補文字パターンより後ろに位置する候補文字
パターンを表示し、 前記第2キーが押下された場合、前記表示工程は、表示
している候補文字パターンの前に位置する候補文字パタ
ーンを表示し、 前記第3キーが押下された場合、前記表示工程は、表示
している候補文字パターンの次の候補文字パターンを表
示し、 前記第4キーが押下された場合、前記表示工程は、表示
している候補文字パターンの前の候補文字パターンを表
示し、 前記確定キーが押下された場合、前記表示工程は、表示
対象となる各候補文字パターンを前記出力工程の出力対
象に確定することを特徴とする請求項13に記載の画像
処理方法。
23. The designating step includes at least a first key, a second key, a third key, a fourth key, and an enter key. When the first key is pressed, the display step displays Displaying the candidate character pattern located after the candidate character pattern being displayed, and when the second key is pressed, the display step displays the candidate character pattern located before the displayed candidate character pattern. If the third key is pressed, the display step displays a candidate character pattern next to the displayed candidate character pattern. If the fourth key is pressed, the display step displays Displaying the candidate character pattern before the candidate character pattern that is present, and when the confirmation key is pressed, the display step decides each candidate character pattern to be displayed as an output target of the output step. The image processing method according to claim 13.
【請求項24】 前記指定工程は、更に、前記表示工程
で表示対象とする候補文字パターンの数を指定可能とす
ることを特徴とする請求項13に記載の画像処理方法。
24. The image processing method according to claim 13, wherein in the specifying step, the number of candidate character patterns to be displayed in the display step can be specified.
【請求項25】 入力された原稿画像中の文字を認識す
る画像処理のプログラムコードが格納されたコンピュー
タ可読メモリであって、 前記入力された原稿画像中の文字を認識する認識工程の
プログラムコードと、 前記認識工程で認識された認識文字に対応する文字コー
ドと、認識候補を複数有する不確定文字に対応する複数
の候補文字コードを第1メモリに記憶する第1記憶工程
のプログラムコードと、 前記文字コードに対応する文字パターンと、前記複数の
候補文字コードに対応する複数の候補文字パターンを発
生する発生工程のプログラムコードと、 前記文字パターンと前記複数の候補文字パターンを第2
メモリに記憶する第2記憶工程のプログラムコードと、 前記第2メモリに記憶される内容を表示する表示工程の
プログラムコードと、 前記表示工程で表示される複数の候補文字パターンより
所望の候補文字パターンを指定する指定工程のプログラ
ムコードと、 前記指定工程で指定された候補文字パターンと、前記文
字パターンを出力する出力工程のプログラムコードとを
備えることを特徴とするコンピュータ可読メモリ。
25. A computer readable memory storing an image processing program code for recognizing a character in an input document image, comprising: a program code for a recognition step for recognizing a character in the input document image; A program code of a first storage step of storing, in a first memory, a character code corresponding to the recognized character recognized in the recognition step and a plurality of candidate character codes corresponding to an uncertain character having a plurality of recognition candidates; A character pattern corresponding to the character code, a program code of a generating step for generating a plurality of candidate character patterns corresponding to the plurality of candidate character codes,
A program code of a second storage step to be stored in a memory; a program code of a display step to display contents stored in the second memory; and a candidate character pattern desired from a plurality of candidate character patterns displayed in the display step. A computer readable memory comprising: a program code of a designation step for designating a character pattern; a candidate character pattern designated in the designation step; and a program code of an output step of outputting the character pattern.
JP27514499A 1999-09-28 1999-09-28 Picture processor, picture processing method and computer readable memory Withdrawn JP2001101338A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27514499A JP2001101338A (en) 1999-09-28 1999-09-28 Picture processor, picture processing method and computer readable memory

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27514499A JP2001101338A (en) 1999-09-28 1999-09-28 Picture processor, picture processing method and computer readable memory

Publications (1)

Publication Number Publication Date
JP2001101338A true JP2001101338A (en) 2001-04-13

Family

ID=17551305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27514499A Withdrawn JP2001101338A (en) 1999-09-28 1999-09-28 Picture processor, picture processing method and computer readable memory

Country Status (1)

Country Link
JP (1) JP2001101338A (en)

Similar Documents

Publication Publication Date Title
US20020051666A1 (en) Image forming apparatus having function of automatically selecting one of sheet feeders, method of controlling the image forming apparatus and storage medium
US5809183A (en) Method and apparatus for recognizing character information at a variable magnification
US6493472B1 (en) Sheet processing apparatus, sheet processing method and information processing apparatus
US6314213B1 (en) Image processing apparatus and method which process image on the basis of direction of document
JP2000298702A (en) Image processing device and method therefor, and computer-readable memory
US7472348B2 (en) Image processing apparatus, image processing method and storage medium using character size and width for magnification
JP2001061061A (en) Image processing unit
JPH08137882A (en) Method and device for image processing
JP3976802B2 (en) Image processing apparatus and image processing method
JPH10191018A (en) Image processing method and device
JP2001101338A (en) Picture processor, picture processing method and computer readable memory
JP2021128367A (en) Information formation apparatus
JP2000353214A (en) Picture processor and its method and computer readable memory
JP2001134026A (en) Device and method for image processing and storing medium that can be read by computer
JPH10117281A (en) Image-forming method and device
JPH07182442A (en) Character recognition device and method therefor
JP2003150901A (en) Image processor
JP2000137765A (en) Processor and method for image processing and storage medium
JP2000348136A (en) Picture output device, picture output method and storage medium
JP2000339402A (en) Picture processor, picture processing method and computer readable memory
JP3897407B2 (en) Image processing apparatus and method, and memory medium
JPH10107998A (en) Image processing unit, layout processing method for the image processing unit and storage medium storing program readable by computer
JP2000348137A (en) Picture output device, picture output method and storage medium
JP2000348135A (en) Picture processor picture processing method and storage medium
JP3538415B2 (en) Image forming apparatus provided with magnification setting device

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061205