JPH07129719A - Document picture input device - Google Patents

Document picture input device

Info

Publication number
JPH07129719A
JPH07129719A JP5270808A JP27080893A JPH07129719A JP H07129719 A JPH07129719 A JP H07129719A JP 5270808 A JP5270808 A JP 5270808A JP 27080893 A JP27080893 A JP 27080893A JP H07129719 A JPH07129719 A JP H07129719A
Authority
JP
Japan
Prior art keywords
image
character
document
input device
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5270808A
Other languages
Japanese (ja)
Inventor
Koichi Takahashi
弘一 高橋
Keizo Isemura
圭三 伊勢村
Satoshi Kaneko
敏 金子
Masahiro Serizawa
雅弘 芹澤
Tokuji Kaneko
徳治 金子
Hirohiko Kishimoto
浩彦 岸本
Masanobu Taira
昌宣 平
Akihiko Sato
明彦 佐藤
Noriaki Matsui
規明 松井
Yoshio Mizuno
水野  善夫
Yasuo Fukada
泰生 深田
Yoshihiro Hosomi
芳弘 細見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5270808A priority Critical patent/JPH07129719A/en
Publication of JPH07129719A publication Critical patent/JPH07129719A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Facsimile Scanning Arrangements (AREA)

Abstract

PURPOSE:To improve the character recognition rate of a color document. CONSTITUTION:Image areas of the document picture read in as RGB (or CMY) components by a reader unit A are separated by a character recognition circuit 408, and document pictures (character pictures) of the color having the highest degree of character separation in areas judged to be respective character areas are compared and synthesized, and the density histogram of each character area to be synthesized is generated by a density histogram processing circuit 410. The synthesized document picture is subjected to character recognition by the circuit 408, and, if an unrecognizable character picture is found, the quantity of light of a lamp for document illumination is adaptively controlled in accordance with the state of the density histogram of the area, to which this character picture belongs, to obtain a recognizable character picture.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は文字認識装置における文
字画像入力手段の制御に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to control of character image input means in a character recognition device.

【0002】[0002]

【従来の技術】手書きした文字は使用する筆記具や筆
圧、用紙の材質などによりその文字濃度にばらつきがあ
る。またプリンタなどの出力装置の状態によっても出力
文字の濃度差が発生する。
2. Description of the Related Art Handwritten characters vary in character density depending on the writing tool used, the writing pressure, the material of the paper, and the like. Further, the density difference of output characters also occurs depending on the state of an output device such as a printer.

【0003】図11は従来の文字認識装置のブロック図
であり、前述のような同一原稿中に濃度差のある文字を
図11のような文字認識装置で認識させようとした場
合、所定の濃度に達していない文字に関して「かすれ」
が発生し、認識精度が低下してしまっていた。
FIG. 11 is a block diagram of a conventional character recognition apparatus. When characters having different densities in the same original document are recognized by the character recognition apparatus as shown in FIG. About characters that have not reached
Occurs, and the recognition accuracy has deteriorated.

【0004】この欠点を解決するため、「かすれ」の発
生した文字に対して文字の線幅を拡大した後、再度文字
認識を行う手法や、「かすれ」の発生した文字の端点を
検出してその端点間の距離と端点付近の線分のながれか
らその端点間を接続した後、再度文字認識するという手
法が考案されている。
In order to solve this drawback, a method of re-recognizing a character after enlarging the line width of a character in which "blurring" has occurred, or detecting an end point of the character in which "blurring" has occurred, is detected. A method has been devised in which after the distance between the end points and the flow of a line segment near the end points are connected to each other, the characters are recognized again.

【0005】[0005]

【発明が解決しようとする課題】しかし上記の手法では
部分的な文字のかすれに対して本来つぶす必要のない部
分をつぶしてしまったり、つなぐ必要のない部分をつな
いでしまい、かえって文字候補を増やして認識できなく
なるという欠点があった。
However, according to the above method, a part which is not originally required to be crushed is partially crushed due to a partial character blurring, or a part which is not required to be crushed is connected, so that the number of character candidates is increased. There was a drawback that it could not be recognized.

【0006】また近年、カラー原稿の需要が増えてきて
いる。それにともないカラー原稿に対応した文字認識装
置が必要となってきている。
In recent years, the demand for color originals has increased. Along with this, a character recognition device compatible with color originals has become necessary.

【0007】しかし文字認識そのものはカラーである必
要性はないため従来の文字認識装置ではカラー原稿に対
応した文字抽出は行われていない。そのため白黒の原稿
よりも文字のかすれが発生し易いばかりでなく色による
文字飾りがあると文字の認識率が低下してしまうという
欠点があった。
However, since the character recognition itself does not need to be in color, the conventional character recognition device does not perform character extraction corresponding to a color original. For this reason, there is a drawback in that not only the fading of characters is more likely to occur than in a black-and-white document, but also the character recognition rate is lowered if there is a character decoration with colors.

【0008】そこで本発明の目的は以上のような問題を
解消した原稿画像入力装置を提供することにある。
Therefore, an object of the present invention is to provide a document image input device that solves the above problems.

【0009】[0009]

【課題を解決するための手段】上記問題点を解決するた
め、本発明は、複数の色成分毎に原稿画像を入力するた
めの画像入力手段、該入力手段により入力した原稿画像
を記憶するための1または複数の画像記憶手段、該画像
記憶手段内の原稿画像における文字領域と文字以外の領
域を分割する像域分離手段、文字マッチング用のフォン
トを記憶している辞書手段、前記画像記憶手段内の文字
領域から1文字づつ切り出した後その特徴を抽出し前記
辞書手段と比較して文字を認識する文字認識手段、前記
画像記憶手段内の文字領域の濃度ヒストグラムを作成す
るとともに文字認識用のしきい値を演算する濃度ヒスト
グラム処理手段、および前記文字認識手段により認識で
きない文字が発生した場合前記画像入力手段の原稿画像
の読み取り濃度を変更する手段を具えたことを特徴とす
る。
In order to solve the above-mentioned problems, the present invention stores an image input means for inputting an original image for each of a plurality of color components and an original image input by the input means. 1 or a plurality of image storage means, an image area separation means for dividing a character area and a non-character area in a document image in the image storage means, a dictionary means for storing a character matching font, and the image storage means. A character recognition means for recognizing a character by extracting the characteristics of each character after cutting out one character from the character area in the image recognition means and a density histogram of the character area in the image storage means and for character recognition. When a density histogram processing means for calculating a threshold value and a character that cannot be recognized by the character recognition means are generated, the reading density of the original image of the image input means is changed. Characterized in that comprising further to means.

【0010】さらに本発明は複数の色成分毎に原稿画像
を入力するための画像入力手段、該入力手段により入力
した複数の色成分の原稿画像を各1ライン分記憶するた
めのラインメモリ、該ラインメモリに記憶された各色画
像毎に濃度ヒストグラムを作成するとともにライン方向
の高周波成分を検出し文字認識用のしきい値と文字認識
用の色の原稿画像を選択する処理手段、該処理手段によ
り選択された色の原稿画像を一画面記憶するための画像
記憶手段、該画像記憶手段内の画像から文字領域と文字
以外の領域を分割する像域分離手段、文字マッチング用
のフォントを記憶している辞書手段、および前記画像記
憶手段内の文字領域から1文字づつ切り出した後その特
徴を抽出し前記辞書手段と比較して文字を認識する文字
認識手段を有することを特徴とする。
Further, according to the present invention, an image input means for inputting a manuscript image for each of a plurality of color components, a line memory for storing one line of each manuscript image of a plurality of color components input by the input means, A processing means for creating a density histogram for each color image stored in the line memory and detecting a high frequency component in the line direction to select a threshold for character recognition and a document image of a color for character recognition by the processing means. Image storage means for storing one screen of the original image of the selected color, image area separation means for dividing a character area and a non-character area from the image in the image storage means, and a character matching font are stored. And a character recognition means for recognizing characters by extracting the characteristics of each character after cutting out the character area from the character area in the image storage means and comparing with the dictionary means. And wherein the door.

【0011】[0011]

【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
Embodiments of the present invention will now be described in detail with reference to the drawings.

【0012】<実施例1>図1は本発明の実施例である
複写装置の外観図であり、原稿画像を読み取るリーダユ
ニットAと読み取られた画像を紙などの記録媒体上に形
成するプリンタユニットBとから構成されている。また
リーダユニットAには図3に図示する操作部Cが設けら
れている。
<Embodiment 1> FIG. 1 is an external view of a copying apparatus according to an embodiment of the present invention. A reader unit A for reading an original image and a printer unit for forming the read image on a recording medium such as paper. It is composed of B and. Further, the reader unit A is provided with an operation section C shown in FIG.

【0013】図2を用いてリーダユニットAならびにプ
リンタユニットBについて説明する。
The reader unit A and the printer unit B will be described with reference to FIG.

【0014】リーダユニットAの原稿給送手段1に積載
された複数の原稿を1枚もしくは2枚連続に原稿台ガラ
ス面2上の所定の位置に給送、または読み取らせる原稿
の画像が形成されている面(原稿面)を原稿台ガラス2
上に下向きに置き、原稿カバー(原稿給送手段1)によ
り原稿台ガラス2上に押し当てられる。原稿面はランプ
3で照明され、その反射光をミラー5〜7およびレンズ
8を介して画像読み取り用のセンサであるイメージセン
サ9に集光し主走査方向1ライン分の画像信号(画像デ
ータ)を入力する。そしてミラー5とミラー6,7を
2:1の相対速度で副走査方向に移動させて原稿面をす
べて入力する。
An image of a document is formed so that one or two documents stacked on the document feeding means 1 of the reader unit A can be fed or read continuously to a predetermined position on the platen glass surface 2. The surface (original surface) of the original platen glass 2
The document is placed face down and pressed against the document glass 2 by the document cover (document feeding means 1). The surface of the original is illuminated by a lamp 3, and the reflected light is focused on an image sensor 9 which is a sensor for image reading through mirrors 5 to 7 and a lens 8 and an image signal (image data) for one line in the main scanning direction is obtained. Enter. Then, the mirror 5 and the mirrors 6 and 7 are moved in the sub-scanning direction at a relative speed of 2: 1 to input the entire document surface.

【0015】イメージセンサ9に入力された画像信号は
いったん図4で示す画像メモリに記憶されOCR処理な
どの画像メモリを利用した処理が行われる。
The image signal input to the image sensor 9 is once stored in the image memory shown in FIG. 4 and subjected to processing using the image memory such as OCR processing.

【0016】処理が行われた画像データは順次画像メモ
リから読み出され、さらに操作部Cで選択された画像処
理を施し、プリンタユニットBのレーザ走査光学系ユニ
ット10に供給される。
The processed image data is sequentially read from the image memory, further subjected to the image processing selected by the operation section C, and supplied to the laser scanning optical system unit 10 of the printer unit B.

【0017】このレーザ走査光学系ユニット10は半導
体レーザユニット、コリメータレンズ、回転多面体ミラ
ー(ポリゴンミラー)、fθレンズ、補正光学系などで
構成されている。ここに入力されてきた画像データで半
導体レーザの出力光を変調し、その変調されたレーザ光
はコリメータレンズを介して高速で回転しているポリゴ
ンミラーに照射され、そこで反射したレーザ光はfθレ
ンズを介してポリゴンミラーの回転にあわせて感光体1
1上を走査し画像(潜像)を形成する。
The laser scanning optical system unit 10 is composed of a semiconductor laser unit, a collimator lens, a rotary polyhedral mirror (polygon mirror), an fθ lens, a correction optical system and the like. The output light of the semiconductor laser is modulated by the image data input here, and the modulated laser light is applied to a polygon mirror rotating at high speed through a collimator lens, and the laser light reflected there is fθ lens. Photoconductor 1 according to the rotation of the polygon mirror via
1 is scanned to form an image (latent image).

【0018】感光体11上に形成された静電潜像は12
または13の現像器から供給される現像剤(トナー)で
可視化される。
The electrostatic latent image formed on the photoconductor 11 is 12
Alternatively, it is visualized with the developer (toner) supplied from the developing device 13.

【0019】また14および15の被転写紙積載部に積
載収納された記録用紙は、給紙ローラ,給送ローラによ
りレジストローラ位置まで送られる。さらに記録用紙は
レジストローラで感光体11上に形成されている画像の
画像先端位置とタイミングをとられて感光体11からの
転写位置に送られる。
The recording papers stacked and stored in the transfer paper stacking units 14 and 15 are sent to the registration roller position by the paper feed roller and the feed roller. Further, the recording paper is sent to the transfer position from the photoconductor 11 by the registration roller in timing with the image front end position of the image formed on the photoconductor 11.

【0020】転写分離帯電器16により感光体11に形
成されているトナー像が記録用紙に転写された後、感光
体11から分離されて搬送ベルトを介して定着器17で
トナー像が定着される。
After the toner image formed on the photoconductor 11 is transferred onto the recording sheet by the transfer / separation charger 16, the toner image is separated from the photoconductor 11 and fixed by the fixing device 17 via the conveying belt. .

【0021】定着された記録用紙は方向フラッパ19で
排紙ローラ18により排紙トレーに積載出力されるか、
多重/両面画像形成プロセスを行うため内部搬送手段に
送られ再給紙に備える。
The fixed recording paper is stacked on the paper output tray by the paper output roller 18 by the direction flapper 19 or is output.
In order to perform a multiplex / double-sided image forming process, the image is sent to an internal conveying unit to prepare for re-feeding.

【0022】図3に操作部Cの構成例を示す。操作部C
は、複写開始を指示するコピースタートキー311、複
写動作の停止を指示するコピーストップキー310、コ
ピーモードを標準状態に復帰させるリセットキー30
9、“0”から“9”のテンキー群と設定された複写枚
数などをクリアする“C”キーなどで構成される設定キ
ー群313、コピー枚数の表示部312、濃度の濃淡を
設定する濃度キー303ならびにその表示部302、自
動濃度調整機能の選択キーとその表示器304、倍率選
択キー306とその表示器305、給紙段および自動用
紙選択機能の選択キー308ならびに給紙段および用紙
サイズの表示器307、OCR機能の選択キー315な
らびにその表示器314、などの独立のキースイッチと
表示部がある。
FIG. 3 shows an example of the configuration of the operating section C. Operating part C
Is a copy start key 311 for instructing to start copying, a copy stop key 310 for instructing to stop the copying operation, and a reset key 30 for returning the copy mode to the standard state.
9, a set key group 313 including a ten key group from "0" to "9" and a "C" key for clearing the set number of copies, a copy number display portion 312, and a density for setting the density of the density Key 303 and its display unit 302, automatic density adjustment function selection key and its display 304, magnification selection key 306 and its display 305, paper feed tray and automatic paper selection function selection key 308, paper feed tray and paper size Display 307, OCR function selection key 315 and its display 314, and other independent key switches and display units.

【0023】また操作部Cには操作表示部301があ
り、この操作表示部301はドットマトリクス液晶ディ
スプレイ(LCD)とその上面に透明電極で形成されマ
トリクス状に配置されたキーSWとで構成され、LCD
に表示された内容を直接触る(押す)タッチパネル方式
の表示・入力手段である。
The operation section C has an operation display section 301. The operation display section 301 is composed of a dot matrix liquid crystal display (LCD) and keys SW formed of transparent electrodes on the upper surface thereof and arranged in a matrix. , LCD
It is a touch panel type display / input means for directly touching (pressing) the content displayed on.

【0024】図4に本発明の実施例である複写装置の制
御系のブロック図を示す。操作部416のコピーキーが
押されるとシステムコントローラ415はリーダユニッ
トAを起動し原稿画像の読み込み動作を起動する。
FIG. 4 is a block diagram of the control system of the copying machine according to the embodiment of the present invention. When the copy key of the operation unit 416 is pressed, the system controller 415 activates the reader unit A and the operation of reading the original image.

【0025】調光回路401で光量を制御されたランプ
で照明された原稿画像はレンズを介してイメージセンサ
402に入力され、3原色、すなわち、R,G,Bの各
電気信号に変換される。電気信号に変換された原稿画像
はプリアンプ403を介してA/D変換器404でディ
ジタル信号に変換され、シェーディング補正回路405
で画像信号のシェーディングが補正される。そして原稿
画像信号はR,G,Bの各画像メモリ407に格納され
る。これらの動作はシステムコントローラ415で制御
されているタイミングパルス発生回路406の出力パル
スでタイミングがとられている。
An original image illuminated by a lamp whose light amount is controlled by a light control circuit 401 is input to an image sensor 402 via a lens and converted into three primary colors, that is, R, G, and B electrical signals. . The original image converted into an electric signal is converted into a digital signal by an A / D converter 404 via a preamplifier 403, and a shading correction circuit 405.
The shading of the image signal is corrected by. The original image signal is stored in the R, G, and B image memories 407. These operations are timed by the output pulse of the timing pulse generation circuit 406 controlled by the system controller 415.

【0026】画像メモリ407に原稿画像を記憶すると
システムコントローラ415は文字認識回路408を起
動し、文字認識回路408の機能の一つである像域分割
処理によりRGBそれぞれの画像メモリ407に格納さ
れている原稿画像を文字領域と文字以外の領域に分割す
る。
When the original image is stored in the image memory 407, the system controller 415 activates the character recognition circuit 408 and is stored in the image memory 407 for each of RGB by the image area division processing which is one of the functions of the character recognition circuit 408. Divide the existing document image into text and non-text areas.

【0027】システムコントローラ415はRGBそれ
ぞれの画像メモリ407におこなった像域分割処理によ
り分割された領域を比較し、分割された文字領域毎にど
の画像メモリ407の原稿画像を用いるか選択する。
(選択は文字領域判定を優先させた多数決による選択方
法を用いている。) そして例えばG画像メモリ407において各々の選択さ
れた画像領域を合成するとともに、濃度ヒストグラム処
理回路410によって選択された各領域毎に濃度ヒスト
グラムを作成する。
The system controller 415 compares the areas divided by the image area division processing performed on the RGB image memories 407, and selects which image memory 407 of the original image is to be used for each divided character area.
(A selection method is based on a majority decision that gives priority to character area determination.) Then, for example, each selected image area is combined in the G image memory 407, and each area selected by the density histogram processing circuit 410 is combined. A density histogram is created for each.

【0028】システムコントローラ415は再度文字認
識回路408を起動し、G画像メモリ407の合成した
画像から1文字づつ文字画像を切り出し、辞書409と
比較して対応する文字フォント画像に文字画像を置き換
える。
The system controller 415 activates the character recognition circuit 408 again, cuts out the character images one by one from the combined image in the G image memory 407, compares the character images with the dictionary 409, and replaces the character images with the corresponding character font images.

【0029】原稿画像すべての文字画像の置き換えが終
了したとき、かすれなどによる認識不能文字がある場合
認識不能文字の存在する領域に対する濃度ヒストグラム
を調べ、その分布に応じて調光回路401にランプ光量
を減少させるように指示をして、再度原稿取り込みから
やり直す。再度の試行でも確定できなかった場合にはそ
の部分を元の文字画像のままとして処理を先に進める。
When all the character images of the original image have been replaced, if there are unrecognizable characters due to blurring or the like, the density histogram for the area where the unrecognizable characters exist is checked, and the light intensity of the lamp is sent to the dimming circuit 401 according to the distribution. To reduce the number of scans, and then try scanning again. If it cannot be confirmed by the second trial, the portion is left as it is and the process proceeds.

【0030】システムコントローラ415は通常のコピ
ー動作ではR:0.3、G:0.59、B:0.11
(標準値)であるアクティブマトリクス411のマトリ
クス係数をOCR機能が選択されたときはR:0,G:
1,B:0に切り替え、文字の色は黒としてプリント出
力するようにする。(Gの係数を1としたのは、置き換
えられた文字フォントが格納されているのがGの画像メ
モリであるためである。) アクティブマトリクス411を通った文字画像は濃度変
換回路412で輝度濃度変換をし、画像処理回路413
で文字画像に操作部Cで設定された各種画像を施し、画
像記録部414(プリンタユニットB)にその文字画像
を送り込む。画像記録部414では、その文字画像によ
りレーザ光を変調して記録用紙に記録する。
The system controller 415 is R: 0.3, G: 0.59, B: 0.11 in a normal copy operation.
When the OCR function is selected, the matrix coefficient of the active matrix 411 (standard value) is R: 0, G:
It is switched to 1, B: 0 and the character color is printed out as black. (The G coefficient is set to 1 because the replaced character font is stored in the G image memory.) The character image that has passed through the active matrix 411 is processed by the density conversion circuit 412 in the brightness density. Image conversion circuit 413
Then, various images set by the operation unit C are applied to the character image, and the character image is sent to the image recording unit 414 (printer unit B). The image recording unit 414 modulates the laser light with the character image and records it on a recording sheet.

【0031】以上の動作を図5に示すシステムコントロ
ーラ415の動作フローチャートを用いてさらに説明す
る。
The above operation will be further described with reference to the operation flowchart of the system controller 415 shown in FIG.

【0032】動作スタンバイ状態においてアクティブマ
トリクス411のマトリクス係数を標準値にし(S50
1)、コピーがスタートされるのを待機する(S50
2)。
In the operation standby state, the matrix coefficient of the active matrix 411 is set to the standard value (S50
1) Wait for copying to start (S50)
2).

【0033】操作部Cのコピースタートキーが押される
とOCR機能がオンされているかを調べ(S503)、
リーダユニットAを起動させる。
When the copy start key of the operation section C is pressed, it is checked whether the OCR function is turned on (S503).
Start the reader unit A.

【0034】OCR機能がオンされているとき、リーダ
ユニットAから読み込まれた原稿画像は三原色のまま画
像メモリ407に記憶され(S504)、文字認識回路
408を用いて文字領域とそれ以外の領域に分割する
(S505)。
When the OCR function is turned on, the original image read from the reader unit A is stored in the image memory 407 as it is in the three primary colors (S504), and the character recognition circuit 408 is used to display the character area and other areas. It is divided (S505).

【0035】RGBそれぞれの画像メモリ407におこ
なった像域分割処理により分割された領域を比較し、分
割された文字領域毎にどの画像メモリ407の原稿画像
を用いるか選択する。(選択は文字領域判定を優先させ
た多数決による選択方法を用いている。)(S506) 選択された各領域毎に濃度ヒストグラム処理回路410
を用いて濃度ヒストグラムを作成し文字認識用のしきい
値を求め文字認識回路408に伝える(S507)。そ
してあらかじめ定めている画像メモリ407(たとえば
G画像メモリ)において選択された画像領域を合成する
(S508)。
The areas divided by the image area division processing performed on the image memories 407 for each of RGB are compared and the original image in the image memory 407 to be used is selected for each divided character area. (The selection uses a selection method based on a majority decision giving priority to the character area determination.) (S506) The density histogram processing circuit 410 for each selected area.
Is used to create a density histogram, obtain a threshold value for character recognition, and notify the character recognition circuit 408 (S507). Then, the image areas selected in the predetermined image memory 407 (for example, G image memory) are combined (S508).

【0036】それから再度文字認識回路408を起動
し、画像メモリ407上の合成した画像から1文字づつ
文字画像を切り出し、その文字画像の特徴を抽出して辞
書409に記憶されている内容と比較して確定できる文
字は辞書409から文字フォントを画像メモリ407上
にドット展開し、文字候補がいくつかある場合は対応す
る文字コードを記憶しておき複数の文字コードと辞書4
09とを比較して文字を確定し文字フォントを画像メモ
リ407に展開する。これによっても確定されない場合
はかすれ文字が発生したことを示すフラグをセットしそ
の領域を示すコードを記憶する。(画像領域を合成する
際その領域を示すコードがシステムコントローラ415
により割当てられている。)(S509) 原稿画像すべての文字画像の置き換えが終了したとき、
かすれなどによる認識不能文字がある場合(S51
0)、認識不能文字の存在する領域に対する濃度ヒスト
グラムを調べ、その分布に応じて調光回路401にラン
プ光量を減少させるように指示をして(S512)、再
度原稿取り込みからやり直す。
Then, the character recognition circuit 408 is activated again, character images are cut out one by one from the combined image on the image memory 407, and the characteristics of the character images are extracted and compared with the contents stored in the dictionary 409. For a character that can be determined by expanding the character font from the dictionary 409 on the image memory 407, if there are several character candidates, the corresponding character code is stored and the plurality of character codes and the dictionary 4 are stored.
09, the character is determined and the character font is expanded in the image memory 407. If it is not confirmed even by this, a flag indicating that a faint character has occurred is set and a code indicating the area is stored. (When synthesizing image areas, the code indicating the area is the system controller 415
Allocated by. ) (S509) When the replacement of all the character images of the original image is completed,
When there is an unrecognizable character due to faintness (S51
0) The density histogram for the area where the unrecognizable character exists is examined, and the dimming circuit 401 is instructed to reduce the lamp light amount according to the distribution (S512), and the document reading is performed again.

【0037】再度の試行でも確定できなかった場合には
(S511)、その部分を元の文字画像のままとして処
理をする。
If it cannot be confirmed by the second trial (S511), that portion is processed as it is as the original character image.

【0038】それからアクティブマトリクス411のマ
トリクス係数をOCR用に設定変更してから(S51
3)、各プリント動作ユニットを起動してプリント出力
する(S515)。
Then, after changing the matrix coefficient of the active matrix 411 for OCR (S51
3), each print operation unit is activated to print out (S515).

【0039】上記実施例においてはかすれが発生したと
判断したとき、かすれの生じた部分の濃度ヒストグラム
の結果から照明用のランプの光量を変化させていたがプ
リアンプ403のゲインを変化させてもよい。さらにプ
リアンプ403のゲインはRGB各色毎に設定可能とす
れば読み込みの時点で色選択できるようになる。またア
クティブマトリクス411を画像処理回路413の前段
または後段に設けても同様の動作が可能である。ただし
その場合には濃度変換回路412が3系統必要となる。
In the above embodiment, when it is determined that a blur has occurred, the light amount of the illumination lamp is changed based on the result of the density histogram of the blur portion, but the gain of the preamplifier 403 may be changed. . Further, if the gain of the preamplifier 403 can be set for each of the RGB colors, the color can be selected at the time of reading. The same operation can be performed even if the active matrix 411 is provided in the front stage or the rear stage of the image processing circuit 413. However, in that case, three density conversion circuits 412 are required.

【0040】また上記実施例で使用している文字認識用
の辞書409は着脱可能な記憶媒体でも良く、その記憶
媒体は1または複数接続することができる。
The character recognition dictionary 409 used in the above embodiment may be a removable storage medium, and one or more storage media can be connected.

【0041】<実施例2>図6に本発明の第2の実施例
である複写装置制御系のブロック図を示す。操作部61
8のコピーキーが押されるとシステムコントローラ61
7はリーダユニットAを起動し原稿画像の読み込み動作
を起動する。
<Second Embodiment> FIG. 6 is a block diagram of a copying machine control system according to a second embodiment of the present invention. Operation unit 61
When the copy key 8 is pressed, the system controller 61
Reference numeral 7 activates the reader unit A to activate the reading operation of the original image.

【0042】調光回路601で光量を制御されたランプ
で照明された原稿画像はレンズを介してイメージセンサ
602に入力され、RGBの電気信号に変換される。電
気信号に変換された原稿画像はプリアンプ603を介し
てA/D変換器604でディジタル信号に変換され、シ
ェーディング補正回路605で画像信号のシェーディン
グが補正された後RGBの各ラインメモリ606に格納
される。
A document image illuminated by a lamp whose light amount is controlled by a light control circuit 601 is input to an image sensor 602 via a lens and converted into RGB electrical signals. The original image converted into an electric signal is converted into a digital signal by an A / D converter 604 via a preamplifier 603, and after shading of the image signal is corrected by a shading correction circuit 605, it is stored in each RGB line memory 606. It

【0043】ラインメモリ606に格納されている画像
に対して濃度ヒストグラム処理回路608においてライ
ン毎の濃度ヒストグラムが作成されるとともにライン方
向のエッジ検出を行い、RGB3ラインの中でエッジが
シャープと判断された色信号をラインメモリ606から
画像メモリ610に格納できるようにアクティブマトリ
クス609の係数を変化させ、順次ラインメモリ606
からアクティブマトリクス609を介して画像メモリ6
10に格納する。
A density histogram for each line is created in the density histogram processing circuit 608 for the image stored in the line memory 606, and edge detection in the line direction is performed. It is determined that the edge is sharp among the three RGB lines. The coefficient of the active matrix 609 is changed so that the stored color signal can be stored in the image memory 610 from the line memory 606, and the line memory 606 is sequentially changed.
To the image memory 6 via the active matrix 609.
Store in 10.

【0044】アクティブマトリクス609のマトリクス
係数はR:0.3、G:0.59、B:0.11(標準
値)であるがOCR機能が選択されたときは濃度処理回
路608の判定によりRGBのうち一つの係数がスルー
である1となり他のふたつの係数はオフである0とな
る。
The matrix coefficients of the active matrix 609 are R: 0.3, G: 0.59, B: 0.11 (standard value). However, when the OCR function is selected, the density processing circuit 608 makes a determination of RGB. One of the coefficients is a through 1 and the other two are off.

【0045】すべての画像信号が画像メモリ610に格
納されたところで、システムコントローラ617は文字
認識回路611を起動し、文字認識回路611の機能の
一つである像域分割処理により画像メモリ610に格納
されている原稿画像を文字領域と文字以外の領域に分割
する。
When all the image signals have been stored in the image memory 610, the system controller 617 activates the character recognition circuit 611 and stores them in the image memory 610 by the image area division processing which is one of the functions of the character recognition circuit 611. The original image is divided into a character area and a non-character area.

【0046】さらにシステムコントローラ617は再度
文字認識回路611を起動し、画像メモリ610上の文
字領域と判断された領域の画像から1文字づつ文字画像
を切り出し、辞書612と比較して対応する文字フォン
ト画像に文字画像を置き換える。
Further, the system controller 617 activates the character recognition circuit 611 again, cuts out a character image for each character from the image of the area determined to be the character area on the image memory 610, compares it with the dictionary 612, and compares it with the corresponding character font. Replace text image with image.

【0047】原稿画像すべての文字画像の置き換えが終
了したとき、かすれなどによる認識不能文字がある場
合、認識不能文字の存在するラインの濃度ヒストグラム
を調べ、その分布に応じて調光回路601にランプ光量
を減少させるように指示をして、再度原稿取り込みから
やり直す。再度の試行でも確定できなかった場合にはそ
の部分を元の文字画像のままとして処理を先に進める。
When all the character images of the original image have been replaced, if there are unrecognizable characters due to blurring, the density histogram of the line where the unrecognizable characters are present is checked, and the dimming circuit 601 is ramped according to the distribution. Instruct to reduce the light intensity, and try again from the original capture. If it cannot be confirmed by the second trial, the portion is left as it is and the process proceeds.

【0048】OCR機能が選択されているときスイッチ
613はb側に切り替わり、画像メモリ610の記憶内
容がプリンタユニットBに出力可能となる。
When the OCR function is selected, the switch 613 is switched to the b side, and the contents stored in the image memory 610 can be output to the printer unit B.

【0049】画像メモリ610から順次読み出された文
字画像は濃度変換回路614で輝度濃度変換をし、画像
処理回路615で文字画像に操作部Cで設定された各種
画像を施し、画像記録部616(プリンタユニットB)
にその文字画像を送り込む。画像記録部616では、そ
の文字画像によりレーザ光を変調して記録用紙に記録す
る。
A character image sequentially read from the image memory 610 is subjected to brightness / density conversion by a density conversion circuit 614, various image set by the operation unit C is applied to the character image by an image processing circuit 615, and an image recording unit 616. (Printer unit B)
Send the character image to. The image recording unit 616 modulates the laser light with the character image and records it on a recording sheet.

【0050】以上の動作を図7および図8に示すシステ
ムコントローラ617の動作フローチャートを用いてさ
らに説明する。
The above operation will be further described with reference to operation flowcharts of the system controller 617 shown in FIGS.

【0051】動作スタンバイ状態においてアクティブマ
トリクス609のマトリクス係数を標準値にし(S70
1)、コピーがスタートされるのを待機する(S70
2)。
In the operation standby state, the matrix coefficient of the active matrix 609 is set to the standard value (S70
1) Waiting for copying to start (S70)
2).

【0052】操作部Cのコピースタートキーが押される
とOCR機能がオンされているかを調べ(S703)、
リーダユニットAを起動させ、入力画像のライン数をセ
ットする(S704)。
When the copy start key of the operation section C is pressed, it is checked whether the OCR function is turned on (S703),
The reader unit A is activated and the number of lines of the input image is set (S704).

【0053】リーダユニットAから読み込まれた1ライ
ン分の原稿画像はシェーディング補正された後ラインメ
モリ606に格納する(S705)。
The original image for one line read from the reader unit A is stored in the line memory 606 after being subjected to shading correction (S705).

【0054】濃度ヒストグラム処理回路608を起動
し、ラインメモリ606に格納されている画像データを
順次読みだしライン毎の濃度ヒストグラムを作成する
(S706)とともにライン方向のエッジ検出を行い
(S707)、RGB3ラインの中でエッジがシャープ
と判断された色信号をラインメモリ606から画像メモ
リ610に格納できるようにアクティブマトリクス60
9の係数を変化させ(S708)、順次ラインメモリ6
06からアクティブマトリクス609を介して画像メモ
リ610に格納する(S709)。
The density histogram processing circuit 608 is activated to sequentially read the image data stored in the line memory 606 to create a density histogram for each line (S706) and to detect an edge in the line direction (S707), and RGB3 An active matrix 60 is provided so that a color signal whose edge is determined to be sharp in a line can be stored in the image memory 610 from the line memory 606.
The coefficient of 9 is changed (S708), and the line memory 6
The data is stored in the image memory 610 from 06 via the active matrix 609 (S709).

【0055】すべての画像信号が画像メモリ610に格
納されたところで(S710)、文字認識回路611を
起動し、文字認識回路611の機能の一つである像域分
割処理により画像メモリ610に格納されている原稿画
像を文字領域と文字以外の領域に分割した後、文字領域
と判断された領域の画像から1文字づつ文字画像を切り
出し(S711)、辞書612と比較して対応する文字
を選び出し(S712)、その文字フォント画像でもっ
て切りだした文字画像を置き換える(S713)。
When all the image signals have been stored in the image memory 610 (S710), the character recognition circuit 611 is activated and stored in the image memory 610 by the image area division processing which is one of the functions of the character recognition circuit 611. After dividing the original image into a character region and a region other than the character region, a character image is cut out one by one from the image of the region determined to be the character region (S711), and the corresponding character is selected by comparing with the dictionary 612 ( In step S712, the character image cut out with the character font image is replaced (S713).

【0056】ここで文字候補がいくつかある場合は対応
する文字コードを記憶しておき複数の文字コードと辞書
612とを比較して文字を確定し文字フォントと切りだ
した文字画像を置き換える。これによっても確定されな
い場合はかすれ文字が発生したことを示すフラグをセッ
トしその領域を示すコードを記憶する。(画像領域を合
成する際その領域を示すコードがシステムコントローラ
617により割当てられている。) 原稿画像すべての文字画像の置き換えが終了したとき、
かすれなどによる認識不能文字がある場合(S71
4)、認識不能文字の存在する領域に対する濃度ヒスト
グラムを調べ、その分布に応じて調光回路601にラン
プ光量を減少させるように指示をして(S716)、再
度原稿取り込みからやり直す。
If there are several character candidates, the corresponding character code is stored and a plurality of character codes are compared with the dictionary 612 to determine the character and the character font and the cut out character image are replaced. If it is not confirmed even by this, a flag indicating that a faint character has occurred is set and a code indicating the area is stored. (When synthesizing image areas, a code indicating the area is assigned by the system controller 617.) When the replacement of all the character images of the original image is completed,
When there is an unrecognizable character due to faintness (S71
4) The density histogram for the area where the unrecognizable character is present is examined, and the light control circuit 601 is instructed to reduce the lamp light quantity according to the distribution (S716), and the original reading is performed again.

【0057】再度の試行でも確定できなかった場合には
(S715)、その部分を元の文字画像のままとして処
理をする。
If it cannot be confirmed by the second trial (S715), that portion is processed as it is as the original character image.

【0058】それから各プリント動作ユニットを起動し
てプリント出力する(S718)。
Then, each print operation unit is activated to print out (S718).

【0059】上記実施例においてはかすれが発生したと
判断したとき、かすれの生じた部分の濃度ヒストグラム
の結果から照明用のランプの光量を変化させていたがプ
リアンプ603のゲインを変化させてもよい。
In the above embodiment, when it is determined that the blur has occurred, the light amount of the illumination lamp is changed based on the result of the density histogram of the blur portion, but the gain of the preamplifier 603 may be changed. .

【0060】また図6のブロック図におけるシステムコ
ントローラ617の動作として図9,図10のフローチ
ャートに示す動作によっても本発明を実施することが可
能である。以下図9,図10のフローチャートを用いて
説明する。
The present invention can also be implemented by the operation shown in the flowcharts of FIGS. 9 and 10 as the operation of the system controller 617 in the block diagram of FIG. This will be described below with reference to the flowcharts of FIGS. 9 and 10.

【0061】動作スタンバイ状態においてアクティブマ
トリクス609のマトリクス係数を標準値にし(S80
1)、コピーがスタートされるのを待機する(S80
2)。
In the operation standby state, the matrix coefficient of the active matrix 609 is set to the standard value (S80
1) Wait for copying to start (S80)
2).

【0062】操作部Cのコピースタートキーが押される
とOCR機能がオンされているかを調べ(S803)、
リーダユニットAを起動させ、入力画像のライン数をセ
ットする(S804)。
When the copy start key of the operation section C is pressed, it is checked whether the OCR function is turned on (S803),
The reader unit A is activated and the number of lines of the input image is set (S804).

【0063】それからランプの光量を標準光量にする
(S805)。
Then, the light quantity of the lamp is set to the standard light quantity (S805).

【0064】リーダユニットAから読み込まれた1ライ
ン分の原稿画像はシェーディング補正された後ラインメ
モリ606に格納する(S806)。
The original image for one line read from the reader unit A is shading-corrected and then stored in the line memory 606 (S806).

【0065】濃度ヒストグラム処理回路608を起動
し、ラインメモリ606に格納されている画像データを
順次読みだしライン毎の濃度ヒストグラムを作成する
(S807)とともにライン方向のエッジ検出を行う
(S808)。それからRGB3ラインの中でエッジが
シャープと判断された色信号のシャープさが所定のレベ
ルに達していない場合(S809)、かすれなどによる
認識不能文字が発生する恐れがあるとして濃度ヒストグ
ラムを調べ、その分布に応じて調光回路601にランプ
光量を減少させるように指示をして(S811)、再度
原稿取り込み(S806)からやり直す。
The density histogram processing circuit 608 is activated to sequentially read the image data stored in the line memory 606 to create a density histogram for each line (S807) and to detect an edge in the line direction (S808). Then, if the sharpness of the color signal whose edges are determined to be sharp in the RGB3 lines has not reached a predetermined level (S809), it is determined that unrecognizable characters due to blurring may occur, and the density histogram is checked. The light control circuit 601 is instructed to reduce the lamp light amount according to the distribution (S811), and the document reading process is repeated (S806).

【0066】再度の試行でも確定できなかった場合には
(S810)、その部分を元の文字画像のままにして処
理をする。
If it cannot be confirmed even by the second trial (S810), the portion is left as it is and the original character image is processed.

【0067】それからラインメモリ606から画像メモ
リ610に格納できるようにアクティブマトリクス60
9の係数を変化させ(S812)、順次ラインメモリ6
06からアクティブマトリクス609を介して画像メモ
リ610に格納する(S813)。
Then, the active matrix 60 can be stored in the image memory 610 from the line memory 606.
The coefficient of 9 is changed (S812), and the line memory 6
The data is stored in the image memory 610 from 06 via the active matrix 609 (S813).

【0068】すべての画像信号が画像メモリ610に格
納されたところで(S814)、文字認識回路611を
起動し、文字認識回路611の機能の一つである像域分
割処理により画像メモリ610に格納されている原稿画
像を文字領域と文字以外の領域に分割した後、文字領域
と判断された領域の画像から1文字づつ文字画像を切り
出し(S815)、辞書612と比較して対応する文字
を選び出し(S816)、その文字フォント画像でもっ
て切りだした文字画像を置き換える(S817)。
When all the image signals are stored in the image memory 610 (S814), the character recognition circuit 611 is activated and stored in the image memory 610 by the image area division processing which is one of the functions of the character recognition circuit 611. After dividing the original image into a character region and a region other than the character region, a character image is cut out one by one from the image of the region determined to be the character region (S815), and the corresponding character is selected by comparing with the dictionary 612 ( (S816), the character image cut out by the character font image is replaced (S817).

【0069】ここで文字候補がいくつかある場合は対応
する文字コードを記憶しておき複数の文字コードと辞書
612とを比較して文字を確定し文字フォントと切りだ
した文字画像を置き換える。これによっても確定されな
い場合はかすれ文字が発生したことを示すフラグをセッ
トしその領域を示すコードを記憶する。(画像領域を合
成する際その領域を示すコードがシステムコントローラ
617により割当てられている。)原稿画像すべての文
字画像の置き換えが終了してから各プリント動作ユニッ
トを起動してプリント出力する(S819)。
If there are several character candidates, the corresponding character code is stored and a plurality of character codes are compared with the dictionary 612 to determine the character and the character font and the cut out character image are replaced. If it is not confirmed even by this, a flag indicating that a faint character has occurred is set and a code indicating the area is stored. (When the image areas are combined, a code indicating the area is assigned by the system controller 617.) After the replacement of all the character images of the original image is completed, each print operation unit is activated to print out (S819). .

【0070】上記例においてはかすれが発生しそうと判
断したとき、そのラインの濃度ヒストグラムの結果から
照明用のランプの光量を変化させていたがプリアンプ6
03のゲインを変化させてもよい。
In the above example, when it is determined that a blur is likely to occur, the light quantity of the illumination lamp is changed from the result of the density histogram of that line.
The gain of 03 may be changed.

【0071】[0071]

【発明の効果】以上説明したように本発明によれば、カ
ラー原稿の文字認識に際して適応的に原稿色成分を選択
し高率で文字認識することができる。
As described above, according to the present invention, it is possible to adaptively select a document color component for character recognition of a color document and to perform character recognition at a high rate.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明を実施した複写装置の外観図である。FIG. 1 is an external view of a copying apparatus embodying the present invention.

【図2】本発明を実施した複写装置の内部断面図であ
る。
FIG. 2 is an internal sectional view of a copying apparatus embodying the present invention.

【図3】本発明を実施した複写装置の操作部を示す図で
ある。
FIG. 3 is a diagram showing an operation unit of a copying apparatus embodying the present invention.

【図4】本発明の第1実施例の回路ブロック図である。FIG. 4 is a circuit block diagram of a first embodiment of the present invention.

【図5】同動作フローチャートである。FIG. 5 is a flowchart of the same operation.

【図6】本発明の第2実施例の回路ブロック図である。FIG. 6 is a circuit block diagram of a second embodiment of the present invention.

【図7】同動作フローチャートの一部を示す図である。FIG. 7 is a diagram showing a part of the same operation flowchart.

【図8】残りの動作フローチャートである。FIG. 8 is a remaining operation flowchart.

【図9】別の動作フローチャートの一部を示す図であ
る。
FIG. 9 is a diagram showing a part of another operation flowchart.

【図10】残りの動作フローチャートである。FIG. 10 is a remaining operation flowchart.

【図11】従来の回路ブロック図である。FIG. 11 is a conventional circuit block diagram.

【符号の説明】[Explanation of symbols]

401 調光回路 402 イメージセンサ 404 A/D変換器 407 画像メモリ 408 文字認識回路 409 辞書 410 濃度ヒストグラム処理回路 411 アクティブマトリクス 415 システムコントローラ 401 Light control circuit 402 Image sensor 404 A / D converter 407 Image memory 408 Character recognition circuit 409 Dictionary 410 Density histogram processing circuit 411 Active matrix 415 System controller

フロントページの続き (72)発明者 芹澤 雅弘 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 金子 徳治 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 岸本 浩彦 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 平 昌宣 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 佐藤 明彦 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 松井 規明 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 水野 善夫 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 深田 泰生 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 細見 芳弘 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内Front page continuation (72) Inventor Masahiro Serizawa 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Tokuharu Kaneko 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Hirohiko Kishimoto 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Masanori Hira 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Invention Akihiko Sato 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Noriaki Matsui 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Yoshio Mizuno Inventor 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Yasushi Fukada 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Yoshihiro Hosomi Ota-ku, Tokyo Shimomaruko 3-30-2 Canon Inc.

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】 複数の色成分毎に原稿画像を入力するた
めの画像入力手段、該入力手段により入力した原稿画像
を記憶するための1または複数の画像記憶手段、該画像
記憶手段内の原稿画像における文字領域と文字以外の領
域を分割する像域分離手段、文字マッチング用のフォン
トを記憶している辞書手段、前記画像記憶手段内の文字
領域から1文字づつ切り出した後その特徴を抽出し前記
辞書手段と比較して文字を認識する文字認識手段、前記
画像記憶手段内の文字領域の濃度ヒストグラムを作成す
るとともに文字認識用のしきい値を演算する濃度ヒスト
グラム処理手段、および前記文字認識手段により認識で
きない文字が発生した場合前記画像入力手段の原稿画像
の読み取り濃度を変更する手段を具えたことを特徴とす
る原稿画像入力装置。
1. An image input unit for inputting a document image for each of a plurality of color components, one or a plurality of image storage units for storing a document image input by the input unit, and a document in the image storage unit. Image area separating means for dividing a character area and a non-character area in an image, a dictionary means for storing a font for character matching, a character area is extracted from the character area in the image storing means, and the characteristics thereof are extracted. Character recognition means for recognizing characters in comparison with the dictionary means, density histogram processing means for creating a density histogram of a character area in the image storage means and calculating a threshold value for character recognition, and the character recognition means A document image input device comprising means for changing the reading density of the document image of the image inputting means when an unrecognizable character occurs. .
【請求項2】 請求項1において、前記読み取り濃度変
更手段が原稿照明光源の調光手段であることを特徴とす
る原稿画像入力装置。
2. The document image input device according to claim 1, wherein the reading density changing unit is a light adjusting unit of a document illumination light source.
【請求項3】 請求項1において、前記読み取り濃度変
更手段がイメージセンサ出力の増幅手段であることを特
徴とする原稿画像入力装置。
3. The original image input device according to claim 1, wherein the reading density changing means is an amplifying means of an image sensor output.
【請求項4】 請求項1において、前記辞書手段が着脱
可能であることを特徴とする原稿画像入力装置。
4. The document image input device according to claim 1, wherein the dictionary means is removable.
【請求項5】 請求項1において、前記文字認識手段が
文字を認識した後前記辞書手段内のフォントで前記原稿
の文字画像を置き換えることを特徴とする原稿画像入力
装置。
5. The manuscript image input device according to claim 1, wherein after the character recognition means recognizes a character, the character image of the manuscript is replaced with a font in the dictionary means.
【請求項6】 複数の色成分毎に原稿画像を入力するた
めの画像入力手段、該入力手段により入力した複数の色
成分の原稿画像を各1ライン分記憶するためのラインメ
モリ、該ラインメモリに記憶された各色画像毎に濃度ヒ
ストグラムを作成するとともにライン方向の高周波成分
を検出し文字認識用のしきい値と文字認識用の色の原稿
画像を選択する処理手段、該処理手段により選択された
色の原稿画像を一画面記憶するための画像記憶手段、該
画像記憶手段内の画像から文字領域と文字以外の領域を
分割する像域分離手段、文字マッチング用のフォントを
記憶している辞書手段、および前記画像記憶手段内の文
字領域から1文字づつ切り出した後その特徴を抽出し前
記辞書手段と比較して文字を認識する文字認識手段を有
することを特徴とする原稿画像入力装置。
6. An image input unit for inputting an original image for each of a plurality of color components, a line memory for storing one line of each original image of a plurality of color components input by the input unit, and the line memory. A processing means for creating a density histogram for each color image stored in the memory and detecting a high-frequency component in the line direction to select a threshold for character recognition and a document image of a color for character recognition, selected by the processing means. Image storage means for storing one color original image in one screen, image area separation means for dividing a character area and a non-character area from the image in the image storage means, and a dictionary storing character matching fonts. Means and character recognition means for recognizing characters by extracting the characteristics of each character after cutting out one character from the character area in the image storage means and comparing with the dictionary means. Document image input device.
【請求項7】 請求項6において、前記文字認識手段が
認識できない文字が発生した場合入力原稿画像の読み取
り濃度を変更する手段を有することを特徴とする原稿画
像入力装置。
7. The manuscript image input device according to claim 6, further comprising means for changing a reading density of an input manuscript image when a character that cannot be recognized by the character recognition means is generated.
【請求項8】 請求項7において、前記読み取り濃度変
更手段が原稿照明光源の調光手段であることを特徴とす
る原稿画像入力装置。
8. The document image input device according to claim 7, wherein the reading density changing unit is a light adjusting unit of a document illumination light source.
【請求項9】 請求項7において、前記読み取り濃度変
更手段がイメージセンサ出力の増幅手段であることを特
徴とする原稿画像入力装置。
9. The document image input device according to claim 7, wherein the reading density changing unit is an image sensor output amplifying unit.
【請求項10】 請求項6において、前記辞書手段が着
脱可能であることを特徴とする原稿画像入力装置。
10. The document image input device according to claim 6, wherein the dictionary means is removable.
【請求項11】 請求項6において、前記文字認識手段
が文字を認識した後前記辞書手段のフォントで原稿の文
字画像を置き換えることを特徴とする原稿画像入力装
置。
11. The document image input device according to claim 6, wherein the character recognition unit replaces the character image of the document with the font of the dictionary unit after recognizing the character.
【請求項12】 原稿画像の通常入力モードと文字認識
モードを切り替えるための手段とその表示手段とを有す
ることを特徴とする原稿画像入力装置。
12. An original image input device comprising: means for switching between a normal input mode and a character recognition mode of an original image and a display means for the means.
JP5270808A 1993-10-28 1993-10-28 Document picture input device Pending JPH07129719A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5270808A JPH07129719A (en) 1993-10-28 1993-10-28 Document picture input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5270808A JPH07129719A (en) 1993-10-28 1993-10-28 Document picture input device

Publications (1)

Publication Number Publication Date
JPH07129719A true JPH07129719A (en) 1995-05-19

Family

ID=17491310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5270808A Pending JPH07129719A (en) 1993-10-28 1993-10-28 Document picture input device

Country Status (1)

Country Link
JP (1) JPH07129719A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010166550A (en) * 2009-01-16 2010-07-29 Genesys Logic Inc Image processor having optical source intensity compensation function, intensity compensation apparatus, scanning system and method of the same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010166550A (en) * 2009-01-16 2010-07-29 Genesys Logic Inc Image processor having optical source intensity compensation function, intensity compensation apparatus, scanning system and method of the same

Similar Documents

Publication Publication Date Title
US6011877A (en) Apparatus and method for determining the directional orientation of a document image based upon the location of detected punctuation marks within the document image
US6798905B1 (en) Document orientation recognizing device which recognizes orientation of document image
US6504628B1 (en) Color image-forming apparatus capable of discriminating the colors of the original image
US6249353B1 (en) Image editing apparatus
JPH07152865A (en) Device and method for recognizing information
KR100306063B1 (en) Image processing method and apparatus
US6377705B1 (en) Image processing apparatus and method and computer-readable memory
JP3684036B2 (en) Image processing apparatus and image processing method
JP2000298702A (en) Image processing device and method therefor, and computer-readable memory
JPH10178538A (en) Image processing unit and layout processing method for the same unit
JP3343367B2 (en) Image direction determining method and apparatus using vertical and horizontal direction data
JPH07129719A (en) Document picture input device
JPH06189083A (en) Device and method for recognizing image direction
JP3787440B2 (en) Image processing apparatus and image processing method
JP3629962B2 (en) Image recognition device
JP3629969B2 (en) Image recognition device
JPH11213089A (en) Image processor and its method
JPH10117281A (en) Image-forming method and device
KR101360516B1 (en) Image processing apparatus, image processing method, and storage medium
JPH11220557A (en) Image processing unit and method
JP2000339402A (en) Picture processor, picture processing method and computer readable memory
JP2000022899A (en) Image recognition device
JP2001134026A (en) Device and method for image processing and storing medium that can be read by computer
JP2003141444A (en) Image processing device, control method of image processing device, program and storage medium
JP2002142070A (en) Image transmission system and image transmitter and method for them