JP3774502B2 - Image processing apparatus and method - Google Patents

Image processing apparatus and method Download PDF

Info

Publication number
JP3774502B2
JP3774502B2 JP09412396A JP9412396A JP3774502B2 JP 3774502 B2 JP3774502 B2 JP 3774502B2 JP 09412396 A JP09412396 A JP 09412396A JP 9412396 A JP9412396 A JP 9412396A JP 3774502 B2 JP3774502 B2 JP 3774502B2
Authority
JP
Japan
Prior art keywords
input image
processing
determination
image
predetermined time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09412396A
Other languages
Japanese (ja)
Other versions
JPH09282468A (en
Inventor
ゆかり 戸田
真琴 高岡
茂雄 福岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP09412396A priority Critical patent/JP3774502B2/en
Publication of JPH09282468A publication Critical patent/JPH09282468A/en
Application granted granted Critical
Publication of JP3774502B2 publication Critical patent/JP3774502B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は画像処理装置およびその方法に関し、例えば、画像の向を判定する画像処理に関する。
【0002】
【従来の技術】
近年、複写機のインテリジェント化が進み、複数の原稿を一枚にレイアウトしたり、両面コピーしたりなど、いろいろな機能が備わるとともに、ADF(Automatic Document Feeder)の充実により自動化、高速化も進んでいる。
【0003】
このような高機能な複写機を効率よく利用するためには、その複写機が原稿の向きを判定してくれることが重要になる。例えば、ADFを利用し、図1に示すように、4in1という画像処理機能により20枚の原稿を四枚ずつレイアウトして、五枚のプリントアウトにして出力する場合、原稿の向きが自動的に判定できれば、原稿を上向きにそろえて置いたり、縦書き、横書きを考慮して並べ替えたりするユーザの手間を省くことができる。
【0004】
原稿の向きを判定する方法には、大きく分けて、レイアウトを利用する方法と、OCR(光学的文字認識)を利用する方法とある。
【0005】
【発明が解決しようとする課題】
しかし、上述した技術においては、次のような問題点がある。つまり、レイアウトを利用して原稿の向きを判定する方法は、簡単なビジネス文書ならば問題ないが、凝ったデザインの複雑なレイアウトの原稿の方向を判定することはできない。
【0006】
一方、OCRを利用して原稿の向きを判定する方法は、原稿画像を二値化した画像から文字領域を抽出する文字抽出処理とOCR処理に時間がかかり、複写機の複写スピードに合ったリアルタイム処理が難しく、複写機の複写スピードのボトルネックになってしまう欠点がある。
【0007】
本発明は、複写処理スピード低下を防ぐことを目的とする。
【0008】
【課題を解決するための手段】
本発明は、前記の目的を達成する一手段として、以下の構成を備える。
【0009】
本発明にかかる画像処理装置は、入力画像から各文字領域を抽出し、当該抽出された各文字領域に対して文字認識を行って、当該各文字領域の方向を判定することにより、前記入力画像の方向判定結果を出力する処理手段と、前記処理手段で出力された方向判定結果を用いて、前記入力画像の複写処理を制御する制御手段とを有し、前記入力画像の方向の判定が所定時間内に終了しない場合、前記処理手段はそれまでに得られた中間方向判定結果を出力し、前記制御手段は前記所定時間内に入力画像の方向の判定が終了しない場合に関する予め設定されたユーザの指示に基づき、前記出力手段で出力された中間方向判定結果を用いて前記入力画像の複写処理を制御することを特徴とする。
【0010】
本発明にかかる画像処理方法は、入力画像から文字領域を出して、当該抽出された各文字領域に対して文字認識を行って、当該各文字領域の向を判定することにより、前記入力画像の向判定結果を出力する処理ステップと前記処理ステップで出力された方向判定結果を用いて、前記入力画像の複写処理を制御する制御ステップとを有し、前記入力画像の向の判定が所定時間内に終了しない場合、前記処理ステップはそれまでに得られた中間方向判定結果を出力し、前記制御ステップは、前記所定時間内に入力画像の向の判定終了しない場合に関する予め設定されたユーザの指示に基づき、前記処理ステップで出力された中間方向判定結果を用いて前記入力画像の複写処理を制御することを特徴とする。
【0011】
【発明の実施の形態】
以下、本発明にかかる一実施形態の画像処理装置を図面を参照して詳細に説明する。
【0012】
【第1実施形態】
図2は本実施形態の方向判定装置の構成例を示すブロック図で、機能拡張カードとして提供され、複写機の機能拡張スロットに挿入することにより、その複写機に原稿の向きを認識させる機能を追加することができる。
【0013】
同図において、複写機201は、画像メモリおよび各種の画像処理機能をもち、2in1(一枚に原稿二枚分の画像を複写する処理)、4in1、回転、鏡像などの画像処理が可能である。
【0014】
方向判定カード202は、複写機201から8ビットの多値画像データ、クロックCLK、主走査方向同期信号HSYNC、主走査方向イネーブル信号VE、ページイネーブル信号PE、3ビットのアドレスADDR、および、8ビットのデータDATAなどの信号を受取ることができる。そして、原稿の向きの判定結果として、方向(0度,90度,180度および270度)を示す2ビット信号、組方向(縦書および横書)を示す1ビット信号および自信度を示す1ビット信号を返す。なお、これら信号の種類や、そのビット数は一例であり、これに限られるものではない。
【0015】
上記の信号ADDRとDATAに関して、上記のビット幅であれば、八種類のデータを複写機201から受取ることができる。八種類のデータとしては、例えば、画像サイズ、画像横サイズ、画像縦サイズ、画像横ズーム、画像縦ズームなどが考えられるが、以下の説明においては、信号ADDRはなしとし、信号DATAには処理限定時間TLIMITを示す8ビットが送られるとする。つまり、方向判定カード202は、次頁の原稿サイズに適した処理限定時間(TLIMIT)を、信号PEの立ち下がりで受取ることにする。
【0016】
二値化回路2021は、複写機201から受取った多値画像データを二値化する。二値メモリ2022は、二値化回路2021により二値化された画像データを記憶する。文字検出回路2023は、複写機201から受取った多値画像データから文字領域を検出し、その文字領域を表す座標データを出力する。文字領域座標メモリ2024は、文字検出回路2023により出力された文字領域を表す座標データを記憶する。なお、複写機201から方向判定カード202へ渡される画像データは、複写機201により二値化された画像データであっても構わない。
【0017】
CPU2025は、RAM2026をワークメモリに使用し、ROM2027に予め格納されたプログラムに従い、文字領域座標メモリ2024から座標データを読出し、その座標データに従って、二値メモリ2022から二値画像データを読出すなどの各種処理を実行する。つまり、CPU2025は、ROM2027に格納された文字認識プログラムにより方向判定処理を行い、方向判定を終了した場合、または、後述するタイマ2028からの割込信号により判定処理を終了した場合、方向判定の結果を出力する。
【0018】
タイマ2028は、ページイネーブル信号(PE)の立ち下がりにおいて、複写機201から処理限定時間(TLIMIT)を受取り、例えば、TLIMITをカウントダウンすることによりTLIMITにより指定された時間の経過を判定し、指定された時間が経過するとCPU2025へ割込信号を送る。
【0019】
図3は方向判定カード202の第二の構成例を示すブロック図で、方向判定にかかる処理をソフトウェアで行う場合の構成である。方向判定ソフトウェアとしては、文字領域判定を行い、OCRを使用して方向判定するものや、レイアウト解析を行い方向判定するものなどを利用することができる。
【0020】
図4は方向判定カード202の第三の構成例を示すブロック図で、方向判定にかかる処理をハードウェア(方向判定回路2029)で行う場合の構成である。ハードウェアの処理としても、ソフトウェアの場合と同様に、文字領域判定を行い、OCRを使用して方向判定するものや、レイアウト解析を行い方向判定するものなどを利用することができる。
【0021】
勿論、図3および図4に示す構成において、方向判定カード202に二値化回路2021をもたせ、複写機201から入力された多値画像データを二値化させることもできる。また、方向判定カード202に多値のバンドメモリ(あるいはページメモリ)をもたせ、ソフトウェアにより、複写機201から入力された多値画像データから方向判定を行ってもよい。
【0022】
図5は方向判定カード202の詳細な構成例を示すブロック図である。
【0023】
同図において、符号Aで示す矩形に囲まれた部分はワンチップで構成され、そのワンチップには、少なくとも、図2に示した二値化回路2021、文字検出回路2023および文字座標領域メモリ2024が含まれている。
【0024】
閾値決定回路101は、入力多値画素データから二値化閾値およびエッジを検出するための差閾値を決定する。この二値化閾値は、二値化回路2021の二値化処理に利用される。エッジ検出回路102は、クロックCLKに同期し、差閾値を用いて入力多値画素データから高周波検出処理を行う。エッジ座標記憶部103は、エッジ検出回路102により検出されたエッジの座標データを記憶する。領域情報記憶部104は、既に検出されたエッジ座標を結合した結果作成される領域情報を記憶する。
【0025】
図6は結合処理回路105の処理を説明するための図で、結合処理回路105は、エッジ座標記憶部103に記憶された座標データ701〜704および712と、領域情報記憶部104に記憶された座標データ705〜708および713とを比較して、結合すべきと判断した座標データを結合した後、結合した座標データ(符号709〜715の太線で示す領域)を領域情報記憶部104へ格納する。
【0026】
つまり、図5に符号Aで示す構成(文字検出回路2023および二値化回路2021)により、入力された画像データは二値化されて二値メモリ2022へ格納されるとともに、その文字領域の座標データが文字領域座標メモリ2024へ格納される。
【0027】
例えば、図7Aに示すような文書の画像データに対して文字検出処理を行うと、図7Bに示すような矩形情報が得られる。そして、CPU2025は、文字領域座標メモリ2024に格納されている座標データに従って、二値メモリ2022から画像データを読出し、OCR処理を行う。CPU2025は、二値メモリ2025から読出した各文字領域の二値画像データに対して四方向のOCR処理を行い、ROM2027などに辞書として格納された文字情報に一番近い結果が得られる方向を、それら文字領域の向きとして、判定結果を出力する。
【0028】
図8は本システムのタイミングチャート例を示す図で、符号801はイメージスキャナ(CCD)からの画像入力を、符号802はスキャナから入力された多値画像データの二値値化処理を、符号803は文字抽出処理を、符号804はOCR処理を、それぞれ示す。つまり、スキャナからの入力801に同期して、リアルタイムに文字抽出処理803を行い、抽出された文字領域に四方向のOCR処理804を行い、文書画像の向き、および、縦書き横書きなどを識別する。
【0029】
ここで、ROM2027に格納されたプログラムは、CPU2025のOCRによる方向判定処理が、所定時間(TLIMIT)内に終了することを目指して設計されている。しかし、所定時間内に方向判定処理が終了しなかった(タイマ2028から割込まれた)場合、CPU2025は、それまでのに得られた方向および組方向(中間結果)と、自信度‘0’(自信なしの意味)とからなる判定結果を返す。なお、TLIMITは、複写機201の原稿スキャン動作を停止させないように設定されるものである。
【0030】
複写機201は、方向判定カード202から送られてくる判定結果の自信度に応じて、ユーザに設定された指示に従い、実行中の複写処理を制御することができる。例えば、処理を開始する前に、自信度が‘0’の場合は処理を中止するように指示されていれば複写処理を中止し、自信度を無視するように指示されていれば複写処理を継続する。
【0031】
以上説明したように、本実施形態によれば、OCRを利用して原稿の向きを判定するので、凝ったデザインの複雑なレイアウトの原稿の向きを判定することができ、複写機の複写スピードに合わせてリアルタイムに原稿の向きを判定することができる。そして、もし所定時間内に原稿の向きを判定する処理を終了することができなかった場合は、それまでに得られた判定結果(中間結果)を出力するので、複写スピードを低下させることはない。
【0032】
また、例えば図3に示した構成により文字抽出処理を行う場合、画像の解像度を低下させることで、例えば図7Aに示した画像から図9に示すような画像を生成して、文字を相互に結合して輪郭線追跡を行い、得られた個々の結合領域の縦横比が大きい場合に文字と判定する方法を用いることもできる。
【0033】
また、上述した実施形態においては、複写機201に方向判定カード202を挿入する例を説明したが、本発明はこれに限定されるものではなく、イメージスキャナ、プリンタ、コンピュータから構成されるシステムに適用することもでき、その場合、方向判定カード202はコンピュータのスロットに挿入されることになる。あるいは、コンピュータ上で稼働するプログラムによって原稿の向きが判定されることになる。
【0034】
さらに、イメージスキャナとコンピュータで構成されるシステムにおいて、イメージスキャナにより読込まれた画像の向きを判定し、その判定結果に基づいて、コンピュータに接続されたハードディスクなどの記憶媒体に格納するシステムでもよい。また、コンピュータから入力された画像の向きを判定して、その判定結果に基づいて、プリントアウトを行うプリンタでもよい。
【0035】
【他の実施形態】
なお、本発明は、複数の機器(例えばホストコンピュータ,インタフェイス機器,リーダ,プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機,ファクシミリ装置など)に適用してもよい。
【0036】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク,ハードディスク,光ディスク,光磁気ディスク,CD-ROM,CD-R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0037】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0038】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0039】
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードを格納することになるが、簡単に説明すると、図10のメモリマップ例に示す各モジュールを記憶媒体に格納することになる。すなわち、少なくとも「二値化」「文字領域検出」「文字画像データ読出」および「画像方向判定」の各モジュールのプログラムコードを記憶媒体に格納すればよい。
【0040】
【発明の効果】
以上説明したように、本発明によれば、複写処理スピード低下を防ぐことができる。
【図面の簡単な説明】
【図1】画像処理機能を説明するための図、
【図2】本発明にかかる一実施形態の方向判定装置の構成例を示すブロック図、
【図3】図2に示す方向判定カードの第二の構成例を示すブロック図、
【図4】図2に示す方向判定カードの第三の構成例を示すブロック図、
【図5】図2に示す方向判定カードの詳細な構成例を示すブロック図、
【図6】図5に示す結合処理回路の処理を説明するための図、
【図7A】文字検出処理を説明するための図、
【図7B】文字検出処理を説明するための図、
【図8】本システムのタイミングチャート例を示す図、
【図9】文字抽出処理の他の方法を説明する図、
【図10】本発明にかかるプログラムコードを格納した記憶媒体のメモリマップ例を示す図である。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus and method, for example, it relates to determining the image processing the direction of the image.
[0002]
[Prior art]
In recent years, the copier has become more intelligent, has various functions such as laying out multiple originals on one sheet, copying on both sides, and automation and speeding up due to the enhancement of ADF (Automatic Document Feeder). Yes.
[0003]
In order to efficiently use such a high-function copying machine, it is important that the copying machine determines the orientation of the document. For example, when using ADF and laying out 20 originals by 4in1 with an image processing function called 4in1 and outputting them as 5 printouts as shown in Fig. 1, the orientation of the originals is automatically If the determination can be made, it is possible to save the user's trouble of arranging the originals upward or rearranging them in consideration of vertical writing and horizontal writing.
[0004]
The method for determining the orientation of an original can be broadly divided into a method using a layout and a method using OCR (optical character recognition).
[0005]
[Problems to be solved by the invention]
However, the above-described technique has the following problems. In other words, the method of determining the orientation of a document using a layout is not a problem for simple business documents, but the direction of a document having a complicated layout with an elaborate design cannot be determined.
[0006]
On the other hand, the method of determining the orientation of an original using OCR requires time for character extraction processing and OCR processing to extract a character area from a binarized image of the original image, and real-time matching the copying speed of the copier. Processing is difficult, and there is a drawback that it becomes a bottleneck of copying speed of a copying machine.
[0007]
An object of the present invention is to prevent a reduction in the speed of copying processing.
[0008]
[Means for Solving the Problems]
The present invention has the following configuration as one means for achieving the above object.
[0009]
The image processing apparatus according to the present invention extracts each character region from an input image, performs character recognition on each extracted character region, and determines the direction of each character region, thereby determining the input image. A processing means for outputting a direction determination result of the input image, and a control means for controlling the copying process of the input image using the direction determination result output by the processing means. If it does not end within the time, the processing means outputs the intermediate direction determination result obtained so far, and the control means is a preset user for the case where the determination of the direction of the input image does not end within the predetermined time. Based on the above instruction, the copying process of the input image is controlled using the intermediate direction determination result output by the output means .
[0010]
Image processing method according to the present invention, out extract each character area from the input image, by performing character recognition on each character region that is the extraction, by determining the direction of the each of the character areas, the a processing step of outputting a direction determination result towards the input image, using the processing direction determination result output by step, and a control step of controlling the copying process of the input image, direction towards the input image If the judgment does not end within a predetermined time, the processing step outputs an intermediate direction determination result obtained so far, the control step, if the determination of the direction towards the input image within the predetermined time has not completed The input image copying process is controlled using the intermediate direction determination result output in the processing step based on a user instruction set in advance .
[0011]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an image processing apparatus according to an embodiment of the present invention will be described in detail with reference to the drawings.
[0012]
[First Embodiment]
FIG. 2 is a block diagram showing an example of the configuration of the direction determining apparatus according to the present embodiment. Can be added.
[0013]
In the figure, the copying machine 201 has an image memory and various image processing functions, and can perform image processing such as 2in1 (processing for copying two original images on one sheet), 4in1, rotation, and mirror image. .
[0014]
The direction determination card 202 is an 8-bit multi-value image data from the copier 201, clock CLK, main scanning direction synchronization signal HSYNC, main scanning direction enable signal VE, page enable signal PE, 3-bit address ADDR, and 8-bit. Can receive signals such as data DATA. Then, as a result of determining the orientation of the document, a 2-bit signal indicating the direction (0 degrees, 90 degrees, 180 degrees, and 270 degrees), a 1-bit signal indicating the composition direction (vertical writing and horizontal writing), and 1 indicating the confidence level. Returns a bit signal. Note that the types of these signals and the number of bits are examples, and the present invention is not limited to these.
[0015]
With respect to the signals ADDR and DATA, eight types of data can be received from the copying machine 201 as long as the bit width is as described above. As eight types of data, for example, image size, image horizontal size, image vertical size, image horizontal zoom, image vertical zoom, etc. can be considered, but in the following description, the signal ADDR is not provided, and the processing is limited to the signal DATA. Suppose that 8 bits are sent indicating the time TLIMIT. That is, the direction determination card 202 receives a processing time limit (TLIMIT) suitable for the original size of the next page at the falling edge of the signal PE.
[0016]
A binarization circuit 2021 binarizes the multi-value image data received from the copying machine 201. The binary memory 2022 stores the image data binarized by the binarization circuit 2021. A character detection circuit 2023 detects a character area from the multivalued image data received from the copying machine 201, and outputs coordinate data representing the character area. The character area coordinate memory 2024 stores coordinate data representing the character area output by the character detection circuit 2023. Note that the image data passed from the copying machine 201 to the direction determination card 202 may be image data binarized by the copying machine 201.
[0017]
The CPU 2025 uses the RAM 2026 as a work memory, reads coordinate data from the character area coordinate memory 2024 according to a program stored in the ROM 2027 in advance, and reads binary image data from the binary memory 2022 according to the coordinate data. Perform various processes. In other words, the CPU 2025 performs the direction determination process by the character recognition program stored in the ROM 2027 and ends the direction determination, or ends the determination process by an interrupt signal from the timer 2028 described later, the result of the direction determination Is output.
[0018]
The timer 2028 receives the processing limit time (TLIMIT) from the copier 201 at the falling edge of the page enable signal (PE), for example, determines the elapse of the time specified by TLIMIT by counting down TLIMIT. When the specified time has elapsed, an interrupt signal is sent to the CPU 2025.
[0019]
FIG. 3 is a block diagram showing a second configuration example of the direction determination card 202, which is a configuration in the case where the processing for direction determination is performed by software. As the direction determination software, it is possible to use a character area determination and a direction determination using OCR, a layout analysis and a direction determination.
[0020]
FIG. 4 is a block diagram showing a third configuration example of the direction determination card 202, which is a configuration in the case where processing related to direction determination is performed by hardware (direction determination circuit 2029). As hardware processing, as in the case of software, it is possible to use a character area determination and a direction determination using OCR, a layout analysis and a direction determination.
[0021]
Of course, in the configuration shown in FIGS. 3 and 4, the direction determination card 202 can be provided with a binarization circuit 2021, and the multi-value image data input from the copying machine 201 can be binarized. Alternatively, the direction determination card 202 may be provided with a multi-value band memory (or page memory), and the direction determination may be performed from the multi-value image data input from the copying machine 201 by software.
[0022]
FIG. 5 is a block diagram showing a detailed configuration example of the direction determination card 202.
[0023]
In the same figure, a portion surrounded by a rectangle indicated by a symbol A is configured by one chip, and at least one of the binarization circuit 2021, the character detection circuit 2023, and the character coordinate area memory 2024 illustrated in FIG. It is included.
[0024]
The threshold value determination circuit 101 determines a binarization threshold value and a difference threshold value for detecting an edge from input multi-value pixel data. This binarization threshold is used for the binarization processing of the binarization circuit 2021. The edge detection circuit 102 performs high-frequency detection processing from input multilevel pixel data using a difference threshold in synchronization with the clock CLK. The edge coordinate storage unit 103 stores the coordinate data of the edges detected by the edge detection circuit 102. The area information storage unit 104 stores area information created as a result of combining the already detected edge coordinates.
[0025]
FIG. 6 is a diagram for explaining the processing of the combination processing circuit 105. The combination processing circuit 105 stores the coordinate data 701 to 704 and 712 stored in the edge coordinate storage unit 103 and the region information storage unit 104. After comparing the coordinate data 705 to 708 and 713 and combining the coordinate data determined to be combined, the combined coordinate data (the region indicated by the bold lines 709 to 715) is stored in the region information storage unit 104. .
[0026]
In other words, the input image data is binarized and stored in the binary memory 2022 by the configuration (character detection circuit 2023 and binarization circuit 2021) shown in FIG. Data is stored in the character area coordinate memory 2024.
[0027]
For example, when character detection processing is performed on image data of a document as shown in FIG. 7A, rectangular information as shown in FIG. 7B is obtained. Then, the CPU 2025 reads the image data from the binary memory 2022 according to the coordinate data stored in the character area coordinate memory 2024, and performs OCR processing. The CPU 2025 performs four-way OCR processing on the binary image data of each character area read from the binary memory 2025, and the direction in which the result closest to the character information stored as a dictionary in the ROM 2027 is obtained. The determination result is output as the direction of these character areas.
[0028]
FIG. 8 is a timing chart example of this system. Reference numeral 801 denotes image input from an image scanner (CCD), reference numeral 802 denotes binarization processing of multi-value image data input from the scanner, and reference numeral 803. Indicates a character extraction process, and reference numeral 804 indicates an OCR process. In other words, in synchronization with the input 801 from the scanner, character extraction processing 803 is performed in real time, four-way OCR processing 804 is performed on the extracted character area, and the orientation of the document image, vertical writing and horizontal writing, etc. are identified. .
[0029]
Here, the program stored in the ROM 2027 is designed with the aim of completing the direction determination processing by the OCR of the CPU 2025 within a predetermined time (TLIMIT). However, if the direction determination process is not completed within the predetermined time (interrupted from the timer 2028), the CPU 2025 determines the direction and set direction (intermediate result) obtained so far, and the degree of confidence “0”. Returns a judgment result consisting of (meaning without confidence). TLIMIT is set so as not to stop the document scanning operation of the copying machine 201.
[0030]
The copying machine 201 can control the copying process being executed according to the instruction set by the user according to the degree of confidence in the determination result sent from the direction determination card 202. For example, before starting the process, if the confidence level is '0', the copy process will be stopped if the process is instructed to stop the process, and if the confidence level is ignored, the copy process will be performed. continue.
[0031]
As described above, according to the present embodiment, since the orientation of the document is determined using OCR, it is possible to determine the orientation of the document with a complicated layout of elaborate design, and the copying speed of the copying machine can be determined. In addition, the orientation of the document can be determined in real time. If the process of determining the orientation of the document cannot be completed within a predetermined time, the determination result (intermediate result) obtained so far is output, so that the copying speed is not reduced. .
[0032]
Also, for example, when performing character extraction processing with the configuration shown in FIG. 3, by reducing the resolution of the image, for example, an image as shown in FIG. 9 is generated from the image shown in FIG. It is also possible to use a method of performing outline tracking by combining and determining a character when the obtained combined area has a large aspect ratio.
[0033]
Further, in the above-described embodiment, the example in which the direction determination card 202 is inserted into the copying machine 201 has been described. However, the present invention is not limited to this, and the system includes an image scanner, a printer, and a computer. In this case, the direction determination card 202 is inserted into the slot of the computer. Alternatively, the orientation of the document is determined by a program running on the computer.
[0034]
Furthermore, in a system constituted by an image scanner and a computer, the system may determine the orientation of an image read by the image scanner and store the image in a storage medium such as a hard disk connected to the computer based on the determination result. Further, a printer that determines the orientation of an image input from a computer and performs printout based on the determination result may be used.
[0035]
[Other Embodiments]
Note that the present invention can be applied to a system including a plurality of devices (for example, a host computer, an interface device, a reader, a printer, etc.), or a device (for example, a copier, a facsimile device, etc.) including a single device. You may apply to.
[0036]
Another object of the present invention is to supply a storage medium storing software program codes for realizing the functions of the above-described embodiments to a system or apparatus, and the computer (or CPU or MPU) of the system or apparatus stores the storage medium. Needless to say, this can also be achieved by reading and executing the program code stored in the. In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the storage medium storing the program code constitutes the present invention. As a storage medium for supplying the program code, for example, a floppy disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a magnetic tape, a nonvolatile memory card, a ROM, or the like can be used.
[0037]
Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) running on the computer based on the instruction of the program code. It goes without saying that a case where the function of the above-described embodiment is realized by performing part or all of the actual processing and the processing is included.
[0038]
Further, after the program code read from the storage medium is written into a memory provided in a function expansion card inserted in the computer or a function expansion unit connected to the computer, the function expansion is performed based on the instruction of the program code. It goes without saying that the CPU or the like provided in the card or the function expansion unit performs part or all of the actual processing and the functions of the above-described embodiments are realized by the processing.
[0039]
When the present invention is applied to the above-described storage medium, the storage medium stores program codes corresponding to the flowcharts described above. To briefly describe, each module shown in the memory map example of FIG. Is stored in a storage medium. That is, at least “binarization”, “character area detection”, “character image data reading”, and “image direction determination” modules may be stored in the storage medium.
[0040]
【The invention's effect】
As described above, according to the present invention, it is possible to prevent a reduction in the speed of copying processing.
[Brief description of the drawings]
FIG. 1 is a diagram for explaining an image processing function;
FIG. 2 is a block diagram showing a configuration example of a direction determination device according to an embodiment of the present invention;
FIG. 3 is a block diagram showing a second configuration example of the direction determination card shown in FIG.
4 is a block diagram showing a third configuration example of the direction determination card shown in FIG.
FIG. 5 is a block diagram showing a detailed configuration example of the direction determination card shown in FIG.
6 is a diagram for explaining processing of the coupling processing circuit shown in FIG. 5;
FIG. 7A is a diagram for explaining character detection processing;
FIG. 7B is a diagram for explaining character detection processing;
FIG. 8 is a diagram showing an example timing chart of the system;
FIG. 9 is a diagram for explaining another method of character extraction processing;
FIG. 10 is a diagram showing an example of a memory map of a storage medium storing program codes according to the present invention.

Claims (6)

入力画像から文字領域を出し、当該抽出された各文字領域に対して文字認識を行って、当該各文字領域の向を判定することにより、前記入力画像の向判定結果を出力する処理手段と
前記処理手段で出力された方向判定結果を用いて、前記入力画像の複写処理を制御する制御手段とを有し、
前記入力画像の向の判定が所定時間内に終了しない場合、前記処理手段はそれまでに得られた中間方向判定結果を出力し、前記制御手段は前記所定時間内に入力画像の向の判定終了しない場合に関する予め設定されたユーザの指示に基づき、前記出力手段で出力された中間方向判定結果を用いて前記入力画像の複写処理を制御することを特徴とする画像処理装置。
Out extract each character area from the input image, by performing character recognition on each character region that is the extraction, by determining the direction of the each of the character areas, and outputs a direction judgment result towards the input image Processing means ;
Control means for controlling the copying process of the input image using the direction determination result output by the processing means ;
If the determination of the direction towards the input image is not completed within a predetermined time, the processing means outputs an intermediate direction determination result obtained so far, the control means of the direction of the input image within the predetermined time period based on a preset user instructions on when the determination is not completed, the image processing apparatus and controls the copy processing of the input image using the intermediate direction determination result output by said output means.
前記制御手段は、前記入力画像の向の判定が前記所定時間内に終了せず、前記ユーザの指示が前記複写処理の継続を示す場合、前記入力画像の複写処理を継続するように制御することを特徴とする請求項1に記載された画像処理装置。The control means, the determination of the direction towards the input image not completed within the predetermined time, when the instruction of the user indicates a continuation of the copying process is controlled so as to continue the copying process of the input image 2. The image processing apparatus according to claim 1, wherein 前記制御手段は、前記入力画像の向の判定が前記所定時間内に終了せず、前記ユーザの指示が前記複写処理の中止を示す場合、前記入力画像の複写処理を中止するように制御することを特徴とする請求項1または請求項2に記載された画像処理装置。The control means, the determination of the direction towards the input image not completed within the predetermined time, when the instruction of the user indicating the abort of the copying process is controlled so as to stop the copying processing of the input image 3. The image processing apparatus according to claim 1 or 2 , wherein 入力画像から文字領域を出して、当該抽出された各文字領域に対して文字認識を行って、当該各文字領域の向を判定することにより、前記入力画像の向判定結果を出力する処理ステップと
前記処理ステップで出力された方向判定結果を用いて、前記入力画像の複写処理を制御する制御ステップとを有し
前記入力画像の向の判定が所定時間内に終了しない場合、前記処理ステップはそれまでに得られた中間方向判定結果を出力し、前記制御ステップは、前記所定時間内に入力画像の向の判定終了しない場合に関する予め設定されたユーザの指示に基づき、前記処理ステップで出力された中間方向判定結果を用いて前記入力画像の複写処理を制御することを特徴とする画像処理方法。
Out extract each character area from the input image, by performing character recognition on each character region that is the extraction, by determining the direction of the each of the character areas, outputs a direction judgment result towards the input image Processing steps to
Using the direction determination result output in the processing step, and a control step for controlling the copying process of the input image ,
If the determination of the direction towards the input image is not completed within a predetermined time, the processing step outputs an intermediate direction determination result obtained so far, the control step, the direction of the input image within the predetermined time period An image processing method comprising: controlling copying processing of the input image using the intermediate direction determination result output in the processing step based on a user instruction set in advance when the determination is not completed.
前記制御ステップは、前記入力画像の方向の判定が前記所定時間内に終了せず、前記ユーザの指示が前記複写処理の継続を示す場合、前記入力画像の複写処理を継続するように制御することを特徴とする請求項The control step controls to continue the copying process of the input image when the determination of the direction of the input image does not end within the predetermined time and the user instruction indicates the continuation of the copying process. Claims characterized by 4Four に記載された画像処理方法。The image processing method described in 1. 前記制御ステップは、前記入力画像の方向の判定が前記所定時間内に終了せず、前記ユーザの指示が前記複写処理の中止を示す場合、前記入力画像の複写処理を中止するように制御することを特徴とする請求項The control step performs control so as to stop the copying process of the input image when the determination of the direction of the input image does not end within the predetermined time and the user instruction indicates that the copying process is stopped. Claims characterized by 4Four または請求項Or claims 5Five に記載された画像処理方法。The image processing method described in 1.
JP09412396A 1996-04-16 1996-04-16 Image processing apparatus and method Expired - Fee Related JP3774502B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09412396A JP3774502B2 (en) 1996-04-16 1996-04-16 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09412396A JP3774502B2 (en) 1996-04-16 1996-04-16 Image processing apparatus and method

Publications (2)

Publication Number Publication Date
JPH09282468A JPH09282468A (en) 1997-10-31
JP3774502B2 true JP3774502B2 (en) 2006-05-17

Family

ID=14101655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09412396A Expired - Fee Related JP3774502B2 (en) 1996-04-16 1996-04-16 Image processing apparatus and method

Country Status (1)

Country Link
JP (1) JP3774502B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3906623B2 (en) 2000-02-10 2007-04-18 コニカミノルタビジネステクノロジーズ株式会社 Copy machine

Also Published As

Publication number Publication date
JPH09282468A (en) 1997-10-31

Similar Documents

Publication Publication Date Title
US7751648B2 (en) Image processing apparatus, image processing method, and computer program
JP4250483B2 (en) Image processing apparatus, image processing method, program, and storage medium
US7317835B2 (en) Image processing method and apparatus
JP2004165969A (en) Image processing apparatus and program thereof
US20050213138A1 (en) Color-image processing apparatus and method, and storage medium
JP3884845B2 (en) Information processing apparatus and method
JP3774502B2 (en) Image processing apparatus and method
US7558511B2 (en) Scanning apparatus and method having editing function, and multi functional peripheral using the scanning method
US6975757B1 (en) Color-image processing apparatus and method, and storage medium
JPH1021364A (en) Method and device for processing image
JP2000029987A (en) Method for controlling image reader device and image reader device and system therefor
JPH09190491A (en) Picture processing method and its device
JPH07288676A (en) Image processing unit and its method
JP2003263642A (en) Image processor and image processing method
JPH04251395A (en) Optical character/graphic reader
JP2007065864A (en) Image processor and processing method, image forming apparatus and method, and original reading device and method
JP2005109857A (en) Image processor and control method therefor
JP2002077574A (en) Method and apparatus for processing information as well as storage medium
JPH1093772A (en) Image processor and image processing method
JPH09261466A (en) Image processor
JPH09190494A (en) Picture processing method and its device
JP2000278512A (en) Image forming device and method therefor
JPH10262138A (en) Image reader
JPH08329189A (en) Device and method for detecting mark position
JPH10228530A (en) Device and method for processing image

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060220

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100224

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100224

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110224

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120224

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130224

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140224

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees