JP5280425B2

JP5280425B2 - 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体

Info

Publication number: JP5280425B2
Application number: JP2010253878A
Authority: JP
Inventors: 仁志廣畑; 章人 ▲吉▼田; 淳寿森本; 陽介小西
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2010-11-12
Filing date: 2010-11-12
Publication date: 2013-09-04
Anticipated expiration: 2030-11-12
Also published as: CN102469234B; US20120120444A1; CN102469234A; JP2012104028A; US8941864B2

Description

本発明は、原稿を読み取って取得した原稿画像データに基づいて上記原稿に記載されている文字の文字認識処理を行う画像処理装置および画像処理方法に関するものである。

従来から、紙媒体に記載されている情報をスキャナで読み取って画像データを作成し、画像データに含まれる文字について文字認識処理（ＯＣＲ（Optical Character Recognition）処理）を施してテキストデータを作成する技術がある。

例えば、特許文献１には、小さな文字を高精度に読み取れるとともに、大きな文字を高速に読み取ることを可能にするために、画素数が多い高解像度の光電変換手段と画素数が少ない低解像度の光電変換手段とで画像を読み取り、小さな文字の場合には高解像度の光電変換手段で読み取った画像データを用い、大きな文字の場合には低解像度の光電変換手段で読み取った画像データを用いて文字認識を行う技術が開示されている。

特開平６−２３１３０１号公報（平成６年８月１９日公開）特開平７−１９２０８６号公報（平成７年７月２８日公開）特開平６−１８９０８３号公報（平成６年７月８日公開）

しかしながら、上記特許文献１の技術では、複数の光電変換手段を備える必要があるので、装置構成の複雑化および装置コストの増大を招いてしまうという問題がある。

本発明は、上記の課題に鑑みてなされたものであり、その目的は、多様な文字サイズの文字に対する文字認識処理を簡単な構成で精度よく行うことにある。

本発明の画像処理装置は、上記の課題を解決するために、原稿を読み取って取得した画像データに基づいて上記原稿に記載されている文字の文字認識処理を行う画像処理装置であって、画像データに含まれる文字の文字認識処理を行う認識処理部と、上記画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定する文字サイズ判定部と、上記文字サイズ判定部によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された場合に、上記画像データにおける少なくとも上記所定サイズよりも大きいと判定された文字を含む領域を当該文字のサイズが上記所定サイズ以下になるように縮小処理する縮小処理部とを備え、上記認識処理部は、上記文字サイズ判定部によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された場合に、上記縮小処理部によって縮小処理された画像データを用いて上記文字の文字認識処理を行うことを特徴としている。

本発明の画像処理方法は、上記の課題を解決するために、原稿を読み取って取得した画像データに基づいて上記原稿に記載されている文字の文字認識処理を行う画像処理方法であって、上記画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定する文字サイズ判定工程と、上記文字サイズ判定工程によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された場合に、上記画像データにおける少なくとも上記所定サイズよりも大きいと判定された文字を含む領域を当該文字のサイズが上記所定サイズ以下になるように縮小処理する縮小処理工程と、上記画像データに含まれる文字の文字認識処理を行う認識処理工程とを含み、上記認識処理工程は、上記文字サイズ判定工程によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された場合に、上記縮小処理工程によって縮小処理された画像データを用いて上記文字の文字認識処理を行うことを特徴としている。

上記の画像処理装置および画像処理方法によれば、画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定し、所定サイズよりも大きいと判定された場合に、画像データにおける少なくとも上記所定サイズよりも大きいと判定された文字を含む領域を当該文字のサイズが上記所定サイズ以下になるように縮小処理し、縮小処理された画像データを用いて上記文字の文字認識処理を行う。これにより、文字サイズが所定サイズよりも大きい文字の文字認識処理を行う場合であっても、文字認識処理を精度よく行うことができる。すなわち、多様な文字サイズの文字の文字認識処理を簡単な構成で精度よく行うことができる。

また、上記所定サイズは、上記認識処理部において所定の文字認識精度を得るための上記認識処理部の仕様上の上限値、または当該上限値より小さい値に設定されている構成としてもよい。

上記の構成によれば、文字認識処理の対象とする文字のサイズが認識処理部において所定の文字認識精度を得るための認識処理部の仕様上の上限値よりも大きい場合であっても、所定の文字認識精度を得ることができる。

また、上記文字サイズ判定部は、上記画像データにおける領域毎、あるいは上記画像データにおける行毎に文字サイズの判定を行う構成としてもよい。

上記の構成によれば、画像データにおける領域毎、あるいは画像データにおける行毎に文字サイズの判定を行うことにより、文字サイズが領域毎あるいは行毎に異なる場合であっても文字認識処理を精度よく行うことができる。

また、ユーザからの文字サイズの選択指示を受け付ける操作入力部を備え、
上記文字サイズ判定部は、上記操作入力部を介して入力される上記選択指示に基づいて上記画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定する構成としてもよい。

上記の構成によれば、ユーザからの選択指示に基づいて画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定することができるので、文字サイズの判定を容易に行うことができる。

また、上記文字サイズ判定部は、上記画像データに基づいて文字認識処理の対象とする文字が含まれる領域における、各文字の外接矩形、各文字の高さ、各行の高さ、または複数の文字からなる文字群の外接矩形を検出し、この検出結果に基づいて上記画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定する構成としてもよい。

上記の構成によれば、文字サイズ判定部が画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを自動判定するので、ユーザの利便性を向上させることができる。

また、上記文字認識処理の結果に応じたテキストデータを含む出力ファイルを生成するフォーマット化処理部を備えている構成としてもよい。なお、上記出力ファイルは、テキストデータのみからなるファイルであってもよく、画像データとテキストデータとを対応付けたものであってもよい。

また、本発明の画像読取装置は、原稿を読み取って画像データを取得する画像入力装置と、上記画像入力装置が取得した画像データに基づいて上記原稿に記載されている文字の文字認識処理を行う、上記したいずれかの画像処理装置とを備えていることを特徴としている。

上記の構成によれば、文字サイズが所定サイズよりも大きい文字の文字認識処理を行う場合であっても、文字認識処理を精度よく行うことができる。また、画像入力装置の取得した画像データを必要に応じて低解像度化して文字認識処理を行うので、上記特許文献１の技術のように複数の光電変換手段を備える必要がない。したがって、装置構成の複雑化および装置コストの増大を招くことなく、多様な文字サイズの文字の文字認識処理を簡単な構成で精度よく行うことができる。

本発明の画像形成装置は、上記フォーマット化処理部を備えた上記画像処理装置と、上記画像データに応じた画像を記録材上に形成する画像形成部と、上記出力ファイルを所定の送信先に送信するか、あるいは所定の保存先に保存するファイル出力処理部とを備えている。

上記の構成によれば、多様な文字サイズの文字の文字認識処理を簡単な構成で精度よく行い、文字認識処理の結果に応じたテキストデータを含む出力ファイルを所定の送信先に送信するか、あるいは所定の保存先に保存することができる。

なお、上記画像処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各部として動作させることにより、上記画像処理装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に含まれる。

以上のように、本発明の画像処理装置は、上記画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定する文字サイズ判定部と、上記文字サイズ判定部によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された場合に、上記画像データにおける少なくとも上記所定サイズよりも大きいと判定された文字を含む領域を当該文字のサイズが上記所定サイズ以下になるように縮小処理する縮小処理部と、上記画像データに含まれる文字の文字認識処理を行う認識処理部とを備え、上記認識処理部は、上記文字サイズ判定部によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された場合に、上記縮小処理部によって縮小処理された画像データを用いて上記文字の文字認識処理を行う。

また、本発明の画像処理方法は、上記画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定する文字サイズ判定工程と、上記文字サイズ判定工程によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された場合に、上記画像データにおける少なくとも上記所定サイズよりも大きいと判定された文字を含む領域を当該文字のサイズが上記所定サイズ以下になるように縮小処理する縮小処理工程と、上記画像データに含まれる文字の文字認識処理を行う認識処理工程とを含み、上記認識処理工程は、上記文字サイズ判定工程によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された場合に、上記縮小処理工程によって縮小処理された画像データを用いて上記文字の文字認識処理を行う。

それゆえ、多様な文字サイズの文字の文字認識処理を簡単な構成で精度よく行うことができる。

本発明の一実施形態にかかる画像処理装置において行われるスキャンモードの処理の流れを示すフローチャートである。本発明の一実施形態にかかる画像処理装置を備えた画像形成装置の構成を示すブロック図である。本発明の一実施形態にかかる画像処理装置を備えた画像形成装置の構成を示すブロック図である。図２の画像形成装置に備えられる画像入力装置の構成を示す説明図である。本発明の一実施形態にかかる画像処理装置に備えられる原稿検知部の構成を示すブロック図である。（ａ）は図２および図３に示した画像形成装置の操作パネルに表示される表示画面の一例を示す説明図であり、（ｂ）は（ａ）に示した表示画面においてユーザが選択可能な内容を示す説明図である。（ａ）は図２および図３に示した画像形成装置の操作パネルに表示される表示画面の一例を示す説明図であり、（ｂ）は（ａ）に示した表示画面においてユーザが選択可能な内容を示す説明図である。（ａ）は図２および図３に示した画像形成装置の操作パネルに表示される表示画面の一例を示す説明図であり、（ｂ）は（ａ）に示した表示画面においてユーザが選択可能な内容を示す説明図である。（ａ）および（ｂ）は、図５に示した原稿検知部に備えられる文字サイズ判定部における文字サイズの判定方法の一例を示す説明図である。（ａ）および（ｂ）は、図５に示した原稿検知部に備えられる行数判定部における行数の判定方法の一例を示す説明図である。（ａ）および（ｂ）は図５に示した原稿検知部に備えられる縮小処理部において行われる縮小処理の縮小率の設定方法を示す説明図である。（ａ）および（ｂ）は図５に示した原稿検知部に備えられるレイアウト解析部におけるレイアウト解析方法を示す説明図である。図２および図３に示した画像形成装置の変形例を示すブロック図である。図２および図３に示した画像形成装置の変形例を示すブロック図である。本発明の一実施形態にかかる画像処理装置において行われる帳票登録モードの処理の流れを示すフローチャートである。図１５に示した帳票登録モードの処理において新規登録される帳票原稿の一例を示す説明図である。（ａ）〜（ｅ）は、図１６に示した帳票原稿を読み取った結果に基づいて表示される表示画面の一例を示す説明図である。図１６に示した帳票原稿においてＯＣＲ領域として設定される領域の例を示す説明図である。（ａ）および（ｂ）は図１５に示した帳票登録モードの処理におけるＯＣＲ領域の設定方法を示す説明図である。（ａ）および（ｂ）は図１５に示した帳票登録モードの処理におけるＯＣＲ領域の設定方法を示す説明図である。（ａ），（ｃ）〜（ｅ）は、図１５に示した帳票登録モードの処理においてＯＣＲ条件の設定処理を行う際に操作パネルの表示部に表示されるＯＣＲ条件設定画面の一例を示す説明図であり、（ｂ）はＯＣＲ条件設定画面における各選択項目についてのユーザが選択可能な条件を示している。図１５に示した帳票登録モードにおいて登録される帳票の登録情報の例を示す説明図である。本発明の一実施形態にかかる画像処理装置において行われる帳票ＯＣＲモードの処理の流れを示すフローチャートである。（ａ）は図２３に示した帳票ＯＣＲモードの処理において処理対象とされる帳票原稿の一例を示す説明図であり、（ｂ）は（ａ）に示した帳票原稿の画像データに対する文字認識処理によって検出されるテキストデータの一例を示す説明図である。本発明の一実施形態にかかる画像処理装置を備えた画像読取装置の構成例を示すブロック図である。本発明の一実施形態にかかる画像処理装置を備えた情報処理装置の構成例を示すブロック図である。

本発明の一実施形態について説明する。なお、本実施形態では、本発明をデジタルカラー複合機（コピア機能、スキャナ機能、プリンタ機能、ファクシミリ送受信機能、scan to e-mail機能等を備える複合機）に適用する場合の実施例について主に説明する。

（１−１．デジタルカラー複合機１の全体構成）
図２および図３は、本実施形態にかかる画像処理装置を備えたデジタルカラー複合機（画像読取装置、画像形成装置）１の概略構成を示すブロック図である。この図に示すように、デジタルカラー複合機１は、画像入力装置２、画像処理装置３、画像出力装置４、通信装置５、記憶部６、制御部７、および操作パネル８を備えている。

このデジタルカラー複合機１は、（１）画像入力装置２で読み取った画像データまたは通信装置５によって外部から受信した画像データに応じた画像を画像出力装置４によって記録材上に形成（印刷）する画像形成モード、および（２）画像入力装置２で読み取った画像データを通信装置５により外部装置に送信する画像送信モードを備えている。また、画像送信モードは、スキャンモード（通常読取モード）、帳票ＯＣＲモード、および帳票登録モードを備えている。さらに、スキャンモードでは、原稿から読み取った画像データに基づいて原稿の文字認識処理（ＯＣＲ処理）を行うことの要否を選択できるようになっている。図２は画像形成モードにおけるデータの流れを示しており、図３は画像送信モードにおけるデータの流れの一例を示している。通信装置５によって外部から受信した画像データは、一旦、記憶部６に記憶され、ユーザからの指示入力により、記憶部６より読み出されて出力処理が行われる。

画像入力装置２は、原稿の画像を読み取って画像データ（原稿画像データ）を生成するものであり、例えばＣＣＤ（Charge Coupled Device ）ラインセンサなどの光学情報を電気信号に変換するデバイス（光電変換手段）を備えたスキャナ部より構成されている。本実施形態では、画像入力装置２は、原稿からの反射光像を、ＲＧＢ（Ｒ：赤・Ｇ：緑・Ｂ：青）のアナログ信号として画像処理装置３に出力する。画像入力装置２の詳細については後述する。

画像処理装置３は、画像形成モードでは、画像入力装置２から入力された画像データに種々の画像処理を施して得られるＣＭＹＫの画像データを画像出力装置４に出力する。また、画像送信モードでは、画像入力装置２から入力された画像データに種々の画像処理を施し、ユーザによって指定されたファイル形式の画像ファイル（出力ファイル）を生成して通信装置５に出力する。この際、文字認識処理の実行が指定されている場合には、画像データと文字認識処理の結果とを対応付けた画像ファイル、あるいは文字認識処理の結果に応じて生成したテキストデータを含むファイル（出力ファイル）を生成して通信装置５に出力する。なお、画像処理装置３の詳細については後述する。

画像出力装置（画像出力部）４は、画像処理装置３から入力された画像データを記録材（例えば紙等）上に出力するものである。画像出力装置４の構成は特に限定されるものではなく、例えば、電子写真方式あるいはインクジェット方式を用いた画像出力装置を用いることができる。

通信装置５は、例えばモデムやネットワークカードより構成される。通信装置５は、ネットワークカード、ＬＡＮケーブル等を介して、ネットワークに接続された他の装置（例えば、パーソナルコンピュータ、サーバ装置、表示装置、他のデジタル複合機、ファクシミリ装置等）とデータ通信を行う。

操作パネル８は、例えば、液晶ディスプレイなどの表示部と設定ボタンなどからなる操作入力部により構成され（いずれも図示せず）、制御部７の指示に応じた情報を上記表示部に表示するとともに、上記設定ボタンを介してユーザから入力される情報を制御部７に伝達する。なお、操作パネル８として表示部と操作入力部とが一体化されたタッチパネルを用いてもよい。ユーザは、操作パネル８を介して入力画像データに対する処理モード、印刷枚数、用紙サイズ、送信先アドレスなどの各種情報を入力することができる。

記憶部６は、画像処理装置３で扱われる各種データ（画像データ、帳票の登録情報等）を記憶する記憶手段である。記憶部６の構成は特に限定されるものではないが、例えばハードディスクなどを用いることができる。

制御部７は、例えばＣＰＵ（Central Processing Unit）等からなり、図示しないＲＯＭ等に格納されたプログラムや各種データ、操作パネル８から入力される情報、画像入力装置２あるいは画像出力装置４に備えられる各種センサの検知結果等に基づいて、デジタルカラー複合機１の各部の動作を制御する。

（１−２．画像入力装置２の構成）
図４は、画像入力装置２の構成を示す説明図である。この図に示すように、画像入力装置２は、第２コンタクトガラス５２上を搬送される原稿の上面側の画像を読み取るイメージセンサ部５３と、第２コンタクトガラス５２上を搬送される原稿の下面側の画像を読み取る機能、および第１コンタクトガラス５１上に載置されている原稿を走査することによりこの原稿の下面側を読み取る読取部５４とを備えている。これにより、画像入力装置２は、原稿を静止させて画像を読み取る静止読取モード、原稿を搬送させながら原稿を読み取る走行読取モードを実行できるようになっている。また、走行読取モードでは、搬送されている原稿の片面の画像を読み取る片面読取モードおよび両面の画像を読み取る両面読取モードを実行できるようになっている。

第２コンタクトガラス５２上を移動するように原稿を搬送するために、画像入力装置２はＡＤＦ（Auto Document Feeder）５０を備えている。このＡＤＦ５０は、図４に示すように整合ローラ対５５を備えている。整合ローラ対５５は、搬送されてきた原稿の先端が整合ローラ対５５のニップ部に突き当たるように配置されている。そして、原稿が上記ニップ部に突き当たることによって原稿に所定の撓みが形成された後、整合ローラ対５５が回動することによってこの原稿を下流側の原稿搬送路５６に搬送することで、原稿の先端を搬送方向に垂直になるように原稿の向きを整合させるようになっている。

また、ＡＤＦ５０における第１コンタクトガラス５１との対向面には第１コンタクトガラス５１上に載置された原稿を抑える原稿押さえマット５７が備えられており、ＡＤＦ５０における第２コンタクトガラス５２との対向面には原稿の搬送方向を規制するためのガイド５８が備えられている。また、第２コンタクトガラス５２におけるイメージセンサ部５３との対向面とは反対側の面には、読取部５４の光源６２から照射される光がイメージセンサ部５３に入射してイメージセンサ部５３が画像を適切な濃度で読み取れなくなるのを防止するための遮光部材５９が配置されている。

なお、上記した各部材のうち、原稿押さえマット５７、整合ローラ対５５、原稿搬送路５６、イメージセンサ部５３、および上側原稿搬送ガイド５８等が上部筐体（原稿カバー）６０に備えられ、第１コンタクトガラス５１、第２コンタクトガラス５２、および読取部５４が下部筐体６１に備えられている。また、上部筐体６０は下部筐体６１に対して開閉可能に構成されている。

上記読取部５４は、第１走査ユニット６３、第２走査ユニット６４、結像レンズ６５、およびＣＣＤ（Charge Coupled Device）６６を備えている。第１走査ユニット６３は、第１コンタクトガラス５１に沿って（図４の左から右に向かって）一定速度Ｖで移動しながら原稿を露光するものであり、光源（露光ランプ）６２と、原稿の反射光を第２走査ユニット６４に導く第１反射ミラー６７とを有している。

第２走査ユニット６４は、第１走査ユニット６３に追随してＶ／２の速度で移動するようになっており、第１反射ミラー６７からの光を結像レンズ６５に導くための第２反射ミラー６８および第３反射ミラー６９を備えている。

結像レンズ６５は、第３反射ミラー６９からの反射光をＣＣＤ６６上で結像させるものである。ＣＣＤ６６は結像レンズ６５からの光をアナログの電気信号に変換するものである。なお、このアナログの電気信号は、後述する画像処理装置３によってデジタルの画像データに変換される。

走行読取モード（片面読取モード、両面読取モード）で原稿を読み取る場合、読取部５４は、ホームポジション（図示せず）から、図４に示したように第２コンタクトガラス５２に対向する位置に移動する。また、静止読取モードで原稿を読み取る場合、読取部５４は、図４に示した位置Ｐから原稿サイズ検出手段（図示せず）で検出された原稿サイズに応じた距離だけ第１コンタクトガラス５１に沿った方向に移動するようになっている。上記原稿サイズ検出手段は、例えば、画像入力装置２内に配置されたフォトトランジスタなどの光電変換素子により第１コンタクトガラス５１上に載置された原稿の主走査方向および副走査方向の原稿サイズを検知するものであってもよく、あるいは、操作パネル８を介してユーザが選択した原稿のサイズを検知するものであってもよい。

なお、両面読取モードで原稿を読み取った場合、例えば、原稿の表面が読取部５４で読み取られるように設定されている場合には読取部５４で読み取られた画像データがまず画像処理装置３に出力され、その後、イメージセンサ部５３で読み取られた原稿の裏面の画像データが画像処理装置３に入力されるようになっている。なお、読取部５４で読み取られた画像データが画像処理装置３で処理されている間、イメージセンサ部５３で読み取られた画像データは後述する記憶部６に格納され、読取部５４で読み取られた画像データの画像処理が終了した後（あるいは読取部５４で読み取られた画像データに対する画像処理の進行状況に応じて）、記憶部６から読み出されて画像処理が施される。

なお、画像入力装置２の構成はこれに限るものではなく、原稿を読み取って画像データを生成できるものであればよい。例えば、原稿台に載置された原稿を読み取る機能、または搬送されている原稿を読み取る機能の一方のみを備えたものであってもよい。

（１−３．画像処理装置３の構成および画像形成モードの動作）
次に、画像処理装置３の構成および動作について説明する。まず、画像形成モードの場合の動作について説明する。

画像処理装置３は、図２に示したように、Ａ／Ｄ変換部１１、シェーディング補正部１２、入力処理部１３、原稿検知部１４、原稿補正部１５、色補正部１６、黒生成下色除去部１７、空間フィルタ部１８、出力階調補正部１９、中間調生成部（中間調生成部）２０、領域分離部２１、認識処理部２２、描画コマンド生成部２３、およびフォーマット化処理部２４を備えている。

画像形成モードの場合、まず、Ａ／Ｄ変換部１１が、画像入力装置２から入力されたＲＧＢのアナログ信号をデジタル信号に変換してシェーディング補正部１２に出力する。

シェーディング補正部１２は、Ａ／Ｄ変換部１１から送られてきたデジタルのＲＧＢ信号に対して、画像入力装置２の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施し、入力処理部１３に出力する。

入力処理部（入力階調補正部）１３は、シェーディング補正部１２にて各種の歪みが取り除かれたＲＧＢ信号に対して、カラーバランスを整えると同時に、濃度信号など画像処理装置３に採用されている画像処理システムの扱い易い信号に変換する処理を施す。また、下地濃度の除去やコントラストなどの画質調整処理を行う。また、入力処理部１３は、上記の各処理を施した画像データを記憶部６に一旦記憶させる。

原稿検知部１４は、入力処理部１３によって上記の処理が施された画像データに基づいて原稿画像の傾き角度、天地方向、画像データ中の画像が存在する領域である画像領域などを検出し、その検出結果を原稿補正部１５に出力する。

原稿補正部１５は、原稿検知部１４の検知結果（原稿傾き検知部３４による傾き検知結果および天地方向検知部３５による天地方向検知結果）に基づいて、入力処理部１３によって上述の処理が施された画像データに原稿傾き補正処理および天地方向補正処理を行う。

なお、本実施形態では、原稿補正部１５が原稿検知部１４の傾き検知結果に基づいて原稿傾き補正処理を行い、原稿傾き補正後の画像データを記憶部６に一旦記憶させ、原稿傾き補正後の画像データを記憶部６から原稿検知部１４に再入力し、この再入力された画像データに基づいて原稿検知部１４が天地判定を行い、天地判定結果に基づいて原稿補正部１５が天地方向補正処理を行って天地方向補正後の画像データを記憶部６に一旦記憶させるようになっている。ただし、これに限らず、原稿検知部１４において傾き検知処理および天地判定処理を行ってこれら両処理の結果を原稿補正部１５に出力し、原稿補正部１５が上記両処理の結果に基づいて原稿傾き補正処理および天地方向補正処理を行うようにしてもよい。

また、原稿検知部１４は、文字認識処理を行うモードが選択されている場合には、原稿補正部１５によって原稿傾き補正および天地方向補正が行われた画像データに基づいて作成した２値画像データ、および２値画像データに基づいてレイアウト解析処理（文字の方向が縦書きであるか横書きであるかを解析する処理）を行った結果を認識処理部２２に出力する。なお、原稿補正部１５が原稿検知部１４によって生成された２値画像データに対して原稿傾き補正および天地方向補正を行い、その結果を認識処理部２２に出力するようにしてもよい。

また、原稿補正部１５によって原稿傾き補正処理および天地方向補正処理が施された画像データをファイリングデータとして管理するようにしてもよい。この場合、上記画像データは、例えば、ＪＰＥＧ圧縮アルゴリズムに基づいてＪＰＥＧコードに圧縮されて記憶部６に格納される。そして、この画像データに対するコピー出力動作やプリント出力動作が指示された場合には、記憶部６からＪＰＥＧコードが引き出されて不図示のＪＰＥＧ伸張部に引き渡され、復号化処理が施されてＲＧＢデータに変換される。また、上記の画像データに対して送信動作が指示された場合には、記憶部６からＪＰＥＧコードが引き出され、ネットワーク網や通信回線を介して通信装置５から外部装置へ送信される。

図５は、原稿検知部１４の概略構成を示すブロック図である。この図に示すように、原稿検知部１４は、信号変換部３１、解像度変換部３２、２値化処理部３３、原稿傾き検知部３４、天地方向検知部３５、レイアウト解析部３６、文字サイズ判定部３７、縮小処理部３８、および行数判定部３９を備えている。

信号変換部３１は、入力処理部１３によって上記各処理が施された画像データがカラー画像である場合にこの画像データを無彩化して、明度信号もしくは輝度信号に変換し、解像度変換部３２に出力する。

例えば、信号変換部３１は、Ｙｉ＝０．３０Ｒｉ＋０．５９Ｇｉ＋０．１１Ｂｉを演算することによりＲＧＢ信号を輝度信号Ｙに変換する。ここで、Ｙは各画素の輝度信号であり、Ｒ，Ｇ，Ｂは各画素のＲＧＢ信号における各色成分であり、添え字のｉは画素毎に付与された値（ｉは１以上の整数）である。あるいは、ＲＧＢ信号をＣＩＥ１９７６Ｌ*ａ*ｂ*信号（ＣＩＥ:Commission International de l'Eclairage、Ｌ*：明度、a*,ｂ*:色度）に変換してもよく、Ｇ信号を用いてもよい。

解像度変換部３２は、画像データの解像度を低解像度に変換し、２値化処理部３３に出力する。解像度変換の方法は特に限定されるものではなく、例えば、公知のニアレストネイバー法、バイリニア法、バイキュービック法、平均値法などを用いることができる。

本実施形態では、解像度変換部３２は、画像入力装置２において１２００ｄｐｉあるいは６００ｄｐｉで読み込まれた画像データの解像度を第１解像度（例えば３００ｄｐｉ）に変換した画像データと第１解像度よりも低い第２解像度（例えば７５ｄｐｉ）に変換した画像データとを生成する。

２値化処理部３３は、解像度変換部３２によって解像度変換された第１解像度の画像データ、および第２解像度の画像データをそれぞれ２値化し、第１解像度の２値画像データＡおよび第２解像度の２値画像データＢを生成する。具体的には、画像データにおける各画素の濃度（画素値）と予め設定された閾値とを比較することにより各画素の画素値を２値化する。例えば、画像データが８ビットである場合、上記閾値を１２８とする。あるいは、複数の画素（例えば５画素×５画素）からなるブロックにおける濃度（画素値）の平均値を閾値としてもよい。また、２値化処理部３３は、第１解像度の画像データを原稿傾き検知部３４および天地方向検知部３５に出力し、第１解像度の画像データおよび第２解像度の画像データを行数判定部３９に出力する。

原稿傾き検知部３４は、２値化処理部３３から入力される第１解像度の２値画像データＡに基づいて、画像読取時のスキャン位置（正規の原稿位置）に対する原稿の傾き角度を検知し、検知した傾き角度を原稿補正部１５に出力する。つまり、原稿傾き検知部３４は、画像入力装置２におけるスキャン位置（正規の原稿位置）に対して、画像読取時における原稿の位置が傾いていた場合に、この傾き角度を検知し、原稿補正部１５に出力する。

傾き角度の検知方法は特に限定されるものではなく、例えば従来から公知の方法を用いることができる。例えば、特許文献２に記載されている方法を用いてもよい。この方法では、２値化された画像データからを黒画素と白画素との境界点（例えば各文字の上端における白／黒の境界点の座標）を複数個抽出し、各境界点の点列の座標データを求める。黒画素と白画素の境界については、例えば、各文字の上端における白／黒境界点の座標を求める。そして、この点列の座標データに基づいて回帰直線を求め、その回帰係数ｂを下記式（１）に基づいて算出する。

ｂ＝Ｓｘｙ／Ｓｘ・・・（１）
なお、Ｓｘ，Ｓｙはそれぞれ変量ｘ，ｙの残差平方和であり、Ｓｘｙはｘの残差とｙの残差の積の和である。すなわち、Ｓｘ，Ｓｙ，Ｓｘｙは下記式（２）〜（４）で表わされる。

そして、上記のように算出した回帰係数ｂより、下記式（５）に基づいて傾き角度θを算出する。

ｔａｎθ＝ｂ・・・（５）
天地方向検知部３５は、２値化処理部３３から入力される第１解像度の２値画像データＡに基づいて、画像読取時の原稿の天地方向を検知し、検知した天地方向を原稿補正部１５に出力する。

天地方向の検知方法は特に限定されるものではなく、例えば従来から公知の方法を用いることができる。例えば、特許文献３に記載されている方法を用いてもよい。この方法では、以下の（１）〜（６）の処理により原稿の天地方向を検知する。
（１）原稿内の文字を文字毎に切り出して各文字をパターン化して文字パターンを生成する。
（２）文字パターンには文字以外のノイズも含まれるため、文字の可能性が高い文字パターン（例えば、縦横比が１：２〜２：１である文字パターン）を選別する。
（３）文字パターンの特徴とデータベース化された文字パターン情報とを比較（マッチング）する。例えば、データベース化された文字パターンに切り出された文字パターン（入力パターン）を重ね合わせ、画素ごとの白黒を比較する。そして、データベース化された文字パターンの中に全ての画素が合致する文字パターンが存在する場合には当該文字パターンに対応する文字を入力パターンの文字であると判別する。また、全ての画素が合致する文字パターンが存在しない場合、合致する画素の数が所定のマッチング割合に達しているか否かを判断し、達していない場合にはその文字パターンは判別不能と判断する。一方、所定のマッチング割合に達している場合には、合致する画素が最も多い文字パターンに対応する文字を入力パターンの文字であると判別する。
（４）切り出された文字パターンを９０°、１８０°、２７０°回転させ、上記（２）および（３）の処理を繰り返す。
（５）上記各回転角（０°、９０°、１８０°、２７０°）について、上記（２），（３）によって判別可能であった文字の数を比較し、判別可能な文字数が最も多い回転角を原稿の文字方向として原稿の天地方向を判定する。
（６）天地方向の判定結果として０°、９０°、１８０°、および２７０°のうちのいずれかを出力する。

レイアウト解析部３６、文字サイズ判定部３７、縮小処理部３８、および行数判定部３９は、画像出力モードでは動作を行わない。これら各部の詳細については後述する。

色補正部１６は、原稿補正部１５によって原稿傾き補正処理および天地方向補正処理が施された画像データを記憶部６から読み出し、読み出した画像データをＲＧＢ信号の補色であるＣＭＹ（Ｃ：シアン・Ｍ：マゼンタ・Ｙ：イエロー）信号に変換するとともに、色再現性を高める処理を行う。

黒生成下色除去部１７は、色補正後のＣＭＹの３色信号から黒（Ｋ）信号を生成する黒生成、元のＣＭＹ信号から黒生成で得たＫ信号を差し引いて新たなＣＭＹ信号を生成する処理を行うものである。これにより、ＣＭＹの３色信号はＣＭＹＫの４色信号に変換される。

空間フィルタ部１８は、黒生成下色除去部１７より入力されるＣＭＹＫ信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理（強調処理および／または平滑化処理）を行い、空間周波数特性を補正する。これにより、出力画像のぼやけや粒状性劣化を軽減することができる。

出力階調補正部１９は、用紙等の記録材に出力するための出力γ補正処理を行い、出力γ補正処理後の画像データを中間調生成部２０に出力する。

中間調生成部２０は、最終的に画像を画素に分離してそれぞれの階調を再現できるように処理する階調再現処理（中間調生成）を施す。

領域分離部２１は、ＲＧＢ信号より、入力画像中の各画素を黒文字領域、色文字領域、網点領域、印画紙写真（連続階調領域）領域の何れかに分離するものである。領域分離部２１は、分離結果に基づき、画素がどの領域に属しているかを示す領域分離信号を、黒生成下色除去部１７、空間フィルタ部１８、および中間調生成部２０へと出力する。黒生成下色除去部１７、空間フィルタ部１８、および中間調生成部２０では、入力された領域分離信号に基づいて、各領域に適した処理が行われる。領域分離処理の方法は特に限定されるものではなく、従来から公知の方法を用いることができる。

認識処理部（ＯＣＲエンジン）２２、描画コマンド生成部２３、およびフォーマット化処理部２４は、画像形成モードでは動作を行わない。これら各部の詳細については後述する。

上述した各処理が施された画像データは、一旦、記憶部６あるいは他のメモリ（図示せず）に記憶されたのち、所定のタイミングで読み出されて画像出力装置４に入力される。

（１−４．画像処理装置３の構成および画像送信モードの動作）
次に、画像送信モードにおける画像処理装置３の動作、および原稿検知部１４に備えられるレイアウト解析部３６、文字サイズ判定部３７、縮小処理部３８、および行数判定部３９の構成、認識処理部２２、描画コマンド生成部２３、およびフォーマット化処理部２４の構成について説明する。

デジタルカラー複合機１は、画像送信モードとして、スキャンモード（通常読取モード）、帳票ＯＣＲモード、および帳票登録モードを備えており、図６（ａ）、図７（ａ）および図８（ａ）に示すように操作パネル８の表示部に表示されたスキャンモードのタブＴ１、帳票ＯＣＲモードのタブＴ２、および帳票登録モードのタブＴ３の中からユーザが所望するモードのタブを選択するようになっている。

図６（ａ）は画像送信モードのタブＴ１が選択された場合に操作パネル８の表示部に表示される表示画面の一例を示す説明図であり、図６（ｂ）は図６（ａ）の表示画面に表示される各項目についてユーザが選択可能な設定値（設定内容）を示す説明図である。

また、図７（ａ）は帳票登録モードのタブＴ３が選択された場合に操作パネル８の表示部に表示される表示画面の一例を示す説明図であり、図７（ｂ）は図７（ａ）の表示画面に表示される各項目についてユーザが選択可能な設定値（設定内容）を示す説明図である。

また、図８（ａ）は帳票ＯＣＲモードのタブＴ２が選択された場合に操作パネル８の表示部に表示される表示画面の一例を示す説明図であり、図８（ｂ）は図８（ａ）の表示画面に表示される各項目についてユーザが選択可能な設定値（設定内容）を示す説明図である。

（１−４−１．スキャンモードの処理）
まず、スキャンモードが選択された場合について説明する。図１はスキャンモードにおける画像処理装置３の処理の流れを示すフローチャートである。なお、画像入力装置２、Ａ/Ｄ変換部１１、シェーディング補正部１２、入力処理部１３、および領域分離部２１の処理内容は画像形成モードの場合と同様なので、ここではその説明を省略する。

本実施形態では、図６（ａ）および図６（ｂ）に示したように、スキャンモードにおいて、ユーザが、（１）出力画像データのフォーマット（本実施形態ではＰＤＦ、ＰＤＦ（ＯＣＲ）、ＴＩＦＦ、ＪＰＥＧのうちのいずれか）、（２）出力画像データの解像度（本実施形態では６００ｄｐｉ，４００ｄｐｉ，３００ｄｐｉ，２００ｄｐｉ，１００ｄｐｉのうちのいずれか）、（３）出力画像データのカラータイプ（本実施形態ではカラー、グレー、白黒２値のうちのいずれか）、（４）原稿傾き補正を行うか否か、および（５）天地方向補正を行うか否かを選択することができるようになっている。

また、スキャンモードでは、出力画像データのフォーマットとしてＰＤＦ（ＯＣＲ）が選択された場合にのみ文字認識処理を行い、文字認識結果を透明テキストデータとして画像データに重畳させたＰＤＦ（Portable Document Format）形式の画像ファイルを生成するようになっている。

さらに、出力画像データのフォーマットとしてＰＤＦ（ＯＣＲ）が選択された場合、すなわち文字認識処理を行う場合には、ユーザが、（ａ）ＯＣＲ言語（本実施形態では日本語または英語のいずれか）、および（ｂ）文字サイズ（本実施形態では「標準」、「大きい」、「かなり大きい」、「自動判定」のいずれか）を選択できるようになっている。

なお、出力画像データのフォーマットとして、文字認識処理を行わないフォーマット（ＰＤＦ、ＴＩＦＦ、またはＪＰＥＧ）が選択された場合には、図６（ａ）に表示されている項目のうち、ＯＣＲ設定に関する項目（ＯＣＲ言語、文字サイズ）についてはグレイアウト表示または非表示とされる。

図６（ａ）の表示画面において上記の各項目が設定された後、「原稿の読み取り」ボタンが操作された場合、制御部７は、画像入力装置２、Ａ/Ｄ変換部１１、シェーディング補正部１２、および入力処理部１３に上述した画像形成モードにおける処理と同様の処理を行わせる。

そして、入力処理部１３の処理が終わった後、制御部７は、原稿傾き補正を行うか否かを判断する（Ｓ１）。この判断は、図６（ａ）に示した表示画面においてユーザが原稿傾き補正を行うことを選択したか否かに応じて行えばよい。

そして、Ｓ１において原稿傾き補正を行うと判断した場合、制御部７は、入力処理部１３において上述の処理が施された画像データに対して信号変換部３１、解像度変換部３２、および２値化処理部３３に上述した各処理を行わせ、その結果に基づいて原稿傾き検知部３４に原稿傾き検知処理を行わせ（Ｓ２）、原稿補正部１５に原稿傾き補正処理を行わせる（Ｓ３）。原稿補正部１５は、原稿傾き補正処理後の画像データを記憶部６に一旦記憶させる。

Ｓ１において原稿傾き補正を行わないと判断した場合、あるいはＳ３において原稿傾き補正処理を行った後、制御部７は、天地方向補正を行うか否かを判断する（Ｓ４）。この判断は、図６（ａ）に示した表示画面においてユーザが天地方向補正を行うことを選択したか否かに応じて行えばよい。

そして、Ｓ４において天地方向補正を行うと判断した場合、制御部７は、Ｓ３において原稿傾き補正処理が施された画像データ、あるいは入力処理部１３において上述の処理が施された画像データを記憶部６から読み出して信号変換部３１、解像度変換部３２、および２値化処理部３３に上述した各処理を行わせ、その結果に基づいて天地方向検知部３５に天地方向検知処理を行わせ（Ｓ５）、原稿補正部１５に天地方向補正処理を行わせる（Ｓ６）。原稿補正部１５は、天地方向補正処理後の画像データを記憶部６に一旦記憶させる。

Ｓ４において天地方向補正を行わないと判断した場合、あるいはＳ６において天地方向補正処理を行った後、制御部７は、文字認識処理を行うか否かを判断する（Ｓ７）。この判断は、例えば、図６（ａ）に示した表示画面において出力画像データのフォーマットとしてＰＤＦ（ＯＣＲ）が選択されたか否かに応じて行えばよい。

Ｓ７において文字認識処理を行わないと判断した場合、制御部７は、後述するＳ１４の処理を行う。

一方、Ｓ７において文字認識処理を行うと判断した場合、制御部７は、原稿の文字サイズが「標準」、「大きい」、「かなり大きい」のうちのいずれに属するかを特定する（Ｓ８）。具体的には、制御部７は、図６（ａ）に示した表示画面に対して、ユーザが「標準」、「大きい」、「かなり大きい」のうちのいずれかを選択する選択指示を行った場合にはその選択指示に応じて文字サイズを特定する。また、ユーザが「自動判定」を選択した場合には、制御部７は、原稿検知部１４に備えられる文字サイズ判定部３７に文字サイズの自動判定処理（文字サイズが「標準」、「大きい」、「かなり大きい」のうちのいずれに属するかを判定する処理）を行わせ、その判定処理結果に応じて文字サイズを特定する。

なお、本実施形態では、原稿の文字サイズが認識処理部２２における文字認識において所定の文字認識精度が得られる認識処理部２２の仕様上の上限値（例えば文字の高さサイズ１７ｍｍ）以下の場合には「標準」サイズとし、上記上限値より大きく所定値（例えば上記上限値の２倍）以下の場合には「大きい」サイズとし、上記所定値より大きい場合には「かなり大きい」とするようになっている。ただし、これに限らず、認識処理部２２の仕様上の上限値よりも低い値を閾値として設定し、文字サイズがこの閾値以下の場合には「標準」サイズとし、上記閾値より大きく所定値（例えば上記閾値の２倍）以下の場合には「大きい」サイズとし、上記所定値より大きい場合には「かなり大きい」とするようにしてもよい。また、上記の上限値は、認識処理部２２の製造者が仕様値として公表している値であってもよく、複数種類の文字が複数の文字サイズで印字されたサンプル原稿の画像データに基づいて認識処理部２２で文字認識処理を行って認識成功率を算出し、所定の認識成功率（文字認識精度）が得られる文字サイズの上限値を算出した結果であってもよい。

また、文字サイズ判定部３７における文字サイズの自動判定方法は特に限定されるものではないが、例えば、以下に示す（例１）〜（例５）のうちのいずれかの方法を用いることができる。

（例１）：２値化処理部３３によって生成された第１解像度または第２解像度の２値画像データに基づいて文字の外接矩形を求め、外接矩形のサイズ（高さ、または、幅）についてのヒストグラムを作成し、最も頻度の高いサイズをその原稿における外接矩形のサイズとして算出する。そして、予め設定しておいた外接矩形のサイズと文字サイズ（「標準」、「大きい」、「かなり大きい」）との関係に基づいて文字サイズを特定する。

なお、外接矩形の求め方は後述するレイアウト解析部３６における外接矩形の求め方と同様である。このため、レイアウト解析部３６における外接矩形の算出結果を用いて文字サイズの自動判定処理を行うようにしてもよく、文字サイズ判定部３７において外接矩形を算出し、この算出結果をレイアウト解析部３６におけるレイアウト解析処理でも利用するようにしてもよい。

（例２）：天地方向検知部３５における天地方向検知処理で求めた文字パターンのうち、データベース化された文字パターンに対するマッチング割合が高い文字パターン（マッチング割合が所定値以上である文字パターン）のサイズ（高さ、または、幅）のヒストグラムを作成し、最も頻度の高いサイズに基づいて原稿の文字サイズ（「標準」、「大きい」、「かなり大きい」）を特定する。

（例３）：ＯＣＲ対象領域に含まれる行が１行のみである場合、図９（ａ）に示すように、文字サイズ判定部３７が２値化処理部３３によって生成された第１解像度または第２解像度の２値画像データに基づいてＯＣＲ対象領域の高さ（矩形形状からなるＯＣＲ対象領域の高さ）を検出し、その検出結果に基づいて文字サイズ（「標準」、「大きい」、「かなり大きい」）を特定する。

なお、ＯＣＲ対象領域が１行のみであるか複数行であるかは、ユーザが操作パネル８を介して指定してもよく、行数判定部３９が行数を自動判定するようにしてもよい。

また、行数判定部３９における行数の自動判定方法は特に限定されるものではないが、例えば、２値化処理部３３によって生成された第１解像度または第２解像度の２値画像データに基づいて、画像データの各ラインについて当該各ラインの延伸方向（行の延伸方向）に沿った白画素と黒画素との反転回数のヒストグラムを生成し、このヒストグラムに基づいて判定するようにしてもよい。

この方法では、反転回数が所定値（例えば２０）以下のラインが所定ライン数以上連続して存在する場合に、その連続するラインからなる領域を空白領域として検出する。また、検出された空白領域の中に最初のラインまたは最終のラインが含まれる空白領域が存在する場合には、当該空白領域は行間領域ではなく原稿の余白領域であると判断し、当該空白領域を除外した空白領域を行間領域として検出する。そして、行間領域が存在するか否かを判断し、存在する場合には行数は複数行であると判断する。一方、行間領域が存在しない場合には行数は１行であると判断する。

なお、上記の所定ライン数は、行間として判断する行間領域の高さの閾値と行数判定処理に用いる画像データの解像度とに応じて適宜設定すればよい。例えば、画像データの解像度が３００ｄｐｉであり、上記閾値が１ｍｍとする場合、上記所定ライン数は１２ライン程度に設定される。

図１０（ａ）は複数の文字行が存在する場合の画像データ、およびこの画像データに基づいて行数判定部３９によって生成されるヒストグラムの例を示している。この図に示すように、複数の文字行が存在する場合には、反転回数の分布は、文字行部分において反転回数の多いラインが連続し、空白領域（行間領域および余白領域）において反転回数の少ないラインが連続した分布となる。

図１０（ｂ）は、行数が１行のみである場合の画像データ、およびこの画像データに基づいて行数判定部３９によって生成されるヒストグラムの例を示している。この図に示すように、行数が１行のみである場合には反転回数の多いラインが連続して存在する領域は文字行部分のみとなり、空白領域は余白領域のみとなる。

したがって、ライン方向（行方向）に沿った画素値の反転回数（白画素と黒画素との反転回数）の分布を求め、余白領域を除く空白領域である行間領域の有無を判定することで、複数の文字行が存在する画像であるか行数が１行のみの画像であるかを判別できる。なお、反転回数が所定値以上であるラインの連続部分が所定値（例えば１ｍｍ以上）である場合に、その連続部分を行として抽出してもよく、また当該連続部分のラインの延伸方向に対して垂直な方向の長さを行の高さとして抽出するようにしてもよい。

（例４）：ＯＣＲ対象領域に含まれる行が１行のみである場合、図９（ｂ）に示すように、文字サイズ判定部３７が２値化処理部３３によって生成された第１解像度または第２解像度の２値画像データに基づいてＯＣＲ対象領域に含まれる文字群の外接矩形を求め、その矩形サイズの高さに基づいて文字サイズ（「標準」、「大きい」、「かなり大きい」）を特定する。

（例５）：ＯＣＲ対象領域に含まれる行が複数行である場合、行数判定部３９にＯＣＲ対象領域に含まれる行の高さを抽出させ、抽出された行の高さに基づいて文字サイズ（「標準」、「大きい」、「かなり大きい」）を特定する。行数判定部３９における行の抽出方法としては上記（例４）で示した方法を用いることができる。

次に、制御部７は、Ｓ５で特定した文字サイズに基づいて、文字サイズが「標準」であるか否か、すなわち原稿の文字サイズが認識処理部２２における文字認識において所定の文字認識精度が得られる認識処理部２２の仕様上の上限値以下であるか否かを判断する（Ｓ９）。文字サイズが「標準」ではないと判断した場合、すなわち特定された文字サイズが「大きい」または「かなり大きい」である場合、制御部７は、縮小処理部３８を制御し、２値化処理部３３によって生成された第１解像度および第２解像度の２値画像データに対して、縮小後の画像データにおける文字サイズが「標準」に収まるサイズになるように、特定された文字サイズに応じて縮小処理を行わせ（Ｓ１０）、縮小処理後の第２解像度の２値画像データをレイアウト解析部３６に出力させ、縮小処理後の第１解像度の２値画像データを認識処理部２２に出力させる。

一方、文字サイズが「標準」であると判断した場合、制御部７は、縮小処理部３８を制御し、２値化処理部３３によって生成された第２解像度の２値画像データを縮小処理せずにそのままレイアウト解析部３６に出力させ、第１解像度の２値画像データを縮小処理せずにそのまま認識処理部２２に出力させ、には後述するＳ１１の処理に進む。

具体的には、図１１（ａ）に示すように、文字サイズが「大きい」である場合には画像サイズを１／２倍に縮小し、文字サイズが「かなり大きい」の場合には画像サイズを１／４倍に縮小する。なお、文字サイズを「標準」、「大きい」、「かなり大きい」に分類するのではなく、文字の高さサイズに応じて分類してもよい。この場合、例えば図１１（ｂ）に示すように、文字の高さに応じた文字サイズの分類結果に応じて画像データの縮小率（縮小倍率）を設定すればよい。

また、特定された文字サイズが「標準」である場合、縮小処理部３８は、縮小倍率を等倍とする。すなわち、縮小処理部３８は、２値化処理部３３によって生成された第２解像度の２値画像データをそのままレイアウト解析部３６に出力し、２値化処理部３３によって生成された第１解像度の２値画像データを認識処理部２２に出力する。

なお、本実施形態では、各文字サイズに応じた画像データの縮小率を２の累乗（べき乗）に設定している。この場合、２×２、４×４のマスク（ブロック）の画素値の平均値を求めて１画素に置き換えることにより縮小処理を行うことができるので、縮小処理を簡略化することができる。ただし、これに限らず、縮小率を２の累乗以外の値に設定してもよい。

次に、制御部７は、レイアウト解析部３６を制御し、第２解像度の２値画像データに基づいて、画像データに含まれる文字の方向が縦書きであるか横書きであるかを解析するレイアウト解析処理を行わせる（Ｓ１１）。なお、レイアウト解析部３６ではレイアウトの概要を認識できればよく、必ずしも高精細な画像データは必要でないことから、本実施形態では原稿傾き検知部３４および天地方向検知部３５において用いられる第１解像度の２値画像データよりも低解像度の第２解像度の２値画像データを用いてレイアウト解析処理を行う。

具体的には、レイアウト解析部３６は、図１２に示すように、文字の外接矩形を求め、外接矩形間の距離に基づいて縦書きか横書きであるかを判定する。文字の外接矩形については以下に示す（１）〜（４）の処理によって求める。
（１）最初のライン（１番上のライン）を注目ラインとし、黒画素にラベリングを行う。
（２）注目ラインを一つ下のラインにずらし、黒画素について上記ラインとは異なるラベルをセットする。
（３）注目ラインとその１つ上のラインの黒画素の連結状態を判定し、連結している場合は画素が繋がっていると判断し、１つ上のラインにおける連結している黒画素と同じラベルに置き換える。
（４）上記処理を各ラインについて順次行い、各ラインのラベル付け結果に基づいて文字の抽出を行う。抽出した文字における上端、下端、左端および右端の画素位置（画素の座標）を基に外接矩形を抽出する。なお、画素の座標は、読み込まれた画像データの左端かつ上端の位置を原点として求める。

その後、制御部７は、認識処理部２２を制御し、縮小処理部３８から入力される第１解像度の２値画像データ、およびレイアウト解析部３６から入力されるレイアウト解析結果（縦書きであるか横書きであるか）に基づいて、画像データに対する文字認識処理を行わせ、文字認識処理結果を描画コマンド生成部２３に出力させる（Ｓ１２）。

具体的には、認識処理部２２は、縮小処理部３８から入力された第１解像度の２値画像データに基づいて画像データに含まれる文字の特徴量を抽出し、抽出結果を辞書データに含まれる文字の特徴量と比較して文字認識を行い、類似する文字に対応する文字コードを検出する。なお、上記辞書データとして、図７（ａ）の表示画面において選択されたＯＣＲ言語に対応する辞書データを用いるようにしてもよい。また、図７（ａ）に示した例では、ＯＣＲ言語として日本語または英語のいずれかを選択するものとしたが、これに限らず、他の言語を選択可能にしてもよく、文字種別（例えば、数字、英字、記号、カタカナなど）、あるいは文字種別の組み合わせ（例えば、数字と記号との組み合わせな）を選択可能にし、選択された文字種別に応じた辞書データを用いるようにしてもよい。

また、画像データに含まれる文字の特徴量を抽出する際、認識処理部２２が、レイアウト解析部３６の判定結果（縦書きであるか横書きであるか）に基づいて、隣接する文字によって構成される単語の認識処理を行うようにしてもよい。つまり、レイアウト解析結果に応じた方向に隣接する文字の組み合わせと、辞書データに含まれる単語データとのマッチングを行うことによって原稿に記載されている単語の認識処理を行うようにしてもよい。また、画像データに含まれる文字（あるいは単語）に対応する文字（あるいは単語）の候補が複数検出された場合、これら複数の候補をそれぞれ文字認識処理結果として描画コマンド生成部２３に出力させるようにしてもよい。

次に、制御部７は、描画コマンド生成部２３を制御し、認識処理部２２による文字認識結果に対応する透明テキストを画像ファイル内に配置させるための命令を生成させる（Ｓ１３）。ここで、透明テキストとは、認識された文字（あるいは、文字および単語）をテキスト情報として見掛け上は見えない形で画像データに重ね合わせる（あるいは埋め込む）ためのデータである。例えば、ＰＤＦファイルでは、画像データに透明テキストを付加した画像ファイルが一般に使用されている。

次に、制御部７は、フォーマット化処理部２４を制御し、中間調生成部２０から入力される画像データに基づいて図６（ａ）の表示画面においてユーザが指定したフォーマットの画像ファイル（出力ファイル）を生成させ（Ｓ１４）、生成された画像ファイルを通信装置５によって所定の送信先に送信させるか、あるいは記憶部６またはデジタルカラー複合機１に着脱可能に装着される記録媒体等に保存するなどのファイル出力処理を行って処理を終了する。具体的には、出力画像データのフォーマットとしてＰＤＦ（ＯＣＲ）が選択されている場合には、中間調生成部２０から入力される画像データに、描画コマンド生成部２３から入力される命令に応じた透明テキストを埋め込んだＰＤＦフォーマットの画像ファイルを生成させる。また、出力画像データのフォーマットとしてＰＤＦ（ＯＣＲ）以外のフォーマット（ＰＤＦ、ＴＩＦＦ、あるいはＪＰＥＧ）が選択されている場合には当該フォーマットの画像ファイルを生成させる。

なお、図１には示していないが、制御部７は、図６（ａ）の表示画面における解像度およびカラータイプの画像データが中間調生成部２０からフォーマット化処理部２４に出力されるように画像処理装置３の各部を制御する。

具体的には、制御部７は、原稿検知部１４に備えられる解像度変換部３２を制御して入力処理部１３から出力される画像データを図６（ａ）において選択された解像度の画像データに変換させる。なお、このとき、原稿検知部１４の信号変換部３１、２値化処理部３３、原稿傾き検知部３４および原稿補正部１５の処理はスルー（何も処理を行わない）となり、原稿補正部１５から出力された画像データが記憶部６に記憶される。

また、制御部７は、色補正部１６を制御して図６（ａ）において選択されたカラータイプの画像データに色変換させる。例えば、カラータイプとしてカラーが選択されている場合、制御部７は、色補正部１６を制御し、原稿補正部１５から入力される画像入力装置２の画像読取特性に依存したＲ，Ｇ，Ｂの画像データを、一般に普及している表示装置の表示特性に適合したＲ’Ｇ’Ｂ’の画像データ（例えば、ｓＲＧＢデータ）に変換させる。また、カラータイプとしてグレーが選択されている場合、原稿補正部１５から入力される画像入力装置２の画像読取特性に依存したＲ，Ｇ，Ｂの画像データをグレースケールの画像データに変換させる。また、カラータイプとして白黒２値が選択されている場合、原稿補正部１５から入力される画像入力装置２の画像読取特性に依存したＲ，Ｇ，Ｂの画像データを白黒の２値画像データに変換させる。

また、制御部７は、画像送信モードでは黒生成下色除去部１７および中間調生成部２０には処理を行わせず、黒生成下色除去部１７および中間調生成部２０については前段の処理部から入力された画像データをそのまま次段の処理部に出力（スルー）させる。

また、制御部７は、空間フィルタ部１８を制御し、領域分離信号に基づいてデジタルフィルタによる空間フィルタ処理（強調処理，平滑化処理）を行わせる。また、制御部７は、出力階調補正部１９を制御し、所定の出力階調補正処理を行わせる。

なお、本実施形態では、認識処理部２２が原稿検知部１４から入力される２値化画像データおよびレイアウト解析結果に基づいて文字認識処理を施すものとしているが、これに限るものではない。例えば、図１３に示すように、領域分離部２１から出力される領域分離信号を認識処理部２２に入力させ、認識処理部２２がこの領域分離信号に基づいて文字領域（文字エッジと判定された画素からなる画像領域）を示すテキストマップを生成し、原稿検知部１４から入力される２値化画像データにおける文字領域に対してのみレイアウト解析結果を考慮して文字認識処理を行うようにしてもよい。

また、図１４に示すように、画像データに基づいて原稿の種別を判別する原稿種別自動判別部２５を設け、この原稿種別自動判別部２５から出力される原稿種別判別信号を認識処理部２２に入力させ、原稿種別判別信号が文字を含む原稿（例えば文字原稿、文字印刷写真原稿、文字印画紙写真原稿など）であることを示す場合にのみ、認識処理部２２が原稿検知部１４から入力される２値化画像データおよびレイアウト解析結果に基づいて文字認識処理を行うようにしてもよい。原稿種別自動判別部２５における原稿種別の判別方法は、少なくとも文字を含む原稿と文字を含まない原稿とを判別できる方法であれば特に限定されるものではなく、従来から公知の種々の方法を用いることができる。

また、本実施形態では、フォーマット化処理部２４が、文字認識結果に応じた透明テキストデータを画像データに埋め込んだ画像ファイルを生成するものとしたが、これに限るものではない。例えば、文字認識処理結果に応じたテキストデータを透明テキストとは異なる方法で画像データに対応付けた画像ファイルを生成してもよい。また、文字認識処理結果に応じたテキストファイルを画像データが格納される画像ファイルとは別に生成するようにしてもよい。

また、本実施形態では、スキャンモードでは文字サイズを原稿全体について一律に判別しているが、これに限らず、原稿上の領域毎あるいは行毎に文字サイズを判別し、領域毎あるいは行毎に縮小処理を行うか否かを判断するようにしてもよい。また、原稿上の領域毎に文字サイズを判別する場合、ユーザからの指示に応じて各領域を設定してもよく、領域分離部２１による領域分離処理の結果に応じて各領域を設定してもよい。

（１−４−２．帳票登録モードの処理）
次に、帳票登録モードの処理について説明する。本実施形態では、帳票登録モードにおいて、所定の帳票フォーマットの原稿（帳票原稿）について、帳票番号（帳票識別情報）、文字認識処理（ＯＣＲ処理）の対象とする原稿上の領域であるＯＣＲ領域（文字認識処理領域）、および当該ＯＣＲ領域に対する文字認識処理を行う際の処理条件であるＯＣＲ条件（文字認識処理条件）を予め登録しておく。そして、後述する帳票ＯＣＲモードにおいて帳票原稿の文字認識処理を行う場合に、登録されているＯＣＲ領域およびＯＣＲ条件に基づいて文字認識処理を行う。

なお、帳票登録モードでは、新たな帳票フォーマットを登録する新規登録処理、および既に登録されている帳票原稿についてのＯＣＲ領域および／またはＯＣＲ条件を編集する編集処理を行えるようになっている。

図１５は帳票登録モードにおける画像処理装置３の処理の流れを示すフローチャートである。

まず、図７（ａ）に示した表示画面においてユーザが帳票番号を指定すると（Ｓ２１）、指定された帳票番号に基づいて新規登録であるか否かを判断する（Ｓ２２）。

具体的には、図７（ａ）の表示画面において帳票番号を選択するための入力領域の一部（例えば三角印部）に触れると、図７（ｂ）に示す帳票番号のリストが操作パネル８の表示部に表示される。また、このリストでは、ＯＣＲ領域およびＯＣＲ条件が既に登録されている帳票番号の下地領域が、ＯＣＲ領域およびＯＣＲ条件が登録されていない帳票番号の下地領域とは異なる色で表示される。これにより、ユーザは、新規登録処理を行う場合には未登録の帳票番号の中から所望する番号を選択し、編集処理を行う場合には登録済みの帳票番号の中からＯＣＲ領域およびＯＣＲ条件を編集したい帳票の帳票番号を選択できるようになっている。また、制御部７は、未登録の帳票番号が選択された場合には新規登録処理であると判断し、登録済みの帳票番号が選択された場合には編集処理であると判断する。

なお、上記リストの中からユーザが所望する帳票番号を選択すると、図７（ａ）に示したように、当該帳票番号に対応する帳票の帳票名が操作パネル８の表示部に表示されるようになっている。この帳票名は、未登録の帳票番号である場合にはデフォルトで設定された帳票名（本実施形態では、「帳票」という文字列の後に帳票番号を組み合わせた帳票名。例えば「帳票２」、「帳票３」など）とされる。また、登録済みの帳票番号の帳票名については、ユーザが操作パネル８を操作することによって任意に編集できるようになっている。

また、帳票登録モードのタブＴ３が選択された場合、最初の（デフォルト）表示は、帳票番号が空白（何も選択されていない状態）とするが、帳票番号１を選択しておいてもよいし、未登録の帳票番号の中で、最小の帳票番号を選択しておいてもよい。

して、Ｓ２２において新規登録処理ではないと判断した場合、すなわち編集処理であると判断した場合には、制御部７は、Ｓ２６の処理を行う。

一方、Ｓ２２において新規登録処理であると判断した場合、制御部７は、ユーザが操作パネル８を介して入力する読み取り条件設定を受け付ける（Ｓ２３）。本実施形態では、読み取り条件設定として、図７（ａ）に示したように、読み取り解像度、原稿傾き補正の要否、および天地方向補正の要否をユーザが選択できるようになっている。また、読み取り解像度については、図７（ｂ）に示したように、１００ｄｐｉ，２００ｄｐｉ，３００ｄｐｉ，４００ｄｐｉ、６００ｄｐｉの中からユーザが所望する解像度を選択するようになっている。また、Ｓ２３において設定された読み取り解像度、原稿傾き補正の要否、および天地方向補正の要否は、この新規登録処理を行う帳票原稿に対して共通のＯＣＲ条件として登録される。

Ｓ２３においてユーザが読み取り条件設定を行った後、「帳票の読み取り」ボタンを操作すると、制御部７は、画像入力装置２を制御して登録処理の対象とする帳票原稿の読み取り処理を行わせる（Ｓ２４）。また、制御部７は、認識処理部２２を制御し、帳票原稿を読み取って取得した画像データに基づいて、帳票原稿における所定位置ｂ１（本実施形態では右下端部）に印字されている帳票種別情報の文字認識処理（帳票種別ＯＣＲ処理）を行わせる（Ｓ２５）。

次に、制御部７は、Ｓ２４で帳票原稿を読み取って取得した画像データに応じた画像を操作パネル８の表示部に表示させる（Ｓ２６）。

図１６は新規登録処理を行う帳票原稿の一例を示す説明図であり、図１７（ａ）は図１６に示した帳票原稿を読みよって取得した画像データに基づいて操作パネル８の表示部に表示される画像の一例を示す説明図である。なお、新規登録処理を行う際の帳票原稿は、図１６の例のように帳票中の各記入項目に数値や名称等の内容が記載されていないものであることが好ましいが、これに限らず、各記入項目に数値や名称等の内容が記載されているものを用いてもよい。

なお、図１７（ａ）に示したように、操作パネル８の表示部には、帳票原稿の画像と、「キャンセル」、「拡大」、「縮小」、「登録」の各ボタンが表示される。「拡大」または「縮小」のボタンが操作されると、制御部７は、帳票原稿の画像を拡大または縮小して操作パネル８の表示部に表示させる。また、「キャンセル」のボタンが操作されると、制御部７は、Ｓ２４で読み取った画像データを破棄し、Ｓ２１の処理に戻って図７（ａ）に示した表示画面を表示させる。

次に、制御部７は、操作パネル８を介してユーザが選択するＯＣＲ領域（原稿中の文字認識処理の対象とする部分）の選択指示を受け付ける（Ｓ２７）。

例えば、図１８における太線で囲んだ各領域をＯＣＲ領域として指定する場合、領域ａ１〜ａ３のように罫線で囲まれていない領域については、ユーザは、ＯＣＲ領域とする領域の始点Ｓおよび終点Ｅを指定する。具体的には、図１９（ａ）に示すように、操作パネル８の表示部に表示されている原稿画像におけるＯＣＲ領域の始点Ｓとする位置に指やスタイラスペン等でタッチし、タッチしたまま終点Ｅとする位置まで移動した後、タッチを離すことで始点Ｓと終点Ｅを指定する。これにより、図１９（ｂ）に示すように、始点Ｓおよび終点Ｅを対角線上に配置される頂点とする矩形形状のＯＣＲ領域が設定される。

また、領域ａ４〜ａ６のように罫線で囲まれている領域については、ユーザは、ＯＣＲ領域とする罫線枠内の領域に指やスタイラスペン等でタッチし、そのまま表示画面から離すことによってＯＣＲ領域とする罫線枠を指定する。具体的には、図２０（ａ）に示すように、ユーザが罫線枠内の点に指やスタイラスペン等でタッチすると、制御部７は、図２０（ｂ）に示すようにユーザがタッチした点を含む罫線枠（図中の太線部）を検出し、当該罫線枠によって囲まれた領域をＯＣＲ領域とする。なお、罫線枠の検出方法は特に限定されるものではなく、例えば従来から公知の方法を用いることができる。また、ユーザがタッチした点を含む罫線枠として検出した領域の面積（大きさ）が所定値以上（例えば１０００００画素以上）の場合、あるいは帳票原稿の周縁部分に接している場合には、当該領域は罫線で囲まれていない部分であると判断し、ユーザに警告を出し、ＯＣＲ領域として設定しないようにしてもよい。

また、ユーザが最初にタッチした表示画面上の点が始点Ｓを指定するためのものであるのか、罫線枠を指定するためのものであるのかについては、最初にタッチした点から離した点までの距離が所定値（例えば表示部の解像度が３００ｄｐｉである場合、５０画素に相当する距離）以上であるか否かによって判断すればよい。

次に、制御部７は、Ｓ２７で選択されたＯＣＲ領域に対するＯＣＲ条件に関するユーザからの指示入力を受け付け、この指示入力に応じてＯＣＲ条件の設定を行う（Ｓ２８）。

例えば、Ｓ２７でにおいてＯＣＲ領域として選択された領域のうち、ＯＣＲ条件が未設定の領域の外縁部を図１７（ｂ）に示すように所定の色の枠（例えば赤色の枠。図１７（ｂ）では破線の枠で示している。）で囲んで表示し、当該領域にユーザが再度タッチすると、当該領域に対するＯＣＲ条件の設定処理に移行する。

また、ＯＣＲ領域として指定された領域のうち、ＯＣＲ条件の設定が完了した領域については、図１７（ｃ）に示すようにＯＣＲ条件の設定が完了していない領域とは異なる色の枠（例えば青色の枠。図１７（ｃ）では一点鎖線の枠で示している。）で囲んで表示する。そして、ＯＣＲ条件を設定済みの領域にユーザがタッチすると、当該領域に対するＯＣＲ条件の設定処理（編集処理）に移行する。

なお、ＯＣＲ領域の設定処理およびＯＣＲ条件の設定処理は、ＯＣＲ領域を設定したときに当該ＯＣＲ領域のＯＣＲ条件を続けて設定するようにしてもよく、原稿上の全てのＯＣＲ領域を設定した後、各ＯＣＲ領域に対するＯＣＲ条件の設定を順次行うようにしてもよい。また、複数のＯＣＲ領域を設定した後、ユーザが任意のタイミングで任意の１または複数のＯＣＲ領域を選択し、選択したＯＣＲ領域のＯＣＲ条件を設定するようにしてもよい。

複数のＯＣＲ領域を選択するためには、図１７（ｄ）のように、「複数選択モード」ボタン、および、「編集」ボタンを設ける。図１７（ｅ）は、「複数選択モード」を有効にした状態を表し、任意のＯＣＲ領域をタッチするとそのＯＣＲ領域が選択状態となる。選択状態のＯＣＲ領域をタッチするとそのＯＣＲ領域の選択が解除される（タッチするたびにＯＮ、ＯＦＦが変わるトグル動作）。ユーザは、連続して所望するＯＣＲ領域を選択した後、「編集」ボタンをタッチして編集モードに遷移させ、ＯＣＲ条件の設定を一括して行うことができる。選択されたＯＣＲ領域を長くタッチすることにより、編集モードに遷移してＯＣＲ条件の設定を一括して行えるようにしてもよい。

なお、複数のＯＣＲ領域が選択された場合、ＯＣＲ領域固有の情報は編集できないため、編集画面は、図２１（ｅ）のように、「項目番号」、「項目名」はグレイアウト、あるいは全く表示せず、共通設定が可能な項目「文字サイズ」、「行数」、「文字種別」についてのみ表示や変更可能とする。

図２１（ａ）は、ＯＣＲ条件の設定処理を行う際に操作パネル８の表示部に表示されるＯＣＲ条件設定画面の一例を示す説明図である。また、図２１（ｂ）は、図２１（ａ）の表示画面における各選択項目について選択可能な条件を示している。本実施形態では、図２１（ａ）に示したように、ＯＣＲ領域毎に、「文字サイズ」、「行数」、「文字種別」を設定できるようになっている。「文字サイズ」としては、図２１（ｂ）に示したように、上述したスキャンモードの場合と同様、「標準」、「大きい」、「かなり大きい」、「自動判定」のいずれかを選択するようになっている。また、「行数」としては、図２１（ｂ）に示したように、「１行」、「複数行」、「自動判定」のいずれかを選択できるようになっている。また、「文字種別」としては、「日本語」、「英語」、「数字」、「英字／記号」、「カタカナ」のいずれか、あるいはこれらの組み合わせを選択できるようになっている。

図２１（ａ）の表示画面においてユーザが項目番号を選択するための入力領域の一部（例えば三角印部）に触れると、図２１（ｂ）に示す項目番号のリストが操作パネル８の表示部に表示される。また、このリストでは、ＯＣＲ条件が既に登録されている項目番号の下地領域（図２１（ｂ）の例では項目番号１，２）が、ＯＣＲ条件が登録されていない項目番号（図２１（ｂ）の例では項目番号３〜６）の下地領域とは異なる色で表示される。これにより、ユーザは、項目を新規登録する場合には未登録の項目番号の中から所望する番号を選択し、登録済みの項目の編集処理を行う場合には登録済みの項目番号の中からＯＣＲ条件を編集したい項目の項目番号を選択できるようになっている。

なお、上記の項目名は、未登録の項目番号である場合にはデフォルトで設定された項目名（本実施形態では、「項目」という文字列の後に項目番号を組み合わせた項目名。例えば「項目１」、「項目２」など）とされる。また、登録済みの項目番号の項目名については、ユーザが操作パネル８を操作することによって任意に編集できるようになっている。

また、条件が登録されていないＯＣＲ領域に対する、図２１（ａ）の最初（デフォルト）の表示は、項目番号を空白（何も選択されていない状態）とするが、帳票番号１を選択しておいてもよいし、未登録の帳票番号の中で、最小の帳票番号を選択しておいてもよい。

項目番号を選択した後、ユーザは、「文字サイズ」、「行数」、「文字種別」を選択する。そして、ユーザがＯＣＲ条件設定画面に表示されている「設定」ボタンを操作すると、制御部７は、その時点でＯＣＲ条件設定画面において設定されているＯＣＲ条件を設定対象としているＯＣＲ領域についてのＯＣＲ条件として確定し、図１７（ｃ）に示したように原稿画像を表示させるとともに原稿画像上における当該ＯＣＲ領域の枠をＯＣＲ条件設定済みの色で表示させる。

また、「キャンセル」ボタンが操作された場合、制御部７は、ＯＣＲ条件設定画面に表示されているＯＣＲ条件を採用せず、操作パネル８の表示部の表示をこのＯＣＲ条件設定画面を表示させる前の状態に戻す。

また、「消去」ボタンが操作された場合、制御部７は、編集中のＯＣＲ領域をＯＣＲ領域から除外し、当該ＯＣＲ領域を選択する前の状態の表示画面（例えば図１７（ａ）の表示画面）を表示させる。

図２１（ｃ）は、登録済みの項目番号１が選択された場合のＯＣＲ条件設定画面（ＯＣＲ条件編集画面）の例を示している。この例は、図１８に示した領域ａ４（「番号」に対応する罫線枠内の領域）に対するＯＣＲ条件であり、項目名が「番号」に設定され、文字サイズは「標準」、行数は「１行」、文字種別は「数字」＋「英字／記号」に設定されている。

図２１（ｄ）は、登録済みの項目番号２が選択された場合のＯＣＲ条件設定画面（ＯＣＲ条件編集画面）の例を示している。この例は、図１８に示した領域ａ１に対するＯＣＲ条件であり、項目名が「住所」に設定され、文字サイズは「標準」、行数は「複数行」、文字種別は「日本語」に設定されている。

このように、行数が「１行」であるのか「複数行」であるのかを指定することにより、「１行」である場合には帳票ＯＣＲモードの処理を行うときにレイアウト解析処理を省略することができ、また行数に応じた文字認識処理を行うことで文字認識精度を向上させたりすることができる。また、「文字種別」を指定することにより、帳票ＯＣＲモードの処理を行うときに指定された「文字種別」に応じた文字認識処理を行うことで文字認識精度を向上させたりすることができる。

その後、制御部７は、新規登録処理あるいは編集処理を行っている帳票原稿に対するＯＣＲ領域およびＯＣＲ条件の設定処理が全て完了したか否かを判断する（Ｓ２９）。例えば、制御部７は、図１７（ａ）〜図１７（ｃ）のいずれかの表示画面において、「登録」ボタンが操作されたときに全ての設定処理が完了したと判断する。そして、完了していないと判断した場合、制御部７は、Ｓ２６の処理に戻る。

一方、完了したと判断した場合、制御部７は、この帳票に関する帳票番号、帳票名、帳票種別、ＯＣＲ領域、およびＯＣＲ条件を記憶部６に記憶（登録）させ（Ｓ３０）、処理を終了する。

図２２は、１つの帳票についての登録情報の例を示す説明図である。この図に示すように、各帳票について、「帳票共通」情報、および１または複数の「項目」情報が登録される。

「帳票共通」情報とは、その帳票全体について共通の情報（項目）であり、帳票番号、帳票名、帳票種別、読み取り解像度、原稿傾き補正の要否、天地方向補正の要否、および項目数が含まれる。

帳票種別はＳ２４，Ｓ２５の処理において帳票原稿の所定位置ｂ１を読み取った画像に基づいて文字認識処理を行った結果を示すテキストデータである。

読み取り解像度、原稿傾き補正の要否、および天地方向補正の要否は、Ｓ２３においてユーザが指定した読み取り条件である。なお、これら各条件については、帳票ＯＣＲモードにおいて帳票の読み取り処理を行う毎にユーザが任意に変更できるようになっている。

項目数は、Ｓ２８の処理において設定された項目数である。なお、本実施形態では、図２２に示したように、各項目について、当該項目を適用するＯＣＲ領域の位置情報（図２２の例では左上Ｘ座標、左上Ｙ座標、幅、および高さ）が登録されるようになっている。

（１−４−３．帳票ＯＣＲモードの処理）
次に、帳票ＯＣＲモードの処理について説明する。なお、帳票ＯＣＲモードでは、帳票原稿を読み取って画像データを取得し、この画像データから予め登録されているＯＣＲ領域に応じた領域の画像を切り出し、予め登録されているＯＣＲ条件に応じて文字認識処理を行う。この際、文字サイズが「標準」以外であるＯＣＲ領域について、画像データを「標準」の文字サイズに収まるように縮小処理した結果に基づいて文字認識処理を行う。また、帳票ＯＣＲモードでは、文字認識処理によって生成されたテキストデータを画像データに対応付けた画像ファイルを生成するのではなく、文字認識処理の結果に基づいてＣＳＶ（Comma Separated Values）フォーマット（カンマ区切りのテキストフォーマット）のテキストデータを含む出力ファイルを生成して出力するようになっている。また、複数の同一の帳票原稿を連続して読み取った場合には、原稿ページ間に改行コードを挿入したＣＳＶフォーマットのテキストデータを生成して出力する。なお、ＣＳＶフォーマットのテキストデータの１行目には項目名を記載し、実際の文字認識結果については２行目以降に記載するようにしてもよい。

連続して読み取った帳票原稿が全て同じフォーマットである場合には、１つのＣＳＶフォーマットのテキストデータを生成するが、異なるフォーマットである場合には、帳票フォーマット毎にＣＳＶフォーマットのテキストデータの生成を行う。例えば、１ページが帳票Ａ、２ページ目が帳票Ｂ、３ページ目が帳票Ａである場合、１ページ目と３ページ目の結果は、１つのＣＳＶフォーマットのテキストデータになり、２ページ目の結果は、別の１つのＣＳＶフォーマットのテキストデータとなる。帳票原稿のフォーマットが同じであるか、異なるかの判断は、帳票に記されている帳票番号によって行う。

図８（ａ）に示したように、帳票ＯＣＲモードが選択されると、操作パネル８の表示部には、帳票名、原稿傾き補正の要否、および天地方向補正の要否をユーザが選択するための表示、および原稿の読み取り開始指示を行うための「原稿の読み取り」ボタンが表示される。

図８（ｂ）に示すように、帳票名としては、自動判別、帳票番号１（１：帳票１）、帳票番号２（２：帳票２）、帳票番号３（３：帳票３）、帳票番号４（４：帳票４）・・・が選択可能になっている。

なお、図８（ａ）の表示画面において帳票名が選択された場合に、当該帳票名に対応する帳票の登録情報から原稿傾き補正の要否、および天地方向補正の要否に関する登録情報を読み出し、これらの登録情報に応じて図８（ａ）の表示画面における原稿傾き補正の要否、および天地方向補正の要否の表示状態を変更するようにしてもよい。例えば、選択された帳票の登録情報において原稿傾き補正が不要（しない）と設定されている場合には、図８（ａ）における原稿傾き補正の要否に関する入力項目を「しない」に変更するようにしてもよい。

図２３は帳票ＯＣＲモードにおける画像処理装置３の処理の流れを示すフローチャートである。

図８（ａ）の表示画面において上記の各項目が設定された後、「原稿の読み取り」ボタンが選択された場合、制御部７は、画像入力装置２、Ａ/Ｄ変換部１１、シェーディング補正部１２、および入力処理部１３に上述した画像形成モードにおける処理と同様の処理を行わせる。

そして、入力処理部１３の処理が終わった後、制御部７は、図８（ａ）の表示画面において選択された帳票番号に基づいて、帳票ＯＣＲ処理に適用する帳票（帳票の登録情報）を特定する（Ｓ４１）。

なお、図８（ａ）の表示画面において帳票番号として「自動判別」が選択された場合、制御部７は、画像データにおける所定位置ｂ１（「帳票種別」に対応する領域）について文字認識処理を行って帳票種別を読み出す。そして、画像データから読み出した帳票番号と登録されている各帳票の帳票番号とを比較し、一致する帳票が存在する場合にはその帳票を帳票ＯＣＲ処理に適用する帳票として特定する。なお、画像データから帳票番号を読み取る際の原稿傾き補正の要否および天地方向補正の要否については、帳票にかかわらず共通の設定としてデフォルト設定されていてもよく、自動判別が選択されて「原稿の読み取り」ボタンが操作されたときの図８（ａ）の表示画面における設定内容に応じて設定してもよい。

また、制御部７は、原稿傾き補正を行うか否かを判断する（Ｓ４２）。この判断は、図８（ａ）に示した表示画面においてユーザが原稿傾き補正を行うことを選択したか否かに応じて行えばよい。

そして、Ｓ４２において原稿傾き補正を行うと判断した場合、制御部７は、入力処理部１３において上述の処理が施された画像データに対して信号変換部３１、解像度変換部３２、および２値化処理部３３に上述した各処理を行わせ、その結果に基づいて原稿傾き検知部３４に原稿傾き検知処理を行わせ（Ｓ４３）、原稿補正部１５に原稿傾き補正処理を行わせる（Ｓ４４）。原稿補正部１５は、原稿傾き補正処理後の画像データを記憶部６に一旦記憶させる。

Ｓ４２において原稿傾き補正を行わないと判断した場合、あるいはＳ４４において原稿傾き補正処理を行った後、制御部７は、天地方向補正を行うか否かを判断する（Ｓ４５）。この判断は、図８（ａ）に示した表示画面においてユーザが天地方向補正を行うことを選択したか否かに応じて行えばよい。

そして、Ｓ４５において天地方向補正を行うと判断した場合、制御部７は、Ｓ４４において原稿傾き補正処理が施された画像データ、あるいは入力処理部１３において上述の処理が施された画像データを記憶部６から読み出して信号変換部３１、解像度変換部３２、および２値化処理部３３に上述した各処理を行わせ、その結果に基づいて天地方向検知部３５に天地方向検知処理を行わせ（Ｓ４６）、原稿補正部１５に天地方向補正処理を行わせる（Ｓ４７）。原稿補正部１５は、天地方向補正処理後の画像データを記憶部６に一旦記憶させる。

Ｓ４５において天地方向補正を行わないと判断した場合、あるいはＳ４７において天地方向補正処理を行った後、制御部７は、Ｓ４１で選択された帳票の登録情報に基づいて１または複数のＯＣＲ領域を抽出し、抽出したＯＣＲ領域の中から文字認識処理を行っていないＯＣＲ領域を１つ選択する（Ｓ４８）。

そして、制御部７は、記憶部６から画像データ（原稿傾き補正処理および／または天地方向補正処理が施された画像データ、あるいは入力処理部１３において上述の処理が施された画像データ）を読み出し、この画像データからＳ４８で選択したＯＣＲ領域の画像データ（部分画像データ）を切り出し、切り出した画像データに対して信号変換部３１、解像度変換部３２、および２値化処理部３３に上述した各処理を行わせて原稿検知部１４に出力させる（Ｓ４９）。例えば、帳票の登録情報においてＯＣＲ領域が図１８に示したように設定されており、帳票原稿が図２４（ａ）に示す原稿である場合、図２４（ｂ）に示す部分画像データのうち、処理対象としているＯＣＲ領域に対応する部分画像データが切り出される。なお、ＯＣＲ領域の部分画像データを切り出す処理を行う部分画像抽出部（図示せず）を制御部７とは別に設けてもよい。

また、制御部７は、原稿の文字サイズが「標準」、「大きい」、「かなり大きい」のうちのいずれに属するかを特定する（Ｓ５０）。具体的には、制御部７は、切り出されたＯＣＲ領域に対して登録されているＯＣＲ条件情報に応じて文字サイズを特定する。また、ＯＣＲ条件で、「自動判定」が登録されている場合には、制御部７は、原稿検知部１４に備えられる文字サイズ判定部３７に文字サイズの自動判定処理（文字サイズが「標準」、「大きい」、「かなり大きい」のうちのいずれに属するかを判定する処理）を行わせ、その判定処理結果に応じて文字サイズを特定する。文字サイズの自動判定方法としては、上述した方法を用いることができる。

次に、制御部７は、Ｓ５で特定した文字サイズに基づいて、文字サイズが「標準」であるか否か、すなわち原稿の文字サイズが認識処理部２２における文字認識において所定の文字認識精度が得られる認識処理部２２の動作仕様の上限値以下であるか否かを判断する（Ｓ５１）。そして、文字サイズが「標準」であると判断した場合には後述するＳ５３の処理に進む。

一方、文字サイズが「標準」ではないと判断した場合、すなわち特定された文字サイズが「大きい」または「かなり大きい」である場合、制御部７は、縮小処理部３８を制御し、２値化処理部３３によって生成された第１解像度および第２解像度の２値画像データ（Ｓ４９で切り出された部分画像データに基づいて生成された２値画像データ）に対して、縮小後の画像データにおける文字サイズが「標準」に収まるサイズになるように特定された文字サイズに応じて縮小処理を行わせ（Ｓ５２）、縮小処理後の第２解像度の２値画像データをレイアウト解析部３６に出力させ、縮小処理後の第１解像度の２値画像データを認識処理部２２に出力させる。

次に、制御部７は、レイアウト解析部３６を制御し、縮小処理部３８から入力された第２解像度の２値画像データに基づいて、画像データに含まれる文字の方向が縦書きであるか横書きであるかを解析するレイアウト解析処理を行わせる（Ｓ５３）。

その後、制御部７は、認識処理部２２を制御し、縮小処理部３８から入力される第１解像度の２値画像データ、レイアウト解析部３６から入力されるレイアウト解析結果（縦書きであるか横書きであるか）、およびＳ４１で選択した帳票の登録情報に含まれている処理中のＯＣＲ領域についてのＯＣＲ条件に基づいて、画像データに対する文字認識処理を行わせ、文字認識処理結果を描画コマンド生成部２３に出力させる（Ｓ５４）。なお、本実施形態では帳票ＯＣＲモードではテキストデータを画像データに対応付けた画像ファイルは生成せず、描画コマンド生成部２３は入力された文字認識処理結果をそのままフォーマット化処理部２４に出力するようになっている。

次に、制御部７は、Ｓ４１で選択した帳票の登録情報に含まれている全てのＯＣＲ領域について文字認識処理を行ったか否かを判断する（Ｓ５５）。そして、文字認識処理を行っていないＯＣＲ領域が残っている場合にはＳ４８の処理に戻る。

一方、全てのＯＣＲ領域について文字認識処理を完了したと判断した場合、制御部７は、フォーマット化処理部２４を制御し、描画コマンド生成部２３から入力される文字認識処理結果に基づいてＣＳＶフォーマットのテキストデータを生成させ（Ｓ５６）、通信装置５によって所定の送信先に送信させて処理を終了する。

なお、テキストデータとともに帳票原稿の画像データを送信するようにしてもよく、その場合には中間調生成部２０から出力される画像データをフォーマット化処理部２４によって所定の出力フォーマットに変換させ、通信装置５によって所定の送信先に送信させるようにすればよい。

また、画像データについては出力せず、テキストデータのみを出力するようにしてもよく、その場合には色補正部１６、黒生成下色除去部１７、空間フィルタ部１８、出力階調補正部１９、中間調生成部２０、および領域分離部２１の処理を省略してもよい。

以上のように、本実施形態にかかるデジタルカラー複合機１は、画像データの文字認識処理を行う際、文字認識処理の対象となる文字列の文字サイズが認識処理部２２において所定の文字認識精度が得られる認識処理部２２の動作仕様の上限値（上限サイズ）よりも大きい場合に、上記文字列の文字サイズが上記上限値以下になるように画像データに縮小処理を施して得られる画像データに基づいて文字認識処理を行う。

これにより、上記上限値よりも大きい文字についても精度よく文字認識処理を行うことができる。また、画像入力装置２においては文字サイズにかかわらず共通の光電変換手段を用いて画像読取処理を行うことができるので、画像入力装置２の装置構成を複雑化させることなく、簡単な構成で高精度の文字認識処理を行うことができる。

なお、本実施形態では、本発明をデジタルカラー複合機１に適用する場合について説明したが、本発明の適用対象はこれに限るものではない。例えば、デジタルカラー複合機１が有する上記各機能（コピア機能、スキャナ機能、プリンタ機能、ファクシミリ送受信機能、scan to e-mail機能）のうちの一部のみを有する装置（例えば複写機、スキャナなど）に適用することもできる。また、外部から取得した画像データに対して文字認識処理を施す画像処理装置（例えばパーソナルコンピュータ、サーバ装置等に備えられる画像処理装置）に適用することもできる。

図２５は、本発明をカラースキャナ（画像読取装置）１ｂに適用する場合の構成例を示すブロック図である。なお、デジタルカラー複合機１に備えられる各部材と同様の機能を有する部材については同じ符号を付している。

図２５に示すように、カラースキャナ１ｂは、画像入力装置２、画像処理装置３ｂ、記憶部６、制御部７、および操作パネル８を備えている。また、画像処理装置３ｂは、Ａ／Ｄ変換部１１、シェーディング補正部１２、入力処理部１３、原稿検知部１４、原稿補正部１５、色補正部１６、認識処理部２２、描画コマンド生成部２３、およびフォーマット化処理部２４を備えている。これにより、カラースキャナ１ｂでは、デジタルカラー複合機１における画像送信モードの処理と同様の処理が行われる。なお、フォーマット化処理部２４において所定のフォーマットに変換された画像ファイルを、例えばコンピュータやサーバ等へ出力するようにしてもよい。

図２６は、本発明をパーソナルコンピュータあるいはサーバ装置等の情報処理装置１ｃに適用する場合の構成例を示すブロック図である。なお、デジタルカラー複合機１に備えられる各部材と同様の機能を有する部材については同じ符号を付している。

図２６に示すように、この情報処理装置１ｃは、画像処理装置３ｃ、記憶部６、制御部７、およびユーザインターフェース部８ｂを備えている。また、画像処理装置３ｃは、入力処理部１３、原稿検知部１４、原稿補正部１５、認識処理部２２、描画コマンド生成部２３、およびフォーマット化処理部２４を備えている。ユーザインターフェース部８ｂはデジタルカラー複合機１における操作パネル８と同様の処理を行うものであり、表示部８ｃと操作入力部８ｄとを備えている。表示部８ｃとしては例えば液晶表示装置等と用いることができる。また、操作入力部８ｄとしては、キーボードやマウス等を用いることができる。

上記構成により、情報処理装置１ｃでは、デジタルカラー複合機１における文字認識処理と同様の処理が行われる。また、フォーマット化処理部２４において所定のフォーマットに変換された画像ファイルは、記憶部６に保存されるか、あるいは他の装置に出力される。

また、本実施形態において、デジタルカラー複合機１、カラースキャナ１ｂ、および情報処理装置１ｃに備えられる各部（各ブロック）を、ＣＰＵ等のプロセッサを用いてソフトウェアによって実現してもよい。この場合、デジタルカラー複合機１、カラースキャナ１ｂ、および情報処理装置１ｃは、各機能を実現する制御プログラムの命令を実行するＣＰＵ（central processing unit）、上記プログラムを格納したＲＯＭ（read only memory）、上記プログラムを展開するＲＡＭ（random access memory）、上記プログラムおよび各種データを格納するメモリ等の記憶装置（記録媒体）などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアであるデジタルカラー複合機１、カラースキャナ１ｂ、および情報処理装置１ｃの制御プログラムのプログラムコード（実行形式プログラム、中間コードプログラム、ソースプログラム）をコンピュータで読み取り可能に記録した記録媒体を、デジタルカラー複合機１、カラースキャナ１ｂ、および情報処理装置１ｃに供給し、そのコンピュータ（またはＣＰＵやＭＰＵ（ＭｉｃｒｏＰｒｏｃｅｓｓｉｎｇＵｎｉｔ））が記録媒体に記録されているプログラムコードを読み出し実行することによって達成される。

上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー（登録商標）ディスク／ハードディスク等の磁気ディスクやＣＤ−ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ／ＣＤ−Ｒ等の光ディスクを含むディスク系、ＩＣカード（メモリカードを含む）／光カード等のカード系、あるいはマスクＲＯＭ／ＥＰＲＯＭ／ＥＥＰＲＯＭ／フラッシュＲＯＭ等の半導体メモリ系などを用いることができる。

また、デジタルカラー複合機１、カラースキャナ１ｂ、および情報処理装置１ｃを通信ネットワークと接続可能に構成し、通信ネットワークを介して上記プログラムコードを供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、ＬＡＮ、ＩＳＤＮ、ＶＡＮ、ＣＡＴＶ通信網、仮想専用網（virtual private network）、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、ＩＥＥＥ１３９４、ＵＳＢ、電力線搬送、ケーブルＴＶ回線、電話線、ＡＤＳＬ回線等の有線でも、ＩｒＤＡやリモコンのような赤外線、Ｂｌｕｅｔｏｏｔｈ（登録商標）、８０２．１１無線、ＨＤＲ、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

また、デジタルカラー複合機１、カラースキャナ１ｂ、および情報処理装置１ｃの各ブロックは、ソフトウェアを用いて実現されるものに限らず、ハードウェアロジックによって構成されるものであってもよく、処理の一部を行うハードウェアと当該ハードウェアの制御や残余の処理を行うソフトウェアを実行する演算手段とを組み合わせたものであってもよい。

本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

本発明は、原稿を読み取って取得した画像データに基づいて上記原稿に記載されている文字の文字認識処理を行う画像処理装置および画像処理方法に適用できる。

１デジタルカラー複合機（画像読取装置、画像形成装置）
１ｂカラースキャナ（画像読取装置）
１ｃ情報処理装置
２画像入力装置
３，３ｂ，３ｃ画像処理装置
４画像出力装置（画像形成部）
５通信装置（ファイル出力処理部）
６記憶部
７制御部
８操作パネル（操作入力部）
８ｂユーザインターフェース部（操作入力部）
１４原稿検知部
１５原稿補正部
２２認識処理部
２３描画コマンド生成部
２４フォーマット化処理部
２５原稿種別自動判別部
３１信号変換部
３２解像度変換部
３３２値化処理部
３４原稿傾き検知部
３５天地方向検知部
３６レイアウト解析部
３７文字サイズ判定部
３８縮小処理部
３９行数判定部

Claims

原稿を読み取って取得した画像データに基づいて上記原稿に記載されている文字の文字認識処理を行う画像処理装置であって、
上記画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定する文字サイズ判定部と、
上記文字サイズ判定部によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された場合に、上記画像データにおける少なくとも上記所定サイズよりも大きいと判定された文字を含む領域を当該文字のサイズが上記所定サイズ以下になるように縮小処理する縮小処理部と、
上記画像データに含まれる文字の文字認識処理を行う認識処理部とを備え、
上記文字サイズ判定部は、上記画像データにおける複数の文字を含む領域毎または行毎に、当該領域または行に含まれる文字のサイズが所定サイズよりも大きいか否かを判定し、かつ、文字のサイズが上記所定サイズよりも大きいと判定した領域または行を、当該領域または当該行の文字のサイズの上記所定サイズに対する比率に応じて予め定めた複数のレベルのうちのいずれかに分類し、
上記縮小処理部は、上記文字サイズ判定部による分類結果に応じて、上記画像データにおける文字のサイズが上記所定サイズよりも大きいと判定された領域または行を、上記レベル毎に予め設定された縮小率で縮小処理し、
上記認識処理部は、上記文字サイズ判定部によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された領域または行について、上記縮小処理部によって縮小処理された画像データを用いて文字認識処理を行うことを特徴とする画像処理装置。
上記所定サイズは、上記認識処理部において所定の文字認識精度を得るための上記認識処理部の仕様上の上限値、または当該上限値より小さい値に設定されていることを特徴とする請求項１に記載の画像処理装置。
上記レベル毎に予め設定された上記縮小率は、２の累乗であることを特徴とする請求項１または２に記載の画像処理装置。
ユーザからの文字サイズの選択指示を受け付ける操作入力部を備え、
上記文字サイズ判定部は、上記操作入力部を介して入力される上記選択指示に基づいて上記画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定することを特徴とする請求項１から３のいずれか１項に記載の画像処理装置。
上記文字サイズ判定部は、上記画像データに基づいて文字認識処理の対象とする文字が含まれる領域における、各文字の外接矩形、各文字の高さ、各行の高さ、または複数の文字からなる文字群の外接矩形を検出し、この検出結果に基づいて上記画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定することを特徴とする請求項１から３のいずれか１項に記載の画像処理装置。
上記文字認識処理の結果に応じたテキストデータを含む出力ファイルを生成するフォーマット化処理部を備えていることを特徴とする請求項１から５のいずれか１項に記載の画像処理装置。
原稿を読み取って画像データを取得する画像入力装置と、
上記画像入力装置が取得した画像データに基づいて上記原稿に記載されている文字の文字認識処理を行う、請求項１から６のいずれか１項に記載の画像処理装置とを備えていることを特徴とする画像読取装置。
請求項６に記載の画像処理装置と、
上記画像データに応じた画像を記録材上に形成する画像形成部と、
上記出力ファイルを所定の送信先に送信するか、あるいは所定の保存先に保存するファイル出力処理部とを備えていることを特徴とする画像形成装置。
原稿を読み取って取得した画像データに基づいて上記原稿に記載されている文字の文字認識処理を行う画像処理方法であって、
上記画像データにおける文字認識処理の対象とする文字のサイズが所定サイズよりも大きいか否かを判定する文字サイズ判定工程と、
上記文字サイズ判定工程によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された場合に、上記画像データにおける少なくとも上記所定サイズよりも大きいと判定された文字を含む領域を当該文字のサイズが上記所定サイズ以下になるように縮小処理する縮小処理工程と、
上記画像データに含まれる文字の文字認識処理を行う認識処理工程とを含み、
上記文字サイズ判定工程では、上記画像データにおける複数の文字を含む領域毎または行毎に、当該領域または行に含まれる文字のサイズが所定サイズよりも大きいか否かを判定し、かつ、文字のサイズが上記所定サイズよりも大きいと判定した領域または行を、当該領域または当該行の文字のサイズの上記所定サイズに対する比率に応じて予め定めた複数のレベルのうちのいずれかに分類し、
上記縮小処理工程では、上記文字サイズ判定工程による分類結果に応じて、上記画像データにおける文字のサイズが上記所定サイズよりも大きいと判定された領域または行を、上記レベル毎に予め設定された縮小率で縮小処理し、
上記認識処理工程では、上記文字サイズ判定工程によって上記画像データにおける文字認識処理の対象とする文字のサイズが上記所定サイズよりも大きいと判定された領域または行について、上記縮小処理工程によって縮小処理された画像データを用いて文字認識処理を行うことを特徴とする画像処理方法。
請求項１から６のいずれか１項に記載の画像処理装置を動作させるプログラムであって、コンピュータを上記各部として機能させるためのプログラム。
請求項１０に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。