JP2006186414A - Image reader, image reading method, system and program, and storage medium - Google Patents
Image reader, image reading method, system and program, and storage medium Download PDFInfo
- Publication number
- JP2006186414A JP2006186414A JP2004374712A JP2004374712A JP2006186414A JP 2006186414 A JP2006186414 A JP 2006186414A JP 2004374712 A JP2004374712 A JP 2004374712A JP 2004374712 A JP2004374712 A JP 2004374712A JP 2006186414 A JP2006186414 A JP 2006186414A
- Authority
- JP
- Japan
- Prior art keywords
- reading
- image
- image reading
- resolution
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Image Input (AREA)
- Facsimiles In General (AREA)
- Facsimile Scanning Arrangements (AREA)
- Character Input (AREA)
Abstract
Description
本発明は、原稿の画像を最適な読取解像度で読み取ることが可能な画像読取装置及び方法、画像読取システム、プログラム、並びに記憶媒体に関するものである。 The present invention relates to an image reading apparatus and method, an image reading system, a program, and a storage medium that can read an image of a document with an optimum reading resolution.
近年、原稿の画像を読み取ると共に、OCR(Optical Character Reader)処理と連動して高精度の文字認識を行う画像読取装置が提案されている(例えば、特許文献1参照)。この画像読取装置では、低解像度で原稿の読み取り動作が実行された後にOCR処理で文字認識が行われ、文字認識率が所定値未満である場合、当該所定値に達するまで段階的に解像度を上げて読み取り動作が行われている。
しかしながら、上記特許文献1に記載された画像読取装置では、文字認識率が所定値未満である場合、たとえ原稿上に文字認識率の高い部分があっても、読取解像度を上げて再度原稿全体に対して読み取り動作が実行されることになり、無駄に時間を消費するという問題がある。
However, in the image reading apparatus described in
また、再読み取り時間を短縮するために、最初に低解像度で読み取り動作が実行された時点で、ユーザ自身が原稿に応じた最適な読取解像度を意識しなければならないという問題もある。 There is also a problem that the user himself / herself must be aware of the optimum reading resolution corresponding to the original when the reading operation is first executed at a low resolution in order to shorten the re-reading time.
本発明は、上記問題を解決すべく成されたものであり、原稿を再読み取りする時間を短縮することができ、ユーザに読取解像度の変更を意識させることなく、画像読み取り及び文字認識処理を行うことができる画像読取装置及び方法、画像読取システム、プログラム、並びに記憶媒体を提供することを目的とする。 The present invention has been made to solve the above-described problem, and can reduce the time for re-reading a document and perform image reading and character recognition processing without making the user aware of changes in the reading resolution. An object of the present invention is to provide an image reading apparatus and method, an image reading system, a program, and a storage medium.
上記目的を達成するために、請求項1記載の画像読取システムは、原稿の画像を読み取る画像読取装置と、当該画像読取装置に接続された情報処理装置とで構成される画像読取システムにおいて、前記画像読取装置は、前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信手段と、前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取手段とを備え、前記情報処理装置は、前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割手段と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、前記算出された第2の読取解像度を記憶する読取解像度記憶手段と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示手段とを備えることを特徴とする。
In order to achieve the above object, an image reading system according to
上記目的を達成するために、請求項11記載の画像読取装置は、原稿の画像を読み取る画像読取装置において、前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割手段と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取手段とを備えることを特徴とする。
In order to achieve the above object, an image reading apparatus according to
上記目的を達成するために、請求項12記載の画像読取方法は、原稿の画像を読み取る画像読取装置の画像読取方法において、前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割工程と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取工程とを備えることを特徴とする。 In order to achieve the above object, an image reading method according to claim 12 is an image reading method of an image reading apparatus for reading an image of a document, and includes a first image reading step of reading the document at a first reading resolution; A dividing step of dividing the first image data obtained by the first image reading means into a plurality of second image data, and a calculation for calculating a second reading resolution from each of the plurality of second image data And a second image reading step of reading the original document at the second reading resolution for each of the second image data.
上記目的を達成するために、請求項13記載の画像読取方法は、原稿の画像を読み取る画像読取装置と、当該画像読取装置に接続された情報処理装置とで構成される画像読取システムの画像読取方法において、前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信工程と、前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取工程と、前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割工程と、前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、前記算出された第2の読取解像度を記憶する読取解像度記憶工程と、前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示工程とを備えることを特徴とする。 In order to achieve the above object, an image reading method according to claim 13 is an image reading system comprising: an image reading apparatus that reads an image of a document; and an information processing apparatus connected to the image reading apparatus. In the method, a first image reading step of reading the document at a first reading resolution, a transmission step of transmitting the first image data obtained by the first image reading means to the information processing device, A second image reading step of reading a plurality of ranges on the document at different second reading resolutions based on instruction information from the information processing device; and a plurality of the first image data received from the image reading device. A dividing step of dividing the second image data, a calculating step of calculating a second reading resolution from each of the plurality of second image data, and the calculated second reading resolution. A reading resolution storing step, and an image reading instruction step of sending instruction information for instructing the document to be read at the second reading resolution for each second image data to the image reading device. To do.
本発明によれば、原稿を第1の読取解像度で読み取って得られた第1の画像データを複数の第2の画像データに分割し、当該複数の第2の画像データからそれぞれ第2の読取解像度を算出し、原稿を第2の画像データ毎に第2の読取解像度で読み取るので、画像データの部分ごとに読取解像度を変更して読み取りを行うことにより、原稿の再読み取り時間を短縮することができ、ユーザに読取解像度の変更を意識させることなく、画像読み取り及び文字認識処理を行うことができる。 According to the present invention, first image data obtained by reading a document at a first reading resolution is divided into a plurality of second image data, and a second reading is performed from each of the plurality of second image data. Since the resolution is calculated and the original is read at the second reading resolution for each second image data, reading time is changed by changing the reading resolution for each portion of the image data, thereby shortening the time for rereading the original. Thus, image reading and character recognition processing can be performed without making the user aware of changing the reading resolution.
以下、本発明の実施の形態を図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[第1の実施の形態]
図1は、本発明の実施の形態に係る画像読取システム全体のシステム構成と内部のハードウェア構成を示すブロック図である。
[First Embodiment]
FIG. 1 is a block diagram showing a system configuration of an entire image reading system and an internal hardware configuration according to an embodiment of the present invention.
図1において、本画像読取システム1は、パーソナルコンピュータ等から成る情報処理装置100と、当該情報処理装置100に通信ネットワーク300を介して接続されたスキャナ200とで構成される。
1, the
情報処理装置100は、CPU101と、RAM102と、ROM103と、外部メモリ104と、入力装置106と、表示装置107と、印刷装置108と、通信インターフェース109とを備える。スキャナ200は、不図示の原稿台上に載置された原稿の画像を読み取ることが可能な画像読取装置である。
The
ROM103又は外部メモリ104は、CPU101の制御プログラムであるBIOS(Basic Input/Output System)やオペレーティングシステム(以下、「OS」という。)等を記憶するものである。RAM102は、CPU101の主メモリ、ワークエリア等として機能するものである。
The
CPU101は、システムバス110に接続された各種デバイスとのアクセスを総括的に制御すると共に、後述する処理の実行に際して必要なプログラム等をRAM102にロードし、当該プログラム等を実行することで各種動作を実現するものである。
The
入力装置106は、キーボードやポインティングデバイス等で構成されるものである。表示装置107は、LCD(Liquid Crystal Display)等で構成されるものである。印刷装置108は、レーザプリンタ等で構成されるものである。通信インターフェース109は、所定のプロトコルにより通信ネットワーク300に接続すると共に、スキャナ200との通信を制御するものである。
The
外部メモリ104は、ハードディスク等の記憶装置で構成され、後述する文字認識処理で使用されるデータベース(DB)105を備える。DB105は、図11(a)に示す解像度変換Indexテーブル1101及び図11(b)に示す解像度変換No.テーブル1102を備える。解像度変換Indexテーブル1101は、文字の高さから解像度変換テーブルNo.を決定するためのテーブル情報である。解像度変換No.テーブル1102は、黒白変化点数から必要最小限の解像度を決定するためのテーブル情報である。
The
次に、図1の画像読取システム1における文字認識処理について図2〜図6を参照して説明する。
Next, character recognition processing in the
図2は、図1の画像読取システム1にて実行される文字認識処理を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。
FIG. 2 is a flowchart showing a character recognition process executed in the
図2において、まず、ステップS401では、スキャナ200が原稿に対して75dpiの低解像度でプレスキャンを行い、その結果をプレスキャン画像として情報処理装置100に送信する。
In FIG. 2, first, in step S401, the
次に、情報処理装置100は、スキャナ200からプレスキャン画像を受信し(ステップS402)、受信したプレスキャン画像から原稿の空白部分を検出、除外し、文字や絵など同類のものをまとめていくつかのブロックに分割する(ステップS403)。ここで、ブロックに分割されたプレスキャン画像の一例を図3に示す。
Next, the
図3において、プレスキャン画像301では、文字のかたまり(文字列)が4つあることからブロック302,303,304,305に分割される。
In FIG. 3, the
また、ステップS403では、ブロック302〜305のプレスキャン画像301上での位置や幅、高さ等のブロック位置情報を測定し、ブロック位置情報テーブルとしてRAM102に記憶する。ここで、記憶されたブロック位置情報テーブルの一例を図4に示す。
In step S403, block position information such as the position, width, and height of the
図4において、ブロック位置情報テーブル201には、ブロックNo.1〜4に対応してブロック302〜305の各ブロックのX軸及びY軸方向の各位置、幅、及び高さが格納されている。ブロックナンバー(No.)は、スキャンされる順に各ブロックに対して付されている。なお、X軸及びY軸の位置については各ブロックの頂点のうちの1つとするが、これに限定されるものではない。
In FIG. 4, the block position information table 201 includes a block No. Corresponding to 1 to 4, the positions, widths, and heights of the
図2に戻り、ステップS404では、ブロック302〜305の各ブロックに対して後述する最適解像度決定処理を行い、各ブロックのドット高及び最適解像度を算出し、ブロック別解像度テーブルとしてRAM102に格納する。ここで、ブロック別解像度テーブルの一例を図6に示す。
Returning to FIG. 2, in step S404, the optimum resolution determination process described later is performed for each of the
図6において、ブロック別解像度テーブル901には、ブロックNo.1〜4に対応してブロック302〜305の各ブロックのドット高[ドット]及び最適解像度[dpi]が格納されている。このドット高は、各ブロックにおける文字1行分の高さである。このドット高に基づいて当該ブロックをどれくらいの解像度で読み取るのが文字認識率を向上させるのに最適かを決定し、決定した解像度が最適解像度である。ブロック別解像度テーブル901における最適解像度は、それぞれのブロックを32[ドット]以上で読み取られるように算出されたものであるが、これに限定されるものではない。
In FIG. 6, the block-specific resolution table 901 includes a block No. Corresponding to 1 to 4, the dot height [dot] and the optimum resolution [dpi] of each of the
図2に戻って、ステップS405では、ステップS403でRAM102に格納されたブロック位置情報テーブル201から1ブロック分(例えば、ブロックNo.1)のブロック位置情報を読み出すと共に、RAM102に格納されたブロック別解像度テーブル901から当該ブロックに対応する最適解像度を読み出す。つづいて、ステップS406において、ステップS405で読み出した1ブロック分のブロック位置情報と最適解像度をスキャナ200に送信する。
Returning to FIG. 2, in step S405, the block position information for one block (for example, block No. 1) is read from the block position information table 201 stored in the
ステップS407において、スキャナ200は、情報処理装置100から受信した1ブロック分のブロック位置情報に基づいてスキャン位置を特定し、当該ブロックに対応する最適解像度で原稿上の当該ブロックの本スキャンを行う。つづいて、本スキャンした結果を情報処理装置100に送信する(ステップS408)。
In step S407, the
情報処理装置100は、スキャナ200から本スキャン結果を受信すると、全てのブロックに対して本スキャンが終了したか否かを判断し(ステップS409)、全てのブロックに対して本スキャンが終了しておらず、残っているブロックがあるときは、ステップS405に戻って、次のブロック(例えば、ブロックNo.2)に移行する。一方、全てのブロックに対して本スキャンが終了しているときは、ステップS410に進む。
When receiving the main scan result from the
ステップS410では、受信した各ブロックの本スキャン結果に対して文字認識処理を行って、本処理を終了する。 In step S410, a character recognition process is performed on the received main scan result of each block, and the process ends.
上記処理により、原稿上に文字サイズが互いに異なる文字列が複数存在していても、これらを各々最適な読取解像度でスキャンすることができ、文字認識率を向上させると共に、再読み取りする時間を短縮することができる。 By the above process, even if there are multiple character strings with different character sizes on the document, each of them can be scanned with the optimum reading resolution, improving the character recognition rate and reducing the time for re-reading. can do.
図5は、図2のステップS404における最適解像度決定処理の詳細を示すフローチャートである。 FIG. 5 is a flowchart showing details of the optimum resolution determination process in step S404 of FIG.
図5において、ステップS601では、ブロック302〜305のうちの1ブロックに対して当該ブロックが文字列か否かを判断する。一般に文字パタ−ンのような二次元情報は空間周波数の高い成分を多く含み、写真などの絵柄は空間周波数の低い成分を多く含む。従って、エッジ検出などの公知技術を用いることによって、入力画像中に含まれる文字領域と絵柄領域とを識別しうる。また網点処理された写真などは網点検出によって検出しうるので、それを文字領域と区別することもできる。これらの結果、当該ブロックが文字列でない場合は、当該ブロックに対して文字認識を行わず、ステップS605に進む。一方、当該ブロックが文字列である場合はステップS602へ進む。
In FIG. 5, in step S <b> 601, it is determined whether one of the
次に、ステップS602において、当該文字列ブロックにおける空白部分を検出し、行間を認識する。例えば、プレスキャン画像301では、横方向に空白が続く部分が検出され、行間307として認識される。つづいて、ステップS603において、ステップS602で認識された行間から文字1行分の高さ306を認識し、ドット高として当該文字列ブロックのブロック別解像度テーブル901に格納する。
Next, in step S602, a blank portion in the character string block is detected to recognize a line space. For example, in the
次に、ステップS604において、ステップS603で認識されたドット高に基づいて、文字列ブロックの文字部分が例えば32[ドット]以上で読み取られるように最適解像度を算出し、ステップS605において、算出した最適解像度を当該文字列ブロックのブロック別解像度テーブル901に格納する。 Next, in step S604, based on the dot height recognized in step S603, the optimal resolution is calculated so that the character portion of the character string block is read at, for example, 32 [dots] or more. In step S605, the calculated optimal The resolution is stored in the block-by-block resolution table 901 of the character string block.
次に、ステップS605において、全てのブロックに対して最適解像度を算出したか否かを判断し、算出していないブロックがあるときは、ステップS601に戻って、次のブロックに移行する。一方、全てのブロックに対して最適解像度を算出したときは、リターンする。 Next, in step S605, it is determined whether or not the optimal resolution has been calculated for all the blocks. If there is a block that has not been calculated, the process returns to step S601 and proceeds to the next block. On the other hand, when the optimum resolution is calculated for all the blocks, the process returns.
上記第1の実施の形態によれば、スキャナ200から受信したプレスキャン画像を文字や絵など同類のブロックに分割し、分割した各ブロックのブロック位置情報及び最適解像度を逐次算出してスキャナ200に送信し、当該ブロック位置情報及び最適解像度に基づいて当該ブロックの本スキャンを順次行わせるので、読み取りたい紙面の位置毎に最適な読取解像度の設定での再読み取り処理が行われるため、原稿の再読み取り時間を短縮することができる。
According to the first embodiment, the pre-scan image received from the
また、低解像度でプレスキャンを実行し、予め文字認識が困難と予想される範囲を認識し、自動的に最適解像度を設定して画像読み取り処理を実行することにより、ユーザが解像度を意識せずに画像読み取りを行うことができる。 In addition, by performing pre-scan at low resolution, recognizing the range where character recognition is expected to be difficult in advance, automatically setting the optimal resolution and executing image reading processing, the user is not aware of the resolution Image reading can be performed.
[第2の実施の形態]
本発明の第2の実施の形態に係る画像読取システムは、その構成(図1)が上記第1の実施の形態と同じであり、同一の構成要素には同一の符号を付してそれらの説明を省略する。以下に、上記第1の実施の形態と異なる点のみを説明する。
[Second Embodiment]
The image reading system according to the second embodiment of the present invention has the same configuration (FIG. 1) as that of the first embodiment, and the same components are denoted by the same reference numerals and their components are denoted by the same reference numerals. Description is omitted. Only differences from the first embodiment will be described below.
図7は、本発明の第2の実施の形態における文字認識処理を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。なお、ステップS701〜S704の処理は、図2のステップS401〜S404と同じである。
FIG. 7 is a flowchart showing character recognition processing in the second embodiment of the present invention. This process is executed by the
図7において、ステップS705では、RAM102に格納されたブロック位置情報テーブル201から全ブロックのブロック位置情報を読み出すと共に、RAM102に格納されたブロック別解像度テーブル901から全ブロックの最適解像度を読み出す。つづいて、ステップS706において、ステップS705で読み出した全ブロックのブロック位置情報と最適解像度を一括してスキャナ200に送信する。
In FIG. 7, in step S <b> 705, the block position information of all blocks is read from the block position information table 201 stored in the
ステップS707において、スキャナ200は、情報処理装置100から受信した全ブロックのブロック位置情報に基づいてスキャン位置を特定し、各ブロックに対応する最適解像度で原稿上のそれぞれのブロックの本スキャンを行う。つづいて、本スキャンした結果を情報処理装置100に送信する(ステップS708)。
In step S707, the
情報処理装置100は、スキャナ200から本スキャン結果を受信すると(ステップS709)、受信した全てのブロックの本スキャン結果に対して文字認識処理を行って(ステップS710)、本処理を終了する。
When the
本第2の実施の形態によれば、スキャナ200から受信したプレスキャン画像を文字列や絵、図などのブロックに分割し、分割した全ブロックの位置情報及び最適解像度を算出してスキャナ200に一括して送信し、当該位置情報及び最適解像度に基づいて全ブロックの本スキャンを行わせるので、本スキャンにかかる時間をより短くすることができる。
According to the second embodiment, the pre-scan image received from the
[第3実施の形態]
本発明の第3の実施の形態に係る画像読取システムは、その構成(図1)が上記第1の実施の形態と同じであり、同一の構成要素には同一の符号を付してそれらの説明を省略する。以下に、上記第1の実施の形態と異なる点のみを説明する。
[Third Embodiment]
The image reading system according to the third embodiment of the present invention has the same configuration (FIG. 1) as that of the first embodiment, and the same components are denoted by the same reference numerals and their components are denoted by the same reference numerals. Description is omitted. Only differences from the first embodiment will be described below.
図8は、本発明の第3の実施の形態における最適解像度決定処理の詳細を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。
FIG. 8 is a flowchart showing details of the optimum resolution determination process in the third embodiment of the present invention. This process is executed by the
図8において、ステップS501では、ブロック302〜305のうちの1ブロックに対して当該ブロックが文字列か否かを判断する。この結果、当該ブロックが文字列でない場合は、当該ブロックに対して文字認識を行わず、リターンする。一方、当該ブロックが文字列である場合はステップS502へ進む。
In FIG. 8, in step S501, it is determined whether one of the
次に、ステップS502において、ROM103又は外部メモリ104に予め格納されている変化点数解像度対応テーブルを読み出す。変化点数解像度対応テーブルには、図11(a)に示す解像度変換Indexテーブル1101及び解像度変換No.テーブル1102が含まれる。
Next, in step S502, the change point resolution correspondence table stored in advance in the
次に、ステップS503において、ブロック302〜305のうちの1ブロックから所定数の走査線を読み取り、白画素から黒画素及び黒画素から白画素への変化点を計数する。次に、ステップS504において、当該ブロックにおける文字1行分の高さが走査線何本分かを解析し、その走査線数と変化点数解像度対応テーブルに基づいて最適解像度を算出する。すなわち走査線数と図11(a)の解像度変換Indexテーブル1101から解像度変換テーブルNo.を決定し、図11(b)の解像度変換No.テーブル1102と計数された変化点数より最適解像度を算出し、図12に示すブロック別解像度テーブル1201に格納する。
In step S503, a predetermined number of scanning lines are read from one of the
上記第3の実施の形態によれば、白画素から黒画素及び黒画素から白画素に変化する変化点の数を計数することにより最適解像度を算出するので、上記第1の実施の形態の効果に加え、原稿上の文字がかすれていたり、薄い色であっても最適解像度を算出することができ、文字認識処理を適切に行うことができる。 According to the third embodiment, since the optimum resolution is calculated by counting the number of change points that change from white pixels to black pixels and from black pixels to white pixels, the effect of the first embodiment is obtained. In addition, the optimum resolution can be calculated even if characters on the document are faint or light, and character recognition processing can be performed appropriately.
なお、本第3の実施の形態を上記第2の実施の形態に適用することで、本発明が実現することも可能である。 The present invention can also be realized by applying the third embodiment to the second embodiment.
[第4の実施の形態]
本発明の第4の実施の形態に係る画像読取システムは、その構成(図1)が上記第1の実施の形態と同じであり、同一の構成要素には同一の符号を付してそれらの説明を省略する。以下に、上記第1の実施の形態と異なる点のみを説明する。
[Fourth Embodiment]
The image reading system according to the fourth embodiment of the present invention has the same configuration (FIG. 1) as that of the first embodiment, and the same components are denoted by the same reference numerals and their components are denoted by the same reference numerals. Description is omitted. Only differences from the first embodiment will be described below.
上記第1〜第3の実施の形態では、読取解像度を意識することなくスキャンする方法について説明したが、本第4の実施の形態では、ブロック毎に文字認識結果を確認してスキャンする方法について説明する。 In the first to third embodiments, the method of scanning without being conscious of the reading resolution has been described. In the fourth embodiment, the method of scanning by checking the character recognition result for each block. explain.
図9は、本発明の第4の実施の形態における文字認識処理を示すフローチャートである。本処理は、ROM103又は外部メモリ104に格納されたプログラムに基づいてCPU101により実行されるものである。
FIG. 9 is a flowchart showing character recognition processing in the fourth embodiment of the present invention. This process is executed by the
図9において、まず、情報処理装置100は、ROM103又は外部メモリ104に予め格納されている変化点数解像度対応テーブルを読み出す(ステップS801)。変化点数解像度対応テーブルには、図11(a)に示す解像度変換Indexテーブル1101及び解像度変換No.テーブル1102が含まれる。
In FIG. 9, first, the
次に、スキャナ200が原稿に対して75dpiの低解像度でプレスキャンを行い、その結果をプレスキャン画像として情報処理装置100に送信する(ステップS802)。
Next, the
次に、情報処理装置100は、スキャナ200からプレスキャン画像を受信し(ステップS803)、受信したプレスキャン画像から原稿の空白部分を検出し、文字や絵など同類のものをまとめていくつかのブロックに分割する(ステップS804)。
Next, the
次に、分割した各ブロックに対し、ステップS801で読み出した変化点数解像度対応テーブルを利用して後述するブロックスキャン処理を行い(ステップS805)、スキャン未処理ブロックがあるか否かを判別し(ステップS817)、スキャン未処理ブロックがないときは本処理を終了する。 Next, block scanning processing (to be described later) is performed on each divided block using the change point resolution correspondence table read in step S801 (step S805), and it is determined whether there is an unprocessed block (step S805). S817) When there is no unprocessed block, this processing is terminated.
図10は、図9のステップS805のブロックスキャン処理の詳細を示すフローチャートである。 FIG. 10 is a flowchart showing details of the block scan processing in step S805 of FIG.
図10において、まず、ブロック302〜305のうちの1ブロックから所定数の走査線を読み取り、白画素から黒画素及び黒画素から白画素への変化点を計数する(ステップS806)。次に、当該ブロックにおける文字1行分の高さが走査線何本分かを解析し、その走査線数と図11(a)の解像度変換Indexテーブル1101から解像度変換テーブルNo.を決定し、図11(b)の解像度変換No.テーブル1102とステップS806で計数された変化点数より最適解像度を算出する(ステップS807)。
In FIG. 10, first, a predetermined number of scanning lines are read from one of the
次に、計数された変化点数及び算出された最適解像度を図12のブロック別解像度テーブル1201に格納する(ステップS808)。つづいて、RAM102に格納されたブロック位置情報テーブル201から1ブロック分のブロック位置情報を読み出すと共に、RAM102に格納されたブロック別解像度テーブル1201から当該ブロックに対応する最適解像度を読み出してスキャナ200に送信する(ステップS809)。
Next, the calculated number of change points and the calculated optimum resolution are stored in the block-specific resolution table 1201 of FIG. 12 (step S808). Subsequently, the block position information for one block is read from the block position information table 201 stored in the
スキャナ200は、情報処理装置100から受信した1ブロックを、受信した最適解像度で本スキャンし(ステップS810)、その本スキャン結果と本スキャンした現在位置の情報を情報処理装置100に送信する(ステップS811)。
The
情報処理装置100は、スキャナ200から受信した本スキャン結果に対して文字認識処理を行う(ステップS812)。次に、文字認識処理の結果を表示装置107に表示し(ステップS813)、表示した文字認識処理の結果に対する可否をユーザに入力させ(ステップS814)、ユーザによりOKと判定されたか否かを判別する(ステップS815)。この結果、NGと判定されたときは、ユーザにより手動で解像度が変更され(ステップS816)、再度ステップS808以降の処理を行う一方、OKと判定されたときは、リターンする。
The
上記第4の実施の形態によれば、スキャナ200から受信したプレスキャン画像を文字や絵など同類のブロックに分割し、分割した各ブロックのブロック位置情報及び最適解像度を算出してスキャナ200に送信し、当該ブロック位置情報及び最適解像度に基づいて当該ブロックの本スキャンを行わせ、スキャナ200から受信した本スキャン結果に対して文字認識処理して文字認識結果を表示し、当該文字認識結果の可否をユーザに判定させるので、ユーザの要求に応じた文字認識結果を提供することができる。
According to the fourth embodiment, the pre-scan image received from the
上記第1〜第4の実施の形態において、画像読取システム1では、情報処理装置100とスキャナ200とが別体で構成されているが、一体で構成されていてもよい。また、スキャナ200は、画像読み取り機能を有するものであれば複写機やファクシミリ、複合機であってもよい。
In the first to fourth embodiments, in the
本発明の目的は、上記実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出して実行することによっても達成される。 An object of the present invention is to supply a storage medium storing software program codes for realizing the functions of the above-described embodiments to a system or apparatus, and a computer (or CPU, MPU, or the like) of the system or apparatus as a storage medium. This can also be achieved by reading and executing the stored program code.
この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。 In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiment, and the storage medium storing the program code constitutes the present invention.
また、プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。または、プログラムコードをネットワークを介してダウンロードしてもよい。 Examples of the storage medium for supplying the program code include a floppy (registered trademark) disk, a hard disk, a magneto-optical disk, a CD-ROM, a CD-R, a CD-RW, a DVD-ROM, a DVD-RAM, and a DVD. -RW, DVD + RW, magnetic tape, nonvolatile memory card, ROM, etc. can be used. Alternatively, the program code may be downloaded via a network.
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって上述した実施の形態の機能が実現される場合も含まれる。 Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) running on the computer based on the instruction of the program code. A case where part or all of the actual processing is performed and the functions of the above-described embodiments are realized by the processing is also included.
更に、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上述した実施の形態の機能が実現される場合も含まれる。 Further, after the program code read from the storage medium is written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion is performed based on the instruction of the program code. This includes the case where the CPU or the like provided in the board or the function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments are realized by the processing.
また、コンピュータが読み出したプログラムコードを実行することにより、前述した各実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOSなどが実際の処理の一部または全部を行い、その処理によって前述した各実施の形態の機能が実現される場合も、本発明に含まれることは云うまでもない。 Further, by executing the program code read out by the computer, not only the functions of the above-described embodiments are realized, but also the OS running on the computer based on the instruction of the program code is actually Needless to say, the present invention also includes a case where the functions of the above-described embodiments are realized by performing part or all of the processing, and the processing.
この場合、上記プログラムは、該プログラムを記憶した記憶媒体から直接、又はインターネット、商用ネットワーク、若しくはローカルエリアネットワーク等に接続された不図示の他のコンピュータやデータベース等からダウンロードすることにより供給される。 In this case, the program is supplied by downloading directly from a storage medium storing the program or from another computer or database (not shown) connected to the Internet, a commercial network, a local area network, or the like.
1 画像読取システム
100 情報処理装置
101 CPU
102 RAM
103 ROM
104 外部メモリ
107 表示装置
200 スキャナ
301 プレスキャン画像
302,303,304,305 ブロック
1
102 RAM
103 ROM
104
Claims (15)
前記画像読取装置は、前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、
前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信手段と、
前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取手段とを備え、
前記情報処理装置は、前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割手段と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、
前記算出された第2の読取解像度を記憶する読取解像度記憶手段と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示手段とを備えることを特徴とする画像読取システム。 In an image reading system including an image reading device that reads an image of a document and an information processing device connected to the image reading device,
The image reading apparatus includes: a first image reading unit that reads the document at a first reading resolution;
Transmitting means for transmitting the first image data obtained by the first image reading means to the information processing apparatus;
Second image reading means for reading a plurality of ranges on the document at different second reading resolutions based on instruction information from the information processing apparatus;
The information processing apparatus includes a dividing unit that divides the first image data received from the image reading apparatus into a plurality of second image data;
Calculating means for calculating a second reading resolution from each of the plurality of second image data;
Reading resolution storage means for storing the calculated second reading resolution;
An image reading system comprising: image reading instruction means for sending instruction information for instructing the original to be read at the second reading resolution for each second image data to the image reading apparatus.
前記文字認識された結果を表示する表示手段と、
ユーザからの入力に応じて前記第2の読取解像度を変更する変更手段とを更に備えることを特徴とする請求項1乃至7のいずれか1項に記載の画像読取システム。 The information processing apparatus includes: a character recognition unit that performs character recognition on image data of a document obtained by the second image reading unit;
Display means for displaying the result of the character recognition;
The image reading system according to claim 1, further comprising a changing unit that changes the second reading resolution in response to an input from a user.
前記原稿を第1の読取解像度で読み取る第1の画像読取手段と、
前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割手段と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出手段と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取手段とを備えることを特徴とする画像読取装置。 In an image reading apparatus that reads an image of a document,
First image reading means for reading the document at a first reading resolution;
Dividing means for dividing the first image data obtained by the first image reading means into a plurality of second image data;
Calculating means for calculating a second reading resolution from each of the plurality of second image data;
An image reading apparatus comprising: a second image reading unit that reads the original document at the second reading resolution for each second image data.
前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、
前記第1の画像読取手段により得られた第1の画像データを複数の第2の画像データに分割する分割工程と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取る第2の画像読取工程とを備えることを特徴とする画像読取方法。 In an image reading method of an image reading apparatus that reads an image of a document,
A first image reading step of reading the document at a first reading resolution;
A dividing step of dividing the first image data obtained by the first image reading means into a plurality of second image data;
A calculation step of calculating a second reading resolution from each of the plurality of second image data;
And a second image reading step of reading the original document for each of the second image data at the second reading resolution.
前記原稿を第1の読取解像度で読み取る第1の画像読取工程と、
前記第1の画像読取手段により得られた第1の画像データを前記情報処理装置に送信する送信工程と、
前記情報処理装置からの指示情報に基づいて前記原稿上の複数の範囲を互いに異なる第2の読取解像度で読み取る第2の画像読取工程と、
前記画像読取装置から受信した前記第1の画像データを複数の第2の画像データに分割する分割工程と、
前記複数の第2の画像データからそれぞれ第2の読取解像度を算出する算出工程と、
前記算出された第2の読取解像度を記憶する読取解像度記憶工程と、
前記原稿を前記第2の画像データ毎に前記第2の読取解像度で読み取るように指示する指示情報を前記画像読取装置に送る画像読取指示工程とを備えることを特徴とする画像読取方法。 In an image reading method of an image reading system including an image reading device that reads an image of a document and an information processing device connected to the image reading device,
A first image reading step of reading the document at a first reading resolution;
A transmission step of transmitting the first image data obtained by the first image reading means to the information processing apparatus;
A second image reading step of reading a plurality of ranges on the document at different second reading resolutions based on instruction information from the information processing apparatus;
A dividing step of dividing the first image data received from the image reading device into a plurality of second image data;
A calculation step of calculating a second reading resolution from each of the plurality of second image data;
A reading resolution storing step of storing the calculated second reading resolution;
An image reading method comprising: an image reading instruction step of sending instruction information for instructing to read the original for each of the second image data at the second reading resolution to the image reading apparatus.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004374712A JP2006186414A (en) | 2004-12-24 | 2004-12-24 | Image reader, image reading method, system and program, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004374712A JP2006186414A (en) | 2004-12-24 | 2004-12-24 | Image reader, image reading method, system and program, and storage medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006186414A true JP2006186414A (en) | 2006-07-13 |
Family
ID=36739223
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004374712A Withdrawn JP2006186414A (en) | 2004-12-24 | 2004-12-24 | Image reader, image reading method, system and program, and storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006186414A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007081887A (en) * | 2005-09-14 | 2007-03-29 | Canon Inc | Image processing apparatus and control method thereof |
JP2009163398A (en) * | 2007-12-28 | 2009-07-23 | Toshiba Corp | Form reading device, form reading system and program |
JP2015537325A (en) * | 2012-12-13 | 2015-12-24 | クアルコム,インコーポレイテッド | Text quality based feedback to improve OCR |
-
2004
- 2004-12-24 JP JP2004374712A patent/JP2006186414A/en not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007081887A (en) * | 2005-09-14 | 2007-03-29 | Canon Inc | Image processing apparatus and control method thereof |
JP2009163398A (en) * | 2007-12-28 | 2009-07-23 | Toshiba Corp | Form reading device, form reading system and program |
JP2015537325A (en) * | 2012-12-13 | 2015-12-24 | クアルコム,インコーポレイテッド | Text quality based feedback to improve OCR |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8374460B2 (en) | Image processing unit, noise reduction method, program and storage medium | |
JPH06332636A (en) | Printer server system | |
US8369614B2 (en) | Edge control in a digital color image via tone and size dependent dilation of pixels | |
JP5407627B2 (en) | Image processing apparatus, image processing method, and program | |
US20070057152A1 (en) | Image forming apparatus, image processing apparatus, image output apparatus, portable terminal, image processing system, image forming method, image processing method, image output method, image forming program, image processing program, and image output program | |
JP5315075B2 (en) | Image processing apparatus, image processing apparatus control method, and program | |
JP2020067959A (en) | Image processing apparatus, and control method and program thereof | |
JP2006186414A (en) | Image reader, image reading method, system and program, and storage medium | |
JP2020017899A (en) | Image forming apparatus, control method of the same, and program | |
JP7301529B2 (en) | Image processing device, image processing method, and program | |
JP2018182464A (en) | Image processing system and program | |
US20160072966A1 (en) | Non-transitory computer readable medium and image processing device | |
JP6855831B2 (en) | Data processing equipment and data processing program | |
JP6743447B2 (en) | Server program, image generation device, and image data generation method | |
US8437046B2 (en) | Image processing apparatus and method for outputting an image subjected to pseudo-halftone processing | |
JP6413450B2 (en) | Image processing apparatus, image forming apparatus, and program | |
JP6485051B2 (en) | Image processing system, image processing apparatus, and program | |
JP2008177721A (en) | Image processor, image forming apparatus, image formation system, and image processing program | |
US10212305B2 (en) | Communication apparatus and method and non-transitory computer readable medium for sending processing records to multiple destinations | |
US9444963B2 (en) | Non-transitory storage medium storing printer driver used by application software that generates print script from original in accordance with ability of image forming apparatus, and printing method | |
JP6174190B2 (en) | Image forming apparatus, image output program, and image output method | |
JP2017142690A (en) | Information processing apparatus and method for controlling the same | |
KR20060105371A (en) | Network scanning system and network scanning method using the same | |
JP5413297B2 (en) | Image processing apparatus, image processing method, program, and recording medium | |
JP2000255131A (en) | Image printing apparatus and method, and memory medium storing program readable by computer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060420 |
|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080304 |