JP2009048293A

JP2009048293A - 情報処理システム、情報処理実行プログラム及び画像処理装置

Info

Publication number: JP2009048293A
Application number: JP2007211813A
Authority: JP
Inventors: Kazuhiro Otani; 和宏大谷; Katsuya Koyanagi; 勝也小柳; Kenji Furuyama; 健司古山; Masataka Kamiya; 昌孝神谷
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2007-08-15
Filing date: 2007-08-15
Publication date: 2009-03-05

Abstract

【課題】既に実行したＯＣＲ変換処理を、必要以上に無駄にすることなく、かつＯＣＲ変換のための時間を細分化管理することで、作業効率の低下を防止する。
【解決手段】サーチャブルＰＤＦ５０を作成するためのＯＣＲ変換の際、当該元となる原稿のイメージ領域を複数の区画部Anに分類し、それぞれの区画部An毎にＯＣＲ変換時間を設定し、この設定した時間を経過しても当該区画部AnのＯＣＲ変換が見完了の場合は、その区画部AnのみＯＣＲ変換を断念するようにした。これにより、冗長されるＯＣＲ変換にある程度歯止めをかけて、処理時間の短縮化を図ると共に、他の区画部AnのＯＣＲ変換が完了していれば、その区画部AnのサーチャブルＰＤＦとしての能力を維持することができる。
【選択図】図３

Description

本発明は、検査機能付電子文書を作成するための情報処理システム、情報処理実行プログラム及び画像処理装置に関するものである。

近年、紙文書の電子化の最大の課題は、電子化された文書を如何に容易に検索可能にするかと言われている。

上記課題に対応するため、透明テキスト付電子文書（透明テキスト付ＰＤＦ）という技術が開発されている。これは、スキャンした画像データに、ＯＣＲ変換（文字認識）したテキストデータを透明色で貼り付けた構成となっている。

なお、ＯＣＲ変換技術として、不必要なイメージデータ部分を除外するべく、予めストップマークを付与することで、ＯＣＲ変換を中止する技術が提案されている（特許文献１参照）。

ここで、この透明テキスト付ＰＤＦは、人間が見るときはスキャンした画像データであるため、仮にＯＣＲ変換に誤変換があっても全く気にならない。一方、正しく変換できない部分はＰＤＦの検索機能でほぼ正確に検索できる。このように、検索が可能であることから、透明テキスト付ＰＤＦをサーチャブルＰＤＦということもある（以下、「サーチャブルＰＤＦ」という）。

サーチャブルＰＤＦは、上記の如く非常に便利である反面、ＯＣＲ変換したテキストデータが透明であるため、このＯＣＲ変換した領域の内、誤変換された部分を特定するのが困難となる。

このため、ＯＣＲ変換の精度を高める必要があるが、ＯＣＲ変換の精度を高めると読取時間（文字認識時間）が増長することになる。

そこで、用紙（１頁）の読み取り作業において、所定時間経過しても完了しない場合は、１頁全体のＯＣＲ変換を中止することが考えられるが、これでは、多くのＯＣＲ変換部分が存在するばかりでなく、当該頁における既にＯＣＲ変換が完了した部分が無駄となる。
特開平１０−２３２９０４公報

本発明は上記事実を考慮し、既に実行したＯＣＲ変換処理を、必要以上に無駄にすることなく、かつＯＣＲ変換のための時間を細分化管理することで、作業効率の低下を防止することができる情報処理システム、画像処理実行プログラム及び画像処理装置を得ることが目的である。

（第１の発明／画像処理システム）
第１の発明は、所定の原稿画像から文字認識装置によって抽出された透明なテキストデータを、前記所定の原稿画像に基づいて生成された電子文書に重ね合わせ、目視画像に対して検索機能を加味した検索機能付電子文書を作成するための情報処理システムであって、前記文字認識装置で抽出する領域を複数に区画する文字認識領域区画手段と、前記文字認識領域区画手段で区画されたそれぞれの区画毎に、文字認識装置における文字認識時間を設定する文字認識時間設定手段と、前記文字認識時間設定手段で設定した文字認識実行時間中に文字認識が完了したか否かを判別する判別手段と、各区画毎の前記判別手段による判別結果が、文字認識未完了と判別された場合に、当該区画の文字認識を省略する文字認識中止手段と、を有している。

第１の発明によれば、文字認識装置で抽出する領域を複数に区画し、区画されたそれぞれの区画毎に、文字認識装置における文字認識時間を設定すると共に、この設定した文字認識実行時間中に文字認識が完了したか否かを判別し、文字認識未完了と判別された場合に、当該区画の文字認識を省略するようにした。

この結果、既に実行したＯＣＲ変換処理を、必要以上に無駄にすることなく、かつ作業効率の低下を防止することができる。

第１の発明において、前記領域が原稿の１頁分であり、前記区画は１頁内の細分化であることを特徴としている。

また、領域が原稿の１頁分であり、前記区画が１頁内の細分化とすることで、作業効率の低下の防止効果をさらに上げることができる。

また、第１の発明において、前記電子文書に含まれるイメージ領域が、所定の圧縮率で圧縮する圧縮手段をさらに有することを特徴としている。

さらに、所定の圧縮処理によりイメージ領域の読取時間を短縮することができる。

（画像処理実行プログラム／第２の発明）
第２の発明は、所定の原稿画像から文字認識装置によって抽出された透明なテキストデータを、前記所定の原稿画像に基づいて生成された電子文書に重ね合わせ、目視画像に対して検索機能を加味した検索機能付電子文書を作成するための情報処理実行プログラムであって、前記文字認識装置で抽出する領域を複数に区画し、区画されたそれぞれの区画毎に、文字認識装置における文字認識時間を設定し、設定した文字認識実行時間中に文字認識が完了したか否かを判別し、各区画毎の判別結果が、文字認識未完了と判別された場合に、当該区画の文字認識を省略することを特徴としている。

第２の発明によれば、文字認識装置で抽出する領域を複数に区画し、区画されたそれぞれの区画毎に、文字認識装置における文字認識時間を設定すると共に、この設定した文字認識実行時間中に文字認識が完了したか否かを判別し、文字認識未完了と判別された場合に、当該区画の文字認識を中止するようにした。

第２の発明において、前記領域が原稿の１頁分であり、前記区画は１頁内の細分化であることを特徴としている。

（画像処理装置／第３の発明）
第３の発明は、原稿画像を読み取る原稿画像読取装置と、前記原稿画像読取装置で読み取った読取データに基づいて、文字認識すべき領域と、イメージ領域とに分別する文字認識領域分別手段と、前記文字認識領域分別手段で分別した文字認識領域内の読取データに基づいて文字認識を実行する文字認識装置と、前記文字認識領域選別手段で分別したイメージ領域の読取データを所定の圧縮率で圧縮する圧縮手段とを有し、前記文字認識装置が、前記文字認識領域分別手段で分別した文字認識領域を細分化して、複数の区画を生成する区画生成手段と、前記区画生成手段で区画した領域毎に文字認識実行時間を設定する文字認識実行時間設定手段と、前記区画毎の文字認識処理において、それぞれの区画における文字認識実行時間設定手段で設定した文字認識実行時間を超えた場合に、当該区画の文字認識を中止する文字認識中止手段と、を備えることを特徴としている。

第３の発明によれば、文字認識装置で抽出する領域を複数に区画し、区画されたそれぞれの区画毎に、文字認識装置における文字認識時間を設定すると共に、この設定した文字認識実行時間中に文字認識が完了したか否かを判別し、文字認識未完了と判別された場合に、当該区画の文字認識を中止するようにした。

第３の発明において、前記領域が原稿の１頁分であり、前記区画は１頁内の細分化であることを特徴としている。

以上説明した如く本発明では、既に実行したＯＣＲ変換処理を、必要以上に無駄にすることなく、かつＯＣＲ変換のための時間を細分化管理することで、作業効率の低下を防止することができるという優れた効果を有する。

図１には、本実施の形態に係る画像形成装置１０と、この画像形成装置１０を用いた画像処理を制御するためのＰＣ１００とがネットワーク１０２介して接続されたシステム構成が示されている。

（画像形成装置１０の概略構成）
図２には、本実施の形態に係る画像形成装置１０の概要が示されている。画像形成装置１０には、画像形成部１２、この画像形成部１２の上方に設けられた原稿読取部１４とで構成されている。原稿読取部１４には、当該原稿読取部１４の開閉蓋を兼用する原稿搬送装置１６が設けられている。

原稿読取部１４には、その上面に原稿を載せるための透明のガラス板で形成されたプラテンガラス（図示省略）が設置され、原稿読取領域となっている。また原稿読取部１４には、ユーザが原稿読取、或いは複写指示等を入力操作するためのユーザー・インターフェイス２４が配設されている。ユーザー・インターフェイス２４にはテンキーが設けられ、プリント枚数設定や倍率設定に利用されると共に、ファクシミリ送信時の電話機のダイヤルキーとしても利用される。すなわち、原稿読取部１４は、コピー時の原稿読取機能と、ファクシミリ送信時の原稿読取機能とを併せ持っている。なお、コピー機能は前記画像形成部１２と原稿読取部１４との組合わせで実行可能である。

原稿搬送装置１６には、複写しようとする原稿を（複数枚の場合は重ねて）載せるフィーダートレイ２０が設けられている。この原稿搬送装置１６では、フィーダートレイ２０上に載せられた原稿（複数枚重ねられている場合は、その最上層の原稿）を、原稿反転ユニット（図示省略）へ送り込むことで、反転しながらプラテンガラス上の読取領域を通過させ、フィーダートレイ２０の下部に設けられた原稿排紙トレイ２２上に排出されるように自動搬送して原稿読取動作を実行する。

画像形成部１２には、装置本体下部に３段に渡って配置された給紙トレイ２６が設けられ、サイズが指定されることで、選択的に給紙トレイ２６から記録シートが給紙装置によって１枚ずつ引き出され、画像形成部１２に搬送されるようになっている。

画像形成部１２には、シート材に画像を形成する感光体ドラムが配設されている。なお、図示は省略したが、感光体ドラムの周囲には、帯電装置、光走査装置、現像装置、転写装置等が配設されている。感光体ドラムの周面は、一様に帯電された後、光走査装置によって画像データに基づく静電潜像が形成され、形成された静電潜像を現像装置によってトナー現像する。その後、転写装置を通過することで、感光体ドラム上のトナー画像がシート材に転写する構成となっている。画像が転写されたシート材は定着装置によって加熱、加圧処理され、画像が定着された状態で排出されるようになっている。

上記画像形成装置１０では、例えば、物理的に存在する紙媒体に記録された原稿画像を、画像読取部１４で読み取ることで、検索機能付電子文書（以下、「サーチャブルＰＤＦ」という）を作成する機能を備えている。作成されたサーチャブルＰＤＦ５０（図４参照）は、所定の端末処理装置（例えば、ＰＣ１００）へ送信される。

サーチャブルＰＤＦ５０とは、原稿画像に基づいて生成したＰＤＦ画像（図４に示すＰＤＦレイヤー５２）に対して、別途原稿画像のテキスト部分をＯＣＲ変換して生成したテキストデータ（図４に示すテキストレイヤー５４）を透明化して貼り付けた、所謂レイヤー構造であり、当該目視可能なＰＤＦ画像のテキスト部分を検索可能としたものである。

このため、このサーチャブルＰＤＦを、前記ＰＣ１００のモニタ１００Aに表示することで、当該一連（複数ページに亘る場合がある）のサーチャブルＰＤＦを検索対象とした、文字（デキストデータ）検索が可能となる。

図３は、ＰＣ１００における、画像形成装置１０のスキャナ機能（画像読取部１４による画像読取機能）によって読み取ったデータに基づいてサーチャブルＰＤＦを生成するための機能ブロック図である。なお、この機能ブロック図は、ハード構成を限定するものではない。

画像形成装置１０のスキャニング機能で読み取った画像データ（イメージデータ）は、画像解析部１０１に入力されるようになっている。

画像解析部１０１では、イメージデータの内、テキスト（文字）になり得る領域（テキスト領域）と、写真、イラスト、図形等の領域（イメージ領域）とが混在するか否かの解析を実行する。

画像解析部１０１は、イメージ／テキスト分離部１０３に接続されている。イメージ／テキスト分離部１０３では、前記画像解析部１００で解析したテキスト領域と、イメージ領域とに分離する。

また、イメージ／テキスト分離部１０３は、圧縮部１０４と、テキストデータ区画部１０６と、ＰＤＦ作成部１０８とにそれぞれ接続されている。

圧縮部１０４は、イメージ／テキスト分離部１０３から入力されるスキャンデータを対象とした圧縮処理を実行し（以下、圧縮後のデータを「圧縮イメージデータ」という）、当該圧縮イメージデータをＰＤＦ作成部１０８へ送出する。

テキストデータ区画部１０６は、イメージ／テキスト分離部１０３から入力されるテキスト領域を複数の領域に区画する（図５に示す区画部Ａn（nは正の整数）参照）。言い換えれば、後に実行するＯＣＲ変換処理の対象領域を予め細分化しておく。

この区画部Anは、例えば、単純に矩形の枠で区画してもよいし、文字フォントや大きさ等の特定ファクタに基づいて区画してもよい。

また、テキストデータ区画部１０６は、区画部−ＯＣＲ変換時間設定部１１０、区画領域読出部１１２に接続されている。

区画部−ＯＣＲ変換時間設定部１１０は、前記テキストデータ区画部１０６で区画された複数の区画部Anの情報（区画情報）に基づいて、当該区画部An毎に、ＯＣＲ変換時間を設定する。例えば、このＯＣＲ変換時間は、区画部Anの面積に比例して設定してもよいし、文字数に比例して設定してもよい。

なお、ここでは詳細に記載していないが、区画部Anを示す識別符号と、当該区画部AnのＯＣＲ変換時間とをテーブルかして記憶するようにしてもよいし、区画部Anの面積や区画部An内の文字数に基づいて、その都度、演算によってＯＣＲ変換時間を得るようにしてもよい。

区画領域読出部１１２は、前記テキスト領域区画部１０６からテキスト領域データを受け、これをＯＣＲ変換実行部１１４からの読出指示に応答するように送出する役目を有している。

なお、このとき、区画領域読出部１０６では、前記区画部−ＯＣＲ変換時間設定部１１０に対して、ＯＣＲ変換区画指定情報を送出する。これにより、区画部−ＯＣＲ変換時間設定部１１０では、該当するＯＣＲ設定時間情報を計時部１１６へ送出するようになっている。

計時部１１６は、ＯＣＲ変換実行部１１４に接続され、このＯＣＲ変換実行部１１４からは計時部１１６に対して、特定の区画部AnのＯＣＲ変換処理が開始されるとき、計時起動指示が送出される。

計時部１１６では、前記計時起動指示に応じて、計時を開始するが、このときの計時終了時間（タイムアップ時間）は、前記区画部−ＯＣＲ変換時間設定部１１０から入力するＯＣＲ変換時間である。

計時部１１６は、ＯＫ／ＮＧ判別部１１８に接続されている。また、前記ＯＣＲ変換実行部１１４もＯＫ／ＮＧ判別部１１８に接続されている。

ＯＣＲ変換実行部１１４から計時部１１６には、ＯＣＲ変換開始信号及び変換終了信号が送出される。

計時部１１６では、計時時間情報をＯＫ／ＮＧ判別部１１８へ送出する。ＯＫ／ＮＧ判別部１１８では、前記開始信号から終了信号までの時間と、前記区画部−ＯＣＲ変換時間設定部１１０から入力するＯＣＲ変換時間と、に基づいてＯＣＲ変換が所定の時間内に完了したか（ＯＫ）否か（ＮＧ）が判別され、その判別信号（ＯＫ又はＮＧ）が、ＯＣＲ変換実行部１１４にフィードバックされる。

判別結果がＯＫの場合には、ＯＣＲ変換実行部１１４でＯＣＲ変換したデータ（区画部Anのテキストデータ）は、ＯＣＲ変換データレイアウト部１２０へ送出されるようになっている。

ＯＣＲ変換データレイアウト部１２０では、ＯＣＲ変換したテキストデータ（区画部An）を、元の原稿画像の座標データと照合しながらレイアウトし（図４に示すテキストレイヤー５４の作成）、レイヤー管理部１２２へ送出する。

一方、このレイヤー管理部１２２には、前記ＰＤＦ作成部で作成したＰＤＦ（図４に示すＰＤＦレイヤー５２）が入力されるようになっている。このレイヤー管理部１２４では、テキストレイヤー５４とＰＤＦレイヤー５２とが合成され、サーチャブルＰＤＦ５０が生成される。

レイヤー管理部１２４は、表示制御部１２４に接続されている。表示制御部１２４では、合成されたサーチャブルＰＤＦ５０をＰＣ１００のモニタ１００Ａに表示する。

以下に本実施の形態の作用を図６のフローチャートに従い説明する。

図６は、ＰＣ１００におけるサーチャブルＰＤＦ５０の作成手順を示しており、ステップ１５０では、スキャンデータが入力されたか否かが判断され、肯定判定されるとステップ１５２へ移行して入力データを解析し、ステップ１５４へ移行する。また、ステップ１５０で否定判定された場合には、後述するステップ１８６へ移行する。

ステップ１５４では、イメージ領域とテキスト領域とを分離し、次いでステップ１５６へ移行してスキャンデータの圧縮処理を実行し、ステップ１５８へ移行する。

ステップ１５８では、圧縮処理されたデータに基づいて、ＰＤＦレイヤー５２を作成する。

一方、次のステップ１６０では、前記ステップ１５４で分離した片方であるイメージ領域を区画部Anに分割し、ステップ１６２へ移行する。

ステップ１６２では、各区画部An毎のＯＣＲ変換時間を設定する。この区画−ＯＣＲ設定時間はテーブル化して記憶してもよいし、その都度、演算等による得るようにしてもよい。

次のステップ１６４では、ＯＣＲ変換する区画部Anを特定し、次いでステップ１６６へ移行して特定した区画部AnのＯＣＲ変換時間を読み出して、ステップ１６８へ移行する。

ステップ１６８では、ＯＣＲ変換を開始し、次いでステップ１７０で計時をスタートする。

次のステップ１７２では、ＯＣＲ変換が終了したか否かが判断され、否定判定されると、ステップ１７４へ移行して、当該区画部Anに設定したＯＣＲ変換時間が経過したか否かが判断される。このステップ１７４で否定判定された場合は、区画部An内のＯＣＲ変換時間に余裕があり、ステップ１７２へ戻り、ＯＣＲ変換を継続する。

一方、ステップ１７４で肯定判定された場合は、区画部An内のＯＣＲ変換時間がなくなったと判断され、ステップ１７６へ移行して当該区画部AnのＯＣＲ変換を中止し、ステップ１７８へ移行する。

また、前記ステップ１７２で肯定判定された場合は、当該区画部AnのＯＣＲ変換が終了したと判断し、ステップ１７８へ移行する。

ステップ１７８では、次にＯＣＲ変換する区画部Anが残っているか否かが判断され、肯定判定されると、ステップ１６４へ戻り、上記工程を繰り返す。

また、ステップ１７８で否定判定されると、全ての区画部AnのＯＣＲ変換処理が終了（ＯＣＲ中止区画部Anを含む）したと判断し、ステップ１８０へ移行してテキストレイヤー５４を作成する。

次のステップ１８２では、前記ステップ１５８で作成されたＰＤＦレイヤー５２と、ステップ１８０で作成されたテキストレイヤー５４とを合成し、次いでステップ１８４で合成によって生成されたサーチャブルＰＤＦを保存し、ステップ１８６へ移行する。

ステップ１８６では、サーチャーブルＰＤＦ５０の表示指示があったか否かが判断され、肯定判定されるとステップ１８８へ移行して、保存されたサーチャブルＰＤＦから表示指示がなされたサーチャブルＰＤＦ５０を読み出し、次いでステップ１９０へ移行して表示制御を実行する（ＰＣ１００のモニタ１００Ａに表示）。

以上説明したように本実施の形態では、サーチャブルＰＤＦ５０を作成するためのＯＣＲ変換の際、当該元となる原稿のイメージ領域を複数の区画部Anに分類し、それぞれの区画部An毎にＯＣＲ変換時間を設定し、この設定した時間を経過しても当該区画部AnのＯＣＲ変換が見完了の場合は、その区画部AnのみＯＣＲ変換を断念するようにした。

これにより、冗長されるＯＣＲ変換にある程度歯止めをかけて、処理時間の短縮化を図ると共に、他の区画部AnのＯＣＲ変換が完了していれば、その区画部AnのサーチャブルＰＤＦとしての能力を維持することができる。

なお、本実施の形態では、一連のＯＣＲ変換処理をＰＣ１００により実行するように説明したが、この一連のＯＣＲ変換処理は、前記画像形成装置１０で実行するようにしてもよい。

言い換えれば、ＰＣ１００と画像形成装置１０とは、ネットワーク１０２を介して画像処理装置（画像処理システム）を構成しており、一連のＯＣＲ処理は、画像処理装置の範疇であれば、上記ＰＣ１００、画像形成装置１０に限らず、例えば、新たにネットワーク１０２に接続、或いは、ＰＣ１００又は画像形成装置１０に直接接続した、サーバーや情報処理端末等によって実行するようにしてもよい。

また、上記では、原稿画像を元の画像としたが、ファクシミリ等のように電子的に受信したビットマップデータ等を元の画像としてＯＣＲ変換処理を実行してもよい。

さらに、本実施の形態デでは、Adobe System社によって開発されたＰＤＦフォーマットを中心に説明したが、それに類する検索機能の付いた電子文書の応用も可能である。

本実施の形態に係る画像処理装置と、この画像処理装置を用いた画像処理を制御するためのＰＣとがネットワークを介して接続されたシステム構成図である。本実施の形態に係る画像形成装置１０の概略構成図である。ＰＣにおける、画像処理装置のスキャナ機能によって読み取ったデータに基づいてサーチャブルＰＤＦを生成するための機能ブロック図である。サーチャブルＰＤＦのレイヤー構成を示す斜視図である。テキストレイヤーにおける区画部を示す平面図である。ＰＣ１００におけるサーチャブルＰＤＦ５０の作成手順を示す制御フローチャートである。

符号の説明

１０画像形成装置
１００ＰＣ（文字認識装置）
１０２ネットワーク
１２画像形成部
１４原稿読取部（原稿画像読取装置）
１６原稿搬送装置
２４ユーザ・インター・フェイス
２０フィーダートレイ
２２原稿排紙トレイ
２６給紙トレイ
５０サーチャーブルＰＤＦ
５２ＰＤＦレイヤー
５４テキストレイヤー
１００Ａモニタ
１０１画像解析部
１０３イメージ／テキスト分離部（文字認識領域分別手段）
１０４圧縮部（圧縮手段）
１０６テキストデータ区画部（文字認識領域区画手段、区画生成手段）
１０８ＰＤＦ作成部
１１０区画部−ＯＣＲ変換時間設定部（文字認識実行時間設定手段）
１１２区画領域読出部
１１４ＯＣＲ変換実行部（文字認識中止手段）
１１６計時部
１１８ＯＫ／ＮＧ判別部（判別手段）
１２０ＯＣＲ変換データレイアウト部
１２２レイヤー管理部
１２４表示制御部

Claims

所定の原稿画像から文字認識装置によって抽出された透明なテキストデータを、前記所定の原稿画像に基づいて生成された電子文書に重ね合わせ、目視画像に対して検索機能を加味した検索機能付電子文書を作成するための情報処理システムであって、
前記文字認識装置で抽出する領域を複数に区画する文字認識領域区画手段と、
前記文字認識領域区画手段で区画されたそれぞれの区画毎に、文字認識装置における文字認識時間を設定する文字認識実行時間設定手段と、
前記文字認識実行時間設定手段で設定した文字認識実行時間中に文字認識が完了したか否かを判別する判別手段と、
各区画毎の前記判別手段による判別結果が、文字認識未完了と判別された場合に、当該区画の文字認識を省略する文字認識中止手段と、
を有する情報処理システム。
前記領域が原稿の１頁分であり、前記区画は１頁内の細分化であることを特徴とする請求項１記載の情報処理システム。
前記電子文書に含まれるイメージ領域が、所定の圧縮率で圧縮する圧縮手段をさらに有することを特徴とする請求項１又は請求項２記載の情報処理システム。
所定の原稿画像から文字認識装置によって抽出された透明なテキストデータを、前記所定の原稿画像に基づいて生成されたＰＤＦに重ね合わせ、目視画像に対して検索機能を加味した検索機能付電子文書を作成するための情報処理実行プログラムであって、
前記文字認識装置で抽出する領域を複数に区画し、
区画されたそれぞれの区画毎に、文字認識装置における文字認識実行時間を設定し、
設定した文字認識実行時間中に文字認識が完了したか否かを判別し、
各区画毎の判別結果が、文字認識未完了と判別された場合に、当該区画の文字認識を省略することを特徴とする情報処理実行プログラム。
前記領域が原稿の１頁分であり、前記区画は１頁内の細分化であることを特徴とする請求項４記載の情報処理実行プログラム。
原稿画像を読み取る原稿画像読取装置と、
前記原稿画像読取装置で読み取った読取データに基づいて、文字認識すべき領域と、イメージ領域とに分別する文字認識領域分別手段と、
前記文字認識領域分別手段で分別した文字認識領域内の読取データに基づいて文字認識を実行する文字認識装置と、
前記文字認識領域選別手段で分別したイメージ領域の読取データを所定の圧縮率で圧縮する圧縮手段とを有し、
前記文字認識装置が、
前記文字認識領域分別手段で分別した文字認識領域を細分化して、複数の区画を生成する区画生成手段と、
前記区画生成手段で区画した領域毎に文字認識実行時間を設定する文字認識実行時間設定手段と、
前記区画毎の文字認識処理において、それぞれの区画における文字認識実行時間設定手段で設定した文字認識実行時間を超えた場合に、当該区画の文字認識を中止する文字認識中止手段と、
を備えることを特徴とする画像処理装置。
前記領域が原稿の１頁分であり、前記区画は１頁内の細分化であることを特徴とする請求項６記載の画像処理装置。