JP2019148902A

JP2019148902A - 画像処理装置とその制御方法、及びプログラム

Info

Publication number: JP2019148902A
Application number: JP2018032195A
Authority: JP
Inventors: 寺尾　仁秀; Kimihide Terao; 仁秀寺尾
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2018-02-26
Filing date: 2018-02-26
Publication date: 2019-09-05

Abstract

【課題】ＯＣＲ処理の文字認識の精度を上げるためには、ＯＣＲ辞書の数を増やすだけでは限界があり、より、認識精度を向上させるためにはＯＣＲエンジンの改良が必要となる。【解決手段】画像データに含まれる文字を認識する画像処理装置とその制御方法であって、複数の文字認識手段を有し、文字認識に関する設定と、複数の文字認識手段との対応を記憶しておき、前記設定と記憶された前記対応とに基づいて、前記画像データに含まれる文字の文字認識を行う文字認識手段を前記複数の文字認識手段から選択し、その選択された文字認識手段により前記画像データに含まれる文字を認識させるよう制御する。【選択図】図７

Description

本発明は、画像処理装置とその制御方法、及びプログラムに関する。

従来、デジタル複合機等の画像処理装置において、文字が記載された原稿をスキャンして画像データに変換し、その画像データに対してＯＣＲ（文字認識）処理を行って文字コードを取得する機能が提供されている。また、ＯＣＲにより文字コードを取得する際の文字認識精度を高めるための様々な技術が提案されている。

例えば特許文献１には、画像処理装置において、複数のアプリケーションからのＯＣＲ処理要求に基づいてＯＣＲ処理を実行する際、一つのＯＣＲエンジンで複数のＯＣＲ言語辞書を使用して文字認識を行うことが記載されている。

特許第４７５９９６３号公報

しかしながら、１つのＯＣＲエンジンで複数のＯＣＲ辞書を参照して文字認識の精度向上を図ろうとすると、１つのＯＣＲモジュールで、複数のＯＣＲ辞書数分のＯＣＲ処理を行う必要があり処理時間が長くなるという課題があった。またＯＣＲ処理の文字認識の精度を上げるためには、ＯＣＲ辞書の数を増やすだけでは限界があり、より、認識精度を向上させるためにはＯＣＲエンジンの改良が必要となる。このため、ＯＣＲ処理における文字認識精度の向上と、処理時間を短縮するための技術が求められていた。

本発明の目的は、上記従来技術の課題を解決することにある。

本発明の目的は、複数の文字認識手段と文字認識用の辞書を有し、ユーザの設定に応じて、文字認識手段と辞書とを選択して文字認識を行うことにより、ＯＣＲ処理における文字認識精度の向上と処理時間の短縮を実現する技術を提供することにある。

上記目的を達成するために本発明の一態様に係る画像処理装置は以下のような構成を備える。即ち、
画像データに含まれる文字を認識する画像処理装置であって、
複数の文字認識手段と、
文字認識に関する設定を行う設定手段と、
前記設定手段による設定される前記設定と、前記複数の文字認識手段との対応を記憶する記憶手段と、
前記設定手段による設定と前記記憶手段に記憶された前記対応とに基づいて、前記画像データに含まれる文字の文字認識を行う文字認識手段を前記複数の文字認識手段から選択する選択手段と、
前記選択手段により選択された文字認識手段により前記画像データに含まれる文字を認識させるよう制御する制御手段と、を有することを特徴とする。

本発明により、ユーザの設定に応じて、文字認識手段と辞書とを選択して文字認識を行うことにより、文字認識処理における文字認識精度の向上と処理時間の短縮を実現できるという効果がある。

本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。

添付図面は明細書に含まれ、その一部を構成し、本発明の実施形態を示し、その記述と共に本発明の原理を説明するために用いられる。
本発明の実施形態１に係る画像処理システムの全体構成を説明する図。実施形態１に係る画像処理装置のハードウェア構成を説明するブロック図。実施形態１に係る画像処理装置のＯＣＲモジュールの構成を説明するブロック図。実施形態１に係るＯＣＲモジュール３０３の機能構成を説明する機能ブロック図。実施形態１に係るＯＣＲモジュール３０４の機能構成を説明する機能ブロック図。実施形態１に係る画像処理装置において、使用するＯＣＲモジュールを切り替えるときに参照するテーブル情報を説明する図。実施形態１に係る画像処理装置によるＯＣＲ処理を説明するフローチャート。実施形態１に係る画像処理装置の操作部に表示されるスキャン設定画面の一例を示す図。実施形態３に係る画像処理装置の操作部に表示されるファイル名の設定画面の一例を示す図。実施形態３に係る画像処理装置の操作部に表示される確認画面の一例を示す図。

以下、添付図面を参照して本発明の実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。

［実施形態１］
図１は、本発明の実施形態１に係る画像処理システムの全体構成を説明する図である。

この画像処理システムでは、ファイル共有サーバ１０１、メールサーバ１０２、そして例えば複合機等の画像処理装置１０３がネットワーク１０４を介して接続されている。画像処理装置１０３は、原稿をスキャンして得られた画像データをメモリに記憶したり、またネットワークを介してネットワーク１０４上のファイル共有サーバ１０１やメールサーバ１０２に送信することができる。またこのメモリに記憶した画像データに含まれる文字を認識する文字認識（ＯＣＲ）機能を有している。

図２は、実施形態１に係る画像処理装置１０３のハードウェア構成を説明するブロック図である。

ＣＰＵ２０１は、ＲＯＭ２０９に格納されたブートプログラムを実行してＨＤＤ２０３に格納されているプログラムをＲＡＭ２０８に展開し、その展開したプログラムを実行することによって画像処理装置１０３全体の動作を制御する。またＣＰＵ２０１は、バス２０２を介して画像処理装置１０３内の各部と通信を行う。

プリンタ２０４は、入力された画像データに基づく画像を記録紙（シート）上に印刷する。スキャナ（読取部）２０５は、ユーザが原稿台にセットした原稿の画像を読み取り、これによって得た画像データをＨＤＤ２０３或いはＲＡＭ２０８等に蓄積する。またスキャナ２０５は、不図示の自動原稿給送装置（ＡＤＦ）を含み、その原稿給送装置にセットされた複数枚の原稿を順次原稿台に給送して読み取ることができる。ＨＤＤ２０３はハードディスクドライブであり、スキャナ２０５より入力された画像データや、プログラム及び各種ユーザデータ（アドレス帳等）や後述のＯＣＲ辞書等を保存する。操作部２０６は、ユーザにより操作される複数のキー、ユーザに通知すべき各種情報を表示する表示部を含む。尚、この表示部はタッチパネル機能を備えても良い。ネットワークＩ／Ｆ２０７は、画像処理装置１０３をネットワーク１０４に接続し、スキャナ２０５で得られ、ＲＡＭ２０８或いはＨＤＤ２０３に保存されている画像データをネットワーク上のファイル共有サーバ１０１へ送信する。ＦＡＸ（ファクス）２１０は、電話回線を介して画像データの送受信を行う。

図３は、実施形態１に係る画像処理装置１０３のＯＣＲモジュールの構成を説明するブロック図である。尚、このＯＣＲモジュール（ＯＣＲエンジン）は、ハードウェアで構成されても良く、或いはＣＰＵ２０１が、前述のＲＡＭ２０８に展開したプログラムを実行することにより実現されても良い。

画像処理装置１０３の複数のアプリケーション３０１は、ＯＣＲ処理を使用した様々な機能を提供している。アプリケーション３０１は、画像データをＯＣＲ処理依頼部３０２に渡してＯＣＲ処理を依頼する。ＯＣＲ処理依頼部３０２は、複数のアプリケーション３０１から要求されるＯＣＲ処理要求を受信する。このとき複数のＯＣＲ処理要求が同時に発行された場合は、それらＯＣＲ処理要求をシリアライズした後、ＯＣＲモジュール３０３或いはＯＣＲモジュール３０４に対して発行する。このようにＯＣＲ処理依頼部３０２は、ＯＣＲモジュール３０３とＯＣＲモジュール３０４とを切り替えてＯＣＲ処理要求を発行するが、その切り替えは、後述するユーザの設定と、図６のテーブルに従って行う。

図４は、実施形態１に係るＯＣＲモジュール３０３の機能構成を説明する機能ブロック図である。尚、このＯＣＲモジュール３０３はハードウェアで構成されても良く、或いはＣＰＵ２０１が、前述のＲＡＭ２０８に展開したプログラムを実行することにより実現されても良い。

ＯＣＲ処理における画像処理は、ＯＣＲエンジン部４００で実行される。ＯＣＲエンジン部４００で実行される処理は、更に４０１〜４０７で示す処理モジュールを使用して実行される。二値画像生成部４０１は、画像データを白黒の二値画像に変換する。このように二値画像データに変換することで、ＯＣＲ処理時に必要となるメモリ容量を削減できる。傾き補正部４０２は、画像データが傾いていた場合に画像データを正立化する処理を行う。このように画像データを正立化することでＯＣＲの認識精度を向上できる。ブロックセレクション処理部４０３は、画像データから、文字部分と写真部分とを判別し、それぞれ個別の画像データに分離する。文字認識処理部４０４は、ブロックセレクション処理部４０３で取得された文字部分の画像データから文字パターンを生成する。文字認識処理部４０４は、文字認識用のＯＣＲ辞書４０８を参照して、アプリケーション３０１から指定されたＯＣＲ言語に従って１つのＯＣＲ言語辞書を選択する。そして、上述の文字パターンと、選択したＯＣＲ言語辞書の文字パターンとを比較して文字認識を行い、認識した文字に対応する文字コードを決定する。

画像高圧縮処理部４０５は、ＯＣＲモジュールの付加機能の一つで、ブロックセレクション処理部４０３で得られた写真部分の画像データに対して高い圧縮方式（例えばＪＰＥＧ２０００等）で圧縮して画像データのサイズを小さくする。ファイル名抽出部４０６もＯＣＲモジュールの付加機能の一つで、文字認識処理部４０４で取得した文字コードの中から、ファイル名として適切な文字コードをファイル名として抽出する。ＯＣＲモジュール３０３は、ＯＣＲ処理を実行した後、取得した文字コードをＯＣＲ処理依頼部３０２を経由して呼び出し元のアプリケーション３０１に返す。画像暗号化部４０７は、ＯＣＲモジュールの付加機能の一つで、文字認識で得られた文字コード、或いはブロックセレクション処理部４０３で得られた写真部分の画像データを暗号化する。

ＯＣＲ辞書４０８は、日本語辞書、英語辞書、中国語辞書、ロシア語辞書などを備えている。

図５は、実施形態１に係るＯＣＲモジュール３０４の機能構成を説明する機能ブロック図である。

ＯＣＲモジュール３０３との相違点は、ＯＣＲエンジン部５００が有する機能モジュールが異なっている点と、サポートしているＯＣＲ言語辞書５０５が異なっている点にある。ＯＣＲエンジン部５００の二値画像生成部５０１、傾き補正部５０２、及びブロックセレクション処理部５０３は、前述の図４の二値画像生成部４０１、傾き補正部４０２及びブロックセレクション処理部４０３と同じである。ＯＣＲエンジン部５００の文字認識処理部５０４は、欧米の言語については高い文字認識精度で認識可能なアルゴリズムを有している点で、図４の文字認識処理部４０４と異なっている。一方、ＯＣＲエンジン部５００は、図４に示す画像高圧縮処理部４０５やファイル名抽出部４０６の機能を有していない点でも、ＯＣＲモジュール３０３のＯＣＲエンジン部４００と異なっている。

ＯＣＲ言語辞書５０５は、図４のＯＣＲ言語辞書４０８がサポートしている日本語辞書がない一方で、ＯＣＲ言語辞書４０８がサポートしていないアラビア語辞書をサポートしているという点でも異なっている。尚、これらＯＣＲモジュールの違いはあくまで一例であり、本発明は、これらに限定されるものではない。

従って、ＯＣＲモジュール３０４は、欧米の言語を、より高い文字認識精度で認識したい場合、或いはアラビア語の文字認識を行う場合等に選択される。

図６は、実施形態１に係る画像処理装置１０３において、使用するＯＣＲモジュール３０３とＯＣＲモジュール３０４を切り替えるときに参照するテーブル情報を説明する図である。

図６（Ａ）は、文字認識の対象の言語に応じたＯＣＲモジュールを選択するためのテーブル情報を示す。ここでは欧米の言語に対しては、ＯＣＲモジュール３０４を選択する情報が記憶されている。

図６（Ｂ）は、ファイル形式と、文字認識の対象の言語に応じたＯＣＲモジュールを選択するためのテーブル情報を示す。ここでも欧米の言語に対しては、ＯＣＲモジュール３０４を選択する情報が記憶されている。但し、欧米の言語の場合であっても、高圧縮及び暗号化に対しては、ＯＣＲモジュール３０４が対応していないので、ＯＣＲモジュール３０３を選択する情報が記憶されている。

図６（Ｃ）は、ファイル形式と、文字認識の対象の言語、及びタイトルＯＣＲ機能に応じたＯＣＲモジュールを選択するためのテーブル情報を示す。ここでは、ＯＣＲモジュール３０４は、タイトルＯＣＲ機能に対応していないので、タイトルＯＣＲ機能がオンであればＯＣＲモジュール３０３を選択する情報が記憶されている。

以下、実施形態１に係る画像処理装置１０３のＯＣＲ処理方法を図７のフローチャートを参照して説明する。

図７は、実施形態１に係る画像処理装置１０３によるＯＣＲ処理を説明するフローチャートである。尚、このフローチャートで示す処理は、ＣＰＵ２０１が、前述のＲＡＭ２０８に展開したプログラムを実行することにより達成される。

まずＳ７０１でＣＰＵ２０１は、アプリケーション３０１により操作部２０６に表示される設定画面を介して入力される、スキャンにおける読み取り設定を取得する。

図８は、実施形態１に係る画像処理装置１０３の操作部２０６に表示されるスキャン設定画面の一例を示す図である。

図８の画面では、ファイル形式として「ＰＤＦ」８０１が選択され、ＰＤＦの詳細オプション８０２で「ＯＣＲ」が選択されている。そしてユーザは、ＯＣＲ処理時の言語設定８０３から所望の言語を選択する。そしてユーザは、この設定画面の設定を確定する場合はＯＫボタン８０４を押下し、取り消す場合はキャンセルボタン８０５を押下する。

この画面を介した設定を受け取るとＳ７０２に進みＣＰＵ２０１は、この画面で設定された読み取り設定に従って、スキャナ２０５を駆動して原稿を読み取り、その原稿の画像を電子化した画像データを取得する。次にＳ７０３に進みＣＰＵ２０１は、ＯＣＲ処理依頼部３０２に対してＯＣＲ処理要求を発行する。そしてＳ７０４に進みＣＰＵ２０１は、Ｓ７０１で取得した読み取り設定をＯＣＲ処理依頼部３０２に渡す。

そしてＳ７０５〜Ｓ７０７でＣＰＵ２０１は、Ｓ７０１で取得した設定に基づいて、図６のテーブル情報を参照して、ＯＣＲ処理要求に対して使用するＯＣＲモジュールを切り替える。まずＳ７０５でＣＰＵ２０１は、そのＯＣＲ処理要求で、タイトルのＯＣＲ設定がなされているかどうか判定し、タイトルのＯＣＲ設定がオンであればＳ７１１に進み、図６（Ｃ）のテーブル情報を参照してＯＣＲモジュール３０３にＯＣＲ処理を依頼する。そしてＳ７１２に進み、ＯＣＲモジュール３０３によりＯＣＲ処理を実行させてＳ７１０に進みＣＰＵ２０１は、その文字認識結果を文字コードに変換して出力し、この処理を終了する。

一方、Ｓ７０５でＣＰＵ２０１は、タイトルのＯＣＲ設定がオンでないと判定するとＳ７０６に進み、ＣＰＵ２０１は、Ｓ７０１で取得した設定に高圧縮が含まれているかどうか判定する。ここで高圧縮が含まれていると判定するとＳ７１１に進み、図６（Ｂ）（Ｃ）のテーブル情報を参照してＯＣＲモジュール３０３にＯＣＲ処理を依頼するが、そうでないときはＳ７０７に進む。Ｓ７０７でＣＰＵ２０１は、ＯＣＲ処理の対象の言語が欧米の言語かどうか判定する。欧米の言語でないときはＳ７１１に進むが、欧米の言語の場合はＳ７０８に進む。Ｓ７０８でＣＰＵ２０１は、図６（Ａ）のテーブルを参照してＯＣＲモジュール３０４にＯＣＲ処理を依頼する。そしてＳ７０９に進み、ＯＣＲモジュール３０４によるＯＣＲ処理を実行する。そしてＳ７１０に進みＣＰＵ２０１は、その文字認識結果を文字コードに変換して出力し、この処理を終了する。

図６（Ａ）は、図８の画面でファイル形式に「ＰＤＦ」８０１が設定されていて、ＰＤＦの詳細オプション８０２として「ＯＣＲ」が設定されている場合に、言語設定８０３によるＯＣＲモジュールの切り替えをテーブル情報として表現した例である。言語設定８０３で、欧米の言語が指定された場合は、欧米の言語の認識精度が、より高いＯＣＲモジュール３０４が選択される。

また、言語設定８０３で日本語が指定された場合は、ＯＣＲモジュール３０４のＯＣＲ言語辞書５０５には日本語がないためＯＣＲモジュール３０３が選択される。また言語設定８０３でアラビア語が指定された場合は、ＯＣＲモジュール３０３のＯＣＲ言語辞書４０８にはアラビア語がないため、ＯＣＲモジュール３０４が選択される。

このようにしてＣＰＵ２０１は、Ｓ７０５〜Ｓ７０７の判定結果に基づいて、ＯＣＲモジュール３０３、ＯＣＲモジュール３０４のいずれかを選択し、その選択したＯＣＲモジュールに対してＯＣＲ処理を依頼する。

以上説明したように実施形態１によれば、ユーザによる設定に基づいて、ＯＣＲの文字認識の精度が、より高いＯＣＲモジュールを自動で選択してＯＣＲ処理を実行させることができる。これにより、ＯＣＲ処理の処理速度を速めることができ、文字認識の精度と処理速度の両立を向上できる。

［実施形態２］
次に本発明の実施形態２を説明する。

実施形態２では、図８の読み取り設定画面において、ファイル形式の設定画面からファイル形式として「ＰＤＦ」８０１を選択し、ＰＤＦの詳細オプション８０２で、「ＯＣＲ」（言語設定は任意）と「高圧縮」の両方を選択した場合で説明する。尚、実施形態２に係るシステム構成及び画像処理装置１０３のハードウェア構成等は、前述の実施形態１と同様とする。

実施形態２では、図８の画面で設定された設定として、ＰＤＦの詳細オプション８０２で「高圧縮」が追加で設定されている点が実施形態１と異なる。

この場合、ＣＰＵ２０１は、図６（Ｂ）のテーブル情報を参照して、使用するＯＣＲモジュールを選択する。図５に示すようにＯＣＲモジュール３０４は、図４のＯＣＲモジュール３０３の画像高圧縮処理部４０５を有していない。このため、ＰＤＦの詳細オプション８０２で「高圧縮」が選択された場合は、ＯＣＲ言語設定８０３に関わらず、常にＯＣＲモジュール３０３が選択される。

また同様に、図５に示すようにＯＣＲモジュール３０４には画像暗号化部４０７がないため、画像データを暗号化する機能がない。このため、ＰＤＦの詳細オプション８０２で「暗号化」が選択された場合は、ＯＣＲ言語設定８０３の設定に関わらず、常にＯＣＲモジュール３０３が選択される。

以上説明したように実施形態２によれば、ユーザの設定に応じて、文字認識に必要な最適なＯＣＲモジュールを自動で選択できるため、ＯＣＲ処理の処理速度を速めることができ、文字認識の精度と処理速度の両立を向上できる。

［実施形態３］
次に本発明の実施形態３を説明する。

実施形態３では、図８の読み取り設定画面において、ファイル形式として「ＰＤＦ」が選択され、ＰＤＦの詳細オプション８０２で「ＯＣＲ」（言語設定は任意）が選択される。また更に、追加で図９に示すファイル名設定を行う。尚、実施形態３に係るシステム構成及び画像処理装置１０３のハードウェア構成等は、前述の実施形態１と同様とする。

図９は、実施形態３に係る画像処理装置１０３の操作部２０６に表示されるファイル名の設定画面の一例を示す図である。

このファイル名設定画面で、ファイル名９０１に設定した文字列が画像データのファイル名として設定可能となる。このファイル名設定画面で自動付与（ＯＣＲ）９０２が選択されている場合は、ＯＣＲで抽出した文字コードを、画像データのファイル名として設定できる。この画面での設定を確定する場合、ユーザはＯＫボタン９０３を押下し、取り消す場合はキャンセルボタン９０４を押下する。

実施形態３では、Ｓ７０１で取得した設定例としては、図８のファイル形式設定は実施形態１と同様であるが、図９のファイル名設定画面において自動付与（ＯＣＲ）９０２が選択されている点が実施形態１と異なる。

自動付与（ＯＣＲ）９０２が選択されている場合は、図６（Ｃ）のテーブル情報を参照して、使用するＯＣＲモジュールを選択する。

図５に示すように、ＯＣＲモジュール３０４は、ファイル名抽出部４０６を含まないため、自動付与（ＯＣＲ）９０２の機能に対応できない。よって、自動付与（ＯＣＲ）９０２が選択された場合は、ＰＤＦ詳細オプション８０２やＯＣＲ言語設定８０３の設定に関わらず、常にＯＣＲモジュール３０３が選択される。

以上説明したように実施形態３によれば、ユーザ設定に応じて、最適なＯＣＲモジュールを自動で選択できるため、ＯＣＲ処理の処理速度を速めることができ、文字認識の精度と処理速度の両立を向上できる。

［実施形態４］
次に本発明の実施形態４を説明する。

実施形態３では、ＯＣＲモジュール３０４にはファイル名抽出部４０６がないという場合の説明であったが、ＯＣＲモジュール３０４にファイル名抽出部４０６がある場合は、ユーザがＯＣＲの結果に応じて設定するようにしても良い。つまり、ＯＣＲモジュール３０３で取得した文字コード結果を操作部２０６上に図１０のような確認画面を表示する。

図１０は、実施形態３に係る画像処理装置１０３の操作部２０６に表示される確認画面の一例を示す図である。

文字認識により取得した文字コードの結果はファイル名１００１に表示される。このとき、ファイル名１００１が所望の結果でない場合、ユーザは、ファイル名の再抽出を指示する「はい」ボタン１００３を押下する。これにより画像処理装置１０３は、使用するＯＣＲモジュールを、今回使用したＯＣＲモジュール３０３からＯＣＲモジュール３０４に切替える。そしてＯＣＲモジュール３０４を使用した文字認識の結果から、ファイル名を再抽出して、ファイル名１００１に表示させることができる。一方、ユーザが「いいえ」ボタン１００２を押下した場合は、ファイル名１００１に表示されているファイル名を画像データに設定する。

尚、ファイル名１００１に表示されている文字列は、ユーザがソフトキーボード等を利用して編集することも可能である。

以上説明したように実施形態３によれば、画像処理装置が自動でＯＣＲモジュールを切り替えるだけでなく、ユーザが選択的にＯＣＲモジュールを切り替えることもできる。これによりＯＣＲ処理の処理速度を速めることができ、文字認識の精度と処理速度の両立を向上できる。

尚、前述の実施形態１〜４においては、２つのＯＣＲモジュールを有し、これら２つのＯＣＲモジュールを切り替えるようにしたが、ＯＣＲモジュールの数は２つに限定されるものではない。

また上述の実施形態では、画像処理装置が有する複数のＯＣＲモジュールを切り替えて使用したが、画像処理装置の外部装置（例えばネットワークサーバ）にあるＯＣＲモジュールを切り替え対象とするような構成であっても良い。

（その他の実施形態）
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

本発明は上記実施形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために、以下の請求項を添付する。

１０３…画像処理装置、２０１…ＣＰＵ、２０３…ＨＤＤ，２０６…操作部、２０８…ＲＡＭ、２０９…ＲＯＭ、３０２…ＯＣＲ依頼処理部、３０３，３０４…ＯＣＲモジュール、４００，５００…ＯＣＲエンジン部、４０８，５０５…ＯＣＲ言語辞書

Claims

画像データに含まれる文字を認識する画像処理装置であって、
複数の文字認識手段と、
文字認識に関する設定を行う設定手段と、
前記設定手段による設定される前記設定と、前記複数の文字認識手段との対応を記憶する記憶手段と、
前記設定手段による設定と前記記憶手段に記憶された前記対応とに基づいて、前記画像データに含まれる文字の文字認識を行う文字認識手段を前記複数の文字認識手段から選択する選択手段と、
前記選択手段により選択された文字認識手段により前記画像データに含まれる文字を認識させるよう制御する制御手段と、
を有することを特徴とする画像処理装置。
前記複数の文字認識手段はそれぞれ、当該文字認識手段の文字認識処理における画像処理を実行するＯＣＲエンジンを含み、前記ＯＣＲエンジンは、文字認識用の言語辞書を使用して文字認識を行うことを特徴とする請求項１に記載の画像処理装置。
前記複数の文字認識手段のいずれかの文字認識手段は、画像データの圧縮処理、文字認識で得られた文字コードを前記画像データのファイル名として設定するファイル名を抽出する処理、画像データを暗号化する処理の少なくともいずれかを実行できる前記ＯＣＲエンジンを含むことを特徴とする請求項２に記載の画像処理装置。
前記設定手段は、前記画像データのファイル形式を設定することを特徴とする請求項１乃至３のいずれか１項に記載の画像処理装置。
前記設定手段は、前記文字認識の対象とする言語を設定することを特徴とする請求項１乃至４のいずれか１項に記載の画像処理装置。
前記記憶手段は、前記文字認識の対象とする言語と、前記複数の文字認識手段のそれぞれとの対応を記憶することを特徴とする請求項１に記載の画像処理装置。
前記記憶手段は、前記画像データのファイル形式と、前記文字認識の対象とする言語と、前記複数の文字認識手段のそれぞれとの対応を記憶することを特徴とする請求項１に記載の画像処理装置。
前記記憶手段は、前記画像データのファイル形式、前記文字認識の対象とする言語、及び文字認識の結果を使用する機能と、前記複数の文字認識手段のそれぞれとの対応を記憶することを特徴とする請求項１に記載の画像処理装置。
前記文字認識結果を使用する機能として、前記画像データのファイル名として設定するファイル名を抽出する処理が設定されている場合、前記抽出されたファイル名を表示してユーザに確認させる画面を表示手段を、更に有することを特徴とする請求項８に記載の画像処理装置。
前記抽出されたファイル名を表示する前記画面を介して、前記画像データのファイル名の再抽出が指示されると、前記選択手段により選択されている文字認識手段とは別の文字認識手段を選択し、当該選択された文字認識手段を使用して文字認識を実行させ、当該文字認識で得られた文字コードを前記画像データのファイル名として前記表示手段に表示させる再抽出手段を、更に有することを特徴とする請求項９に記載の画像処理装置。
前記画面を介して、前記画像データのファイル名をユーザに編集させる編集手段を、更に有することを特徴とする請求項９又は１０に記載の画像処理装置。
前記設定手段により設定される前記設定は、ファイル形式、文字認識の対象とする言語、文字認識の結果を利用する機能の少なくともいずれかを含むことを特徴とする請求項１乃至１１のいずれか１項に記載の画像処理装置。
原稿を読み取り、当該原稿の画像に対応する画像データを出力する読取手段を、更に有し、
前記画像データは、前記読取手段から出力された画像データであることを特徴とする請求項１乃至１２のいずれか１項に記載の画像処理装置。
複数の文字認識手段を有し、画像データに含まれる文字を認識する画像処理装置を制御する制御方法であって、
文字認識に関する設定を行う設定工程と、
前記設定工程による設定される前記設定と、前記複数の文字認識手段との対応を記憶する記憶工程と、
前記設定工程による設定と前記記憶工程に記憶された前記対応とに基づいて、前記画像データに含まれる文字の文字認識を行う文字認識手段を前記複数の文字認識手段から選択する選択工程と、
前記選択工程により選択された文字認識手段により前記画像データに含まれる文字を認識させるよう制御する制御工程と、
を有することを特徴とする制御方法。
コンピュータを、請求項１乃至１３のいずれか１項に記載の画像処理装置の各手段として機能させるためのプログラム。