JP2019148902A - 画像処理装置とその制御方法、及びプログラム - Google Patents
画像処理装置とその制御方法、及びプログラム Download PDFInfo
- Publication number
- JP2019148902A JP2019148902A JP2018032195A JP2018032195A JP2019148902A JP 2019148902 A JP2019148902 A JP 2019148902A JP 2018032195 A JP2018032195 A JP 2018032195A JP 2018032195 A JP2018032195 A JP 2018032195A JP 2019148902 A JP2019148902 A JP 2019148902A
- Authority
- JP
- Japan
- Prior art keywords
- character recognition
- image data
- ocr
- processing apparatus
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【課題】OCR処理の文字認識の精度を上げるためには、OCR辞書の数を増やすだけでは限界があり、より、認識精度を向上させるためにはOCRエンジンの改良が必要となる。【解決手段】画像データに含まれる文字を認識する画像処理装置とその制御方法であって、複数の文字認識手段を有し、文字認識に関する設定と、複数の文字認識手段との対応を記憶しておき、前記設定と記憶された前記対応とに基づいて、前記画像データに含まれる文字の文字認識を行う文字認識手段を前記複数の文字認識手段から選択し、その選択された文字認識手段により前記画像データに含まれる文字を認識させるよう制御する。【選択図】 図7
Description
本発明は、画像処理装置とその制御方法、及びプログラムに関する。
従来、デジタル複合機等の画像処理装置において、文字が記載された原稿をスキャンして画像データに変換し、その画像データに対してOCR(文字認識)処理を行って文字コードを取得する機能が提供されている。また、OCRにより文字コードを取得する際の文字認識精度を高めるための様々な技術が提案されている。
例えば特許文献1には、画像処理装置において、複数のアプリケーションからのOCR処理要求に基づいてOCR処理を実行する際、一つのOCRエンジンで複数のOCR言語辞書を使用して文字認識を行うことが記載されている。
しかしながら、1つのOCRエンジンで複数のOCR辞書を参照して文字認識の精度向上を図ろうとすると、1つのOCRモジュールで、複数のOCR辞書数分のOCR処理を行う必要があり処理時間が長くなるという課題があった。またOCR処理の文字認識の精度を上げるためには、OCR辞書の数を増やすだけでは限界があり、より、認識精度を向上させるためにはOCRエンジンの改良が必要となる。このため、OCR処理における文字認識精度の向上と、処理時間を短縮するための技術が求められていた。
本発明の目的は、上記従来技術の課題を解決することにある。
本発明の目的は、複数の文字認識手段と文字認識用の辞書を有し、ユーザの設定に応じて、文字認識手段と辞書とを選択して文字認識を行うことにより、OCR処理における文字認識精度の向上と処理時間の短縮を実現する技術を提供することにある。
上記目的を達成するために本発明の一態様に係る画像処理装置は以下のような構成を備える。即ち、
画像データに含まれる文字を認識する画像処理装置であって、
複数の文字認識手段と、
文字認識に関する設定を行う設定手段と、
前記設定手段による設定される前記設定と、前記複数の文字認識手段との対応を記憶する記憶手段と、
前記設定手段による設定と前記記憶手段に記憶された前記対応とに基づいて、前記画像データに含まれる文字の文字認識を行う文字認識手段を前記複数の文字認識手段から選択する選択手段と、
前記選択手段により選択された文字認識手段により前記画像データに含まれる文字を認識させるよう制御する制御手段と、を有することを特徴とする。
画像データに含まれる文字を認識する画像処理装置であって、
複数の文字認識手段と、
文字認識に関する設定を行う設定手段と、
前記設定手段による設定される前記設定と、前記複数の文字認識手段との対応を記憶する記憶手段と、
前記設定手段による設定と前記記憶手段に記憶された前記対応とに基づいて、前記画像データに含まれる文字の文字認識を行う文字認識手段を前記複数の文字認識手段から選択する選択手段と、
前記選択手段により選択された文字認識手段により前記画像データに含まれる文字を認識させるよう制御する制御手段と、を有することを特徴とする。
本発明により、ユーザの設定に応じて、文字認識手段と辞書とを選択して文字認識を行うことにより、文字認識処理における文字認識精度の向上と処理時間の短縮を実現できるという効果がある。
本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。
添付図面は明細書に含まれ、その一部を構成し、本発明の実施形態を示し、その記述と共に本発明の原理を説明するために用いられる。
本発明の実施形態1に係る画像処理システムの全体構成を説明する図。
実施形態1に係る画像処理装置のハードウェア構成を説明するブロック図。
実施形態1に係る画像処理装置のOCRモジュールの構成を説明するブロック図。
実施形態1に係るOCRモジュール303の機能構成を説明する機能ブロック図。
実施形態1に係るOCRモジュール304の機能構成を説明する機能ブロック図。
実施形態1に係る画像処理装置において、使用するOCRモジュールを切り替えるときに参照するテーブル情報を説明する図。
実施形態1に係る画像処理装置によるOCR処理を説明するフローチャート。
実施形態1に係る画像処理装置の操作部に表示されるスキャン設定画面の一例を示す図。
実施形態3に係る画像処理装置の操作部に表示されるファイル名の設定画面の一例を示す図。
実施形態3に係る画像処理装置の操作部に表示される確認画面の一例を示す図。
以下、添付図面を参照して本発明の実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
[実施形態1]
図1は、本発明の実施形態1に係る画像処理システムの全体構成を説明する図である。
図1は、本発明の実施形態1に係る画像処理システムの全体構成を説明する図である。
この画像処理システムでは、ファイル共有サーバ101、メールサーバ102、そして例えば複合機等の画像処理装置103がネットワーク104を介して接続されている。画像処理装置103は、原稿をスキャンして得られた画像データをメモリに記憶したり、またネットワークを介してネットワーク104上のファイル共有サーバ101やメールサーバ102に送信することができる。またこのメモリに記憶した画像データに含まれる文字を認識する文字認識(OCR)機能を有している。
図2は、実施形態1に係る画像処理装置103のハードウェア構成を説明するブロック図である。
CPU201は、ROM209に格納されたブートプログラムを実行してHDD203に格納されているプログラムをRAM208に展開し、その展開したプログラムを実行することによって画像処理装置103全体の動作を制御する。またCPU201は、バス202を介して画像処理装置103内の各部と通信を行う。
プリンタ204は、入力された画像データに基づく画像を記録紙(シート)上に印刷する。スキャナ(読取部)205は、ユーザが原稿台にセットした原稿の画像を読み取り、これによって得た画像データをHDD203或いはRAM208等に蓄積する。またスキャナ205は、不図示の自動原稿給送装置(ADF)を含み、その原稿給送装置にセットされた複数枚の原稿を順次原稿台に給送して読み取ることができる。HDD203はハードディスクドライブであり、スキャナ205より入力された画像データや、プログラム及び各種ユーザデータ(アドレス帳等)や後述のOCR辞書等を保存する。操作部206は、ユーザにより操作される複数のキー、ユーザに通知すべき各種情報を表示する表示部を含む。尚、この表示部はタッチパネル機能を備えても良い。ネットワークI/F207は、画像処理装置103をネットワーク104に接続し、スキャナ205で得られ、RAM208或いはHDD203に保存されている画像データをネットワーク上のファイル共有サーバ101へ送信する。FAX(ファクス)210は、電話回線を介して画像データの送受信を行う。
図3は、実施形態1に係る画像処理装置103のOCRモジュールの構成を説明するブロック図である。尚、このOCRモジュール(OCRエンジン)は、ハードウェアで構成されても良く、或いはCPU201が、前述のRAM208に展開したプログラムを実行することにより実現されても良い。
画像処理装置103の複数のアプリケーション301は、OCR処理を使用した様々な機能を提供している。アプリケーション301は、画像データをOCR処理依頼部302に渡してOCR処理を依頼する。OCR処理依頼部302は、複数のアプリケーション301から要求されるOCR処理要求を受信する。このとき複数のOCR処理要求が同時に発行された場合は、それらOCR処理要求をシリアライズした後、OCRモジュール303或いはOCRモジュール304に対して発行する。このようにOCR処理依頼部302は、OCRモジュール303とOCRモジュール304とを切り替えてOCR処理要求を発行するが、その切り替えは、後述するユーザの設定と、図6のテーブルに従って行う。
図4は、実施形態1に係るOCRモジュール303の機能構成を説明する機能ブロック図である。尚、このOCRモジュール303はハードウェアで構成されても良く、或いはCPU201が、前述のRAM208に展開したプログラムを実行することにより実現されても良い。
OCR処理における画像処理は、OCRエンジン部400で実行される。OCRエンジン部400で実行される処理は、更に401〜407で示す処理モジュールを使用して実行される。二値画像生成部401は、画像データを白黒の二値画像に変換する。このように二値画像データに変換することで、OCR処理時に必要となるメモリ容量を削減できる。傾き補正部402は、画像データが傾いていた場合に画像データを正立化する処理を行う。このように画像データを正立化することでOCRの認識精度を向上できる。ブロックセレクション処理部403は、画像データから、文字部分と写真部分とを判別し、それぞれ個別の画像データに分離する。文字認識処理部404は、ブロックセレクション処理部403で取得された文字部分の画像データから文字パターンを生成する。文字認識処理部404は、文字認識用のOCR辞書408を参照して、アプリケーション301から指定されたOCR言語に従って1つのOCR言語辞書を選択する。そして、上述の文字パターンと、選択したOCR言語辞書の文字パターンとを比較して文字認識を行い、認識した文字に対応する文字コードを決定する。
画像高圧縮処理部405は、OCRモジュールの付加機能の一つで、ブロックセレクション処理部403で得られた写真部分の画像データに対して高い圧縮方式(例えばJPEG2000等)で圧縮して画像データのサイズを小さくする。ファイル名抽出部406もOCRモジュールの付加機能の一つで、文字認識処理部404で取得した文字コードの中から、ファイル名として適切な文字コードをファイル名として抽出する。OCRモジュール303は、OCR処理を実行した後、取得した文字コードをOCR処理依頼部302を経由して呼び出し元のアプリケーション301に返す。画像暗号化部407は、OCRモジュールの付加機能の一つで、文字認識で得られた文字コード、或いはブロックセレクション処理部403で得られた写真部分の画像データを暗号化する。
OCR辞書408は、日本語辞書、英語辞書、中国語辞書、ロシア語辞書などを備えている。
図5は、実施形態1に係るOCRモジュール304の機能構成を説明する機能ブロック図である。
OCRモジュール303との相違点は、OCRエンジン部500が有する機能モジュールが異なっている点と、サポートしているOCR言語辞書505が異なっている点にある。OCRエンジン部500の二値画像生成部501、傾き補正部502、及びブロックセレクション処理部503は、前述の図4の二値画像生成部401、傾き補正部402及びブロックセレクション処理部403と同じである。OCRエンジン部500の文字認識処理部504は、欧米の言語については高い文字認識精度で認識可能なアルゴリズムを有している点で、図4の文字認識処理部404と異なっている。一方、OCRエンジン部500は、図4に示す画像高圧縮処理部405やファイル名抽出部406の機能を有していない点でも、OCRモジュール303のOCRエンジン部400と異なっている。
OCR言語辞書505は、図4のOCR言語辞書408がサポートしている日本語辞書がない一方で、OCR言語辞書408がサポートしていないアラビア語辞書をサポートしているという点でも異なっている。尚、これらOCRモジュールの違いはあくまで一例であり、本発明は、これらに限定されるものではない。
従って、OCRモジュール304は、欧米の言語を、より高い文字認識精度で認識したい場合、或いはアラビア語の文字認識を行う場合等に選択される。
図6は、実施形態1に係る画像処理装置103において、使用するOCRモジュール303とOCRモジュール304を切り替えるときに参照するテーブル情報を説明する図である。
図6(A)は、文字認識の対象の言語に応じたOCRモジュールを選択するためのテーブル情報を示す。ここでは欧米の言語に対しては、OCRモジュール304を選択する情報が記憶されている。
図6(B)は、ファイル形式と、文字認識の対象の言語に応じたOCRモジュールを選択するためのテーブル情報を示す。ここでも欧米の言語に対しては、OCRモジュール304を選択する情報が記憶されている。但し、欧米の言語の場合であっても、高圧縮及び暗号化に対しては、OCRモジュール304が対応していないので、OCRモジュール303を選択する情報が記憶されている。
図6(C)は、ファイル形式と、文字認識の対象の言語、及びタイトルOCR機能に応じたOCRモジュールを選択するためのテーブル情報を示す。ここでは、OCRモジュール304は、タイトルOCR機能に対応していないので、タイトルOCR機能がオンであればOCRモジュール303を選択する情報が記憶されている。
以下、実施形態1に係る画像処理装置103のOCR処理方法を図7のフローチャートを参照して説明する。
図7は、実施形態1に係る画像処理装置103によるOCR処理を説明するフローチャートである。尚、このフローチャートで示す処理は、CPU201が、前述のRAM208に展開したプログラムを実行することにより達成される。
まずS701でCPU201は、アプリケーション301により操作部206に表示される設定画面を介して入力される、スキャンにおける読み取り設定を取得する。
図8は、実施形態1に係る画像処理装置103の操作部206に表示されるスキャン設定画面の一例を示す図である。
図8の画面では、ファイル形式として「PDF」801が選択され、PDFの詳細オプション802で「OCR」が選択されている。そしてユーザは、OCR処理時の言語設定803から所望の言語を選択する。そしてユーザは、この設定画面の設定を確定する場合はOKボタン804を押下し、取り消す場合はキャンセルボタン805を押下する。
この画面を介した設定を受け取るとS702に進みCPU201は、この画面で設定された読み取り設定に従って、スキャナ205を駆動して原稿を読み取り、その原稿の画像を電子化した画像データを取得する。次にS703に進みCPU201は、OCR処理依頼部302に対してOCR処理要求を発行する。そしてS704に進みCPU201は、S701で取得した読み取り設定をOCR処理依頼部302に渡す。
そしてS705〜S707でCPU201は、S701で取得した設定に基づいて、図6のテーブル情報を参照して、OCR処理要求に対して使用するOCRモジュールを切り替える。まずS705でCPU201は、そのOCR処理要求で、タイトルのOCR設定がなされているかどうか判定し、タイトルのOCR設定がオンであればS711に進み、図6(C)のテーブル情報を参照してOCRモジュール303にOCR処理を依頼する。そしてS712に進み、OCRモジュール303によりOCR処理を実行させてS710に進みCPU201は、その文字認識結果を文字コードに変換して出力し、この処理を終了する。
一方、S705でCPU201は、タイトルのOCR設定がオンでないと判定するとS706に進み、CPU201は、S701で取得した設定に高圧縮が含まれているかどうか判定する。ここで高圧縮が含まれていると判定するとS711に進み、図6(B)(C)のテーブル情報を参照してOCRモジュール303にOCR処理を依頼するが、そうでないときはS707に進む。S707でCPU201は、OCR処理の対象の言語が欧米の言語かどうか判定する。欧米の言語でないときはS711に進むが、欧米の言語の場合はS708に進む。S708でCPU201は、図6(A)のテーブルを参照してOCRモジュール304にOCR処理を依頼する。そしてS709に進み、OCRモジュール304によるOCR処理を実行する。そしてS710に進みCPU201は、その文字認識結果を文字コードに変換して出力し、この処理を終了する。
図6(A)は、図8の画面でファイル形式に「PDF」801が設定されていて、PDFの詳細オプション802として「OCR」が設定されている場合に、言語設定803によるOCRモジュールの切り替えをテーブル情報として表現した例である。言語設定803で、欧米の言語が指定された場合は、欧米の言語の認識精度が、より高いOCRモジュール304が選択される。
また、言語設定803で日本語が指定された場合は、OCRモジュール304のOCR言語辞書505には日本語がないためOCRモジュール303が選択される。また言語設定803でアラビア語が指定された場合は、OCRモジュール303のOCR言語辞書408にはアラビア語がないため、OCRモジュール304が選択される。
このようにしてCPU201は、S705〜S707の判定結果に基づいて、OCRモジュール303、OCRモジュール304のいずれかを選択し、その選択したOCRモジュールに対してOCR処理を依頼する。
以上説明したように実施形態1によれば、ユーザによる設定に基づいて、OCRの文字認識の精度が、より高いOCRモジュールを自動で選択してOCR処理を実行させることができる。これにより、OCR処理の処理速度を速めることができ、文字認識の精度と処理速度の両立を向上できる。
[実施形態2]
次に本発明の実施形態2を説明する。
次に本発明の実施形態2を説明する。
実施形態2では、図8の読み取り設定画面において、ファイル形式の設定画面からファイル形式として「PDF」801を選択し、PDFの詳細オプション802で、「OCR」(言語設定は任意)と「高圧縮」の両方を選択した場合で説明する。尚、実施形態2に係るシステム構成及び画像処理装置103のハードウェア構成等は、前述の実施形態1と同様とする。
実施形態2では、図8の画面で設定された設定として、PDFの詳細オプション802で「高圧縮」が追加で設定されている点が実施形態1と異なる。
この場合、CPU201は、図6(B)のテーブル情報を参照して、使用するOCRモジュールを選択する。図5に示すようにOCRモジュール304は、図4のOCRモジュール303の画像高圧縮処理部405を有していない。このため、PDFの詳細オプション802で「高圧縮」が選択された場合は、OCR言語設定803に関わらず、常にOCRモジュール303が選択される。
また同様に、図5に示すようにOCRモジュール304には画像暗号化部407がないため、画像データを暗号化する機能がない。このため、PDFの詳細オプション802で「暗号化」が選択された場合は、OCR言語設定803の設定に関わらず、常にOCRモジュール303が選択される。
以上説明したように実施形態2によれば、ユーザの設定に応じて、文字認識に必要な最適なOCRモジュールを自動で選択できるため、OCR処理の処理速度を速めることができ、文字認識の精度と処理速度の両立を向上できる。
[実施形態3]
次に本発明の実施形態3を説明する。
次に本発明の実施形態3を説明する。
実施形態3では、図8の読み取り設定画面において、ファイル形式として「PDF」が選択され、PDFの詳細オプション802で「OCR」(言語設定は任意)が選択される。また更に、追加で図9に示すファイル名設定を行う。尚、実施形態3に係るシステム構成及び画像処理装置103のハードウェア構成等は、前述の実施形態1と同様とする。
図9は、実施形態3に係る画像処理装置103の操作部206に表示されるファイル名の設定画面の一例を示す図である。
このファイル名設定画面で、ファイル名901に設定した文字列が画像データのファイル名として設定可能となる。このファイル名設定画面で自動付与(OCR)902が選択されている場合は、OCRで抽出した文字コードを、画像データのファイル名として設定できる。この画面での設定を確定する場合、ユーザはOKボタン903を押下し、取り消す場合はキャンセルボタン904を押下する。
実施形態3では、S701で取得した設定例としては、図8のファイル形式設定は実施形態1と同様であるが、図9のファイル名設定画面において自動付与(OCR)902が選択されている点が実施形態1と異なる。
自動付与(OCR)902が選択されている場合は、図6(C)のテーブル情報を参照して、使用するOCRモジュールを選択する。
図5に示すように、OCRモジュール304は、ファイル名抽出部406を含まないため、自動付与(OCR)902の機能に対応できない。よって、自動付与(OCR)902が選択された場合は、PDF詳細オプション802やOCR言語設定803の設定に関わらず、常にOCRモジュール303が選択される。
以上説明したように実施形態3によれば、ユーザ設定に応じて、最適なOCRモジュールを自動で選択できるため、OCR処理の処理速度を速めることができ、文字認識の精度と処理速度の両立を向上できる。
[実施形態4]
次に本発明の実施形態4を説明する。
次に本発明の実施形態4を説明する。
実施形態3では、OCRモジュール304にはファイル名抽出部406がないという場合の説明であったが、OCRモジュール304にファイル名抽出部406がある場合は、ユーザがOCRの結果に応じて設定するようにしても良い。つまり、OCRモジュール303で取得した文字コード結果を操作部206上に図10のような確認画面を表示する。
図10は、実施形態3に係る画像処理装置103の操作部206に表示される確認画面の一例を示す図である。
文字認識により取得した文字コードの結果はファイル名1001に表示される。このとき、ファイル名1001が所望の結果でない場合、ユーザは、ファイル名の再抽出を指示する「はい」ボタン1003を押下する。これにより画像処理装置103は、使用するOCRモジュールを、今回使用したOCRモジュール303からOCRモジュール304に切替える。そしてOCRモジュール304を使用した文字認識の結果から、ファイル名を再抽出して、ファイル名1001に表示させることができる。一方、ユーザが「いいえ」ボタン1002を押下した場合は、ファイル名1001に表示されているファイル名を画像データに設定する。
尚、ファイル名1001に表示されている文字列は、ユーザがソフトキーボード等を利用して編集することも可能である。
以上説明したように実施形態3によれば、画像処理装置が自動でOCRモジュールを切り替えるだけでなく、ユーザが選択的にOCRモジュールを切り替えることもできる。これによりOCR処理の処理速度を速めることができ、文字認識の精度と処理速度の両立を向上できる。
尚、前述の実施形態1〜4においては、2つのOCRモジュールを有し、これら2つのOCRモジュールを切り替えるようにしたが、OCRモジュールの数は2つに限定されるものではない。
また上述の実施形態では、画像処理装置が有する複数のOCRモジュールを切り替えて使用したが、画像処理装置の外部装置(例えばネットワークサーバ)にあるOCRモジュールを切り替え対象とするような構成であっても良い。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は上記実施形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために、以下の請求項を添付する。
103…画像処理装置、201…CPU、203…HDD,206…操作部、208…RAM、209…ROM、302…OCR依頼処理部、303,304…OCRモジュール、400,500…OCRエンジン部、408,505…OCR言語辞書
Claims (15)
- 画像データに含まれる文字を認識する画像処理装置であって、
複数の文字認識手段と、
文字認識に関する設定を行う設定手段と、
前記設定手段による設定される前記設定と、前記複数の文字認識手段との対応を記憶する記憶手段と、
前記設定手段による設定と前記記憶手段に記憶された前記対応とに基づいて、前記画像データに含まれる文字の文字認識を行う文字認識手段を前記複数の文字認識手段から選択する選択手段と、
前記選択手段により選択された文字認識手段により前記画像データに含まれる文字を認識させるよう制御する制御手段と、
を有することを特徴とする画像処理装置。 - 前記複数の文字認識手段はそれぞれ、当該文字認識手段の文字認識処理における画像処理を実行するOCRエンジンを含み、前記OCRエンジンは、文字認識用の言語辞書を使用して文字認識を行うことを特徴とする請求項1に記載の画像処理装置。
- 前記複数の文字認識手段のいずれかの文字認識手段は、画像データの圧縮処理、文字認識で得られた文字コードを前記画像データのファイル名として設定するファイル名を抽出する処理、画像データを暗号化する処理の少なくともいずれかを実行できる前記OCRエンジンを含むことを特徴とする請求項2に記載の画像処理装置。
- 前記設定手段は、前記画像データのファイル形式を設定することを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
- 前記設定手段は、前記文字認識の対象とする言語を設定することを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。
- 前記記憶手段は、前記文字認識の対象とする言語と、前記複数の文字認識手段のそれぞれとの対応を記憶することを特徴とする請求項1に記載の画像処理装置。
- 前記記憶手段は、前記画像データのファイル形式と、前記文字認識の対象とする言語と、前記複数の文字認識手段のそれぞれとの対応を記憶することを特徴とする請求項1に記載の画像処理装置。
- 前記記憶手段は、前記画像データのファイル形式、前記文字認識の対象とする言語、及び文字認識の結果を使用する機能と、前記複数の文字認識手段のそれぞれとの対応を記憶することを特徴とする請求項1に記載の画像処理装置。
- 前記文字認識結果を使用する機能として、前記画像データのファイル名として設定するファイル名を抽出する処理が設定されている場合、前記抽出されたファイル名を表示してユーザに確認させる画面を表示手段を、更に有することを特徴とする請求項8に記載の画像処理装置。
- 前記抽出されたファイル名を表示する前記画面を介して、前記画像データのファイル名の再抽出が指示されると、前記選択手段により選択されている文字認識手段とは別の文字認識手段を選択し、当該選択された文字認識手段を使用して文字認識を実行させ、当該文字認識で得られた文字コードを前記画像データのファイル名として前記表示手段に表示させる再抽出手段を、更に有することを特徴とする請求項9に記載の画像処理装置。
- 前記画面を介して、前記画像データのファイル名をユーザに編集させる編集手段を、更に有することを特徴とする請求項9又は10に記載の画像処理装置。
- 前記設定手段により設定される前記設定は、ファイル形式、文字認識の対象とする言語、文字認識の結果を利用する機能の少なくともいずれかを含むことを特徴とする請求項1乃至11のいずれか1項に記載の画像処理装置。
- 原稿を読み取り、当該原稿の画像に対応する画像データを出力する読取手段を、更に有し、
前記画像データは、前記読取手段から出力された画像データであることを特徴とする請求項1乃至12のいずれか1項に記載の画像処理装置。 - 複数の文字認識手段を有し、画像データに含まれる文字を認識する画像処理装置を制御する制御方法であって、
文字認識に関する設定を行う設定工程と、
前記設定工程による設定される前記設定と、前記複数の文字認識手段との対応を記憶する記憶工程と、
前記設定工程による設定と前記記憶工程に記憶された前記対応とに基づいて、前記画像データに含まれる文字の文字認識を行う文字認識手段を前記複数の文字認識手段から選択する選択工程と、
前記選択工程により選択された文字認識手段により前記画像データに含まれる文字を認識させるよう制御する制御工程と、
を有することを特徴とする制御方法。 - コンピュータを、請求項1乃至13のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018032195A JP2019148902A (ja) | 2018-02-26 | 2018-02-26 | 画像処理装置とその制御方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018032195A JP2019148902A (ja) | 2018-02-26 | 2018-02-26 | 画像処理装置とその制御方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019148902A true JP2019148902A (ja) | 2019-09-05 |
Family
ID=67850555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018032195A Pending JP2019148902A (ja) | 2018-02-26 | 2018-02-26 | 画像処理装置とその制御方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019148902A (ja) |
-
2018
- 2018-02-26 JP JP2018032195A patent/JP2019148902A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10528679B2 (en) | System and method for real time translation | |
JP5361471B2 (ja) | 情報処理装置、その制御方法、及びプログラム | |
US7684077B2 (en) | Image processing apparatus and image processing method | |
JP7043929B2 (ja) | 情報処理システムおよび情報処理方法 | |
US8385650B2 (en) | Image processing apparatus, information processing apparatus, and information processing method | |
US9473669B2 (en) | Electronic document generation system, electronic document generation apparatus, and recording medium | |
US10306085B2 (en) | Information processing apparatus, control method of information processing apparatus, and recording medium | |
US11792341B2 (en) | Information processing apparatus, method of controlling the same, and storage medium | |
CN104683638A (zh) | 能够再现用户设定的图像形成装置及其控制方法 | |
JP2010165019A (ja) | ファイル名生成システム | |
JP5064943B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP5173278B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
US8867091B2 (en) | Image processing system, image processing apparatus, image scanning apparatus, and control method and program for image processing system | |
JP2010213121A (ja) | 画像処理装置、システム及び画像処理方法 | |
US11694458B2 (en) | Image processing apparatus that sets metadata of image data, method of controlling same, and storage medium | |
JP2019148902A (ja) | 画像処理装置とその制御方法、及びプログラム | |
JP7187145B2 (ja) | 画像送信装置、画像送信装置の制御方法、及びプログラム | |
JP2018042152A (ja) | 画像処理装置、画像処理プログラム、画像処理システムおよび画像処理方法 | |
JP5178497B2 (ja) | 画像読み取り装置、及び画像読み取り装置の制御方法、並びにプログラム | |
JP4968927B2 (ja) | 画像処理装置及び画像処理方法、並びにプログラム | |
US20190107978A1 (en) | Image forming apparatus and print setting method | |
JP2006211553A (ja) | 画像処理装置およびその方法 | |
JP6237369B2 (ja) | 画像形成装置、制御方法、および制御プログラム | |
US11695881B2 (en) | Image forming apparatus that creates a composite image by comparing image data of document sheets, control method thereof, and storage medium | |
JP2017182184A (ja) | 画像処理装置及びその制御方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |