JP6541410B2 - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP6541410B2
JP6541410B2 JP2015093476A JP2015093476A JP6541410B2 JP 6541410 B2 JP6541410 B2 JP 6541410B2 JP 2015093476 A JP2015093476 A JP 2015093476A JP 2015093476 A JP2015093476 A JP 2015093476A JP 6541410 B2 JP6541410 B2 JP 6541410B2
Authority
JP
Japan
Prior art keywords
data
image
character
processing
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015093476A
Other languages
English (en)
Other versions
JP2016045933A (ja
Inventor
数馬 小川
数馬 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2015093476A priority Critical patent/JP6541410B2/ja
Publication of JP2016045933A publication Critical patent/JP2016045933A/ja
Application granted granted Critical
Publication of JP6541410B2 publication Critical patent/JP6541410B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、文字列を含む入力画像データに基づいて、前記文字列に係る文字レイヤに、前記入力画像データに係る画像レイヤを重畳させたPDFファイルを生成する画像処理装置に関する。
近年、いわゆるサーチャブルPDF(Portable Document Format)ファイルの利用が増えつつある。サーチャブルPDFファイルは、文字列を含む画像データを全文検索可能なPDFとして電子化する機能である。サーチャブルPDFファイルにおいては、画像データに含まれる文字列を、文字データとして管理することにより、ユーザは、コンピュータ等の情報処理装置によって文字検索することができる。
また、特許文献1においては、文書画像から背景領域以外の画像を抽出し、これを統合して連結成分を生成し、これを、形状特徴を用いて所定の領域に分類して、文書画像の領域識別の結果を得て、OCR処理に好適な二値画像と領域識別結果を得る文書画像認識方法について開示されている。
特開2001−297303号公報
一方、従来においては、ASIC(Application Specific Integrated Circuit)にて所定の処理を行ない、これによって生成された画像データに対して、そのままCPU等がOCR処理等を行うことによりサーチャブルPDFファイルが生成された。
しかし、このような場合、カラーのサーチャブルPDFファイルを作成するときは、斯かる処理におけるメモリ使用量が大きく、また、OCR処理を行うためにわざわざカラーデータからモノクロデータへの変換を行う必要があり、更に、所定解像度以下の解像度を有するサーチャブルPDFファイルを作成する場合は、OCR処理の精度が悪くなるといった問題が生じていた。
このような問題の解決に対して、特許文献1の文書画像認識方法では何ら工夫されておらず、対応できない。
本発明は、斯かる事情に鑑みてなされたものであり、その目的とするところは、文字列を含む入力画像データに基づいて、前記文字列に係る文字レイヤに、前記入力画像データに係る画像レイヤを重畳させたサーチャブルPDFファイルを生成する画像処理装置において、前記文字レイヤを形成する文字レイヤ用データを生成する生成処理と並行的に、前記画像レイヤを形成する画像データを生成することにより、該サーチャブルPDFファイルの生成が従来に比べて短時間内に行われる画像処理装置を提供することにある。
本発明に係る画像処理装置は、文字列を含む入力画像データに基づいて、前記文字列に係る文字レイヤに、前記入力画像データに係る画像レイヤを重畳させたPDFファイルを生成する画像処理装置において、前記文字レイヤを形成する文字レイヤ用データを生成する生成処理を行う文字処理手段と、前記生成処理と並行的に、前記画像レイヤを形成する画像データを生成する画像生成手段とを備えることを特徴とする。
本発明に係る画像処理装置は、前記文字レイヤ用データは、前記入力画像データから文字列を抽出することによって生成され、前記文字処理手段は、前記入力画像データに基づいて、文字列の抽出のための文字列抽出用データを生成するデータ生成手段と、生成された文字列抽出用データを用いて文字列の抽出を行う文字列抽出手段とを備えることを特徴とする。
本発明に係る画像処理装置は、前記データ生成手段は、生成する文字列抽出用データの解像度を変更できるように構成されていることを特徴とする。
本発明に係る画像処理装置は、前記データ生成手段は、所定の閾値まで解像度を下げて前記文字列抽出用データを生成するように構成されていることを特徴とする。
本発明に係る画像処理装置は、前記文字処理手段によって生成された文字レイヤ用データを記憶する記憶部を備えることを特徴とする。
本発明に係る画像処理装置は、前記文字列抽出用データはグレースケール画像であることを特徴とする。
本発明によれば、前記生成処理と並行的に、前記画像レイヤを形成する画像データを生成する処理が行われるので、前記サーチャブルPDFファイルの生成が従来に比べて短時間内に行われる。
本発明の実施の形態1の複合機の要部構成を示す機能ブロック図である。 本発明の実施の形態1に係る複合機の画像処理部の要部構成を示す機能ブロック図である。 本発明の実施の形態1に係る複合機において、サーチャブルPDFファイルを生成する処理を説明する説明図である。 本発明の実施の形態3に係る複合機において、サーチャブルPDFファイルを生成する処理を説明する説明図である。 本発明の実施の形態4に係る複合機において、データ生成部によって生成されるOCR処理用画像データを概念的に示す図である。
以下に、本発明の実施の形態に係る画像処理装置を、いわゆる複合機に適用した場合を例として、図面に基づいて詳述する。
本発明に係る複合機は、文字列を含む文字領域を含んでおり、外部から入力され、又は読み取られた入力画像データを用いていわゆるサーチャブルPDFファイルを生成する処理を行うことができるように構成されている。
サーチャブルPDFファイルは、前記入力画像データに含まれた文字領域に基づいて文字レイヤを生成し、該入力画像データに係る画像レイヤに、該文字レイヤを重畳させたPDFファイルである。
すなわち、本発明に係る複合機においては、前記入力画像データをPDF化する前にOCR処理を施し、白抜き文字及び地色部分の文字を含む前記文字領域から文字の抽出を行ない、抽出されたデータを透明レイヤにする。また、斯かる透明レイヤを、前記入力画像データに基づく画像レイヤと重ね合わせたかたちでPDF化する。従って、キーワード検索等が可能である。
(実施の形態1)
図1は本発明の実施の形態1の複合機100の要部構成を示す機能ブロック図である。複合機100は、制御部1と、画像入力部2と、画像処理部3と、画像出力部4と、送受信部5と、操作パネル6と、表示部7と、記憶部8とを備えている。
画像入力部2は、読み取りすべき原稿に光を照射する光源、CCD(Charge Coupled Device)、COMS(Complementary Oxide Metal Semiconductor)のようなイメージセンサ等を有し、該原稿の画像データの光学的読み取りを行なう。また、画像入力部2では、所定の読取り位置に載置された原稿からの反射光像を当該イメージセンサに結像させ、RGB(R : Red, G : Green, B : Blue)のアナログデータを出力する。
画像処理部3は、例えば、画像入力部2から入力されるアナログデータを基にデジタル形式の画像データ(入力画像データ)を生成し、又は記憶部8に記憶されている画像データ(入力画像データ)を読み出し、夫々の画像の種類に応じた処理を施した後、出力(印刷)すべき画像データを生成する。画像処理部3によって生成された出力用画像データは、画像出力部4に出力される。
また、画像処理部3は、前記入力画像データに基づいて、前記サーチャブルPDFファイルを生成する処理を行う。斯かる処理に対する詳細については、後述する。
画像出力部4は、画像処理部3から出力される画像データに基づく画像を記録用紙、OHPフィルム等の記録媒体上に印刷する。画像出力部4は、感光体ドラム、該感光体ドラムを所定の電位に帯電させる帯電器、外部から受付けた画像データに応じてレーザ光を発して感光体ドラム上に静電潜像を生成させるレーザ書込装置、感光体ドラム表面に形成された静電潜像にトナーを供給して現像化する現像器、感光体ドラム表面に形成されたトナー像を記録媒体上に転写する転写器等を備えており、例えば、電子写真方式にて画像を記録媒体上に出力する。
送受信部5は、外部に前記原稿のデータを送信するネットワークカード、モデム等を備えている。例えば、送受信部5は、画像処理部3によって生成されたサーチャブルPDFファイルを所定の送信解像度にて外部に送信する。
また、操作パネル6は、複合機100における「ファックス」、「メール」等の機能を切り替える機能ボタン、テンキー、スタートキー、キャンセルキー、受け付けた指示を確定するためのエンターキー、画像入力部2を介して読み取った原稿の画像をシート状の記録媒体上に画像形成するための「印刷」キー又は「コピー」キー等を備えている。
表示部7は、例えば、LCD又はEL(Electroluminescence)パネル等からなり、画像出力部4を介して、所定の記録用紙へ出力(印刷)すべき画像が表示される。また、表示部7は、複合機100の状態、ジョブ処理の状況、画像入力部2が読み取った原稿の画像及び操作パネル6の操作内容の確認等、利用者に対して報知すべき情報を表示する。
記憶部8は、例えば、フラッシュメモリ、EEPROM(登録商標)、HDD、MRAM(磁気抵抗メモリ)、FeRAM(強誘電体メモリ)、又は、OUM等の不揮発性の記憶媒体により構成されている。
制御部1は、このようなハードウェアを適宜制御する。また、制御部1は、CPU、ROM及びRAM(図示せず)を備えている。
ROMには各種の制御プログラム、演算用のパラメータのうちの基本的に固定のデータ等が予め格納されており、RAMはデータを一時的に記憶し、記憶順、記憶位置等に関係なく読み出すことが可能である。また、RAMは、例えば、ROMから読み出されたプログラム、該プログラムを実行することにより発生する各種データ、該実行の際適宜変化するパラメータ等を記憶する。
CPUは、ROMに予め格納されている制御プログラムをRAM上にロードして実行することによって、上述した各種ハードウェアの制御を行ない、装置全体を本発明の複合機として動作させる。
以上の構成を用いて、本発明の実施の形態1に係る複合機100は、前記サーチャブルPDFファイルを生成する処理を行なう。以下、詳しく説明する。
図2は本発明の実施の形態1に係る複合機100の画像処理部3の要部構成を示す機能ブロック図である。画像処理部3は、文字処理部31、画像生成部32及びPDF生成部33を備えており、文字処理部31は更にデータ生成部311及び文字列抽出部312を有している。
文字処理部31は、前記入力画像データの文字領域に基づいて、前記文字レイヤ(透明レイヤ)を形成するデータ(以下、文字レイヤ用データ)を生成する処理を行う。すなわち、文字処理部31は、前記入力画像データに対してOCR処理を施して前記文字領域から文字を抽出し、抽出された結果データは透明レイヤにされる。
データ生成部311は、いわゆるハードウェア処理によって、OCR処理を行うための画像データ(以下、OCR処理用画像データと言う。)を生成する。すなわち、データ生成部311は、ASIC(Application Specific Integrated Circuit)から構成されており、前記入力画像データに対して、伸張・圧縮等の処理を施して、前記OCR処理用画像データを生成する。
データ生成部311による所定の処理によって生成されたOCR処理用画像データは、斯かる処理前の入力画像データより低い解像度を有し、該処理前の入力画像データがカラーかモノクロかに関わらず、モノクロのデータとして生成される。実施の形態1においては、データ生成部311は、例えば、解像度が300dpiのOCR処理用画像データを生成するものとする。
従って、データ生成部311によるOCR処理用画像データの生成は短い時間内に行われる。かつ、文字列抽出部312でのOCR処理も短時間内に実行できる。
一般に、画像入力部2(例えば、スキャナー)によって読み込まれた画像データの解像度は600dpiであるが、OCR処理に必要な最低の解像度は300dpi程度である。実施の形態1の複合機100においては、上述したように、データ生成部311により、解像度が300dpiのOCR処理用画像データが生成されるので、処理の精度を落とすことなく、かつ短時間内に、文字列抽出部312がOCR処理を行うことができる。
また、以上においては、データ生成部311がハードウェアからなる場合を例として説明したが、本発明はこれに限るものでなく、制御部1のCPUが所定のプログラムを実行することにより、ソフトウェア的に構築されてもよい。
文字列抽出部312は、データ生成部311によって生成されたOCR処理用画像データを用いてOCR処理を行う。すなわち、文字列抽出部312は、前記OCR処理用画像データから文字を抽出する処理(OCR処理)を行ない、OCR処理により読み込まれた文字に複数の候補がある場合は、辞書を用いた単語チェック、文法チェック等によって、一番確信度が高い文字を選択する。これによって、OCR抽出結果データ及び書誌データが生成される。例えば、文字列抽出部312は、制御部1のCPUが所定のプログラムを実行することにより、ソフトウェア的に構築されている。
画像生成部32は、いわゆるハードウェア処理により、前記入力画像データに基づいて前記画像レイヤを形成する画像データ(以下、画像レイヤ用画像データと言う)を生成する。すなわち、画像生成部32は、ASIC(Application Specific Integrated Circuit)から構成されており、前記入力画像データに対して、伸張・圧縮等の処理を施して、前記画像レイヤ用画像データを生成する。
また、以上においては、画像生成部32がハードウェアからなる場合を例として説明したが、本発明はこれに限るものでなく、制御部1のCPUが所定のプログラムを実行することにより、ソフトウェア的に構築されてもよい。
PDF生成部33は、文字処理部31によって生成されたOCR抽出結果データ及び書誌データと、画像処理部32によって生成された画像レイヤ用画像データとをオーバーレイ合成してサーチャブルPDFファイルを生成でする。
換言すれば、PDF生成部33は、前記入力画像データから抽出された文字に係るOCR抽出結果データ及び書誌データに係る文字レイヤと、前記画像レイヤ用画像データに係る画像レイヤとを重ね合わせてPDF化する。
図3は本発明の実施の形態1に係る複合機100において、サーチャブルPDFファイルを生成する処理を説明する説明図である。以下、説明の便宜上、画像入力部2によって読み込まれた画像データが入力画像データである場合を例として説明する。
まず、画像入力部2が原稿の画像を読み込む。この際、読み込まれた画像データはRGBのアナログ画像データであり、画像処理部3に出力される。
これに対して所定の処理が施された後、処理後のデジタル画像データが文字処理部31及び画像生成部32に各々出力される。この際、出力される画像データは、RGBデータであり、例えば、JPEG形式によって圧縮され、600×600dpiの解像度を有する画像データである。
以降、文字処理部31による前記文字レイヤ用データの生成処理と、画像生成部32による前記画像レイヤ用画像データの生成処理とは並列的に行われる。すなわち、文字処理部31が前記文字レイヤ用データを生成する際、画像生成部32が前記画像レイヤ用画像データを生成する。
従って、本発明に係る複合機100においては、サーチャブルPDFファイルの生成が従来に比べ短時間内に行われる。以下、詳しく説明する。
データ生成部311では、入力される前記処理後の画像データに基づいて、前記OCR処理用画像データを生成する。データ生成部311における処理に対しては、すでに説明しており、詳しい説明を省略する。データ生成部311によって生成されたOCR処理用画像データは文字列抽出部312に出力される。
この際、出力されるOCR処理用画像データは、1bit/画素のK8データであり、例えば、JPEG形式によって圧縮され、300×300dpiの解像度を有する画像データである。
このように、生成されたOCR処理用画像データは、処理前の画像データより解像度が低く、カラーデータからモノクロデータに変換されているので、データ生成部311での処理は短い時間内に行われる。
次いで、文字列抽出部312はデータ生成部311によって生成されたOCR処理用画像データを用いて、傾き補正、OCR処理等を行う。斯かる処理によって、前記OCR抽出結果データ及び書誌データ、すなわち、文字レイヤ用データが生成される。生成された文字レイヤ用データはPDF生成部33に出力される。文字列抽出部312における当該処理については既に説明しており詳しい説明を省略する。
上述したように、データ生成部311によって生成されたOCR処理用画像データは、解像度が低く、モノクロデータであるので、文字列抽出部312での処理にて、多くのメモリが使用されず、短時間内に実行できる。
この間、前記文字レイヤ用データの生成と並列的に、画像生成部32においても前記画像レイヤ用画像データの生成が行われる。すなわち、画像生成部32は、入力される前記処理後の画像データに基づいて、画像レイヤ用画像データを生成する。画像生成部32における斯かる処理については既に説明しており、詳しい説明は省略する。
画像生成部32によって生成された画像レイヤ用画像データはPDF生成部33に出力される。斯かる画像レイヤ用画像データは、例えば、RGBデータであり、例えば、JPEG形式によって圧縮され、600×600dpiの解像度を有する画像データである。
PDF生成部33は、文字処理部31からの文字レイヤ用データに係る文字レイヤと、画像生成部32からの画像レイヤ用画像データに係る画像レイヤとを重ね合わせてサーチャブルPDFファイルを生成する。
以降、例えば、送受信部5が斯かるサーチャブルPDFファイルを所定の宛先に送信する。
(実施の形態2)
実施の形態1においては、データ生成部311によって生成されるOCR処理用画像データは、斯かる処理の前より解像度が低く、特定の解像度(例えば、300×300dpi)を有する場合を例として説明した。しかし、本発明はこれに限るものでない。
実施の形態2に係る複合機100においては、所定の判定部を備え、該判定部の判定結果に基づいて、データ生成部311が特定の解像度を有するOCR処理用画像データを生成するように構成しても良い。
すなわち、実施の形態2に係る複合機100においては、前記判定部が、データ生成部311に入力される画像データに対してその解像度が所定の閾値(例えば、300×300dpi)以上であるか否かを判断する。前記判定部によって閾値以上であると判定された場合、データ生成部311は、特定の解像度まで解像度を下げてOCR処理用画像データを生成する。一方、前記判定部によって閾値未満であると判定された場合、データ生成部311は、特定の解像度まで解像度を上げてOCR処理用画像データを生成する。
以上の構成を有することにより、実施の形態2に係る複合機100は、OCR処理にて、安定して精度の高い文字検出を行うことができる。
また、以上の記載に限るものでなく、前記判定に係る閾値はユーザによって変更できるように構成しても良い。
なお、前記判定部は、例えば、DSP(Digital Signal Processor)のようなハードウェアロジックによって構成してもよいし、前記CPUが所定のプログラムを実行することにより、ソフトウェア的に構築されてもよい。
(実施の形態3)
図4は本発明の実施の形態3に係る複合機100において、サーチャブルPDFファイルを生成する処理を説明する説明図である。以下、説明の便宜上、画像入力部2によって読み込まれた画像データが入力画像データである場合を例として説明する。
まず、画像入力部2が原稿の画像を読み込み、読み込まれた画像データはRGBのアナログ画像データであり、画像処理部3に出力される。これに対して所定の処理が施された後、処理後のデジタル画像データが文字処理部31及び画像生成部32に各々出力される。
以降、文字処理部31による前記文字レイヤ用データの生成処理と、画像生成部32による前記画像レイヤ用画像データの生成処理とは並列的に行われる。
データ生成部311では、入力される前記処理後の画像データに基づいて、前記OCR処理用画像データを生成する。データ生成部311における処理に対しては、すでに説明しており、詳しい説明を省略する。データ生成部311によって生成されたOCR処理用画像データは文字列抽出部312に出力される。
次いで、文字列抽出部312はデータ生成部311によって生成されたOCR処理用画像データを用いて、傾き補正、OCR処理等を行う。斯かる処理によって、前記OCR抽出結果データ及び書誌データ、すなわち、文字レイヤ用データが生成される。文字列抽出部312における当該処理については既に説明しており詳しい説明を省略する。
この間、画像生成部32においても、前記文字レイヤ用データの生成と並列的に前記画像レイヤ用画像データの生成が行われる。すなわち、画像生成部32は、入力される前記処理後の画像データに基づいて、画像レイヤ用画像データを生成する。画像生成部32における斯かる処理については既に説明しており、詳しい説明は省略する。
一方、実施の形態3に係る複合機100においては、文字列抽出部312によって生成された文字レイヤ用データはPDF生成部33に出力されると共に、前記画像レイヤ用画像データとは別に保存される。
斯かる画像レイヤ用画像データの保存は、画像処理部3内に所定の記憶部を設け、斯かる文字レイヤ用データを記憶するようにしてもよく、記憶部8に記憶するように構成してもよい。
PDF生成部33は、文字処理部31からの文字レイヤ用データに係る文字レイヤと、画像生成部32からの画像レイヤ用画像データに係る画像レイヤとを重ね合わせてサーチャブルPDFファイルを生成する。生成されたサーチャブルPDFファイルは、送受信部5によって所定の解像度にて宛先に送信される。
実施の形態3に係る複合機100においては、このような構成を有するので、送信解像度の変更を伴う再送信が必要な場合、斯かる処理を簡略にすることができる。以下、詳しく説明する。
例えば、一定の送信解像度にてサーチャブルPDFファイルを送信した後、何らかの理由により、前記送信解像度と異なる新たな解像度にて該サーチャブルPDFファイルを再送信する場合が想定できる。このような場合、サーチャブルPDFファイルに係る文字レイヤ用データ及び画像レイヤ用画像データを当該新たな解像度に合わせて再度生成する必要がある。
しかし、実施の形態3に係る複合機100においては、上述したように、文字列抽出部312によって生成された文字レイヤ用データが前記画像レイヤ用画像データとは別に保存される。従って、上述したように、異なる解像度での再送信が必要な場合、当該新たな解像度に合わせて文字レイヤ用データを再度生成する必要がなく、新たな解像度に応じて、既に保存されている文字レイヤ用データに対して、例えば、座標変更等の簡単な処理を施すだけで良い。
従って、前記再送信に係る処理を大幅に簡略化でき、斯かる処理に掛かる時間を短縮でき、また、当該処理に伴うメモリの使用を極力抑えることができる。
実施の形態1と同様の部分については、同一の符号を付して詳細な説明を省略する。
(実施の形態4)
実施の形態4においては、データ生成部311によって生成されるOCR処理用画像データがグレースケール画像である。換言すれば、前記OCR処理用画像データはグレースケールにて生成される。これによって、前記OCR処理における文字列(文字領域)の認識率が高くなる。より詳しくは、グレー文字の認識が可能となり、また、白抜き文字等の反転文字の認識率を高めることが出来る。
図5は本発明の実施の形態4に係る複合機において、データ生成部311によって生成されるOCR処理用画像データを概念的に示す図である。図5Aは、原稿データを示しており、図5BはOCR処理用画像データを白黒の2値で生成した場合であり、図5CはOCR処理用画像データをグレースケールにて生成した場合を示している。
図5Aに示しているように、例えば、OCR処理を施す原稿(原稿データ)は、文字部分の濃度値が200で、背景部分の濃度値が160である。
このような場合、白黒の2値化の閾値を例えば150としてOCR処理用画像データを生成して斯かる原稿に対してOCR処理を施した場合は、濃度値150以上は全て黒となるので、図5Bに示しているように、濃度値160である該原稿の背景が黒となって文字との区別ができず、文字の認識が出来なくなる。
これに対して、本発明の実施の形態4に係る複合機100においては、データ生成部311によって生成されるOCR処理用画像データがグレースケール画像であるので、図5Cに示しているように、該原稿の背景が黒となることはなく、文字の認識が可能となる。
本発明の実施態様1においては、文字列を含む入力画像データに基づいて、前記文字列に係る文字レイヤに、前記入力画像データに係る画像レイヤを重畳させたPDFファイルを生成する画像処理装置100において、前記文字レイヤを形成する文字レイヤ用データを生成する生成処理を行う文字処理手段31と、前記生成処理と並行的に、前記画像レイヤを形成する画像データを生成する画像生成手段32とを備えることを特徴とする。
本発明によれば、前記文字レイヤ用データを生成する生成処理と並行的に、前記画像レイヤを形成する画像データが生成されることにより、サーチャブルPDFファイルの生成が従来に比べて短時間内に行われる。
本発明の実施態様2においては、前記文字レイヤ用データは、前記入力画像データから文字列を抽出することによって生成され、前記文字処理手段31は、前記入力画像データに基づいて、文字列の抽出のための文字列抽出用データを生成するデータ生成手段311と、生成された文字列抽出用データを用いて文字列の抽出を行う文字列抽出手段312とを備えることを特徴とする。
本発明によれば、前記データ生成手段が、前記入力画像データに基づいて、前記入力画像データから文字列を抽出するための文字列抽出用データを生成すると、前記文字列抽出手段が生成された文字列抽出用データを用いて文字列の抽出を行う。
本発明の実施態様3においては、前記データ生成手段311は、生成する文字列抽出用データの解像度を変更できるように構成されていることを特徴とする。
本発明によれば、前記データ生成手段によって生成される文字列抽出用データの解像度は必要に応じて変更できる。
本発明の実施態様4においては、前記データ生成手段311は、所定の閾値まで解像度を下げて前記文字列抽出用データを生成するように構成されていることを特徴とする。
本発明によれば、前記データ生成手段は前記文字列抽出用データを生成する際、所定の閾値まで解像度を下げて前記文字列抽出用データを生成する。
本発明の実施態様5においては、前記文字処理手段31によって生成された文字レイヤ用データを記憶する記憶部8を備えることを特徴とする。
本発明によれば、前記文字処理手段によって生成された文字レイヤ用データは、前記画像レイヤを形成する画像データとは別に、前記記憶部によって記憶される。
本発明の実施態様6においては、前記文字列抽出用データはグレースケール画像であることを特徴とする。
本発明によれば、前記文字例抽出用データがグレースケールにて生成される。これによって、前記文字例の抽出において、グレー文字の認識が可能となり、また、白抜き文字等の反転文字の認識率を高めることが出来る。
1 制御部
3 画像処理部
8 記憶部
31 文字処理部
32 画像生成部
100 複合機
311 データ生成部
312 文字列抽出部

Claims (4)

  1. 文字列を含む読み込まれた入力画像データに基づいて、前記文字列に係る文字レイヤに、前記入力画像データに係る画像レイヤを重畳させたPDFファイルを生成する画像処理装置において、
    前記入力画像データから文字列を抽出することによって、前記文字レイヤを形成する文字レイヤ用データを生成する生成処理を行う文字処理手段と、
    前記生成処理と並行的に、前記画像レイヤを形成する画像データを生成する画像生成手段とを備え
    前記文字処理手段は、
    前記入力画像データに基づいて、文字列の抽出のための文字列抽出用データを生成するデータ生成手段と、
    生成された文字列抽出用データを用いて文字列の抽出を行う文字列抽出手段とを有し、
    前記入力画像データの解像度と閾値との比較結果に応じて、前記データ生成手段は生成する文字列抽出用データの解像度を変更することを特徴とする画像処理装置。
  2. 前記データ生成手段は、所定の閾値まで解像度を下げて前記文字列抽出用データを生成するように構成されていることを特徴とする請求項に記載の画像処理装置。
  3. 前記文字処理手段によって生成された文字レイヤ用データを記憶する記憶部を備えることを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記文字列抽出用データはグレースケール画像であることを特徴とする請求項1又は2に記載の画像処理装置。
JP2015093476A 2014-08-21 2015-04-30 画像処理装置 Active JP6541410B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015093476A JP6541410B2 (ja) 2014-08-21 2015-04-30 画像処理装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014168697 2014-08-21
JP2014168697 2014-08-21
JP2015093476A JP6541410B2 (ja) 2014-08-21 2015-04-30 画像処理装置

Publications (2)

Publication Number Publication Date
JP2016045933A JP2016045933A (ja) 2016-04-04
JP6541410B2 true JP6541410B2 (ja) 2019-07-10

Family

ID=55636372

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015093476A Active JP6541410B2 (ja) 2014-08-21 2015-04-30 画像処理装置

Country Status (1)

Country Link
JP (1) JP6541410B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3955515B2 (ja) * 2002-09-09 2007-08-08 株式会社リコー 画像読み取り方法、画像読み取り装置およびネットワークシステム
JP4543855B2 (ja) * 2004-09-24 2010-09-15 富士ゼロックス株式会社 文書画像処理装置、文書画像処理装置の制御方法及びプログラム
JP4574313B2 (ja) * 2004-10-04 2010-11-04 キヤノン株式会社 画像処理装置および方法
JP4861362B2 (ja) * 2008-04-10 2012-01-25 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP2010273119A (ja) * 2009-05-21 2010-12-02 Sharp Corp 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
JP2010286917A (ja) * 2009-06-09 2010-12-24 Sharp Corp 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP2016045933A (ja) 2016-04-04

Similar Documents

Publication Publication Date Title
JP4789516B2 (ja) 文書変換装置、文書変換方法並びに記憶媒体
US9514394B2 (en) Image forming apparatus capable of changing image data into document data, an image forming system, and an image forming method
US20110090534A1 (en) Image processing apparatus, control method therefor, and program
JP5797679B2 (ja) 画像形成装置及び画像形成方法
JP2007102545A (ja) 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
US9614984B2 (en) Electronic document generation system and recording medium
JP4943354B2 (ja) 情報識別装置、情報識別方法、プログラム及び記録媒体
US11436454B2 (en) Inspection device, image forming apparatus, and non-transitory computer readable medium storing inspection program
JP6541410B2 (ja) 画像処理装置
JP2020204905A (ja) 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
US11611680B2 (en) Inspection device, image forming apparatus, and non-transitory computer readable medium storing inspection program
JP2018077794A (ja) 画像処理装置、及び画像形成装置
JP2023030811A (ja) 情報処理装置、抽出処理装置、画像処理システム、情報処理装置の制御方法、及びプログラム
JP2015177265A (ja) 画像処理装置、画像処理システム、情報記憶方法およびプログラム
JP6662108B2 (ja) 画像変換プログラム及び画像変換装置並びに画像変換方法
JP6269256B2 (ja) 情報処理装置、画像形成装置、情報処理方法、及び情報処理プログラム
JP2019220906A (ja) 画像処理システム、印刷指示装置、画像処理装置及びプログラム
JP7452059B2 (ja) 情報処理装置及びプログラム
US11134171B1 (en) Image reading apparatus, image forming apparatus, and image reading method that perform image processing for each area
US11212419B1 (en) Image reading system, image forming system, and image reading method that perform image processing for each area
JP2005196637A (ja) 画像形成装置及びその制御方法
JP6413783B2 (ja) 印刷指示装置、印刷システムおよびプログラム
JP2023143386A (ja) 情報処理装置及び情報処理プログラム
JP2014232930A (ja) 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム
JP2013254393A (ja) データ処理装置及びこれを用いたデータ処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190515

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190611

R150 Certificate of patent or registration of utility model

Ref document number: 6541410

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150