JP2012073749A - Image formation device and image formation program - Google Patents
Image formation device and image formation program Download PDFInfo
- Publication number
- JP2012073749A JP2012073749A JP2010217169A JP2010217169A JP2012073749A JP 2012073749 A JP2012073749 A JP 2012073749A JP 2010217169 A JP2010217169 A JP 2010217169A JP 2010217169 A JP2010217169 A JP 2010217169A JP 2012073749 A JP2012073749 A JP 2012073749A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character information
- target image
- character
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
Description
本発明は、PDFなどのファイルデータを生成する画像形成装置及び画像形成プログラムに関し、特に、不可視のテキストデータが付されたサーチャブルファイルを生成する画像形成装置及び画像形成プログラムに関する。 The present invention relates to an image forming apparatus and an image forming program for generating file data such as PDF, and more particularly to an image forming apparatus and an image forming program for generating a searchable file with invisible text data.
近年、原稿をPDF(Portable Document Format)やXPS(XML Paper Specification)などのファイルデータに変換する際、原稿に含まれる文字情報を付加することによって、所望の文字列が検索可能なサーチャブルPDFやサーチャブルXPS等(以下、これらをサーチャブルファイルと総称する。)の利用が高まっている。
図9に示すように、サーチャブルファイルは、原稿から文字情報を抽出するため、画像データ(JPEGデータなど)を二値化したラスタデータからテキストデータを抽出するOCR(Optical Character Reader)の技術が用いられる。このためサーチャブルファイルの生成に際しては、文字オブジェクトの的確なパターンマッチングを実現すべく、適切な解像度変換が求められる。
すなわち、解像度は文字認識レベルに相当し、解像度の増減によって文字の認識精度を調整することができる(例えば、特許文献1参照)。
In recent years, when a document is converted into file data such as PDF (Portable Document Format) or XPS (XML Paper Specification), a searchable PDF or searchable PDF in which a desired character string can be searched by adding character information included in the document. The use of XPS and the like (hereinafter collectively referred to as searchable files) is increasing.
As shown in FIG. 9, in order to extract character information from a manuscript, a searchable file uses OCR (Optical Character Reader) technology that extracts text data from raster data obtained by binarizing image data (JPEG data or the like). Used. For this reason, when generating a searchable file, appropriate resolution conversion is required to achieve accurate pattern matching of character objects.
That is, the resolution corresponds to the character recognition level, and the character recognition accuracy can be adjusted by increasing or decreasing the resolution (see, for example, Patent Document 1).
ところで、サーチャブルファイルは、図10に示すように、OCR処理によって抽出したテキストデータからなるテキストレイヤを非表示とし、このテキストレイヤと画像データのレイヤとが階層状に形成されたものである。
このため、ユーザーは、サーチャブルファイルに埋め込まれた文字列が正しいか否かを一見して判断することはできず、ビューワー等を介して実際に文字列検索を行ってみなければその精度を判別できない問題があった。
このような問題に対し、OCR処理によって抽出された文字列を表示するステップや、誤って抽出された文字を修正するステップを具備した文字認識方法が提案されている(例えば、特許文献2参照)。
By the way, as shown in FIG. 10, the searchable file hides a text layer made up of text data extracted by OCR processing, and the text layer and the image data layer are formed in a hierarchy.
For this reason, the user cannot judge at a glance whether or not the character string embedded in the searchable file is correct. If the user does not actually perform a character string search through a viewer or the like, the accuracy will be improved. There was a problem that could not be determined.
In order to solve such a problem, a character recognition method including a step of displaying a character string extracted by OCR processing and a step of correcting an erroneously extracted character has been proposed (for example, see Patent Document 2). .
しかしながら、特許文献2に記載された文字認識方法によれば、文字そのものをユーザーの手作業により修正するようにしているため、二次的なミスが発生するおそれがあった。
また、特許文献1に記載された文字認識装置によれば、このようなミスは発生し得ないが、OCRの認識精度を判定するために種々のキーワードやキーワード毎のスコアを事前に設定しなければならず煩雑であった。さらに、読み取り解像度を任意の値に設定し、その結果を事前に確認する手段がないため、柔軟性に欠き、ユーザーにとって不便なものとなっていた。
However, according to the character recognition method described in Patent Document 2, since the character itself is corrected manually by the user, there is a possibility that a secondary error may occur.
Further, according to the character recognition device described in
本発明は、以上のような事情に鑑みなされたものであり、サーチャブルファイルの生成にあたり、ユーザーが任意に文字認識レベルを設定できるとともに、文字抽出の精度を確認することができ、また、これらの処理を繰り返し行うことで、高品質のサーチャブルファイルを円滑に生成することができる画像形成装置及び画像形成プログラムを提供する。 The present invention has been made in view of the circumstances as described above, and in generating a searchable file, the user can arbitrarily set the character recognition level and can check the accuracy of character extraction. An image forming apparatus and an image forming program capable of smoothly generating a high-quality searchable file by repeating the above process are provided.
上記目的を達成するため、本発明の画像形成装置は、所定の画質の対象画像から文字情報を抽出する文字情報抽出手段と、前記文字情報と前記対象画像の出力イメージを表示する表示手段と、前記文字情報及び対象画像にもとづき、前記文字情報を検出可能な前記対象画像のファイルデータを生成するファイルデータ生成手段と、入力操作に応じ対象画像の画質を変更する文字精度変更手段と、を備え、前記表示手段が、変更された画質の前記対象画像から抽出した文字情報と前記対象画像の出力イメージを表示し、前記ファイルデータ生成手段が、変更された画質の前記対象画像から抽出した文字情報及び前記対象画像にもとづき、前記ファイルデータを生成する構成としてある。 In order to achieve the above object, an image forming apparatus of the present invention includes character information extraction means for extracting character information from a target image having a predetermined image quality, display means for displaying the character information and an output image of the target image, File data generating means for generating file data of the target image capable of detecting the character information based on the character information and the target image; and character accuracy changing means for changing the image quality of the target image in accordance with an input operation. The display means displays the character information extracted from the target image with the changed image quality and the output image of the target image, and the file data generation means extracts the character information extracted from the target image with the changed image quality. In addition, the file data is generated based on the target image.
また、本発明の画像形成プログラムは、画像形成装置のコンピューターを、所定の画質の対象画像から文字情報を抽出する文字情報抽出手段、前記文字情報と前記対象画像の出力イメージを表示する表示手段、前記文字情報及び対象画像にもとづき、前記文字情報を検出可能な前記対象画像のファイルデータを生成するファイルデータ生成手段、及び、入力操作に応じ対象画像の画質を変更する文字精度変更手段、として機能させるとともに、前記表示手段に、変更された画質の前記対象画像から抽出した文字情報と前記対象画像の出力イメージを表示させ、前記ファイルデータ生成手段に、変更された画質の前記対象画像から抽出した文字情報及び前記対象画像にもとづき、前記ファイルデータを生成させる構成としてある。 Further, the image forming program of the present invention includes a computer of an image forming apparatus, character information extracting means for extracting character information from a target image having a predetermined image quality, display means for displaying the character information and an output image of the target image, Functions as file data generating means for generating file data of the target image capable of detecting the character information based on the character information and the target image, and character accuracy changing means for changing the image quality of the target image in accordance with an input operation. And displaying the character information extracted from the target image having the changed image quality and the output image of the target image on the display unit, and extracting the image data from the target image having the changed image quality on the file data generating unit. The file data is generated based on the character information and the target image.
本発明の画像形成装置及び画像形成プログラムによれば、高品質のサーチャブルファイルを円滑に生成することができる。 According to the image forming apparatus and the image forming program of the present invention, a high-quality searchable file can be generated smoothly.
以下、本発明の一実施形態について図面を参照して説明する。
図1は、本発明の一実施形態に係るMFP(画像形成装置)の構成を示すブロック図である。
図1に示すように、本実施形態のMFP10は、通信インターフェース11と、表示インターフェース12と、パネル13と、スキャナデバイス14と、制御部15とを備える。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a configuration of an MFP (image forming apparatus) according to an embodiment of the present invention.
As illustrated in FIG. 1, the MFP 10 according to the present exemplary embodiment includes a
通信インターフェース11は、LAN(Local Area Network)等のネットワークを介し、パーソナルコンピューター20(以下、PC20という。)との間で必要なデータや信号の通信を行うためのネットワークインターフェースである。例えば、PC20におけるユーティリティやWebブラウザの実行にもとづきPC20から出力された原稿の画像データ(例えば、JPEGやMMRなどのイメージデータ)を受信する。
The
表示インターフェース12は、パネル13との間で種々のデータを送受信する入出力インターフェースである。例えば、パネル13から出力されたサーチャブルPDFの作成要求を制御部15に受け渡す処理や、生成されたプレビュー画像をパネル13に受け渡す処理等を行う。
The
パネル13は、タッチパネルとカラーLCD(Liquid Crystal Display)とを組み合わせたタッチパネルユニット等から構成され、種々の画面を表示するとともに、ユーザーのタッチ操作により種々の操作指令を入力するための操作ボタンを表示する操作パネルを構成する。例えば、パネル13は、原稿のプレビュー画像や原稿から抽出した文字列のプレビュー画像を表示し、または、サーチャブルPDFの作成要求を行うための操作ボタンや他のユーザーインターフェースを表示する(図5,6参照)。
The
スキャナデバイス14は、スキャナユニットとして搭載されたイメージセンサなどのスキャナ装置であり、画像や文字が描かれた原稿を読み取って画像データ(JPEGやMMRなどのイメージデータ)を取得するものである。
なお、スキャナデバイス14は、取得した原稿の画像データを制御部15(後述するデータ送受信部151)に出力する。
The
The
制御部15は、CPU、制御プログラムやデータが記憶されたROM、ワークメモリとして機能するRAM、I/Oポートなどのマイクロコンピューターで構成される。制御部15は、記憶された制御プログラムを実行して、MFP10を構成する各部を制御する。
例えば、制御部15は、通信インターフェース11を介して受信した画像データやスキャナデバイス14を介して入力した画像データをラスタデータに変換する等の画像処理を行う。
なお、画像処理によって得られたラスタデータは、通常は出力画像(出力イメージ)として印刷処理に用いられる。具体的には、ラスタデータにもとづくトナー像が感光体ドラム上に形成され、このトナー像が一旦、転写ベルトに転写される。次いで、転写ベルト上のトナー像を用紙に転写し、転写ローラーによりトナー像を用紙に定着させることによって印刷処理が行われる(感光体ドラム、転写ドラム及び転写ローラーは非図示)。
The control unit 15 includes a microcomputer such as a CPU, a ROM that stores control programs and data, a RAM that functions as a work memory, and an I / O port. The control unit 15 executes the stored control program to control each unit constituting the
For example, the control unit 15 performs image processing such as converting image data received via the
Note that raster data obtained by image processing is normally used for print processing as an output image (output image). Specifically, a toner image based on the raster data is formed on the photosensitive drum, and this toner image is temporarily transferred to the transfer belt. Next, the toner image on the transfer belt is transferred to a sheet, and the toner image is fixed on the sheet by a transfer roller, whereby a printing process is performed (photosensitive drum, transfer drum, and transfer roller are not shown).
ここで、本発明の一実施形態に係るMFPの制御部について詳細に説明する。
制御部15は、図1に示すように、データ送受信部151と、画像処理部152と、OCR解析部153と、フォントラスタライザ154とを、各機能ブロックとして備える。
データ送受信部151は、制御部15と他の構成部との間で必要なデータ又は信号の受け渡しを行う。
例えば、通信インターフェース11やスキャナデバイス14から入力した画像データを画像処理部152に出力し、または、画像処理部152から入力したラスタデータを通信インターフェース11や表示インターフェース12に出力する。
Here, the control unit of the MFP according to the embodiment of the present invention will be described in detail.
As shown in FIG. 1, the control unit 15 includes a data transmission /
The data transmission /
For example, image data input from the
画像処理部152は、入力した画像データを所定の出力画質(解像度)にもとづくピクセルに分解して2値データに変換することによって、出力画像(ラスタデータ)を生成する(出力画像生成手段)。
また、画像処理部152は、必要に応じ、解像度、画像サイズを変更し、又は、回転や色変換を行うなど、出力画質を変更したうえで出力画像を生成することもできる。
画像処理部152は、生成した出力画像をOCR処理部153に出力する。
さらに、画像処理部152は、出力画像をPDFデータに変換するとともに、OCR解析部153によって抽出されたテキストデータとPDFデータとを結合してPDFファイル(サーチャブルPDF)を生成する(ファイルデータ生成手段)。
The
The
The
Further, the
OCR解析部153は、出力画像を解析してテキストデータを抽出する(文字情報抽出手段)。具体的には、OCR解析部153は、ラスタデータから文字を構成するピクセルを取り出し、該当する文字コード、サイズ、位置などの属性情報を付する。
フォントラスタライザ154は、テキストデータをラスタデータに変換することで文字列のプレビュー画像を生成する。生成された文字列のプレビュー画像は、PC20やパネル13に送られて表示される(図5参照)。
The
The
なお、PC20は、MFP10とLAN(Local Area Network)等のネットワークを介し電気的に接続されている。
PC20には、ビットマップ画像のプレビュー機能を有するWebブラウザその他のPCユーティリティがインストールされており、また、このPCユーティリティによりMFP20との各種情報の受け渡しを可能としている。
The
A PC browser and other PC utilities having a bitmap image preview function are installed in the
つぎに、本発明の一実施形態の画像処理を詳細に説明する。具体的には、i)画像データ入力時における画像処理、ii)テキストデータを抽出しプレビュー表示する工程における画像処理、iii)文字認識レベルの再設定時における画像処理、及び、iv)サーチャブルPDFの生成時における画像処理についてそれぞれ説明する。 Next, image processing according to an embodiment of the present invention will be described in detail. Specifically, i) image processing at the time of image data input, ii) image processing in the step of extracting and previewing text data, iii) image processing at the time of resetting the character recognition level, and iv) searchable PDF Each of the image processing at the time of generation will be described.
i)画像データ入力時における画像処理
図2は、本発明の一実施形態において画像データ入力時における画像処理を説明するための説明図である。
具体的には、図2に示すように、画像データの入力から出力画像をOCR解析部153に出力するまでの間に行われる画像処理を説明する。
i) Image Processing at the Time of Image Data Input FIG. 2 is an explanatory diagram for explaining image processing at the time of image data input in one embodiment of the present invention.
Specifically, as shown in FIG. 2, image processing performed between the input of image data and the output of an output image to the
図2に示すように、まず、PC20又はスキャナデバイス14を介して原稿の画像データを入力する。
例えば、PC20が、MFP10と情報の受け渡しが可能なWebブラウザその他のユーティリティを介し、サーチャブルPDFの作成要求信号と、原稿の画像データとを通信インターフェース11に出力する。通信インターフェース11は、入力した信号及びデータをデータ送受信部151に出力する。
他方、スキャナデバイス14で読み取った原稿の画像データを用いてサーチャブルPDFを生成する場合、パネル13が、サーチャブルPDFの作成要求信号をデータ送受信部151に出力し、スキャナデバイス14が、原稿の画像データをデータ送受信部151に出力する。
As shown in FIG. 2, first, image data of an original is input via the
For example, the
On the other hand, when generating a searchable PDF using document image data read by the
データ送受信部151は、入力したサーチャブルPDFの作成要求信号及び原稿の画像データを画像処理部152に出力する。
画像処理部152は、入力した原稿の画像データを所定の出力画質(解像度)にもとづいて2値化し、ラスタデータからなる出力画像を取得する。
なお、画像処理部152は、取得した出力画像にもとづいて原稿のプレビュー画像を生成してこれを保持するとともに、この出力画像をOCR解析部153に出力する。
The data transmission /
The
The
ii)テキストデータを抽出しプレビュー表示する工程における画像処理
図3は、出力画像からテキストデータを抽出してからプレビュー表示するまでに行われる画像処理を説明するための説明図である。
ii) Image Processing in Step of Extracting Text Data and Displaying Preview FIG. 3 is an explanatory diagram for explaining image processing performed from extraction of text data from an output image to preview display.
ここでは、まず、OCR解析部153が、出力画像から文字情報を抽出し、これをプレーンテキスト、リッチテキストなどのテキストデータに変換して画像処理部152に出力する。
つぎに、画像処理部152は、入力したテキストデータを、フォントラスタライザ154を使用してラスタデータに変換し、文字列のプレビュー画像として取得する。なお、画像処理部152は、入力したテキストデータを保持しておく。
また、画像処理部152は、保持しておいた原稿のプレビュー画像と文字列のプレビュー画像とをデータ送受信部151に出力する。なお、この際、画像処理部152は、原稿のプレビュー画像と文字列のプレビュー画像とを対比可能に並べて配置したプレビュー画像に加工してデータ送受信部151に出力することもできる。
次いで、画像処理部152は、このようなプレビュー画像と、OCR解析部153から入力したテキストデータとをデータ送受信部151に出力する。
Here, first, the
Next, the
Further, the
Next, the
データ送受信部151は、入力したプレビュー画像及びテキストデータを通信インターフェース11又は表示インターフェース12に出力する。
通信インターフェース11は、入力したプレビュー画像及びテキストデータをPC20に送信し、表示インターフェース12は、入力したプレビュー画像及びテキストデータをパネル13に出力する。
プレビュー画像を入力したPC20又はパネル13では、原稿のプレビュー画像と、文字列のプレビュー画像を表示する(表示手段)。なお、文字列のプレビュー画像に加え、認識文字数、言語、処理時間などの他の文字情報を表示することもできる。
このため、ユーザーは、表示された2つのプレビュー画像を比較しながら参照することができ、OCR解析部153によって抽出された文字の正否を容易に確認することができる。
The data transmission /
The
The
Therefore, the user can refer to the two displayed preview images while comparing them, and can easily confirm whether the characters extracted by the
iii)文字認識レベルの再設定時における画像処理
図4は、文字認識レベルの再設定時における画像処理を説明するための説明図である。
文字認識レベルの再設定は、プレビュー画像を確認した結果、文字の誤りが多く許容できないと判断した場合等、ユーザーの判断で任意で行われる。
ユーザーは、図5や図6に示すように、PC20に接続された非図示のモニターやパネル13の表示領域に表示されたプレビュー画面を参照しつつ、操作ボタン、調整バーなどのユーザーインターフェースを介して文字認識レベルの再設定を行う。
iii) Image processing at the time of resetting the character recognition level FIG. 4 is an explanatory diagram for explaining image processing at the time of resetting the character recognition level.
The resetting of the character recognition level is arbitrarily performed at the user's discretion, for example, when the preview image is confirmed and it is determined that many character errors are unacceptable.
As shown in FIGS. 5 and 6, the user refers to a monitor screen (not shown) connected to the
具体的には、ユーザーは、図5に示された表示領域に表示される「認識レベル再調整」ボタンを選択する。「認識レベル再調整」ボタンが選択されると、図6に示す文字認識レベルの調整バー(操作部)を表示する(操作部表示手段)。この調整バーによれば、文字の認識精度(抽出精度)とパフォーマンス(処理速度)との割合をボタン操作やスライド操作によって調整できる(文字精度変更手段)。例えば、図6において、ユーザーは、レベル選択ボタンの左を選択して、精度を高く設定することができるが、この場合、パフォーマンスは低く設定される。また、レベル選択ボタンの右を選択すると、パフォーマンスを高く設定することができるが精度は低く設定される。
文字認識レベルが再設定され、「決定」ボタンが選択されると、この再設定した文字認識レベルの設定情報が出力される。
Specifically, the user selects a “recognition level readjustment” button displayed in the display area shown in FIG. When the “recognition level readjustment” button is selected, the character recognition level adjustment bar (operation unit) shown in FIG. 6 is displayed (operation unit display means). According to this adjustment bar, the ratio between the character recognition accuracy (extraction accuracy) and the performance (processing speed) can be adjusted by a button operation or a slide operation (character accuracy changing means). For example, in FIG. 6, the user can select the left of the level selection button and set the accuracy high, but in this case, the performance is set low. If the right of the level selection button is selected, the performance can be set high, but the accuracy is set low.
When the character recognition level is reset and the “OK” button is selected, the reset character recognition level setting information is output.
文字認識レベルの設定情報は、出力画質に関するパラメータである。具体的には、文字認識レベルの再設定に応じ、画像処理部152は、画像データを出力画像(ラスタデータ)に変換する際の解像度等の出力画質を変更する(文字精度変更手段)。つまり、文字認識レベルとしての認識精度を元の認識精度より高く設定した場合にはこれに相応して高解像度の出力画像が生成され、認識精度を元の認識精度より低く設定した場合にはこれに相応して低解像度の出力画像が生成される。
The character recognition level setting information is a parameter relating to output image quality. Specifically, according to the resetting of the character recognition level, the
また、文字認識レベルの設定情報は、原稿の種類に応じて定めるようにしてもよい。例えば、スキャナデバイス14のプレスキャン機能等により、白黒文字の原稿、色文字原稿、イメージ混在など、原稿の種類を判別し、判別された原稿の種類に応じて出力画質(解像度)を設定し又は変更することもできる。
なお、解像度の他、画像サイズ、色変換などの画質に関する他のパラメータを文字認識レベルの設定情報として用いることもできる。
The character recognition level setting information may be determined according to the type of document. For example, by using the pre-scan function of the
In addition to the resolution, other parameters relating to image quality such as image size and color conversion can also be used as setting information for the character recognition level.
具体的な画像処理の流れは以下の通りである。
まず、PC20に付属するマウス等の操作を介して文字認識レベルの再設定を行った場合には、PC20が、再設定された文字認識レベルの設定情報を通信インターフェース11に送信し、通信インターフェース11は、この設定情報をデータ送受信部151に出力する。
他方、パネル13上のキー操作によって文字認識レベルの再設定を行った場合、パネル13が、再設定された文字認識レベルの設定情報を表示インターフェース12に出力し、表示インターフェース12が、この設定情報をデータ送受信部151に出力する。
次いで、データ送受信部151は、再設定に係る文字認識レベルの設定情報を画像処理部152に出力する。
The specific image processing flow is as follows.
First, when the character recognition level is reset through the operation of the mouse attached to the
On the other hand, when the character recognition level is reset by a key operation on the
Next, the data transmission /
画像処理部152は、再設定に係る文字認識レベルの設定情報にもとづき、原稿の画像データを出力画像に変換してOCR解析部153に出力する。
例えば、文字認識レベルの再設定において、元の解像度より高い解像度が設定された場合、新たに設定されたその解像度にもとづいて原稿のイメージデータをラスタデータに変換し、これをOCR解析部153に出力する。
なお、前述したii)における画像処理と同様、OCR解析部153は、出力画像からテキストデータを抽出し、フォントラスタライザ154がこれをラスタデータに変換することで文字列のプレビュー画像を生成し、画像処理部153が、テキストデータとともに、PC20又はパネル13に出力する。
The
For example, in the resetting of the character recognition level, when a resolution higher than the original resolution is set, the original image data is converted into raster data based on the newly set resolution, and this is converted to the
Similar to the image processing in ii) described above, the
iv)サーチャブルPDFの生成時における画像処理
図7は、本発明の一実施形態において、サーチャブルPDFの生成時における画像処理を説明するための説明図である。
図7に示すように、所定操作に応じ、PC20又はパネル13が、サーチャブルPDFのファイル作成の実行信号を出力する。この動作は、図5に示すプレビュー画面上に表示される「実行」キーを選択することにより実行される。
PC20を介してファイル作成の実行信号が出力されると、通信インターフェース11がこれをデータ送受信部151に出力する。他方、パネル13を介してファイル作成の実行信号が出力されると、表示インターフェース12がこれをデータ送受信部151に出力する。
データ送受信部151は、入力したファイル作成の実行信号を画像処理部152に出力する。
iv) Image processing when generating a searchable PDF FIG. 7 is an explanatory diagram for explaining image processing when generating a searchable PDF in one embodiment of the present invention.
As shown in FIG. 7, the
When a file creation execution signal is output via the
The data transmission /
ファイル作成の実行信号を入力した画像処理部152は、その時点において保持している原稿の出力画像をPDFデータに変換するとともに、その時点において保持しているテキストデータ(すなわち、直前に設定した文字認識レベルにもとづいてOCR解析部153が抽出したテキストデータ)とPDFデータとを結合することでサーチャブルPDFを生成する。サーチャブルPDFの生成に際しては、テキストデータを形成するテキストレイヤを非表示にしつつ、このテキストレイヤとPDFデータとを階層状に結合する。
The
ところで、PC20又はパネル13を介し、ユーザーが、テキストデータを修正する処理を介してサーチャブルPDFを生成することもできる。
この場合、ユーザーは、PC20のキーボード操作やパネル13のキー操作により、該当する文字の削除、加筆、変更を行う。そして、所定操作に応じ、PC20又はパネル13が、修正後のテキストデータとファイル作成の実行信号とをデータ送受信部151に出力する。
ファイル作成の実行信号を入力したデータ送受信部151は、この実行信号とともに入力した修正テキストデータを取り出す。そして、その時点において保持していた原稿の出力画像をPDFデータに変換するとともに、取り出した修正テキストデータとそのPDFデータとを結合することでサーチャブルPDFを生成する。
By the way, the searchable PDF can be generated by the user via the
In this case, the user deletes, adds, or changes the corresponding character by a keyboard operation of the
The data transmission /
次に、本発明の一実施形態に係る画像処理方法について図面を参照しながら説明する。
図8は、本発明の一実施形態に係る画像処理方法を示すフローチャートである。
図8に示すように、まず、MFP10は、サーチャブルPDFのファイル作成要求と原稿の画像データとを受信する(S1)。具体的には、PC20におけるユーザーの所定操作に応じ、サーチャブルPDFのファイル作成の要求信号と原稿の画像データとが出力され、通信インターフェース11を介しデータ送受信部151がこれを受信する。または、パネル13におけるユーザーの所定操作に応じ出力されたサーチャブルPDFのファイル作成の要求信号を、表示インターフェース12を介してデータ送受信部151が入力するとともに、スキャナデバイス14によって読み込まれた原稿の画像データをデータ送受信部151が入力する。
なお、データ送受信部151は、入力したファイル作成の要求信号と原稿の画像データを画像処理部152に出力する。
Next, an image processing method according to an embodiment of the present invention will be described with reference to the drawings.
FIG. 8 is a flowchart showing an image processing method according to an embodiment of the present invention.
As shown in FIG. 8, first, the
The data transmission /
ファイル作成の要求信号を入力した画像処理部152は、この要求信号とともに入力した原稿の画像データを所定の出力画質(所定解像度)に調整して出力画像(ラスタデータ)を作成する。また、この出力画像にもとづき、原稿のプレビュー画像を生成する(S2)。
画像処理部152は、生成した原稿の出力画像をOCR解析部153に出力する。
OCR解析部153は、原稿の出力画像からテキストデータを抽出し(S3)、これを画像処理部152に出力する。
また、画像処理部152は、フォントラスタライザ154を使用してテキストデータをラスタデータに変換し、文字列のプレビュー画像を生成する(S4)。
次いで、画像処理部152は、生成した原稿のプレビュー画像と文字列のプレビュー画像及びテキストデータをPC20又はパネル13に送る(S5)。なお、画像処理部152は、テキストデータを保持しておく。
The
The
The
Further, the
Next, the
つぎに、PC20又はパネル13は、受信(入力)した原稿のプレビュー画像と文字列のプレビュー画像を表示する(S6)。なお、このとき、認識文字数、言語、処理時間等の他の文字情報をプレビュー画像とともに表示するようにしてもよい。
これにより、ユーザーは、プレビュー画像を見て、OCR解析部153による文字抽出の精度を確認することができる。
ここで、文字認識レベルの再設定がされた場合(S7:YES)、画像処理部152は、この再設定された文字認識レベルの設定情報を取得し、この設定情報にもとづいて原稿の画像データをラスタデータに変換して出力画像を生成する(S8)。なお、生成された原稿の出力画像はOCR解析部153に出力され、再度ステップS3以降の処理を行う。
Next, the
Thus, the user can check the accuracy of character extraction by the
When the character recognition level is reset (S7: YES), the
他方、文字認識レベルの再設定がされなかった場合(S7:NO)、テキストデータが修正されたか否かを判定する(S9)。すなわち、ユーザーの手作業によりテキストデータが修正されたか否かを判断する。
テキストデータが修正された場合(S9:YES)、データ送受信部151は、PC20又はパネル13から修正テキストデータを受信(入力)し、画像処理部152に出力する(S10)。
そして、画像処理部152が、出力画像のPDFデータと修正テキストデータとを結合してサーチャブルPDFを生成する(S11)。
テキストデータが修正されなかった場合(S9:NO)、画像処理部152が、出力画像のPDFデータと保持しておいたテキストデータとを結合してサーチャブルPDFを生成する(S11)。
On the other hand, if the character recognition level has not been reset (S7: NO), it is determined whether the text data has been modified (S9). That is, it is determined whether or not the text data has been corrected manually by the user.
When the text data is corrected (S9: YES), the data transmitting / receiving
Then, the
If the text data has not been corrected (S9: NO), the
以上、本発明の実施形態に係るMFP10によれば、サーチャブルファイルの生成にあたり、ユーザーが文字認識レベル(出力画質)を変更してOCR処理を行わせることができるとともに、このOCR処理における文字抽出精度を確認することができる。
そして、このような再帰的なOCR処理を可能とすることで、精度の高いサーチャブルファイルを生成することができる。
As described above, according to the
By enabling such recursive OCR processing, it is possible to generate a searchable file with high accuracy.
また、OCR解析部153における文字情報の抽出精度と文字情報の抽出速度との割合を設定し得る調整バーを表示し、この調整バーの設定によって定まる割合にもとづいて変更された出力画質にもとづいてOCR処理を行うことができるようにしている。
このため、速度パフォーマンスとのバランスを保ちつつ一定の精度を有するサーチャブルPDFを生成することができる。
In addition, an adjustment bar that can set the ratio between the character information extraction accuracy and the character information extraction speed in the
For this reason, it is possible to generate a searchable PDF having a certain accuracy while maintaining a balance with the speed performance.
さらに、文字の修正を手作業で直接行うことも可能としているため、例えば、文書全体の修正を文字認識レベル(出力画質)の再設定により行い、微細な修正についてはユーザーがピンポイントで修正を行うなど、柔軟な対応が可能となる。 In addition, since it is also possible to manually correct characters, for example, the entire document is corrected by resetting the character recognition level (output image quality), and the user makes pinpoint corrections for fine corrections. Flexible response is possible.
以上、本発明の画像形成装置について、好ましい実施形態を示して説明したが、本発明にかかる画像形成装置は、上述した各実施形態に限定されるものではなく、本発明の範囲で種々の変更実施が可能であることは言うまでもない。
例えば、本発明の実施形態に係るMFP10においては、サーチャブルPDFを生成する例について説明したが、テキストデータとの組み合わせが有用な他のドキュメントデータを用いてサーチャブルファイルを生成してもよい。例えば、XPSデータとテキストデータとの組み合わせからなるサーチャブルXPSを生成することができる。
また、前記実施形態においては、MFP10でサーチャブルPDFを生成するようにしているが、PC20が必要な構成をすべて備え、PC20単体でサーチャブルPDFを生成する構成であっても良い。
The image forming apparatus of the present invention has been described with reference to the preferred embodiments. However, the image forming apparatus according to the present invention is not limited to the above-described embodiments, and various modifications can be made within the scope of the present invention. It goes without saying that implementation is possible.
For example, in the
In the above-described embodiment, the searchable PDF is generated by the
本発明は、複写機、プリンター、複合機などの画像形成装置に好適に用いることができる。 The present invention can be suitably used for an image forming apparatus such as a copying machine, a printer, or a multifunction machine.
10 MFP(画像形成装置)
13 パネル
14 スキャナデバイス
15 制御部
152 画像処理部
153 OCR解析部
154 フォントラスタライザ
20 PC(ホストコンピューター)
10 MFP (image forming apparatus)
13
Claims (5)
前記文字情報と前記対象画像の出力イメージを表示する表示手段と、
前記文字情報及び対象画像にもとづき、前記文字情報を検出可能な前記対象画像のファイルデータを生成するファイルデータ生成手段と、
入力操作に応じ対象画像の画質を変更する文字精度変更手段と、を備え、
前記表示手段が、変更された画質の前記対象画像から抽出した文字情報と前記対象画像の出力イメージを表示し、
前記ファイルデータ生成手段が、変更された画質の前記対象画像から抽出した文字情報及び前記対象画像にもとづき、前記ファイルデータを生成する
ことを特徴とする画像形成装置。 Character information extraction means for extracting character information from a target image of a predetermined image quality;
Display means for displaying the character information and an output image of the target image;
File data generating means for generating file data of the target image capable of detecting the character information based on the character information and the target image;
Character accuracy changing means for changing the image quality of the target image in response to an input operation,
The display means displays the character information extracted from the target image of the changed image quality and the output image of the target image;
The image forming apparatus, wherein the file data generation unit generates the file data based on the character information extracted from the target image having a changed image quality and the target image.
前記文字情報抽出手段が、
前記二値化された対象画像から文字情報を抽出する
請求項1記載の画像形成装置。 Output image generating means for binarizing the target image based on a predetermined image quality or a changed image quality;
The character information extraction means is
The image forming apparatus according to claim 1, wherein character information is extracted from the binarized target image.
前記文字精度変更手段が、前記操作部の設定によって定まる前記割合にもとづいて前記対象画像の画質を変更する請求項1又は2記載の画像形成装置。 An operation unit display unit for displaying an operation unit for setting a ratio between the character information extraction accuracy and the character information extraction speed in the character information extraction unit;
The image forming apparatus according to claim 1, wherein the character accuracy changing unit changes the image quality of the target image based on the ratio determined by the setting of the operation unit.
所定の画質の対象画像から文字情報を抽出する文字情報抽出手段、
前記文字情報と前記対象画像の出力イメージを表示する表示手段、
前記文字情報及び対象画像にもとづき、前記文字情報を検出可能な前記対象画像のファイルデータを生成するファイルデータ生成手段、及び
入力操作に応じ対象画像の画質を変更する文字精度変更手段、として機能させるとともに、
前記表示手段に、変更された画質の前記対象画像から抽出した文字情報と前記対象画像の出力イメージを表示させ、
前記ファイルデータ生成手段に、変更された画質の前記対象画像から抽出した文字情報及び前記対象画像にもとづき、前記ファイルデータを生成させるための画像形成プログラム。 The computer of the image forming device
Character information extraction means for extracting character information from a target image of a predetermined image quality;
Display means for displaying the character information and an output image of the target image;
Based on the character information and the target image, function as file data generation means for generating file data of the target image capable of detecting the character information, and character accuracy change means for changing the image quality of the target image in accordance with an input operation. With
The display means displays the character information extracted from the target image with the changed image quality and the output image of the target image,
An image forming program for causing the file data generation means to generate the file data based on the character information extracted from the target image having a changed image quality and the target image.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217169A JP2012073749A (en) | 2010-09-28 | 2010-09-28 | Image formation device and image formation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217169A JP2012073749A (en) | 2010-09-28 | 2010-09-28 | Image formation device and image formation program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012073749A true JP2012073749A (en) | 2012-04-12 |
Family
ID=46169869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010217169A Pending JP2012073749A (en) | 2010-09-28 | 2010-09-28 | Image formation device and image formation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012073749A (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013168590A1 (en) * | 2012-05-11 | 2013-11-14 | シャープ株式会社 | Image processing device, image forming device, and recording medium |
JP2015032017A (en) * | 2013-07-31 | 2015-02-16 | 京セラドキュメントソリューションズ株式会社 | Image forming apparatus |
JP2015225459A (en) * | 2014-05-27 | 2015-12-14 | 京セラドキュメントソリューションズ株式会社 | Image processor |
CN105407245A (en) * | 2014-09-08 | 2016-03-16 | 柯尼卡美能达株式会社 | Electronic Document Generation Apparatus, Recording Medium, And Electronic Document Generation System |
JP2016118909A (en) * | 2014-12-19 | 2016-06-30 | コニカミノルタ株式会社 | Character image processing system, control program thereof, information processing apparatus, and control program thereof |
US9398191B2 (en) | 2014-07-11 | 2016-07-19 | Konica Minolta, Inc. | Electronic document generation system, electronic document generation apparatus, and recording medium |
US9473669B2 (en) | 2014-07-11 | 2016-10-18 | Konica Minolta, Inc | Electronic document generation system, electronic document generation apparatus, and recording medium |
US9614984B2 (en) | 2014-04-16 | 2017-04-04 | Konica Minolta, Inc. | Electronic document generation system and recording medium |
JP2020102166A (en) * | 2018-12-25 | 2020-07-02 | キヤノン株式会社 | Image processing system, image processing method, program, image processing device, information processing device |
-
2010
- 2010-09-28 JP JP2010217169A patent/JP2012073749A/en active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013168590A1 (en) * | 2012-05-11 | 2013-11-14 | シャープ株式会社 | Image processing device, image forming device, and recording medium |
JP2015032017A (en) * | 2013-07-31 | 2015-02-16 | 京セラドキュメントソリューションズ株式会社 | Image forming apparatus |
US9614984B2 (en) | 2014-04-16 | 2017-04-04 | Konica Minolta, Inc. | Electronic document generation system and recording medium |
JP2015225459A (en) * | 2014-05-27 | 2015-12-14 | 京セラドキュメントソリューションズ株式会社 | Image processor |
US9449223B2 (en) | 2014-05-27 | 2016-09-20 | Kyocera Document Solutions Inc. | Image processing device and image forming apparatus |
US9398191B2 (en) | 2014-07-11 | 2016-07-19 | Konica Minolta, Inc. | Electronic document generation system, electronic document generation apparatus, and recording medium |
US9473669B2 (en) | 2014-07-11 | 2016-10-18 | Konica Minolta, Inc | Electronic document generation system, electronic document generation apparatus, and recording medium |
CN105407245A (en) * | 2014-09-08 | 2016-03-16 | 柯尼卡美能达株式会社 | Electronic Document Generation Apparatus, Recording Medium, And Electronic Document Generation System |
US9485368B2 (en) | 2014-09-08 | 2016-11-01 | Konica Minolta, Inc. | Electronic document generation apparatus, recording medium, and electronic document generation system |
JP2016118909A (en) * | 2014-12-19 | 2016-06-30 | コニカミノルタ株式会社 | Character image processing system, control program thereof, information processing apparatus, and control program thereof |
JP2020102166A (en) * | 2018-12-25 | 2020-07-02 | キヤノン株式会社 | Image processing system, image processing method, program, image processing device, information processing device |
JP7277128B2 (en) | 2018-12-25 | 2023-05-18 | キヤノン株式会社 | IMAGE PROCESSING SYSTEM, IMAGE PROCESSING METHOD, PROGRAM, IMAGE PROCESSING APPARATUS, INFORMATION PROCESSING APPARATUS |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012073749A (en) | Image formation device and image formation program | |
JP7034730B2 (en) | Devices, methods, and programs for setting information related to scanned images | |
US10528679B2 (en) | System and method for real time translation | |
JP7387339B2 (en) | Image processing system, image processing method, and program | |
US8314964B2 (en) | Image processing apparatus and image processing method | |
JP2009043262A (en) | Network device for intelligent electronic document content processing | |
US11144189B2 (en) | Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas | |
JP6762722B2 (en) | Information processing equipment, control methods, and programs | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
US20120140275A1 (en) | Scan management system, scan management apparatus, controlling method of scan management system, and recording medium | |
US20130070273A1 (en) | Image data processing system | |
CN112839141B (en) | Image processing system, image processing method, and storage medium | |
JP2009165088A (en) | Image processor | |
JP6801637B2 (en) | Image forming device | |
JP2020184276A (en) | Image processing device, image processing method, and program | |
JP2015227013A (en) | Printer, control method, and program | |
US20170201639A1 (en) | Image forming apparatus and recording medium | |
EP1441501A2 (en) | Image forming apparatus and image forming method for making image output setting easily | |
JP2021086188A (en) | Image processing system, image processing method, and program | |
JP2016096393A (en) | Information processing apparatus, system, information processing method, and program | |
US20100225980A1 (en) | Image processing device and system, and computer readable medium therefor | |
CN113870387A (en) | Data output system and method, image processing system and method | |
JP5071471B2 (en) | Image forming apparatus, image forming method, and control program for controlling image forming apparatus | |
JP2019134364A (en) | Device, method and program for setting information about scan image data | |
JP2013138370A (en) | Information processing system, control method therefor, and program, and information processing server, control method therefor, and program |