JP2012093895A - Image processing system, image processing method and image processing program - Google Patents

Image processing system, image processing method and image processing program Download PDF

Info

Publication number
JP2012093895A
JP2012093895A JP2010239704A JP2010239704A JP2012093895A JP 2012093895 A JP2012093895 A JP 2012093895A JP 2010239704 A JP2010239704 A JP 2010239704A JP 2010239704 A JP2010239704 A JP 2010239704A JP 2012093895 A JP2012093895 A JP 2012093895A
Authority
JP
Japan
Prior art keywords
image
character
character recognition
image processing
priority
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010239704A
Other languages
Japanese (ja)
Other versions
JP5672953B2 (en
Inventor
Osamu Ogawara
修 小河原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2010239704A priority Critical patent/JP5672953B2/en
Publication of JP2012093895A publication Critical patent/JP2012093895A/en
Application granted granted Critical
Publication of JP5672953B2 publication Critical patent/JP5672953B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve retrievability and editing performance by superimposing character information generated by recognizing characters contained in an image on an original image when rendering an electronic document retrievable and editable.SOLUTION: An image processing system 1 generating character information by recognizing characters displayed as an image comprises: an information acquisition section 141 for acquiring the image in which the characters are displayed; an OCR controller 142 for generating a plurality of character recognition results by causing a plurality of different OCR processing sections to recognize the characters displayed in the image and generate the character information; an OCR result priority order determination section 147 for determining a priority order of the plurality of character recognition results based on difference between each of the plurality of character recognition results; and a document generation section for superimposing character strings generated as the plurality of character recognition results on the image as a transparent layer according to the priority order thereof.

Description

本発明は、画像処理装置、画像処理方法及び画像処理プログラムに関し、特に、文字認識により生成された電子文書の利用性の向上に関する。   The present invention relates to an image processing apparatus, an image processing method, and an image processing program, and more particularly to improving the usability of an electronic document generated by character recognition.

近年、情報の電子化が推進される傾向にあり、電子化された情報の出力に用いられるプリンタやファクシミリ及び書類の電子化に用いるスキャナ等の画像処理装置は欠かせない機器となっている。このような画像処理装置は、撮像機能、画像形成機能及び通信機能等を備えることにより、プリンタ、ファクシミリ、スキャナ、複写機として利用可能なMFP(MultiFunction Peripheral:複合機)として構成されることが多い。   In recent years, there has been a tendency to digitize information, and image processing apparatuses such as printers and facsimiles used for outputting digitized information and scanners used for digitizing documents have become indispensable devices. Such an image processing apparatus is often configured as an MFP (Multi Function Peripheral) that can be used as a printer, a facsimile, a scanner, and a copier by providing an imaging function, an image forming function, a communication function, and the like. .

このような画像処理装置のうち、書類の電子化に用いるスキャナにおいては、読み取りによって生成された画像に含まれる文字を、OCR(Optical Character Recognition)により認識して文字情報を生成することにより、画像として電子化された文書内の情報の検索を可能とすることや、コピー&ペーストや修正等の編集を可能とすることが行われている。   Among such image processing apparatuses, in a scanner used for digitizing documents, characters included in an image generated by reading are recognized by OCR (Optical Character Recognition) to generate character information, thereby generating an image. As a result, it is possible to search for information in an electronic document and to edit such as copy and paste and correction.

このような電子文書は、書類の読み取りにより生成された画像情報と、上記OCR処理により生成された文字情報とで構成される。そして、OCR処理により生成された文字情報は、画像上において文字が認識された座標に対応する位置に配置される。更に、画像上に配置される文字情報は、ユーザによって直接視認されないよう、透明のレイヤとして付加される。   Such an electronic document includes image information generated by reading a document and character information generated by the OCR process. The character information generated by the OCR process is arranged at a position corresponding to the coordinates where the character is recognized on the image. Furthermore, the character information arranged on the image is added as a transparent layer so as not to be directly recognized by the user.

このような態様により生成された電子文書を、対応するビューア等で開いて文字列の検索を行うと、ユーザの視覚上、あたかも画像に含まれる文字が検索によって抽出されたように表示される。また、画像上の文字列を選択するようにユーザがマウス操作等を行うと、透明のレイヤとして付加された文字情報が選択されることにより、ユーザの視覚上は、画像に含まれる文字が選択されたように表示され、文字情報のコピー等が可能となる。   When an electronic document generated in such a manner is opened with a corresponding viewer or the like and a character string is searched for, it is displayed as if the characters included in the image are extracted by the search. When the user performs a mouse operation or the like so as to select a character string on the image, the character information added as a transparent layer is selected, so that the character included in the image is selected visually. The character information can be copied.

しかしながら、OCRにおいて100%の認識率を達成することは困難であるため、上記電子文書において、画像には含まれている文字列が文字情報として認識されておらず、検索によって抽出されない場合があり得る。また、文字が誤認識された結果、選択によりコピーした文字列が、画像として表示されている文字列とは異なる場合があり得る。   However, since it is difficult to achieve a recognition rate of 100% in OCR, a character string included in an image is not recognized as character information in the electronic document and may not be extracted by a search. obtain. In addition, as a result of erroneously recognizing characters, a character string copied by selection may be different from a character string displayed as an image.

このような課題は、日本語のように文字種類が多く、カタカナの“ロ”と漢字の“口”や、カタカナの“エ”と漢字の“工”等、似た形状の文字が多く存在する言語において特に顕著である。   There are many types of issues like Japanese, and there are many characters with similar shapes, such as Katakana “Ro” and Kanji “Mouth”, Katakana “E” and Kanji “Kou”. This is particularly noticeable in languages that do.

また、OCRによる文字認識の精度は、書類上のフォント種類やフォントサイズ等の文字種類及び日本語や英語等の言語種類と、OCRアルゴリズムとの相性に左右される。例えば、ある方式のOCRアルゴリズムでは、アルファベットの認識精度が高いが、仮名や漢字の認識精度が低く、ある方式のOCRアルゴリズムでは、仮名や漢字の認識精度が高く、アルファベットの認識精度が低いということがあり得る。   In addition, the accuracy of character recognition by OCR depends on the compatibility of the OCR algorithm with character types such as font type and font size on the document, and language types such as Japanese and English. For example, some methods of OCR algorithm have high alphabet recognition accuracy, but kana and kanji recognition accuracy is low. Some methods of OCR algorithm have high kana and kanji recognition accuracy and low alphabet recognition accuracy. There can be.

従って、文字種類や言語種類に応じてOCRアルゴリズムを選択することにより、認識精度を向上することが好ましいが、複数の言語種類や文字種類によって作成された書類の場合、ページごとや単語ごとにOCRアルゴリズムを選択することは困難であった。   Therefore, it is preferable to improve the recognition accuracy by selecting an OCR algorithm according to the character type or language type. However, in the case of a document created with a plurality of language types or character types, OCR is performed for each page or each word. It was difficult to choose an algorithm.

このようなOCRによる文字認識の精度を向上するため、複数のOCRアルゴリズムによりOCR処理を行い、複数のOCR認識結果のうちから最も確からしいものを1つ選択して認識結果とする方法が提案されている(例えば、特許文献1参照)。特許文献1に開示された技術においては、複数のOCR認識結果による多数決や言語処理による文字の補完により、複数のOCR認識結果のうちから最も確からしいものを1つ選択する。   In order to improve the accuracy of character recognition by such OCR, a method has been proposed in which OCR processing is performed using a plurality of OCR algorithms, and one of the most probable OCR recognition results is selected as a recognition result. (For example, refer to Patent Document 1). In the technique disclosed in Patent Document 1, one of the most probable OCR recognition results is selected from a plurality of OCR recognition results by a majority decision based on a plurality of OCR recognition results or by complementing characters by language processing.

特許文献1に開示された発明においては、複数のOCR認識結果から1つの結果を選択する際、書類の読み取りの都度、ユーザが手動で選択を行うのは現実的ではないため、上述したような多数決や言語処理により自動選択が採用されるが、正しい認識結果を選択することについて困難性がある。そのため、間違った認識結果が選択されてしまうこともあり、その場合、依然として課題は解決されない。   In the invention disclosed in Patent Document 1, when selecting one result from a plurality of OCR recognition results, it is not realistic for the user to manually select each time the document is read. Although automatic selection is adopted by majority vote or language processing, there is a difficulty in selecting a correct recognition result. Therefore, an incorrect recognition result may be selected, and in that case, the problem is still not solved.

また、複数の認識結果のうちから正しい認識結果を選択する際の精度を向上するためには高度な処理を実行する必要があるため、処理負荷が高く、処理時間が増大する。また、上述したように似た形状の文字が多く存在する言語において、文字の形状に基づいて文字を判別することが困難であるという課題も解決することができない。   In addition, in order to improve the accuracy when selecting a correct recognition result from among a plurality of recognition results, it is necessary to execute advanced processing, which increases processing load and processing time. Moreover, the problem that it is difficult to discriminate characters based on the shape of the character in a language where there are many characters with similar shapes as described above cannot be solved.

本発明は、このような課題を解決するためになされたものであり、画像に含まれる文字を認識して生成した文字情報を元の画像に重畳することにより、電子文書に検索可能性や編集可能性を持たせる場合において、検索性や編集性の向上を図ることを目的とする。   The present invention has been made to solve such problems, and by superimposing character information generated by recognizing characters included in an image on the original image, searchability and editing can be performed on an electronic document. The purpose is to improve searchability and editability when the possibility is given.

上記課題を解決するために、本発明の一態様は、画像として表示されている文字を認識して文字情報を生成する画像処理装置であって、文字が表示された画像を取得する画像取得部と、複数の異なる文字認識方式により前記取得された画像に表示されている文字を認識して文字情報を生成することにより、複数の文字認識結果を生成する文字認識部と、前記複数の文字認識結果夫々の差異に基づき、前記複数の文字認識結果の優先順位を決定する優先順位決定部と、前記複数の文字認識結果として生成された文字列を、前記決定された優先順位に従って前記取得された画像上に透明なレイヤとして重畳する画像重畳部とを含むことを特徴とする。   In order to solve the above-described problem, an aspect of the present invention is an image processing apparatus that recognizes characters displayed as an image and generates character information, and an image acquisition unit that acquires an image on which characters are displayed A character recognition unit that generates a plurality of character recognition results by recognizing characters displayed in the acquired image by a plurality of different character recognition methods and generating character information; and the plurality of character recognitions Based on the difference between the results, the priority determining unit that determines the priority of the plurality of character recognition results, and the character strings generated as the plurality of character recognition results are acquired according to the determined priority. And an image superimposing unit that superimposes as a transparent layer on the image.

また、本発明の他の態様は、画像として表示されている文字を認識して文字情報を生成する画像処理方法であって、文字が表示された画像を取得して記憶媒体に記憶し、複数の異なる文字認識方式により前記取得された画像に表示されている文字を認識して文字情報を生成して記憶媒体に記憶することにより、複数の文字認識結果を生成し、前記複数の文字認識結果夫々の差異に基づき、前記複数の文字認識結果の優先順位を決定して記憶媒体に記憶し、前記複数の文字認識結果として生成された文字列を、前記決定された優先順位に従って前記取得された画像上に透明なレイヤとして重畳して記憶媒体に記憶することを特徴とする。   According to another aspect of the present invention, there is provided an image processing method for recognizing a character displayed as an image and generating character information, acquiring the image on which the character is displayed, storing the image in a storage medium, A plurality of character recognition results are generated by recognizing characters displayed in the acquired image by different character recognition methods, generating character information, and storing the information in a storage medium. Based on each difference, the priority order of the plurality of character recognition results is determined and stored in a storage medium, and the character strings generated as the plurality of character recognition results are acquired according to the determined priority order. It is characterized by being superimposed on the image as a transparent layer and stored in a storage medium.

また、本発明の更に他の態様は、画像として表示されている文字を認識して文字情報を生成する画像処理プログラムであって、文字が表示された画像を取得して記憶媒体に記憶するステップと、複数の異なる文字認識方式により前記取得された画像に表示されている文字を認識して文字情報を生成して記憶媒体に記憶することにより、複数の文字認識結果を生成するステップと、前記複数の文字認識結果夫々の差異に基づき、前記複数の文字認識結果の優先順位を決定して記憶媒体に記憶するステップと、前記複数の文字認識結果として生成された文字列を、前記決定された優先順位に従って前記取得された画像上に透明なレイヤとして重畳して記憶媒体に記憶するステップとを情報処理装置に実行させることを特徴とする。   According to still another aspect of the present invention, there is provided an image processing program for recognizing a character displayed as an image to generate character information, and acquiring the image on which the character is displayed and storing the image in a storage medium Generating a plurality of character recognition results by recognizing characters displayed in the acquired image by a plurality of different character recognition methods and generating character information and storing the character information in a storage medium; and Determining a priority order of the plurality of character recognition results based on a difference between the plurality of character recognition results and storing the priority in the storage medium; and determining the character strings generated as the plurality of character recognition results. And causing the information processing apparatus to execute a step of superimposing a transparent layer on the acquired image according to a priority order and storing the layer on a storage medium.

本発明によれば、画像に含まれる文字を認識して生成した文字情報を元の画像に重畳することにより、電子文書に検索可能性や編集可能性を持たせる場合において、検索性や編集性の向上を図ることができる。   According to the present invention, searchability and editability can be obtained when the electronic document is made searchable and editable by superimposing character information generated by recognizing characters included in the image on the original image. Can be improved.

本発明の実施形態に係る画像形成装置のハードウェア構成を模式的に示すブロック図である。1 is a block diagram schematically illustrating a hardware configuration of an image forming apparatus according to an embodiment of the present invention. 本発明の実施形態に係る画像形成装置の機能構成を示すブロック図である。1 is a block diagram illustrating a functional configuration of an image forming apparatus according to an embodiment of the present invention. 本発明の実施形態に係る画像処理部の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the image process part which concerns on embodiment of this invention. 本発明の実施形態に係る画像処理部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the image process part which concerns on embodiment of this invention. 本発明の実施形態に係るOCRパラメータの入力画面を示す図である。It is a figure which shows the input screen of the OCR parameter which concerns on embodiment of this invention. 本発明の実施形態に係る画像処理部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the image process part which concerns on embodiment of this invention. 本発明の実施形態に係る優先度の調整態様を示す図である。It is a figure which shows the adjustment aspect of the priority which concerns on embodiment of this invention. 本発明の実施形態に係る文字列の重畳位置を示す図である。It is a figure which shows the superimposition position of the character string which concerns on embodiment of this invention. 本発明の実施形態に係る文字列の透明レイヤの重畳態様を示す図である。It is a figure which shows the superimposition aspect of the transparent layer of the character string which concerns on embodiment of this invention.

以下、図面を参照して、本発明の実施形態を詳細に説明する。本実施形態においては、スキャンにより読み取った書類の画像に含まれる文字を認識して文字情報を生成し、文字情報を透明のレイヤとして画像に重畳して電子文書を生成する画像処理装置を例として説明する。本実施形態に係る画像処理装置は、複数の文字認識方法により文字認識を実行して複数の文字認識結果を生成し、文字認識結果の内容に基づいて夫々の文字認識結果の優先順位を決定し、決定した優先順位の順に全ての文字認識結果を重畳する機能を特徴的な機能として含む。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the present embodiment, an image processing apparatus that recognizes characters included in an image of a document read by scanning and generates character information and superimposes the character information on the image as a transparent layer to generate an electronic document is taken as an example. explain. The image processing apparatus according to the present embodiment performs character recognition by using a plurality of character recognition methods, generates a plurality of character recognition results, and determines the priority order of each character recognition result based on the contents of the character recognition results. The function of superimposing all character recognition results in the order of the determined priorities is included as a characteristic function.

図1は、本実施形態に係る画像処理装置のハードウェア構成を示すブロック図である。本実施形態に係る画像処理装置1は、撮像機能、画像形成機能及び通信機能等を備えることにより、プリンタ、ファクシミリ、スキャナ、複写機として利用可能な複合機である。尚、画像処理装置1は、図1に示すハードウェア構成に加えて、スキャナ、プリンタ等を実現するためのエンジンを備える。   FIG. 1 is a block diagram illustrating a hardware configuration of the image processing apparatus according to the present embodiment. The image processing apparatus 1 according to the present embodiment is a multifunction machine that can be used as a printer, a facsimile machine, a scanner, and a copying machine by including an imaging function, an image forming function, a communication function, and the like. The image processing apparatus 1 includes an engine for realizing a scanner, a printer, and the like in addition to the hardware configuration shown in FIG.

図1に示すように、本実施形態に係る画像処理装置1は、一般的なサーバやPC等と同様の構成を含む。即ち、本実施形態に係る画像処理装置1は、CPU(Central Processing Unit)10、RAM(Random Access Memory)20、ROM(Read Only Memory)30、HDD(Hard Disk Drive)40及びI/F50がバス80を介して接続されている。また、I/F50にはLCD(Liquid Crystal Display)60及び操作部70が接続されている。   As shown in FIG. 1, the image processing apparatus 1 according to the present embodiment includes the same configuration as a general server, PC, or the like. That is, the image processing apparatus 1 according to this embodiment includes a CPU (Central Processing Unit) 10, a RAM (Random Access Memory) 20, a ROM (Read Only Memory) 30, an HDD (Hard Disk Drive) 40, and an I / F 50. 80 is connected. Further, an LCD (Liquid Crystal Display) 60 and an operation unit 70 are connected to the I / F 50.

CPU10は演算手段であり、画像処理装置1全体の動作を制御する。RAM20は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、CPU10が情報を処理する際の作業領域として用いられる。ROM30は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。HDD40は、情報の読み書きが可能な不揮発性の記憶媒体であり、OS(Operating System)や各種の制御プログラム、アプリケーション・プログラム等が格納される。   The CPU 10 is a calculation unit and controls the operation of the entire image processing apparatus 1. The RAM 20 is a volatile storage medium capable of reading and writing information at high speed, and is used as a work area when the CPU 10 processes information. The ROM 30 is a read-only nonvolatile storage medium and stores a program such as firmware. The HDD 40 is a non-volatile storage medium that can read and write information, and stores an OS (Operating System), various control programs, application programs, and the like.

I/F50は、バス80と各種のハードウェアやネットワーク等を接続し制御する。LCD60は、ユーザが画像処理装置1の状態を確認するための視覚的ユーザインタフェースである。操作部70は、キーボードやマウス等、ユーザが画像処理装置1に情報を入力するためのユーザインタフェースである。   The I / F 50 connects and controls the bus 80 and various hardware and networks. The LCD 60 is a visual user interface for the user to check the state of the image processing apparatus 1. The operation unit 70 is a user interface such as a keyboard and a mouse for the user to input information to the image processing apparatus 1.

このようなハードウェア構成において、ROM30やHDD40若しくは図示しない光学ディスク等の記憶媒体に格納されたプログラムがRAM20に読み出され、それらのプログラムに従ってCPU10が演算を行うことにより、ソフトウェア制御部が構成される。このようにして構成されたソフトウェア制御部と、ハードウェアとの組み合わせによって、本実施形態に係る画像処理装置1の機能を実現する機能ブロックが構成される。   In such a hardware configuration, a program stored in a storage medium such as the ROM 30, the HDD 40, or an optical disk (not shown) is read into the RAM 20, and the CPU 10 performs calculations according to these programs, thereby configuring a software control unit. The A functional block that realizes the functions of the image processing apparatus 1 according to the present embodiment is configured by a combination of the software control unit configured as described above and hardware.

次に、本実施形態に係る画像処理装置1の機能構成について、図2を参照して説明する。図2は、本実施形態に係る画像処理装置1の機能構成を示すブロック図である。図2に示すように、本実施形態に係る画像処理装置1は、コントローラ100、ADF(Auto Documennt Feeder:原稿自動搬送装置)101、スキャナユニット102、排紙トレイ103、ディスプレイパネル104、給紙テーブル105、プリントエンジン106、排紙トレイ107及びネットワークI/F108を有する。   Next, the functional configuration of the image processing apparatus 1 according to the present embodiment will be described with reference to FIG. FIG. 2 is a block diagram illustrating a functional configuration of the image processing apparatus 1 according to the present embodiment. As shown in FIG. 2, the image processing apparatus 1 according to the present embodiment includes a controller 100, an ADF (Auto Document Feeder) 101, a scanner unit 102, a paper discharge tray 103, a display panel 104, and a paper feed table. 105, a print engine 106, a paper discharge tray 107, and a network I / F 108.

また、コントローラ100は、主制御部111、エンジン制御部112、入出力制御部113、画像処理部114及び操作表示制御部115を含む。図2に示すように、本実施形態に係る画像処理装置1は、スキャナユニット102、プリントエンジン106を有する複合機として構成されている。尚、図2においては、電気的接続を実線の矢印で示しており、用紙若しくは文書束の流れを破線の矢印で示している。   The controller 100 includes a main control unit 111, an engine control unit 112, an input / output control unit 113, an image processing unit 114, and an operation display control unit 115. As shown in FIG. 2, the image processing apparatus 1 according to the present embodiment is configured as a multifunction machine having a scanner unit 102 and a print engine 106. In FIG. 2, the electrical connection is indicated by a solid arrow, and the flow of a sheet or a document bundle is indicated by a broken arrow.

ディスプレイパネル104は、画像処理装置1の状態を視覚的に表示する出力インタフェースであると共に、タッチパネルとしてユーザが画像処理装置1を直接操作し、若しくは画像処理装置1に対して情報を入力する際の入力インタフェース(操作部)でもある。ディスプレイパネル104は、図2に示すLCD60及び操作部70によって実現される。   The display panel 104 is an output interface that visually displays the state of the image processing apparatus 1, and when the user directly operates the image processing apparatus 1 as a touch panel or inputs information to the image processing apparatus 1. It is also an input interface (operation unit). The display panel 104 is realized by the LCD 60 and the operation unit 70 shown in FIG.

ネットワークI/F108は、画像処理装置1がネットワークを介して機器と通信するためのインタフェースであり、Ethernet(登録商標)やUSBインタフェースが用いられる。ネットワークI/F108は、図2に示すI/F50によって実現される。   The network I / F 108 is an interface for the image processing apparatus 1 to communicate with a device via a network, and an Ethernet (registered trademark) or a USB interface is used. The network I / F 108 is realized by the I / F 50 shown in FIG.

コントローラ100は、ソフトウェアとハードウェアとの組み合わせによって構成される。具体的には、ROM30や不揮発性メモリ並びにHDD40や光学ディスク等の不揮発性記憶媒体に格納されたプログラムが、RAM20等の揮発性メモリ(以下、メモリ)にロードされ、それらのプログラムに従ってCPU10が演算を行うことにより構成されるソフトウェア制御部と集積回路などのハードウェアとによってコントローラ100が構成される。コントローラ100は、画像処理装置1全体を制御する制御部として機能する。   The controller 100 is configured by a combination of software and hardware. Specifically, a program stored in a nonvolatile storage medium such as the ROM 30 and the nonvolatile memory as well as the HDD 40 and the optical disk is loaded into a volatile memory (hereinafter referred to as a memory) such as the RAM 20, and the CPU 10 performs an operation according to these programs. The controller 100 is configured by a software control unit configured by performing the above and hardware such as an integrated circuit. The controller 100 functions as a control unit that controls the entire image processing apparatus 1.

主制御部110は、コントローラ100に含まれる各部を制御する役割を担い、コントローラ100の各部に命令を与える。エンジン制御部120は、プリントエンジン106やスキャナユニット102等を制御若しくは駆動する駆動手段としての役割を担う。画像処理部130は、主制御部110の制御に従い、印刷出力すべき画像情報に基づいて描画情報を生成する。この描画情報とは、画像形成部であるプリントエンジン106が画像形成動作において形成すべき画像を描画するための情報である。   The main control unit 110 plays a role of controlling each unit included in the controller 100, and gives a command to each unit of the controller 100. The engine control unit 120 serves as a driving unit that controls or drives the print engine 106, the scanner unit 102, and the like. The image processing unit 130 generates drawing information based on image information to be printed out under the control of the main control unit 110. The drawing information is information for drawing an image to be formed in the image forming operation by the print engine 106 as an image forming unit.

また、画像処理部130は、スキャナユニット102から入力される撮像データを処理し、画像データを生成する。この画像データとは、スキャナ動作の結果物として画像処理装置1の記憶領域に格納される情報である。更に、画像処理部130は、本実施形態の要旨に係る機能として、上記生成した画像データにおいて画像として含まれる文字を認識し、文字情報を生成するOCR(Optical Charatcer Recognition)機能を含む。このOCR機能については後に詳述する。   The image processing unit 130 processes image data input from the scanner unit 102 to generate image data. The image data is information stored in the storage area of the image processing apparatus 1 as a result of the scanner operation. Furthermore, the image processing unit 130 includes an OCR (Optical Character Recognition) function for recognizing characters included as an image in the generated image data and generating character information as a function according to the gist of the present embodiment. This OCR function will be described in detail later.

操作表示制御部140は、ディスプレイパネル104に情報表示を行い若しくはディスプレイパネル104を介して入力された情報を主制御部110に通知する。入出力制御部150は、ネットワークI/F108を介して入力される情報を主制御部110に入力する。また、主制御部110は、入出力制御部150を制御し、ネットワークI/F108及びネットワークを介してクライアント端末2にアクセスする。   The operation display control unit 140 displays information on the display panel 104 or notifies the main control unit 110 of information input via the display panel 104. The input / output control unit 150 inputs information input via the network I / F 108 to the main control unit 110. The main control unit 110 controls the input / output control unit 150 to access the client terminal 2 via the network I / F 108 and the network.

画像処理装置1がプリンタとして動作する場合は、まず、入出力制御部150がネットワークI/F108を介して印刷ジョブを受信する。入出力制御部150は、受信した印刷ジョブを主制御部110に転送する。主制御部110は、印刷ジョブを受信すると、画像処理部130を制御して印刷ジョブに含まれる文書情報若しくは画像情報に基づいて描画情報を生成させる。   When the image processing apparatus 1 operates as a printer, first, the input / output control unit 150 receives a print job via the network I / F 108. The input / output control unit 150 transfers the received print job to the main control unit 110. When receiving the print job, the main control unit 110 controls the image processing unit 130 to generate drawing information based on document information or image information included in the print job.

画像処理部130は、描画情報を生成すると、生成した描画情報をHDD40や図示しない不揮発性メモリ等に記憶させる。エンジン制御部120は、上記記憶された描画情報を読み出してプリントエンジン106に入力し、給紙テーブル105から搬送される用紙に対して画像形成を実行させる。プリントエンジン106の具体的態様としては、インクジェット方式による画像形成機構や電子写真方式による画像形成機構等を用いることが可能である。プリントエンジン106によって画像形成が施された文書は排紙トレイ107に排紙される。   When the image processing unit 130 generates the drawing information, the image processing unit 130 stores the generated drawing information in the HDD 40, a non-illustrated nonvolatile memory, or the like. The engine control unit 120 reads out the stored drawing information and inputs it to the print engine 106 to cause the sheet to be conveyed from the sheet feeding table 105 to form an image. As a specific aspect of the print engine 106, an image forming mechanism using an ink jet method, an image forming mechanism using an electrophotographic method, or the like can be used. A document on which image formation has been performed by the print engine 106 is discharged to a discharge tray 107.

画像処理装置1がスキャナとして動作する場合は、ユーザによるディスプレイパネル104の操作若しくはネットワークI/F108を介して外部の機器から入力されるスキャン実行指示に応じて、操作表示制御部115若しくは入出力制御部113が主制御部111にスキャン実行信号を転送する。主制御部111は、受信したスキャン実行信号に基づき、エンジン制御部112を制御する。   When the image processing apparatus 1 operates as a scanner, the operation display control unit 115 or input / output control is performed according to a user operation on the display panel 104 or a scan execution instruction input from an external device via the network I / F 108. The unit 113 transfers a scan execution signal to the main control unit 111. The main control unit 111 controls the engine control unit 112 based on the received scan execution signal.

エンジン制御部112は、ADF101を駆動し、ADF101にセットされた撮像対象原稿をスキャナユニット102に搬送する。また、エンジン制御部112は、スキャナユニット102を駆動し、ADF101から搬送される原稿を撮像する。また、ADF101に原稿がセットされておらず、スキャナユニット102に直接原稿がセットされた場合、スキャナユニット102は、エンジン制御部112の制御に従い、セットされた原稿を撮像する。即ち、スキャナユニット102が撮像部として動作する。   The engine control unit 112 drives the ADF 101 and conveys the document to be imaged set on the ADF 101 to the scanner unit 102. In addition, the engine control unit 112 drives the scanner unit 102 and images a document conveyed from the ADF 101. If no original is set on the ADF 101 and the original is directly set on the scanner unit 102, the scanner unit 102 images the set original under the control of the engine control unit 112. That is, the scanner unit 102 operates as an imaging unit.

撮像動作においては、スキャナユニット102に含まれるCCD等の撮像素子が原稿を光学的に走査し、光学情報に基づいて生成された撮像情報が生成される。エンジン制御部112は、スキャナユニット102が生成した撮像情報を画像処理部114に転送する。画像処理部114は、主制御部111の制御に従い、エンジン制御部112から受信した撮像情報に基づき画像情報を生成する。画像処理部114が生成した画像情報はHDD40等の画像処理装置1に装着された記憶媒体に保存される。   In the imaging operation, an imaging element such as a CCD included in the scanner unit 102 optically scans the document, and imaging information generated based on the optical information is generated. The engine control unit 112 transfers the imaging information generated by the scanner unit 102 to the image processing unit 114. The image processing unit 114 generates image information based on the imaging information received from the engine control unit 112 according to the control of the main control unit 111. Image information generated by the image processing unit 114 is stored in a storage medium attached to the image processing apparatus 1 such as the HDD 40.

画像処理部114によって生成された画像情報は、ユーザの指示に応じてそのままHDD40等に格納され若しくは入出力制御部113及びネットワークI/F108を介して文書管理サーバ2等の外部の装置に送信される。また、画像処理装置1が複写機として動作する場合は、エンジン制御部112がスキャナユニット102から受信した撮像情報若しくは画像処理部114が生成した画像情報に基づき、画像処理部114が描画情報を生成する。その描画情報に基づいてプリンタ動作の場合と同様に、エンジン制御部112がプリントエンジン106を駆動する。   The image information generated by the image processing unit 114 is stored in the HDD 40 or the like as it is according to a user instruction or transmitted to an external device such as the document management server 2 via the input / output control unit 113 and the network I / F 108. The Further, when the image processing apparatus 1 operates as a copying machine, the image processing unit 114 generates drawing information based on imaging information received by the engine control unit 112 from the scanner unit 102 or image information generated by the image processing unit 114. To do. Based on the drawing information, the engine control unit 112 drives the print engine 106 as in the case of the printer operation.

このような画像処理装置1において、上述したように画像処理部114によるOCR機能が本実施形態に係る要旨の1つである。以下、本実施形態に係る画像処理部114のOCR機能について説明する。図3は、本実施形態に係る画像処理部114の機能のうち、OCRに関する機能の構成を示すブロック図である。   In such an image processing apparatus 1, as described above, the OCR function by the image processing unit 114 is one of the gist according to the present embodiment. Hereinafter, the OCR function of the image processing unit 114 according to the present embodiment will be described. FIG. 3 is a block diagram illustrating a configuration of functions related to OCR among the functions of the image processing unit 114 according to the present embodiment.

図3に示すように、本実施形態に係る画像処理部114は、情報取得部141、OCR制御部142、第一OCR処理部143、第二OCR処理部144、第三OCR処理部145、第四OCR処理部146、OCR結果順序判定部147、文書生成部148及び文書出力部149を含む。図3に示すように、本実施形態に係る画像処理部114は、夫々異なるアルゴリズムに従って文字認識を行う複数のOCR処理部を含み、夫々のOCR結果を全て画像に重畳することが特徴の1つである。   As shown in FIG. 3, the image processing unit 114 according to the present embodiment includes an information acquisition unit 141, an OCR control unit 142, a first OCR processing unit 143, a second OCR processing unit 144, a third OCR processing unit 145, It includes a four OCR processing unit 146, an OCR result order determination unit 147, a document generation unit 148, and a document output unit 149. As shown in FIG. 3, the image processing unit 114 according to the present embodiment includes a plurality of OCR processing units that perform character recognition according to different algorithms, and superimposes each OCR result on an image. It is.

情報取得部141は、スキャンの実行に応じて画像処理部114が生成した画像情報や、OCRを伴うスキャンの実行に際して、ユーザによってディスプレイパネル104を介して入力されたパラメータ等の情報を取得する。OCR制御部142は、ユーザによってディスプレイパネル104を介して入力されたパラメータに基づき、複数のOCD処理部によるOCR処理の実行を制御する。   The information acquisition unit 141 acquires image information generated by the image processing unit 114 according to the execution of the scan, and information such as parameters input by the user via the display panel 104 when executing the scan with OCR. The OCR control unit 142 controls execution of OCR processing by a plurality of OCD processing units based on parameters input by the user via the display panel 104.

第一OCR処理部143〜第四OCR処理部146は、夫々異なったOCRアルゴリズムにより文字認識を実行する。OCR結果順序判定部147は、第一OCR処理部143〜第四OCR処理部146によるOCR処理の結果に基づき、夫々の文字認識結果の優先順位を判定する。このOCR結果順序判定部147による処理が、本実施形態に係る要旨の1つである。   The first OCR processing unit 143 to the fourth OCR processing unit 146 perform character recognition using different OCR algorithms. The OCR result order determination unit 147 determines the priority order of each character recognition result based on the results of the OCR processing by the first OCR processing unit 143 to the fourth OCR processing unit 146. The processing by the OCR result order determination unit 147 is one of the gist according to the present embodiment.

文書生成部148は、OCR結果順序判定部147による判定結果に基づき、元の画像にOCRによって生成された文字情報の透明レイヤを重畳して電子文書を生成する。文書出力部149は、文書生成部148によって生成された電子文書を出力する。   Based on the determination result by the OCR result order determination unit 147, the document generation unit 148 generates an electronic document by superimposing a transparent layer of character information generated by OCR on the original image. The document output unit 149 outputs the electronic document generated by the document generation unit 148.

次に、本実施形態に係る画像処理装置1において、OCRを伴うスキャンが実行される場合の動作について、図4のフローチャートを参照して説明する。図4に示すように、OCRを伴うスキャンが実行される場合、まず、ユーザがディスプレイパネル104を介して、OCR処理についてのパラメータ等と共にスキャンの実行指示を入力する。これにより、操作表示制御部115、主制御部111を介して、画像処理部114の情報取得部141がOCRパラメータ等の操作情報を取得する(S401)。   Next, in the image processing apparatus 1 according to the present embodiment, an operation when scanning with OCR is executed will be described with reference to a flowchart of FIG. As shown in FIG. 4, when a scan with OCR is executed, first, the user inputs a scan execution instruction together with parameters and the like for OCR processing via the display panel 104. Thereby, the information acquisition unit 141 of the image processing unit 114 acquires operation information such as an OCR parameter via the operation display control unit 115 and the main control unit 111 (S401).

図5に、ユーザがOCR処理についてのパラメータを入力するための画面の例を示す。図5に示すように、OCRパラメータ入力画面において、ユーザは、OCRの回数を入力、若しくは選択すると共に、実行するOCR方式を選択し、選択したOCR方式の優先順位を入力する。これらの情報がディスプレイパネル104を介して操作表制御部115に入力され、主制御部114によって画像処理部114に入力される。   FIG. 5 shows an example of a screen for the user to input parameters for OCR processing. As shown in FIG. 5, on the OCR parameter input screen, the user inputs or selects the number of times of OCR, selects the OCR method to be executed, and inputs the priority order of the selected OCR method. These pieces of information are input to the operation table control unit 115 via the display panel 104 and input to the image processing unit 114 by the main control unit 114.

情報取得部141が操作情報を取得すると、OCR制御部142は、それらの情報に基づき、OCR回数、方式及び優先度を設定する(S402)。そして、スキャンの実行指示に応じてスキャンが実行され、画像処理部114に画像情報が入力されると、情報取得部141がその画像情報を取得する(S403)。即ち、S403において、情報取得部141が画像取得部として機能する。情報取得部141が画像情報を取得すると、OCR制御部142は、選択されたOCR方式に対応するOCR処理部に対してOCRパラメータを設定する(S404)と共に、そのOCR方式に応じてOCR対象の画像を加工して(S405)入力し、OCR処理を実行させる(S406)。ここでは、OCR制御部142及び第一OCR処理部143〜第四OCR処理部146が、文字認識部として機能する。   When the information acquisition unit 141 acquires operation information, the OCR control unit 142 sets the number of OCR, the method, and the priority based on the information (S402). When the scan is executed in accordance with the scan execution instruction and the image information is input to the image processing unit 114, the information acquisition unit 141 acquires the image information (S403). That is, in S403, the information acquisition unit 141 functions as an image acquisition unit. When the information acquisition unit 141 acquires image information, the OCR control unit 142 sets an OCR parameter for the OCR processing unit corresponding to the selected OCR method (S404), and the OCR target according to the OCR method is set. The image is processed (S405) and input, and OCR processing is executed (S406). Here, the OCR control unit 142 and the first OCR processing unit 143 to the fourth OCR processing unit 146 function as a character recognition unit.

OCR制御部142は、設定されたOCR回数分S404〜S406の処理を繰り返し(S407/NO)、設定されたOCR回数分、即ち、指定された全てのOCR方式についてOCR処理が完了すると(S407/YES)、OCR結果順序判定部147が、全てのOCR結果に基づいて夫々のOCR方式による文字認識結果の優先度を調整する(S408)。即ち、OCR結果順序判定部147が、優先順位決定部として機能する。   The OCR control unit 142 repeats the processing of S404 to S406 for the set number of times of OCR (S407 / NO), and when the OCR processing is completed for the set number of times of OCR, that is, for all the specified OCR methods (S407 / YES), the OCR result order determination unit 147 adjusts the priority of the character recognition result by each OCR method based on all the OCR results (S408). That is, the OCR result order determination unit 147 functions as a priority order determination unit.

ここで、S408の処理の詳細について、図6を参照して説明する。図6に示すように、OCR結果順序判定部147は、OCR結果の優先順位調整動作において、夫々のOCR処理部によって生成されたOCR処理結果から1つの処理結果を取得し(S601)、OCRによって認識された文字列の先頭から順に単語を1つ選択する(S602)。   Here, the details of the processing of S408 will be described with reference to FIG. As shown in FIG. 6, the OCR result order determination unit 147 acquires one processing result from the OCR processing result generated by each OCR processing unit in the priority order adjustment operation of the OCR result (S601). One word is selected in order from the top of the recognized character string (S602).

OCR結果順序判定部147は、全方式によるOCR結果について1つずつ単語を取得するまでS601、S602の処理を繰り返し(S603/NO)、全方式によるOCR結果について1つずつ単語を取得すると(S603/YES)、夫々の単語の文字列が一致するか否か判断する(S604)。S604の判断により、全単語の文字列が一致した場合(S604/YES)、その単語について1つのテキストレイヤを作成する(S605)。   The OCR result order determination unit 147 repeats the processing of S601 and S602 until it acquires words one by one for the OCR results by all methods (S603 / NO), and acquires one word at a time for the OCR results by all methods (S603). / YES), it is determined whether the character strings of the respective words match (S604). If the character strings of all the words match according to the determination in S604 (S604 / YES), one text layer is created for the word (S605).

他方、全単語の文字列が一致しなかった場合(S604/NO)、OCR結果順序判定部147は、異なる単語毎に優先順位を調整する(S609)。S609の処理について、図7(a)〜(c)を参照して説明する。図7(a)に示すように、4つのOCR方式夫々の文字認識結果が、“カエル”(全て片仮名)、“加二ノレ”(漢字の“加”、漢字の“二”に片仮名の“ノレ”)、“カエル”(全て片仮名)、“力工ル”(漢字の“力”、漢字の“工”に片仮名の“ル”)だった場合を考える。   On the other hand, when the character strings of all the words do not match (S604 / NO), the OCR result order determination unit 147 adjusts the priority for each different word (S609). The process of S609 will be described with reference to FIGS. As shown in FIG. 7A, the character recognition results of each of the four OCR methods are “frog” (all katakana), “kaji nore” (kanji “ka”, kanji “2”, katakana “ Nore ”),“ Frog ”(all Katakana),“ Rikoru ”(Kanji“ Power ”, Kanji“ Ku ”to Katakana“ Le ”).

図7(a)に示すように、文字認識の結果としては、図5に示す画面において入力されたOCR方式の優先順位に加えて、夫々のOCR方式が文字認識の結果の確かさを示す数値として出力した確度の情報が含まれる。即ち、夫々のOCR処理部が、文字認識結果の確かさを示す情報を文字認識結果と共に生成する。OCR結果順序判定部147は、図7(b)に示すように、夫々の認識結果について優先度を+若しくは−する。図7(b)の例においては、優先順位1と優先順位3の文字認識結果が同一であるため、OCR結果判定部147は、優先順位1と優先順位3の文字認識結果の優先度を+する。   As shown in FIG. 7A, as a result of character recognition, in addition to the priority of the OCR method input on the screen shown in FIG. 5, each OCR method indicates a numerical value indicating the certainty of the result of character recognition. Is included. That is, each OCR processing unit generates information indicating the certainty of the character recognition result together with the character recognition result. As shown in FIG. 7B, the OCR result order determination unit 147 increments the priority for each recognition result. In the example of FIG. 7B, since the character recognition results of priority order 1 and priority order 3 are the same, the OCR result determination unit 147 sets the priority of the character recognition results of priority order 1 and priority order 3 to + To do.

また、優先順位2の文字認識結果の確度が低いため、OCR結果順序判定部147は、優先順位2の文字認識結果の優先度を−する。図7(b)の例の他、例えば、4つの文字認識結果において文字列が異なる結果が1つである場合、その文字認識結果の優先度を−する態様が考えられる。   In addition, since the accuracy of the character recognition result of priority 2 is low, the OCR result order determination unit 147 decrements the priority of the character recognition result of priority 2. In addition to the example of FIG. 7B, for example, when there is one result of different character strings in four character recognition results, a mode in which the priority of the character recognition result is negative is conceivable.

図7(b)に示すように認識結果の優先度を調整すると、OCR結果順序判定部147は、図7(c)に示すように、優先順位1と優先順位3の文字認識結果が同一であるため、優先順位の高い方の文字認識結果を採用する。また、図7(c)に示すように、OCR結果順序判定部147は、S609による優先度の調整結果に基づき、優先順位を入れ替える。   When the priority of the recognition result is adjusted as shown in FIG. 7B, the OCR result order determination unit 147 has the same character recognition result of the priority order 1 and the priority order 3 as shown in FIG. 7C. Therefore, the character recognition result with the higher priority is adopted. Further, as illustrated in FIG. 7C, the OCR result order determination unit 147 switches the priority order based on the priority adjustment result in S <b> 609.

S609の処理により優先度を調整して優先順位を入れ替えると、OCR結果順序判定部147は、文字認識結果のうち異なる文字列毎にテキストレイヤを生成する(S610)。S610の処理において、OCR結果順序判定部147が生成するテキストレイヤは、図7(c)に示すようなテキストのレイヤであるが、その色は透明である。これにより、スキャンによって生成された画像の上にテキストレイヤを重畳する際、ユーザには通常の閲覧態様では見えないようにすることができる。   When the priority is adjusted by changing the priority in the process of S609, the OCR result order determining unit 147 generates a text layer for each different character string in the character recognition result (S610). In the processing of S610, the text layer generated by the OCR result order determination unit 147 is a text layer as shown in FIG. 7C, but its color is transparent. Thereby, when superimposing a text layer on the image produced | generated by the scan, it can hide from a user in a normal browsing mode.

S605またはS610の処理が完了すると、OCR結果順序判定部147は、夫々の文字認識結果の文字列が認識された位置、即ち画像情報の座標が同一か否か判断する(S606)。全ての文字列の位置が同一であった場合(S606/YES)、OCR結果順序判定部147は、その位置をテキストレイヤの位置として決定し、図8に示すように、各文字列の優先順位に従って第1レイヤ、第2レイヤ、第3レイヤの順にテキストレイヤを格納する(S607)。尚、S605の処理を経た場合、生成されたテキストレイヤは1つのみであるため、第1レイヤのみにテキストレイヤが格納される。   When the processing of S605 or S610 is completed, the OCR result order determination unit 147 determines whether or not the position where the character string of each character recognition result is recognized, that is, the coordinates of the image information are the same (S606). When the positions of all the character strings are the same (S606 / YES), the OCR result order determining unit 147 determines the position as the position of the text layer, and as shown in FIG. Then, the text layers are stored in the order of the first layer, the second layer, and the third layer (S607). Note that when the process of S605 is performed, only one text layer is generated, so the text layer is stored only in the first layer.

他方、全ての文字列の位置が同一ではなかった場合(S606/NO)、OCR結果順序判定部147は、最も優先順位の高い文字列の認識位置をテキストレイヤの位置として決定し、図8に示すように各文字列の優先順位に従って第1レイヤ、第2レイヤ、第3レイヤの順にテキストレイヤを格納する(S611)。   On the other hand, when the positions of all the character strings are not the same (S606 / NO), the OCR result order determination unit 147 determines the recognition position of the character string having the highest priority as the position of the text layer, and the result is shown in FIG. As shown, the text layers are stored in the order of the first layer, the second layer, and the third layer according to the priority order of each character string (S611).

OCR結果順序判定部147は、文字認識結果に含まれる全単語についてS601からの処理が完了するまで繰り返し(S608/NO)、文字認識結果に含まれる全単語についてS601からの処理が完了したら(S608/YES)、処理を終了する。このような処理により、本実施形態に係るOCR結果の順序調整処理が完了する。   The OCR result order determination unit 147 repeats the process from S601 for all the words included in the character recognition result (S608 / NO), and completes the process from S601 for all the words included in the character recognition result (S608). / YES), the process ends. By such processing, the OCR result order adjustment processing according to the present embodiment is completed.

図4のS408において、OCR結果順序調整処理が完了すると、OCR結果順序判定部147は、図6の処理により優先順位に応じてテキストレイヤを格納した夫々のレイヤを、スキャンにより生成された元の画像に重畳して電子文書を作成する(S409)。即ち、文書生成部148が、画像重畳部として機能する。画像処理部114は、S403からS409の処理を、読み取り対象としてセットされた全ての原稿について繰り返し(S410/NO)、全ての原稿についてS403〜S409の処理が完了したら(S410/YES)、生成した電子文書を出力して(S411)、処理を終了する。このような処理により、OCRを伴うスキャンが実行される場合における、画像処理部114の動作が完了する。   In S408 of FIG. 4, when the OCR result order adjustment process is completed, the OCR result order determination unit 147 stores each layer storing the text layers according to the priority in the process of FIG. An electronic document is created by superimposing it on the image (S409). That is, the document generation unit 148 functions as an image superimposing unit. The image processing unit 114 repeats the processes from S403 to S409 for all the originals set as reading targets (S410 / NO), and generates the process when the processes of S403 to S409 are completed for all the originals (S410 / YES). The electronic document is output (S411), and the process ends. By such processing, the operation of the image processing unit 114 in the case where scanning with OCR is executed is completed.

図9に、図4のS409の処理により生成された電子文書のレイヤ構造を示す。図9に示すように、本実施形態において生成された電子文書は、スキャンにより生成された元の画像の上に、図6の処理によって生成された夫々のレイヤが重畳されて構成されている。尚、図3において説明したように、本実施形態に係る画像処理部114は、夫々異なる方式によってOCRを実行する第一OCR処理部143〜第四OCR処理部146を含むため、最大で4つのレイヤが生成される可能性がある。従って、元の画像の上に重畳されるレイヤは、第1レイヤから第4レイヤまでの4つのレイヤである。   FIG. 9 shows the layer structure of the electronic document generated by the processing of S409 in FIG. As shown in FIG. 9, the electronic document generated in the present embodiment is configured by superimposing the respective layers generated by the process of FIG. 6 on the original image generated by scanning. As described with reference to FIG. 3, the image processing unit 114 according to the present embodiment includes the first OCR processing unit 143 to the fourth OCR processing unit 146 that perform OCR by different methods, and therefore, a maximum of four Layers can be generated. Therefore, the layers superimposed on the original image are four layers from the first layer to the fourth layer.

このように、本実施形態に係る画像処理部114は、スキャンに伴ってOCRを実行して電子文書を生成する際、異なる複数の方式によりOCRを実行し、夫々の実行結果における文字列が異なる場合、異なる文字列を全て保存して別レイヤで元の画像に重畳する。これにより、異なる複数の文字列が認識された場合に、元の画像に重畳するための文字列としていずれか1つを選択するための処理が不要となり、処理を低減することが出来る。   As described above, when the image processing unit 114 according to the present embodiment generates an electronic document by performing OCR in accordance with scanning, the character string in each execution result is different by executing OCR by using a plurality of different methods. In this case, all the different character strings are stored and superimposed on the original image in another layer. As a result, when a plurality of different character strings are recognized, a process for selecting any one of the character strings to be superimposed on the original image becomes unnecessary, and the process can be reduced.

また、元の画像に重畳するための文字列としていずれか1つを選択した場合、正確に認識された文字列ではなく、誤認識された文字列が選択されてしまう場合があり得る。そのような場合、ユーザが電子文書を閲覧用のアプリケーション等で閲覧して文字列を検索しても、本来抽出されるはずの文字列が抽出されないこととなる。これに対して、本実施形態の場合、正確認に認識された文字列も誤認識された文字列も、異なる認識結果を全て保持するため、上記課題を解決することができる。   In addition, when any one character string is selected as a character string to be superimposed on the original image, there may be a case where an erroneously recognized character string is selected instead of a correctly recognized character string. In such a case, even if the user browses the electronic document with a viewing application or the like and searches for the character string, the character string that should be extracted is not extracted. On the other hand, in the case of the present embodiment, the character string recognized for correct confirmation and the character string recognized erroneously all hold different recognition results, so that the above problem can be solved.

また、似た形状の文字が多く存在する言語において、文字の形状に基づいて文字を判別することが困難であるという場合においても、より多くの文字認識方式による認識結果を全て画像上に重畳することにより、正しい認識結果を得る確率を向上することができる。   Also, in a language where there are many similar-shaped characters, even if it is difficult to distinguish characters based on the character shape, all the recognition results by more character recognition methods are superimposed on the image. As a result, the probability of obtaining a correct recognition result can be improved.

他方、図9に示すように、認識結果として異なる文字列を異なるレイヤに格納した場合、正確に認識された文字列が下位のレイヤに格納されていると、ユーザが文字列をコピー&ペーストしたい場合に不都合が生じる。即ち、図9のようなレイヤ構造の場合、選択してコピーされる文字列は、通常の閲覧用アプリケーションでは、先頭のレイヤのみである。従って、正確に認識された文字列が下位のレイヤに格納されていると、正確に認識された文字列をコピーすることができない。   On the other hand, as shown in FIG. 9, when different character strings are stored in different layers as recognition results, the user wants to copy and paste the character strings when the accurately recognized character strings are stored in the lower layers. Inconvenience occurs in some cases. That is, in the case of the layer structure as shown in FIG. 9, the character string to be selected and copied is only the top layer in a normal browsing application. Therefore, if a correctly recognized character string is stored in a lower layer, the correctly recognized character string cannot be copied.

これに対して、本実施形態においては、OCR結果順序判定部147が、図6において説明したような処理により、夫々異なる文字認識結果の優先度を調整し、優先度の高い文字列を上位のレイヤに格納するため、誤認識された文字列が第1レイヤに、正確に認識された文字列が下位のレイヤに格納されるような状態を防ぎ、正確に認識された文字列がコピーされるようにすることができる。   In contrast, in the present embodiment, the OCR result order determination unit 147 adjusts the priority of different character recognition results by the process described in FIG. Since it is stored in the layer, a state in which a misrecognized character string is stored in the first layer and a correctly recognized character string is stored in a lower layer is prevented, and the accurately recognized character string is copied. Can be.

1 画像形成装置
10 CPU
20 RAM
30 ROM
40 HDD
50 I/F
60 LCD
70 操作部
80 バス
100 コントローラ
101 ADF
102 スキャナユニット
103 排紙トレイ
104 ディスプレイパネル
105 給紙テーブル
106 プリントエンジン
107 排紙トレイ
108 ネットワークI/F
110 主制御部
112 エンジン制御部
113 入出力制御部
114 画像処理部
115 操作表示制御部
141 情報取得部
142 OCR制御部
143 第一OCR処理部
144 第二OCR処理部
145 第三OCR処理部
146 第四OCR処理部
147 OCR結果順序判定部
148 文書生成部
149 文書出力部
1 Image forming apparatus 10 CPU
20 RAM
30 ROM
40 HDD
50 I / F
60 LCD
70 Operation unit 80 Bus 100 Controller 101 ADF
102 Scanner unit 103 Paper discharge tray 104 Display panel 105 Paper feed table 106 Print engine 107 Paper discharge tray 108 Network I / F
110 Main Control Unit 112 Engine Control Unit 113 Input / Output Control Unit 114 Image Processing Unit 115 Operation Display Control Unit 141 Information Acquisition Unit 142 OCR Control Unit 143 First OCR Processing Unit 144 Second OCR Processing Unit 145 Third OCR Processing Unit 146 First Four OCR processing unit 147 OCR result order determination unit 148 Document generation unit 149 Document output unit

特開2001−22883号公報JP 2001-22883 A

Claims (9)

画像として表示されている文字を認識して文字情報を生成する画像処理装置であって、
文字が表示された画像を取得する画像取得部と、
複数の異なる文字認識方式により前記取得された画像に表示されている文字を認識して文字情報を生成することにより、複数の文字認識結果を生成する文字認識部と、
前記複数の文字認識結果夫々の差異に基づき、前記複数の文字認識結果の優先順位を決定する優先順位決定部と、
前記複数の文字認識結果として生成された文字列を、前記決定された優先順位に従って前記取得された画像上に透明なレイヤとして重畳する画像重畳部とを含むことを特徴とする画像処理装置。
An image processing apparatus that recognizes characters displayed as an image and generates character information,
An image acquisition unit for acquiring an image on which characters are displayed;
A character recognition unit that generates a plurality of character recognition results by recognizing characters displayed in the acquired image by a plurality of different character recognition methods and generating character information;
A priority determining unit that determines the priority of the plurality of character recognition results based on the difference between the plurality of character recognition results;
An image processing apparatus comprising: an image superimposing unit that superimposes the character strings generated as the plurality of character recognition results as a transparent layer on the acquired image according to the determined priority order.
前記優先順位決定部は、同一の認識対象に基づいて前記複数の文字認識方式により夫々認識された複数の文字列を取得し、前記複数の文字列のうち異なる文字列毎に優先順位を決定することを特徴とする請求項1に記載の画像処理装置。   The priority order determination unit acquires a plurality of character strings recognized by the plurality of character recognition methods based on the same recognition target, and determines a priority order for each different character string among the plurality of character strings. The image processing apparatus according to claim 1. 前記優先順位決定部は、前記複数の文字列のうち、他に同一の文字列がある文字認識結果の優先度を上げることを特徴とする請求項2に記載の画像処理装置。   The image processing apparatus according to claim 2, wherein the priority order determination unit increases the priority of a character recognition result having another identical character string among the plurality of character strings. 前記優先順位決定部は、前記複数の文字列のうち、他に同一の文字列が無い文字認識結果の優先度を下げることを特徴とする請求項2または3に記載の画像処理装置。   The image processing apparatus according to claim 2, wherein the priority order determination unit lowers the priority of a character recognition result that has no other identical character string among the plurality of character strings. 前記画像重畳部は、同一の認識対象に基づく文字認識結果として生成された複数の文字列夫々の前記画像上における認識位置のうち、優先順位が最も高い文字列の前記画像上における認識位置に、前記複数の文字列を重畳することを特徴とする請求項1乃至4いずれかに記載の画像処理装置。   The image superimposing unit, at the recognition position on the image of the character string having the highest priority among the recognition positions on the image of each of a plurality of character strings generated as a character recognition result based on the same recognition target, The image processing apparatus according to claim 1, wherein the plurality of character strings are superimposed. 前記複数の異なる文字認識方式夫々の優先順位を指定する優先順位指定情報をユーザによる操作に応じて取得する操作情報取得部を更に含み、
前記優先順位決定部は、前記複数の文字認識結果夫々の差異に応じて前記取得された優先順位指定情報によって指定される優先順位を調整することにより、前記複数の文字認識結果の優先順位を決定することを特徴とする請求項1乃至5いずれかに記載の画像処理装置。
An operation information acquisition unit that acquires priority designation information that designates the priority of each of the plurality of different character recognition methods according to an operation by a user;
The priority determination unit determines the priority of the plurality of character recognition results by adjusting the priority specified by the acquired priority specification information according to the difference between the plurality of character recognition results. The image processing apparatus according to claim 1, wherein the image processing apparatus includes:
前記文字認識部は、前記文字認識結果の確かさを示す情報を前記文字認識結果と共に生成し、
前記優先順位決定部は、前記文字認識結果の確かさを示す情報に基づいて、前記文字認識結果の優先度を調整することを特徴とする請求項1乃至6いずれかに記載の画像処理装置。
The character recognition unit generates information indicating the certainty of the character recognition result together with the character recognition result,
The image processing apparatus according to claim 1, wherein the priority order determination unit adjusts the priority of the character recognition result based on information indicating the certainty of the character recognition result.
画像として表示されている文字を認識して文字情報を生成する画像処理方法であって、
文字が表示された画像を取得して記憶媒体に記憶し、
複数の異なる文字認識方式により前記取得された画像に表示されている文字を認識して文字情報を生成して記憶媒体に記憶することにより、複数の文字認識結果を生成し、
前記複数の文字認識結果夫々の差異に基づき、前記複数の文字認識結果の優先順位を決定して記憶媒体に記憶し、
前記複数の文字認識結果として生成された文字列を、前記決定された優先順位に従って前記取得された画像上に透明なレイヤとして重畳して記憶媒体に記憶することを特徴とする画像処理方法。
An image processing method for recognizing characters displayed as an image and generating character information,
Acquire an image displaying the characters and store it in the storage medium.
Recognizing characters displayed in the acquired image by a plurality of different character recognition methods to generate character information and storing it in a storage medium, thereby generating a plurality of character recognition results,
Based on the difference between each of the plurality of character recognition results, a priority order of the plurality of character recognition results is determined and stored in a storage medium;
An image processing method, wherein the character strings generated as the plurality of character recognition results are superimposed on the acquired image as a transparent layer according to the determined priority order and stored in a storage medium.
画像として表示されている文字を認識して文字情報を生成する画像処理プログラムであって、
文字が表示された画像を取得して記憶媒体に記憶するステップと、
複数の異なる文字認識方式により前記取得された画像に表示されている文字を認識して文字情報を生成して記憶媒体に記憶することにより、複数の文字認識結果を生成するステップと、
前記複数の文字認識結果夫々の差異に基づき、前記複数の文字認識結果の優先順位を決定して記憶媒体に記憶するステップと、
前記複数の文字認識結果として生成された文字列を、前記決定された優先順位に従って前記取得された画像上に透明なレイヤとして重畳して記憶媒体に記憶するステップとを情報処理装置に実行させることを特徴とする画像処理プログラム。
An image processing program for recognizing characters displayed as an image and generating character information,
Acquiring an image displaying characters and storing the image on a storage medium;
Generating a plurality of character recognition results by recognizing characters displayed in the acquired image by a plurality of different character recognition methods to generate character information and storing the character information in a storage medium;
Determining a priority order of the plurality of character recognition results based on the difference between the plurality of character recognition results, and storing them in a storage medium;
Causing the information processing apparatus to execute a step of superimposing the character strings generated as the plurality of character recognition results as a transparent layer on the acquired image in accordance with the determined priority order and storing them in a storage medium. An image processing program characterized by the above.
JP2010239704A 2010-10-26 2010-10-26 Image processing apparatus, image processing method, and image processing program Expired - Fee Related JP5672953B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010239704A JP5672953B2 (en) 2010-10-26 2010-10-26 Image processing apparatus, image processing method, and image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010239704A JP5672953B2 (en) 2010-10-26 2010-10-26 Image processing apparatus, image processing method, and image processing program

Publications (2)

Publication Number Publication Date
JP2012093895A true JP2012093895A (en) 2012-05-17
JP5672953B2 JP5672953B2 (en) 2015-02-18

Family

ID=46387164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010239704A Expired - Fee Related JP5672953B2 (en) 2010-10-26 2010-10-26 Image processing apparatus, image processing method, and image processing program

Country Status (1)

Country Link
JP (1) JP5672953B2 (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016066157A (en) * 2014-09-24 2016-04-28 富士ゼロックス株式会社 Information processing apparatus, information processing system, and program
US9357479B2 (en) 2013-09-10 2016-05-31 Ricoh Company, Ltd. Communication system, communication control system, communication apparatus, communication method, and connection program
US9892119B2 (en) 2013-08-09 2018-02-13 Ricoh Company, Ltd. Display system, display device, and recording medium
JP6474504B1 (en) * 2018-01-23 2019-02-27 株式会社野村総合研究所 Handwritten character recognition system
US10359842B2 (en) 2014-09-16 2019-07-23 Ricoh Company, Limited Information processing system and information processing method
CN112784825A (en) * 2019-11-01 2021-05-11 株式会社理光 Method for identifying characters in picture, method, device and equipment for searching keywords
CN113313114A (en) * 2021-06-11 2021-08-27 北京百度网讯科技有限公司 Certificate information acquisition method, device, equipment and storage medium
CN114938433A (en) * 2022-07-25 2022-08-23 四川赛狄信息技术股份公司 Video image processing method, system, terminal and medium based on FPGA
JP7404943B2 (en) 2020-03-10 2023-12-26 富士フイルムビジネスイノベーション株式会社 Information processing device and information processing program

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0221383A (en) * 1988-01-04 1990-01-24 Sumitomo Electric Ind Ltd Optical character reader
JPH07239914A (en) * 1994-02-28 1995-09-12 Nippon Steel Corp Character recognition device
JPH11282964A (en) * 1998-03-26 1999-10-15 Nec Corp Character recognition device, learning method and storage medium for recording character recognition program
JP2002259906A (en) * 2001-03-05 2002-09-13 Ricoh Co Ltd Pattern recognition method, device and program
JP2006031163A (en) * 2004-07-13 2006-02-02 Ricoh Co Ltd Character recognition result processor, character recognition result processing method, character recognition result processing program and recording medium with the same program stored
JP2009230671A (en) * 2008-03-25 2009-10-08 Sharp Corp Information processor, information processing method, information processing program, and computer readable recording medium with this program recorded thereon
JP2010211470A (en) * 2009-03-10 2010-09-24 Ricoh Co Ltd Document data generation device and document data generation method

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0221383A (en) * 1988-01-04 1990-01-24 Sumitomo Electric Ind Ltd Optical character reader
JPH07239914A (en) * 1994-02-28 1995-09-12 Nippon Steel Corp Character recognition device
JPH11282964A (en) * 1998-03-26 1999-10-15 Nec Corp Character recognition device, learning method and storage medium for recording character recognition program
JP2002259906A (en) * 2001-03-05 2002-09-13 Ricoh Co Ltd Pattern recognition method, device and program
JP2006031163A (en) * 2004-07-13 2006-02-02 Ricoh Co Ltd Character recognition result processor, character recognition result processing method, character recognition result processing program and recording medium with the same program stored
JP2009230671A (en) * 2008-03-25 2009-10-08 Sharp Corp Information processor, information processing method, information processing program, and computer readable recording medium with this program recorded thereon
JP2010211470A (en) * 2009-03-10 2010-09-24 Ricoh Co Ltd Document data generation device and document data generation method

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9892119B2 (en) 2013-08-09 2018-02-13 Ricoh Company, Ltd. Display system, display device, and recording medium
US9357479B2 (en) 2013-09-10 2016-05-31 Ricoh Company, Ltd. Communication system, communication control system, communication apparatus, communication method, and connection program
US10359842B2 (en) 2014-09-16 2019-07-23 Ricoh Company, Limited Information processing system and information processing method
JP2016066157A (en) * 2014-09-24 2016-04-28 富士ゼロックス株式会社 Information processing apparatus, information processing system, and program
JP6474504B1 (en) * 2018-01-23 2019-02-27 株式会社野村総合研究所 Handwritten character recognition system
JP2019128690A (en) * 2018-01-23 2019-08-01 株式会社野村総合研究所 Handwritten character recognition system
CN112784825A (en) * 2019-11-01 2021-05-11 株式会社理光 Method for identifying characters in picture, method, device and equipment for searching keywords
CN112784825B (en) * 2019-11-01 2024-04-30 株式会社理光 Method for identifying characters in picture, method, device and equipment for retrieving keywords
JP7404943B2 (en) 2020-03-10 2023-12-26 富士フイルムビジネスイノベーション株式会社 Information processing device and information processing program
CN113313114A (en) * 2021-06-11 2021-08-27 北京百度网讯科技有限公司 Certificate information acquisition method, device, equipment and storage medium
CN114938433A (en) * 2022-07-25 2022-08-23 四川赛狄信息技术股份公司 Video image processing method, system, terminal and medium based on FPGA

Also Published As

Publication number Publication date
JP5672953B2 (en) 2015-02-18

Similar Documents

Publication Publication Date Title
JP5672953B2 (en) Image processing apparatus, image processing method, and image processing program
US11386046B2 (en) Apparatus for setting file name for scan image, method of controlling same, and storage medium
US8839104B2 (en) Adjusting an image using a print preview of the image on an image forming apparatus
US11341733B2 (en) Method and system for training and using a neural network for image-processing
JP6427964B2 (en) Image processing system, information processing apparatus, and program
US9614984B2 (en) Electronic document generation system and recording medium
JP5594269B2 (en) File name creation device, image forming device, and file name creation program
US20190188267A1 (en) Image processing apparatus
US11245803B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
CN111580758B (en) Image forming apparatus having a plurality of image forming units
US9245318B2 (en) Methods and systems for automated orientation detection and correction
JP5939043B2 (en) Image processing apparatus control system, control program, and control method
JP2008236250A (en) Image processing apparatus, program, and image processing method
EP3648107A1 (en) Image processing apparatus
US20190188266A1 (en) Image processing apparatus
US10171688B2 (en) Management server to receive scanned images and align the scanned images based on page numbers included in the scanned images
JP2018056797A (en) Image processing device
JP2017224944A (en) Information processing apparatus, information processing method, information processing program, image processing apparatus, and information processing system
US20170346961A1 (en) Modified document generation
JP6119427B2 (en) Image processing apparatus, image reading apparatus, image processing apparatus control method, and image processing apparatus control program
US11849086B2 (en) Image processing apparatus capable of extracting portion of document image specified by preset index and subjecting character string in extracted portion to processing associated with index
JP5380521B2 (en) Operating device and image forming apparatus
JP2017094535A (en) Image formation device
JP6177758B2 (en) Image reading apparatus and image forming apparatus
JP2010165217A (en) Document information processor, document information processing method, control program, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130919

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140523

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140818

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20140818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141215

R151 Written notification of patent or utility model registration

Ref document number: 5672953

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees