JP6061806B2 - Image forming system - Google Patents

Image forming system Download PDF

Info

Publication number
JP6061806B2
JP6061806B2 JP2013159376A JP2013159376A JP6061806B2 JP 6061806 B2 JP6061806 B2 JP 6061806B2 JP 2013159376 A JP2013159376 A JP 2013159376A JP 2013159376 A JP2013159376 A JP 2013159376A JP 6061806 B2 JP6061806 B2 JP 6061806B2
Authority
JP
Japan
Prior art keywords
text data
user
original text
ocr
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013159376A
Other languages
Japanese (ja)
Other versions
JP2015032017A (en
Inventor
健一 桂
健一 桂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2013159376A priority Critical patent/JP6061806B2/en
Publication of JP2015032017A publication Critical patent/JP2015032017A/en
Application granted granted Critical
Publication of JP6061806B2 publication Critical patent/JP6061806B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Facsimiles In General (AREA)

Description

本発明は、光学文字認識(以下、「OCR(optical character recognition)」という)機能で読み取った画像をテキストデータに変換する画像形成装置に関する。   The present invention relates to an image forming apparatus that converts an image read by an optical character recognition (hereinafter referred to as “OCR (optical character recognition)”) function into text data.

最近の技術によれば、プリンター、多機能プリンター、多機能周辺装置、又は複合機などのMFP(Multifunction Peripheral)である画像形成装置は、紙の原稿をスキャナーで読込み、テキストデータに変換する機能を備えている。このように原稿を電子化することで、原稿の文章を流用して他の原稿を作成するときに容易に他の原稿を作成することができ、また、電子化された原稿は保管が容易である。しかし、スキャナーで読み込んだ原稿の書体によっては、OCR機能が文字や単語を正しく認識できないことがある。つまり、OCR機能による認識の精度(以下、「認識度」という)が100%ではないために、文字の誤認識が発生する。このため、OCR機能によって認識された原稿のテキストデータに対してユーザーが誤認識された文字や単語がないかを1つ1つ確認している。例えば、特許文献1のスキャナー装置では、原稿を読み取りデジタル化(以下、「スキャン」という)して得られた画像データをOCR機能により得られたテキストデータであるメタデータを生成し、スキャナー装置の表示部またはPC(パーソナルコンピュータ)に配信して表示させ、ユーザーがスキャナー装置またはPCでこのメタデータを校正することができるようにしている。しかし、同じ書体で作成された原稿などにおいては、OCR機能で誤認識される文字や単語は、何回も誤認識されることがある。このため、ユーザーは、テキストデータにおいて同じように誤認識された文字や単語を何回も手作業で正しい文字や単語に校正する作業を行わなければならない。この対策として、予め誤認識される可能性の高い文字や単語をリスト(以下、「OCR辞書」という)に登録し、OCR機能の認識度が低いと判定したときに、このOCR辞書を使用することで、OCR機能による誤認識率を低下させるようにしている。   According to recent technology, an image forming apparatus that is an MFP (Multifunction Peripheral) such as a printer, a multifunction printer, a multifunction peripheral device, or a multifunction peripheral has a function of reading a paper document with a scanner and converting it into text data. I have. By digitizing the original in this way, it is possible to easily create another original when diverting the text of the original to create another original, and the electronic original is easy to store. is there. However, depending on the typeface of the original read by the scanner, the OCR function may not recognize characters and words correctly. That is, since the accuracy of recognition by the OCR function (hereinafter referred to as “recognition degree”) is not 100%, erroneous recognition of characters occurs. For this reason, it is confirmed one by one whether there is any character or word that is erroneously recognized by the user in the text data of the document recognized by the OCR function. For example, the scanner device of Patent Document 1 generates metadata, which is text data obtained by an OCR function, from image data obtained by reading and digitizing an original (hereinafter referred to as “scan”). The metadata is distributed and displayed on a display unit or a PC (personal computer) so that the user can calibrate the metadata with the scanner device or the PC. However, in a document created with the same typeface, characters and words that are erroneously recognized by the OCR function may be erroneously recognized many times. For this reason, the user must manually calibrate characters and words that have been misrecognized in the text data as many times as possible manually. As a countermeasure, characters and words that are likely to be erroneously recognized are registered in a list (hereinafter referred to as “OCR dictionary”), and this OCR dictionary is used when it is determined that the recognition degree of the OCR function is low. Thus, the misrecognition rate by the OCR function is lowered.

特開2009−21861号公報JP 2009-216181

しかし、ユーザーは誤認識の可能性がある文字や単語をOCR辞書に登録しなければならないので手間がかかり、また校正した文字の登録漏れが発生するという問題があった。   However, there is a problem that the user has to register characters and words that may be erroneously recognized in the OCR dictionary, which is troublesome and that registration of corrected characters occurs.

本発明はこのような状況に鑑みてなされたものであり、上記課題を解決できる画像形成装置を提供することを目的とする。   The present invention has been made in view of such a situation, and an object thereof is to provide an image forming apparatus capable of solving the above-described problems.

本発明の画像形成システムは、OCR機能を有する画像形成装置と外部装置とがネットワークを介して接続された画像形成システムであって、前記画像形成装置は、原稿画像データから原稿テキストデータを作成するOCR処理と、前記原稿テキストデータの校正前原稿テキストデータ及び校正後原稿テキストデータにより、校正前及び校正後の文字または単語をOCR辞書保存テーブルに登録するOCR辞書登録処理部、ユーザー毎の前記OCR辞書保存テーブルと、ユーザー認証のためのユーザー名及びユーザーIDとを保存する記憶部と、を備え、前記画像形成装置は、(1)前記記憶部に保存されたユーザー名及びユーザーIDと、前記画像形成装置に入力されたユーザー名及びユーザーIDとに基づいてユーザー認証を行い、(2)前記ユーザー認証が正常である場合には、前記OCR処理部は、前記原稿画像データから文字または単語を取り出し、前記OCR機能を実行して認識度を算出し、(3)前記認識度が所定の閾値以上である場合には、前記OCR機能で認識された文字または単語を前記原稿テキストデータに保存し、(4)前記認識度が前記所定の閾値より低い場合には、前記ユーザー認証が正常であった前記ユーザー名に対応する前記OCR辞書保存テーブルに、前記認識度が前記所定の閾値より低い文字または単語が登録されているか否かを判断し、(5)登録されている場合には、校正前の文字または単語を校正後の文字または単語に置き換えて前記原稿テキストデータに保存し、(6)登録されていない場合には、前記OCR機能で認識された文字または単語を前記原稿テキストデータに保存し、(7)前記原稿テキストデータを、前記ネットワークを介して前記外部装置に送信し、前記外部装置により、前記原稿テキストデータが受信されると、前記OCR処理部により誤認識された文字または単語が正しい文字または単語に校正されることにより、校正前の文字または単語が装飾されて前記校正前原稿テキストデータに保存され、校正後の文字または単語が装飾されて前記校正後原稿テキストデータに保存され、さらに、ユーザー名及びユーザーID、前記OCR辞書保存テーブルに登録するためのデータであることを示すコマンドが先頭に付加された前記校正前原稿テキストデータ及び前記校正後原稿テキストデータが、前記ネットワークを介して前記画像形成装置に送信され、前記画像形成装置は、(1)前記記憶部に保存された前記ユーザー名及び前記ユーザーIDと、前記外部装置から受信した前記ユーザー名及び前記ユーザーIDとに基づいてユーザー認証を行い、(2)前記ユーザー認証が正常である場合には、前記外部装置から受信した前記校正前原稿テキストデータ及び前記校正後原稿テキストデータを保存し、(3)前記OCR辞書登録処理部により、前記校正前原稿テキストデータまたは前記校正後原稿テキストデータにおける装飾された文字または単語の位置をポインターに設定し、前記校正前原稿テキストデータまたは前記校正後原稿テキストデータにおけるポインターが示す文字または単語を取り出し、(4)取り出した前記文字または単語が、前記ユーザー認証が正常であった前記ユーザー名に対応するOCR辞書保存テーブルに登録されているか否かを判断し、(5)登録されていない場合には、前記ユーザー名に対応する前記OCR辞書保存テーブルに、前記校正前原稿テキストデータ及び前記校正後原稿テキストデータから取り出した文字または単語を登録することを特徴とする
また、前記装飾された文字または単語は、指定色に変更された文字または単語であることを特徴としている。
また、前記画像形成装置は、Webブラウザにより画面を表示し、前記画面に前記校正前原稿テキストデータのファイル名及び前記校正後原稿テキストデータのファイル名を設定することで、前記校正前原稿テキストデータ及び前記校正後原稿テキストデータを受信することを特徴としている。
The image forming system of the present invention is an image forming system in which an image forming apparatus having an OCR function and an external apparatus are connected via a network, and the image forming apparatus creates document text data from document image data. and OCR processing unit, the calibration before the original text data and proofread the original text data of the document text data, and OCR dictionary registration processing section for registering the characters or words after calibration before and calibrated OCR dictionary storage table, the user each of The OCR dictionary storage table, and a storage unit that stores a user name and user ID for user authentication. The image forming apparatus includes (1) a user name and a user ID stored in the storage unit, , Performing user authentication based on the user name and user ID input to the image forming apparatus, 2) When the user authentication is normal, the OCR processing unit extracts characters or words from the document image data, executes the OCR function to calculate a recognition degree, and (3) the recognition degree is If it is greater than or equal to a predetermined threshold, characters or words recognized by the OCR function are stored in the original text data. (4) If the recognition level is lower than the predetermined threshold, the user authentication is performed. It is determined whether or not a character or word whose recognition level is lower than the predetermined threshold is registered in the OCR dictionary storage table corresponding to the normal user name, and (5) when registered Replaces the character or word before proofreading with the character or word after proofreading and saves it in the original text data. (6) If not registered, recognized by the OCR function Characters or words are stored in the original text data, and (7) the original text data is transmitted to the external device via the network, and when the original text data is received by the external device, the OCR By correcting a character or word erroneously recognized by the processing unit to a correct character or word, the character or word before proofreading is decorated and stored in the original text data before proofreading, and the character or word after proofreading is decorated. And stored in the proofread original text data, and further includes the user name and user ID, the pre-proofread original text data to which a command indicating that the data is to be registered in the OCR dictionary storage table is added, and The proofread original text data is transmitted to the image forming apparatus via the network, The image forming apparatus performs user authentication based on (1) the user name and the user ID stored in the storage unit, and the user name and the user ID received from the external apparatus, and (2) If the user authentication is normal, the pre-calibration original text data and the post-correction original text data received from the external device are stored, and (3) the pre-calibration original text is stored by the OCR dictionary registration processing unit. The position of the decorated character or word in the data or the proofread original text data is set as a pointer, and the character or word indicated by the pointer in the pre-proofread original text data or the proofread original text data is extracted, (4) The letter or word is the user whose user authentication was normal (5) if not registered, the OCR dictionary storage table corresponding to the user name stores the pre-proofread original text data and the and features that you register a character or word taken out from the calibration after the manuscript text data.
Also, characters or words that the decorated is characterized characters or words der Rukoto that changed designated color.
Further, the image forming apparatus, W eb displays a screen by the browser, by setting the file name and the file name of the proofread manuscript text data of the calibration before the original text data on the screen, the calibration before the original text Data and the proofread original text data are received.

本発明の画像形成装置は、OCR機能により誤認識された文字や単語をユーザーがPCで校正すると、OCR機能が誤認識する可能性のある文字や単語を容易に漏れなくOCR辞書に登録され、誤認識された文字や単語をOCR機能が正しい文字や単語に置き換えることで、ユーザーが校正する時間を短縮できる。   In the image forming apparatus of the present invention, when a user calibrates a character or a word that is misrecognized by the OCR function with a PC, the character or word that may be misrecognized by the OCR function is easily registered in the OCR dictionary without omission, By replacing the erroneously recognized characters and words with the correct characters and words by the OCR function, it is possible to shorten the time for the user to proofread.

本発明の実施形態に係るOCR辞書登録手順の概要を示す図である。It is a figure which shows the outline | summary of the OCR dictionary registration procedure which concerns on embodiment of this invention. 本発明の実施形態に係る画像形成装置及びPCの機能構成を示す図である。1 is a diagram illustrating a functional configuration of an image forming apparatus and a PC according to an embodiment of the present invention. 図2に示すOCR辞書保存テーブルの構成図である。FIG. 3 is a configuration diagram of an OCR dictionary storage table shown in FIG. 2. 本発明の実施形態に係るOCR処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the OCR process which concerns on embodiment of this invention. 本発明の実施形態に係るOCR辞書登録処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the OCR dictionary registration process which concerns on embodiment of this invention.

以下、本発明を実施するための形態(以下、「実施形態」という)を、図面を参照して説明する。本発明の画像形成装置においては、文字または単語の両方をOCR機能で認識することが可能であるが、実施形態では文字を例に説明する。   Hereinafter, modes for carrying out the present invention (hereinafter referred to as “embodiments”) will be described with reference to the drawings. In the image forming apparatus of the present invention, it is possible to recognize both characters and words with the OCR function.

最初に、OCR辞書登録手順の概要について、図1を用いて説明する。以下、図1(a)に示すOCR辞書登録手順の(1)から(5)の順で説明する。   First, an outline of the OCR dictionary registration procedure will be described with reference to FIG. Hereinafter, the OCR dictionary registration procedure shown in FIG. 1A will be described in the order of (1) to (5).

まず、(1)では、ユーザーが画像形成装置100の原稿台に原稿をセットし、操作パネルからスキャン要求を行い、「ユーザー名」と「ユーザーID」を入力すると、スキャナーにより原稿がスキャンされる。画像形成装置100は、「ユーザー名」と「ユーザーID」によりユーザー認証を行い、ユーザー認証が正常に行われたときに、OCR機能により認識された文字に変換された原稿テキストデータが作成される。OCR機能は、図1(b)に示すように文字の認識度が予め決められた所定の閾値より低いかを判定し、この所定の閾値より低いときに、ユーザー名に対応するOCR辞書を取り出し、認識度の低い文字をOCR辞書で検索し、OCR機能が認識度の低い文字をOCR辞書に登録されている正しい文字に置き換える。   First, in (1), when a user sets a document on the document table of the image forming apparatus 100, makes a scan request from the operation panel, and inputs "user name" and "user ID", the document is scanned by the scanner. . The image forming apparatus 100 performs user authentication using “user name” and “user ID”, and when the user authentication is normally performed, original text data converted into characters recognized by the OCR function is created. . As shown in FIG. 1B, the OCR function determines whether the character recognition level is lower than a predetermined threshold value, and when it is lower than the predetermined threshold value, the OCR dictionary corresponding to the user name is extracted. The character with low recognition degree is searched in the OCR dictionary, and the OCR function replaces the character with low recognition degree with the correct character registered in the OCR dictionary.

次いで、(2)では、画像形成装置100からPC200に原稿テキストデータを送信する。   Next, in (2), document text data is transmitted from the image forming apparatus 100 to the PC 200.

次いで、(3)では、PC200が画像形成装置100から原稿テキストデータを受信すると、PC200の表示部に表示する。ユーザーが表示された原稿テキストデータの文字を確認し、誤認識された文字を正しい文字に校正する。このときに、ユーザーは、原稿テキストデータの誤認識された文字を予め決められた色(以下、「指定色」という)に変更した校正前原稿テキストデータと、正しく校正された文字を指定色に変更した校正後原稿テキストデータを作成する。   Next, in (3), when the PC 200 receives the document text data from the image forming apparatus 100, it is displayed on the display unit of the PC 200. The user confirms the characters in the displayed manuscript text data, and corrects the misrecognized characters to the correct characters. At this time, the user changes the unrecognized character text data in the manuscript text data to a predetermined color (hereinafter referred to as “designated color”) and the calibrated character text as the designated color. Create post-proof proof manuscript text data.

次いで、(4)では、PC200は、「ユーザー名」と「ユーザーID」、及び校正前原稿テキストデータと校正後原稿テキストデータを画像形成装置100に送信する。画像形成装置100は、「ユーザー名」と「ユーザーID」、及び校正前原稿テキストデータと校正後原稿テキストデータを受信すると、「ユーザー名」と「ユーザーID」によりユーザー認証を行う。ユーザー認証が正常に行われたときに、校正前原稿テキストデータと校正後原稿テキストデータによりOCR辞書を登録する処理を行う。なお、PC200が校正前原稿テキストデータと校正後原稿テキストデータを画像形成装置100に送信するときには、例えば、図1(c)に示すように、画像形成装置100が提供するWebブラウザによりOCR辞書更新画面をPC200に表示し、「校正前原稿テキストデータのファイル名」のエリアに校正前原稿テキストデータに付けられているファイル名、「校正後原稿テキストデータのファイル名」のエリアに校正後原稿テキストデータに付けられているファイル名を設定する。この設定により、Webブラウザにより画像形成装置100は、校正前原稿テキストデータと校正後原稿テキストデータを受信する。   Next, in (4), the PC 200 transmits “user name” and “user ID”, pre-proofread original text data, and post-proofread original text data to the image forming apparatus 100. When the image forming apparatus 100 receives the “user name” and “user ID”, the original text data before proofreading, and the original text data after proofreading, the image forming apparatus 100 performs user authentication using the “user name” and “user ID”. When the user authentication is normally performed, a process of registering the OCR dictionary with the pre-proofread original text data and the post-proofread original text data is performed. When the PC 200 transmits the original text data before calibration and the original text data after calibration to the image forming apparatus 100, for example, as shown in FIG. 1C, the OCR dictionary is updated by a Web browser provided by the image forming apparatus 100. The screen is displayed on the PC 200, the file name attached to the pre-proofread original text data file in the “file name of pre-proofread original text data” area, and the post-proofread original text in the “file name of post-proofread original text data” area. Set the file name attached to the data. With this setting, the image forming apparatus 100 receives the pre-proofread original text data and the post-proofread original text data by the Web browser.

次いで、(5)では、画像形成装置100は、PC200から受信した校正前原稿テキストデータから指定色の誤認識された文字を取り出し、校正後原稿テキストデータからユーザーが校正した指定色の文字を取り出すと、OCR辞書に登録する。   Next, in (5), the image forming apparatus 100 takes out characters with erroneously recognized colors designated from the pre-calibration original text data received from the PC 200, and takes out characters of designated colors calibrated by the user from the original text data after proofreading. And registered in the OCR dictionary.

次に、実施形態における画像形成装置100及びPC200の機能構成について、図2を用いて説明する。   Next, functional configurations of the image forming apparatus 100 and the PC 200 in the embodiment will be described with reference to FIG.

まず、画像形成装置100の機能構成について説明する。図2に示すように画像形成装置100は、制御部101、補助記憶部102、記憶部103、操作パネル104、操作パネル処理部105、スキャナー部106、画像処理部107、画像印刷部108、及びネットワーク通信部109を備えている。これらの各部は、バスなどにより接続される構成となっている。また、制御部101には、OCR処理部101aとOCR辞書登録処理部101bを備えている。補助記憶部102には、校正前原稿テキストデータ保存エリア102aと校正後原稿テキストデータ保存エリア102bを備えている。記憶部103にはOCR辞書保存テーブル103aとユーザー認証データ保存エリア103bを備えている。   First, the functional configuration of the image forming apparatus 100 will be described. As shown in FIG. 2, the image forming apparatus 100 includes a control unit 101, an auxiliary storage unit 102, a storage unit 103, an operation panel 104, an operation panel processing unit 105, a scanner unit 106, an image processing unit 107, an image printing unit 108, and A network communication unit 109 is provided. Each of these units is connected by a bus or the like. The control unit 101 includes an OCR processing unit 101a and an OCR dictionary registration processing unit 101b. The auxiliary storage unit 102 includes a pre-calibration original text data storage area 102a and a post-calibration original text data storage area 102b. The storage unit 103 includes an OCR dictionary storage table 103a and a user authentication data storage area 103b.

制御部101は、RAMやROM等の主記憶手段、及びMPU(Micro Processing Unit)やCPU(Central Processing Unit)等の制御手段を備えている。また、制御部101は、各種I/Oや、USB(ユニバーサル・シリアル・バス)等のインターフェース、バスコントローラ等を含む総合的な画像形成装置100のコントロールを行う。制御部101には、OCR機能により文字を認識するOCR処理部101aと、OCR辞書に文字を登録するOCR辞書登録処理部101bが設けられている。OCR処理部101aとOCR辞書登録処理部101bの詳細については、後述する。   The control unit 101 includes main storage means such as RAM and ROM, and control means such as MPU (Micro Processing Unit) and CPU (Central Processing Unit). The control unit 101 controls the overall image forming apparatus 100 including various I / Os, interfaces such as USB (Universal Serial Bus), a bus controller, and the like. The control unit 101 is provided with an OCR processing unit 101a that recognizes characters by the OCR function and an OCR dictionary registration processing unit 101b that registers characters in the OCR dictionary. Details of the OCR processing unit 101a and the OCR dictionary registration processing unit 101b will be described later.

補助記憶部102は、制御部101が実行する処理のプログラムやデータが記憶されるフラッシュメモリである。校正前原稿テキストデータ保存エリア102aは、PC200から受信する校正前テキストデータを一時的に保存する。校正後原稿テキストデータ保存エリア102bは、PC200から受信する校正後テキストデータを一時的に保存する。   The auxiliary storage unit 102 is a flash memory in which programs and data for processing executed by the control unit 101 are stored. The pre-proofread original text data storage area 102a temporarily stores pre-proofread text data received from the PC 200. The proofread original text data storage area 102b temporarily stores the proofread text data received from the PC 200.

記憶部103は、データやプログラムを保存するハードディスクドライブである。OCR辞書保存テーブル103aは、OCR辞書登録処理部101bにより登録されるユーザー毎のOCR辞書を保存する。OCR辞書保存テーブル103aの詳細な構成については、後述する。ユーザー認証データ保存エリア103bは、ユーザー認証を行うときに使用する「ユーザー名」と「ユーザーID」を保存する。   The storage unit 103 is a hard disk drive that stores data and programs. The OCR dictionary storage table 103a stores an OCR dictionary for each user registered by the OCR dictionary registration processing unit 101b. The detailed configuration of the OCR dictionary storage table 103a will be described later. The user authentication data storage area 103b stores “user name” and “user ID” used when performing user authentication.

操作パネル104は、ユーザーによる操作や設定を受け付ける。また、操作パネル104には、画像形成装置100が備えている機能の操作項目の画面、ユーザーに通知する警告メッセージやエラーメッセージを表示することができる。   The operation panel 104 accepts user operations and settings. In addition, the operation panel 104 can display a screen of operation items of functions provided in the image forming apparatus 100, a warning message and an error message to be notified to the user.

操作パネル処理部105は、画像形成装置100が備えている機能の操作項目の画面を操作パネル104に表示する処理、操作パネル104から入力されるユーザーの操作や設定を入力する処理、及び画像形成装置100の状態をユーザーに知らせるための警告メッセージやエラーメッセージを操作パネル104に表示する処理を行う。   The operation panel processing unit 105 displays a screen of operation items of functions provided in the image forming apparatus 100 on the operation panel 104, processes for inputting user operations and settings input from the operation panel 104, and image formation Processing for displaying a warning message or an error message on the operation panel 104 to inform the user of the state of the apparatus 100 is performed.

スキャナー部106は、画像形成装置100の原稿台にセットされた原稿のスキャンを行うことで原稿をデジタル化するもので、ユーザーが操作パネル104からスキャン要求を行うと、スキャナー部106は原稿をスキャンし、スキャンした原稿データを画像処理部107に出力する。   The scanner unit 106 digitizes a document by scanning the document set on the document table of the image forming apparatus 100. When the user makes a scan request from the operation panel 104, the scanner unit 106 scans the document. Then, the scanned document data is output to the image processing unit 107.

画像形成部107は、スキャナー部106から原稿データを入力すると原稿データの画質、解像度、サイズ、回転方向、及び色などの調整を行い、原稿データの文字情報からビットマップグラフィクス(ラスター形式のデータ)に変換して画像化(ラスタライズ)した原稿画像データを作成し、制御部101に出力する。   When the document data is input from the scanner unit 106, the image forming unit 107 adjusts image quality, resolution, size, rotation direction, color, and the like of the document data, and bitmap graphics (raster format data) from character information of the document data. Document image data converted into an image (rasterized) is created and output to the control unit 101.

画像印刷部108は、ユーザーからの印刷要求により、スキャナー部106によりスキャンされた原稿の原稿データ、または画像形成装置100が保存している校正前原稿テキストデータ、校正後原稿テキストデータなどをコピー用紙に印刷する。   The image printing unit 108 copies original document data scanned by the scanner unit 106 according to a print request from the user, or pre-calibration original text data and post-calibration original text data stored in the image forming apparatus 100. Print on.

ネットワーク通信部109は、ネットワーク300に接続するための着脱可能なLANインターフェースを備えている。LANインターフェースには、TCP/IP、AppleTalk、SMB等の各種ネットワークプロトコルのインテリジェントな送受信を行うネットワーク部を含んでいる。   The network communication unit 109 includes a detachable LAN interface for connecting to the network 300. The LAN interface includes a network unit that performs intelligent transmission and reception of various network protocols such as TCP / IP, AppleTalk, and SMB.

次に、PC200の機能構成について説明する。図2に示すようにPC200は、制御部201、補助記憶部202、ネットワーク通信部203、及び表示部204を備え、これら各部はバスなどにより接続される構成となっている。また、制御部201には、原稿テキストデータ送信処理部201aを備えている。補助記憶部202には、校正前原稿テキストデータ保存エリア202aと校正後原稿テキストデータ202bを備えている。   Next, the functional configuration of the PC 200 will be described. As shown in FIG. 2, the PC 200 includes a control unit 201, an auxiliary storage unit 202, a network communication unit 203, and a display unit 204. These units are connected by a bus or the like. In addition, the control unit 201 includes a document text data transmission processing unit 201a. The auxiliary storage unit 202 includes a pre-proofread original text data storage area 202a and post-proofread original text data 202b.

制御部201は、RAMやROM等の主記憶手段、及びCPU(Central Processing Unit)等の制御手段を備えている。また、制御部201は、各種I/Oや、USB(ユニバーサル・シリアル・バス)等のインターフェース、バスコントローラ等を含む総合的なPC200のコントロールを行う。制御部201には、画像形成装置100に校正前原稿テキストデータ及び校正後原稿テキストデータを送信する原稿テキストデータ処理部201aが設けられている。   The control unit 201 includes main storage means such as RAM and ROM, and control means such as a CPU (Central Processing Unit). Further, the control unit 201 performs comprehensive control of the PC 200 including various I / Os, interfaces such as USB (Universal Serial Bus), a bus controller, and the like. The control unit 201 is provided with a document text data processing unit 201 a that transmits the document text data before calibration and the document text data after calibration to the image forming apparatus 100.

補助記憶部202は、フラッシュメモリ等からなる補助記憶装置で、制御部201が実行する処理のプログラムやデータを記憶する。校正前原稿テキストデータ保存エリア202aは、画像形成装置100から受信する原稿テキストデータを保存する。その後、ユーザーにより文字の校正が行われると、校正前の文字が指定色に変更され、校正前原稿テキストデータに保存される。校正後原稿テキストデータ保存エリア202bは、ユーザーが校正した文字とその文字が指定色に変更された校正後原稿テキストデータを保存する。   The auxiliary storage unit 202 is an auxiliary storage device including a flash memory or the like, and stores programs and data for processing executed by the control unit 201. The pre-calibration original text data storage area 202a stores original text data received from the image forming apparatus 100. Thereafter, when the user proofreads the character, the character before proofreading is changed to the designated color and stored in the original text data before proofreading. The proofread original text data storage area 202b stores proofread original text data in which the user proofreads the character and the character is changed to a specified color.

ネットワーク通信部203は、ネットワーク300に接続するための着脱可能なLANインターフェースを備えている。LANインターフェースには、TCP/IP、AppleTalk、SMB等の各種ネットワークプロトコルのインテリジェントな送受信を行うネットワーク部を含んでいる。   The network communication unit 203 includes a detachable LAN interface for connecting to the network 300. The LAN interface includes a network unit that performs intelligent transmission and reception of various network protocols such as TCP / IP, AppleTalk, and SMB.

表示部204は、液晶ディスプレイ等のモニターを備え、ユーザーにより校正前の原稿テキストデータが表示される。   The display unit 204 includes a monitor such as a liquid crystal display, and displays text data before proofreading by the user.

次に、OCR辞書保存テーブル103aの構成について、図3を用いて説明する。OCR辞書保存テーブル103aは、OCR機能が文字を認識するときに使用するユーザー毎のOCR辞書が保存されているテーブルである。OCR辞書保存テーブル103aは、図3に示すように複数のユーザーOCR辞書格納エリア103a−uから構成されている。また、各々のユーザーOCR辞書格納エリア103a−uには、「ユーザー名」u1、「ユーザーID」u2、「登録数」u3、「言語」u4、「文字コード」u5、「校正前の文字」u6、及び「校正後の文字」u7のデータ項目が設けられている。   Next, the configuration of the OCR dictionary storage table 103a will be described with reference to FIG. The OCR dictionary storage table 103a is a table in which an OCR dictionary for each user used when the OCR function recognizes characters is stored. As shown in FIG. 3, the OCR dictionary storage table 103a includes a plurality of user OCR dictionary storage areas 103a-u. Each user OCR dictionary storage area 103a-u includes “user name” u1, “user ID” u2, “registration number” u3, “language” u4, “character code” u5, “characters before proofreading”. Data items of u6 and “character after proofreading” u7 are provided.

「ユーザー名」u1は、個人またはグループのユーザーを識別するためにユーザー毎に付されているユニークな名前である。「ユーザーID」u2は、ユーザー名に対応して付けられた非公開の識別番号で、画像形成装置100がユーザー認証を行うときに使用する。「登録数」u3は、ユーザーOCR辞書格納エリア103a−uに登録されている文字の合計数である。「言語」u4は、原稿に記載された言語である。「文字コード」u5は、原稿テキストデータで用いられている文字コードである。「校正前の文字」u6は、OCR処理部101aによって誤認識され、ユーザーが校正する前の文字である。「校正後の文字」u7は、OCR処理部101aによって誤認識された後に、ユーザーが校正した文字である。図3に示すユーザーAのユーザーOCR辞書格納エリア(ユーザーAのOCR辞書格納エリア)103a−uは、ユーザー名が「AAAAA」、ユーザーIDが「A001」、文字の登録数が「10」、言語が「日本語」、文字コードが「SJIS」、校正前の文字が「せラミックス」、校正後の文字が「セラミックス」である例を示している。   The “user name” u1 is a unique name assigned to each user in order to identify an individual or group user. The “user ID” u2 is a private identification number assigned in correspondence with the user name, and is used when the image forming apparatus 100 performs user authentication. “Number of registrations” u3 is the total number of characters registered in the user OCR dictionary storage area 103a-u. “Language” u4 is a language described in the manuscript. “Character code” u5 is a character code used in the document text data. The “character before proofreading” u6 is a character that is erroneously recognized by the OCR processing unit 101a and is not proofread by the user. The “character after proofreading” u7 is a character proofread by the user after being erroneously recognized by the OCR processing unit 101a. In the user A user OCR dictionary storage area (user A OCR dictionary storage area) 103a-u shown in FIG. Is “Japanese”, the character code is “SJIS”, the character before proofreading is “Seramix”, and the character after proofreading is “ceramics”.

次に、本発明の実施形態に係る画像形成装置100のOCR処理部101aが実行するOCR処理について、図4を用いて説明する。   Next, OCR processing executed by the OCR processing unit 101a of the image forming apparatus 100 according to the embodiment of the present invention will be described with reference to FIG.

画像形成装置100の制御部101が画像処理部107から原稿画像データを入力すると、制御部101は、OCR処理部101aを起動する。OCR処理部101aが起動されると、OCR処理部101aはOCR処理を開始する。以下、図3に示すOCR処理のステップ順に説明する。   When the control unit 101 of the image forming apparatus 100 inputs document image data from the image processing unit 107, the control unit 101 activates the OCR processing unit 101a. When the OCR processing unit 101a is activated, the OCR processing unit 101a starts OCR processing. Hereinafter, the steps will be described in the order of the OCR processing shown in FIG.

(ステップS101)
まず、OCR処理部101aは、操作パネル処理部105からユーザーが設定した「ユーザー名」と「ユーザーID」を入力する。
(Step S101)
First, the OCR processing unit 101 a inputs “user name” and “user ID” set by the user from the operation panel processing unit 105.

(ステップS102)
次いで、OCR処理部101aは、ユーザー認証データ保存エリア103bからステップS101で入力した「ユーザー名」に対応する「ユーザーID」を取り出す。
(Step S102)
Next, the OCR processing unit 101a extracts the “user ID” corresponding to the “user name” input in step S101 from the user authentication data storage area 103b.

(ステップS103)
次いで、OCR処理部101aは、操作パネル処理部105から入力した「ユーザーID」とユーザー認証データ保存エリア103bから取り出した「ユーザーID」が同じであるかを判定することでユーザー認証を行う。ユーザー認証が正常であるとき(ステップS103のYes)は、ステップS104に進む。ユーザー認証が正常でないとき(ステップS103のNo)は、OCR処理を終了する。
(Step S103)
Next, the OCR processing unit 101a performs user authentication by determining whether the “user ID” input from the operation panel processing unit 105 is the same as the “user ID” extracted from the user authentication data storage area 103b. When user authentication is normal (Yes in step S103), the process proceeds to step S104. When the user authentication is not normal (No in step S103), the OCR process is terminated.

(ステップS104)
次いで、OCR処理部101aは、スキャナー部106によりスキャンされ、画像処理部107により画像処理が行われた原稿画像データを入力する。
(Step S104)
Next, the OCR processing unit 101 a inputs document image data scanned by the scanner unit 106 and subjected to image processing by the image processing unit 107.

(ステップS105)
次いで、OCR処理部101aは、ステップS101で入力した「ユーザー名」に対応するユーザーOCR辞書格納エリア103a−uを取り出す。例えば、「ユーザー名」に「AAAAA」が設定され、「ユーザー名」の「AAAAA」に対応しているユーザーOCR辞書保存エリア103a−uが「ユーザーAのOCR辞書保存エリア」であれば、「ユーザーAのOCR辞書保存エリア」が取り出される。
(Step S105)
Next, the OCR processing unit 101a extracts the user OCR dictionary storage area 103a-u corresponding to the “user name” input in step S101. For example, if “AAAAA” is set in “User Name” and the user OCR dictionary storage area 103a-u corresponding to “AAAAAA” in “User Name” is “User A OCR Dictionary Storage Area”, “ User A's OCR dictionary storage area is retrieved.

(ステップS106)
次いで、OCR処理部101aは、原稿画像データの先頭の文字を取り出すために、先頭の文字の位置をポインターに設定する。
(Step S106)
Next, the OCR processing unit 101a sets the position of the first character as a pointer in order to extract the first character of the document image data.

(ステップS107)
次いで、OCR処理部101aは、原稿画像データからポインターが示す文字を取り出し、OCR機能を実行して認識度を算出する。
(Step S107)
Next, the OCR processing unit 101a extracts the character indicated by the pointer from the document image data, executes the OCR function, and calculates the recognition level.

(ステップS108)
次いで、OCR処理部101aは、認識度が予め決められた所定の閾値より低いかを判定する。所定の閾値より低いとき(ステップS108のYes)は、ステップS109に進む。所定の閾値以上であるとき(ステップS108のNo)は、ステップS111に進む。
(Step S108)
Next, the OCR processing unit 101a determines whether the recognition level is lower than a predetermined threshold value. When it is lower than the predetermined threshold value (Yes in step S108), the process proceeds to step S109. When it is equal to or greater than the predetermined threshold (No in step S108), the process proceeds to step S111.

(ステップS109)
ステップS108のYesにおいて、OCR処理部101aは、認識度が低い文字がステップ105で取り出したユーザーOCR辞書格納エリア103a−uの「校正前の文字」u6に登録されているかを判定する。認識度が低い文字が「校正前の文字」u6に登録されているとき(ステップS109のYes)は、ステップS110に進む。認識度の低い文字が「校正前の文字」に登録されていないとき(ステップS109のNo)は、ステップS111に進む。
(Step S109)
In Yes of step S108, the OCR processing unit 101a determines whether or not a character with a low recognition degree is registered in the “character before proofreading” u6 in the user OCR dictionary storage area 103a-u extracted in step 105. When a character with a low recognition degree is registered in the “character before proofreading” u6 (Yes in step S109), the process proceeds to step S110. When the character with low recognition degree is not registered in “character before proofreading” (No in step S109), the process proceeds to step S111.

(ステップS110)
ステップS109のYesにおいて、OCR処理部101aは、ポインターが示すOCR処理された文字をユーザーOCR辞書格納エリア103a−uの「校正前の文字」u6に対応する「校正後の文字」u7に置き換え、原稿テキストデータに保存する。
(Step S110)
In Yes of step S109, the OCR processing unit 101a replaces the character subjected to the OCR processing indicated by the pointer with the “character after proofreading” u7 corresponding to the “character before proofreading” u6 in the user OCR dictionary storage area 103a-u. Save to original text data.

(ステップS111)
ステップS108のNo、及びステップS109のNoにおいて、OCR処理部101aは、OCR機能で認識された文字を原稿テキストデータに保存する。
(Step S111)
In step S108 No and step S109 No, the OCR processing unit 101a stores the character recognized by the OCR function in the document text data.

(ステップS112)
次いで、OCR処理部101aは、原稿画像データの全ての文字が取り出されたかを判定する。全ての文字が取り出されたとき(ステップS112のYes)は、ステップS113に進む。全ての文字が取り出されていないとき(ステップS112のNo)は、ステップS114に進む。
(Step S112)
Next, the OCR processing unit 101a determines whether all characters of the document image data have been extracted. When all the characters have been extracted (Yes in step S112), the process proceeds to step S113. When all the characters have not been extracted (No in step S112), the process proceeds to step S114.

(ステップS113)
ステップS112のYesにおいて、OCR処理部101aは、原稿テキストデータをネットワーク通信部109によりPC200に送信し、OCR処理を終了する。
(Step S113)
In Yes of step S112, the OCR processing unit 101a transmits the document text data to the PC 200 through the network communication unit 109, and ends the OCR processing.

(ステップS114)
ステップS112のNoにおいて、OCR処理部101aは、原稿画像データの次の文字を取り出すために、次の文字の位置をポインターに設定し、ステップS107に戻る。
(Step S114)
In step S112 No, the OCR processing unit 101a sets the position of the next character as a pointer in order to extract the next character of the document image data, and returns to step S107.

画像形成装置100のネットワーク通信部109がPC200から「ユーザー名」と「ユーザーID」、及び校正前テキストデータと校正後テキストデータを受信すると、制御部101は、OCR辞書登録処理部101bを起動する。OCR辞書登録処理部101bが起動されると、OCR辞書登録処理部101bはOCR辞書登録処理を開始する。以下、図5に示すOCR辞書登録処理のステップ順に説明する。   When the network communication unit 109 of the image forming apparatus 100 receives “user name” and “user ID”, pre-proofread text data, and post-proofread text data from the PC 200, the control unit 101 activates the OCR dictionary registration processing unit 101b. . When the OCR dictionary registration processing unit 101b is activated, the OCR dictionary registration processing unit 101b starts an OCR dictionary registration process. Hereinafter, the steps will be described in the order of the OCR dictionary registration process shown in FIG.

(ステップS201)
まず、OCR辞書登録処理部101bは、ネットワーク通信部109から「ユーザー名」と「ユーザーID」を入力する。
(Step S201)
First, the OCR dictionary registration processing unit 101 b inputs “user name” and “user ID” from the network communication unit 109.

(ステップS202)
次いで、OCR辞書登録処理部101bは、ユーザー認証データ保存エリア103bからステップS201で入力した「ユーザー名」に対応する「ユーザーID」を取り出す。
(Step S202)
Next, the OCR dictionary registration processing unit 101b extracts the “user ID” corresponding to the “user name” input in step S201 from the user authentication data storage area 103b.

(ステップS203)
次いで、OCR辞書登録処理部101bは、ステップS201で入力した「ユーザーID」とユーザー認証データ保存エリア103bから取り出した「ユーザーID」が同じであるかを判定することでユーザー認証を行う。ユーザー認証が正常であるとき(ステップS203のYes)は、ステップS204に進む。ユーザー認証が正常でないとき(ステップS203のNo)は、OCR辞書登録処理を終了する。
(Step S203)
Next, the OCR dictionary registration processing unit 101b performs user authentication by determining whether the “user ID” input in step S201 is the same as the “user ID” extracted from the user authentication data storage area 103b. When user authentication is normal (Yes in step S203), the process proceeds to step S204. When the user authentication is not normal (No in step S203), the OCR dictionary registration process is terminated.

(ステップS204)
まず、OCR辞書登録処理部101bは、ネットワーク通信部109から校正前原稿テキストデータを入力すると、校正前原稿テキストデータ保存エリア102aに保存する。同様に、OCR辞書登録処理部101bは、ネットワーク通信部109から校正後原稿テキストデータを入力すると、校正後原稿テキストデータ保存エリア102bに保存する。
(Step S204)
First, when the pre-proofread original text data is input from the network communication unit 109, the OCR dictionary registration processing unit 101b stores the pre-proofread original text data storage area 102a. Similarly, when the proofread document text data is input from the network communication unit 109, the OCR dictionary registration processing unit 101b stores the proofread document text data storage area 102b.

(ステップS205)
次いで、OCR辞書登録処理部101bは、ステップS201で入力した「ユーザー名」に対応するユーザーOCR辞書格納エリア103a−uを取り出す。
(Step S205)
Next, the OCR dictionary registration processing unit 101b takes out the user OCR dictionary storage area 103a-u corresponding to the “user name” input in step S201.

(ステップS206)
次いで、OCR辞書登録処理部101bは、校正前原稿テキストデータから先頭の指定色に変更されている文字を取り出すために、校正前原稿テキストデータにおける先頭の指定色に変更されている文字の位置をポインターに設定する。
(Step S206)
Next, the OCR dictionary registration processing unit 101b determines the position of the character changed to the first designated color in the pre-proofread original text data in order to extract the character changed to the first designated color from the pre-proofread original text data. Set to pointer.

(ステップS207)
次いで、OCR辞書登録処理部101bは、原稿校正前テキストデータからポインターが示す文字を取り出す。
(Step S207)
Next, the OCR dictionary registration processing unit 101b extracts the character indicated by the pointer from the text data before proofreading.

(ステップS208)
次いで、OCR辞書登録処理部101bは、ステップ207で取り出した文字がユーザーOCR辞書格納エリア103a−uの「校正前の文字」u6に登録されているかを判定する。「校正前の文字」u6に登録されているとき(ステップS208のYes)は、ステップS210に進む。「校正前の文字」u6に登録されていないとき(ステップS208のNo)は、ステップS209に進む。
(Step S208)
Next, the OCR dictionary registration processing unit 101b determines whether or not the character extracted in step 207 is registered in the “character before calibration” u6 in the user OCR dictionary storage area 103a-u. When it is registered in “character before proofreading” u6 (Yes in step S208), the process proceeds to step S210. When it is not registered in “character before proofreading” u6 (No in step S208), the process proceeds to step S209.

(ステップS209)
ステップS208のNoにおいて、OCR辞書登録処理部101bは、「ユーザー名」に対応するユーザーOCR辞書格納エリア103a−uの「ユーザー名」u1、「ユーザーID」u2、「登録数」u3、「言語」u4、「文字コード」u5、「校正前の文字」u6、及び「校正後の文字」u7のデータ項目に情報を設定する。なお、「校正後の文字」u7は、校正前テキストデータに対応する文字が校正後テキストデータに保存されているので、校正後テキストデータから取り出して設定する。
(Step S209)
In step S208 No, the OCR dictionary registration processing unit 101b selects “user name” u1, “user ID” u2, “number of registrations” u3, “language” in the user OCR dictionary storage area 103a-u corresponding to “user name”. Information is set in the data items of “u4”, “character code” u5, “character before calibration” u6, and “character after calibration” u7. The “character after proofreading” u7 is set by taking out the text data after proofreading since the characters corresponding to the text data before proofreading are stored in the text data after proofreading.

(ステップS210)
ステップS208のYesまたはステップS209の次に、OCR辞書登録処理部101bは、校正前テキストデータにおいて指定色に変更されている全ての文字が取り出されたかを判定する。全ての文字が取り出されたとき(ステップS210のYes)は、ステップS211に進む。全ての文字が取り出されていないとき(ステップS210のNo)は、ステップS212に進む。
(Step S210)
After Yes in step S208 or step S209, the OCR dictionary registration processing unit 101b determines whether all characters that have been changed to the designated color in the text data before proofreading have been extracted. When all the characters have been extracted (Yes in step S210), the process proceeds to step S211. When all the characters have not been extracted (No in step S210), the process proceeds to step S212.

(ステップS211)
ステップS210のYesにおいて、OCR辞書登録処理部101bは、更新したユーザーOCR辞書格納エリア103a−uをOCR辞書保存テーブル103aの「ユーザー名」に対応するユーザーOCR辞書格納エリア103a−uに保存し、OCR辞書登録処理を終了する。
(Step S211)
In Yes of step S210, the OCR dictionary registration processing unit 101b stores the updated user OCR dictionary storage area 103a-u in the user OCR dictionary storage area 103a-u corresponding to the “user name” in the OCR dictionary storage table 103a. The OCR dictionary registration process is terminated.

(ステップS212)
ステップS210のNoにおいて、OCR辞書登録処理部101bは、校正前原稿テキストデータから指定色に変更されている次の文字を取り出すために、校正前原稿テキストデータにおける指定色に変更されている次の文字の位置をポインターに設定し、ステップS207に戻る。
(Step S212)
In step S210 No, the OCR dictionary registration processing unit 101b extracts the next character that has been changed to the designated color from the original text data before proofreading, and the next color that has been changed to the designated color in the original text data before proofreading. The character position is set to the pointer, and the process returns to step S207.

以上のように、ユーザーにより校正された文字に対応する指定色に変更された校正前の文字が保存されている校正前原稿テキストデータと、ユーザーにより校正された文字が指定色に変更された校正後原稿テキストデータとを、PC200から画像形成装置100に送信することで、画像形成装置100は、OCR機能で誤認識された文字とユーザーにより校正された文字を容易に判別することができる。また、画像形成装置100のWebブラウザで表示されたOCR辞書更新画面により、校正前原稿テキストデータと校正後原稿テキストデータを画像形成装置100はPC200から容易に受信することができる。また、OCR機能は、言語、単語、及びフォントなどによって誤認識が変化するので、ユーザーの使用頻度が高い言語、単語、及びフォントに応じたOCR辞書を作成することで、OCR機能がOCR辞書を使用することにより誤認識された文字を正しい文字に置き換える精度が向上する。また、OCR処理部101aによるOCR処理、またはOCR辞書登録処理部101bによるOCR辞書登録処理において、ユーザー認証が正常であるかを判定しているので、許可されていないユーザーによるOCR処理及びOCR辞書登録処理の実行を不可とすることができる。   As described above, the original text data before calibration in which the pre-calibration text changed to the specified color corresponding to the text calibrated by the user and the calibration in which the text calibrated by the user has been changed to the specified color By transmitting the post original text data from the PC 200 to the image forming apparatus 100, the image forming apparatus 100 can easily discriminate between a character erroneously recognized by the OCR function and a character calibrated by the user. Further, the image forming apparatus 100 can easily receive the pre-proofread original text data and the post-proofread original text data from the PC 200 by the OCR dictionary update screen displayed on the Web browser of the image forming apparatus 100. In addition, since the misrecognition of the OCR function varies depending on the language, word, font, etc., creating an OCR dictionary according to the language, word, and font frequently used by the user allows the OCR function to change the OCR dictionary. This improves the accuracy of replacing erroneously recognized characters with correct characters. In addition, since it is determined whether the user authentication is normal in the OCR processing by the OCR processing unit 101a or the OCR dictionary registration processing by the OCR dictionary registration processing unit 101b, the OCR processing and OCR dictionary registration by an unauthorized user are determined. Execution of processing can be disabled.

なお、実施形態においては、ユーザーにより校正された文字、及びユーザーにより校正された文字に対応する校正前の文字を指定色に変更したが、この指定色に限定されず、網掛け文字、太文字、斜体文字、反転文字、アンダーライン文字などのコンピュータが判別できる装飾文字とすることが可能である。このようにコンピュータが判別できる装飾文字とすることで、OCR辞書登録処理が校正前の文字と校正後の文字を判別し易くなり、自動でOCR辞書に登録することができる。   In the embodiment, the character proofread by the user and the character before proofreading corresponding to the character proofread by the user are changed to the specified color. However, the present invention is not limited to this specified color. It is possible to use decorative characters that can be identified by a computer, such as italic characters, inverted characters, and underline characters. By using the decoration characters that can be discriminated by the computer in this way, the OCR dictionary registration process can easily discriminate between the characters before proofreading and the characters after proofreading, and can be automatically registered in the OCR dictionary.

また、OCR辞書保存テーブル103aは、複数のユーザーOCR辞書格納エリア103a−uから構成されているが、ユーザーOCR辞書格納エリア103a−uを相互にコピーすることも可能である。例えば、図3に示すユーザーAのOCR辞書格納エリアをユーザーEのOCR辞書格納エリアにコピーすることができる。   The OCR dictionary storage table 103a is composed of a plurality of user OCR dictionary storage areas 103a-u, but the user OCR dictionary storage areas 103a-u can also be copied to each other. For example, the user A's OCR dictionary storage area shown in FIG. 3 can be copied to the user E's OCR dictionary storage area.

また、OCR機能が文字をOCR辞書で検索するか否かを判定する認識度の閾値は、OCR機能の速度、OCR機能の精度、またはユーザーの設定により変更が可能である。更に、認識度の閾値に「0」を設定すると、OCR機能がOCR辞書を使用しないような設定とすることも可能である。   In addition, the threshold value of the recognition level for determining whether or not the OCR function searches for characters in the OCR dictionary can be changed according to the speed of the OCR function, the accuracy of the OCR function, or user settings. Furthermore, when “0” is set as the threshold value of the recognition level, the OCR function can be set not to use the OCR dictionary.

また、校正前原稿テキストデータと校正後原稿テキストデータを画像形成装置100に送信するときに、校正前原稿テキストデータと校正後原稿テキストデータの先頭にOCR辞書に登録するためのデータであることを示すコマンドを付加することで、画像形成装置100は、容易に判別でるようにすることも可能である。   In addition, when the original text data before proofreading and the original text data after proofreading are transmitted to the image forming apparatus 100, they are data to be registered in the OCR dictionary at the head of the original text data before proofreading and the original text data after proofreading. By adding the command shown, the image forming apparatus 100 can be easily discriminated.

また、OCR辞書登録処理部101bのOCR辞書登録処理において、校正前原稿テキストデータにおける指定色に変更されている文字でOCR辞書に登録されているかを判定したが、校正後原稿テキストデータにおける指定色に変更されている文字でOCR辞書に登録されているかを判定することも可能である。   Further, in the OCR dictionary registration processing of the OCR dictionary registration processing unit 101b, it is determined whether or not the character changed to the designated color in the pre-proofread original text data is registered in the OCR dictionary. It is also possible to determine whether or not the character changed to is registered in the OCR dictionary.

また、OCR処理部101aのOCR処理において、OCR処理の先頭でユーザー認証を行うようにしたが、操作パネル104に「ユーザー名」と「ユーザーID」が入力されたときに、操作パネル処理部105によりユーザー認証を行うようにすることも可能である。   In the OCR processing of the OCR processing unit 101a, user authentication is performed at the beginning of the OCR processing. However, when “user name” and “user ID” are input to the operation panel 104, the operation panel processing unit 105 is used. It is also possible to perform user authentication according to the above.

また、実施形態においては、画像形成装置100から原稿テキストデータをPC200に送信し、PC200から校正前原稿テキストデータと校正後原稿テキストデータを画像形成装置100に送信するようにしたが、画像形成装置100が原稿テキストデータの校正が可能なディスプレイ(表示部)を備えているときには、画像形成装置100により校正前原稿テキストデータと校正後原稿テキストデータを作成することも可能である。   In the embodiment, the original text data is transmitted from the image forming apparatus 100 to the PC 200, and the pre-calibration original text data and the post-calibration original text data are transmitted from the PC 200 to the image forming apparatus 100. When the display 100 includes a display (display unit) capable of proofreading original text data, the image forming apparatus 100 can create pre-proofread original text data and post-proofread original text data.

このような本発明の画像形成装置は、OCR機能により誤認識された文字や単語をユーザーがPCで校正すると、OCR機能が誤認識する可能性のある文字や単語を容易に漏れなくOCR辞書に登録できるので、誤認識された文字や単語をOCR機能が正しい文字や単語に置き換えることで、ユーザーが校正する時間を短縮できる。   In such an image forming apparatus of the present invention, when a user calibrates a character or a word that is erroneously recognized by the OCR function with a PC, the character or word that may be erroneously recognized by the OCR function is easily included in the OCR dictionary without omission. Since registration can be performed, the time for the user to proofread can be shortened by replacing the erroneously recognized character or word with the correct character or word by the OCR function.

以上、具体的な実施の形態により本発明を説明したが、上記実施の形態は本発明の例示であり、この実施の形態に限定されないことは言うまでもない。   As mentioned above, although this invention was demonstrated by specific embodiment, it cannot be overemphasized that the said embodiment is an illustration of this invention and is not limited to this embodiment.

本発明は、画像形成装置に好適であるが、画像形成装置に限られるものではなく、OCR機能を有する装置一般に適用できる。   The present invention is suitable for an image forming apparatus, but is not limited to an image forming apparatus, and can be applied to any apparatus having an OCR function.

100・・・・・画像形成装置
101・・・・・制御部
101a・・・・OCR処理部
101b・・・・OCR辞書登録処理部
102・・・・・補助記憶部
102a・・・・校正前原稿テキストデータ保存エリア
102b・・・・校正後原稿テキストデータ保存エリア
103・・・・・記憶部
103a・・・・OCR辞書保存テーブル
103b・・・・ユーザー認証データ保存エリア
104・・・・・操作パネル
105・・・・・操作パネル処理部
106・・・・・スキャナー部
107・・・・・画像処理部
108・・・・・画像印刷部
109・・・・・ネットワーク通信部
200・・・・・PC
201・・・・・制御部
201a・・・・原稿テキストデータ送信処理部
202・・・・・補助記憶部
202a・・・・校正前原稿テキストデータ保存エリア
202b・・・・校正後原稿テキストデータ保存エリア
203・・・・・ネットワーク通信部
204・・・・・表示部
300・・・・・ネットワーク
DESCRIPTION OF SYMBOLS 100 ... Image forming apparatus 101 ... Control part 101a ... OCR processing part 101b ... OCR dictionary registration processing part 102 ... Auxiliary storage part 102a ... Calibration Previous document text data storage area 102b... Post-proof document text data storage area 103... Storage unit 103a... OCR dictionary storage table 103b. Operation panel 105... Operation panel processing unit 106... Scanner unit 107... Image processing unit 108. .... PC
201... Control unit 201 a... Original text data transmission processing unit 202... Auxiliary storage unit 202 a... Pre-calibration original text data storage area 202 b. Storage area 203... Network communication unit 204... Display unit 300.

Claims (3)

OCR機能を有する画像形成装置と外部装置とがネットワークを介して接続された画像形成システムであって、
前記画像形成装置は、
原稿画像データから原稿テキストデータを作成するOCR処理と、
前記原稿テキストデータの校正前原稿テキストデータ及び校正後原稿テキストデータにより、校正前及び校正後の文字または単語をOCR辞書保存テーブルに登録するOCR辞書登録処理部
ユーザー毎の前記OCR辞書保存テーブルと、ユーザー認証のためのユーザー名及びユーザーIDとを保存する記憶部と、を備え、
前記画像形成装置は、(1)前記記憶部に保存されたユーザー名及びユーザーIDと、前記画像形成装置に入力されたユーザー名及びユーザーIDとに基づいてユーザー認証を行い、(2)前記ユーザー認証が正常である場合には、前記OCR処理部は、前記原稿画像データから文字または単語を取り出し、前記OCR機能を実行して認識度を算出し、(3)前記認識度が所定の閾値以上である場合には、前記OCR機能で認識された文字または単語を前記原稿テキストデータに保存し、(4)前記認識度が前記所定の閾値より低い場合には、前記ユーザー認証が正常であった前記ユーザー名に対応する前記OCR辞書保存テーブルに、前記認識度が前記所定の閾値より低い文字または単語が登録されているか否かを判断し、(5)登録されている場合には、校正前の文字または単語を校正後の文字または単語に置き換えて前記原稿テキストデータに保存し、(6)登録されていない場合には、前記OCR機能で認識された文字または単語を前記原稿テキストデータに保存し、(7)前記原稿テキストデータを、前記ネットワークを介して前記外部装置に送信し、
前記外部装置により、前記原稿テキストデータが受信されると、前記OCR処理部により誤認識された文字または単語が正しい文字または単語に校正されることにより、校正前の文字または単語が装飾されて前記校正前原稿テキストデータに保存され、校正後の文字または単語が装飾されて前記校正後原稿テキストデータに保存され、さらに、ユーザー名及びユーザーID、前記OCR辞書保存テーブルに登録するためのデータであることを示すコマンドが先頭に付加された前記校正前原稿テキストデータ及び前記校正後原稿テキストデータが、前記ネットワークを介して前記画像形成装置に送信され、
前記画像形成装置は、(1)前記記憶部に保存された前記ユーザー名及び前記ユーザーIDと、前記外部装置から受信した前記ユーザー名及び前記ユーザーIDとに基づいてユーザー認証を行い、(2)前記ユーザー認証が正常である場合には、前記外部装置から受信した前記校正前原稿テキストデータ及び前記校正後原稿テキストデータを保存し、(3)前記OCR辞書登録処理部により、前記校正前原稿テキストデータまたは前記校正後原稿テキストデータにおける装飾された文字または単語の位置をポインターに設定し、前記校正前原稿テキストデータまたは前記校正後原稿テキストデータにおけるポインターが示す文字または単語を取り出し、(4)取り出した前記文字または単語が、前記ユーザー認証が正常であった前記ユーザー名に対応するOCR辞書保存テーブルに登録されているか否かを判断し、(5)登録されていない場合には、前記ユーザー名に対応する前記OCR辞書保存テーブルに、前記校正前原稿テキストデータ及び前記校正後原稿テキストデータから取り出した文字または単語を登録することを特徴とする画像形成システム
An image forming system in which an image forming apparatus having an OCR function and an external device are connected via a network ,
The image forming apparatus includes:
An OCR processing unit that creates document text data from document image data ;
An OCR dictionary registration processing unit for registering pre-proofread and post-proofread characters or words in the OCR dictionary storage table based on pre-proofread original text data and post-proofread original text data of the original text data ;
A storage unit that stores the OCR dictionary storage table for each user and a user name and a user ID for user authentication ;
The image forming apparatus performs (1) user authentication based on a user name and user ID stored in the storage unit and a user name and user ID input to the image forming apparatus, and (2) the user. If the authentication is normal, the OCR processing unit extracts characters or words from the document image data, executes the OCR function to calculate a recognition degree, and (3) the recognition degree is equal to or greater than a predetermined threshold value. The character or word recognized by the OCR function is stored in the original text data. (4) When the recognition degree is lower than the predetermined threshold, the user authentication is normal. It is determined whether or not a character or word whose recognition level is lower than the predetermined threshold is registered in the OCR dictionary storage table corresponding to the user name, and (5) registered If the character or word before proofreading is replaced with the character or word after proofreading and stored in the original text data, (6) if not registered, the character or word recognized by the OCR function (7) transmitting the document text data to the external device via the network;
When the original text data is received by the external device, the character or word erroneously recognized by the OCR processing unit is calibrated to the correct character or word, so that the character or word before calibration is decorated and the character or word is decorated. This data is stored in the original text data before proofreading, decorated with characters or words after proofreading, stored in the original text data after proofreading , and further registered in the OCR dictionary storage table with the user name and user ID. The pre-calibration original text data and the post-correction original text data to which a command indicating this is added is transmitted to the image forming apparatus via the network,
The image forming apparatus performs user authentication based on (1) the user name and the user ID stored in the storage unit, and the user name and the user ID received from the external apparatus, and (2) If the user authentication is normal, the pre-calibration original text data and the post-correction original text data received from the external device are stored, and (3) the pre-calibration original text is stored by the OCR dictionary registration processing unit. The position of the decorated character or word in the data or the proofread original text data is set as a pointer, and the character or word indicated by the pointer in the pre-proofread original text data or the proofread original text data is extracted, (4) The letter or word is the user whose user authentication was normal (5) if not registered, the OCR dictionary storage table corresponding to the user name stores the pre-proofread original text data and the image forming system characterized that you register a character or word fetched from proofread the original text data.
前記装飾された文字または単語は、指定色に変更された文字または単語であることを特徴とする請求項1に記載の画像形成システム The decorative character or word, an image forming system according to claim 1, wherein the characters or words der Rukoto that changed designated color. 画像形成装置は、Webブラウザにより画面を表示し、前記画面に前記校正前原稿テキストデータのファイル名及び前記校正後原稿テキストデータのファイル名を設定することで、前記校正前原稿テキストデータ及び前記校正後原稿テキストデータを受信することを特徴とする請求項1または2に記載の画像形成システム Before Symbol image forming apparatus, the screen displays a by Web browser, by setting the file name and the file name of the proofread manuscript text data of the calibration before the original text data on the screen, the calibration before the original text data and 3. The image forming system according to claim 1, wherein the proofread original text data is received.
JP2013159376A 2013-07-31 2013-07-31 Image forming system Expired - Fee Related JP6061806B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013159376A JP6061806B2 (en) 2013-07-31 2013-07-31 Image forming system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013159376A JP6061806B2 (en) 2013-07-31 2013-07-31 Image forming system

Publications (2)

Publication Number Publication Date
JP2015032017A JP2015032017A (en) 2015-02-16
JP6061806B2 true JP6061806B2 (en) 2017-01-18

Family

ID=52517316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013159376A Expired - Fee Related JP6061806B2 (en) 2013-07-31 2013-07-31 Image forming system

Country Status (1)

Country Link
JP (1) JP6061806B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113474767B (en) * 2019-02-14 2023-09-01 株式会社力森诺科 File search device, file search system, file search program, and file search method
CN112232320B (en) * 2020-12-14 2021-05-25 北京沃东天骏信息技术有限公司 Printed matter text proofreading method and related equipment

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6327992A (en) * 1986-07-22 1988-02-05 Ricoh Co Ltd Generating method for dictionary for individual
JPH03172982A (en) * 1989-12-01 1991-07-26 Oki Electric Ind Co Ltd Character recognizing device
JPH0646217A (en) * 1992-07-22 1994-02-18 Ricoh Co Ltd Facsimile equipment
JP2000322414A (en) * 1999-05-07 2000-11-24 Matsushita Electric Ind Co Ltd Device and method for machine translation
JP2003173421A (en) * 2001-12-07 2003-06-20 Hitachi Ltd Character recognition result correcting device
JP2012073749A (en) * 2010-09-28 2012-04-12 Kyocera Mita Corp Image formation device and image formation program

Also Published As

Publication number Publication date
JP2015032017A (en) 2015-02-16

Similar Documents

Publication Publication Date Title
US7447361B2 (en) System and method for generating a custom font
KR102503880B1 (en) Machine readable security mark and process for generating
JP2020170309A (en) Image processing system, image processing device, image processing method, and program
JP2015127936A (en) Image processing system, information processor and program
JP6061806B2 (en) Image forming system
JP2007122500A (en) Character recognition device, character recognition method and character data
JP2015204075A (en) Electronic document creation system, and program
US6958755B1 (en) Personalized computer fonts
JP2016134915A (en) Image forming apparatus and image output method
US9916526B2 (en) Image forming apparatus capable of generating a handwritten document specific to a user
US10645256B2 (en) Image forming apparatus and non-transitory computer-readable storage medium suitable for extracting areas in images specified by handwritten marker by line marker such as highlighter pen or the like, and electronic marker by digital pen
JP2021114192A (en) Information processing device and program
US10498921B2 (en) Electronic imprinting device that affixes imprint data to document data
JP5089524B2 (en) Document processing apparatus, document processing system, document processing method, and document processing program
US20020181779A1 (en) Character and style recognition of scanned text
JP6201686B2 (en) Text data embedding apparatus, image processing apparatus including the apparatus, text data embedding method, and embedding program
US10839206B2 (en) Information processing device and method performing character recognition on document image data masked or not based on text image count
US10936893B2 (en) Information processing device and method for document image extraction, composite image generation, and OCR processing including display of reading resolution instructions based on character density
JP2022101136A (en) Information processing apparatus, information processing method, and program
US20210097271A1 (en) Character recognition using previous recognition result of similar character
JP2017182195A (en) Document correction method, document correction apparatus, document printer, image for error detection, and computer program
JP2006276904A (en) Facsimile device
JP2007034924A (en) Network system
JP6046088B2 (en) Image processing apparatus and image processing method
JP2005326940A (en) Graphing device, program, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150519

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161213

R150 Certificate of patent or registration of utility model

Ref document number: 6061806

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees