JP5035443B2 - Image processing apparatus, image processing method, and computer program - Google Patents

Image processing apparatus, image processing method, and computer program Download PDF

Info

Publication number
JP5035443B2
JP5035443B2 JP2011084424A JP2011084424A JP5035443B2 JP 5035443 B2 JP5035443 B2 JP 5035443B2 JP 2011084424 A JP2011084424 A JP 2011084424A JP 2011084424 A JP2011084424 A JP 2011084424A JP 5035443 B2 JP5035443 B2 JP 5035443B2
Authority
JP
Japan
Prior art keywords
additional
processing
information
postscript
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011084424A
Other languages
Japanese (ja)
Other versions
JP2011154713A (en
Inventor
英昭 足利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2011084424A priority Critical patent/JP5035443B2/en
Publication of JP2011154713A publication Critical patent/JP2011154713A/en
Application granted granted Critical
Publication of JP5035443B2 publication Critical patent/JP5035443B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、画像処理装置、および画像処理方法、並びにコンピュータ・プログラムに関する。さらに詳細には、例えば追記情報の解析処理などにおいて行なわれる原本ドキュメントと追記ドキュメントとの差分データに含まれる欠損部の修復処理など、様々なデータ抽出処理によって得られた欠損部を含む線画データの修復を効率的に実行する画像処理装置、および画像処理方法、並びにコンピュータ・プログラムに関する。 The present invention relates to an image processing apparatus, an image processing method, and a computer program. More specifically, for example, line drawing data including a missing portion obtained by various data extraction processes, such as a restoration processing of a missing portion included in difference data between an original document and an additionally written document, which is performed in an analysis process of additional information, for example. The present invention relates to an image processing apparatus, an image processing method, and a computer program that efficiently execute restoration.

画像処理の分野において、例えばプリンタやFAXなどから出力したドキュメントに、ユーザがペンや鉛筆、スタンプなどで追記した部分を抽出したり、セキュリティ文書が改竄されていないかどうかを検証する処理について、様々な研究、開発が行なわれている。一般的に、このような追記、改竄検証処理には、オリジナルのドキュメントデータと、追記等の可能性がある出力ドキュメントとの比較を行う処理が行なわれる。 In the field of image processing, for example, there are various processes for extracting a part added by a user with a pen, pencil, stamp, etc. in a document output from a printer or FAX, or for verifying whether a security document has been tampered with. Research and development is underway. In general, in such additional writing and falsification verification processing, processing for comparing original document data with an output document that may be added is performed.

すなわち、追記の検出を行なおうとする文書をスキャナなどの画像読取装置でスキャンして得たスキャン画像データと、PCやプリンタなどに蓄積されている原本画像データとの差分を取り、追記画像データを得るというものである。 That is, the difference between the scanned image data obtained by scanning a document to be detected for additional writing with an image reading device such as a scanner and the original image data stored in a PC or printer is obtained, and the additional image data Is to get

ところが、この方法では、紙文書に元からあった文字や図形などと追記した部分に重なりがある場合、原本との差分を取って追記情報を得ようとした場合、取得された追記情報に、原本との重なり部分が含まれず、追記された文字や、図形などが途切れたデータとなってしまうという問題があった。 However, in this method, if there is an overlap in the part of the paper document that was originally added to the original text or figure, when taking the difference from the original and trying to obtain the additional information, There was a problem that the overlapped portion with the original was not included, and the added characters and figures were interrupted.

このような問題点を解決することを目的とした従来技術として、例えば特許文献1がある。特許文献1は、スキャン画像から原本画像を差し引いた追記画像の途切れ修復に関する構成を開示しており、原本画像の黒画素を順次走査し、着目黒画素の8近傍に追記画像の黒画素があるとき、着目画素に相当する追記画像の画素を黒にするといった処理によって途切れを修復する構成を開示している。 As a prior art aiming at solving such problems, there is, for example, Patent Document 1. Patent Document 1 discloses a configuration related to repair of discontinuity in a postscript image obtained by subtracting an original image from a scan image. Black pixels of the postscript image are sequentially scanned around black pixels of the original image, and there are black pixels of the postscript image in the vicinity of the target black pixel. At this time, a configuration is disclosed in which the discontinuity is repaired by a process of making the pixels of the postscript image corresponding to the target pixel black.

さらに、特許文献2は、スキャン画像から原本画像を差し引く差分処理により生成した追記画像から、途切れた追記の輪郭を作成し、輪郭画像から原稿画像を更に差し引くことで接続すべき端点の座標と接続方向を検出し、さらに、その端点位置と接続方向の情報から端点同士を接続し閉曲線を構成しその内部を着色することにより、途切れの発生してしまった検出追記情報を接続して、途切れを修復した追記情報を取得する構成を開示している。 Further, Patent Document 2 creates an interrupted additional write outline from a postscript image generated by subtracting an original image from a scan image, and further connects the coordinates of the end points to be connected by further subtracting the original image from the outline image. By detecting the direction and connecting the end points from the end point position and connection direction information to form a closed curve and coloring the inside, connecting the detected additional information that has been interrupted, the disconnection The structure which acquires the corrected postscript information is disclosed.

しかし、追記情報を検出しようとする文書のスキャン画像には画質の劣化、すなわち、かすれ具合や色合いに変化が発生している可能性が高く、場合によっては、プリントおよび追記の後、何回かコピーされているかも知れない。特に追記部分はかすれなど画質劣化が激しいため、追記情報を検出しようとする文書のスキャン画像から抽出した追記部分の輪郭は、直線ではなくジグザグになる場合が多い。このため、端点および補間方向の特定が困難となり、上記の特許文献の手法を適用しても、完全な形の修復した追記情報を取得することが困難となるという問題がある。 However, there is a high possibility that the scanned image of the document for which additional information is to be detected has degraded image quality, i.e., the degree of blurring or the hue has changed. It may have been copied. In particular, since the image quality deterioration such as fading is severe in the additional writing portion, the contour of the additional writing portion extracted from the scanned image of the document for which additional writing information is to be detected is often not a straight line but a zigzag. For this reason, it is difficult to specify the end points and the interpolation direction, and it is difficult to obtain the complete postscript repaired additional information even if the method of the above-mentioned patent document is applied.

また、途切れを修復して追記情報を取得する構成において、ペンや鉛筆などによって追記された文字などの細線からなる追記情報の修復は、比較的、正確に行なうことが可能であるが、例えば、原本の文字上をラインマーカで印をつけた処理などを実行した場合、あるいはマーカやマジックなどで追記された文字など、比較的太い追記情報に対する修復は、正確に行なうことが難しいという問題がある。
特開平08−063546号公報 特開2004−213230号公報
In addition, in the configuration in which the postscript information is acquired by repairing the interruption, the repair of the postscript information consisting of fine lines such as characters added by a pen or pencil can be performed relatively accurately. There is a problem that it is difficult to accurately restore relatively thick additional information such as when processing is performed by marking the original character with a line marker, or characters added by a marker or magic. .
Japanese Patent Laid-Open No. 08-063546 JP 2004-213230 A

本発明は、上述の問題点に鑑みてなされたものであり、例えばドキュメントからの追記情報抽出処理において、追記情報抽出対象文書と原本との差分に基づいて抽出される差分データなどに含まれる欠損部を、効率的に正確に修復することを可能とするものであり、特に太い線分を持つ追記情報について、その欠損部を正確に修復して、追記情報を正確に取得可能とした画像処理装置、および画像処理方法、並びにコンピュータ・プログラムを提供することを目的とする。 The present invention has been made in view of the above-described problems. For example, in the postscript information extraction processing from a document, the missing data included in the difference data extracted based on the difference between the postscript information extraction target document and the original Image processing that makes it possible to accurately and efficiently recover the missing part, especially for the postscript information with a thick line segment. An object is to provide an apparatus, an image processing method, and a computer program.

本発明の第1の側面は、
欠損部を有する修復対象データを入力し、欠損部を解消した復元データを生成する画像処理を実行する画像処理装置であり、
原本ドキュメントに対して追記処理のなされた追記ドキュメントに基づく追記ドキュメント画像データを入力し、該追記ドキュメント画像から追記情報を抽出した追記抽出画像を生成する追記情報抽出手段と、
前記追記情報抽出手段の生成した追記抽出画像に含まれる追記情報の線幅を検出する追記線幅検出手段と、
前記追記線幅検出手段の検出した追記情報の線幅に応じて細線用の追記欠損部修復処理、または太線用の追記欠損部修復処理のいずれを実行するかを判定する処理切り替え手段と、
前記追記情報抽出手段の生成した追記抽出画像を入力し、前記処理切り替え手段によって処理対象として決定された太線追記情報に対して太線用の追記欠損部修復処理を実行する太線追記欠損部修復手段と、
前記追記情報抽出手段の生成した追記抽出画像を入力し、前記処理切り替え手段によって処理対象として決定された細線追記情報に対して細線用の追記欠損部修復処理を実行する細線追記欠損部修復手段と、
を有することを特徴とする画像処理装置にある。
The first aspect of the present invention is:
It is an image processing apparatus that performs image processing to input restoration target data having a missing part and generate restoration data that eliminates the missing part,
A postscript information extraction unit that inputs postscript document image data based on a postscript process that has been postscripted with respect to the original document, and generates a postscript extraction image obtained by extracting the postscript information from the postscript document image;
Additional line width detection means for detecting the line width of the additional information included in the additional recording extracted image generated by the additional information extraction means;
A process switching means for determining whether to perform additional write defect portion repair processing for fine lines or additional write defect portion repair processing for thick lines according to the line width of the additional write information detected by the additional write line width detection means;
A thick line additional write defect repairing unit that inputs the additional write extracted image generated by the additional write information extraction unit and executes a thick line additional write defect repair process on the thick line additional write information determined as a processing target by the process switching unit; ,
Fine line additional write defect portion repairing means for inputting the additional write extracted image generated by the additional write information extraction means and executing thin line additional write defect repair processing on the thin line additional write information determined as a processing target by the process switching means; ,
An image processing apparatus characterized by comprising:

さらに、本発明の画像処理装置の一実施態様において、前記太線追記欠損部修復手段は、膨張処理手段を有し、前記追記情報抽出手段の生成した追記抽出画像に含まれる追記情報の膨張処理による欠損部修復処理を実行する構成であることを特徴とする。 Furthermore, in one embodiment of the image processing apparatus of the present invention, the thick line additional write defect portion repairing means has an expansion processing means, and is based on an expansion process of additional write information included in the additional write extraction image generated by the additional write information extraction means. It is a structure which performs a defect | deletion part repair process, It is characterized by the above-mentioned.

さらに、本発明の画像処理装置の一実施態様において、前記細線追記欠損部修復手段は、細線化手段と、端点抽出手段と、端点接続手段を有し、前記追記情報抽出手段の生成した追記抽出画像に含まれる追記情報を前記細線化手段において細線化処理を実行し、前記端点抽出手段において、細線化処理結果に基づく端点抽出処理を実行し、前記端点接続手段において、抽出端点の接続処理を実行して欠損部修復処理を実行する構成であることを特徴とする。 Furthermore, in one embodiment of the image processing apparatus of the present invention, the thin line additional writing defect portion repairing means includes a thinning means, an end point extracting means, and an end point connecting means, and the additional writing extraction generated by the additional information extracting means. The additional information included in the image is subjected to thinning processing in the thinning means, the endpoint extraction means performs endpoint extraction processing based on the thinning processing result, and the endpoint connection means performs extraction endpoint connection processing. It is the structure which performs and performs a defect | deletion part repair process.

さらに、本発明の画像処理装置の一実施態様において、前記細線追記欠損部修復手段は、さらに、膨張処理手段を有し、前記端点接続手段において抽出端点の接続処理によって生成された端点接続データの膨張処理による欠損部修復処理を実行する構成であることを特徴とする。 Furthermore, in an embodiment of the image processing apparatus of the present invention, the thin line additional write defect portion repairing means further includes an expansion processing means, and the endpoint connection data generated by the endpoint connection means by the extraction endpoint connection processing. It is the structure which performs the defect part repair process by an expansion process, It is characterized by the above-mentioned.

さらに、本発明の画像処理装置の一実施態様において、前記追記線幅検出手段は、前記追記情報抽出手段の生成した追記抽出画像に含まれる追記情報を構成する画素に相当する有効画素数(N1)と、該追記情報の細線化データの構成画素数(N2)に基づいて、追記情報の線幅を、下式、
線幅=N1/N2
に従って算出する処理を実行する構成であることを特徴とする。
Furthermore, in one embodiment of the image processing apparatus of the present invention, the additional writing line width detecting means has a number of effective pixels (N1) corresponding to pixels constituting additional writing information included in the additional writing extracted image generated by the additional writing information extracting means. ) And the number of constituent pixels (N2) of the thinned data of the additional writing information, the line width of the additional writing information is expressed by the following equation:
Line width = N1 / N2
It is the structure which performs the process calculated according to this.

さらに、本発明の画像処理装置の一実施態様において、前記処理切り替え手段は、前記追記線幅検出手段の検出した追記情報の線幅に応じて細線用の追記欠損部修復処理、または太線用の追記欠損部修復処理のいずれを実行するかを判定する処理において、予め固定した閾値を適用した判定処理を実行する構成であることを特徴とする。 Furthermore, in one embodiment of the image processing apparatus of the present invention, the process switching means is for adding a write-once missing portion for thin lines or processing for a thick line according to the line width of the postscript information detected by the postscript line width detection means. In the process of determining which of the additional write defect portion repair process is to be performed, the determination process is performed by applying a predetermined threshold value.

さらに、本発明の画像処理装置の一実施態様において、前記処理切り替え手段は、前記追記線幅検出手段の検出した追記情報の線幅に応じて細線用の追記欠損部修復処理、または太線用の追記欠損部修復処理のいずれを実行するかを判定する処理において、追記の実行されたドキュメントの文字サイズ、または行間隔に応じて決定する閾値を適用した判定処理を実行する構成であることを特徴とする。 Furthermore, in one embodiment of the image processing apparatus of the present invention, the process switching means is for adding a write-once missing portion for thin lines or processing for a thick line according to the line width of the postscript information detected by the postscript line width detection means. In the process of determining which of the additional write missing part repair process is executed, the determination process is performed by applying a threshold value that is determined according to the character size or line spacing of the document for which additional writing has been executed. And

さらに、本発明の画像処理装置の一実施態様において、前記追記情報抽出手段は、原本ドキュメント画像データと、前記追記ドキュメント画像データを入力し、2つの入力画像データの差分を抽出する差分抽出手段によって構成されることを特徴とする。 Furthermore, in one embodiment of the image processing apparatus of the present invention, the additional record information extraction unit is configured to input original document image data and the additional record document image data, and to extract a difference between the two input image data. It is characterized by being configured.

さらに、本発明の画像処理装置の一実施態様において、前記追記情報抽出手段は、追記ドキュメント画像データを入力し、該追記ドキュメント画像データから特定の色の記録情報を追記情報として抽出する色抽出手段によって構成されることを特徴とする。 Furthermore, in one embodiment of the image processing apparatus of the present invention, the additional record information extracting unit inputs the additional record document image data, and extracts color record information of a specific color from the additional record document image data as additional record information. It is characterized by comprising.

さらに、本発明の画像処理装置の一実施態様において、前記追記情報抽出手段は、追記ドキュメント画像データを入力し、該追記ドキュメント画像データから罫線情報を削除し、罫線情報以外の情報を追記情報として抽出する罫線分離手段によって構成されることを特徴とする。 Furthermore, in one embodiment of the image processing apparatus of the present invention, the additional record information extracting means inputs the additional record document image data, deletes ruled line information from the additional record document image data, and uses information other than the ruled line information as additional record information. It is characterized by comprising ruled line separating means for extracting.

さらに、本発明の第2の側面は、
欠損部を有する修復対象データを入力し、欠損部を解消した復元データを生成する画像処理を実行する画像処理装置であり、
原本ドキュメントに対して追記処理のなされた追記ドキュメントに基づく追記ドキュメント画像データを入力し、該追記ドキュメント画像から追記情報を抽出した追記抽出画像を生成する追記情報抽出手段と、
前記追記情報抽出手段の生成した追記抽出画像を入力し、予め定められた第1の処理シーケンスに従って、追記欠損部修復処理を実行する第1追記欠損部修復手段と、
前記追記情報抽出手段の生成した追記抽出画像を入力し、前記第1の処理シーケンスとは異なる予め定められた第2の処理シーケンスに従って、追記欠損部修復処理を実行する第2追記欠損部修復手段と、
前記第1追記欠損部修復手段の処理結果と、前記第2追記欠損部修復手段の処理結果とのOR処理を実行して、最終的な追記欠損部修復処理結果データを生成するOR処理手段と、
を有することを特徴とする画像処理装置にある。
Furthermore, the second aspect of the present invention provides
It is an image processing apparatus that performs image processing to input restoration target data having a missing part and generate restoration data that eliminates the missing part,
A postscript information extraction unit that inputs postscript document image data based on a postscript process that has been postscripted with respect to the original document, and generates a postscript extraction image obtained by extracting the postscript information from the postscript document image;
A first additional write defect repairing unit that inputs the additional write extraction image generated by the additional write information extraction unit and executes the additional write defect repairing process according to a predetermined first processing sequence;
Second write-once deficient part repairing means for inputting a postscript extracted image generated by the postscript information extracting means and executing a postscript missing part repairing process according to a predetermined second processing sequence different from the first processing sequence When,
OR processing means for executing final processing of the processing result of the first additional writing defect portion repairing means and the processing result of the second additional writing defect portion repairing means to generate final additional writing defect portion repair processing result data ,
An image processing apparatus characterized by comprising:

さらに、本発明の画像処理装置の一実施態様において、前記第1追記欠損部修復手段は、膨張処理手段を有し、前記追記情報抽出手段の生成した追記抽出画像に含まれる追記情報の膨張処理による欠損部修復処理を実行する構成であることを特徴とする。 Furthermore, in an embodiment of the image processing apparatus of the present invention, the first additional write defect portion repairing unit includes an expansion processing unit, and an expansion process of the additional write information included in the additional write extracted image generated by the additional write information extraction unit. It is the structure which performs the defect | deletion part repair process by.

さらに、本発明の画像処理装置の一実施態様において、前記第2追記欠損部修復手段は、細線化手段と、端点抽出手段と、端点接続手段と膨張処理手段を有し、前記追記情報抽出手段の生成した追記抽出画像に含まれる追記情報を前記細線化手段において細線化処理を実行し、前記端点抽出手段において、細線化処理結果に基づく端点抽出処理を実行し、前記端点接続手段において、抽出端点の接続処理を実行し、前記膨張処理手段において、前記端点接続手段における抽出端点の接続処理によって生成された端点接続データの膨張処理を実行して、欠損部修復処理を実行する構成であることを特徴とする。 Furthermore, in an embodiment of the image processing apparatus of the present invention, the second additional write defect repairing means includes a thinning means, an end point extraction means, an end point connection means, and an expansion processing means, and the additional write information extraction means. The thinning means executes the thinning process in the thinning means, the endpoint extraction means executes the endpoint extraction process based on the thinning processing result, and the endpoint connection means extracts End point connection processing is executed, and in the expansion processing means, the end point connection data generated by the extraction end point connection processing in the end point connection means is executed to execute defect portion repair processing. It is characterized by.

さらに、本発明の画像処理装置の一実施態様において、前記追記情報抽出手段は、原本ドキュメント画像データと、前記追記ドキュメント画像データを入力し、2つの入力画像データの差分を抽出する差分抽出手段によって構成されることを特徴とする。 Furthermore, in one embodiment of the image processing apparatus of the present invention, the additional record information extraction unit is configured to input original document image data and the additional record document image data, and to extract a difference between the two input image data. It is characterized by being configured.

さらに、本発明の画像処理装置の一実施態様において、前記追記情報抽出手段は、追記ドキュメント画像データを入力し、該追記ドキュメント画像データから特定の色の記録情報を追記情報として抽出する色抽出手段によって構成されることを特徴とする。 Furthermore, in one embodiment of the image processing apparatus of the present invention, the additional record information extracting unit inputs the additional record document image data, and extracts color record information of a specific color from the additional record document image data as additional record information. It is characterized by comprising.

さらに、本発明の画像処理装置の一実施態様において、前記追記情報抽出手段は、追記ドキュメント画像データを入力し、該追記ドキュメント画像データから罫線情報を削除し、罫線情報以外の情報を追記情報として抽出する罫線分離手段によって構成されることを特徴とする。 Furthermore, in one embodiment of the image processing apparatus of the present invention, the additional record information extracting means inputs the additional record document image data, deletes ruled line information from the additional record document image data, and uses information other than the ruled line information as additional record information. It is characterized by comprising ruled line separating means for extracting.

さらに、本発明の第3の側面は、
欠損部を有する修復対象データを入力し、欠損部を解消した復元データを生成する画像処理を実行する画像処理方法であり、
原本ドキュメントに対して追記処理のなされた追記ドキュメントに基づく追記ドキュメント画像データを入力し、該追記ドキュメント画像から追記情報を抽出した追記抽出画像を生成する追記情報抽出ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像に含まれる追記情報の線幅を検出する追記線幅検出ステップと、
前記追記線幅検出ステップにおいて検出した追記情報の線幅に応じて細線用の追記欠損部修復処理、または太線用の追記欠損部修復処理のいずれを実行するかを判定する処理切り替えステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、前記処理切り替えステップにおいて処理対象として決定された太線追記情報に対して太線用の追記欠損部修復処理を実行する太線追記欠損部修復ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、前記処理切り替えステップにおいて処理対象として決定された細線追記情報に対して細線用の追記欠損部修復処理を実行する細線追記欠損部修復ステップと、
を有することを特徴とする画像処理方法にある。
Furthermore, the third aspect of the present invention provides
It is an image processing method for inputting image data to be repaired having a missing part and executing image processing to generate restoration data in which the missing part is eliminated,
A postscript information extraction step of inputting postscript document image data based on a postscript process that has been postscripted with respect to the original document, and generating a postscript extraction image obtained by extracting the postscript information from the postscript document image;
An additional writing line width detecting step for detecting a line width of additional writing information included in the additional writing extracted image generated in the additional writing information extraction step;
A process switching step for determining whether to perform additional writing defect portion repair processing for thin lines or additional writing defect portion repair processing for thick lines according to the line width of the additional writing information detected in the additional writing line width detection step;
A thick line additional write defect repair step for inputting the additional write extracted image generated in the additional write information extraction step and executing a thick line additional write defect repair process for the thick line additional write information determined as a processing target in the process switching step; ,
A thin line additional write defect repairing step that inputs the additional write extracted image generated in the additional write information extraction step and executes a thin line additional write defect repair process on the thin line additional write information determined as a processing target in the process switching step; ,
An image processing method characterized by comprising:

さらに、本発明の画像処理方法の一実施態様において、前記太線追記欠損部修復ステップは、前記追記情報抽出ステップにおいて生成した追記抽出画像に含まれる追記情報の膨張処理による欠損部修復処理を実行することを特徴とする。 Furthermore, in one embodiment of the image processing method of the present invention, the thick line additional write defect portion repairing step executes a defective portion repair process by an expansion process of additional write information included in the additional write extraction image generated in the additional write information extraction step. It is characterized by that.

さらに、本発明の画像処理方法の一実施態様において、前記細線追記欠損部修復ステップは、前記追記情報抽出ステップにおいて生成した追記抽出画像に含まれる追記情報の細線化処理を実行し、細線化処理結果に基づく端点抽出処理を実行し、さらに、抽出端点の接続処理を実行して欠損部修復処理を実行するステップであることを特徴とする。 Furthermore, in one embodiment of the image processing method of the present invention, the thin line additional writing defect portion repairing step performs thinning processing of the additional writing information included in the additional writing extracted image generated in the additional writing information extracting step, and the thinning process is performed. It is a step of executing an end point extraction process based on the result, and further executing an extraction end point connection process to execute a defect portion repair process.

さらに、本発明の画像処理方法の一実施態様において、前記細線追記欠損部修復ステップは、さらに、前記端点の接続処理によって生成された端点接続データの膨張処理を実行することを特徴とする。 Furthermore, in one embodiment of the image processing method of the present invention, the thin line additional write defect portion repairing step further executes an expansion process of the end point connection data generated by the end point connection process.

さらに、本発明の画像処理方法の一実施態様において、前記追記線幅検出ステップは、前記追記情報抽出ステップの生成した追記抽出画像に含まれる追記情報を構成する画素に相当する有効画素数(N1)と、該追記情報の細線化データの構成画素数(N2)に基づいて、追記情報の線幅を、下式、
線幅=N1/N2
に従って算出する処理を実行することを特徴とする。
Furthermore, in an embodiment of the image processing method of the present invention, the additional line width detecting step includes the number of effective pixels (N1) corresponding to the pixels constituting the additional write information included in the additional write extracted image generated by the additional write information extraction step. ) And the number of constituent pixels (N2) of the thinned data of the additional writing information, the line width of the additional writing information is expressed by the following equation:
Line width = N1 / N2
The process of calculating according to is performed.

さらに、本発明の画像処理方法の一実施態様において、前記処理切り替えステップは、前記追記線幅検出ステップにおいて検出した追記情報の線幅に応じて細線用の追記欠損部修復処理、または太線用の追記欠損部修復処理のいずれを実行するかを判定する処理において、予め固定した閾値を適用した判定処理を実行することを特徴とする。 Furthermore, in an embodiment of the image processing method of the present invention, the process switching step includes a thin line additional write defect repair process or a thick line depending on the line width of the additional write information detected in the additional write line width detecting step. In the process of determining which of the additional write defect portion repair process is to be performed, a determination process to which a pre-fixed threshold is applied is performed.

さらに、本発明の画像処理方法の一実施態様において、前記処理切り替えステップは、前記追記線幅検出ステップにおいて検出した追記情報の線幅に応じて細線用の追記欠損部修復処理、または太線用の追記欠損部修復処理のいずれを実行するかを判定する処理において、追記の実行されたドキュメントの文字サイズ、または行間隔に応じて決定する閾値を適用した判定処理を実行することを特徴とする。 Furthermore, in an embodiment of the image processing method of the present invention, the process switching step includes a thin line additional write defect repair process or a thick line depending on the line width of the additional write information detected in the additional write line width detecting step. In the process of determining which of the additional writing missing part repairing process is executed, a determination process is performed in which a threshold value determined in accordance with the character size or line spacing of the document for which additional writing has been executed is applied.

さらに、本発明の画像処理方法の一実施態様において、前記追記情報抽出ステップは、原本ドキュメント画像データと、前記追記ドキュメント画像データを入力し、2つの入力画像データの差分を抽出する差分抽出処理を実行するステップであることを特徴とする。 Furthermore, in one embodiment of the image processing method of the present invention, the additional information extracting step includes a difference extraction process of inputting the original document image data and the additional document image data and extracting a difference between the two input image data. It is a step to be executed.

さらに、本発明の画像処理方法の一実施態様において、前記追記情報抽出ステップは、追記ドキュメント画像データを入力し、該追記ドキュメント画像データから特定の色の記録情報を追記情報として抽出する色抽出処理を実行するステップであることを特徴とする。 Further, in one embodiment of the image processing method of the present invention, the additional information extraction step inputs color additional document image data, and extracts a specific color recording information from the additional document image data as additional information. It is the step which performs.

さらに、本発明の画像処理方法の一実施態様において、前記追記情報抽出ステップは、追記ドキュメント画像データを入力し、該追記ドキュメント画像データから罫線情報を削除し、罫線情報以外の情報を追記情報として抽出する罫線分離処理を実行するステップであることを特徴とする。 Further, in one embodiment of the image processing method of the present invention, the additional information extraction step inputs additional document image data, deletes ruled line information from the additional document image data, and uses information other than the ruled line information as additional information. It is a step for executing a ruled line separation process to be extracted.

さらに、本発明の第4の側面は、
欠損部を有する修復対象データを入力し、欠損部を解消した復元データを生成する画像処理を実行する画像処理方法であり、
原本ドキュメントに対して追記処理のなされた追記ドキュメントに基づく追記ドキュメント画像データを入力し、該追記ドキュメント画像から追記情報を抽出した追記抽出画像を生成する追記情報抽出ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、予め定められた第1の処理シーケンスに従って、追記欠損部修復処理を実行する第1追記欠損部修復ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、前記第1の処理シーケンスとは異なる予め定められた第2の処理シーケンスに従って、追記欠損部修復処理を実行する第2追記欠損部修復ステップと、
前記第1追記欠損部修復ステップにおける処理結果と、前記第2追記欠損部修復ステップにおける処理結果とのOR処理を実行して、最終的な追記欠損部修復処理結果データを生成するOR処理ステップと、
を有することを特徴とする画像処理方法にある。
Furthermore, the fourth aspect of the present invention provides
It is an image processing method for inputting image data to be repaired having a missing part and executing image processing to generate restoration data in which the missing part is eliminated,
A postscript information extraction step of inputting postscript document image data based on a postscript process that has been postscripted with respect to the original document, and generating a postscript extraction image obtained by extracting the postscript information from the postscript document image;
A first additional write defect repair step that inputs the additional write extracted image generated in the additional write information extraction step and executes the additional write defect repair process according to a predetermined first processing sequence;
Second write-once defect portion repair step of inputting the postscript extraction image generated in the postscript information extraction step and executing the post-write defect portion repairing process according to a predetermined second processing sequence different from the first processing sequence When,
An OR processing step of performing OR processing of the processing result in the first additional write defect portion repair step and the processing result in the second additional write defect portion repair step to generate final additional write defect portion repair processing result data; ,
An image processing method characterized by comprising:

さらに、本発明の画像処理方法の一実施態様において、前記第1追記欠損部修復ステップは、前記追記情報抽出ステップにおいて生成した追記抽出画像に含まれる追記情報の膨張処理による欠損部修復処理を実行するステップであることを特徴とする。 Furthermore, in one embodiment of the image processing method of the present invention, the first additional write defect portion repairing step performs a defective portion repair process by an expansion process of additional write information included in the additional write extraction image generated in the additional write information extraction step. It is a step to perform.

さらに、本発明の画像処理方法の一実施態様において、前記第2追記欠損部修復ステップは、前記追記情報抽出ステップにおいて生成した追記抽出画像に含まれる追記情報の細線化処理を実行し、細線化処理結果に基づく端点抽出処理を実行し、抽出端点の接続処理を実行し、抽出端点の接続処理によって生成された端点接続データの膨張処理を実行して、欠損部修復処理を実行するステップであることを特徴とする。 Furthermore, in one embodiment of the image processing method of the present invention, the second additional write defect portion repairing step performs thinning processing of the additional writing information included in the additional writing extracted image generated in the additional writing information extraction step, and the thinning is performed. This is a step of executing the end point extraction processing based on the processing result, executing the extraction end point connection processing, executing the end point connection data generated by the extraction end point connection processing, and executing the missing portion repair processing. It is characterized by that.

さらに、本発明の画像処理方法の一実施態様において、前記追記情報抽出ステップは、原本ドキュメント画像データと、前記追記ドキュメント画像データを入力し、2つの入力画像データの差分を抽出する差分抽出処理を実行するステップであることを特徴とする。 Furthermore, in one embodiment of the image processing method of the present invention, the additional information extracting step includes a difference extraction process of inputting the original document image data and the additional document image data and extracting a difference between the two input image data. It is a step to be executed.

さらに、本発明の画像処理方法の一実施態様において、前記追記情報抽出ステップは、追記ドキュメント画像データを入力し、該追記ドキュメント画像データから特定の色の記録情報を追記情報として抽出する色抽出処理を実行するステップであることを特徴とする。 Further, in one embodiment of the image processing method of the present invention, the additional information extraction step inputs color additional document image data, and extracts a specific color recording information from the additional document image data as additional information. It is the step which performs.

さらに、本発明の画像処理方法の一実施態様において、前記追記情報抽出ステップは、追記ドキュメント画像データを入力し、該追記ドキュメント画像データから罫線情報を削除し、罫線情報以外の情報を追記情報として抽出する罫線分離処理を実行するステップであることを特徴とする。 Further, in one embodiment of the image processing method of the present invention, the additional information extraction step inputs additional document image data, deletes ruled line information from the additional document image data, and uses information other than the ruled line information as additional information. It is a step for executing a ruled line separation process to be extracted.

さらに、本発明の第5の側面は、
画像処理装置において、欠損部を有する修復対象データを入力し、欠損部を解消した復元データを生成する画像処理を実行させるコンピュータ・プログラムであり、
原本ドキュメントに対して追記処理のなされた追記ドキュメントに基づく追記ドキュメント画像データを入力し、該追記ドキュメント画像から追記情報を抽出した追記抽出画像を生成する追記情報抽出ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像に含まれる追記情報の線幅を検出する追記線幅検出ステップと、
前記追記線幅検出ステップにおいて検出した追記情報の線幅に応じて細線用の追記欠損部修復処理、または太線用の追記欠損部修復処理のいずれを実行するかを判定する処理切り替えステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、前記処理切り替えステップにおいて処理対象として決定された太線追記情報に対して太線用の追記欠損部修復処理を実行する太線追記欠損部修復ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、前記処理切り替えステップにおいて処理対象として決定された細線追記情報に対して細線用の追記欠損部修復処理を実行する細線追記欠損部修復ステップと、
を実行させることを特徴とするコンピュータ・プログラムにある。
Furthermore, the fifth aspect of the present invention provides
In the image processing apparatus, a computer program for executing image processing for inputting restoration target data having a defect portion and generating restoration data in which the defect portion is eliminated,
A postscript information extraction step of inputting postscript document image data based on a postscript process that has been postscripted with respect to the original document, and generating a postscript extraction image obtained by extracting the postscript information from the postscript document image;
An additional writing line width detecting step for detecting a line width of additional writing information included in the additional writing extracted image generated in the additional writing information extraction step;
A process switching step for determining whether to perform additional writing defect portion repair processing for thin lines or additional writing defect portion repair processing for thick lines according to the line width of the additional writing information detected in the additional writing line width detection step;
A thick line additional write defect repair step for inputting the additional write extracted image generated in the additional write information extraction step and executing a thick line additional write defect repair process for the thick line additional write information determined as a processing target in the process switching step; ,
A thin line additional write defect repairing step that inputs the additional write extracted image generated in the additional write information extraction step and executes a thin line additional write defect repair process on the thin line additional write information determined as a processing target in the process switching step; ,
In a computer program characterized by causing

さらに、本発明の第6の側面は、
画像処理装置において、欠損部を有する修復対象データを入力し、欠損部を解消した復元データを生成する画像処理を実行させるコンピュータ・プログラムであり、
原本ドキュメントに対して追記処理のなされた追記ドキュメントに基づく追記ドキュメント画像データを入力し、該追記ドキュメント画像から追記情報を抽出した追記抽出画像を生成する追記情報抽出ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、予め定められた第1の処理シーケンスに従って、追記欠損部修復処理を実行する第1追記欠損部修復ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、前記第1の処理シーケンスとは異なる予め定められた第2の処理シーケンスに従って、追記欠損部修復処理を実行する第2追記欠損部修復ステップと、
前記第1追記欠損部修復ステップにおける処理結果と、前記第2追記欠損部修復ステップにおける処理結果とのOR処理を実行して、最終的な追記欠損部修復処理結果データを生成するOR処理ステップと、
を実行させることを特徴とするコンピュータ・プログラムにある。
Furthermore, the sixth aspect of the present invention provides
In the image processing apparatus, a computer program for executing image processing for inputting restoration target data having a defect portion and generating restoration data in which the defect portion is eliminated,
A postscript information extraction step of inputting postscript document image data based on a postscript process that has been postscripted with respect to the original document, and generating a postscript extraction image obtained by extracting the postscript information from the postscript document image;
A first additional write defect repair step that inputs the additional write extracted image generated in the additional write information extraction step and executes the additional write defect repair process according to a predetermined first processing sequence;
Second write-once defect portion repair step of inputting the postscript extraction image generated in the postscript information extraction step and executing the post-write defect portion repairing process according to a predetermined second processing sequence different from the first processing sequence When,
An OR processing step of performing OR processing of the processing result in the first additional write defect portion repair step and the processing result in the second additional write defect portion repair step to generate final additional write defect portion repair processing result data; ,
In a computer program characterized by causing

なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能なコンピュータシステムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやFD、MOなどの記録媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータシステム上でプログラムに応じた処理が実現される。 Note that the computer program of the present invention is a recording medium provided in a computer-readable format for a computer system capable of executing various program codes, for example, a recording medium such as a CD, FD, or MO. A computer program that can be provided by a medium or a communication medium such as a network. By providing such a program in a computer-readable format, processing corresponding to the program is realized on the computer system.

本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 Other objects, features, and advantages of the present invention will become apparent from a more detailed description based on embodiments of the present invention described later and the accompanying drawings. In this specification, the system is a logical set configuration of a plurality of devices, and is not limited to one in which the devices of each configuration are in the same casing.

本発明の構成によれば、例えば原本ドキュメントと、追記データの付加された追記ドキュメントの差分データのように欠損部を有するデータについての欠損部を解消する修復処理を効率的にかつ正確に実行することができる。具体的には、本発明の画像処理装置の一実施例構成では、追記抽出画像に含まれる欠損部を有する追記情報の線幅を検出し、線幅が細い場合と太い場合とで、それぞれの線幅に適合した処理シーケンスに従った欠損部修復処理を実行する。具体的には、追記情報が太線である場合は膨張処理による修復を実行し、細線である場合は、細線化処理、端点抽出処理、端点接続処理による修復処理を実行する。本構成によって、線幅に応じた最適な欠損部修復が可能となり、より精度の高い追記情報を生成することが可能となる。 According to the configuration of the present invention, for example, a repair process that eliminates a missing portion of data having a missing portion, such as difference data between an original document and a postscript document to which additional data is added, is executed efficiently and accurately. be able to. Specifically, in the configuration of an embodiment of the image processing apparatus of the present invention, the line width of the postscript information having a defect portion included in the postscript extracted image is detected, and the line width is thin and the case where the line width is thick, respectively. Execute defect repair processing according to the processing sequence that matches the line width. Specifically, when the additional writing information is a thick line, restoration by expansion processing is executed, and when it is a thin line, restoration processing by thinning processing, endpoint extraction processing, and endpoint connection processing is executed. With this configuration, it is possible to optimally repair the missing portion according to the line width, and it is possible to generate additional information with higher accuracy.

また、本発明の一実施例構成によれば、複数の異なる処理シーケンスによる追記情報の欠損部修復処理を並列に実行し、これらの複数の処理結果に基づくOR処理結果を生成して、このOR処理結果を最終的な欠損部修復結果とする。本構成によれば、一方の修復処理シーケンスにおいて修復できなかった欠損部を他方の修復処理シーケンスの結果に基づいて補うことが可能となり、結果としてより完全性の高い追記情報を生成することが可能となる。 Further, according to the configuration of one embodiment of the present invention, the missing information repair processing of the additional information by a plurality of different processing sequences is performed in parallel, and an OR processing result based on the plurality of processing results is generated, and this OR The processing result is the final defect repair result. According to this configuration, it is possible to compensate for a defective portion that could not be repaired in one repair processing sequence based on the result of the other repair processing sequence, and as a result, it is possible to generate additional information with higher completeness. It becomes.

本発明の画像処理装置を適用した処理の概要について説明する図である。It is a figure explaining the outline | summary of the process to which the image processing apparatus of this invention is applied. 原本ドキュメントと、追記ドキュメントからの差分データの生成例について説明する図である。It is a figure explaining the example of a production | generation of the difference data from an original document and a postscript document. 本発明の画像処理装置による処理対象データ例について説明する図である。It is a figure explaining the example of processing target data by the image processing apparatus of this invention. 本発明の画像処理装置一実施例構成を示すブロック図である。1 is a block diagram showing the configuration of an embodiment of an image processing apparatus of the present invention. 本発明の画像処理装置において実行する差分抽出処理の具体的な処理例について説明する図である。It is a figure explaining the specific process example of the difference extraction process performed in the image processing apparatus of this invention. 本発明の画像処理装置において実行する追記情報の線幅検出処理の具体的な処理例について説明する図である。It is a figure explaining the specific process example of the line | wire width detection process of the postscript information performed in the image processing apparatus of this invention. 本発明の画像処理装置一実施例構成を示すブロック図である。1 is a block diagram showing the configuration of an embodiment of an image processing apparatus of the present invention. 本発明の画像処理装置において実行する膨張処理の具体的な処理例について説明する図である。It is a figure explaining the specific process example of the expansion process performed in the image processing apparatus of this invention. 本発明の画像処理装置において実行する細線化処理の具体的な処理例について説明する図である。It is a figure explaining the specific process example of the thinning process performed in the image processing apparatus of this invention. 本発明の画像処理装置において実行する端点抽出処理の具体的な処理例について説明する図である。It is a figure explaining the specific process example of the endpoint extraction process performed in the image processing apparatus of this invention. 本発明の画像処理装置において実行する接続端点ペア抽出処理の具体的な処理例について説明する図である。It is a figure explaining the specific process example of the connection endpoint pair extraction process performed in the image processing apparatus of this invention. 本発明の画像処理装置において実行する端点接続処理の具体的な処理例について説明する図である。It is a figure explaining the specific process example of the end point connection process performed in the image processing apparatus of this invention. 本発明の画像処理装置における処理シーケンスを説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining the process sequence in the image processing apparatus of this invention. 本発明の画像処理装置の一実施例構成を示すブロック図である。It is a block diagram which shows the one Example structure of the image processing apparatus of this invention. 本発明の画像処理装置の一実施例構成を示すブロック図である。It is a block diagram which shows the one Example structure of the image processing apparatus of this invention. 本発明の画像処理装置の一実施例構成を示すブロック図である。It is a block diagram which shows the one Example structure of the image processing apparatus of this invention. 本発明の画像処理装置の一実施例構成を示すブロック図である。It is a block diagram which shows the one Example structure of the image processing apparatus of this invention. 本発明の画像処理装置において実行する具体的な処理例について説明する図である。It is a figure explaining the specific process example performed in the image processing apparatus of this invention. 本発明の画像処理装置において実行する具体的な処理例について説明する図である。It is a figure explaining the specific process example performed in the image processing apparatus of this invention. 本発明の画像処理装置において実行する具体的な処理例について説明する図である。It is a figure explaining the specific process example performed in the image processing apparatus of this invention. 本発明の画像処理装置における処理シーケンスを説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining the process sequence in the image processing apparatus of this invention. 本発明の画像処理装置のハードウェア構成例について説明する図である。It is a figure explaining the hardware structural example of the image processing apparatus of this invention.

以下、図面を参照しながら本発明の実施形態に係る画像処理装置、および画像処理方法、並びにコンピュータ・プログラムの詳細について説明する。 Hereinafter, an image processing apparatus, an image processing method, and a computer program according to embodiments of the present invention will be described in detail with reference to the drawings.

まず、図1以下を参照して、本発明の画像処理装置を適用した処理の概要について説明する。本発明の画像処理装置は、例えば図1に示す原本ドキュメント10、および、原本ドキュメント10に対してコメントやアンダーラインなどの様々なメモ書きを含む追記ドキュメント20とから、差分を抽出して追記されたデータを取得する処理において、差分データの欠損部を修復する処理を行なう。なお、本発明の画像処理装置は、差分データのみならず、その他、様々な処理によって得られた欠損部を有するデータにおける欠損部を解消する処理に適用可能である。 First, an outline of processing to which the image processing apparatus of the present invention is applied will be described with reference to FIG. For example, the image processing apparatus of the present invention extracts a difference from the original document 10 shown in FIG. 1 and the additional document 20 including various memos such as comments and underlines and added to the original document 10. In the process of acquiring the data, a process for repairing the missing portion of the difference data is performed. Note that the image processing apparatus of the present invention can be applied not only to difference data, but also to processing for eliminating missing portions in data having missing portions obtained by various processes.

図1に示す例は、その1つの処理例であり、原本ドキュメント10と、追記ドキュメント20とをスキャナ30によって読み取り、原本ドキュメント画像データと、追記ドキュメント画像データを画像処理装置100に入力して、差分情報取得処理を行い、差分データに含まれる欠損部の修復を行なって追記情報を出力する処理である。 The example shown in FIG. 1 is an example of the processing. The original document 10 and the postscript document 20 are read by the scanner 30, and the original document image data and the postscript document image data are input to the image processing apparatus 100. This is a process of performing difference information acquisition processing, repairing a missing portion included in the difference data, and outputting additional information.

背景技術の欄において説明したように、従来の差分抽出では、原本と追記との重なり部分が途切れた情報が取得されるという問題がある。例えば図2に示すように、原本ドキュメント51と、追記ドキュメント52がある場合、本来追記情報は、線分データ53であるにもかかわらず、原本ドキュメント51と、追記ドキュメント52からの差分データを取得すると、追記抽出情報55に示すように、原本ドキュメント51と、追記ドキュメント52が途切れたデータとして検出され、正しい追記データの検出ができない。本発明では、これらの途切れを修復する処理を画像処理装置100において実行する。 As described in the background art section, in the conventional differential extraction, there is a problem that information in which the overlapping portion between the original and the additional recording is interrupted is acquired. For example, as shown in FIG. 2, when there are an original document 51 and a postscript document 52, difference data from the original document 51 and the postscript document 52 is acquired even though the postscript information is originally the line segment data 53. Then, as shown in the additional record extraction information 55, the original document 51 and the additional record document 52 are detected as data that is interrupted, and correct additional data cannot be detected. In the present invention, the image processing apparatus 100 executes processing for repairing these interruptions.

なお、本発明における画像処理では、図2に示す差分データに基づいて検出された追記情報の修復処理のみではなく、その他の手法によって取得された様々な欠損部を含む途切れたデータの修復も実行することができる。例えば、図3(A)は、原本画像を適用することなく、追記ドキュメント61画像のみから追記抽出情報62を抽出した処理例を示している。 In the image processing according to the present invention, not only repair processing of additional information detected based on the difference data shown in FIG. 2 but also repair of interrupted data including various missing portions acquired by other methods is executed. can do. For example, FIG. 3A shows a processing example in which the postscript extraction information 62 is extracted from only the postscript document 61 image without applying the original image.

例えば、追記データが原本画像データに含まれる異なる色(例えば赤)で記録されている場合、この追記色データのみを追記ドキュメント61から抽出する処理によって、追記抽出情報62が取得される。しかしこの場合も、原本データとの重なり部分は、途切れた画像として追記情報が取得される。 For example, when the additional recording data is recorded in a different color (for example, red) included in the original image data, the additional recording extraction information 62 is acquired by the process of extracting only the additional recording color data from the additional recording document 61. However, also in this case, the additional information is acquired as an interrupted image in the overlapping portion with the original data.

また、図3(B)は、罫線付きドキュメント71から罫線を除去した罫線除去情報72を取得した処理構成を示している。このような処理を行った場合、罫線部としての直線を除去することで、罫線との重なり部が除去されたデータが出力され、本来のデータの一部が欠落してしまう。 FIG. 3B shows a processing configuration in which ruled line removal information 72 obtained by removing ruled lines from the document 71 with ruled lines is acquired. When such processing is performed, by removing the straight line as the ruled line portion, data from which the overlapping portion with the ruled line is removed is output, and a part of the original data is lost.

本発明の画像処理装置100では、このような途切れ、欠落部を持つ画像データについて、欠損部を解消して、途切れのないデータを効率的にかつ正確に生成する処理を行なう。 The image processing apparatus 100 according to the present invention performs a process of efficiently and accurately generating uninterrupted data for image data having such discontinuities and missing portions by eliminating the missing portions.

本発明の画像処理装置の構成および処理の詳細について、図4以下を参照して説明する。本発明の画像処理装置では、欠損部の修復処理を、追記情報が細線である場合と、太線である場合とで切り替えて、異なる修復処理を実行する。すなわち、細線追記欠損部修復手段と、太線追記欠損部修復手段を設け、それぞれの修復手段において、細線の追記欠損部に適した修復処理、および太線の追記欠損部に適した修復処理を実行する。このように太い追記と細い追記に対して、それぞれ異なるシーケンスの欠損部修復処理を適用することで、より正確な欠損部修復が実現される。 Details of the configuration and processing of the image processing apparatus of the present invention will be described with reference to FIG. In the image processing apparatus of the present invention, the restoration process of the defective portion is switched between when the additional writing information is a thin line and when it is a thick line, and different restoration processes are executed. That is, a thin line additional write defect portion repairing means and a thick line additional write defect portion repair means are provided, and in each repair means, a repair process suitable for the thin line additional write defect part and a repair process suitable for the thick line additional write defect part are executed. . As described above, by applying the defect portion repair process of different sequences to the thick append writing and the thin append writing, more accurate defect portion repair is realized.

本発明の画像処理装置では、追記情報の線幅(太さ)を検出し、その線幅に応じた最適な欠損部(途切れ)修復処理を行い、修復精度を向上させる。追記情報が太いか細いかの判断手法としては、様々な手法が適用可能である。 In the image processing apparatus of the present invention, the line width (thickness) of the additional writing information is detected, and an optimal defect (discontinuity) repair process corresponding to the line width is performed to improve the repair accuracy. Various methods can be applied as a method for determining whether the postscript information is thick or thin.

追記情報の線幅が太いか細いかの判定においては、固定的な数値を閾値として適用する処理としてもよいが、固定的な数値を閾値として適用する処理ではなく、処理対象のドキュメントに応じた判定処理を行なう構成としてもよい。例えば、追記が重なっている文字に対して大きいか、小さいかによって判定する構成とする。すなわち、幅1mmのサインペンで書かれた追記でも、8ポイントなどの小さな文字とした場合は、太い追記として処理したほうが良い結果が得られるし、幅4mmのラインマーカで書かれた追記でも、36ポイントなどの大きな文字に重なったところでは、細い追記として処理する構成とするなどの処理である。 In determining whether the line width of additional information is thick or thin, it may be a process that applies a fixed numerical value as a threshold value, but it is not a process that applies a fixed numerical value as a threshold value, but a determination according to the document to be processed It is good also as a structure which performs a process. For example, the determination is made based on whether the additional writing is larger or smaller than the overlapping characters. In other words, even with an additional writing written with a 1 mm wide sign pen, if it is a small character such as 8 points, it is better to process it as a thick additional writing, and an additional writing written with a line marker of 4 mm width The process is such that a portion of a large character such as a point is processed as a thin postscript.

追記情報の線幅判定に際しては、ページ単位、行単位、文字単位など、様々な単位で、追記情報の線幅判定を行ない、判定結果に基づいて、細線追記欠損部修復手段、または太線追記欠損部修復手段のいずれかにおいて、欠損部修復処理を実行する。 When determining the line width of additional writing information, the line width of additional writing information is determined in various units such as page units, line units, and character units. Based on the determination result, thin line additional writing defect repair means, or thick line additional writing deletion In any of the part repairing means, the defective part repairing process is executed.

図4を参照して、本発明の画像処理装置の一実施例について説明する。図4に示す画像処理装置は、原本ドキュメント画像データ151と追記ドキュメント画像データ152を入力して差分を検出し、検出した差分データに基づいて途切れの修復を行なう処理例である。図4に示す画像処理装置は、差分抽出手段201、処理切り替え手段202、追記線幅検出手段203、太線追記欠損部修復手段204、細線追記欠損部修復手段205を有する。以下、これらの各処理手段の実行する処理について説明する。 With reference to FIG. 4, an embodiment of the image processing apparatus of the present invention will be described. The image processing apparatus shown in FIG. 4 is an example of processing in which original document image data 151 and postscript document image data 152 are input, a difference is detected, and breaks are repaired based on the detected difference data. The image processing apparatus shown in FIG. 4 includes a difference extraction unit 201, a process switching unit 202, a postscript line width detection unit 203, a thick line postscript defect part repair unit 204, and a thin line postscript defect part repair unit 205. Hereinafter, processing executed by each of these processing means will be described.

[差分抽出手段]
差分抽出手段201は、スキャナなどに読み取られた画像データとしての原本ドキュメント画像データ151と、原本に含まれない追記を含む追記ドキュメント画像データ152を入力して、これらのドキュメントから差分を抽出する。すなわち、追記された情報を2つのドキュメントの差分情報として読み取る。
[Difference extraction means]
The difference extraction means 201 inputs original document image data 151 as image data read by a scanner or the like and additional record document image data 152 including additional notes not included in the original, and extracts differences from these documents. That is, the added information is read as difference information between two documents.

差分抽出手段201は、位置合わせの行われた原本ドキュメント画像データ151と追記ドキュメント画像データ152との差分を抽出して、追記抽出画像データ153を出力する。この処理は、従来の処理と同様であり、特開2004−213230、特開2004−341914等に記載された処理と同様の処理として実行される。たとえば、原本ドキュメント画像データ151の座標位置(x,y)と、追記ドキュメント画像データ152の対応座標位置(x,y)の差分の有無を検出し、差分が存在する場合にのみデータを抽出する。 The difference extraction unit 201 extracts the difference between the original document image data 151 and the additionally-recorded document image data 152 that have been aligned, and outputs the additionally-recorded extracted image data 153. This process is the same as the conventional process, and is executed as a process similar to the process described in JP-A-2004-213230, JP-A-2004-341914, or the like. For example, the presence / absence of a difference between the coordinate position (x, y) of the original document image data 151 and the corresponding coordinate position (x, y) of the postscript document image data 152 is detected, and data is extracted only when the difference exists. .

差分抽出処理例について図5を参照して説明する。図5に示す例は、先に説明した図2と同様、原本ドキュメント301と、追記ドキュメント302から差分抽出を行なっている。追記ドキュメント202には、元々の原本ドキュメント301には含まれない追記された追記情報303が含まれる。差分抽出手段201は、原本ドキュメント301と、追記ドキュメント302から差分抽出を行なって、追記抽出画像データ304を生成する。ただし、図から理解されるように、差分抽出によって得られる追記抽出画像データ304に含まれる抽出情報は、原本データとの重なり部(図に示す原本に元々記載のある文字[1,2,3]との重なり部)が途切れた不完全な追記データである。この追記抽出画像データが、図4に示す差分抽出手段201の出力する追記抽出画像データ153に相当する。 An example of the difference extraction process will be described with reference to FIG. In the example shown in FIG. 5, difference extraction is performed from the original document 301 and the postscript document 302 as in FIG. 2 described above. The postscript document 202 includes postscript additional information 303 that is not included in the original original document 301. The difference extraction unit 201 performs difference extraction from the original document 301 and the additional writing document 302 to generate additional writing extracted image data 304. However, as can be understood from the figure, the extraction information included in the additionally-recorded extracted image data 304 obtained by the difference extraction has an overlapping portion with the original data (characters [1, 2, 3 that are originally described in the original shown in the figure]. ] Is an incomplete additional record data. This additional recording extracted image data corresponds to the additional recording extracted image data 153 output from the difference extraction unit 201 shown in FIG.

[処理切り替え手段、および追記線幅検出手段]
処理切り替え手段202、および追記線幅検出手段203の処理について説明する。追記線幅検出手段203は、図4に示す差分抽出手段201の出力する追記抽出画像データ153に含まれる追記情報の線幅を検出し、処理切り替え手段202は、追記線幅検出手段203の検出した追記情報の線幅に基づいて、追記情報に含まれる欠損部の修復処理を太線追記欠損部修復手段204、または細線追記欠損部修復手段205のいずれにおいて実行させるかを決定する。
[Process switching means and additional line width detection means]
Processing of the process switching unit 202 and the additional write line width detection unit 203 will be described. The additional recording line width detection unit 203 detects the line width of additional recording information included in the additional recording extracted image data 153 output from the difference extraction unit 201 shown in FIG. 4, and the process switching unit 202 detects the additional recording line width detection unit 203. Based on the line width of the additional write information, it is determined which of the thick line additional write defect repairing unit 204 or the thin line additional write defect repairing unit 205 performs the repair process of the defective part included in the additional write information.

追記線幅検出手段203における追記情報の線幅検出処理例について、図6を参照して説明する。追記情報の線幅検出処理の処理手法には、様々な手法が適用可能である。図6は、その一例を示している。図6に示す追記抽出画像データ304は、図4に示す差分抽出手段201の出力する追記抽出画像データ153に相当する。追記線幅検出手段203は、この追記抽出画像データ304の細線化処理を実行する。細線化処理は、追記抽出画像データ304に含まれる追記情報の線幅を1ドット(画素)幅に設定する処理として実行される。この細線化処理によって生成される画像を図6に示す細線化画像データ305とする。 An example of a line width detection process for additional information in the additional line width detection unit 203 will be described with reference to FIG. Various methods can be applied to the processing method of the line width detection process of the postscript information. FIG. 6 shows an example. The additional write extracted image data 304 shown in FIG. 6 corresponds to the additional write extracted image data 153 output from the difference extraction unit 201 shown in FIG. The postscript line width detection unit 203 executes thinning processing of the postscript extracted image data 304. The thinning process is executed as a process of setting the line width of the additional recording information included in the additional recording extracted image data 304 to a 1-dot (pixel) width. An image generated by this thinning process is assumed to be thinned image data 305 shown in FIG.

追記線幅検出手段203は、追記抽出画像データ304に含まれる追記情報の総ドット数(N1)と、細線化画像データ305に含まれる細線化データの総ドット数(N2)をカウントし、追記抽出画像データ304に含まれる追記情報の線幅を下式に従って算出する。
追記情報線幅=N1/N2
The postscript line width detection unit 203 counts the total number of dots (N1) of the postscript information included in the postscript extracted image data 304 and the total number of dots (N2) of the thinned data included in the thinned image data 305, and adds the additional data The line width of the additional information included in the extracted image data 304 is calculated according to the following formula.
Additional information line width = N1 / N2

処理切り替え手段202は、追記線幅検出手段203が算出した追記抽出画像データ304に含まれる追記情報の線幅(N1/N2)に基づいて、追記情報が太線であるか細線であるかを判定する。この判定は、例えば、処理切り替え手段202の保持する閾値(Th)に基づいて実行される。例えば、
追記情報線幅=N1/N2≧Th
であれば、追記情報は太線と判定し、
追記情報線幅=N1/N2<Th
であれば、追記情報は細線と判定する。
処理切り替え手段202において、追記情報が太線であると判定されると、図4に示す太線追記欠損部修復手段204に、修復処理対象データとしての追記抽出画像データ153が出力され、処理切り替え手段202において、追記情報が細線であると判定されると、図4に示す細線追記欠損部修復手段205に、修復処理対象データとしての追記抽出画像データ153が出力され、それぞれの修復手段において、異なる修復処理シーケンスに従って欠損部の修復処理が実行される。
The process switching unit 202 determines whether the postscript information is a thick line or a thin line based on the line width (N1 / N2) of the postscript information included in the postscript extracted image data 304 calculated by the postscript line width detection unit 203. To do. This determination is performed based on, for example, a threshold value (Th) held by the process switching unit 202. For example,
Postscript information line width = N1 / N2 ≧ Th
If so, the postscript information is determined to be a thick line,
Postscript information line width = N1 / N2 <Th
If so, the additional information is determined to be a thin line.
When the process switching unit 202 determines that the additional recording information is a thick line, the additional recording extracted image data 153 as the repair processing target data is output to the thick line additional recording missing part repairing unit 204 shown in FIG. 4, when the additional writing information is determined to be a thin line, the additional writing extracted image data 153 as the repair processing target data is output to the thin line additional writing defect portion repairing unit 205 shown in FIG. The defect repair process is executed according to the processing sequence.

なお、前述したように、処理切り替え手段202において実行する追記情報の線幅が太いか細いかの判定処理においては、上述したように固定的な数値を閾値として適用する処理としてもよいが、固定的な数値を閾値として適用する処理ではなく、処理対象のドキュメントに応じた判定処理を行なう構成としてもよい。すなわち、原本ドキュメント画像データ151を参照して、追記情報が重なっている文字に対して大きいか、小さいかによって判定する構成としてもよい。 As described above, in the process of determining whether the line width of the additional information to be executed by the process switching unit 202 is thick or thin, as described above, a fixed numerical value may be used as a threshold value. Instead of a process of applying a numerical value as a threshold value, a determination process according to a document to be processed may be performed. That is, a configuration may be adopted in which the original document image data 151 is referenced to determine whether the additional writing information is larger or smaller than the overlapping characters.

例えば、幅1mmのサインペンで書かれた追記でも、8ポイントなどの小さな文字として原本ドキュメント画像データ151に記録されている場合は、太い追記情報であると判定し、幅4mmのラインマーカで書かれた追記でも、36ポイントなどの大きな文字に重なったところでは、細い追記として判定するなどの処理を実行して、判定結果に基づいて、図4に示す太線追記欠損部修復手段204、または細線追記欠損部修復手段205に修復処理対象データとしての追記抽出画像データ153を出力する。なお、追記情報の線幅判定処理、および修復手段の適用切り替え処理は、ページ単位、行単位、文字単位など、様々な単位で処理を行なうことが可能である。例えば、原本ドキュメント画像データ151を参照して、文字部の行間隔を検出して、各行幅に対応した細線と太線の境界値としての閾値を設定する構成としてもよい。 For example, even if additional writing written with a 1 mm wide sign pen is recorded in the original document image data 151 as small characters such as 8 points, it is determined that the additional writing information is thick and written with a line marker of 4 mm wide. In addition to the additional writing, when a large character such as 36 points overlaps, processing such as determination as thin additional writing is executed, and based on the determination result, the thick line additional writing defect repairing unit 204 shown in FIG. The additionally extracted extracted image data 153 is output to the missing part repairing unit 205 as repair processing target data. Note that the additional information information line width determination processing and restoration means application switching processing can be performed in various units such as page units, line units, and character units. For example, referring to the original document image data 151, the line spacing of the character part may be detected, and a threshold value may be set as a boundary value between a thin line and a thick line corresponding to each line width.

このように、文字の大きさや行間隔などを検出する場合は、図7に示すように、処理切り替え手段202は、原本ドキュメント画像データ151を入力する構成として、追記情報が重なっている文字に対して大きいか、小さいか、あるいは行間隔に応じて追記情報が細線であるか太線であるかを判定する。 In this way, when detecting the character size, line spacing, and the like, as shown in FIG. 7, the process switching unit 202 is configured to input the original document image data 151 to the characters with the additional information to be overlapped. It is determined whether the additional writing information is a thin line or a thick line depending on the line spacing.

文字の大きさに基づいて追記情報が細線であるか太線であるかを判定する構成とする場合は、処理切り替え手段202は、原本ドキュメント画像データ151に含まれる文字の大きさを検出する文字外形検出手段と、文字の大きさを基準に追記情報が太線追記であるか細線追記であるかを判別する閾値を決定する閾値決定手段とを有する構成とする。なお、文字の大きさの検出処理は、OCRなどで文字を認識する前処理として用いられるレイアウト解析技術を適用することができる。また、閾値決定手段は、文字外形検出手段が検出した文字の外形(特に高さ)を基準に、例えば文字の高さの1/2を閾値として設定して適用するなどの処理を行なう構成とする。 In the case of determining whether the additional writing information is a thin line or a thick line based on the size of the character, the processing switching unit 202 detects the size of the character included in the original document image data 151. The detection means and a threshold value determination means for determining a threshold value for determining whether the additional writing information is a thick line additional writing or a thin line additional writing based on the character size. Note that a layout analysis technique used as a preprocessing for recognizing a character by OCR or the like can be applied to the character size detection process. Further, the threshold value determining means performs a process of setting and applying, for example, half of the character height as a threshold value based on the character outline (particularly height) detected by the character outline detecting means. To do.

また、行間隔に基づいて追記情報が細線であるか太線であるかを判定する構成とする場合は、行間隔を検出する行間隔検出手段と、行間隔に応じて追記情報が太線追記であるか細線追記であるかを判別する閾値を決定する閾値決定手段を持つ構成とする。なお、行間隔の検出処理は、OCRなどで文字を認識する前処理として用いられるレイアウト解析技術を適用することができる。また、閾値決定手段は、行間隔検出手段が検出した行の間隔を基準に、例えば行間隔の1/2を閾値として設定して適用するなどの処理を行なう構成とする。 In addition, when it is configured to determine whether the additional writing information is a thin line or a thick line based on the line interval, the line interval detecting means for detecting the line interval and the additional writing information according to the line interval are the thick line additional writing. It is assumed that there is a threshold value determining means for determining a threshold value for determining whether or not a thin line is additionally recorded. Note that a layout analysis technique used as a pre-process for recognizing characters by OCR or the like can be applied to the line interval detection process. Further, the threshold value determination unit is configured to perform processing such as setting and applying, for example, ½ of the line interval as a threshold value based on the line interval detected by the line interval detection unit.

[太線追記欠損部修復手段204]
次に、太線追記欠損部修復手段204における処理について説明する。太線追記欠損部修復手段204では、追記情報が太線であると判定された場合に、追記に含まれる欠損部の修復処理を、太線に適した処理によって実行する。
[Thick line additional writing defect repairing means 204]
Next, processing in the thick line additional write defect portion repairing means 204 will be described. When it is determined that the postscript information is a thick line, the thick line postscript missing part repairing unit 204 executes a repair process for the missing part included in the postscript by a process suitable for the thick line.

太線追記欠損部修復手段204は、太い追記の途切れを修復するのに適した修復処理を行なう。太い追記の途切れを修復するのに適した修復処理には、様々な手法があるが、その1つの膨張処理を適用した修復処理について、図8を参照して説明する。 The thick line additional writing defect portion repairing means 204 performs a repair process suitable for repairing the interruption of the thick additional writing. There are various methods for repair processing suitable for repairing the interruption of the thick additional writing. The repair processing to which one expansion processing is applied will be described with reference to FIG.

太線追記欠損部修復手段204は、追記抽出画像データ304を入力する。これは、図4に示す差分抽出手段201の生成した追記抽出画像データ153に相当する。太線追記欠損部修復手段204は、この追記抽出画像データ304に対して、膨張処理(太線化処理)を実行する。膨張処理(太線化処理)は、図8に示すように、修復処理対象の欠損部を有する追記情報311を上下左右にn画素膨らませる処理である。この膨張処理の結果、間隔の短い欠損部は、結合し、途切れが消滅する。この膨張処理によって、欠損部が解消した追記情報312を持つ膨張処理画像データ306が生成される。なお、膨張量nは、例えば3〜10画素など、処理対象画像に応じて決定する。この膨張処理画像データ306が図4に示す太線追記欠損部修復手段204の出力する修復追記抽出画像データ155に相当する。 The thick line postscript missing part repairing unit 204 inputs the postscript extracted image data 304. This corresponds to the additionally recorded extracted image data 153 generated by the difference extracting unit 201 shown in FIG. The thick line additional write missing part repairing unit 204 executes expansion processing (thick line processing) on the additional write extracted image data 304. As shown in FIG. 8, the expansion process (thickening process) is a process of expanding additional information 311 having a defective part to be repaired up, down, left and right by n pixels. As a result of the expansion process, the short gap portions are joined and the discontinuity disappears. By this expansion processing, expansion processing image data 306 having additional information 312 in which the missing portion is eliminated is generated. The expansion amount n is determined according to the processing target image, for example, 3 to 10 pixels. The expansion processed image data 306 corresponds to the repair additional write extracted image data 155 output from the thick line additional write missing portion repair unit 204 shown in FIG.

なお、太線追記欠損部修復手段204の実行する欠損部修復処理は、上述の膨張処理のみならず、太い追記の途切れを修復するのに適した修復処理なら他の手法を適用してもよい。例えば膨張処理は、追記の太さと途切れ幅の比が概ね3対1以下の場合に有効であり(膨張で途切れが修復できた時点で、追記の太さ変化が気にならない範囲)、ラインマーカのように太い追記はこの条件を満たすため、太線追記欠損部修復手段204の実行する修復処理として好ましい処理である。 It should be noted that the defect repair process executed by the thick line additional write defect repairing unit 204 is not limited to the above-described expansion process, and other techniques may be applied as long as the repair process is suitable for repairing a thick additional write break. For example, the expansion process is effective when the ratio between the thickness of the additional writing and the gap width is approximately 3 to 1 or less (the range in which the change in the thickness of the additional writing does not matter when the interruption is repaired by expansion), and the line marker Since thick additional writing satisfies this condition, it is a preferable processing as the repairing processing executed by the thick line additional writing missing portion repairing means 204.

[細線追記欠損部修復手段205]
次に、細線追記欠損部修復手段205における処理について説明する。細線追記欠損部修復手段205では、追記情報が細線であると判定された場合に、追記に含まれる欠損部の修復処理を、細線に適した処理によって実行する。
[Thin wire added defect portion repair means 205]
Next, processing in the thin line additional write defect portion repair unit 205 will be described. When it is determined that the additional writing information is a thin line, the thin line additional write defect portion repairing unit 205 executes a repair process for the defective portion included in the additional write by a process suitable for the thin line.

細線追記欠損部修復手段205は、細い追記の途切れを修復するのに適した修復処理を行なう。細い追記の途切れを修復するのに適した修復処理には、様々な手法があるが、その1つの修復処理例として、細線化処理と、端点抽出処理と、端点接続処理を実行する修復処理例について、図9以下を参照して説明する。 The thin line additional write defect portion repairing unit 205 performs a repair process suitable for repairing the interruption of the thin additional write. There are various methods for repair processing suitable for repairing the interruption of the thin additional recording. One example of the repair processing is a thinning processing, an end point extraction processing, and an end point connection processing. Will be described with reference to FIG.

細線追記欠損部修復手段205は、図9に示す追記抽出画像データ304を入力する。これは、図4に示す差分抽出手段201の生成した追記抽出画像データ153に相当する。細線追記欠損部修復手段205は、細線化手段を有し、細線化手段によって、この追記抽出画像データ304に含まれる欠損部を有する追記情報の細線化処理を実行して、細線化処理画像データ321を生成する。細線化処理画像データ321は、追記情報を例えば1画素の幅を持つ細線化したデータである。 The thin line additional write defect portion repairing unit 205 inputs the additional write extracted image data 304 shown in FIG. This corresponds to the additionally recorded extracted image data 153 generated by the difference extracting unit 201 shown in FIG. The thin line additional write defect portion repair unit 205 includes a thinning unit, and the thin line unit performs thinning processing of the additional write information including the defective portion included in the additional write extraction image data 304, thereby reducing the thinned image data. 321 is generated. The thinning processed image data 321 is data obtained by thinning the postscript information with a width of, for example, one pixel.

細線追記欠損部修復手段205は、さらに、端点抽出手段と、端点接続手段を有し、細線化処理画像データ321に含まれる細線化された追記情報から端点を抽出し、抽出端点を接続する処理を実行する。この処理について、図10、図11、図12を参照して説明する。細線追記欠損部修復手段205の端点抽出手段は、図10に示すように、細線化処理画像データ321に含まれる細線化された追記情報から端点を抽出する。図に示す端点抽出データ322は、P1〜P6の6点の端点が抽出された例を示している。 The thin line additional writing defect portion repairing unit 205 further includes an end point extracting unit and an end point connecting unit, and extracts the end points from the thinned additional recording information included in the thin line processing image data 321 and connects the extracted end points. Execute. This process will be described with reference to FIG. 10, FIG. 11, and FIG. As shown in FIG. 10, the end point extraction unit of the thin line additional write defect portion repair unit 205 extracts the end point from the thinned additional recording information included in the thinning processed image data 321. The endpoint extraction data 322 shown in the figure shows an example in which six endpoints P1 to P6 are extracted.

さらに、細線追記欠損部修復手段205の端点接続手段は、図11に示すように、端点抽出データ322から端点の接続関係を判定し、接続端点ペア抽出データ323を生成する。接続端点ペアの抽出処理は、例えば、以下の3つの処理のいずれかを適用して実行する。
a:接続端点ペアの検索対象としての端点の最近接端点を探索し、予め定めた閾値距離以内の端点を接続端点とする。
b:接続端点ペアの検索対象としての端点に連結する線分を構成する数ドットからその線分の延長方向を算出し、その方向にある最近接端点を接続端点とする。
c:接続端点ペアの検索対象としての端点に連結する線分を構成する数十ドットからその線分のフィティング曲線を算出し、その曲線の延長上に位置する最近接端点を接続端点とする。
Furthermore, as shown in FIG. 11, the end point connecting means of the thin line added defect portion repairing means 205 determines the connection relation of the end points from the end point extracted data 322, and generates the connected end point pair extracted data 323. The connection end point pair extraction process is executed by applying one of the following three processes, for example.
a: The nearest end point of the end point as the search target of the connection end point pair is searched, and the end point within a predetermined threshold distance is set as the connection end point.
b: The extension direction of the line segment is calculated from several dots constituting the line segment connected to the end point as the search target of the connection end point pair, and the closest end point in the direction is set as the connection end point.
c: A fitting curve of the line segment is calculated from tens of dots constituting the line segment connected to the end point to be searched for the connection end point pair, and the closest end point located on the extension of the curve is set as the connection end point. .

細線追記欠損部修復手段205の端点接続手段は、これらのa〜cのいずれかに対応する2つの端点が検出された場合、これらを接続端点ペアとして抽出し接続する処理を実行する。図11に示す接続端点ペア抽出データ323の例は、端点P2と端点P3、端点P4と端点P5が接続端点ペアとして抽出された例を示している。 When two end points corresponding to any one of these a to c are detected, the end point connecting unit of the thin line added defect portion repair unit 205 extracts and connects them as a connecting end point pair, and executes processing for connecting them. The example of the connection end point pair extraction data 323 shown in FIG. 11 shows an example in which the end point P2 and the end point P3, and the end point P4 and the end point P5 are extracted as connection end point pairs.

細線追記欠損部修復手段205の端点接続手段は、図12に示すように、接続端点ペア抽出データ323の接続端点ペア間の接続処理を実行して、端点接続データ324を生成する。この処理の結果、図12に示す端点接続データ324が生成される。この端点接続データ324が、図4に示す細線追記欠損部修復手段205の出力する修復追記抽出画像データ155に相当する。 As illustrated in FIG. 12, the end point connection unit of the thin line added defect portion repair unit 205 executes the connection process between the connection end point pairs of the connection end point pair extraction data 323 to generate end point connection data 324. As a result of this processing, end point connection data 324 shown in FIG. 12 is generated. This end point connection data 324 corresponds to the repair additional record extracted image data 155 output from the thin line additional record missing portion repair unit 205 shown in FIG.

なお、細線追記欠損部修復手段205の生成する端点接続データ324は、図12に示すように、細線データのままであるので、このデータに対して膨張処理を施して、太線化して出力する構成としてもよい。膨張処理(太線化処理)は、線分等の有効画像領域を上下左右にn画素膨らませる処理である。この処理により、細線化データは膨張し太線に復元される。この膨張処理結果データを修復追記抽出画像データ155として出力する構成としてもよい。 Note that the end point connection data 324 generated by the thin line added defect portion repairing unit 205 is still thin line data as shown in FIG. 12, so that this data is subjected to expansion processing and output as a thick line. It is good. The expansion process (thickening process) is a process of expanding an effective image area such as a line segment up, down, left, and right by n pixels. By this processing, the thinned data is expanded and restored to a thick line. The expansion processing result data may be output as the repair additional write extracted image data 155.

以上、説明したように、本発明の画像処理装置では、欠損部を有する追記情報の線幅に応じて、太線追記欠損部修復手段204と、細線追記欠損部修復手段205によって、それぞれ太線および細線の欠損部修復に適応した処理を実行する構成としたので、各追記情報の線幅に適応した最適な修復によって、より精度の高い追記情報修復が実現される。 As described above, in the image processing apparatus of the present invention, the thick line and the thin line added by the thick line additional write defect repairing unit 204 and the thin line additional write defect repairing unit 205 according to the line width of the additional write information having the defective part, respectively. Since the processing adapted to the repair of the missing portion is executed, more accurate additional information restoration is realized by the optimum restoration adapted to the line width of each additional information.

次に、図13に示すフローチャートを参照して、図4に示す画像処理装置において実行する処理シーケンスについて説明する。まず、ステップS101において、追記情報を含む追記ドキュメント画像データを取得する。これは、例えばスキャナなどによって読み取られた画像データである。さらに、ステップS102において、追記を含まない原本ドキュメント画像データを取得する。これも、例えばスキャナなどによって読み取られた画像データである。 Next, a processing sequence executed in the image processing apparatus shown in FIG. 4 will be described with reference to the flowchart shown in FIG. First, in step S101, postscript document image data including postscript information is acquired. This is image data read by, for example, a scanner. In step S102, original document image data that does not include additional writing is acquired. This is also image data read by, for example, a scanner.

ステップS103では、これらの2つの画像データに基づく差分抽出処理を実行する。図4に示す差分抽出手段201における処理であり、この結果として追記抽出画像データが生成される。ただし、この追記抽出画像データは、追記情報と、原本情報の重なり部が欠落した欠損部を含むデータとなる。 In step S103, a difference extraction process based on these two image data is executed. This is a process in the difference extraction means 201 shown in FIG. 4, and as a result, additional extracted image data is generated. However, this postscript extracted image data is data including a missing portion in which an overlap portion of the postscript information and the original information is missing.

次のステップS104〜S107の処理は、図4に示す追記線幅検出手段203の処理である。追記線幅検出手段203は、先に図6を参照して説明したように、まず、ステップS104において、追記抽出画像データに含まれる追記情報(有効画素)の総ドット数(N1)を算出する。次にステップS105において、追記抽出画像データの細線化処理を実行し、ステップS106において、追記抽出画像データの細線化データ(有効画素)の総ドット数(N2)をカウントする。さらに、ステップS107において、追記抽出画像データに含まれる追記情報の線幅を下式に従って算出する。
追記情報線幅=N1/N2
The processes of the next steps S104 to S107 are the processes of the postscript line width detection unit 203 shown in FIG. As described above with reference to FIG. 6, the postscript line width detection unit 203 first calculates the total number of dots (N1) of the postscript information (effective pixels) included in the postscript extraction image data in step S104. . Next, in step S105, thinning processing of the additionally recorded extracted image data is executed, and in step S106, the total number of dots (N2) of the thinned data (effective pixels) of the additionally recorded extracted image data is counted. Furthermore, in step S107, the line width of the additional recording information included in the additional recording extracted image data is calculated according to the following equation.
Additional information line width = N1 / N2

次のステップS108の判定処理は、図4に示す処理切り替え手段202の処理であり、処理切り替え手段202の保持する閾値(Th)に基づいて実行される。例えば、
追記情報線幅=N1/N2≧Th
であれば、追記情報は太線と判定し、
追記情報線幅=N1/N2<Th
であれば、追記情報は細線と判定し、追記情報が太線であると判定されると、図4に示す太線追記欠損部修復手段204に、修復処理対象データとしての追記抽出画像データ153を出力し、細線であると判定されると、細線追記欠損部修復手段205に、修復処理対象データとしての追記抽出画像データ153を出力する。なお、この判定処理は、先に説明したように、文字の大きさや行間隔などを考慮した判定処理を行なう構成としてもよい。
The determination process of the next step S108 is the process of the process switching unit 202 shown in FIG. 4 and is executed based on the threshold value (Th) held by the process switching unit 202. For example,
Postscript information line width = N1 / N2 ≧ Th
If so, the postscript information is determined to be a thick line,
Postscript information line width = N1 / N2 <Th
If it is determined that the additional writing information is a thin line, and it is determined that the additional writing information is a thick line, the additional writing extracted image data 153 as the repair processing target data is output to the thick line additional writing defect portion repairing unit 204 shown in FIG. If it is determined that the line is a thin line, the additionally-recorded extracted image data 153 is output to the thin line additional write missing part repairing unit 205 as the repair process target data. Note that, as described above, this determination processing may be configured to perform determination processing in consideration of character size, line spacing, and the like.

ステップS109の処理は、追記情報が太線であると判定された場合、図4に示す太線追記欠損部修復手段204において実行される太線を対象とした欠損部修復処理である。この処理は、先に図8を参照して説明したように、例えば膨張処理として実行される。 The process of step S109 is a defective portion repair process for the thick line executed by the thick line additional write defective portion repair unit 204 shown in FIG. 4 when it is determined that the additional write information is a thick line. This process is executed as an expansion process, for example, as described above with reference to FIG.

ステップS110の処理は、追記情報が細線であると判定された場合、図4に示す細線追記欠損部修復手段205において実行される細線を対象とした欠損部修復処理である。この処理は、先に図9〜図12を参照して説明したように、細線化処理、端点抽出処理、端点接続処理を伴う処理として実行される。さらに、最終的に膨張処理を実行する構成としてもよい。 The process of step S110 is a defective portion repair process for a thin line, which is executed by the thin line additional write defective portion repair unit 205 shown in FIG. 4 when it is determined that the additional write information is a thin line. As described above with reference to FIGS. 9 to 12, this process is executed as a process involving a thinning process, an endpoint extraction process, and an endpoint connection process. Furthermore, it is good also as a structure which finally performs an expansion process.

これらの処理によって、欠損部を有する追記情報の線幅に応じた欠損部が修復され、修復追記抽出画像データが生成される。本発明の画像処理では、図4に示す太線追記欠損部修復手段204と、細線追記欠損部修復手段205によって、それぞれ太線および細線の欠損部修復に適応した処理を実行する構成としたので、各追記情報の線幅に適応した最適な修復によって、より精度の高い追記情報修復が実現される。 By these processes, the defective portion corresponding to the line width of the additional writing information having the defective portion is repaired, and repair additional extracted image data is generated. In the image processing of the present invention, the thick line additional write defect repairing unit 204 and the thin line additional write defect repairing unit 205 shown in FIG. By the optimum restoration adapted to the line width of the additional information, the additional information can be restored with higher accuracy.

なお、太線追記欠損部修復手段204と、細線追記欠損部修復手段205の処理、すなわち、図13に示す処理フローにおけるステップS109とS110の処理は、並列に実行することが可能であり、例えば処理対象ドキュメント内に含まれる細線追記情報と、太線追記情報を区分して、それぞれの修復手段において欠損部修復処理を並列に実行する構成としてもよい。 Note that the processing of the thick line additional write defect portion repairing means 204 and the thin line additional write defect portion repairing means 205, that is, the processing of steps S109 and S110 in the processing flow shown in FIG. 13, can be executed in parallel. The thin line additional recording information and the thick line additional recording information included in the target document may be classified, and the defective portion repair processing may be executed in parallel in each repairing unit.

なお、図4に示す画像処理装置では、まず、原本ドキュメント画像データ151と、原本に含まれない追記を含む追記ドキュメント画像データ152を、差分抽出手段201に入力して差分抽出によって、追記情報を抽出する処理を行なう構成としていた。 In the image processing apparatus shown in FIG. 4, first, the original document image data 151 and the additional record document image data 152 including the additional notes that are not included in the original are input to the difference extracting means 201, and the additional information is obtained by differential extraction. It was set as the structure which performs the process to extract.

差分抽出を実行する場合は、原本ドキュメントが必要となるが、追記ドキュメントのみを入力として、追記情報を抽出することが可能となる場合もある。例えば、原本の記録情報が全て黒で記録され、追記が全て赤で記録されている追記ドキュメントである場合は、追記ドキュメントから赤で記録された情報のみを抽出する色識別処理によって、追記情報の抽出が可能となる。 When performing differential extraction, an original document is required, but it may be possible to extract postscript information by inputting only the postscript document. For example, in the case of a postscript document in which the original recording information is recorded in black and the postscript is recorded in red, the postscript information is extracted by color identification processing that extracts only the information recorded in red from the postscript document. Extraction is possible.

このような画像処理装置構成を図14に示す。図14に示す画像処理装置と、図4に示す画像処理装置との差異は、図4における差分抽出手段201を、図14では、色抽出手段401に変更し、入力情報を追記ドキュメント画像データ152のみとした点である。その他の構成および処理は、図4以下を参照して説明した処理、構成と同様である。 FIG. 14 shows such an image processing apparatus configuration. The difference between the image processing apparatus shown in FIG. 14 and the image processing apparatus shown in FIG. 4 is that the difference extracting unit 201 in FIG. 4 is changed to the color extracting unit 401 in FIG. This is the only point. Other configurations and processes are the same as the processes and configurations described with reference to FIG.

図14に示す画像処理装置は、原本ドキュメントに含まれる文字情報などの色と、追記された情報の色が異なる場合に適用可能である。例えば、原本がすべて黒の文字、線分によって記録され、追記が赤で行なわれた場合などである。色抽出手段401は、追記を含む追記ドキュメント画像データ152を入力し、追記ドキュメント画像データ152から、追記情報の対応する色(例えば赤)を持つ情報を追記情報として抽出する。なお、追記情報の色情報については、ユーザが入力するなどの処理を行なうことになる。 The image processing apparatus shown in FIG. 14 is applicable when the color of character information or the like included in the original document is different from the color of the added information. For example, this is the case when the original is recorded entirely with black characters and line segments, and the additional writing is made in red. The color extraction unit 401 inputs the postscript document image data 152 including the postscript, and extracts information having a color (for example, red) corresponding to the postscript information as the postscript information from the postscript document image data 152. The color information of the additional information is processed by the user.

この色抽出手段401において抽出された追記情報は、先に図4を参照して説明した差分抽出手段201の生成する追記情報と同様、やはり、原本に含まれる情報との重なりに途切れが発生する場合がある。例えば原本に含まれる黒の文字上に記録された追記された赤色が正確に赤とは認識されず、黒と認識される場合があり、追記抽出手段301がこのような重なり部分を追記情報と識別しない場合があるからである。 The additional recording information extracted by the color extraction unit 401 is interrupted in the overlap with the information included in the original, similarly to the additional recording information generated by the difference extraction unit 201 described above with reference to FIG. There is a case. For example, there is a case where the additionally recorded red color recorded on the black characters included in the original is not accurately recognized as red but is recognized as black. This is because they may not be identified.

このような途切れ部分は、先に図4以下を参照して説明した実施例と同様、追記情報の線幅に応じて、それぞれ太線追記欠損部修復手段204と、細線追記欠損部修復手段205において修復処理が実行され、最終的に正確な追記情報からなる修復追記抽出画像データ154が生成される。 Similar to the embodiment described above with reference to FIG. 4 and the like, such a discontinuous portion is respectively detected in the thick line additional write defect repairing means 204 and the thin line additional write defect repairing means 205 according to the line width of the additional write information. The restoration process is executed, and finally the repair additional record extracted image data 154 composed of accurate additional record information is generated.

さらに、図15を参照して、差分抽出手段の代わりに罫線分離手段402を利用した構成例について説明する。この図15に示す構成と図4に示す構成との差異は、図4に示す差分抽出手段201を罫線分離手段402に変更し、入力情報を追記ドキュメント画像データ152のみとした点である。その他の構成および処理は、図4以下を参照して説明した処理、構成と同様である。 Further, a configuration example using ruled line separation means 402 instead of the difference extraction means will be described with reference to FIG. The difference between the configuration shown in FIG. 15 and the configuration shown in FIG. 4 is that the difference extraction unit 201 shown in FIG. 4 is changed to a ruled line separation unit 402 and the input information is only the postscript document image data 152. Other configurations and processes are the same as the processes and configurations described with reference to FIG.

図15に示す画像処理装置は、原本ドキュメントが、例えば表などの罫線情報によって構成され、その表に文字などを追記情報として記録した場合に、罫線を含まない追記情報としての文字情報などを抽出する場合に有効となる。罫線分離手段402は、追記を含む追記ドキュメント画像データ152を入力し、追記ドキュメント画像データ152から、罫線のみを削除した追記情報を抽出する。 The image processing apparatus shown in FIG. 15 extracts character information or the like as additional information that does not include a ruled line when the original document is composed of ruled line information such as a table and characters and the like are recorded in the table as additional information. It becomes effective when doing. The ruled line separation unit 402 inputs the postscript document image data 152 including the postscript, and extracts the postscript information in which only the ruled line is deleted from the postscript document image data 152.

この罫線分離手段402において抽出された追記情報は、先に図4を参照して説明した差分抽出手段201の生成する追記情報と同様、やはり、原本に含まれる情報との重なりに途切れが発生する場合がある。例えば原本に含まれる罫線上に記録された追記情報は、罫線情報として削除され、抽出される追記情報に含まれなくなるからである。 The additional writing information extracted by the ruled line separation unit 402 is also interrupted in the overlap with the information included in the original, similarly to the additional writing information generated by the difference extraction unit 201 described above with reference to FIG. There is a case. This is because, for example, the additional writing information recorded on the ruled line included in the original is deleted as the ruled line information and is not included in the extracted additional writing information.

このような途切れ部分は、先に図4以下を参照して説明した実施例と同様、追記情報の線幅に応じて、それぞれ太線追記欠損部修復手段204と、細線追記欠損部修復手段205において修復処理が実行され、最終的に正確な追記情報からなる修復追記抽出画像データ154が生成される。 Similar to the embodiment described above with reference to FIG. 4 and the like, such a discontinuous portion is respectively detected in the thick line additional write defect repairing means 204 and the thin line additional write defect repairing means 205 according to the line width of the additional write information. The restoration process is executed, and finally the repair additional record extracted image data 154 composed of accurate additional record information is generated.

次に、図16を参照して、本発明の画像処理装置のさらなる実施例について説明する。図16に示す画像処理装置は、差分抽出手段201の生成する追記抽出画像データ153を、追記情報の線幅に関わらず、先に図4を参照して説明した太線追記欠損部修復手段204に相当する処理を実行する第1追記欠損部修復手段451と、細線追記欠損部修復手段205に相当する処理を実行する第2追記欠損部修復手段452との両手段で、並列に処理を実行し、さらにOR処理手段453において、第1追記欠損部修復手段451の出力と、第2追記欠損部修復手段452の出力のOR処理を実行し、この処理結果を修復追記抽出画像データ155として出力する構成としたものである。 Next, a further embodiment of the image processing apparatus of the present invention will be described with reference to FIG. The image processing apparatus shown in FIG. 16 applies the additionally-recorded extracted image data 153 generated by the difference extracting unit 201 to the thick-line additional-deletion part repairing unit 204 described above with reference to FIG. 4 regardless of the line width of the additional recording information. Processing is performed in parallel by both of the first additional write defect repairing unit 451 that executes the corresponding process and the second additional write defect repairing unit 452 that performs the process corresponding to the thin line additional write defect repairing unit 205. Further, in the OR processing means 453, the OR processing of the output of the first additional write defect portion repair means 451 and the output of the second additional write defect portion repair means 452 is executed, and this processing result is output as repair additional write extraction image data 155. It is a configuration.

図16に示す第1追記欠損部修復手段451と、第2追記欠損部修復手段452を具体的な処理手段として示した構成図を図17に示す。図16に示す第1追記欠損部修復手段451は、図17に示す膨張処理手段454に相当する。図16に示す第2追記欠損部修復手段452は、図17に示す細線化手段455、端点抽出手段456、端点接続手段457、膨張処理手段458に対応する。 FIG. 17 is a block diagram showing the first additional write defect repairing means 451 and the second additional write defect repairing means 452 shown in FIG. 16 as specific processing means. 16 corresponds to the expansion processing means 454 shown in FIG. 16 corresponds to the thinning means 455, the end point extraction means 456, the end point connection means 457, and the expansion processing means 458 shown in FIG.

図18を参照して、本実施例の画像処理装置の実行する具体的な処理例について説明する。図18に示す追記抽出画像データ461は、図17に示す差分抽出手段201の生成する追記抽出画像データ153に相当する。この追記抽出画像データは、図17に示す膨張処理手段454において、膨張処理が実行され、図18に示す膨張処理画像データ462が生成される。膨張処理によって、追記抽出画像データ461に含まれる微小な途切れは修復されるが、膨張処理画像データ462に示すように、大きな途切れは修復されず、残存したままである。 A specific processing example executed by the image processing apparatus according to the present exemplary embodiment will be described with reference to FIG. The postscript extraction image data 461 shown in FIG. 18 corresponds to the postscript extraction image data 153 generated by the difference extraction unit 201 shown in FIG. The additionally extracted extracted image data is subjected to expansion processing in the expansion processing means 454 shown in FIG. 17, and expansion processing image data 462 shown in FIG. 18 is generated. By the expansion process, the minute discontinuity included in the additionally recorded extracted image data 461 is repaired, but as shown in the expansion process image data 462, the large discontinuity is not repaired and remains.

この膨張処理に並列して、追記抽出画像データ461は、図17に示す細線化手段455、端点抽出手段456、端点接続手段457、膨張処理手段458においても処理がなされる。細線化手段455、端点抽出手段456、端点接続手段457における処理は、先の実施例において、図9〜図12を参照して説明した処理であり、細線化処理の後、細線化データの端点を抽出し、端点ペアを検出して接続する処理である。この端点接続後のデータが、図18に示す端点接続細線化データ465である。 In parallel with this expansion processing, the postscript extracted image data 461 is also processed in the thinning unit 455, the end point extraction unit 456, the end point connection unit 457, and the expansion processing unit 458 shown in FIG. The processing in the thinning unit 455, the end point extraction unit 456, and the end point connection unit 457 is the processing described with reference to FIGS. 9 to 12 in the previous embodiment. After the thinning process, the end points of the thinned data are processed. Is extracted, end point pairs are detected and connected. The data after this end point connection is end point connection thinned data 465 shown in FIG.

さらに、図17に示す膨張処理手段458は、この端点接続細線化データ465の膨張処理を実行して、図18に示す膨張処理済み端点接続細線化データ466を生成する。図17に示すOR処理手段453は、膨張処理手段454の処理結果と、膨張処理手段458の処理結果とのOR処理を実行する。すなわち、図18に示す膨張処理画像データ462と、膨張処理済み端点接続細線化データ466とを入力して、これらの画像のOR処理を実行する。このOR処理の結果、いずれかの画像の欠損部は、他方の画像によって補われ、OR処理データ467として生成される。このOR処理データ457が図17に示すOR処理手段の出力する修復追記抽出画像データ155に相当する。 Furthermore, the expansion processing means 458 shown in FIG. 17 executes the expansion processing of the end point connection thinned data 465 to generate the expanded end point connection thinned data 466 shown in FIG. The OR processing unit 453 illustrated in FIG. 17 performs an OR process between the processing result of the expansion processing unit 454 and the processing result of the expansion processing unit 458. That is, the dilated image data 462 and dilated end point connection thinning data 466 shown in FIG. 18 are input, and OR processing of these images is executed. As a result of this OR processing, the missing portion of one of the images is compensated by the other image, and is generated as OR processing data 467. This OR processing data 457 corresponds to the repair additional recording extracted image data 155 output from the OR processing means shown in FIG.

このように、本処理例では、追記情報の線幅に関わらず、2つの異なる処理シーケンスの欠損部修復処理を実行する手段に並列に同一の追記情報の欠損部修復を実行させて、その結果画像をOR処理することで、一方の修復手段において修復されなかった部分を他方の修復手段で修復されたデータを適用して補うことが可能となり、より完全性の高い修復処理が実現される。 As described above, in this processing example, the means for executing the defective portion repair processing of two different processing sequences is executed in parallel to execute the defective portion repair of the same additional information, regardless of the line width of the additional information, and the result By performing an OR process on an image, it becomes possible to supplement a portion that has not been repaired by one repairing unit by applying data repaired by the other repairing unit, thereby realizing a more complete repairing process.

図19、図20を参照して、追記情報が、例えばラインマーカなどのように太い線で実行された場合の修復処理例について説明する。図19には、原本ドキュメント491と、ラインマーカによる追記情報493の含まれる追記ドキュメント492を示している。図17に示す差分抽出手段201は、これらの両ドキュメントから差分を抽出して、追記抽出画像データ494を得る。 With reference to FIG. 19 and FIG. 20, description will be given of a repair processing example in the case where the postscript information is executed with a thick line such as a line marker. FIG. 19 shows an original document 491 and an additional record document 492 including additional information 493 using line markers. The difference extraction unit 201 shown in FIG. 17 extracts the difference from both of these documents, and obtains the postscript extracted image data 494.

追記抽出画像データ494には欠損部(1,2,3の文字構成部)が含まれる。この欠損部を含む追記抽出画像データについて、第1、第2の欠損部修復手段において、異なる処理シーケンスを適用した欠損部修復処理が実行される。図20を参照してこの処理を説明する。 The postscript extracted image data 494 includes a missing part (1, 2, 3 character constituent parts). With respect to the postscript extracted image data including the defective portion, the first and second defective portion repairing means execute a defective portion repair process using different processing sequences. This process will be described with reference to FIG.

図20に示す追記抽出画像データ494は、図17に示す差分抽出手段201によって抽出された追記抽出画像データ153に相当する。この追記抽出画像データは、図17に示す膨張処理手段454において、膨張処理が実行され、図20に示す膨張処理画像データ495が生成される。膨張処理によって、追記抽出画像データ494に含まれる微小な途切れは修復される。この場合、すべての途切れが解消した例を示している。 The postscript extracted image data 494 shown in FIG. 20 corresponds to the postscript extracted image data 153 extracted by the difference extracting unit 201 shown in FIG. This additional record extracted image data is subjected to expansion processing in the expansion processing means 454 shown in FIG. 17, and expansion processing image data 495 shown in FIG. 20 is generated. By the expansion process, the minute interruption included in the additionally recorded extracted image data 494 is repaired. In this case, an example in which all interruptions are eliminated is shown.

この膨張処理に並列して、追記抽出画像データ494は、図17に示す細線化手段455、端点抽出手段456、端点接続手段457、膨張処理手段458においても処理がなされる。細線化手段455は、追記抽出画像データ494に対する細線化処理を実行して、図20に示す細線化データ496を生成する。この細線化データに対する端点接続、膨張処理が実行され、図20に示す膨張処理済み細線化データ597が生成される。 In parallel with this expansion processing, the postscript extracted image data 494 is also processed in the thinning unit 455, the end point extraction unit 456, the end point connection unit 457, and the expansion processing unit 458 shown in FIG. The thinning unit 455 executes thinning processing on the additionally extracted extracted image data 494 to generate thinning data 496 shown in FIG. The end point connection and expansion processing for the thinned data is executed, and expanded thinned data 597 shown in FIG. 20 is generated.

図17に示すOR処理手段453は、膨張処理手段454の処理結果と、膨張処理手段458の処理結果とのOR処理を実行する。すなわち、図20に示す膨張処理画像データ495と、膨張処理済み細線化データ497とを入力して、これらの画像のOR処理を実行する。このOR処理の結果、いずれかの画像の欠損部は、他方の画像によって補われ、OR処理データ498として生成される。このOR処理データ498が図17に示すOR処理手段の出力する修復追記抽出画像データ155に相当する。 The OR processing unit 453 illustrated in FIG. 17 performs an OR process between the processing result of the expansion processing unit 454 and the processing result of the expansion processing unit 458. That is, the dilated image data 495 and dilated thinned data 497 shown in FIG. 20 are input, and OR processing of these images is executed. As a result of this OR processing, the missing portion of one of the images is compensated by the other image, and is generated as OR processing data 498. This OR processing data 498 corresponds to the repair additional extraction extracted image data 155 output from the OR processing means shown in FIG.

図21に示すフローチャートを参照して、本処理例における処理シーケンスについて説明する。まず、ステップS201において、追記情報を含む追記ドキュメント画像データを取得する。これは、例えばスキャナなどによって読み取られた画像データである。さらに、ステップS202において、追記を含まない原本ドキュメント画像データを取得する。これも、例えばスキャナなどによって読み取られた画像データである。 A processing sequence in this processing example will be described with reference to the flowchart shown in FIG. First, in step S201, postscript document image data including postscript information is acquired. This is image data read by, for example, a scanner. In step S202, original document image data that does not include additional writing is acquired. This is also image data read by, for example, a scanner.

ステップS203では、これらの2つの画像データに基づく差分抽出処理を実行する。図16または図17に示す差分抽出手段201における処理であり、この結果として追記抽出画像データが生成される。ただし、この追記抽出画像データは、追記情報と、原本情報の重なり部が欠落した欠損部を含むデータとなる。 In step S203, a difference extraction process based on these two image data is executed. This is a process in the difference extraction means 201 shown in FIG. 16 or FIG. 17, and as a result, additional record extracted image data is generated. However, this postscript extracted image data is data including a missing portion in which an overlap portion of the postscript information and the original information is missing.

ステップS204、S205の処理は、それぞれ図16に示す第1追記欠損部修復手段451、および第2追記欠損部修復手段452の処理である。図17においては、膨張処理手段454の処理(S204)と、細線化手段455〜膨張処理手段458の処理(S205)に相当する。 The processes in steps S204 and S205 are the processes of the first additional write defect repair unit 451 and the second additional write defect repair unit 452 shown in FIG. In FIG. 17, this corresponds to the processing of the expansion processing means 454 (S204) and the processing of the thinning means 455 to the expansion processing means 458 (S205).

図16に示す第1追記欠損部修復手段451、すなわち、図17に示す膨張処理手段454は、ステップS204において、欠損部を有する追記抽出画像データの膨張処理を実行する。また、図16に示す第2追記欠損部修復手段452、すなわち、図17に示す細線化手段455〜膨張処理手段458は、ステップS205において、欠損部を有する追記抽出画像データの細線化処理、端点抽出処理、端点接続処理、膨張処理を実行する。 The first additional write defect portion repairing means 451 shown in FIG. 16, that is, the expansion processing means 454 shown in FIG. 17, executes the expansion processing of the additional write extracted image data having the defective portion in step S204. In addition, the second additional write defect portion repairing means 452 shown in FIG. 16, that is, the thinning means 455 to the expansion processing means 458 shown in FIG. Extraction processing, end point connection processing, and expansion processing are executed.

最後に、ステップS206において、図16、図17に示すOR処理手段453が、2つの異なるシーケンスで実行された修復画像のOR処理を実行し、このOR処理結果画像を、最終的な修復追記抽出画像データとして出力する。 Finally, in step S206, the OR processing means 453 shown in FIGS. 16 and 17 performs OR processing of the repaired images executed in two different sequences, and this OR processing result image is extracted as the final repair appending extraction. Output as image data.

これらの処理によって、欠損部を有する追記情報は、異なる複数の処理シーケンスで修復処理が実行され、最終的にこれらの修復処理結果をOR処理することで、一方の修復処理によって修復されなかった途切れ部分を他方の修復処理結果によって補うことが可能となり、より確実な修復がなされた修復追記画像を得ることができる。 By these processes, the postscript information having a defective part is repaired in a plurality of different processing sequences, and finally the repair process result is ORed so that it is not repaired by one repair process. The part can be supplemented by the result of the other repair process, and a repair additional image with more reliable repair can be obtained.

最後に、図22を参照して、上述した処理を実行する画像処理装置のハードウェア構成例について説明する。図22に示す構成は、例えばPCなどの情報処理装置と、スキャナ等の画像データ読み取り部531と、プリンタなどの画像データ出力部532を備えたハード構成例を示している。 Finally, with reference to FIG. 22, an example of the hardware configuration of the image processing apparatus that executes the above-described processing will be described. The configuration illustrated in FIG. 22 illustrates a hardware configuration example including an information processing apparatus such as a PC, an image data reading unit 531 such as a scanner, and an image data output unit 532 such as a printer.

CPU(Central Processing Unit)501は、上述の実施例において説明した各種のデータ処理、すなわち、差分データなどの欠損部を含むデータの抽出処理、追記情報の線幅判定処理、処理対象データに対する膨張処理、細線化処理、端点抽出、接続処理、OR処理などを含む一連の処理を実行する。制御手段としてのCPU501は、これらの処理の実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行する。 A CPU (Central Processing Unit) 501 performs various types of data processing described in the above-described embodiments, that is, data extraction processing including a missing portion such as difference data, line width determination processing for additional information, and expansion processing for processing target data , A series of processing including thinning processing, end point extraction, connection processing, OR processing, and the like is executed. A CPU 501 serving as a control unit executes processing according to a computer program describing an execution sequence of these processing.

ROM(Read Only Memory)502は、CPU501が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)503は、CPU501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス504により相互に接続されている。 A ROM (Read Only Memory) 502 stores programs used by the CPU 501, calculation parameters, and the like. A RAM (Random Access Memory) 503 stores programs used in the execution of the CPU 501, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 504 including a CPU bus.

ホストバス504は、ブリッジ505を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス506に接続されている。 The host bus 504 is connected to an external bus 506 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 505.

キーボード508、ポインティングデバイス509は、ユーザにより操作される入力デバイスである。ディスプレイ510は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。 A keyboard 508 and a pointing device 509 are input devices operated by the user. The display 510 includes a liquid crystal display device, a CRT (Cathode Ray Tube), or the like, and displays various information as text or image information.

HDD(Hard Disk Drive)511は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU501によって実行するプログラムや情報を記録または再生させる。ハードディスクは、原本ドキュメント画像データ、追記ドキュメント画像データ等の情報、各種処理において生成されるデータなどを格納する。さらに、各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。 An HDD (Hard Disk Drive) 511 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 501 and information. The hard disk stores information such as original document image data and postscript document image data, data generated in various processes, and the like. Further, various computer programs such as various data processing programs are stored.

ドライブ512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体521に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース507、外部バス506、ブリッジ505、およびホストバス504を介して接続されているRAM503に供給する。リムーバブル記録媒体521も、ハードディスクと同様のデータ記録領域として利用可能である。 The drive 512 reads data or a program recorded on a removable recording medium 521 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read out from the interface 507 and the external bus 506. , And supplied to the RAM 503 connected via the bridge 505 and the host bus 504. The removable recording medium 521 can also be used as a data recording area similar to a hard disk.

接続ポート514は、外部接続機器522を接続するポートであり、USB,IEEE1394等の接続部を持つ。接続ポート514は、インタフェース507、および外部バス506、ブリッジ505、ホストバス504等を介してCPU501等に接続されている。通信部515は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部531は、ドキュメントの読み取り処理を実行し、データ出力部532は、ドキュメントデータの出力処理を実行する。 The connection port 514 is a port for connecting the external connection device 522 and has a connection unit such as USB or IEEE1394. The connection port 514 is connected to the CPU 501 and the like via the interface 507, the external bus 506, the bridge 505, the host bus 504, and the like. The communication unit 515 is connected to a network and executes data communication processing with the outside. The data reading unit 531 executes document reading processing, and the data output unit 532 executes document data output processing.

なお、図22に示す画像処理装置のハードウェア構成例は、1つの装置例を示すものであり、本発明の画像処理装置は、図22に示す構成に限らず、上述した実施例において説明した処理を実行可能な構成であればよい。 Note that the hardware configuration example of the image processing apparatus shown in FIG. 22 shows one example of the apparatus, and the image processing apparatus of the present invention is not limited to the configuration shown in FIG. Any configuration capable of executing the process may be used.

以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。 The present invention has been described in detail above with reference to specific embodiments. However, it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present invention. In other words, the present invention has been disclosed in the form of exemplification, and should not be interpreted in a limited manner. In order to determine the gist of the present invention, the claims should be taken into consideration.

なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。 The series of processes described in the specification can be executed by hardware, software, or a combined configuration of both. When executing processing by software, the program recording the processing sequence is installed in a memory in a computer incorporated in dedicated hardware and executed, or the program is executed on a general-purpose computer capable of executing various processing. It can be installed and run.

例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。 For example, the program can be recorded in advance on a hard disk or ROM (Read Only Memory) as a recording medium. Alternatively, the program is temporarily or permanently stored on a removable recording medium such as a flexible disk, a CD-ROM (Compact Disc Read Only Memory), an MO (Magneto optical) disk, a DVD (Digital Versatile Disc), a magnetic disk, or a semiconductor memory. It can be stored (recorded). Such a removable recording medium can be provided as so-called package software.

なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。 The program is installed on the computer from the removable recording medium as described above, or is wirelessly transferred from the download site to the computer, or is wired to the computer via a network such as a LAN (Local Area Network) or the Internet. The computer can receive the program transferred in this manner and install it on a recording medium such as a built-in hard disk.

なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 Note that the various processes described in the specification are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Further, in this specification, the system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to being in the same casing.

以上、説明したように、本発明の構成によれば、例えば原本ドキュメントと、追記データの付加された追記ドキュメントの差分データのように欠損部を有するデータについての欠損部を解消する修復処理を効率的にかつ正確に実行することができる。具体的には、本発明の画像処理装置の一実施例構成では、追記抽出画像に含まれる欠損部を有する追記情報の線幅を検出し、線幅が細い場合と太い場合とで、それぞれの線幅に適合した処理シーケンスに従った欠損部修復処理を実行する。具体的には、追記情報が太線である場合は膨張処理による修復を実行し、細線である場合は、細線化処理、端点抽出処理、端点接続処理による修復処理を実行する。本構成によって、線幅に応じた最適な欠損部修復が可能となり、より精度の高い追記情報を生成することが可能となる。 As described above, according to the configuration of the present invention, for example, it is possible to efficiently perform a repair process for eliminating a missing portion of data having a missing portion, such as difference data between an original document and an additional document to which additional data is added. Can be executed efficiently and accurately. Specifically, in the configuration of an embodiment of the image processing apparatus of the present invention, the line width of the postscript information having a defect portion included in the postscript extracted image is detected, and the line width is thin and the case where the line width is thick, respectively. Execute defect repair processing according to the processing sequence that matches the line width. Specifically, when the additional writing information is a thick line, restoration by expansion processing is executed, and when it is a thin line, restoration processing by thinning processing, endpoint extraction processing, and endpoint connection processing is executed. With this configuration, it is possible to optimally repair the missing portion according to the line width, and it is possible to generate additional information with higher accuracy.

また、本発明の一実施例構成によれば、複数の異なる処理シーケンスによる追記情報の欠損部修復処理を並列に実行し、これらの複数の処理結果に基づくOR処理結果を生成して、このOR処理結果を最終的な欠損部修復結果とする。本構成によれば、一方の修復処理シーケンスにおいて修復できなかった欠損部を他方の修復処理シーケンスの結果に基づいて補うことが可能となり、結果としてより完全性の高い追記情報を生成することが可能となる。 Further, according to the configuration of one embodiment of the present invention, the missing information repair processing of the additional information by a plurality of different processing sequences is performed in parallel, and an OR processing result based on the plurality of processing results is generated, and this OR The processing result is the final defect repair result. According to this configuration, it is possible to compensate for a defective portion that could not be repaired in one repair processing sequence based on the result of the other repair processing sequence, and as a result, it is possible to generate additional information with higher completeness. It becomes.

10 原本ドキュメント
20 追記ドキュメント
30 スキャナ
51 原本ドキュメント
52 追記ドキュメント
53 線分データ
55 追記情報
61 追記ドキュメント
62 追記情報
71 罫線付きドキュメント
72 罫線除去情報
100 画像処理装置
151 原本ドキュメント画像データ
152 追記ドキュメント画像データ
153 追記抽出画像データ
155 修復追記抽出画像データ
201 差分抽出手段
202 処理切り替え手段
203 追記線幅検出手段
204 太線追記欠損部修復手段
205 太線追記欠損部修復手段
301 原本ドキュメント画像データ
302 追記ドキュメント画像データ
303 追記情報
304 追記抽出画像データ
305 細線化画像データ
306 膨張処理画像データ
321 細線化処理画像データ
322 端点抽出データ
323 接続端点ペア抽出データ
324 端点接続データ
401 色抽出手段
402 罫線分離手段
451 第1追記欠損部修復手段
452 第2追記欠損部修復手段
453 OR手段
454 膨張処理手段
455 細線化手段
456 端点抽出手段
457 端点接続手段
458 膨張手段
461 追記抽出画像データ
462 膨張処理画像データ
465 端点接続細線化データ
466 膨張処理済み端点接続細線化データ
467 OR処理データ
491 原本ドキュメント
492 追記ドキュメント
493 追記情報
494 追記抽出画像データ
495 膨張処理画像データ
496 細線化データ
497 膨張処理済み細線化データ
498 OR処理データ
501 CPU(Central Processing Unit)
502 ROM(Read-Only-Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器
531 データ読み取り部
532 データ出力部
DESCRIPTION OF SYMBOLS 10 Original document 20 Additional record document 30 Scanner 51 Original document 52 Additional record document 53 Line segment data 55 Additional record information 61 Additional record document 62 Additional record information 71 Ruled line document 72 Ruled line removal information 100 Image processing apparatus 151 Original document image data 152 Additional record document image data 153 Additional write extraction image data 155 Repair additional write extraction image data 201 Difference extraction means 202 Processing switching means 203 Additional write line width detection means 204 Thick line additional write defect portion repair means 205 Thick line additional write defect portion repair means 301 Original document image data 302 Additional write document image data 303 Additional write Information 304 Additional recording extracted image data 305 Thinned image data 306 Expansion processing image data 321 Thinning processing image data 322 Endpoint extraction Data 323 Connection end point pair extraction data 324 End point connection data 401 Color extraction means 402 Ruled line separation means 451 First additional write defect portion repair means 452 Second additional write defect portion repair means 453 OR means 454 Expansion processing means 455 Thinning means 456 End point extraction means 457 End point connection means 458 Dilation means 461 Additional write extraction image data 462 Dilation processing image data 465 End connection thinning data 466 Dilation processing end point connection thinning data 467 OR processing data 491 Original document 492 Additional writing document 493 Additional writing information 494 Additional writing extraction image data 495 Expansion processing image data 496 Thinning data 497 Expansion processing thinning data 498 OR processing data 501 CPU (Central Processing Unit)
502 ROM (Read-Only-Memory)
503 RAM (Random Access Memory)
504 Host bus 505 Bridge 506 External bus 507 Interface 508 Keyboard 509 Pointing device 510 Display 511 HDD (Hard Disk Drive)
512 drive 514 connection port 515 communication unit 521 removable recording medium 522 external connection device 531 data reading unit 532 data output unit

Claims (8)

欠損部を有する修復対象データを入力し、欠損部を解消した復元データを生成する画像処理を実行する画像処理装置であり、
原本ドキュメントに対して追記処理のなされた追記ドキュメントに基づく追記ドキュメント画像データを入力し、該追記ドキュメント画像から追記情報を抽出した追記抽出画像を生成する追記情報抽出手段と、
前記追記情報抽出手段の生成した追記抽出画像を入力し、予め定められた第1の処理シーケンスに従って、追記欠損部修復処理を実行する第1追記欠損部修復手段と、
前記追記情報抽出手段の生成した追記抽出画像を入力し、前記第1の処理シーケンスとは異なる予め定められた第2の処理シーケンスに従って、追記欠損部修復処理を実行する第2追記欠損部修復手段と、
前記第1追記欠損部修復手段の処理結果と、前記第2追記欠損部修復手段の処理結果とのOR処理を実行して、最終的な追記欠損部修復処理結果データを生成するOR処理手段と、
を有することを特徴とする画像処理装置。
It is an image processing apparatus that performs image processing to input restoration target data having a missing part and generate restoration data that eliminates the missing part,
A postscript information extraction unit that inputs postscript document image data based on a postscript process that has been postscripted with respect to the original document, and generates a postscript extraction image obtained by extracting the postscript information from the postscript document image;
A first additional write defect repairing unit that inputs the additional write extraction image generated by the additional write information extraction unit and executes the additional write defect repairing process according to a predetermined first processing sequence;
Second write-once deficient part repairing means for inputting a postscript extracted image generated by the postscript information extracting means and executing a postscript missing part repairing process according to a predetermined second processing sequence different from the first processing sequence When,
OR processing means for executing final processing of the processing result of the first additional writing defect portion repairing means and the processing result of the second additional writing defect portion repairing means to generate final additional writing defect portion repair processing result data ,
An image processing apparatus comprising:
前記第1追記欠損部修復手段は、膨張処理手段を有し、
前記追記情報抽出手段の生成した追記抽出画像に含まれる追記情報の膨張処理による欠損部修復処理を実行する構成であることを特徴とする請求項1に記載の画像処理装置。
The first additional write defect portion repairing means has an expansion processing means,
The image processing apparatus according to claim 1, wherein a defect portion repair process is performed by an expansion process of additional write information included in the additional write extracted image generated by the additional write information extraction unit.
前記第2追記欠損部修復手段は、細線化手段と、端点抽出手段と、端点接続手段と膨張処理手段を有し、
前記追記情報抽出手段の生成した追記抽出画像に含まれる追記情報を前記細線化手段において細線化処理を実行し、前記端点抽出手段において、細線化処理結果に基づく端点抽出処理を実行し、前記端点接続手段において、抽出端点の接続処理を実行し、前記膨張処理手段において、前記端点接続手段における抽出端点の接続処理によって生成された端点接続データの膨張処理を実行して、欠損部修復処理を実行する構成であることを特徴とする請求項1に記載の画像処理装置。
The second additional write defect repairing means has a thinning means, an endpoint extraction means, an endpoint connection means and an expansion processing means,
The thinning means executes thinning processing on the additional writing information included in the postscript extraction image generated by the additional writing information extraction means, the endpoint extraction means executes endpoint extraction processing based on the thinning processing result, and the endpoint In the connection means, the extraction end point connection processing is executed, and in the expansion processing means, the end point connection data generated by the extraction end point connection processing in the end point connection means is executed, and the defect portion repair processing is executed. The image processing apparatus according to claim 1, wherein the image processing apparatus is configured as described above.
前記追記情報抽出手段は、
原本ドキュメント画像データと、前記追記ドキュメント画像データを入力し、2つの入力画像データの差分を抽出する差分抽出手段によって構成されることを特徴とする請求項1に記載の画像処理装置。
The additional information extracting means is
2. The image processing apparatus according to claim 1, further comprising: difference extraction means for inputting original document image data and the additional document image data and extracting a difference between the two input image data.
前記追記情報抽出手段は、
追記ドキュメント画像データを入力し、該追記ドキュメント画像データから特定の色の記録情報を追記情報として抽出する色抽出手段によって構成されることを特徴とする請求項1に記載の画像処理装置。
The additional information extracting means is
The image processing apparatus according to claim 1, further comprising a color extracting unit that inputs additional document image data and extracts recording information of a specific color from the additional document image data as additional information.
前記追記情報抽出手段は、
追記ドキュメント画像データを入力し、該追記ドキュメント画像データから罫線情報を削除し、罫線情報以外の情報を追記情報として抽出する罫線分離手段によって構成されることを特徴とする請求項1に記載の画像処理装置。
The additional information extracting means is
2. The image according to claim 1, further comprising ruled line separation means for inputting additional record document image data, deleting ruled line information from the additional record document image data, and extracting information other than the ruled line information as additional record information. Processing equipment.
欠損部を有する修復対象データを入力し、欠損部を解消した復元データを生成する画像処理を実行する画像処理方法であり、
原本ドキュメントに対して追記処理のなされた追記ドキュメントに基づく追記ドキュメント画像データを入力し、該追記ドキュメント画像から追記情報を抽出した追記抽出画像を生成する追記情報抽出ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、予め定められた第1の処理シーケンスに従って、追記欠損部修復処理を実行する第1追記欠損部修復ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、前記第1の処理シーケンスとは異なる予め定められた第2の処理シーケンスに従って、追記欠損部修復処理を実行する第2追記欠損部修復ステップと、
前記第1追記欠損部修復ステップにおける処理結果と、前記第2追記欠損部修復ステップにおける処理結果とのOR処理を実行して、最終的な追記欠損部修復処理結果データを生成するOR処理ステップと、
を有することを特徴とする画像処理方法。
It is an image processing method for inputting image data to be repaired having a missing part and executing image processing to generate restoration data in which the missing part is eliminated,
A postscript information extraction step of inputting postscript document image data based on a postscript process that has been postscripted with respect to the original document, and generating a postscript extraction image obtained by extracting the postscript information from the postscript document image;
A first additional write defect repair step that inputs the additional write extracted image generated in the additional write information extraction step and executes the additional write defect repair process according to a predetermined first processing sequence;
Second write-once defect portion repair step of inputting the postscript extraction image generated in the postscript information extraction step and executing the post-write defect portion repairing process according to a predetermined second processing sequence different from the first processing sequence When,
An OR processing step of performing OR processing of the processing result in the first additional write defect portion repair step and the processing result in the second additional write defect portion repair step to generate final additional write defect portion repair processing result data; ,
An image processing method comprising:
画像処理装置において、欠損部を有する修復対象データを入力し、欠損部を解消した復元データを生成する画像処理を実行させるコンピュータ・プログラムであり、
原本ドキュメントに対して追記処理のなされた追記ドキュメントに基づく追記ドキュメント画像データを入力し、該追記ドキュメント画像から追記情報を抽出した追記抽出画像を生成する追記情報抽出ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、予め定められた第1の処理シーケンスに従って、追記欠損部修復処理を実行する第1追記欠損部修復ステップと、
前記追記情報抽出ステップにおいて生成した追記抽出画像を入力し、前記第1の処理シーケンスとは異なる予め定められた第2の処理シーケンスに従って、追記欠損部修復処理を実行する第2追記欠損部修復ステップと、
前記第1追記欠損部修復ステップにおける処理結果と、前記第2追記欠損部修復ステップにおける処理結果とのOR処理を実行して、最終的な追記欠損部修復処理結果データを生成するOR処理ステップと、
を実行させることを特徴とするコンピュータ・プログラム。
In the image processing apparatus, a computer program for executing image processing for inputting restoration target data having a defect portion and generating restoration data in which the defect portion is eliminated,
A postscript information extraction step of inputting postscript document image data based on a postscript process that has been postscripted with respect to the original document, and generating a postscript extraction image obtained by extracting the postscript information from the postscript document image;
A first additional write defect repair step that inputs the additional write extracted image generated in the additional write information extraction step and executes the additional write defect repair process according to a predetermined first processing sequence;
Second write-once defect portion repair step of inputting the postscript extraction image generated in the postscript information extraction step and executing the post-write defect portion repairing process according to a predetermined second processing sequence different from the first processing sequence When,
An OR processing step of performing OR processing of the processing result in the first additional write defect portion repair step and the processing result in the second additional write defect portion repair step to generate final additional write defect portion repair processing result data; ,
A computer program for executing
JP2011084424A 2011-04-06 2011-04-06 Image processing apparatus, image processing method, and computer program Expired - Fee Related JP5035443B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011084424A JP5035443B2 (en) 2011-04-06 2011-04-06 Image processing apparatus, image processing method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011084424A JP5035443B2 (en) 2011-04-06 2011-04-06 Image processing apparatus, image processing method, and computer program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2005369931A Division JP4784299B2 (en) 2005-12-22 2005-12-22 Image processing apparatus, image processing method, and computer program

Publications (2)

Publication Number Publication Date
JP2011154713A JP2011154713A (en) 2011-08-11
JP5035443B2 true JP5035443B2 (en) 2012-09-26

Family

ID=44540577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011084424A Expired - Fee Related JP5035443B2 (en) 2011-04-06 2011-04-06 Image processing apparatus, image processing method, and computer program

Country Status (1)

Country Link
JP (1) JP5035443B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018087921A1 (en) * 2016-11-14 2018-05-17 株式会社Pfu Editing apparatus, editing method, and program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0750483B2 (en) * 1985-05-22 1995-05-31 株式会社日立製作所 How to store additional information about document images
JPS63156296A (en) * 1986-12-19 1988-06-29 Ricoh Co Ltd Method for recovering defective character
JP4120795B2 (en) * 2002-12-27 2008-07-16 株式会社リコー Retouching extraction device and retouching extraction method

Also Published As

Publication number Publication date
JP2011154713A (en) 2011-08-11

Similar Documents

Publication Publication Date Title
WO2019188040A1 (en) Image processing device, image processing method, and image processing program
JP4928310B2 (en) License plate recognition device, control method thereof, computer program
US7925082B2 (en) Information processing apparatus, information processing method, computer readable medium, and computer data signal
JP5682218B2 (en) Difference detection device, difference output device, and program
KR101235226B1 (en) Image processor and image processing method and recording medium
JP2006350680A (en) Image processing apparatus, image processing method, and computer program
US20130136360A1 (en) Image processing apparatus, image processing method, and computer readable medium
JP4565396B2 (en) Image processing apparatus and image processing program
JP4760883B2 (en) Image processing apparatus and image processing program
JP6413542B2 (en) Image processing apparatus and image processing program
JP5035443B2 (en) Image processing apparatus, image processing method, and computer program
JP4784299B2 (en) Image processing apparatus, image processing method, and computer program
US20180343354A1 (en) Document size detecting apparatus, non-transitory computer readable storage medium, and image processing system
JP3121466B2 (en) Image correction device
JP4631696B2 (en) Image processing apparatus, image processing method, and computer program
JP2016045564A (en) Image processor and program
JP2007174037A (en) Unit and method for processing image, and computer program
JP4803001B2 (en) Image processing apparatus and image processing program
JP2007140703A (en) Method for reading insurance policy, system thereof, and insurance policy recognition system
JP4789065B2 (en) Image processing apparatus and image processing program
JP5993100B2 (en) Image processing apparatus and specific figure detection method
JP4900025B2 (en) Image processing apparatus and image processing program
JP5146199B2 (en) Difference extraction apparatus and difference extraction program
JP2010258627A (en) Image processor, image processing method, program, and storage medium
JP2008206037A (en) Image processing apparatus and image processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120531

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120618

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees