JP2001111816A - Document image processing device - Google Patents

Document image processing device

Info

Publication number
JP2001111816A
JP2001111816A JP29181099A JP29181099A JP2001111816A JP 2001111816 A JP2001111816 A JP 2001111816A JP 29181099 A JP29181099 A JP 29181099A JP 29181099 A JP29181099 A JP 29181099A JP 2001111816 A JP2001111816 A JP 2001111816A
Authority
JP
Japan
Prior art keywords
image
noise
document
image processing
text image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP29181099A
Other languages
Japanese (ja)
Inventor
Yoshihiro Shima
好博 嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP29181099A priority Critical patent/JP2001111816A/en
Publication of JP2001111816A publication Critical patent/JP2001111816A/en
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

PROBLEM TO BE SOLVED: To solve problems of a conventional document image processing device where a described character string and a seal stamp in a document image have been hard to see or have been illegible because of a hindrance due to a pattern crowded with very small noises caused by optical scanning of a document and much communication cost and storage cost have been required due to a huge image data amount because the noises consist of very small dot patterns and linear patterns. SOLUTION: The document image processing device is provided with a means that detects presence of noises consisting of very small patterns and a means that eliminates the noise from a captured document image to clear up the image.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文書画像の処理方
法、さらに詳しくは、文書に印刷されたパターンの微妙
な変化を検出して除去する文書画像の処理方法に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for processing a document image, and more particularly, to a method for processing a document image for detecting and removing a subtle change in a pattern printed on a document.

【0002】[0002]

【従来の技術】特開平6―215177「高速文書確認
システム及び確認用文書並びに文書確認方法」(出願
人、シグマ・イメージング・システムズ・インク)や特
開平7―1879「保証書類」(出願人、ザ・スタンダ
ード・レジスター・カンパニー)に記載のように、従来
より、保証書類、例えば、各種証明書や小切手や株や債
券は、有効な文書であって偽造品や写真複製物でないこ
とを保証するために、しばしば、オリジナルの書類では
見えなかったメッセージ、例えば、「複写」というメッ
セージが、該書類のコピーにおいては現れるようにした
ことにより、偽りの書類の使用を未然に阻止し得る文書
が使用されている。本明細書では、この現われたメッセ
ージの部分画像をメッセージパターンと呼ぶ。これらの
文書には、例えば、解像度の異なるラインを有するパタ
ーンが印刷されていたり、密度の異なるインクや蛍光性
のあるインクで形成されたパターンが印刷されていたり
する。スキャナで採取した表面画像を画面に表示し、オ
ペレータが肉眼により、当該文書にメッセージパターン
が現われているかどうかを確認する文書確認システムが
提案されている。
2. Description of the Related Art JP-A-6-215177 "High-speed document confirmation system and document for confirmation and document confirmation method" (applicant, Sigma Imaging Systems, Inc.) and JP-A 7-1879 "guarantee documents" (applicant, Traditionally, as described in The Standard Register Company, guarantee documents, such as various certificates, checks, shares and bonds, are valid documents and are not counterfeit or photocopied. Often, a message that was not visible in the original document, such as the message "copy", appears in a copy of the document, thereby preventing the use of a fake document. Have been. In this specification, the appearing partial image of the message is called a message pattern. On these documents, for example, patterns having lines with different resolutions are printed, or patterns formed with inks having different densities or fluorescent inks are printed. A document confirmation system has been proposed in which a surface image collected by a scanner is displayed on a screen, and an operator visually confirms whether or not a message pattern appears in the document.

【0003】また、同じく、特開平6―215177に
は、小切手等の文書の有効性を確認するため、予め指定
された領域の画像を比較し、例えば、メッセージ「VA
LID」が光学的走査によって現れるかどうかを自動的
に検出することが記載されている。
[0003] Similarly, Japanese Patent Application Laid-Open No. Hei 6-215177 discloses an image in a predetermined area in order to confirm the validity of a document such as a check.
It is described to automatically detect whether the "LID" appears by optical scanning.

【0004】[0004]

【発明が解決しようとする課題】光学的走査によって現
れたメッセージパターンが記載文字列や押印と重なって
いる場合、この光学的走査によって現れたメッセージパ
ターンが障害となり、記載文字列や押印が見づらい、あ
るいは、判読できないという問題があった。
When a message pattern appearing by optical scanning overlaps a written character string or stamp, the message pattern appearing by optical scanning becomes an obstacle, and the written character string or stamp is difficult to see. Or, there was a problem that it could not be read.

【0005】また、メッセージパターンは微小な点状パ
ターンや線状パターンから形成されているため、メッセ
ージパターンが現われた文書画像では、公知の標準的な
圧縮方法ではデータ量が低減できず、かえって、画像デ
ータ量が膨大となる。このため、遠隔地に当該文書画像
を通信する場合、通信コストがかかる等の問題がある。
また、当該文書画像を蓄積する場合、画像データ量が膨
大となり、多くの記憶容量を占めるという問題がある。
[0005] Further, since the message pattern is formed from a minute point-like pattern or a linear pattern, the data amount of a document image in which the message pattern appears cannot be reduced by a known standard compression method. The amount of image data becomes enormous. For this reason, when the document image is communicated to a remote place, there is a problem that communication cost is required.
Further, when storing the document image, there is a problem that the amount of image data becomes enormous and occupies a large storage capacity.

【0006】さらに、特開平6―215177には、小
切手等の文書の有効性を確認するため、予め指定された
領域の画像を比較し、メッセージが光学的走査によって
現れるかどうかを自動的に検出することが記載されてい
る。しかしながら、文書の任意の位置にメッセージが現
われる文書に対して、自動的に当該メッセージを検出す
ることは考慮されていない。
Further, Japanese Patent Application Laid-Open No. Hei 6-215177 discloses a method for automatically checking whether a message appears by optical scanning by comparing images of a predetermined area in order to confirm the validity of a document such as a check. Is described. However, automatic detection of a message in which a message appears at an arbitrary position in the document is not considered.

【0007】本発明の第一の目的は文書の光学的走査に
よって現れたメッセージパターンを除去し、当該文書画
像を明瞭化することである。これにより、文書に記載さ
れた文字列や押印にメッセージパターンが重なるような
文書に対して記載文字列や押印が判読しやすくなる。ま
た、メッセージパターンが除去されるので、文書画像の
データ量が削減でき、文書画像の保管や通信のコストを
低減できるという効果がある。
It is a first object of the present invention to remove a message pattern that has appeared by optical scanning of a document and to clarify the document image. This makes it easier to read the written character string or the seal on a document in which the message pattern overlaps the character string or the seal written on the document. Further, since the message pattern is removed, the data amount of the document image can be reduced, and the cost of storing and communicating the document image can be reduced.

【0008】本発明の第二の目的は文書の光学的走査に
よって現れたメッセージパターンを除去し、当該文書画
像を明瞭化した電子的な画像データに対して、公知であ
る電子透かしを付与することである。当該文書の出所や
履歴、記載内容や除去したメッセージパターン等の文書
情報を電子透かしとして、明瞭化した画像データに対し
て付与することで、文書の保管や通信の安全性を高める
ことができる。公知である電子透かしの方法としては、
佐々木良一著「インターネットセキュリティ入門」19
7頁から200頁(岩波新書、1999年3月19日発
行)に記載の電子透かし技術を用いればよい。
[0008] A second object of the present invention is to remove a message pattern generated by optical scanning of a document and to add a known electronic watermark to electronic image data obtained by clarifying the document image. It is. By adding document information such as the source and history of the document, the contents of the description, and the removed message pattern to the clarified image data as a digital watermark, the security of document storage and communication can be improved. Known methods of digital watermarking include:
Ryoichi Sasaki, "Introduction to Internet Security" 19
The digital watermarking technology described on pages 7 to 200 (Iwanami Shinsho, issued March 19, 1999) may be used.

【0009】本発明の第三の目的は微小なパターンから
形成されているメッセージパターンに対して、点状ノイ
ズおよび線状ノイズを除去することにより、メッセージ
パターンを除去し文書画像を明瞭化する手段を提供する
ことにある。
A third object of the present invention is to remove a point noise and a line noise from a message pattern formed of a minute pattern, thereby removing the message pattern and clarifying a document image. Is to provide.

【0010】本発明の第四の目的は文書中の固定位置で
はなく、任意の位置に出現するメッセージを有する文書
に対して、文書の光学的走査によって微小なパターンか
ら形成されるメッセージパターンが現われるかどうかの
ノイズ有無検出を行うことである。これにより、光学的
走査の対象文書が複写機等で複写された文書かどうかの
真贋判定を行うことができる。
A fourth object of the present invention is to provide a message having a message appearing at an arbitrary position, not a fixed position in the document, as a message pattern formed from a minute pattern by optical scanning of the document. That is, whether or not noise is detected. This makes it possible to determine whether the document to be optically scanned is a document copied by a copying machine or the like.

【0011】本発明の第五の目的は、微小なパターンを
除去する画像明瞭化によって画像データ量を削減し、画
像明瞭化処理後、ネットワークを介して遠隔地に送信す
る。これにより、画像データの通信コスト、保管コスト
を低減することができる。
[0011] A fifth object of the present invention is to reduce the amount of image data by image clarification for removing minute patterns, and after image clarification processing, transmit the image data to a remote place via a network. As a result, communication costs and storage costs for image data can be reduced.

【0012】[0012]

【課題を解決するための手段】上記第一の目的を達成す
るため、微小なパターンからなるノイズの有無を検出す
る第一の手段と、採取した文書画像から当該ノイズを除
去し画像を明瞭化する第二の手段を備え、第一の手段で
微小なパターンからなるノイズが検出された場合にの
み、第二の手段で画像を明瞭化する。
In order to achieve the first object, first means for detecting the presence or absence of noise composed of minute patterns, and elimination of the noise from a sampled document image to clarify the image And a second means for clarifying an image only when noise composed of minute patterns is detected by the first means.

【0013】上記第二の目的を達成するため、微小なパ
ターンからなるノイズの有無を検出する第一の手段と、
当該ノイズを除去し画像を明瞭化する第二の手段と、明
瞭化した画像に対して当該文書情報を基に電子透かしを
付与する第三の手段を具備する。
[0013] To achieve the second object, a first means for detecting the presence or absence of noise composed of a minute pattern;
A second means for removing the noise to clarify the image and a third means for adding a digital watermark to the clarified image based on the document information are provided.

【0014】上記第三の目的を達成するため、ノイズを
除去し画像を明瞭化する手段は、孤立点形状のノイズを
除去する手段と水平および垂直方向の線分形状のノイズ
を除去する手段と、斜め方向の線分形状のノイズを除去
する手段とを具備する。
In order to achieve the third object, means for removing noise and clarifying an image include means for removing noise in the form of isolated points and means for removing noise in the form of horizontal and vertical line segments. Means for removing noise in the shape of a line segment in an oblique direction.

【0015】上記第四の目的を達成するため、微小なパ
ターンからなるノイズの有無を検出する手段は、黒ラン
を生成手段と、黒ランの個数を計数する手段とを具備す
る。あるいは、微小なパターンからなるノイズの有無を
検出する手段は、低解像度の画像を入力する手段と、高
解像度の画像を入力手段と、当該低解像度の画像と高解
像度の画像とを比較する手段を具備する。
In order to achieve the fourth object, the means for detecting the presence or absence of noise composed of minute patterns includes means for generating black runs and means for counting the number of black runs. Alternatively, the means for detecting the presence / absence of noise composed of minute patterns includes means for inputting a low-resolution image, means for inputting a high-resolution image, and means for comparing the low-resolution image with the high-resolution image. Is provided.

【0016】上記第五の目的を達成するため、微小なパ
ターンからなるノイズの有無を検出する手段と、当該ノ
イズを除去し画像を明瞭化する手段と、明瞭化した画像
に対して当該文書情報を基に電子透かしを付与する手段
を具備し、データ量を削減した明瞭化画像を遠隔地にネ
ットワークを介して送信することと、電子透かしを付与
した明瞭化画像を大容量記憶装置に保管する。
In order to achieve the fifth object, means for detecting the presence or absence of noise composed of minute patterns, means for removing the noise to clarify an image, and means for clarifying the document information with respect to the clarified image A means for giving a digital watermark based on the image data, transmitting the clarified image with a reduced data amount to a remote place via a network, and storing the clarified image with the digital watermark in a mass storage device .

【0017】[0017]

【発明の実施の形態】図1は本発明の一実施例である文
書画像処理装置の構成図である。図2は対象とする文書
画像の例である。光学的走査により採取した文書画像2
00において、オリジナルの文書では見えなかったメッ
セージ、例えば、「複写」というメッセージが、当該文
書の光学的走査においては現れている。この現われたメ
ッセージの部分画像201、202、203をメッセー
ジパターンと呼ぶ。記載文字列210、211、212
とこれらメッセージパターンとが重なると記載文字列が
見づらい、判読しづらいという問題がある。また、メッ
セージパターン201、202、203は微小なパター
ンから形成されており、点状ノイズや線状ノイズが密集
している。文書画像には、このようなノイズが密集して
いるため、当該文書画像に対して、公知である標準的な
データ圧縮方法、例えば、MMR圧縮法(モデイファイ
ド・モデイファイド・リード法)を適用すると、データ
圧縮の効果はなく、かえって、データ量が増大するとい
う問題がある。このため、ノイズを除去して文書画像を
明瞭化する必要がある。光電変換部100で文書の表面
に光学的走査を行い文書画像を採取する。文書画像に対
して、ノイズ有無検出部101において、微小なノイズ
の密集部分、即ちメッセージパターンの有無を検出す
る。そして、ノイズが有ると判断された場合、画像明瞭
化部102において、当該ノイズを除去する。図3は明
瞭化した文書画像の例である。文書画像200に対し
て、画像明瞭化部102において、ノイズを除去する明
瞭化処理を行った結果画像が300である。明瞭化後画
像300において、光学的走査によって出現した微小な
ノイズからなるメッセージパターン201、202、2
03は除去され、記載文字列310、311、312の
みが現われている。このため、明瞭化後の画像のデータ
量は削減することができる。送信部103では明瞭化後
の画像を公知である標準的なデータ圧縮方法、例えば、
MMR圧縮法(モデイファイド・モデイファイド・リー
ド法)を適用し、データ量を削減後、ネットワーク10
4を介して遠隔地に送信し、遠隔地にある受信部105
で受信する。電子透かし付与部106では、明瞭化後の
画像に対して、文書情報、例えば、出所、履歴、除去し
たメッセージパターン等の情報を基に、公知である電子
透かしを、付与する。そして、大容量の記憶装置からな
る蓄積部107において当該明瞭化後の画像データを蓄
積保管する。
FIG. 1 is a block diagram of a document image processing apparatus according to an embodiment of the present invention. FIG. 2 is an example of a target document image. Document image 2 obtained by optical scanning
At 00, a message that was not visible in the original document, such as the message "copy", appears in an optical scan of the document. The appearing partial images 201, 202, and 203 of the message are called message patterns. Description character strings 210, 211, 212
When these message patterns overlap with each other, there is a problem that the written character string is difficult to see and difficult to read. Further, the message patterns 201, 202, and 203 are formed of minute patterns, and point noises and linear noises are concentrated. Since such noises are dense in the document image, if a known standard data compression method, for example, the MMR compression method (Modified, Modified Read) is applied to the document image, There is no effect of data compression, and there is a problem that the data amount is rather increased. For this reason, it is necessary to remove the noise to clarify the document image. The surface of the document is optically scanned by the photoelectric conversion unit 100 to collect a document image. For the document image, the noise presence / absence detection unit 101 detects a dense portion of minute noise, that is, the presence / absence of a message pattern. When it is determined that there is noise, the image clarifying unit 102 removes the noise. FIG. 3 is an example of a clarified document image. An image 300 is a result image of the document image 200 that has been subjected to a clearing process for removing noise in the image clearing unit 102. In the image 300 after clarification, message patterns 201, 202, and 2 composed of minute noises generated by optical scanning.
03 is removed, and only the description character strings 310, 311 and 312 appear. For this reason, the data amount of the image after clarification can be reduced. The transmission unit 103 converts the clarified image into a known standard data compression method, for example,
After applying the MMR compression method (Modified Modified Read method) to reduce the amount of data, the network 10
4 to the remote location, and the remote receiving unit 105
To receive. The digital watermark adding unit 106 adds a known electronic watermark to the image after the clarification based on document information, for example, information such as a source, a history, and a removed message pattern. Then, the clarified image data is stored in the storage unit 107 including a large-capacity storage device.

【0018】メッセージパターン201、202、20
3は微小なパターンから形成されており、点状ノイズや
線状ノイズが密集している。図14はメッセージパター
ンの一部分の拡大図であり、メッセージパターンの一部
1400には孤立点状ノイズ1401、1402、14
03が密集している。また、図9は水平方向の線分ノイ
ズが密集したメッセージパターンの一部分の拡大図であ
る。メッセージパターンの一部900には水平方向の線
分ノイズ901、902、903が密集している。さら
に、図11は垂直方向の線分ノイズが密集したメッセー
ジパターンの一部分の拡大図である。メッセージパター
ンの一部1100には垂直方向の線分ノイズ1101、
1102、1103、1104が密集している。図12
は斜め方向の線分ノイズが密集したメッセージパターン
の一部分の拡大図である。メッセージパターンの一部1
200には斜め方向の線分ノイズ1201、1202、
1203が密集している。文書によっては、これら、点
状ノイズや線状ノイズのいづれかがメッセージパターン
として出現する場合や、点状ノイズや線状ノイズが組み
合わされて出現する場合があり、ノイズの種類を予め特
定することはできない。
Message patterns 201, 202, 20
Numeral 3 is formed from a minute pattern, and point noise and linear noise are dense. FIG. 14 is an enlarged view of a part of the message pattern. A part 1400 of the message pattern includes isolated point noises 1401, 1402, and 1414.
03 is crowded. FIG. 9 is an enlarged view of a part of a message pattern in which line segment noise in the horizontal direction is dense. Line segment noises 901, 902, and 903 in the horizontal direction are concentrated in a part 900 of the message pattern. FIG. 11 is an enlarged view of a part of a message pattern in which vertical line segment noise is dense. A vertical line segment noise 1101 includes a part 1100 of the message pattern.
1102, 1103, and 1104 are dense. FIG.
FIG. 4 is an enlarged view of a part of a message pattern in which line segment noise in an oblique direction is dense. Part 1 of message pattern
200 includes oblique line segment noises 1201 and 1202;
1203 are dense. Depending on the document, any of these point noise or linear noise may appear as a message pattern, or may appear in combination with point noise or linear noise.It is not possible to specify the type of noise in advance. Can not.

【0019】図4はノイズ有無検出部101の処理過程
を説明する図である。ステップ400で通常解像度の画
像を入力し、ステップ401で当該画像を白黒の2値画
像に変換する。そして、ステップ402で、黒色の画素
の横方向のつながりからなる黒線分(黒ランと呼ぶ)を
生成する。そして、ステップ403で、当該黒ランの個
数を計数し、黒ランの密度を算出する。ステップ404
でノイズの有無判定を行う。有無判定では、例えば、当
該黒ランの密度が所定値より大きければ、メッセージパ
ターンが有ると判定する。
FIG. 4 is a view for explaining the processing steps of the noise detection unit 101. In step 400, an image having a normal resolution is input, and in step 401, the image is converted into a monochrome binary image. Then, in step 402, a black line segment (referred to as a black run) composed of the horizontal connection of the black pixels is generated. Then, in step 403, the number of the black runs is counted, and the density of the black runs is calculated. Step 404
To determine the presence or absence of noise. In the presence / absence determination, for example, if the density of the black run is greater than a predetermined value, it is determined that there is a message pattern.

【0020】図5は画像明瞭化部102の処理過程を説
明する図である。点状ノイズや線状ノイズのいづれかが
メッセージパターンとして出現する場合や、点状ノイズ
や線状ノイズが組み合わされて出現する場合があり、ノ
イズの種類を予め特定することはできない。このため、
ステップ500で孤立点状ノイズを除去する。そして、
ステップ501で横線状ノイズを除去する。次いで、黒
ランをステップ502で、90度回転させ、ステップ5
03で、縦線状ノイズを除去する。黒ランを90度回転
しているため、ステップ501の横線状ノイズの除去と
ステップ503の縦線状ノイズの除去とは、同じ処理方
法でよい。次に、ステップ504で黒ランを90度回転
させ、元の正立した画像に戻す。次いで、ステップ50
5で斜め線状ノイズを除去する。
FIG. 5 is a diagram for explaining the processing steps of the image clearing unit 102. Either point noise or linear noise may appear as a message pattern, or point noise or linear noise may appear in combination, and the type of noise cannot be specified in advance. For this reason,
In step 500, isolated point noise is removed. And
In step 501, horizontal linear noise is removed. Next, in step 502, the black run is rotated 90 degrees, and in step 5
At 03, vertical line noise is removed. Since the black run is rotated by 90 degrees, the same processing method may be used for removing the horizontal linear noise in step 501 and removing the vertical linear noise in step 503. Next, in step 504, the black run is rotated 90 degrees to return to the original erect image. Then, Step 50
In step 5, oblique linear noise is removed.

【0021】図6はノイズ有無検出部101の別の実施
例の処理過程を説明する図である。文書表面の光学的走
査において、ステップ600で低解像度の画像を入力
し、ステップ602で当該画像を2値化する。一方、ス
テップ601で高解像度の画像を入力し、同じくステッ
プ603で当該画像を2値化する。低解像度の画像で
は、微小なパターンの変化は採取されないので、点状や
線状ノイズからなるメッセージパターンは出現しない。
一方、高解像度の画像では、微小なパターンの変化は採
取されるので、点状や線状ノイズからなるメッセージパ
ターンは出現する。この原理を利用し、ステップ604
において、低解像度の2値画像と高解像度の2値画像と
の画像差分を抽出する。ステップ605で当該画像差分
値の大小を比較し、有無判定を行う。もし、画像差分値
が大きい場合、光学的走査によりメッセージパターンが
出現していると判定する。一方、画像差分値が小さい場
合、メッセージパターンが光学的走査により出現してい
ないと判定する。複写機等により複写した紙の文書で
は、複写時にメッセージパターンが出現している。この
ため、低解像度の2値画像と高解像度の2値画像とも複
写されたメッセージパターンが含まれているため、ステ
ップ604の画像差分の値は小さく、メッセージパター
ンが光学的走査により出現していないと判定する。これ
により、入力する文書が複写された文書であるか、オリ
ジナルな文書であるかの判定を行うことができる。
FIG. 6 is a diagram for explaining the processing steps of another embodiment of the noise detection unit 101. In the optical scanning of the document surface, a low-resolution image is input in step 600, and the image is binarized in step 602. On the other hand, a high-resolution image is input in step 601, and the image is binarized in step 603. In a low-resolution image, a minute pattern change is not sampled, so that a message pattern composed of point-like or linear noise does not appear.
On the other hand, in a high-resolution image, a minute pattern change is sampled, so that a message pattern composed of point-like or linear noise appears. Using this principle, step 604
In, an image difference between a low-resolution binary image and a high-resolution binary image is extracted. In step 605, the magnitude of the image difference value is compared to determine the presence or absence. If the image difference value is large, it is determined that a message pattern has appeared by optical scanning. On the other hand, if the image difference value is small, it is determined that the message pattern has not appeared by optical scanning. In a paper document copied by a copying machine or the like, a message pattern appears at the time of copying. Therefore, since both the low-resolution binary image and the high-resolution binary image include the copied message pattern, the value of the image difference in step 604 is small, and the message pattern has not appeared by optical scanning. Is determined. This makes it possible to determine whether the input document is a copied document or an original document.

【0022】図7は光学的走査の対象文書が複写機等で
複写された文書かオリジナルな文書であるかどうかの真
贋判定を行う文書処理装置の構成を説明する図である。
光電変換部700で文書の表面画像を採取し、ノイズ有
無検出部701でメッセージパターンの有無を検出す
る。ノイズ有無検出部701は図6に示した構成でよ
い。メッセージパターンの有無検出結果は結果出力部7
02で画面上の警告文や警告音声として出力される。
FIG. 7 is a diagram for explaining the configuration of a document processing apparatus for judging whether a document to be optically scanned is a document copied by a copying machine or the like or an original document.
A photoelectric conversion unit 700 collects a surface image of the document, and a noise presence / absence detection unit 701 detects the presence / absence of a message pattern. The noise presence / absence detector 701 may have the configuration shown in FIG. The result output part 7 detects the presence or absence of the message pattern.
02 is output as a warning sentence or warning sound on the screen.

【0023】図8は本発明の別の実施例である。光電変
換部800で文書の表面に光学的走査を行い文書画像を
採取する。文書画像に対して、ノイズ有無検出部801
において、微小なノイズの密集部分、即ちメッセージパ
ターンの有無を検出する。そして、ノイズが有ると判断
された場合、画像明瞭化部802において、当該ノイズ
を除去する。電子透かし付与部803では、明瞭化後の
画像に対して、文書情報、例えば、出所、履歴、除去し
たメッセージパターン等の情報を基に、公知である電子
透かしを、付与する。
FIG. 8 shows another embodiment of the present invention. The surface of the document is optically scanned by the photoelectric conversion unit 800 to collect a document image. Noise detection unit 801 for the document image
, A dense portion of minute noise, that is, the presence or absence of a message pattern is detected. If it is determined that there is noise, the image clarification unit 802 removes the noise. The digital watermark adding unit 803 adds a known electronic watermark to the image after the clarification based on document information, for example, information such as a source, a history, and a removed message pattern.

【0024】図10はステップ501で示した水平方向
の線分ノイズを除去する方法を説明する図である。黒ラ
ンで表現された画像に対して、今、注目する黒ランを1
000とすると、当該注目黒ラン1000の上側の走査
線上において、注目黒ランの始点座標XS0、1010
と終点座標XE0、1011に近辺に白領域1001が
存在するかどうかを判定する。また、同じく、当該注目
黒ラン1000の下側の走査線上において、注目黒ラン
の始点座標XS0、1010と終点座標XE0、101
1の近辺に白領域1002が存在するかどうかを判定す
る。もし、注目する黒ラン1000の上下の走査線上に
当該白領域1001、1002が存在する場合、当該黒
ランを線分ノイズとして、当該黒ランを削除する。
FIG. 10 is a diagram for explaining a method of removing the horizontal line segment noise shown in step 501. For the image represented by black runs, the black run of interest is now 1
000, the starting point coordinates XS0, 1010 of the target black run on the scanning line above the target black run 1000
It is determined whether a white area 1001 exists near the end point coordinates XE0 and 1011. Similarly, on the lower scanning line of the target black run 1000, the start point coordinates XS0 and 1010 and the end point coordinates XE0 and 101 of the target black run.
It is determined whether or not a white area 1002 exists in the vicinity of “1”. If the white areas 1001 and 1002 exist on the scanning lines above and below the black run 1000 of interest, the black run is deleted using the black run as line segment noise.

【0025】図13はステップ505で示した斜め方向
の線分ノイズを除去する方法を説明する図である。黒ラ
ンで表現された画像に対して、今、注目する黒ランを1
300とすると、当該注目黒ラン1300の上側の走査
線上において、注目黒ランの始点座標XS0、1310
と終点座標XE0、1311とに対して、始点座標13
30、終点座標1331が所定の位置関係を有する黒ラ
ン1301が存在するかどうかを判定する。また、同じ
く、当該注目黒ラン1300の下側の走査線上におい
て、始点座標1320、終点座標1321が所定の位置
関係を有する黒ラン1302が存在するかどうかを判定
する。もし、注目する黒ラン1300の上下の走査線上
に当該黒ラン1301、1302が存在する場合、当該
黒ランを斜め線分ノイズとして、当該黒ラン1330を
削除する。
FIG. 13 is a view for explaining a method of removing the line segment noise in the oblique direction shown in step 505. For the image represented by black runs, the black run of interest is now 1
Assuming that the start coordinate XS0, 1310 of the target black run on the scanning line above the target black run 1300,
And the end point coordinates XE0 and 1311, the start point coordinate 13
30, it is determined whether there is a black run 1301 whose end point coordinates 1331 have a predetermined positional relationship. Similarly, it is determined whether there is a black run 1302 having a predetermined positional relationship between the start point coordinates 1320 and the end point coordinates 1321 on the scan line below the target black run 1300. If the black runs 1301 and 1302 exist on the scanning lines above and below the black run 1300 of interest, the black run 1330 is deleted using the black run as oblique line segment noise.

【0026】[0026]

【発明の効果】本発明によれば、文書に記載された文字
列や押印にメッセージパターンが重なるような文書に対
して記載文字列や押印が判読しやすくなる。また、メッ
セージパターンが除去されるので、文書画像のデータ量
が削減でき、文書画像の保管や通信のコストを低減でき
るという効果がある。
According to the present invention, a written character string or a seal can be easily read in a document in which a message pattern overlaps a character string or a seal described in the document. Further, since the message pattern is removed, the data amount of the document image can be reduced, and the cost of storing and communicating the document image can be reduced.

【0027】また、本発明によれば、メッセージパター
ンを除去した明瞭化文書画像データに対して、当該文書
の出所や履歴、記載内容や除去したメッセージパターン
等の文書情報を電子透かしとして、明瞭化した文書画像
データに付与することで、文書の保管や通信の安全性を
高めることができる。
Further, according to the present invention, the clarified document image data from which the message pattern has been removed is clarified by using document information such as the source, history, description contents and the removed message pattern of the document as an electronic watermark. By adding the document image data to the stored document image data, the security of document storage and communication can be improved.

【0028】さらに、本発明によれば、光学的走査の対
象文書が複写機等で複写された文書かどうかの真贋判定
を行うことができる。
Further, according to the present invention, it is possible to determine whether the document to be optically scanned is a document copied by a copying machine or the like.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例である文書画像処理装置の構
成図である。
FIG. 1 is a configuration diagram of a document image processing apparatus according to an embodiment of the present invention.

【図2】対象とする文書画像の例である。FIG. 2 is an example of a target document image.

【図3】明瞭化した文書画像の例である。FIG. 3 is an example of a clarified document image.

【図4】ノイズ有無検出部101の処理過程を説明する
図である。
FIG. 4 is a diagram illustrating a processing process of a noise presence / absence detection unit 101.

【図5】画像明瞭化部102の処理過程を説明する図で
ある。
FIG. 5 is a diagram illustrating a processing process of an image clarifying unit 102.

【図6】ノイズ有無検出部101の別の実施例の処理過
程を説明する図である。
FIG. 6 is a diagram illustrating a processing process of another embodiment of the noise presence / absence detection unit 101.

【図7】光学的走査の対象文書が複写機等で複写された
文書かオリジナルな文書であるかどうかの真贋判定を行
う文書処理装置の構成を説明する図である。
FIG. 7 is a diagram illustrating a configuration of a document processing apparatus that determines whether the document to be optically scanned is a document copied by a copying machine or the like or an original document.

【図8】本発明の別の実施例である。FIG. 8 is another embodiment of the present invention.

【図9】水平方向の線分ノイズが密集したメッセージパ
ターンの一部分の拡大図である。
FIG. 9 is an enlarged view of a part of a message pattern in which horizontal line segment noise is dense.

【図10】ステップ501で示した水平方向の線分ノイ
ズを除去する方法を説明する図である。
FIG. 10 is a diagram illustrating a method for removing line segment noise in the horizontal direction shown in step 501.

【図11】垂直方向の線分ノイズが密集したメッセージ
パターンの一部分の拡大図である。
FIG. 11 is an enlarged view of a part of a message pattern in which vertical line segment noise is dense.

【図12】斜め方向の線分ノイズが密集したメッセージ
パターンの一部分の拡大図である。
FIG. 12 is an enlarged view of a part of a message pattern in which line segment noise in a diagonal direction is dense.

【図13】ステップ505で示した斜め方向の線分ノイ
ズを除去する方法を説明する図である。
FIG. 13 is a diagram illustrating a method of removing line segment noise in an oblique direction shown in step 505.

【図14】メッセージパターンの一部分の拡大図であ
る。
FIG. 14 is an enlarged view of a part of a message pattern.

【符号の説明】[Explanation of symbols]

101…ノイズ有無検出部、102…画像明瞭化部、1
06…電子透かし付与部、200…文書画像、201…
メッセージパターン、300…明瞭化後画像、403…
黒ラン個数計数ステップ、500…点状ノイズ除去ステ
ップ、501…横線状ノイズ除去ステップ、600…低
解像度画像入力ステップ、601…高解像度画像入力ス
テップ、604…画像差分ステップ、901…水平方向
線分ノイズ、1101…垂直方向線分ノイズ、1203
…斜め線方向線分ノイズ、1401…孤立点状ノイズ。
101: Noise detection unit, 102: Image clarification unit, 1
06: digital watermarking unit, 200: document image, 201:
Message pattern, 300 ... image after clarification, 403 ...
Black run number counting step, 500 point-like noise removal step, 501 horizontal line noise removal step, 600 low-resolution image input step, 601 high-resolution image input step, 604 image difference step, 901 horizontal line segment Noise, 1101... Vertical segment noise, 1203
... Oblique line direction line segment noise, 1401... Isolated point noise.

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B057 AA11 BA02 BA29 CA02 CA06 CA12 CA16 CB02 CB06 CB12 CB16 CC02 CD04 CD05 CE02 CG07 CH08 DA08 DA17 DB02 DB05 DB08 DC02 DC32 DC36 5C076 AA02 AA14 AA21 AA22 AA40 BA06  ────────────────────────────────────────────────── ─── Continued on the front page F term (reference) 5B057 AA11 BA02 BA29 CA02 CA06 CA12 CA16 CB02 CB06 CB12 CB16 CC02 CD04 CD05 CE02 CG07 CH08 DA08 DA17 DB02 DB05 DB08 DC02 DC32 DC36 5C076 AA02 AA14 AA21 AA22 AA40 BA06

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】文章画像の読み取り手段と、 上記読み取り手段で読み取った上記文章画像を入力し、
上記文章画像中の画像パターンを検出し、該検出結果を
出力する第一の検出手段と、 上記読み取り手段で読み取った上記文章画像を入力し、
上記文章画像中の画像パターンを上記第一の検出手段よ
りも高解像度で検出し、該検出結果を出力する第二の検
出手段と、 上記第一の検出手段の検出結果を入力し二値化された第
一の検出手段の検出結果を出力し、上記第二の検出手段
の検出結果を入力し二値化された第二の検出手段の検出
結果を出力する二値化手段と、 上記二値化された第一の検出手段の検出結果と、上記二
値化された第二の検出手段の検出結果とを入力し、二つ
の画像の差分結果を出力する画像差分手段と、 上記差分結果を入力し、該差分結果からノイズを検出す
るノイズ有無検出手段と、 上記文章画像と上記ノイズを入力し、上記文章画像から
上記ノイズを除去した明瞭化後画像を出力する画像明瞭
化手段と、を備えた文章画像処理装置。
1. A reading means for reading a text image, and inputting the text image read by the reading means,
A first detecting means for detecting an image pattern in the text image and outputting the detection result; and inputting the text image read by the reading means,
A second detection unit that detects an image pattern in the text image at a higher resolution than the first detection unit and outputs the detection result; and inputs a detection result of the first detection unit and binarizes the input. Binarizing means for outputting the detected result of the first detecting means, inputting the detected result of the second detecting means, and outputting the binarized detection result of the second detecting means; Image difference means for inputting the detection result of the first detection means that has been converted into a value and the detection result of the second detection means having been converted to a binary value, and outputting a difference result between the two images; And noise detection means for detecting noise from the difference result, image clarification means for inputting the text image and the noise, and outputting a clarified image after removing the noise from the text image, A sentence image processing device comprising:
【請求項2】請求項1記載の文章画像処理装置であっ
て、 更に、上記明瞭化後画像を入力し、該明瞭化後画像に電
子透かしを付与して出力する電子透かし付与手段を備え
た文章画像処理装置。
2. The text image processing apparatus according to claim 1, further comprising electronic watermarking means for inputting the clarified image, adding a digital watermark to the clarified image, and outputting the digitalized watermark. Text image processing device.
【請求項3】請求項1又は2記載の文章画像処理装置で
あって、 上記画像明瞭化手段は、点形状のノイズを除去する手
段、線形状のノイズを除去する手段を有することを特徴
とする文章画像処理装置。
3. The text image processing apparatus according to claim 1, wherein said image clearing means has means for removing point-shaped noise and means for removing linear noise. Sentence image processing device.
【請求項4】請求項1又は2記載の文章画像処理装置で
あって、 上記二値化手段は、白黒の二値化を行うことを特徴とす
る文章画像処理装置。
4. The text image processing apparatus according to claim 1, wherein said binarizing means performs black and white binarization.
【請求項5】請求項4記載の文章画像処理装置であっ
て、 上記ノイズ有無検出手段は、上記差分結果に含まれる黒
色の画素のつながりを生成し、該つながりの個数又は密
度を算出してノイズの有無を判定することを特徴とする
文章画像処理装置。
5. The text image processing apparatus according to claim 4, wherein the noise presence / absence detecting means generates a connection of black pixels included in the difference result, and calculates the number or density of the connection. A sentence image processing apparatus characterized by determining the presence or absence of noise.
【請求項6】請求項1記載の文章画像処理装置であっ
て、 更に、上記明瞭化後画像を入力して送信データに変換
し、該送信データを送信する送信手段を有することを特
徴とする文章画像処理装置。
6. The text image processing apparatus according to claim 1, further comprising a transmission unit that inputs the clarified image, converts the input image into transmission data, and transmits the transmission data. Text image processing device.
JP29181099A 1999-10-14 1999-10-14 Document image processing device Pending JP2001111816A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29181099A JP2001111816A (en) 1999-10-14 1999-10-14 Document image processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29181099A JP2001111816A (en) 1999-10-14 1999-10-14 Document image processing device

Publications (1)

Publication Number Publication Date
JP2001111816A true JP2001111816A (en) 2001-04-20

Family

ID=17773722

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29181099A Pending JP2001111816A (en) 1999-10-14 1999-10-14 Document image processing device

Country Status (1)

Country Link
JP (1) JP2001111816A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8009305B2 (en) 2003-08-21 2011-08-30 Ricoh Company, Ltd. Method, program, and apparatus for detecting a copy-prohibited document and prohibiting a reproduction of the detected copy prohibited document
US11115560B2 (en) 2018-09-28 2021-09-07 Pfu Limited Image processing device, control method and control program for more accurately removing a background pattern from an image

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8009305B2 (en) 2003-08-21 2011-08-30 Ricoh Company, Ltd. Method, program, and apparatus for detecting a copy-prohibited document and prohibiting a reproduction of the detected copy prohibited document
US11115560B2 (en) 2018-09-28 2021-09-07 Pfu Limited Image processing device, control method and control program for more accurately removing a background pattern from an image

Similar Documents

Publication Publication Date Title
JP3964684B2 (en) Digital watermark embedding device, digital watermark detection device, digital watermark embedding method, and digital watermark detection method
JP3178305B2 (en) Image processing method and apparatus, copier, scanner and printer equipped with the same
KR100433590B1 (en) Ticket issuing method, ticket issuing system and ticket collating method
JP4261005B2 (en) Region-based image binarization system
JP2001078006A (en) Method and device for embedding and detecting watermark information in black-and-white binary document picture
JP2003099788A (en) Image processor
JP3427554B2 (en) Image processing apparatus and method
US20110170133A1 (en) Image forming apparatus, method of forming image and method of authenticating document
CN101344748B (en) Copy apparatus having copy prevention function and copy prevention method thereof
JP2001111816A (en) Document image processing device
CN101082957B (en) Halftone screen encoded certificate false proof processing method
JP4757205B2 (en) Image processing apparatus, image processing system, and image processing program
JPH09120456A (en) Method and device for image processing, and copying machine, printer, and scanner using same
Suzaki et al. New alteration detection technique for printed documents using dot pattern watermarking
JP3412441B2 (en) Image processing device
Suzaki et al. A watermark embedding and extracting method for printed documents
JP2733146B2 (en) Image processing device
JP3178440B2 (en) Image processing method and apparatus, copier, scanner and printer equipped with the same
JP4006140B2 (en) Image processing apparatus and image processing method
JP4206605B2 (en) Image processing apparatus, image processing method, and recording medium recording image processing program
JP3720748B2 (en) Image processing apparatus, control method therefor, computer program, and recording medium
JP3210378B2 (en) Image input device
JP2007110196A (en) Information processing system, texture superimposing apparatus, answer extract apparatus, texture superimposing method, and answer extract method
JP2001218008A (en) Picture processor, picture processing method and storage medium
JP2824991B2 (en) Image identification method