JP2001078006A - 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置 - Google Patents

白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置

Info

Publication number
JP2001078006A
JP2001078006A JP22349099A JP22349099A JP2001078006A JP 2001078006 A JP2001078006 A JP 2001078006A JP 22349099 A JP22349099 A JP 22349099A JP 22349099 A JP22349099 A JP 22349099A JP 2001078006 A JP2001078006 A JP 2001078006A
Authority
JP
Japan
Prior art keywords
watermark information
image
information
embedding
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP22349099A
Other languages
English (en)
Other versions
JP3373811B2 (ja
Inventor
Tomio Amano
富夫 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP22349099A priority Critical patent/JP3373811B2/ja
Priority to US09/621,567 priority patent/US6983056B1/en
Publication of JP2001078006A publication Critical patent/JP2001078006A/ja
Application granted granted Critical
Publication of JP3373811B2 publication Critical patent/JP3373811B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0062Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0065Extraction of an embedded watermark; Reliable detection

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 紙の文書画像は通常白黒2値のデータである
ため、濃淡の変化を利用するカラーの多値データ用の埋
め込み手法を適用できなかった。紙に印刷後の文書を、
スキャナなどで取り込むと画素レベルでは変化している
ため、埋め込んだ透かし情報を安定して検出することが
困難であった。 【解決手段】 文書画像からテキスト領域を検出し、検
出されたテキスト領域の特徴量を増減させるか、または
検出されたテキスト領域を複数の小区画に分割し小区画
を2つ以上のグループに分けて各々のグループに対して
その特徴量を増減させることによって透かし情報を埋め
込み、透かしの検出時には、各々のグループから得られ
る特徴量の集積値を比較することによって透かし情報を
検出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像中に人間
の目には一見わからないような形で透かし情報を埋め込
み、不正行為の防止や各種の権利保護に役立てる白黒2
値文書画像への透かし情報埋め込み・検出方法及びその
装置に関するものである。
【0002】
【従来の技術】ビジネス活動のグローバル化や消費者の
権利意識の普及に伴い、企業や公共機関が取り扱う情報
に関して、より厳格な管理が要求されるようになってき
ている。情報の不正な流出や偽造・改竄が、公正な競争
の阻害やプライバシーの侵害等というかたちで社会全体
に多くの不利益をもたらす、というコンセンサスが確立
した結果と考えられる。
【0003】コンピュータによる情報管理が主流となっ
た昨今でも情報の流出・漏洩は、紙によって行われるこ
とが多い。また、ペーパーレスが叫ばれている昨今であ
るが、コンピュータからプリントアウトされる形態で、
オフィス内での紙の消費量はむしろ増加している。更
に、コピアやファックスなどのOA機器の普及は情報流出
が起りやすい状況をもたらした。このような状況の下で
は、紙ベースの情報流出・漏洩を防ぎ、また流出・漏洩
した文書を追跡するための技術的手段が求められてい
る。
【0004】また、DTP(Desk Top Publishing)ソフト
ウェアやプリンタの普及により高品質の印刷文書の作成
が容易になったが、このことは外見上はもっともらしい
が内容が本来と異なる文書が作成、即ち改竄され、悪用
される危険性を増大させた。文書が偽者でないことを示
すために特別な用紙−例えば物理的な透かしの入った用
紙−やインクを用いることもできるが、ランニングコス
トが高くなってしまう。しかし、一般の文書は通常の用
紙やインクを用いて印刷、コピーされたものであり、こ
れらの文書に対してその正当性を保証する情報を付加す
る方法が求められている。
【0005】例えば、特開平7-84485号公報はコピアの
出力機を同定するための透かしの埋め込み手法を開示し
ているが、この手法はページ全体に配置した複数の領域
の黄色のトナーの輝度を変化させることにより埋め込み
を行っている。当然検出にはカラーの多値画像のスキャ
ンが要求されるが、一般的に文書は多値ではなく白黒2
値であり、また透かし検出のために白黒コピアやファッ
クスにまでカラー画像を取り込む機能を付加するのはコ
スト面で実用的ではない。
【0006】特開平6-324625号公報は文字のはねなどの
微妙な形状の差異によって透かしを埋め込む手法を開示
している。しかし、紙に印刷後スキャンした画像は、プ
リンタ印字機構の種類やプリンタとスキャナの解像度の
違いなどの影響を受けるため、画素レベルでは元画像か
ら変化している。また、コピー・印刷・スキャン時の濃
度の設定や文書の置き方−位置ずれやスキュー(紙の傾
き)−による変化、更に染み・かすれ等のノイズの影響
も加わる。これらの変動の中から埋め込みによる局所的
な形状の変化を、安定的に検出することは困難である。
【0007】
【発明が解決しようとする課題】特開平7-222000号公報
はテキスト行における中心線の縦方向の間隔を増減させ
て透かしを埋め込む手法を開示している。この手法は印
刷後のスキャンに耐え得るが検出時にオリジナル文書か
ら抽出しておいた情報が必要となるため、上述の流出・
漏洩防止のシナリオには適用できない。
【0008】本発明の目的は上述した課題を解決して、
通常白黒2値のデータである紙の文書画像でも透かし情
報を埋め込むことができ、かつ埋め込んだ情報を安定し
て検出できる白黒2値文書画像への透かし情報埋め込み
・検出方法及びその装置を提供しようとするものであ
る。
【0009】
【課題を解決するための手段】最初に文書画像からテキ
スト行の領域を検出し領域内の特徴を変化させ、この特
徴の変化を観測することにより、透かしの埋め込み及び
検出を行う。画像自体から検出されたテキスト行(通常
は外接矩形)を基準にすることにより位置ずれやスキュ
ーに対して頑健であり、1つの特徴量また複数の特徴量
の組み合わせの差・比を利用することにより染みやかす
れ等の全体的なノイズに対しても頑健な透かしを実現す
ることができる。
【0010】透かしの埋め込みにあたっては対象となる
画像領域(テキスト行)を複数の小区画に分割し、小区
画を2つのグループに分ける。一方のグループに属する
小区画に対しては特徴の量を増やす操作を行い、他方の
グループに属する小区画に対しては特徴の量を減らす操
作を施す。透かしの検出時には各小区画から抽出される
特徴をグループ毎に集計し、2つのグループから得られ
た値を比較することによって、透かしが埋め込まれてい
るのか否か、もしも透かしが埋め込まれているなら透か
しのビットは1か0かを判定する。局所的な特徴の変化
を集積することにより、コピー・印刷・スキャン時に加
えられるランダムな特徴の変化(染み、かすれ等)、ノ
イズの多い文書、印字品質の低い文書に対して耐性を持
たせることができる。
【0011】更に、2つのグループから得られた値を、
値の差や比を用いて情報を表現することにより、ページ
全体にわたって特徴量を増加または減少させるような種
類のノイズに対しても安定して透かを検出することが可
能になる。説明の便宜上、2つの小区画のグループで説
明しているが、例えばグループを2以上にしても良い。
また、特徴量の増減についても、増加と減少といいう2
段階の操作には限定されず、特徴量を段階的に増加や減
少させることにより、より多くの透かし情報を埋め込む
ことも可能である。ただし、同一領域内に透かし情報を
より多く埋め込むほど、透かし情報を埋め込んだ文書画
像から埋め込まれている情報を検出する確度(安定性)
が低くなるという問題がある。しかしこの問題は1ビッ
ト当りの透かし情報を埋め込む領域を大きくすること、
即ち1ビット当りに対して数行のテキスト行の特徴量を
集積することで、透かし情報を検出する確度を高めるこ
とが可能であるため対処可能である。
【0012】上述のように方法に即して説明してきた
が、画像中のテキスト領域を検出する手段とその検出さ
れたテキスト領域の特徴量を操作・検出する手段を含む
透かし情報埋め込み・検出装置というような、装置の形
態であっても、本発明の目的、効果等は達成可能であ
る。
【0013】
【発明の実施の形態】例えば、電子透かしを用いた機密
情報の漏洩防止・追跡は以下のようにして行われる。−
文書の印刷時に、印字される画像データ中にセキュリテ
ィに関する情報を電子透かしの技術を用いて埋め込んで
おく。−コピアやファックスで紙文書をスキャンする際
に、画像データ中に透かしが埋め込まれているか否かを
チェックし、検出されたセキュリティに応じてコピーや
ファックスを禁止したり、記録(ファックスであれば、
誰が何処に送ったかの発信記録をとる等)をとる、等の
措置を講ずる。文書の偽造防止や真贋の判断に電子透か
しを用いる場合には、印刷時に透かしを埋め込んでお
き、提示された文書から同じ透かしが検出できるか否か
によって文書の正当性を検証する。
【0014】ただし、電子透かしを用いて上記のシナリ
オ実現するためには、以下の点を考慮する。−文書画像
は白黒2値のデータとして表現されることが多いため、
濃淡の変化を用いた埋め込み手法の適用は不可であるこ
と。−印刷・コピー時やスキャン時における紙の位置ず
れやスキュー(紙の傾き)、染みやかすれ等のノイズに
対して頑健であること。−印刷物をスキャンした画像
は、画素レベルで見れば元画像と同一ではないこと。
【0015】図1に文書画像への透かし埋め込み/検出
を用いたアプリケーションの構成例を示す。埋め込み側
モジュール内の1の「文書作成/管理」は文書を電子的
に作成、保管、伝達するためのシステムであり、既存の
ワードプロセッサ、グループウェア、文書データベース
等が相当する。コード化されている文書データを紙など
の媒体に出力する場合、2の「出力用画像の作成」によ
りページ毎に画像データ(あるいは同等のデータ表現)
が生成され、4の「透かしの埋め込み」が透かしの埋め
込みを行う。画像は、図1のように他の処理や3の「入
力デバイス」から4の「透かしの埋め込み」モジュール
に入力させるような構成をとることも可能である。他の
処理から紙の文書が送られてきた場合は、3の「入力デ
バイス」(例えばイメージスキャナ)によって画像デー
タが取り込まれ、4の「透かしの埋め込み」モジュール
への入力になる。透かしが埋め込まれた画像は5の適当
な「出力デバイス」(プリンタ等)により紙文書として
出力される。
【0016】出力された紙文書は以後物理的に保存/伝
達されるが、その過程で不正に持ち出されたり、改竄・
偽造が行われる可能性がある。検出側モジュールでは正
しい透かしが埋め込まれているか否かをチェックし、不
正と判断した場合は以後の処理(コピーやファックスの
送信等)を行わないよう制御する。まず、6の「入力デ
バイス」(イメージスキャナ等)によって画像として取
り込まれる。画像は7の「透かしの検出」モジュールに
よって処理され、その後、結果が8の「チェックロジッ
ク」に渡されて、そこで要求された処理(コピーやファ
ックス等)を実行して良いか否かを判定する。図1にお
いて、2の「出力用画像の作成」、4の「透かしの埋め
込み」モジュールをファームウェアとして5の「出力デ
バイス」の中に組み込むような構成も可能である。同様
に、7の「透かしの検出」や8の「チェックロジック」
をファームウェア(装置内に保存される,その当該装置
を動かすのに必要なプログラムの一種)として6の「入
力デバイス」に組み込むような構成も可能である。5の
「出力デバイス」と6の「入力デバイス」を省略し電子
的な画像データの偽造・改竄・不正な送信をチェックす
るアプリケーション・ソフトウェアを構成することも可
能である。
【0017】上述の構成の中で、4の「透かしの埋め込
み」モジュール及び7の「透かしの検出」モジュールの
内容が、本発明の中心部分である。図2は、本手法によ
る透かし埋め込み/検出処理のフローチャートである。
埋め込み処理の入力はオリジナル文書のページ画像、出
力は透かしが埋め込まれたページ画像である。検出処理
は、画像(通常は印刷後にスキャンされたもの)を入力
として、透かしの埋め込みが無いこと、または透かし情
報を示すビット列を出力する。説明の便宜上、ここでは
1ビットを埋め込み、それを検出する場合について説明
をおこなう。もちろん、本発明の趣旨から外れることな
く、複数ビットを埋め込むことも可能である。
【0018】埋め込み処理の最初のステップとして画像
中のテキスト領域を検出し、各行に外接する矩形の座標
を計算する。これは従来技術であり、OCRや文書画像解
析分野で開発された既存のレイアウト解析手法を用いる
ことができる。
【0019】検出された行の外接矩形集合について、そ
れぞれの矩形を小区画に分割し、小区画を2つのグルー
プに分ける。分割やグルーピングは、透かしの埋め込み
時と検出時で同一のものを使用する限り、任意(ランダ
ム)に決定することができる。ただし、透かし検出の確
度を上げるため、即ち安定して透かしを検出するために
は、 1) 各グループに属する区画の面積の総和に大きな差
がないこと 2) 行矩形を上下で分割した場合には、上下の小区画
が別々のグループに属すること が望ましい。2)は、埋め込みに使われる特徴量に変動
を与える要素、例えば明朝体のテキスト中に一部ゴシッ
ク体が使われている場合等の影響を相殺する効果があ
る。
【0020】図3に行矩形の分割とグルーピングの例を
示す。この例では、「ビジネス活動のグローバル化や消
費者の権」というテキスト行に外接する矩形を水平方向
に6等分、垂直方向に2等分して計12個の小区画に分
割している。図3(c)のとは小区画の属するグル
ープを示し、即ちとの2種類にグループ分けを行
う。
【0021】透かしの情報として1を埋め込むか、0を
埋め込むかに応じて、各グループに対して画像の特徴量
を増減する処理を施す。本実施例では1を埋め込む場合
にはグループに属する小区画に対してはその特徴量を
増加させる処理を行い、グループに属する小区画に対
してはその特徴量を逆に減少させる処理を行うこととす
る。0を埋め込む場合は、これとは逆の操作を行うこと
とする。このルールは、透かしの埋め込み時と検出時に
おいて整合性があれば、逆に定めることもできる。ここ
で特徴とは、画像から適当なルールに基づいて計算され
るスカラー量のことをいう。例えば、黒画素の数、黒白
の遷移の数(ある画像の範囲をラスタ走査して黒画素お
よび白画素のランを観測したとき画素の値が白から黒
(または黒から白)に変化する回数)、特定の局所パター
ンの出現頻度、線分の平均太さ等はいずれも特徴である
が、透かしに使用可能な特徴は、透かしが無い状態であ
る程度統計的に一定である必要がある。統計的に一定で
なければ、透かし情報の検出の確度(安定性)が低くな
るからである。本実施例では、小区画内の黒画素の数を
黒画素領域の周囲長の2乗で正規化した値を特徴として
用いている。
【0022】その他の例として、線分の平均太さを特徴
として利用することも可能である。図8に線分の平均太
さを検出する場合のフローチャートを示す。図9のよう
に、太さの検出は対象となる矩形領域について主操作方
向を垂直方向とするラスタ操作をすることによって行
う。太さ情報検出プログラムは垂直の走査線各ラインを
観測して黒画素のラン(連)を検出しランデータ(視点
と長さの情報)に変換する。各ランについてその長さを
予め設定しておいた閾値と比較して短いランの長さと数
を記録する。ラスタ操作が終了した時点でランの長さの
平均を計算する。図8のフローチャートでは、水平線分
及び水平に近い線分を検出の対象としている。長さを閾
値と比較しているのは、水平及び水平に近い線分を上か
ら横切るかたちになっているランのみをカウントに対象
として考慮するためである。
【0023】斜め線分に対しては見かけの「太さ」が大
きくなるが、特に補正をしなくとも、透かしの無い状態
で統計的に一定であり透かしの特徴として使用すること
が可能である。ラスタ走査の主走査方向を水平に変えて
垂直及び垂直に近い線分の太さ、水平と垂直両方を組み
合わせたもの、または黒画素領域の輪郭追跡を行って正
確な意味での線分太さ(ただし、計算量が増加する)、
局所的な輪郭特徴(輪郭線を局所的に観測したとき縦/
横/斜めといった方向毎に集計したもの)なども、透か
しの特徴として使用できる。本実施例の場合は、特徴量
を変化させるための操作として図4に示すような太め処
理(特徴量の増加)と細め処理(特徴量の減少)を用い
ている。
【0024】図5に本実施例による透かし埋め込みの結
果を示す。この例では、各行を上下左右に2等分して4
つの小区画に分割し、左上と右下の小区画をグループ
1、右下と左上の小区画をグループ2と定義している。
太め処理と細め処理は文字を構成している水平線分に対
して1画素分ずつ行った。この処理は、特徴量の差また
は比において、透かしの埋め込みを安定的に検出・確認
できる限り画素を増減させることも可能である。ただ
し、特徴量の差・比がより大きくなるような処理をすれ
ば、透かしの検出・確認の確度(安定性)は高くなる
が、逆に透かしが利用者に視覚で認識される可能性が高
くなり、透かしの性質上あまり好ましくない結果とな
る。
【0025】透かしの検出処理(図2(b)参照)で
は、埋め込み処理と同様にテキスト行矩形の同定、小区
画への分割、グルーピングを行った後、各小区画から特
徴(黒画素の数を黒画素領域の周囲長の2乗で正規化し
た値)を抽出し各グループ毎に集計する。集計値の差
(図2(b)のF−Fの値)が正の閾値より大きい
場合( F1−F2>|T|)であれば1を出力し、負の閾値
よりも小さい場合(F1−F2<−|T|)であれば0を出
力し、これら以外の場合は埋め込みなしと判定する。ま
たは、集計値の比(F1/F2)が1より十分大きい場
合は1を出力し、小さい場合は0を出力させ、これら以
外の場合は埋め込み無しと判定しても良い。
【0026】表1に各行ごとに(F−F)×10
の値を計算した結果を示す。この値は透かし埋め込み後
の画像、及び透かし無しの画像を解像度300dpiの
プリンタで紙に出力し、400dpiのスキャナで取り
込んだ画像にスキュー補正を行った後で計算したもので
ある。この例では、印刷とスキャンを経ても1/0を埋
め込んだ画像は埋め込み無しの画像に対して正負に大き
く振れた値を示す。ただし、埋め込み無しも−613〜
91の範囲に広がっており、1行分のデータに1ビット
を埋め込み安定して検出するほどの確度は無い。しか
し、表1のように平均及び標準偏差を計算してみると複
数行で1ビットを表現すれば安定した(何も埋め込まれ
ていないのに透かし有りと判定されてしまう確率が十分
低い)検出が可能であることがわかる。
【0027】
【表1】
【0028】図10(a),(b)のように、画像中のテキス
ト領域を検出する手段(12,22)とその検出されたテキス
ト領域の特徴量を操作する手段13または特徴量を抽出す
る手段23を含む装置の形態としても、本発明は実現可能
である。同様に、図11(a),(b)のように、画像中のテ
キスト領域を検出する手段(32,42)と、その検出された
画像領域を小区画に分割する手段(33,43)、その小区画
をグループに分ける手段(34,44)、及びその検出された
テキスト領域の特徴量を操作する手段35または特徴量を
抽出する手段45を含む透かし情報埋め込み装置31または
透かし情報検出装置41の形態としても、本発明は実現可
能である
【0029】上述した本発明の利点を以下にまとめる。 (1) 小区画に分割された領域における特徴量を集積
(各グループでの集積、複数行にわたる特徴量の集積)
することによって、印刷やスキャン時に加わるランダム
な特徴の変化(ノイズ)に対して頑健であり、比較的印
字品質の低い文書、染みやかすれ(ノイズ)がある文書
などにおいても、安定して透かしを埋め込み・検出する
ことができる。 (2) 特徴量は透かしの無い状態で統計的に一定であ
れば良く、水平線分の平均太さ、垂直線分の平均太さ、
またはこれらの組み合わせ等様々な特徴を使用すること
が可能であり、汎用性が非常に高い。 (3) 画像自体から検出されたテキスト行(通常は外
接矩形)を基準にすることによって、位置ずれやスキュ
ーに対して頑健な透かしを実現できる。 (4) 小区画の分割やグルーピングの仕方、どの特徴
量を使用するかを発行者だけの秘密としておけば、たと
え偽造者が透かしのアルゴリズムを知っていたり、透か
し埋め込み機能付きのプリンタを持っていても、偽造者
が同じ透かしを文書に埋め込むことはできない。 (5) 小区分の分割やグルーピングをすることによっ
て、同一文書内に異なる字体が使用された場合における
特徴量への影響を相殺し、安定した透かしの埋め込みが
可能である。
【0030】図6はコンテンツ識別の応用例として本発
明を用いた文書情報の機密管理の枠組みを示している。
図中のプリンタには透かしの埋め込み機能がファックス
とコピアには透かしの検出機能が組み込まれている。プ
リンタで印刷される際に、文書にはファックスやコピー
の許可ビットが透かしとして埋め込まれる。この文書を
コピーまたはファックスしようとすると、スキャン時に
透かし情報がチェックされ、許可ビットがオンの場合に
は処理が続行され、許可ビットがオフの場合には処理の
中止や記録(使用者や目的等)をとる等の措置が取られ
る。このように本発明によって紙の文書がコピアやファ
ックス等により不正に複製されたり流出するのを防ぐこ
とが可能となる。一般にオリジナルの紙文書は比較的厳
重に管理されておりオリジナルを外部に持ち出しても、
その文書を次に利用(閲覧)する際に不正に持ち出され
た事が発覚する可能性が高いのに対して、複製された文
書を追跡し管理することは困難である。持ち出す側にと
っては「文書を盗んだ訳ではない」という意味で心理的
障壁も低い。実際、多くの不正情報流出事件でコピアや
ファックスが使われている。本発明の提供する枠組みは
複製が作られる時点でその行為の妥当性をチェックする
ことができ、紙文書の不正な流出を防止する上で大きな
効果を持つ。
【0031】図7に本発明を用いた文書の偽造防止の枠
組みを示す。正当な文書の発行者は透かしの埋め込み機
能付きのプリンタを用いて文書を印刷し流通させる。透
かし埋め込みの対象となる文書としては、他者の行動に
影響を与えるような経済情報、証明書、チケットの類が
考えられる。透かしの内容や埋め込み時の小区画への分
割やグルーピングの仕方、特徴量の設定は発行者のみが
保持しているものとする。文書の正当性を検証する必要
が生じた場合には、ファックスやインターネット経由等
で文書イメージを発行者に送り透かしが正しく検出でき
るか否かの判定を依頼すれば良い。仮に偽造者が透かし
の埋め込みアルゴリズムを知っていたり、透かし埋め込
み機能付きのプリンタを持っていても小区画の分割やグ
ルーピングの仕方、特徴量の設定を発行者固有の秘密と
すれば、偽造者が同じ透かしを埋め込んだり検出したり
することは不可能である。
【0032】
【発明の効果】本発明では秘密通信で要求されるような
多量の情報を文書画像に埋め込むことには適さないが、
紙に出力後にスキャンしても安定して透かし情報を検出
することが可能である。従って、紙として出力された後
のコンテンツ識別や偽造防止の手段として用いることが
できる。
【図面の簡単な説明】
【図1】 透かしを利用した文書画像アプリケーション
の構成を示す図である。
【図2】 文書画像への透かし情報埋め込み/検出処理
のフローチャートを示す図である。
【図3】 テキスト行矩形の小区画への分割とグルーピ
ングを示す図である。
【図4】 特徴量(線分の太さ)の操作の例を示す図で
ある。
【図5】 埋め込み後にスキャンした画像の例を示す図
である。
【図6】 透かしによる機密文書管理を示す図である。
【図7】 透かしによる偽造の防止を示す図である。
【図8】 特徴量(線分太さ情報)の検出処理のフロー
チャートを示す図である。
【図9】 特徴量(線分太さ情報)の検出処理におい
て、主走査方向を垂直方向とするラスタ走査を示す図で
ある。
【図10】 文書画像への透かし情報埋め込み・検出装
置を示すブロック図である。
【図11】 文書画像への透かし情報埋め込み・検出装
置を示すブロック図である。
【符号の説明】
1 文書作成/管理、2 出力用画像の作成、3、6
入力デバイス、4 透かしの埋め込み、5 出力デバイ
ス、7 透かしの検出、8 チェックロジック、 1
1、31 透かし情報埋め込み装置、21、41 透か
し情報検出装置、12、22、32、42 テキスト領
域検出手段、13、35 特徴量操作手段、33、43
テキスト領域分割手段、34、44 小区画グルーピ
ング手段、23、45特徴量抽出手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 天野 富夫 神奈川県大和市下鶴間1623番地14 日本ア イ・ビー・エム株式会社 東京基礎研究所 内 Fターム(参考) 5B057 AA11 CA02 CA06 CA12 CA16 CB02 CB06 CB12 CB16 CB19 CC03 CE08 CF01 CF02 CG07 CH18 DA08 DA17 DB02 DB05 DB08 DC01 5C076 AA02 AA14 AA21 AA22 AA36 AA40 BA06 BB45 CA10

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 テキスト情報を白黒2値文書画像として
    表現したデータ中に透かし情報を埋め込む処理におい
    て、画像中のテキスト領域を検出しその検出されたテキ
    スト領域の特徴量を操作することを特徴とする、透かし
    情報埋め込み方法。
  2. 【請求項2】 請求項1に記載する方法によって透かし
    情報を埋め込んだ文書画像から埋め込まれている情報を
    検出する処理において、画像中のテキスト領域を検出し
    その検出されたテキスト領域から特徴量を抽出すること
    を特徴とする、透かし情報検出方法。
  3. 【請求項3】 テキスト情報を白黒2値文書画像として
    表現したデータ中に透かし情報を埋め込む処理におい
    て、画像中のテキスト領域を検出し埋め込み対象となっ
    た画像中のテキスト領域を複数の小区画に分割し、小区
    画を複数のグループに分け、各々のグループに対して特
    徴量を1段階または多段階に増やす操作または減らす操
    作を施すことを特徴とする、透かし情報埋め込み方法。
  4. 【請求項4】 請求項3に記載する方法によって透かし
    情報を埋め込んだ文書画像から埋め込まれている情報を
    検出する処理において、画像中のテキスト領域を検出し
    その検出されたテキスト領域を複数の小区画に分割し、
    小区画を複数のグループに分け、各々のグループにおい
    て小区画から検出される特徴量を集積し、各グループの
    集積値の比較によって透かし情報の値を判定することを
    特徴とする、透かし情報検出方法。
  5. 【請求項5】 特徴量が黒画素数、黒白の遷移数、特定
    の局所パターンの出現頻度、線分の平均太さのいずれか
    1つまたはその組み合わせからなる、請求項1または3
    に記載の方法。
  6. 【請求項6】 透かし情報埋め込みまたは検出対象の画
    像領域がテキスト行の外接矩形である、請求項1または
    3に記載の方法。
  7. 【請求項7】 テキスト情報を画像として表現したデー
    タ中に透かし情報を埋め込む処理において、埋め込み対
    象となった画像中のテキスト領域を上下2分割し、左右
    は複数の小区画に分割し、小区画は上下で異なるグルー
    プに分け、各々のグループに対して特徴量を1段階また
    は多段階に増やす操作または減らす操作を施すことを特
    徴とする、請求項1または3に記載の方法。
  8. 【請求項8】 テキスト情報を画像として表現したデー
    タ中に透かし情報を埋め込む処理において、画像中のテ
    キスト領域を検出し、その検出されたテキスト領域の特
    徴量を操作し、複数行に対して透かし情報を1ビット以
    上埋め込むことことを特徴とする、請求項1または3に
    記載の方法。
  9. 【請求項9】 請求項8に記載する方法によって透かし
    情報を埋め込んだ文書画像から埋め込まれている情報を
    検出する処理において、複数行から1ビット以上埋め込
    まれた透かし情報を検出することを特徴とする、透かし
    情報検出方法。
  10. 【請求項10】 テキスト情報を白黒2値文書画像とし
    て表現したデータ中に透かし情報を埋め込む装置であっ
    て、画像中のテキスト領域を検出する手段とその検出さ
    れたテキスト領域の特徴量を操作する手段を含むこと特
    徴とする、透かし情報埋め込み装置。
  11. 【請求項11】 文書画像に埋め込まれている透かし情
    報を検出する装置であって、画像中のテキスト領域を検
    出する手段とその検出されたテキスト領域から特徴量を
    抽出する手段を含むことを特徴とする、透かし情報検出
    装置。
  12. 【請求項12】 テキスト情報を白黒2値文書画像とし
    て表現したデータ中に透かし情報を埋め込む装置であっ
    て、画像中のテキスト領域を検出する手段、埋め込み対
    象となった画像中のテキスト領域を複数の小区画に分割
    する手段、小区画を複数のグループに分ける手段、及び
    各々のグループに対して特徴量を1段階または多段階に
    増やす操作または減らす操作を施す手段を含むことを特
    徴とする、透かし情報埋め込み装置。
  13. 【請求項13】 文書画像に埋め込まれている透かし情
    報を検出する装置であって、画像中のテキスト領域を検
    出する手段、その検出されたテキスト領域を複数の小区
    画に分割する手段、小区画を複数のグループに分ける手
    段、各々のグループにおいて小区画から検出される特徴
    量を集積する手段、及び各グループの集積値の比較によ
    って透かし情報の値を判定する手段を含むことを特徴と
    する、透かし情報検出装置。
JP22349099A 1999-08-06 1999-08-06 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置 Expired - Fee Related JP3373811B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP22349099A JP3373811B2 (ja) 1999-08-06 1999-08-06 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置
US09/621,567 US6983056B1 (en) 1999-08-06 2000-07-21 Method and device for embedding and detecting watermarking information into a black and white binary document image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22349099A JP3373811B2 (ja) 1999-08-06 1999-08-06 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置

Publications (2)

Publication Number Publication Date
JP2001078006A true JP2001078006A (ja) 2001-03-23
JP3373811B2 JP3373811B2 (ja) 2003-02-04

Family

ID=16798964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22349099A Expired - Fee Related JP3373811B2 (ja) 1999-08-06 1999-08-06 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置

Country Status (2)

Country Link
US (1) US6983056B1 (ja)
JP (1) JP3373811B2 (ja)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100403204B1 (ko) * 2001-07-11 2003-10-23 주식회사 마크애니 이진화 문서에 대한 워터마크 삽입 및 검출 방법과 그 장치
KR100469999B1 (ko) * 2002-03-19 2005-02-05 주식회사 실트로닉 영상의 해쉬 값을 이용한 이진 정지 영상 인증용 워터마킹방법 및 장치
US7039215B2 (en) 2001-07-18 2006-05-02 Oki Electric Industry Co., Ltd. Watermark information embedment device and watermark information detection device
US7085399B2 (en) 2002-06-18 2006-08-01 Oki Electric Industry Co., Ltd. Watermark information embedding device and watermark information detection device
US7202960B2 (en) 2001-05-21 2007-04-10 Oki Electric Industry Co., Ltd. Print sheet original authentication system, printer device and checking device
US7245740B2 (en) 2003-07-01 2007-07-17 Oki Electric Industry Co., Ltd. Electronic watermark embedding device, electronic watermark detection device, electronic watermark embedding method, and electronic watermark detection method
EP1835718A1 (de) * 2006-03-13 2007-09-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Robustes digitales Wasserzeichen für Vektorschriften
JP2007304889A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像処理装置及びその制御方法
US7440583B2 (en) 2003-04-25 2008-10-21 Oki Electric Industry Co., Ltd. Watermark information detection method
JP2009076957A (ja) * 2007-09-18 2009-04-09 Panasonic Electric Works Co Ltd 撮像装置
JP2009200800A (ja) * 2008-02-21 2009-09-03 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US7627136B2 (en) 2004-05-31 2009-12-01 Ricoh Company Ltd. Information embedding device, information detecting device, information embedding and detecting system, information embedding method, information detecting method, information embedding program, information detecting program, information embedding and detecting program, and recording medium
JP2010507109A (ja) * 2006-10-18 2010-03-04 デスティニー ソフトウェア プロダクションズ インコーポレイテッド メディアデータに電子透かしを付与する方法
US7894092B2 (en) 2005-10-25 2011-02-22 Fujitsu Limited Computer-readable recording medium storing print image generating program and print image generating method
US8077910B2 (en) 2005-10-25 2011-12-13 Fujitsu Limited Digital watermark embedding and detection
US8160294B2 (en) 2006-09-28 2012-04-17 Fujitsu Limited Electronic watermark embedment apparatus and electronic watermark detection apparatus
US8588460B2 (en) 2007-08-31 2013-11-19 Fujitsu Limited Electronic watermark embedding device, electronic watermark detecting device, and programs therefor
JP2014500688A (ja) * 2010-12-23 2014-01-09 北大方正集▲団▼有限公司 西洋語の透かし処理をするための透かし画像の分割方法と装置
CN111005260A (zh) * 2019-11-25 2020-04-14 广东侨盛防伪材料有限公司 一种黑水印纸及其制作方法
CN111767787A (zh) * 2020-05-12 2020-10-13 北京奇艺世纪科技有限公司 身份证图像的正反面判断方法、装置、设备及存储介质

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030042399A1 (en) * 2001-06-19 2003-03-06 Umax Data Systems Inc. Calibration method of an image-capture apparatus
JP2003259112A (ja) * 2001-12-25 2003-09-12 Canon Inc 透かし情報抽出装置及びその制御方法
JP2004104494A (ja) * 2002-09-10 2004-04-02 Canon Inc 電子透かし埋め込み装置及びその制御方法
GB2404296A (en) * 2003-07-23 2005-01-26 Sony Uk Ltd Data content identification using watermarks as distinct codes
US7856116B2 (en) 2004-11-09 2010-12-21 Digimarc Corporation Authenticating identification and security documents
JP4170318B2 (ja) * 2005-07-12 2008-10-22 シャープ株式会社 画像形成装置、制御方法、制御プログラム、および、コンピュータ読取り可能な記録媒体
JP2007060467A (ja) * 2005-08-26 2007-03-08 Fuji Xerox Co Ltd インターネットファクシミリ中継装置、プログラム、方法、ファクシミリ受信装置
JP4449921B2 (ja) * 2006-02-23 2010-04-14 村田機械株式会社 ファクシミリ装置およびクライアント端末
JP4123282B2 (ja) * 2006-03-14 2008-07-23 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置、画像形成装置の制御方法、および画像形成装置の制御プログラム
JP4082432B2 (ja) * 2006-03-15 2008-04-30 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置、画像形成装置の制御方法、および画像形成装置の制御プログラム
EP1840777A1 (de) * 2006-03-27 2007-10-03 Mediasec Technologies GmbH Verfahren zur Einbringung einer digitalen Markierung in ein digitales Dokument
US8064636B2 (en) * 2007-05-31 2011-11-22 Canon Kabushiki Kaisha Image processing apparatus and method of controlling the same
US8059859B2 (en) * 2007-05-31 2011-11-15 Canon Kabushiki Kaisha Image processing apparatus and method of controlling the same
US20080307233A1 (en) * 2007-06-09 2008-12-11 Bank Of America Corporation Encoded Data Security Mechanism
CN101122995B (zh) * 2007-09-11 2010-10-13 北京大学 二值图像中数字水印的嵌入、提取方法和装置
US8411313B2 (en) 2007-09-14 2013-04-02 Ricoh Company, Limited Image forming apparatus and image reading method for reading an untargeted page of an original
US7974437B2 (en) * 2007-11-19 2011-07-05 Seiko Epson Corporation Identifying steganographic data in an image
US8081823B2 (en) * 2007-11-20 2011-12-20 Seiko Epson Corporation Segmenting a string using similarity values
US8031905B2 (en) * 2007-11-21 2011-10-04 Seiko Epson Corporation Extracting data from images
US8243981B2 (en) * 2007-11-26 2012-08-14 Seiko Epson Corporation Identifying embedded data in an image
US8009862B2 (en) * 2007-11-27 2011-08-30 Seiko Epson Corporation Embedding data in images
JP4587058B2 (ja) * 2008-09-10 2010-11-24 富士ゼロックス株式会社 画像処理装置、画像処理システム及びプログラム
US8289574B2 (en) * 2009-09-02 2012-10-16 Xerox Corporation Method and system for controlling darkening of image data
US8885947B2 (en) 2010-09-06 2014-11-11 Anteleon Imaging Sarl Method for marking graphical elements and method for detecting said marking in a graphical element
CN103138926B (zh) * 2011-11-30 2016-01-13 中国电信股份有限公司 水印签名方法与装置
CN111445376B (zh) * 2020-03-24 2023-08-18 五八有限公司 视频水印的检测方法、装置、电子设备和存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0629972A3 (en) 1993-04-23 1995-05-24 Hewlett Packard Co Method and device for embedding identification codes in printed documents.
JPH0784485A (ja) 1993-05-31 1995-03-31 Canon Inc 画像形成システム
US6086706A (en) * 1993-12-20 2000-07-11 Lucent Technologies Inc. Document copying deterrent method
US5530759A (en) 1995-02-01 1996-06-25 International Business Machines Corporation Color correct digital watermarking of images
US5761686A (en) * 1996-06-27 1998-06-02 Xerox Corporation Embedding encoded information in an iconic version of a text image
US5825892A (en) 1996-10-28 1998-10-20 International Business Machines Corporation Protecting images with an image watermark
JP3008908B2 (ja) * 1997-11-10 2000-02-14 日本電気株式会社 文字切り出し装置および文字切り出し方式
GB9809679D0 (en) * 1998-05-06 1998-07-01 Xerox Corp Portable text capturing method and device therefor
JP3592545B2 (ja) * 1998-08-07 2004-11-24 株式会社リコー 画像処理装置および画像処理方法および情報記録媒体
US6456393B1 (en) * 1998-08-18 2002-09-24 Seiko Epson Corporation Information embedding in document copies
JP2000099501A (ja) * 1998-09-17 2000-04-07 Internatl Business Mach Corp <Ibm> 文書データへの情報の埋め込み方法およびシステム
US6753977B2 (en) * 2001-01-31 2004-06-22 Hewlett-Packard Development Company, L.P. Machine-readable information embedded on a document

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7202960B2 (en) 2001-05-21 2007-04-10 Oki Electric Industry Co., Ltd. Print sheet original authentication system, printer device and checking device
KR100403204B1 (ko) * 2001-07-11 2003-10-23 주식회사 마크애니 이진화 문서에 대한 워터마크 삽입 및 검출 방법과 그 장치
US7039215B2 (en) 2001-07-18 2006-05-02 Oki Electric Industry Co., Ltd. Watermark information embedment device and watermark information detection device
KR100469999B1 (ko) * 2002-03-19 2005-02-05 주식회사 실트로닉 영상의 해쉬 값을 이용한 이진 정지 영상 인증용 워터마킹방법 및 장치
US7085399B2 (en) 2002-06-18 2006-08-01 Oki Electric Industry Co., Ltd. Watermark information embedding device and watermark information detection device
US7440583B2 (en) 2003-04-25 2008-10-21 Oki Electric Industry Co., Ltd. Watermark information detection method
US7245740B2 (en) 2003-07-01 2007-07-17 Oki Electric Industry Co., Ltd. Electronic watermark embedding device, electronic watermark detection device, electronic watermark embedding method, and electronic watermark detection method
US7627136B2 (en) 2004-05-31 2009-12-01 Ricoh Company Ltd. Information embedding device, information detecting device, information embedding and detecting system, information embedding method, information detecting method, information embedding program, information detecting program, information embedding and detecting program, and recording medium
US7894092B2 (en) 2005-10-25 2011-02-22 Fujitsu Limited Computer-readable recording medium storing print image generating program and print image generating method
US8077910B2 (en) 2005-10-25 2011-12-13 Fujitsu Limited Digital watermark embedding and detection
EP1835718A1 (de) * 2006-03-13 2007-09-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Robustes digitales Wasserzeichen für Vektorschriften
JP2007304889A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 画像処理装置及びその制御方法
US8160294B2 (en) 2006-09-28 2012-04-17 Fujitsu Limited Electronic watermark embedment apparatus and electronic watermark detection apparatus
JP2010507109A (ja) * 2006-10-18 2010-03-04 デスティニー ソフトウェア プロダクションズ インコーポレイテッド メディアデータに電子透かしを付与する方法
US8588460B2 (en) 2007-08-31 2013-11-19 Fujitsu Limited Electronic watermark embedding device, electronic watermark detecting device, and programs therefor
JP2009076957A (ja) * 2007-09-18 2009-04-09 Panasonic Electric Works Co Ltd 撮像装置
JP2009200800A (ja) * 2008-02-21 2009-09-03 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP2014500688A (ja) * 2010-12-23 2014-01-09 北大方正集▲団▼有限公司 西洋語の透かし処理をするための透かし画像の分割方法と装置
CN111005260A (zh) * 2019-11-25 2020-04-14 广东侨盛防伪材料有限公司 一种黑水印纸及其制作方法
CN111767787A (zh) * 2020-05-12 2020-10-13 北京奇艺世纪科技有限公司 身份证图像的正反面判断方法、装置、设备及存储介质

Also Published As

Publication number Publication date
US6983056B1 (en) 2006-01-03
JP3373811B2 (ja) 2003-02-04

Similar Documents

Publication Publication Date Title
JP3373811B2 (ja) 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置
US6970259B1 (en) Systems and methods for forgery detection and deterrence of printed documents
JP4688375B2 (ja) 文書偽造を防止する印刷方法
US8335342B2 (en) Protecting printed items intended for public exchange with information embedded in blank document borders
JP4554358B2 (ja) 印刷文書のための可視認証パターン
US7580159B2 (en) Method, program, and apparatus for preventing a reproduction of an anti-copy document, and a medium storing the program
US8243982B2 (en) Embedding information in document border space
US20080028221A1 (en) Additional Information Processing Apparatus, Additional Information Processing System, and Additional Information Processing Method
US20070003341A1 (en) Image processing device, image processing method, program, and recording medium
US20070241554A1 (en) Survivable security features for image replacement documents
WO2005109311A2 (en) System and method for decoding digital encoded images
US8373895B2 (en) Prevention of unauthorized copying or scanning
JP2001218033A (ja) 画像処理装置、画像処理方法及び記憶媒体
JP2011034535A (ja) 本人確認書類真贋判定装置
US20100021002A1 (en) Printed matter, image processing apparatus, printed matter authenticity determination apparatus, image processing method, printed matter authenticity determination method, and program
US20110170133A1 (en) Image forming apparatus, method of forming image and method of authenticating document
JP2001126046A (ja) Icカード、icカード認証システム、及びその認証方法
US8218178B2 (en) Image processing apparatus, image processing method, recording medium storing image processing program, and computer data signal embedded in carrier wave
CN101344748B (zh) 具有复印防止功能的复印装置及其复印防止方法
US8038073B2 (en) Tamper detection of documents using encoded dots
US11979537B1 (en) Incorporation of source-identifying information in scanned documents
Chen et al. Data hiding in document images
US20040123100A1 (en) Certificate issuing method and certificate verifying method
JP2005286963A (ja) 印刷用媒体への情報埋め込み装置,情報読み取り装置および情報を埋め込んだ媒体
JP2003060890A (ja) 通信ネットワークを利用した個人認証システム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071122

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081122

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081122

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091122

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091122

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121122

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees