JP4510092B2 - 電子透かしの埋め込み及び検出 - Google Patents

電子透かしの埋め込み及び検出 Download PDF

Info

Publication number
JP4510092B2
JP4510092B2 JP2007542534A JP2007542534A JP4510092B2 JP 4510092 B2 JP4510092 B2 JP 4510092B2 JP 2007542534 A JP2007542534 A JP 2007542534A JP 2007542534 A JP2007542534 A JP 2007542534A JP 4510092 B2 JP4510092 B2 JP 4510092B2
Authority
JP
Japan
Prior art keywords
digital watermark
character
embedding
feature
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007542534A
Other languages
English (en)
Other versions
JPWO2007049340A1 (ja
Inventor
健介 倉木
泰三 阿南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2007049340A1 publication Critical patent/JPWO2007049340A1/ja
Application granted granted Critical
Publication of JP4510092B2 publication Critical patent/JP4510092B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0051Embedding of the watermark in the spatial domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0062Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0083Image watermarking whereby only watermarked image required at decoder, e.g. source-based, blind, oblivious

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、人間の目にはわかりにくい形で文書データに対して電子透かし情報を埋め込む技術および埋め込んだ電子透かし情報を検出する技術であり、重要な情報が印刷された紙媒体からの情報漏洩を抑止するための技術に関する。
近年、企業等の組織内で保管する情報の電子化が進み、将来的にも紙による保管は減っていくことが予想される。しかしながら、紙文書が無くなるわけではないため、必然的に発生し続ける紙と電子データの混在環境になっているのが現状である。また、企業や公共機関が取り扱う顧客データなどの個人情報の流出・漏洩が懸念されており、より厳格な管理システムの導入が求められている。
このような状況に対応するためのセキュリティ技術の1つとして電子透かしが挙げられる。電子透かしとは画像、文書、音声などのデータに著作権者名や複製履歴などの情報を埋め込む技術である。組織内で取り扱う重要なデータや組織外へ提供する製品に対して、このような電子透かし情報を埋め込むことで、情報漏洩防止、複製防止、あるいは原本保証などを可能にする。
例えば、二値画像に対する人間の視覚特性に基づいて改変の判断基準およびその優先順位を与え、優先順位が高い画素から順に改変を施すことで透かし情報を挿入する技術が開示されている(例えば、特許文献1参照。)。
また、文書画像からテキスト領域を検出し、検出されたテキスト領域の特徴量を増減させるか、または検出されたテキスト領域を複数の小区画に分割し小区画を2つ以上のグループに分けて各々のグループに対してその特徴量を増減させることによって透かし情報を埋め込み、透かしの検出時には、各々のグループから得られる特徴量の集積値を比較することによって透かし情報を検出する技術が開示されている(例えば、特許文献2参照。)。
このように、電子化されたデータに対する電子透かしは研究が盛んであり、各種製品化されているが、文書データ、特に一度プリントアウトされた紙媒体から埋め込んだ情報を抽出するのは困難である。これは、プリントおよびスキャンする際に起こり得る位置のずれ、ノイズ付加、解像度変換などによる高周波成分の損失などにより、埋め込んだ情報を失いやすいのが原因である。
特開2004−289783号公報 特開2001−78006号公報
従来の方法では人間の視覚特性を利用した技術により、画質の向上と電子透かし情報の埋め込みを同時に実現しているが、図形や文字の輪郭や切れ目に重点的に電子透かし情報を埋め込んでいるため、プリントアウトやコピーが何度か繰り返された場合には輪郭部分がかすれたりぼけたりするので、埋め込んだ電子透かし情報を失う可能性が高いという問題点があった。
また、文字が元々持っている構造的な特徴を考慮していないため、電子透かしが埋め込まれる文字のデザインなどによって検出の精度が変わってしまうという問題点があった。例えば、同じ電子透かし情報を埋め込む場合、文字を構成する線の太さが一様なゴシック体よりも部分によって線の太さが異なる明朝体の方が、誤検出率が高くなるという問題点があった。
本発明は、上記事情に鑑みてなされたもので、視覚的に判別しにくい文書への電子透かし情報の埋め込みを可能にするとともに、埋め込んだ電子透かし情報がプリントアウト、コピー、あるいはスキャンされた後でも安定して検出することが可能な電子透かし処理プログラム、電子透かし処理装置および電子透かし処理方法を提供することを目的とする。
本発明は、上記課題を解決するため、下記のような構成を採用した。
すなわち、本発明の一態様によれば、本発明の電子透かし埋め込みプログラムは、テキストデータに電子透かし情報を埋め込んで電子透かし埋め込み画像を生成する電子透かし埋め込み装置に実行させるためのコンピュータ実行可能な電子透かし埋め込みプログラムであって、埋め込み対象データとしての文字の特徴を検出する手順と、前記検出された特徴に基づいて、前記文字に電子透かし情報を埋め込む手順とを実行させるための電子透かし埋め込みプログラムである。
また、本発明の電子透かし埋め込みプログラムは、前記特徴を検出する手順が、前記文字を構成する線の方向及び太さを前記文字の特徴として検出することが望ましい。
また、本発明の電子透かし埋め込みプログラムは、前記特徴を検出する手順が、前記線の所定方向における太さの平均値あるいは最頻出値を前記文字の特徴として検出し、前記情報を埋め込む手順が、前記特徴を検出する手順によって検出された前記線の太さを異ならせることにより前記電子透かし情報を埋め込むことが望ましい。
また、本発明の電子透かし埋め込みプログラムは、前記情報を埋め込む手順が、前記線の太さを多段階に調節することが望ましい。
また、本発明の電子透かし埋め込みプログラムは、前記特徴を検出する手順が、外郭方向寄与度を用いることにより前記線の方向を検出することが望ましい。
また、本発明の電子透かし埋め込みプログラムは、前記情報を埋め込む手順が、前記特徴を検出する手順によって検出された特徴に基づいて、前記文字に前記電子透かし情報を埋めるべきかどうかを判断し、前記判断結果によって前記電子透かし情報を埋め込まないもしくは埋め込み強度を適応的に調整することが望ましい。
また、本発明の電子透かし埋め込みプログラムは、前記埋め込み対象データとしての文字を複数の領域に分割して埋め込み対象データとする領域分割手順を更に備え、前記特徴を検出する手順が、前記領域を分割する手順によって埋め込み対象データとされた領域中に存在する文字部分の特徴を検出することが望ましい。
また、本発明の電子透かし埋め込みプログラムは、前記情報を埋め込む手順が、前記領域を分割する手順によって分割された各領域に対して、前記埋め込む電子透かし情報の埋め込み強度を適応的に調整することが望ましい。
また、本発明の電子透かし埋め込みプログラムは、前記電子透かし情報の埋め込み対象である埋め込み対象データを入力する手順と、前記データを入力する手順によって入力された埋め込み対象データから文字により構成されるテキスト領域を検出する手順と、前記テキスト領域を検出する手順によって検出されたテキスト領域から前記文字を切り出す手順とを更に備え、前記特徴を検出する手順が、前記文字を切り出す手順によって切り出された文字を前記埋め込み対象データとし、前記文字の特徴を検出することが望ましい。
また、本発明の一態様によれば、本発明の電子透かし抽出プログラムは、電子透かし情報が埋め込まれた電子透かし埋め込み画像から前記電子透かし情報を検出する電子透かし検出装置に実行させるためのコンピュータ実行可能な電子透かし抽出プログラムであって、前記電子透かし埋め込み画像を入力する手順と、前記画像を入力する手順によって入力された電子透かし埋め込み画像から文字により構成されるテキスト領域を検出する手順と、前記テキスト領域を検出する手順によって検出されたテキスト領域から前記文字を切り出す手順と、前記文字を切り出す手順によって切り出された文字の特徴を解析する手順と、前記特徴を解析する手順によって解析された特徴に基づいて、前記文字に埋め込まれた電子透かし情報を抽出する手順とを実行させるための電子透かし抽出プログラムである。
また、本発明の電子透かし抽出プログラムは、前記構造を解析する手順が、前記文字を構成する線の方向及び太さを前記文字の特徴として解析することが望ましい。
また、本発明の一態様によれば、本発明の電子透かし埋め込み装置は、テキストデータに電子透かし情報を埋め込んで電子透かし埋め込み画像を生成する電子透かし埋め込み装置であって、埋め込み対象データとしての文字の特徴を検出する特徴検出手段と、前記特徴検出手段によって検出された特徴に基づいて、前記文字に電子透かし情報を埋め込む情報埋め込み手段とを備えることを特徴とする。
また、本発明の電子透かし埋め込み装置は、前記特徴検出手段が、前記文字を構成する線の方向及び太さを前記文字の特徴として検出することが望ましい。
また、本発明の電子透かし埋め込み装置は、前記特徴検出手段が、前記線の所定方向における太さの平均値あるいは最頻出値を前記文字の特徴として検出し、前記情報埋め込み手段が、前記特徴検出手段によって検出された前記線の太さを異ならせることにより前記電子透かし情報を埋め込むことが望ましい。
また、本発明の電子透かし埋め込み装置は、前記情報埋め込み手段が、前記線の太さを多段階に調節することが望ましい。
また、本発明の電子透かし埋め込み装置は、前記特徴検出手段が、外郭方向寄与度を用いることにより前記線の方向を検出することが望ましい。
また、本発明の電子透かし埋め込み装置は、前記情報埋め込み手段が、前記特徴検出手段によって検出された特徴に基づいて、前記文字に前記電子透かし情報を埋めるべきかどうかを判断し、前記判断結果によって前記電子透かし情報を埋め込まないもしくは埋め込み強度を適応的に調整することが望ましい。
また、本発明の電子透かし埋め込み装置は、前記埋め込み対象データとしての文字を複数の領域に分割して埋め込み対象データとする領域分割手段を更に備え、前記特徴検出手段が、前記領域分割手段によって埋め込み対象データとされた領域中に存在する文字部分の特徴を検出することが望ましい。
また、本発明の電子透かし埋め込み装置は、前記情報埋め込み手段が、前記領域分割手段によって分割された各領域に対して、前記埋め込む電子透かし情報の埋め込み強度を適応的に調整することが望ましい。
また、本発明の電子透かし埋め込み装置は、前記電子透かし情報の埋め込み対象である埋め込み対象データを入力するデータ入力手段と、前記データ入力手段によって入力された埋め込み対象データから文字により構成されるテキスト領域を検出するテキスト領域検出手段と、前記テキスト領域検出手段によって検出されたテキスト領域から前記文字を切り出す文字切り出し手段とを更に備え、前記特徴検出手段が、前記文字切り出し手段によって切り出された文字を前記埋め込み対象データとし、前記文字の特徴を検出することが望ましい。
また、本発明の一態様によれば、本発明の電子透かし検出装置は、電子透かし情報が埋め込まれた電子透かし埋め込み画像から前記電子透かし情報を検出する電子透かし検出装置であって、前記電子透かし埋め込み画像を入力する画像入力手段と、前記画像入力手段によって入力された電子透かし埋め込み画像から文字により構成されるテキスト領域を検出するテキスト領域検出手段と、前記テキスト領域検出手段によって検出されたテキスト領域から前記文字を切り出す文字切り出し手段と、前記文字切り出し手段によって切り出された文字の特徴を解析する構造解析手段と、前記特徴解析手段によって解析された特徴に基づいて、前記文字に埋め込まれた電子透かし情報を抽出する情報抽出手段とを備えることを特徴とする。
また、本発明の電子透かし検出装置は、前記構造解析手段が、前記文字を構成する線の方向及び太さを前記文字の特徴として解析することが望ましい。
また、本発明の一態様によれば、本発明の電子透かし埋め込み方法は、テキストデータに電子透かし情報を埋め込んで電子透かし埋め込み画像を生成する電子透かし埋め込み装置において実行される電子透かし埋め込み方法であって、埋め込み対象データとしての文字の特徴を検出し、
前記検出された特徴に基づいて、前記文字に電子透かし情報を埋め込むことを特徴とする。
また、本発明の電子透かし埋め込み方法は、前記特徴の検出が、前記文字を構成する線の方向及び太さを前記文字の特徴として検出することが望ましい。
また、本発明の一態様によれば、本発明の電子透かし抽出方法は、電子透かし情報が埋め込まれた電子透かし埋め込み画像から前記電子透かし情報を検出する電子透かし検出装置において実行される電子透かし抽出方法であって、前記電子透かし埋め込み画像を入力し、前記入力された電子透かし埋め込み画像から文字により構成されるテキスト領域を検出し、前記検出されたテキスト領域から前記文字を切り出し、前記切り出された文字の特徴を解析し、前記解析された特徴に基づいて、前記文字に埋め込まれた電子透かし情報を抽出することを特徴とする。
また、本発明の電子透かし抽出方法は、前記構造の解析が、前記文字を構成する線の方向及び太さを前記文字の特徴として解析することが望ましい。
本発明を適用した電子透かし処理装置の機能ブロック図である。 本発明を適用した電子透かし埋め込み処理の流れを示すフローチャートである。 触手方向を説明するための図である。 ゴシック体の文字の例を示す図である。 ゴシック体の文字の水平方向のヒストグラムの例を示す図である。 ゴシック体の文字の垂直方向のヒストグラムの例を示す図である。 ゴシック体の文字の右斜め方向のヒストグラムの例を示す図である。 ゴシック体の文字の左斜め方向のヒストグラムの例を示す図である。 明朝体の文字の例を示す図である。 明朝体の文字の水平方向のヒストグラムの例を示す図である。 明朝体の文字の垂直方向のヒストグラムの例を示す図である。 明朝体の文字の右斜め方向のヒストグラムの例を示す図である。 明朝体の文字の左斜め方向のヒストグラムの例を示す図である。 本発明を適用した電子透かし抽出処理の流れを示すフローチャートである。
以下、図面に基づいて本発明を適用した実施の形態を説明する。
まず、本発明の概略を説明する。
本発明は、テキストデータに電子透かし情報を埋め込んで電子透かし埋め込み済み画像を生成する電子透かし埋め込み装置、上記電子透かし埋め込み装置に実行させるためのコンピュータ実行可能な電子透かし埋め込みプログラム、あるいは上記電子透かし埋め込み装置において実行される電子透かし埋め込み方法である。
電子透かし情報の埋め込みは、最初に文書情報を含むデータから構造解析により文字領域を抽出する。抽出した文字領域から文字を一文字もしくは複数文字同時に切り出す。切り出した文字の特徴量を抽出および解析する。この解析結果に基づいて電子透かし情報を埋め込むどうか判定し、埋め込む場合には文字の特徴を操作する。例えば、特徴量の比を利用して電子透かし情報を埋め込むことで解像度変換などに対して強固な埋め込みを行う。
他方、電子透かし情報の抽出は、最初に文書情報を含むデータから構造解析により文字領域を抽出する。抽出した文字領域から文字を一文字もしくは複数文字同時に切り出す。切り出した文字の特徴量を抽出および解析する。この解析結果に基づいて電子透かし情報が埋め込まれているかどうか、埋め込まれているならば埋め込まれている電子透かし情報を抽出する。
上述のようにして電子透かし情報の埋め込み及び抽出を行うことにより、文字の構造的特徴を解析するので、情報の埋め込み精度は文字のデザインなどに依存せずに安定している。また、文字の構造的特徴を操作するので、輪郭の形状など局所的な特徴量を操作する技術と比べると電子透かし情報が失われにくい。
図1は、本発明を適用した電子透かし処理装置の機能ブロック図である。
図1において、符号1は電子透かし処理装置を示し、符号11は入力部を示し、符号12はテキスト領域抽出部を示し、符号13は文字切り出し部を示し、符号14は特徴検出部を示し、符号15は情報埋め込み部を示し、符号16は構造解析部を示し、符号17は情報抽出部を示し、符号18は領域分割部を示す。
電子透かし処理装置1は、テキストデータに電子透かし情報を埋め込んで電子透かし埋め込み画像を生成し、あるいは、電子透かし情報が埋め込まれた電子透かし埋め込み画像から前記電子透かし情報を検出する装置であって、入力部11、テキスト領域抽出部12、文字切り出し部13、特徴検出部14、情報埋め込み部15、構造解析部16、情報抽出部17、および領域分割部18を備えている。
そして、電子透かし処理装置1は、入力部11、テキスト領域抽出部12、文字切り出し部13、特徴検出部14、情報埋め込み部15、および領域分割部18により構成されることにより、テキストデータに電子透かし情報を埋め込んで電子透かし埋め込み画像を生成する電子透かし埋め込み装置として機能し、入力部11、テキスト領域抽出部12、文字切り出し部13、構造解析部16、情報抽出部17、および領域分割部18により構成されることにより、電子透かし情報が埋め込まれた電子透かし埋め込み画像から前記電子透かし情報を検出する電子透かし抽出装置として機能する。
電子透かし処理装置1が、電子透かし埋め込み装置として機能する場合、入力部11は、前記電子透かし情報の埋め込み対象である埋め込み対象データを入力する。テキスト領域検出部12は、前記入力部11によって入力された埋め込み対象データから文字により構成されるテキスト領域を検出する。文字切り出し部13は、前記テキスト領域検出部12によって検出されたテキスト領域から前記文字を切り出す。
特徴検出部14は、埋め込み対象データとしての文字、例えば前記文字切り出し部13によって切り出された文字を前記埋め込み対象データとし、前記文字の特徴を検出する。そして、情報埋め込み部15は、前記特徴検出部14によって検出された特徴、例えば前記文字を構成する線の方向及び太さに基づいて、前記文字に電子透かし情報を埋め込む。
具体的な電子透かし情報の埋め込みとしては、例えば、前記特徴検出部14が、前記線の所定方向における太さの平均値あるいは最頻出値を前記文字の特徴として検出し、前記情報埋め込み部15が、前記特徴検出部14によって検出された前記線の太さを異ならせることにより実現する。
前記特徴検出部14による特徴の検出においては、外郭方向寄与度を用いることにより前記線の方向を検出する。
また、前記情報埋め込み部15は、前記線の太さを多段階に調節することが可能であり、前記特徴検出部14によって検出された特徴に基づいて、前記文字に前記電子透かし情報を埋めるべきかどうかを判断し、前記判断結果によって前記電子透かし情報を埋め込まないもしくは埋め込み強度を適応的に調整することも可能である。
領域分割部18は、前記埋め込み対象データとしての文字を複数の領域に分割して埋め込み対象データとする。この場合、前記特徴検出部14は、前記領域分割部18によって埋め込み対象データとされた領域中に存在する文字部分の特徴を検出する。そして、前記情報埋め込み部15は、前記領域分割部18によって分割された各領域に対して、前記埋め込む電子透かし情報の埋め込み強度を適応的に調整する。
他方、電子透かし処理装置1が、電子透かし抽出装置として機能する場合、入力部11は、前記電子透かし埋め込み画像を入力する。テキスト領域検出部12は、前記入力部11によって入力された電子透かし埋め込み画像から文字により構成されるテキスト領域を検出する。文字切り出し部13は、前記テキスト領域検出部12によって検出されたテキスト領域から前記文字を切り出す。
構造解析部16は、前記文字切り出し部13によって切り出された文字の特徴を解析する。情報抽出部17は、前記特徴解析部16によって解析された特徴、例えば前記文字を構成する線の方向及び太さに基づいて、前記文字に埋め込まれた電子透かし情報を抽出する。
次に、上述のように構成された電子透かし処理装置1による電子透かし情報の埋め込みおよび抽出の方法について説明する。
まず、電子透かし処理装置1による電子透かし情報の埋め込みの方法について説明する。
図2は、本発明を適用した電子透かし埋め込み処理の流れを示すフローチャートである。
図2において、ステップS21は「データ入力」を示し、ステップS22は「文字のみか?」を示し、ステップS23は「テキスト領域抽出」を示し、ステップS24は「文字切り出し」を示し、ステップS25は「領域分割するか?」を示し、ステップS26は「領域分割」を示し、ステップS27は「特徴抽出」を示し、ステップS28は「埋め込むか?」を示し、ステップS29は「情報埋め込み」を示す。
まず、ステップS21において、入力部11が、電子透かし情報の埋め込み対象である埋め込み対象データとして、文章情報を含む入力データ、例えばPDF(Portable Document Format)、ワードプロセッサにより作成された文書等の、画像や文字が混在したドキュメントデータ、あるいはスキャナなどで読み込んだBMP(Bit MaP)データやJPEG(Joint Photographic Experts Group)データなどのイメージデータを読み込む。並行して埋め込みたい透かし情報を入力する。そして、ステップS22において、ステップS21で入力されたデータが文字のみから構成されたデータであるのか画像データも含むデータであるのかを判断する。
ステップS22で文字のみであると判断された場合(ステップS22:YES)は、ステップS24に進み、文字切り出し部13が、読み込んだ入力データから文字の部分を切り出す。すなわち、入力データが持つレイアウト情報を利用して文字を切り出し、この後の処理についてはBMPなどの画像として扱う。JPEGやその他の画像フォーマットでも良い。他方、ステップS22で入力データが文字のみではなく画像データをも含むドキュメントデータであると判断された場合(ステップS22:NO)は、ステップS23において、ドキュメントデータの中からテキスト領域抽出部12が実行する構造解析によってテキスト領域を抽出し、抽出したテキスト領域から文字切り出し部13が文字の部分を一文字単位で切り出す。なお、文字は複数文字同時に切り出しても良い。
次に、ステップS25において、ステップS24で切り出した文字を複数の領域に分割するか否かを判断し、分割する場合(ステップS25:YES)は、ステップS26において、ステップS24で切り出した文字を複数の領域に分割してステップS27に進む。
他方、分割しない場合(ステップS25:NO)は、ステップS27において、特徴検出部14が、ステップS24で切り出した文字の構造を解析して特徴を検出する。例えば文字を構成する線の方向及び太さを前記文字の特徴として検出する。なお、ステップS26で文字を複数の領域に分割した場合は、その分割された領域中にある文字の一部分を構成する線の方向及び太さを前記文字の特徴として検出する。
ここで、文字を構成する線の方向とその方向毎の太さを抽出する方法について説明する。
図3は、触手方向を説明するための図である。
まず、抽出した文字画像をラスタ走査し画素毎に図3に示したような8方向の画素の連結長を求める。そして、下記式(1)乃至式(4)に示したように、8方向の連結長から水平方向、右斜め45度方向、垂直方向、左斜め45度方向の連結長を求める。
水平方向 :d1=L1+L5 式(1)
右斜め45度方向:d2=L2+L6 式(2)
垂直方向 :d3=L3+L7 式(3)
左斜め45度方向:d4=L4+L8 式(4)
なお、L1乃至L8は着目画素から図3で示した8方向に触手を伸ばして求まる黒点連結長である。
次に、d1乃至d4の連結長から下記式(5)乃至式(8)のようにして外郭方向寄与度D1乃至D4を求める。
D1=d1/(d12+d22+d32+d421/2 式(5)
D2=d2/(d12+d22+d32+d421/2 式(6)
D3=d3/(d12+d22+d32+d421/2 式(7)
D4=d4/(d12+d22+d32+d421/2 式(8)
ここで例に挙げて説明する。
図4は、ゴシック体の文字の例を示す図である。
文字成分内の着目画素から8方向に伸びた触手が図4のようになっている場合、外郭方向寄与度D1乃至D4を求めると外郭方向寄与度D1の値が最大になる。この場合着目画素は水平方向の線を構成する画素の1つであり、さらに着目画素を含む水平方向の線の太さはL3+L7+1になる。文字を構成する画素である画素値が0(黒)の全ての画素に対して上記の処理を行って統計的に解析する。本実施の形態では文字を構成する線の方向毎に太さのヒストグラムを生成する。
図5は、ゴシック体の文字の水平方向のヒストグラムの例を示す図であり、図6は、ゴシック体の文字の垂直方向のヒストグラムの例を示す図であり、図7は、ゴシック体の文字の右斜め方向のヒストグラムの例を示す図であり、図8は、ゴシック体の文字の左斜め方向のヒストグラムの例を示す図である。
そして、このようにして作成したヒストグラムから方向毎の太さの平均もしくは最頻出値などを特徴量として求める。
本実施の形態では最頻出値を特徴量として使用する。水平方向の線の太さの最頻出値がa、垂直方向の線の太さの最頻出値がbである場合、二つの値の比率c(=a/b)が任意の閾値eに対してc>eの時は“0”、c≦eの時は“1”というように切り出した文字の初期状態(情報を埋め込む前の状態)を求める。特徴検出には斜め方向の線の太さの比率を利用しても良い。さらに、水平方向と垂直方向との比率と、右斜め45度方向と左斜め45度方向との比率を組み合わせることで、一文字について“00”、“01”、“10”、“11”の4パターンの状態に識別することも可能である。
また、文字のフォントはゴシック体に限らず、明朝体でも同様である。
図9は、明朝体の文字の例を示す図であり、図10は、明朝体の文字の水平方向のヒストグラムの例を示す図であり、図11は、明朝体の文字の垂直方向のヒストグラムの例を示す図であり、図12は、明朝体の文字の右斜め方向のヒストグラムの例を示す図であり、図13は、明朝体の文字の左斜め方向のヒストグラムの例を示す図である。
図2の説明に戻る。
ステップS27で文字の特徴を検出した後、ステップS28において、ステップS27で検出された特徴に基づいて、前記文字に前記電子透かし情報を埋め込むか否かを判断する。
ステップS28で埋め込むと判断した場合(ステップS28:YES)は、ステップS29において、情報埋め込み部15は、特徴検出部14がステップS27で検出した特徴と文字の初期状態を利用して電子透かし情報を埋め込む。例えば、埋め込む電子透かし情報を“1”とし、文字の初期状態が“0”の場合、c≦eとなるように文字の特徴量を操作する。この場合は文字の水平方向の線の太さを細くするか、もしくは垂直方向の線の太さを太くするように操作する。なお、前記判断結果によっては前記電子透かし情報を埋め込まないか、もしくは埋め込み強度を適応的に調整する。たとえば埋め込む情報と文字の初期状態が同じ場合は何も処理を行わない。また、特徴量を操作することで線の太さが細くなりすぎるなど、画質が大幅に劣化する場合は情報を埋め込まないことも可能である。
なお、ステップS26で文字を複数の領域に分割した場合は、文字全体の特徴量ではなく、そのうちのいくつかの領域の特徴量だけを操作しても良い。また、電子透かし情報の埋め込みにも特徴検出と同様に斜め方向の線の太さの比率を利用しても良い。水平方向と垂直方向との比率と、右斜め45度方向と左斜め45度方向との比率を組み合わせることで、一文字について“00”、“01”、“10”、“11”の4パターンの情報を埋め込むことも可能である。さらに、上記に加えて、後述する電子透かし情報の抽出時の精度を高めるために、電子透かし情報を埋め込む際に同じ電子透かし情報を繰り返し埋め込むことや、誤り訂正符号などを利用することも可能である。
また、ステップS26における領域の分割は、例えば、文字の外接矩形で囲まれた領域をM×Nの領域に分割する。この場合、ステップS27の特徴検出は、分割領域毎に4方向(水平方向、垂直方向、右斜め45度方向、左斜め45度方向)の線の太さをヒストグラムを用いて統計的に解析する。そして、ステップS29の電子透かし情報の埋め込み方としては、ある分割領域で検出した4方向あるいは特定の2方向(水平方向と垂直方向、もしくは右斜め45度方向と左斜め45度方向)の線の太さが同程度の太さの場合は、その分割領域では埋め込み強度を適応的に変化させて埋め込む。どの程度埋め込み強度を変化させるかは検出した線の太さによって判断する。例えば線の太さが太いほど埋め込み強度を強く、細いほど弱くする。このように埋め込みやすい部分に集中的に埋め込むことで電子透かし情報の抽出時の精度を高めるとともに、文字の劣化を抑制することができる。
次に、電子透かし処理装置1による電子透かし情報の抽出の方法について説明する。
図14は、本発明を適用した電子透かし抽出処理の流れを示すフローチャートである。
図14において、ステップS141は「データ入力」を示し、ステップS142は「文字のみか?」を示し、ステップS143は「テキスト領域抽出」を示し、ステップS144は「文字切り出し」を示し、ステップS145は「領域分割するか?」を示し、ステップS146は「領域分割」を示し、ステップS147は「構造解析」を示し、ステップS148は「情報抽出」を示す。
まず、ステップS141において、入力部11が、スキャナなどを用いてスキャンすることにより、電子透かしが埋め込まれたBMPやJPEGなどの画像データを読み込む。そして、ステップS142において、ステップS141で入力されたデータが文字のみから構成されたデータであるのか画像データも含むデータであるのかを判断する。
ステップS142で文字のみであると判断された場合(ステップS142:YES)は、ステップS144に進み、文字切り出し部13が、読み込んだ入力データから文字の部分を切り出す。すなわち、入力データが持つレイアウト情報を利用して文字を切り出し、この後の処理についてはBMPなどの画像として扱う。JPEGやその他の画像フォーマットでも良い。他方、ステップS142で入力データが文字のみではなく画像データをも含むドキュメントデータであると判断された場合(ステップS142:NO)は、ステップS143において、ドキュメントデータの中からテキスト領域抽出部12が実行する構造解析によってテキスト領域を抽出し、抽出したテキスト領域から文字切り出し部13が文字の部分を一文字単位で切り出す。なお、文字は複数文字同時に切り出しても良い。
次に、ステップS145において、ステップS144で切り出した文字を複数の領域に分割するか否かを判断し、分割する場合(ステップS145:YES)は、ステップS146において、ステップS144で切り出した文字を複数の領域に分割してステップS147に進む。
他方、分割しない場合(ステップS145:NO)は、ステップS147において、構造解析部16が、ステップS144で切り出した文字の構造を解析することにより、特徴抽出部14が図2のステップS27で文字の特徴を検出したのと同様にして特徴を検出する。例えば文字を構成する線の方向及び太さを前記文字の特徴として検出する。なお、ステップS146で文字を複数の領域に分割した場合は、その分割された領域中にある文字の一部分を構成する線の方向及び太さを前記文字の特徴として検出する。
そして、ステップS148において、情報抽出部17は、構造解析部16で生成されたヒストグラムから切り出した文字に埋め込まれている電子透かし情報を抽出する。例えば前記ヒストグラムから方向毎の太さの平均もしくは最頻出値などを求める。本実施の形態では最頻出値を特徴量として使用する。水平方向の線の太さの最頻出値がa、垂直方向の線の太さの最頻出値がbである場合を考える。二つの値の比率c(=a/b)が任意の閾値eに対してc>eの時は“0”、c≦eの時は“1”というように埋め込まれている情報を判定する。
以上、本発明を適用した実施の形態を説明してきたが、電子透かし情報の埋め込みとして文字の線を太めたり細めたりする代わりに、例えば、各文字に“0”あるいは“1”をラスタスキャンした最後のドットに付加するようにしてもよい。この場合、見た目には全く分からない電子透かし情報を埋め込むことができる。
以上、説明してきたように、本発明によれば、視覚的に判別しにくい文書への電子透かし情報の埋め込みを可能にするとともに、埋め込んだ電子透かし情報がプリントアウト、コピー、あるいはスキャンされた後でも安定して検出することが可能になる。
なお、上述してきた本発明の実施の形態は、電子透かし処理装置の一機能としてハードウェアまたはDSPボードやCPUボードでのファームウェアもしくはソフトウェアにより実現することができる。
以上、本発明の実施の形態を、図面を参照しながら説明してきたが、本発明が適用される電子透かし処理装置は、その機能が実行されるのであれば、上述の実施の形態に限定されることなく、単体の装置であっても、複数の装置からなるシステムあるいは統合装置であっても、LAN、WAN等のネットワークを介して処理が行なわれるシステムであってもよいことは言うまでもない。
また、バスに接続されたCPU、ROMやRAMのメモリ、入力装置、出力装置、外部記録装置、媒体駆動装置、ネットワーク接続装置で構成されるシステムでも実現できる。すなわち、前述してきた実施の形態のシステムを実現するソフトェアのプログラムコードを記録したROMやRAMのメモリ、外部記録装置、可搬記録媒体を、電子透かし処理装置に供給し、その電子透かし処理装置のコンピュータがプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。
この場合、可搬記録媒体等から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記録した可搬記録媒体等は本発明を構成することになる。
プログラムコードを供給するための可搬記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、DVD−RAM、磁気テープ、不揮発性のメモリーカード、ROMカード、電子メールやパソコン通信等のネットワーク接続装置(言い換えれば、通信回線)を介して記録した種々の記録媒体などを用いることができる。
また、コンピュータ(情報処理装置)がメモリ上に読み出したプログラムコードを実行することによって、前述した実施の形態の機能が実現される他、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOSなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施の形態の機能が実現される。
さらに、可搬型記録媒体から読み出されたプログラムコードやプログラム(データ)提供者から提供されたプログラム(データ)が、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施の形態の機能が実現され得る。
すなわち、本発明は、以上に述べた実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内で種々の構成または形状を取ることができる。

Claims (8)

  1. テキストデータに電子透かし情報を埋め込んで電子透かし埋め込み画像を生成する電子透かし埋め込み装置に実行させるためのコンピュータ実行可能な電子透かし埋め込みプログラムであって、
    埋め込み対象データとしての文字を構成する文字線の方向毎の太さを前記文字の特徴として検出する手順と、
    前記検出された特徴に基づいて、前記文字線の方向のうち任意の2方向の太さの比を変更することで電子透かし情報を埋め込む手順と、
    を実行させるための電子透かし埋め込みプログラム。
  2. 前記特徴を検出する手順は、前記文字を構成する黒点毎にその黒点が属する黒点の連結長の最も長い方向を前記文字線の方向、さらに、前記文字線の方向と垂直に交わる黒点の連結長を太さとして算出し、前記文字線の方向毎に太さの平均値あるいは再頻出値を前記文字の特徴として検出することを特徴とする請求項に記載の電子透かし埋め込みプログラム。
  3. 前記情報を埋め込む手順は、前記線の太さを多段階に調節することを特徴とする請求項に記載の電子透かし埋め込みプログラム。
  4. 前記特徴を検出する手順は、前記文字を構成する黒点毎の文字線方向を表す特徴である外郭方向寄与度を用いることにより前記線の方向を検出することを特徴とする請求項に記載の電子透かし埋め込みプログラム。
  5. 前記情報を埋め込む手順は、前記特徴を検出する手順によって検出された特徴に基づいて、前記文字に前記電子透かし情報を埋めるべきかどうかを判断し、前記判断結果によって前記電子透かし情報を埋め込まないもしくは埋め込み強度を適応的に調整することを特徴とする請求項1に記載の電子透かし埋め込みプログラム。
  6. 前記埋め込み対象データとしての文字を複数の領域に分割して埋め込み対象データとする領域分割手順を更に備え、
    前記特徴を検出する手順は、前記領域を分割する手順によって埋め込み対象データとされた領域中に存在する文字部分の特徴を検出することを特徴とする請求項1に記載の電子透かし埋め込みプログラム。
  7. 前記情報を埋め込む手順は、前記領域を分割する手順によって分割された各領域に対して、前記埋め込む電子透かし情報の埋め込み強度を適応的に調整することを特徴とする請求項に記載の電子透かし埋め込みプログラム。
  8. 電子透かし情報が埋め込まれた電子透かし埋め込み画像から前記電子透かし情報を検出する電子透かし検出装置に実行させるためのコンピュータ実行可能な電子透かし抽出プログラムであって、
    前記電子透かし埋め込み画像を入力する手順と、
    前記画像を入力する手順によって入力された電子透かし埋め込み画像から文字により構成されるテキスト領域を検出する手順と、
    前記テキスト領域を検出する手順によって検出されたテキスト領域から前記文字を切り出す手順と、
    前記文字を切り出す手順によって切り出された文字を構成する文字線の方向毎の太さを算出し、前記文字線の方向のうち電子透かし情報の埋め込みで使用した2方向の太さの比である前記文字の特徴を解析する手順と、
    前記特徴を解析する手順によって解析された特徴に基づいて、前記文字に埋め込まれた電子透かし情報を抽出する手順と、
    を実行させるための電子透かし抽出プログラム。
JP2007542534A 2005-10-25 2005-10-25 電子透かしの埋め込み及び検出 Expired - Fee Related JP4510092B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2005/019633 WO2007049340A1 (ja) 2005-10-25 2005-10-25 電子透かしの埋め込み及び検出

Publications (2)

Publication Number Publication Date
JPWO2007049340A1 JPWO2007049340A1 (ja) 2009-04-30
JP4510092B2 true JP4510092B2 (ja) 2010-07-21

Family

ID=37967464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007542534A Expired - Fee Related JP4510092B2 (ja) 2005-10-25 2005-10-25 電子透かしの埋め込み及び検出

Country Status (3)

Country Link
US (1) US8077910B2 (ja)
JP (1) JP4510092B2 (ja)
WO (1) WO2007049340A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7856116B2 (en) * 2004-11-09 2010-12-21 Digimarc Corporation Authenticating identification and security documents
US8935379B1 (en) 2005-09-07 2015-01-13 Reversevision, Inc. Methods, systems, and products for evaluating electronic data and electronic forms
AU2005209707B2 (en) * 2005-09-13 2008-08-14 Canon Kabushiki Kaisha Adaptive mark placement
WO2009148129A1 (ja) * 2008-06-04 2009-12-10 株式会社エヌ・ティ・ティ・ドコモ 移動通信方法及びネットワーク装置
US8976003B2 (en) * 2009-09-23 2015-03-10 International Business Machines Corporation Large-scale document authentication and identification system
US20110153490A1 (en) * 2009-12-22 2011-06-23 Martignoni Thomas M Methods, Systems, and Products for Providing Good Faith Estimates
US8630444B2 (en) * 2009-12-30 2014-01-14 Mitsubishi Electric Research Laboratories, Inc. Method for embedding messages into structure shapes
JP5598120B2 (ja) * 2010-06-30 2014-10-01 株式会社リコー 画像処理装置
KR101491446B1 (ko) * 2010-10-14 2015-02-23 한국전자통신연구원 출판물의 핑거프린트 추출 방법, 출판물의 핑거프린트 추출 장치, 핑거프린트를 이용한 출판물 식별 시스템 및 핑거프린트를 이용한 출판물 식별 방법
CN104346321B (zh) * 2013-07-31 2017-09-12 北大方正集团有限公司 一种文本中数字水印信息的嵌入和提取方法及装置
CN109766978B (zh) * 2019-01-17 2020-06-16 北京悦时网络科技发展有限公司 一种词码的生成方法、识别方法、装置、存储介质
WO2023172161A1 (ru) * 2022-03-10 2023-09-14 Публичное Акционерное Общество "Сбербанк России" Способ и система защиты информации при печати документов
WO2023172162A1 (ru) * 2022-03-10 2023-09-14 Публичное Акционерное Общество "Сбербанк России" Способ защиты информации при печати документов

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003259112A (ja) * 2001-12-25 2003-09-12 Canon Inc 透かし情報抽出装置及びその制御方法
JP2004247883A (ja) * 2003-02-12 2004-09-02 Canon Inc 画像処理方法
JP2004349879A (ja) * 2003-05-20 2004-12-09 Fujitsu Ltd 画像データ処理装置、画像データ処理方法および画像データ処理プログラム
JP2005229186A (ja) * 2004-02-10 2005-08-25 Oki Electric Ind Co Ltd 情報埋込み装置および情報検証装置、ならびにその情報検証方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7203903B1 (en) * 1993-05-20 2007-04-10 Microsoft Corporation System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings
JP3373811B2 (ja) 1999-08-06 2003-02-04 インターナショナル・ビジネス・マシーンズ・コーポレーション 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置
JP2003230001A (ja) 2002-02-01 2003-08-15 Canon Inc 文書用電子透かし埋め込み装置及び文書用電子透かし抽出装置並びにそれらの制御方法
JP4193665B2 (ja) 2003-03-05 2008-12-10 株式会社日立製作所 二値画像用電子透かし方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003259112A (ja) * 2001-12-25 2003-09-12 Canon Inc 透かし情報抽出装置及びその制御方法
JP2004247883A (ja) * 2003-02-12 2004-09-02 Canon Inc 画像処理方法
JP2004349879A (ja) * 2003-05-20 2004-12-09 Fujitsu Ltd 画像データ処理装置、画像データ処理方法および画像データ処理プログラム
JP2005229186A (ja) * 2004-02-10 2005-08-25 Oki Electric Ind Co Ltd 情報埋込み装置および情報検証装置、ならびにその情報検証方法

Also Published As

Publication number Publication date
WO2007049340A1 (ja) 2007-05-03
US20080205699A1 (en) 2008-08-28
US8077910B2 (en) 2011-12-13
JPWO2007049340A1 (ja) 2009-04-30

Similar Documents

Publication Publication Date Title
JP4510092B2 (ja) 電子透かしの埋め込み及び検出
JP3592545B2 (ja) 画像処理装置および画像処理方法および情報記録媒体
JP5015540B2 (ja) 電子透かし埋め込み装置および検出装置
JP4745830B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4310288B2 (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
US7190807B2 (en) Digital watermark extracting method, apparatus, program and storage medium
JP4250483B2 (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
US20150228045A1 (en) Methods for embedding and extracting a watermark in a text document and devices thereof
JP2006050551A (ja) 画像処理装置及びその方法、並びにプログラム及び記憶媒体
JP4595014B2 (ja) 電子透かし埋め込み装置および検出装置
US20030118211A1 (en) Watermark information extraction apparatus and method of controlling thereof
US7209572B2 (en) Digital watermark embedding apparatus, digital watermark extraction apparatus, and methods thereof
JP4437756B2 (ja) 情報抽出方法および情報抽出装置および情報抽出プログラムおよび記憶媒体
CN109087234A (zh) 一种文本图像中的水印嵌入方法和装置
JP4414907B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP3728209B2 (ja) 画像処理方法及び装置及びコンピュータプログラム及び記憶媒体
JP3780181B2 (ja) 画像処理装置及びデータ処理装置とその方法及び記憶媒体
JP2006237858A (ja) 画像処理装置、画像処理方法、その方法をコンピュータに実行させるプログラム、および記録媒体
JP2008085579A (ja) 情報埋め込み装置、情報読み取り装置、情報埋め込み方法、情報読み取り方法、およびコンピュータプログラム
JP4804433B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP3884997B2 (ja) 電子透かし埋め込み装置及び電子透かし抽出装置並びにそれらの方法、コンピュータプログラム、記録媒体
JP2005253004A (ja) 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP3703445B2 (ja) 電子透かし埋め込み装置、電子透かし抽出装置、及びそれらの方法
JP2009193170A (ja) 文字認識装置及び文字認識方法
JP2007096503A (ja) 画像処理装置、画像処理方法、および画像処理プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100428

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees