JP2006261974A - 情報埋め込み方法、情報復元方法、情報埋め込み装置及び情報復元装置 - Google Patents

情報埋め込み方法、情報復元方法、情報埋め込み装置及び情報復元装置 Download PDF

Info

Publication number
JP2006261974A
JP2006261974A JP2005075603A JP2005075603A JP2006261974A JP 2006261974 A JP2006261974 A JP 2006261974A JP 2005075603 A JP2005075603 A JP 2005075603A JP 2005075603 A JP2005075603 A JP 2005075603A JP 2006261974 A JP2006261974 A JP 2006261974A
Authority
JP
Japan
Prior art keywords
information
document
embedded
parameter value
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005075603A
Other languages
English (en)
Inventor
Kagenori Nagao
景則 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005075603A priority Critical patent/JP2006261974A/ja
Publication of JP2006261974A publication Critical patent/JP2006261974A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 所定の情報を埋め込んだときに、紙文書の体裁を損ねることなく高い不可視性、耐複写性及び復元性がえられる文書を得る。
【解決手段】 文書又は文書データに情報を埋め込むときに、対象となる文書の文書データから文字列の体裁に関するパラメータとして例えば、文字間隔を系列的に抽出してパラメータ値系列を生成する(ステップ100、102)。これと共に、m系列等を適用して符号系列群を生成し、入力された埋め込み情報の各シンボルを符号系列群の符号系列を用いて符号化して符号化情報系列を生成し(ステップ104〜108)、この符号化情報系列に基づいて、対象文書のパラメータ値系列を修正することにより、埋め込み情報を埋め込んだ文書の文書データを生成する(ステップ110〜114)。
【選択図】 図4

Description

本発明は、所定の情報を埋め込んだ文書を作成するときの情報埋め込み方法、情報復元方法、情報埋め込み装置及び情報復元装置に関する。
各種情報の電子化が普及するのに伴って、顧客名簿や開発中の製品情報などの機密情報の漏洩が問題となっている。特に電子化した文書(文書データ)は、原本と完全に一致した複製を容易に行うことができ、また、複製した文書データの持ち出しは、ネットワーク等を使用することにより極めて容易となっており、文書データの漏洩防止が望まれている。
近年、暗号化技術、認証技術、アクセス制限技術等が急速な進歩を遂げており、これらの技術を用いて適正な対策を施すことにより、文書データの持ち出しが困難となりつつある。
一方、プリンタや複写機の普及、高機能化に伴って、文書データの印刷出力のみならず、精巧な文書複写が可能となっており、また、印刷出力や複写によって作成された紙文書は、外部への持ち出しが極めて容易となっている。
ここから、電子文書データを紙文書として外部に持ち出されることによる情報漏洩の防止が遅れをとっている。
ところで、紙文書に対する機密漏洩策として、追跡情報の付加技術がある。この追跡情報は、紙文書に、プリント出力を行ったときの出力者を特定可能とする情報や、出力日時を特定する情報などを追跡情報として、紙文書上に記録紙しておくことにより、紙文書が外部に流出してしまったときに、追跡情報から流出元を特定可能とすることにより、機密情報の漏洩抑制が可能となるようにしている。
このような追跡情報としては、不可視性や紙文書内のコンテンツとの不可分性が要求される。
紙文書に情報を記録する方法としては、一次元又は二次元などのバーコードが一般的であるが、追跡情報が可視的であったり、紙文書上のコンテンツと無関係のシンボル等によって記録されていると、追跡情報が記録されていることが明らかとなってしまい、このために、該当情報を切り取ったり、塗つぶすことによる消去や、情報の解読、改ざんが可能となり、これにより、流出元の特定が妨害されてしまうという問題が生じる。
ここから、紙文書に記録する追跡情報としては、不可視性やコンテンツとの不可分性が要求される。
ここから、紙文書に対して不可視性の高い情報の記録方法として、文字のみから形成される文書画像に対して、背景画像を生成し、この背景画像に電子透かしによって情報を埋め込む提案がある(例えば、特許文献1参照。)。
また、漢字と漢字に対応するひらがなによる表記や、英数字及び英数字に対応する漢数字などのように、文書上に出現する特定の単語を、同義語である2種類の表現で表すことにより情報ビットの埋め込みを行う提案がなされている(例えば、特許文献2参照。)。
さらに、紙文書に記録する文章中の文字位置をシフトして、各文字の間の前後の間隔長に変化を持たせることにより、情報を埋め込む方法が提案されている(例えば、特許文献3参照。)。
この提案では、情報ビットを埋め込む対象となる文字の前後の空白長(間隔)をP、Sとしたとき、例えば情報ビットが「1」ならP>S、「0」ならP<Sと規定して文字位置をシフトする。この操作を、埋め込む情報のビット数に相当する文字に対して行うことにより、紙文書に所望の情報を埋め込むことができる。また、句読点の前後の文字位置をシフトさせてしまうと、違和感が生じて目に付きやすくなるために、句読点の周辺の文字を、情報埋め込みに使用しなうようにして、不可視性の向上を図るようにしている。
また、紙文書に形成する文字パターンのサイズやフォント種別を変更するなどして、情報を埋め込む提案がなされている(例えば、特許文献4参照。)。
この提案では、通常の文章において出現頻度の高い「の」、「は」等の文字を情報埋め込みの対象として、文書の先頭から情報埋め込み対象の文字に情報を埋め込む。このとき、例えば、情報ビットが「1」であると、別のフォントに置換えたり、文字幅を10%程度広げるなどして文字パターンを変化させることで埋め込み情報を表現し、埋め込んだ情報を復元するときには、情報埋め込み前の文書と比較して、情報埋め込み対象の文字上での文字パターンの変化の有無を判別するようにしている。
一方、紙文書は、複写機による複写が容易であることから、二次コピーや三次コピーとして持ち出されることがある。このとき、複写機の解像度や、原稿となる元の紙文書上の汚れによるノイズなどの影響を受けて、文字の太りや細り、荒れなどによる画質劣化が生じる。
このために、紙文書に形成される追跡情報としては、複写が繰り返されたときにも再現が可能となる耐複写性が要求される。
しかしながら、特許文献1の提案では、コピーが繰り返されることによる画質劣化に対する耐性が低いという問題がある。すなわち、文字の読み易さを維持するためには、背景画像の濃度を低くする必要があるが、濃度の低い画像はコピー(複写)が繰り返されることにより飛んでしまうことになり、このために、埋め込み情報が消失してしまう。
これに対して、特許文献2の提案では、コピーが繰り返されても、文字の判読ができれば、埋め込んでいる情報の判読は可能であり、耐複写性が高いといえる。しかし、例えば、「頂く」と「いただく」等では、同義であっても文字数が一致しない表記を用いてしまうと、文章の体裁のみならず、改行位置やページ数などの文書全体の体裁が原本と異なってしまう。また、情報埋め込みの対象とする特定の単語の出現頻度が小さい文書では、埋め込む情報量が極めて少なくなってしまう。
また、複写されることによる画質低下によって文字間の空白長が変化してしまうことがある。このため、特許文献3で提案している文字位置をシフトさせる方法では、空白長が変化することにより、埋め込んでいる情報の正確な復元が困難となる恐れがある。
これを防止するためには、文字位置のシフト量を大きくして、画質低下によって空白長が変化しても、文字の前後の空白長が明確なるように維持可能とする方法があるが、この方法を用いると、文章中に加えた文字間隔の変更が明確となるために、情報の不可視性が損なわれてしまうという問題が生じる。
また、紙文書を作成するときには、文字間隔を整えるカーニング処理を行うことがあり、カーニングされた文章では、文字間隔が一定でないために、文字の前後の空白長を変化させることで情報を埋め込む場合、文字位置を大きくシフトしなければならないことがあり、このために、不可視性が損なわれてしまうことがある。
さらに、コピーを繰り返すことによる画質低下は、文字の形状などを変化させてしまうことがある。このために、特許文献4に示す文字パターンのサイズやフォントの種別等を変化させて情報を埋め込む方法においても、コピーが繰り返されることにより、埋め込んでいる情報の復元性が低下してしまう。
このときの情報の復元性低下を防止する方法としては、文字サイズを大きく変更したり、形状が大きく異なるフォントを使用する方法があるが、この方法では、文字パターンが大きく変化してしまうことになるために、紙文書の文章中に加えた変化が明らかになってしまい、情報埋め込みの不可視性が損なわれてしまうという問題が生じる。
また、特許文献4の提案においても、埋め込み対象とする文字の出現頻度が低いと、埋め込む情報の情報量が低下してしまうと言う問題がある。
特開2004−48380号公報 特開2003−108543号公報 特開2003−230001号公報 特開2001−251490号公報
本発明は上記事実に鑑みてなされたものであり、紙文書の体裁を損ねることなく、紙文書上で高い不可視性を保持できると共に、複写が繰り返されたときにも、正確な情報の復元性を維持できる情報埋め込み方法、情報埋め込み装置及び、埋め込まれている情報を復元する情報復元方法、情報復元装置を提供することを目的とする。
上記目的を達成するための本発明の情報埋め込み方法は、文字列が形成される文書を、情報埋め込み対象として所定の埋め込み情報を埋め込む情報埋め込み方法であって、前記埋め込み情報に基づいた各シンボルを符号化した符号化系列を生成し、該符号化系列を前記埋め込み対象の文書の文字列の体裁に関する情報に基づいたパラメータ値に系列的に埋め込むことを特徴とする。
この発明によれば、埋め込み情報の各データ値に応じたシンボル(シンボル値)を符号化して符号系列を生成する。また、情報を埋め込む対象とする文書の文書データから、文書に形成する文字列の体裁に関するパラメータを設定し、該パラメータのパラメータ値に埋め込み情報の符号系列を系列的に埋め込む。
これにより、埋め込み情報を埋め込んだ文書の作成が可能となり、この文書上では、文字列の体裁に関するパラメータ値が埋め込み情報に応じて修正され、埋め込み情報が不可視的に埋め込まれる。
また、本発明の情報埋め込み方法は、前記埋め込み対象の文書の文書データから文字列の体裁に関する情報に基づいてパラメータ値を系列的に抽出してパラメータ値系列を生成すると共に、前記埋め込み情報に基づいた各シンボルを符号化する符号系列による符号系列群を生成して、生成した符号系列群の符号系列に基づいて埋め込み情報の各シンボルを符号化した符号化情報系列を生成し、前記符号化情報系列と前記パラメータ値系列を合成して修正パラメータ値系列を生成し、該修正パラメータ値系列を前記パラメータ値系列に置換して、前記埋め込み情報を埋め込んだ文書の文書データを生成することを特徴とする。
この発明によれば、埋め込み情報の各データ値に応じたシンボル(シンボル値)を設定すると共に、シンボルの符号化に用いる符号系列の符号系列群を生成し、符号系列群の符号系列によって埋め込み情報のシンボルを符号化して、符号化情報系列を生成する。
この符号化情報系列をパラメータ値系列に合成することにより、パラメータ値系列を修正し、修正したパラメータ値を、文書データから抽出したパラメータ値に置換することにより埋め込み情報を埋め込んだ文書データを生成する。
また、本発明の情報埋め込み方法では、前記符号系列群が、互いに直交又は略直交し、かつ、ランダム性を有する符号系列とすることが好ましく、前記符号系列群内の各符号系列に対して、前記埋め込み情報の1シンボル分を割り当てることが好ましい。
さらに、本発明の情報埋め込み方法では、前記文書体裁に関するパラメータとして、文字間隔、単語間隔、行間隔、文字高さ、文字幅、文字の傾き、文字の重心、文字の回転角の何れか少なくと一つを用いることができる。
一方、本発明の情報埋め込み方法によって文書又は文書データに埋め込まれている情報を復元するための情報復元方法は、文字列が形成される文書に、該文書の文書データから文字列の体裁に関する情報に基づいたパラメータ値系列を、所定の符号系列群の各符号系列によって埋め込み情報の各シンボルを符号化した符号化情報系列に基づいて修正することにより埋め込み情報が埋め込まれた文書又は文書データから、前記埋め込み情報を復元する情報復元方法であって、前記文書又は前記文書データから前記パラメータ値系列を抽出し、抽出した前記パラメータ値系列と前記符号系列群の各符号系列の相関値を求めることにより、前記埋め込み情報を復元することを特徴とする。
この発明によれば、情報の復元を行う文書データから実際のパラメータ値系列を抽出し、抽出した実際のパラメータ値系列と、情報埋め込みに用いた符号系列群の符号系列との相関値を演算する。
この後、演算した相関値から、埋め込んでいるシンボルを判定することにより、埋め込み情報の復元を行う。
このように、本発明では、情報埋め込みに、文書上の文字列を用い、文字列の文書体裁に関するパラメータ値系列を、埋め込み情報を所定の符号系列群で符号化した符号化情報系列により修正することにより、埋め込み情報を埋め込んでおり、文書の複写を繰り返しても、文字列が消えない限りは、複写された文書上に埋め込んでいる情報が残り、さらに、埋め込み情報を符号化することにより冗長性を高めているため、複写に対する耐久性が高くなっている。
このような本発明に適用可能な情報埋め込み装置は、文字列が形成される文書を、情報埋め込み対象として所定の埋め込み情報を埋め込む情報埋め込み装置であって、前記埋め込み対象の文書の文書データを入力する文書入力手段と、前記文書データから文字列の体裁に関する情報をパラメータとするパラメータ値を系列的に抽出してパラメータ値系列を生成するパラメータ値生成手段と、前記埋め込み情報を形成するシンボルを各シンボルごとに符号化する符号系列による符号系列群を生成する符号系列群生成手段と、前記埋め込み情報に応じたシンボルのそれぞれを前記符号系列群の符号系列によって符号化して符号化情報系列を生成する符号化情報系列生成手段と、前記符号化情報系列と前記パラメータ値系列を合成してパラメータ値系列に応じた修正パラメータ値系列を生成する修正パラメータ値系列生成手段と、前記修正パラメータ値系列を前記パラメータ値系列に置換することにより前記文書データを修正して前記埋め込み情報を埋め込んだ文書の文書データを生成する文書修正手段と、を含むものであれば良い。
また、情報埋め込み装置は、前記符号系列群生成手段が、互いに直交又は略直交し、かつ、ランダム性を有する符号系列を生成することが好ましく、前記埋め込み情報が入力されると共に、入力された埋め込み情報を予め設定されているシンボルに置換する埋め込み情報入力手段を含むことができる。
また、本発明を適用する情報復元装置は、文字列が形成される埋め込み対象文書に、該対象文書の文書データから文字列の体裁に関する情報に基づいたパラメータ値系列を、所定の符号系列群の各符号系列によって埋め込み情報の各シンボルを符号化した符号化情報系列に基づいて修正することにより埋め込み情報が埋め込まれた文書又は文書データから、前記埋め込み情報を復元する情報復元装置であって、前記文書データ又は前記文書を読み込む文書読込み手段と、前記文書読込み手段によって読み込んだ文書データから、前記対象文書の前記パラメータ値系列に対する実際のパラメータ値系列を抽出する実パラメータ値系列抽出手段と、前記実パラメータ値系列抽出手段によって抽出した前記パラメータ値系列と、前記符号系列群の各符号系列の相関値を演算し、演算結果から前記埋め込み情報の各シンボルを判定することにより埋め込み情報を復元する埋め込み情報復元手段と、を含むものであれば良い。
さらに、本発明の情報埋め込み方法は、埋め込み対象とする文書データを読み込むステップと、読み込んだ文書データから文字列の体裁に関するパラメータのパラメータ値系列を抽出するステップと、所定の符号系列の符号系列群を生成するステップと、埋め込み情報に応じた各シンボルを符号系列群の符号系列によって符号化して符号化情報系列を生成するステップと、パラメータ値系列と符号化情報系列を合成することによりパラメータ値系列を修正した修正パラメータ値系列を生成するステップと、修正パラメータ値系列をパラメータ値系列と置換することにより文書データを修正するステップと、を含むプログラム又は、このプログラムを記憶する記憶媒体を用いて達成することができる。
また、本発明の情報復元方法は、情報の復元対象とする文書の文書データを読み込むステップと、読み込んだ文書データから情報埋め込みに適用されている文字列の体裁に関するパラメータの実際のパラメータ値系列を抽出するステップと、情報埋め込みに適用した符号系列群の符号系列と復元対象の文書から抽出したパラメータ値系列の相関値を演算するステップと、演算結果のそれぞれに基づいて対象文書に埋め込まれているシンボルを判定するステップと、判定したシンボルから対象文書の文書データに埋め込まれている埋め込み情報を復元するステップと、を含むプログラム又は、このプログラムを記憶する記憶媒体を用いて達成することができる。
以上説明したように本発明によれば、文字列の体裁に関するパラメータ値を符号化した埋め込み情報に応じて極めて僅かに修正するので、高い不可視性を確保することができると共に、複写が繰り返されても、埋め込んでいる情報が消失してしまうのを防止し、的確な復元性を維持することができるという優れた効果が得られる。
また、埋め込んだ情報の不可視性の高い文書が得られるので、埋め込んだ情報の解読や改ざんがなされてしまうの防止できる。
以下に図面を参照しながら本発明の実施の形態を詳細に説明する。図1には、本実施の形態に適用した文書処理システム10の概略構成を示している。この文書処理システム10は、文書データに基づいた文書を印刷出力するときに所定の情報を付加可能とする文書処理装置12と、所定の情報が付加されて文書処理装置12から印刷出力された文書14又は、文書14を複写した文書14Aから所定の情報を抽出する文書処理装置16とを含んで構成されている。
文書処理装置12、16は、パーソナルコンピュータやワークステーションなどの情報処理装置18、20を含んでいる。また、文書処理装置12は、情報処理装置18から出力される画像データ(文書データ)に基づいて印刷処理を行うプリンタ22を含んで構成され、文書処理装置16は、文書14、14Aなどを原稿として原稿に記録されている画像を読み込んで、該画像に応じた画像データ(文書データ)を情報処理装置20へ出力するスキャナ24を含んで構成されている。
なお、文書処理システム10は、文書処理装置12と文書処理装置16をネットワーク接続して、データの交換が可能となっていても良い。また、ここでは、文書処理装置12、16に分けて説明するが、文書処理装置12、16の機能を合わせ持つ1台の文書処理装置を用いて構成したものであっても良い。すなわち、1台の情報処理装置にプリンタ22とスキャナ24を接続して構成したものであっても良い。このとき、プリンタ機能とスキャナ機能を合わせ持つ複写機や複合機等を用いるなど、任意の構成を適用することができる。
図2には、文書処理装置12の機能ブロック図を示している。この文書処理装置12は、文書入力部26及び埋め込み情報入力部28を備えている。
文書処理システム10では、文書処理装置12から文書14を印刷出力するときに、印刷出力日時、印刷出力者、印刷出力したプリンタ等の情報等の任意の情報を埋め込み可能となっており(以下、埋め込み情報とする)、文書入力部26には、埋め込み情報を埋め込む対象とする文書の文書データが入力され、埋め込み情報入力部28には、文書データへ埋め込む埋め込み情報が入力される。
文書データとしては、PostScript形式等のページ記述言語で記述されたものであっても良く、ワードプロセッサー出力形式の文書データ(電子文書データ)であっても良い。また、文書データとしては、スキャナやデジタルカメラなどの画像読取り手段、撮像手段によって読取りないし撮影された文書のラスタデータなどであっても良い。
このような文書入力部26としては、スキャナやデジタルカメラなどを含むことができると共に、文書データを蓄積して記憶可能なハードディスクドライブ(HDD)、DVD(Digital Versatile Disc、DVD−RAM、DVD±RW、DVD±Rなど)ドライブ、CD(Compact Disc、CD−ROM、CD−R、CD−RWなど)ドライブ、MO(Magneto−Optical disk)ドライブなどの各種の記憶媒体用入力装置ないし入出力装置、ネットワークを介して文書データの授受を行うデータ転送装置など、文書データの受け取りが可能な任意の構成を含むことができる。
埋め込み情報入力部28から入力する埋め込み情報としては、数字や文字、URL(Uniform Resource Locator)、音声や画像などのマルチメディアデータなど、デジタルデータ又はデジタルデータに変換可能なデータであれば任意のデータを適用することができる。
このような埋め込み情報の入力を行う埋め込み情報入力部28としては、キーボード等の入力デバイスを用いて文字などを入力することができ、マルチメディアデータなどを入力するときには、前記文書入力部26と同様に、HD、DVD、CD、MOなどの各種記憶媒体やネットワークを介してデータの授受を行う構成を適用することができる。
文書処理装置12には、パラメータ値系列抽出部30が設けられている。このパラメータ値系列抽出部30では、文書入力部26から入力される電子文書データやラスタデータなどの文書データを解析し、文書上の文字列から得られるパラメータ値を系列的に抽出して、抽出したパラメータ値の系列(パラメータ値系列)を生成する。
このパラメータ値としては、文字間隔、単語間隔、行間隔、文字高さ、文字幅、文字の傾きなど、文書体裁に関する値を適用することができ、パラメータ値系列抽出部30では、予め設定されているパラメータ値を系列的に抽出する。
一方、文書処理装置12には、符号系列群生成部32、情報符号化部34及び修正パラメータ値系列生成部36が設けられている。
符号系列群生成部32は、埋め込み情報入力部28から入力される埋め込み情報を符号化した符号化情報の生成に適用する1又は複数の符号系列を生成する。このとき、符号系列群生成部32は、埋め込み情報のシンボル数に相当する数の符号系列を符号系列群として生成するようになっている。
情報符号化部34は、埋め込み情報入力部28から入力された埋め込み情報を符号系列群生成部32で生成した符号系列群によって符号化して、埋め込み情報と符号系列群に応じた符号化情報系列を生成する。このとき、情報符号化部34では、埋め込み情報の各シンボルを、該当シンボルに対応する符号系列群内の符号系列を用いて符号化し、各シンボルの符号化結果を合成することにより符号化情報系列を生成する。
修正パラメータ値系列生成部36は、埋め込み対象となっている文書データから抽出したパラメータ値系列の各パラメータ値を、符号化情報系列の対応するシンボル値に応じて修正して、パラメータ値ごとの修正パラメータ値を生成することにより、修正パラメータ値系列を得る。
また、文書処理装置12には、文書修正部38及び、プリンタ22を用いて印刷処理等を実行する文書出力部40が形成されている。
文書修正部38は、文書入力部26から入力された文書データに基づいた文書の体裁を、修正パラメータ値系列生成部36で生成した修正パラメータ値系列の各シンボル値(修正パラメータ値)に基づいて修正する。例えば、文書修正部38では、文書データから抽出した各パラメータ値を、対応する修正パラメータ値に置換するなどの処理を行う。これにより、修正後の文書データでは、文書上の文字列から得られる文字間隔、単語間隔、文字高さ、文字幅、文字の傾きなどの文書体裁に関するパラメータ値が、修正パラメータ値系列の各シンボル値に等しくなるように修正される。
このような符号系列群生成部32、情報符号化部34、修正パラメータ値系列生成部36及び文書修正部38は、各種の処理を行うCPU、CPUで実行する処理プログラムを格納したROM、一時記憶手段などとして用いるRAMやHDDなど、パーソナルコンピュータやワークステーションなどにおける一般的構成のハードウェアを用いて構成することができる。
また、文書出力部40は、文書修正部38によって修正された文書データを所定の形式に変換して出力する。このときに、文書データを、プリンタ22で処理可能なデータ形式に変換して、プリンタ22へ出力することにより、所定の埋め込み情報が埋め込まれた文書データを紙に印刷した文書14が得られる。
また、文書出力部40は、紙への印刷出力に限らず、例えば、PostScript形式などのページ記述言語やワードプロセッサー出力形式の電子文書データや、ラスタデータ形式のデータファイルとして出力するものであっても良い。
このような文書出力部40は、プリンタ22やプリンタ22を制御する制御装置のみならず、各種の記録媒体へのデータの書込みを可能とするデータ書込み装置又はデータ書込み装置の制御装置、ネットワークを介してデータを伝送するデータ転送装置などを接続することができる。
一方、図3には、文書処理装置16の機能ブロック図を示している。この文書処理装置16には、文書読込み部42が設けられている。埋め込み情報が埋め込まれている文書のラスタデータなどの文書データを読み込む。例えば、対象とする文書が紙に印刷出力された文書14や、この文書14を複写して作成した文書14Aであるときには、この文書14、14Aをスキャナ24に装填して画像読込みを行うことにより、文書14、14Aに応じたラスタデータを生成し、このラスタデータを文書データとして出力する。
このような文書読込み部42としては、スキャナ24などの画像読取り手段に限らず、デジタルカメラなど撮像手段を用いることができる。また、文書読取り部42は、対象となる文書が、電子文書データ又はラスタデータなどとして記憶媒体に記録されているときには、記憶媒体に応じたデータ読取り装置を含むことができ、また、ネットワークを介してデータを読み込む構成を含んだものであっても良い。なお、文書読込み部42では、各種のデータ形式で入力される文書データを、ラスタデータに変換する機能を合わせ持つことができる。
また、文書処理装置16には、パラメータ系列抽出部44、符号系列群生成部46及び埋め込み情報復元部48が設けられている。パラメータ値系列抽出部44は、予め設定されているパラメータ値を文書データから抽出する。このときに、パラメータ値系列抽出部44は、埋め込み情報の埋め込みに用いたパラメータ値を抽出して、パラメータ値系列を生成する。このようなパラメータ値系列抽出部44は、前記した文書処理装置12に形成しているパラメータ値系列抽出部30と同等の構成を適用することができる。
一方、文書処理装置16では、前記した文書処理装置12で文書に埋め込んだ埋め込み情報を復元するようにしており、ここから、符号系列群生成部46は、文書処理装置12の符号系列群生成部32で生成した符号系列群と同じ符号系列群を生成する。
このような符号系列群生成部46としては、図2に示すように、文書処理装置12に符号系列群記憶部50を設けて、文書に付加情報を埋め込むときに用いた符号系列群を記憶し、この符号系列群記憶部50に記憶している符号系列群を読み込むものであっても良く、このときには、図1に示すように、文書処理装置12と文書処理装置16とをネットワーク接続しても良い。
また、これに限らず、予め符号系列群を設定しておいて文書処理装置12と文書処理装置16のそれぞれに記憶しておいても良く、符号系列群を所定の記憶媒体に記憶しておき、符号系列群生成部46が、該当記憶媒体から読み込むものであっても良いが、セキュリティ性を確保した方法を適用することが好ましい。
埋め込み情報復元部48(図3参照)は、符号系列群生成部46で生成した符号系列群を用いて、パラメータ値系列抽出部44で抽出した対象文書のパラメータ値から、埋め込み情報を復元する。
このような、パラメータ値系列抽出部44、符号系列群生成部46及び埋め込み情報復元部48は、各種の処理を行うCPU、CPUで実行する処理プログラムを格納したROM、一時記憶手段などとして用いるRAMやHDDなど、パーソナルコンピュータやワークステーションなどにおける一般的構成のハードウェアを用いて構成することができる。
また、文書処理装置16には、埋め込み情報復元部48で復元した埋め込み情報を出力する情報出力部52が設けられている。この情報出力部52は、CRT、LCD等の各種の表示デバイスを用いて埋め込み情報を表示するものであっても良く、また、プリンタ等の印刷出力装置を用いて印刷出力するものであっても良く、埋め込み情報を記憶媒体に書き込むことにより出力するなどの任意の構成を取ることができ、出力先や出力形式に応じた制御手段ないし出力装置を含むものであれば良い。
ここで、一例として、文書の体裁に関するパラメータ値として文字間隔を適用すると共に、該パラメータ値を用いて埋め込み情報を埋め込んだ文書14を作成する共に、文書14又は文書14を複写することにより作成した文書14A(以下、文書14Aとする)から埋め込み情報を復元するときの処理を説明する。
図4には、文書処理装置12での文書14の作成処理の概略を示している。このフローチャートでは、最初のステップ100で、付加情報を埋め込む文書データを入力する。次のステップ102では、入力した文書データを解析することにより、パラメータ値として設定する文字間隔を抽出して、パラメータ値系列を生成する。
パラメータ値の抽出は、入力された文書データがPostScript形式などのページ記述言語を用いたものやワードプロセッサ出力形式などの電子文書データであるときには、該当電子文書データを解析することにより文字間隔を直接求めることができる。なお、このときの解析方法としては、電子文書データの形式(フォーマット)に応じた公知の手法を用いることができる。
また、既に紙文書となっている文書に埋め込み情報を埋め込むために、スキャナなどの画像読取り手段やデジタルカメラなどの撮像手段によって読み込まれて生成されたラスタデータなどであるときには、文字認識の前処理として一般的に行われる文字の切り出し処理を実行し、矩形状に切り出し処理された各文字の間の矩形形状の空間の幅を文字間隔として抽出することができる。なお、このときの文字の切り出し抽出等の処理は、任意の処理方法を適用することができる。
これにより、例えば、図6に示す文書14Bを形成する文書データが入力され、この文書データからL個のパラメータ値を抽出するときには、互いに隣接する文字の間の間隔を文字間隔a(0)、a(1)、a(2)、・・a(L−3)、a(L−2)、a(L−1)として順に抽出する。
これにより、文字間隔をパラメータ値とする系列長Lのパラメータ値系列a(k)(ただし、k=0、1、2、・・、L−1)を得ることができる。なお、パラメータ値として用いる文字間隔の抽出開始位置は、文書の先頭であることが好ましいが、例えば、上から何行目の先頭などの予め設定した位置あれば任意の位置を適用することができる。また、1行で所望の数(例えばL個)の文字間隔を抽出できなかったときには、複数行にまたがって所望の数の文字間隔を抽出するものであって良い。
図4に示すフローチャートでは、ステップ104で埋め込み情報を入力すると共に、ステップ106では、符号系列群を生成する。ここで、例えば、埋め込む情報をnビット(ビット数n)の2値データとすると、ステップ104では、入力される埋め込み情報をnビットの2値データに変換して、埋め込み情報b(i)を生成する。このとき、データ値が「0」のビットには、データ値として「−1」を当てるものとする。これにより、
b(i)={±1}、(ただし、i=0、1、2、・・、n−1)
が得られる。
また、符号系列は、シンボル値の平均値が小さな値で、かつ、ランダム性を有する値の系列が用いられる。また、生成される符号系列群は、任意の2つの符号系列の間で、相互相関値の絶対値が小さい値となるようにしている。
このような性質の符号系列としては、m系列(最長系列、Maximal−length sequences)やGold符号(Gold系列)などがあり、これらを使用することができるが、これに限らず、上記の性質を満たすものであれば任意の符号系列群を用いることができる。
ここで、符号系列群の一例として、1周期の系列長Lのm系列と、そのシフトバージョンを用いると、符号系列群pn(i、k)は、
pn(i、k)=m(k+i)
(ただし、k=0、1、2、・・、L−1、i=0、1、2、・・、n−1)
となる。このとき、符号系列m(x)は、1周期の系列長Lのm系列を表すものとし、そのシンボル値は、「+1」又は「−1」の何れかを取るものとする。
図4のフローチャートでは、次のステップ108で符号系列群pn(i、k)を用いて埋め込み情報b(i)の各ビットに対する符号化処理を行う。
図5には、符号化処理の概略を示している。なお、ここでは、符号化処理によって、数1の(1)式に示す符号化情報系列c(k)を生成するものとしている。
Figure 2006261974
ここから、図5に示すフローチャートでは、最初のステップ120で初期設定(i=0)を行い、次のステップ122では、埋め込み情報b(i)を符号系列群pn(i、k)で符号化する。この後、ステップ124では、符号化した結果を符号系列c(k)に加算する。
また、ステップ126では、iがビット数のnに達していないかを確認し、達していないときには、ステップ126で肯定判定してステップ128へ移行し、iをインクリメントしてステップ122へ戻る。これを繰り返すことにより、n個の符号化情報による符号化情報系列c(k)が生成される。
ここで、埋め込み情報b(i)と符号系列pn(i、k)は、共にシンボル値が「+1」又は「−1」であることから、その積も「+1」又は「−1」となる。したがって、符号化情報系列c(k)は、[−n、n]のシンボル値を持つ系列となる。
図4のフローチャートでは、埋め込み情報の符号化を行って符号化情報系列c(k)を生成すると、ステップ110へ移行し、この符号化情報系列c(k)から修正パラメータ値系列d(k)を生成する。このとき、情報の埋め込み強度を示す定数δが予め設定されており、この定数δに基づいて修正パラメータ値系列d(k)を生成する。すなわち、修正パラメータ値系列d(k)は、
d(k)=a(k)+δ・c(k)
となる。
ここで、定数δは、小さい値とすることにより、文書14上での埋め込み情報の不可視性が高くなる。すなわち、定数δが小さくなることにより、修正パラメータ値系列d(k)が元のパラメータ値系列a(k)に近づくことになる。
次のステップ112では、この修正パラメータ値に基づいて、文書データの修正を行う。このとき、元の文書データ上での文字間隔であるパラメータ値系列a(k)を、修正した修正パラメータ値系列d(k)に置き換えることにより、文書データの体裁を修正する。
なお、元の文書データがPostScript形式などのページ記述言語やワードプロセッサ出力形式などであるときには、文字間隔が修正パラメータ値系列d(k)の各シンボル値に等しくなるように文書データの記述を修正する。
また、元の文書データがラスタデータであるときには、パラメータ値系列を抽出するときに行った文字の切り出し処理の結果を用い、文字画像として切り出した矩形状のブロック間の距離を、修正パラメータ値系列d(k)のシンボル値となるように文字画像を再配置する。
このようにして、文書データを修正すると、次のステップ114では、修正した文書データに基づいた印刷処理を行い、所定の付加情報を埋め込んだ文書14を印刷出力する。これにより、図7(A)に示すように、修正パラメータ値d(k)に基づいた文字間隔の文書14が作成される。
すなわち、埋め込み情報を埋め込む前の文書データ(図6に示す文書14B)では、文字間隔が、パラメータ値系列a(k)(パラメータ値a(0)、a(1)、a(2)、・・)となっているのに対して、図7(A)に示すように、埋め込み情報を埋め込んだ文書14(文書データ)では、該当文字間隔が、修正パラメータ値系列d(k)(修正パラメータ値d(0)、d(1)、d(0)、・・)となっている。
なお、文書データとして出力するときには、所定のデータ形式(フォーマット)に変換するなどして、指定された出力先へ出力するものであれば良い。
このようにして、付加情報が埋め込まれた文書14は、バーコードなどのように文書内に文章などのコンテンツと共に併記されるものと異なり、文字列中に文字間隔として、コンテンツと不可分となる形式で埋め込まれる。
これにより、文書14から埋め込み情報を取り除こうとすると、文書14内のコンテンツそのものを失うことになり、文書14内のコンテンツを損ねること無く、埋め込み情報のみを除去することができなくなる。
したがって、埋め込み情報として、外部に漏らしたくない文書に対する追跡情報を適用することにより、高いセキュリティ性を確保することができる。すなわち、埋め込み情報の除去が困難となっているために、文書14に埋め込んだ情報から文書14の出所を明確にすることができる。
一方、埋め込み情報を埋め込むときに用いる符号系列(符号系列群pn(i、k))は、シンボル値の平均が小さく、かつ、ランダム性を有するものとしている。したがって、その線形和である符号化情報系列c(k)も、そのシンボル値の平均は小さい値で、ランダム性を有するものとなる。
ここで、修正パラメータ値系列d(k)は、
d(k)=a(k)+δ・c(k)
となっており、ここから、文書14上の文字間隔は、ランダムに広げられたり狭められたりされていることになる。また、一定の範囲(例えば1行)を見れば、修正量の和は、小さい値となる。
したがって、修正後の各行の長さは、元の文書上での行の長さと殆ど変わらないことになり、情報が埋め込まれていることの視認が困難となっている。すなわち、埋め込み情報の不可視性が高いと言える。
また、濃度の低い画像に情報を埋め込むと、複写を繰り返すことにより、情報を埋め込んだ画像の一部や画像そのものが消えてしまうことになる。これに対して、文書などに形成される文字列は、高い濃度で印刷されるので、複写を繰り返したときにも、文字そのものが消えてしまうことがない。また、複写を繰り返したために文字が消えることは、文書そのものの価値がなくなることであり、ここから、文書中の文字は、実質的に消えることはないと言え、このような文書中の文字列を使用することにより、埋め込み情報の耐複写性の向上を図ることができる。
次に、文書14又は文書14を複写して作成された文書14A(以下、文書14Aとする)からの埋め込み情報の復元を説明する。
文書14Aからの埋め込み情報の復元には、文書処理装置16を用いる。このときの文書処理装置16での処理の流れを図8に示しており、このフローチャートでは、最初のステップ140では、文書14Aの画像データ(文書データ)を読み込む。この文書データの読込みは、文書14Aをスキャナ24に装填して読み込むなどの方法を適用することができる。
なお、文書14Aの読込みは、スキャナ24などの画像読取り手段に限らず、デジタルカメラなどの撮像手段を用いることができる。また、埋め込み情報を復元する対象は、文書14Aのみならず、情報を埋め込んだ文書データ(文書14を出力可能とするデータ)に対しても可能であり、このときには、対象の文書データを記憶媒体やネットワークを介して読み込む。
文書データを読み込むと、ステップ142では、文書データから予め設定されているパラメータ値系列を抽出する。このときのパラメータ値は、文書14への情報の埋め込みに適用した文書体裁に関する値を適用し、例えば、文書14を作成するときに文字間隔をパラメータ値としているときには、文書14Aの文書データ上で、文字間隔をパラメータ値として抽出してパラメータ値系列を生成する。このときのパラメータ値系列の抽出は、前記した図4のステップ102と同様の処理を適用することができる。
これにより、図7(B)に示すように、文書14A上でのパラメータ値g(0)、g(1)、g(2)・・が系列的に抽出される。これにより、文書14Aでのパラメータ値系列g(k)(ただし、k=0、1、2、・・、L−1)が生成される。
図8の次のステップ144では、符号系列群を生成する。このとき、文書14への情報埋め込みに適用したのと同じ符号系列群pn(i、k)を生成する。なお、この符号系列群pn(i、k)の生成に換えて、文書処理装置12から符号系列群pn(i、k)を読み込むなどして取得するようにしても良く、これにより、簡単に、かつ、確実に文書14の作成に適用した符号系列群pn(i、k)を得ることができる。
ここで、文書14Aから抽出したパラメータ値系列g(k)は、
g(k)=d(k)+e(k)
=a(k)+δ・c(k)+e(k)
となっている。このとき、e(k)は、複写を繰り返すことにより生じる文字の太りや細り、あるいは文字上のノイズ、荒れによる誤差分及び、文字間隔(パラメータ値)を抽出するときの検出誤差としている(以下、誤差系列e(k)とする)。
ここから、ステップ146では、埋め込み情報の復元処理を行う。図9には、埋め込み情報の復元処理の概略を示しており、このフローチャートでは、最初のステップ150で初期設定(i=0)を行う。この後、ステップ152では、パラメータ値系列g(k)と符号系列群pn(i、k)との間の相関値の演算を行う。
ここで、パラメータ値系列g(k)とi番目の符号系列pn(i、k)との相関値R(i)は、数2に示す(2)式となる。
Figure 2006261974
ここから、相関値R(i)は、数3に示すように書き換えることができる。
Figure 2006261974
ここで、符号系列群pn(i、k)としては、群内の何れの二つの符号系列をとっても、相関値の絶対値が小さいものを使用しており、最終行である(3)式の第2項に着目すると、この第2項で大きな値をとるのは、i=jの時のみであり、それ以外は、i=jの時に比べて非常に小さい値となる。
すなわち、本実施の形態では、符号系列群pn(i、k)の一例としてm系列とそのシフトバージョンを適用しており、その間の相互相関値は、数4となることは周知である。
Figure 2006261974
ここから、数3に示す(3)式は、数5に示すように書き換えることができる。
Figure 2006261974
ここで、符号系列の系列長Lとしては、通常、大きな値(数百から数千)を用いるため、情報の埋め込み強度の定数δの値を適切に設定すれば、数5の(4)式では、i=jのときのみ第2項の絶対値が非常に大きな値(系列長L)となる。
これに対して、(4)式の第1項及び第4項は、パラメータ値系列a(k)と符号系列pn(i、k)の相互相関値及び、誤差系列e(k)と符号系列pn(i、k)との相互相関値を表しており、符号系列pn(i、k)は、シンボル値の平均値が小さい値で、かつ、ランダム性を有するものとしているため、自身以外の何れの信号に対しても、相関値が低い。このために、(4)式では、第1項及び第4項は、第2項と比較するとはるかに小さい値となる。
また、(4)式の第1項におけるパラメータ値系列a(k)は、情報を埋め込む前の文書(文書14B)上でのパラメータ値(文字間隔)を示しており、kによって様々な値を取るものであっても、符号系列pn(i、k)の持つ特性から低相関となる。
このために、情報埋め込みの対象としている元の文書14B上では、文字間隔が等間隔である必要がなく、埋め込み対象とする文書は、例えば、見た目が自然となるように文字の前後の間隔を調整するカーニングを施した文書(文書データ)であってもよいといえる。
一方、(4)式の第3項の絶対値は、(n−1)・δ以下となる。このとき、埋め込む情報のビット数であるnが、符号系列の系列長Lに比べて十分に小さい値であれば、第3項の絶対値は、第2項の絶対値に比べてはるかに小さい値となる。
このような(4)式の構成から、符号系列pn(i、k)の系列長Lが、埋め込む情報のビット数nに対して十分に大きな値であり、かつ、埋め込み強度の定数δを適切に設定すれば、第2項の絶対値は、第1項、第3項及び第4項の絶対値よりもはるかに大きくなる。
これにより、相関値R(i)は、数6の(5)式に近似することができ、相関値R(i)の符号から埋め込んでいる情報のビットごとの符号を判定することができる。
Figure 2006261974
ここから、図9のフローチャートでは、ステップ152で相関値R(i)を演算すると、ステップ154で、演算した相関値R(i)の符号を確認する。このときに、相関値R(i)が正であれば、ステップ154で肯定判定してステップ156へ移行し、該当する埋め込み情報b(i)を「1」に設定し、相関値R(i)が負であれば、ステップ154で否定判定してステップ158へ移行し、該当する埋め込み情報b(i)を「−1」に設定する。
また、ステップ160では、iがnに達していないかを確認し、達していないときには、ステップ160で肯定判定してステップ162へ移行し、iをインクリメントして、ステップ152へ戻る。
これにより、埋め込み情報b(i)が復元される。
このようにして埋め込み情報を復元すると、図8のフローチャートでは、ステップ148へ移行して、埋め込み情報を出力する。このときの出力方法としては、印刷処理であっても良く、CRT、LCDなどの表示デバイスに表示して良く、さらには、埋め込み情報のデジタルデータとして、各種の記憶媒体に格納するものであっても良く、さらには、ネットワーク等を介して、所定の宛先へ転送するなどの出力方法を適用することができる。
このように、文書処理装置16では、文書処理装置12で所定の情報を埋め込んで作成された文書14ないし文書14の文書データから、埋め込んだ情報を的確に復元することができる。
また、文書処理装置16では、文書14が繰返し複写されて作成されたために、文字の太りや細りなどの画質低下が生じてしまった文書14Aからも、埋め込まれている情報を的確に復元することができる。
次に、所定の情報を埋め込んだ文書14の作成及び、文書14に基づいた文書14Aから、埋め込んでいる情報の復元処理を、具体例を示して説明する。
対象文書に埋め込む情報の不可視性を高めるためには、埋め込み強度を示す定数δを小さな値に設定する必要があり、定数δを小さくしても埋め込み情報の復元を可能とするためには、符号系列の系列長Lを数百から数千とする必要があるが、ここでは、説明を簡略化するために、符号系列の系列長Lを15(L=15)とし、埋め込み情報b(i)を2ビットとした具体例を説明する。
このときの埋め込み情報b(i)及び、符号系列群pn(i、k)を数7に示すように設定する。
Figure 2006261974
このような埋め込み情報b(i)及び符号系列群pn(i、k)から、符号化情報系列c(k)は、数8に示すものとなる。
Figure 2006261974
このようにして得られる符号化情報系列c(k)に基づいて、元の文書データ上の文字間隔のパラメータ値であるパラメータ値系列a(k)を修正する。なお、元の文書データ上での文字間隔は、等間隔である必要はなく、また、文字列が自然に見えるように前後の文字に合わせて文字間隔を調整するカーニングを施すと、文字間隔は必ずしも等間隔とはならないが、ここでは、説明を簡略化するために文字間隔を等間隔として、文字間隔の系列であるパラメータ値系列a(k)を、a(k)=20としておく。
また、符号系列の系列長Lを数百から数千とすれば、情報の埋め込み強度となる定数δを極めて小さい値とすることにより、埋め込み情報の不可視性を高くすることができる。しかし、ここでは系列長LをL=15としているので、埋め込み強度を示す定数δを、大きな値に設定する必要があり、ここから、定数δをδ=3に設定する。
これらの前提を元に修正パラメータ値系列d(k)を求めると、修正パラメータ値系列d(k)は、数9に示すようになる。
Figure 2006261974
この後、文書上の文字間隔を、修正パラメータ値系列d(k)となるように文書データを修正し、修正した文書データに基づいて印刷処理を行うことにより、所定の情報を埋め込んだ文書14が得られる。
一方、この文書14を複写することにより得られる文書14Aから、埋め込まれている情報を復元するときには、文書14Aの画像読取りを行って、文書データを生成した後、この文書データから文字間隔であるパラメータ値系列g(k)を抽出する。このときのパラメータ値系列g(k)には、誤差系列e(k)が含まれていると想定することができる。
このときの誤差系列e(k)として例えば数10に示すものを想定すると、パラメータ値系列g(k)は、数11に示すようになる。パラメータ値系列g(k)及び符号情報系列群pn(i、k)から、埋め込まれているnビット(ここでは、2ビット)の埋め込み情報b(i)を復元する。
Figure 2006261974
Figure 2006261974
埋め込み情報b(i)の復元は、先ず、埋め込み情報b(0)を得るために、パラメータ値g(k)と、符号情報系列pn(0、k)から、相関値R(0)を演算する(数12参照)。
Figure 2006261974
ここで、相関値R(0)=27(R(0)>0)であるので、b(0)=1となる。
また、埋め込み情報b(1)は、数13に示すように、パラメータ値g(k)と符号情報系列pn(1、k)から、R(1)=−61(R(1)<0)となる。
Figure 2006261974
したがって、埋め込み情報b(1)=−1が得られ、文書14に埋め込んだ情報が、文書14Aから正確に復元される。
すなわち、文書14を複写することにより画質が低下してしまった文書14Aであったときでも、埋め込みに用いたパラメータ値系列g(k)を抽出できれば、埋め込まれている埋め込み情報b(i)の適正な復元が可能となる。また、パラメータ値として、文書上の文字列の体裁に関する情報を用いており、パラメータ値の抽出が困難となるほど画質が低下している状態では、文書内の文字の判別も困難なときであり、ここから、内容が有効な文書14Aであれば、埋め込み用に用いたパラメータ値系列g(k)の抽出が可能となる。さらに、埋め込み情報を符号化することにより冗長性を高めているため、埋め込んでいる情報を的確に復元することができる。
なお、本実施の形態では、文書内の文字列の体裁に関する情報として、文字間隔をパラメータとして説明したが、文字間隔に限らず、単語間隔、行間隔、文字高さ、文字幅などを適用することができる。また、文字列の体裁に関する情報として、文字の傾き、文字の回転、文字の重心等を適用しても良い。
さらに、パラメータとしては、上記の何れか一つに限らず、例えば、文字間隔と文字高さなど、複数のパラメータを組み合わせてもよく、これにより、より多くの情報を、不可視性を保持させ、かつ復元性を高くして、文書に埋め込むことができる。
また、以上説明した本実施の形態は、本発明の一例を示すものであり、本発明の構成を限定するものではない。例えば、本実施の形態では、文書処理装置12、16によって構成した文書処理システム10を例に説明したが、本発明は、任意の構成の情報処理装置を用いて、該情報処理装置に、所定のハードウェアないし、ソフトウェア(プログラム)を組み込むことにより構成することができる。
本実施の形態に適用した文書処理システムの概略構成図である。 情報を埋め込んだ文書作成に用いる文書処理装置の要部の概略構成を示すブロック図である。 情報復元に用いる文書処理装置の要部の概略構成を示すブロック図である。 文書作成の概略を示す流れ図である。 埋め込み情報の符号化処理の概略を示す流れ図である。 埋め込み対象とする文書の一例を示す概略図である。 (A)は情報を埋め込んだ文書の要部を示す概略図、(B)は情報復元を行う文書の要部を示す概略図である。 埋め込み情報の復元するときの処理の概略を示す流れ図である。 埋め込み情報を復元するときの処理の概略を示す流れ図である。
符号の説明
10 文書処理システム
12 文書処理装置(情報埋め込み装置)
14 文書
14A 文書
14B 文書
16 文書処理装置(情報復元装置)
18 情報処理装置(情報埋め込み装置)
20 情報処理装置(情報復元装置)
22 プリンタ
24 スキャナ
26 文書入力部
28 埋め込み情報入力部
30 パラメータ値系列抽出部
32 符号系列群生成部
34 情報符号化部(符号化情報系列生成部)
36 修正パラメータ値生成部
38 文書修正部
40 文書出力部
42 文書読込み部
44 パラメータ値系列抽出部
46 符号系列群生成部
48 埋め込み情報復元部
52 情報出力部

Claims (10)

  1. 文字列が形成される文書を、情報埋め込み対象として所定の埋め込み情報を埋め込む情報埋め込み方法であって、
    前記埋め込み情報に基づいた各シンボルを符号化した符号系列を生成し、
    該符号系列を前記埋め込み対象の文書の文字列の体裁に関する情報に基づいたパラメータ値に系列的に埋め込むことを特徴とする情報埋め込み方法。
  2. 前記埋め込み対象の文書の文書データから文字列の体裁に関する情報に基づいてパラメータ値を系列的に抽出してパラメータ値系列を生成すると共に、
    前記埋め込み情報に基づいた各シンボルを符号化する符号系列による符号系列群を生成して、生成した符号系列群の符号系列に基づいて埋め込み情報の各シンボルを符号化した符号化情報系列を生成し、
    前記符号化情報系列と前記パラメータ値系列を合成して修正パラメータ値系列を生成し、該修正パラメータ値系列を前記パラメータ値系列に置換して、前記埋め込み情報を埋め込んだ文書の文書データを生成することを特徴とする請求項1に記載の情報埋め込み方法。
  3. 前記符号系列群が、互いに直交又は略直交し、かつ、ランダム性を有する符号系列となっていることを特徴とする請求項1又は請求項2に記載の情報埋め込み方法。
  4. 前記符号系列群内の各符号系列に対して、前記埋め込み情報の1シンボル分を割り当てることを特徴とする請求項1から請求項3の何れか1項に記載の情報埋め込み方法。
  5. 前記文書体裁に関するパラメータとして、文字間隔、単語間隔、行間隔、文字高さ、文字幅、文字の傾き、文字の重心、文字の回転角の何れか少なくと一つを用いることを特徴とする請求項1から請求項4の何れか1項に記載の情報埋め込み方法。
  6. 文字列が形成される文書に、該文書の文書データから文字列の体裁に関する情報に基づいたパラメータ値系列を、所定の符号系列群の各符号系列によって埋め込み情報の各シンボルを符号化した符号化情報系列に基づいて修正することにより埋め込み情報が埋め込まれた文書又は文書データから、前記埋め込み情報を復元する情報復元方法であって、
    前記文書又は前記文書データから前記パラメータ値系列を抽出し、抽出した前記パラメータ値系列と前記符号系列群の各符号系列の相関値を求めることにより、前記埋め込み情報を復元することを特徴とする情報復元方法。
  7. 文字列が形成される文書を、情報埋め込み対象として所定の埋め込み情報を埋め込む情報埋め込み装置であって、
    前記埋め込み対象の文書の文書データを入力する文書入力手段と、
    前記文書データから文字列の体裁に関する情報をパラメータとするパラメータ値を系列的に抽出してパラメータ値系列を生成するパラメータ値生成手段と、
    前記埋め込み情報を形成するシンボルを各シンボルごとに符号化する符号系列による符号系列群を生成する符号系列群生成手段と、
    前記埋め込み情報に応じたシンボルのそれぞれを前記符号系列群の符号系列によって符号化して符号化情報系列を生成する符号化情報系列生成手段と、
    前記符号化情報系列と前記パラメータ値系列を合成してパラメータ値系列に応じた修正パラメータ値系列を生成する修正パラメータ値系列生成手段と、
    前記修正パラメータ値系列を前記パラメータ値系列に置換することにより前記文書データを修正して前記埋め込み情報を埋め込んだ文書の文書データを生成する文書修正手段と、
    を含むことを特徴とする情報埋め込み装置。
  8. 前記符号系列群生成手段が、互いに直交又は略直交し、かつ、ランダム性を有する符号系列を生成することを特徴とする請求項7に記載の情報埋め込み装置。
  9. 前記埋め込み情報が入力されると共に、入力された埋め込み情報を予め設定されているシンボルに置換する埋め込み情報入力手段を含むことを特徴とする請求項7又は請求項8に記載の情報埋め込み装置。
  10. 文字列が形成される埋め込み対象文書に、該対象文書の文書データから文字列の体裁に関する情報に基づいたパラメータ値系列を、所定の符号系列群の各符号系列によって埋め込み情報の各シンボルを符号化した符号化情報系列に基づいて修正することにより埋め込み情報が埋め込まれた文書又は文書データから、前記埋め込み情報を復元する情報復元装置であって、
    前記文書データ又は前記文書を読み込む文書読込み手段と、
    前記文書読込み手段によって読み込んだ文書データから、前記対象文書の前記パラメータ値系列に対する実際のパラメータ値系列を抽出する実パラメータ値系列抽出手段と、
    前記実パラメータ値系列抽出手段によって抽出した前記パラメータ値系列と、前記符号系列群の各符号系列の相関値を演算し、演算結果から前記埋め込み情報の各シンボルを判定することにより埋め込み情報を復元する埋め込み情報復元手段と、
    を含むことを特徴とする情報復元装置。
JP2005075603A 2005-03-16 2005-03-16 情報埋め込み方法、情報復元方法、情報埋め込み装置及び情報復元装置 Pending JP2006261974A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005075603A JP2006261974A (ja) 2005-03-16 2005-03-16 情報埋め込み方法、情報復元方法、情報埋め込み装置及び情報復元装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005075603A JP2006261974A (ja) 2005-03-16 2005-03-16 情報埋め込み方法、情報復元方法、情報埋め込み装置及び情報復元装置

Publications (1)

Publication Number Publication Date
JP2006261974A true JP2006261974A (ja) 2006-09-28

Family

ID=37100729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005075603A Pending JP2006261974A (ja) 2005-03-16 2005-03-16 情報埋め込み方法、情報復元方法、情報埋め込み装置及び情報復元装置

Country Status (1)

Country Link
JP (1) JP2006261974A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015126380A (ja) * 2013-12-26 2015-07-06 凸版印刷株式会社 配布文書管理方法及びそのプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015126380A (ja) * 2013-12-26 2015-07-06 凸版印刷株式会社 配布文書管理方法及びそのプログラム

Similar Documents

Publication Publication Date Title
JP4310288B2 (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
JP5253352B2 (ja) 文書内にメッセージを埋め込む方法、及び距離場を使用して文書内にメッセージを埋め込む方法
US20040001606A1 (en) Watermark fonts
JP2010016816A (ja) 重要コンテンツを認証データに保持した状態で文書を自己認証する方法
JP2003101762A (ja) 透かし情報埋め込み装置,及び,透かし情報検出装置
JP2006345017A (ja) 画像処理方法および画像処理装置および画像処理プログラムおよび記録媒体
US8014559B2 (en) Information embedding apparatus, information embedding method, information extracting apparatus, information extracting method, computer program product
JP2009230748A (ja) 認証情報を格納するための、印刷文書上の二次元バーコードスタンプの作成と配置
JPWO2007049340A1 (ja) 電子透かしの埋め込み及び検出
JP2006050551A (ja) 画像処理装置及びその方法、並びにプログラム及び記憶媒体
CN102027526A (zh) 使用间距编码在文本文档中嵌入隐秘数据的方法和系统
JP4837101B2 (ja) 電子透かし埋め込み装置、電子透かし検出装置およびプログラム
JP3930502B2 (ja) 品質調整システムおよび透かし品質検査装置
CN109800547B (zh) 一种用于word文档保护和分发跟踪的信息快速嵌入和提取的方法
JP4613807B2 (ja) 文書処理装置および文書処理方法
US9075961B2 (en) Method and system for embedding data in a text document
JP2006261974A (ja) 情報埋め込み方法、情報復元方法、情報埋め込み装置及び情報復元装置
Varna et al. Data hiding in hard-copy text documents robust to print, scan and photocopy operations
JP2008085579A (ja) 情報埋め込み装置、情報読み取り装置、情報埋め込み方法、情報読み取り方法、およびコンピュータプログラム
JP3545782B2 (ja) 極秘文書の機密保持方法
CN110378829B (zh) 信息提供和水印提取的方法、装置及设备
JP2007174181A (ja) 文書処理装置、文書処理方法および文書処理プログラム
JP2003533919A (ja) 音符のセット内に秘密情報を一体化するための方法
JP4871793B2 (ja) 情報処理装置及びその方法
JP2004247883A (ja) 画像処理方法