JP2007150606A - 文書処理装置および文書処理方法 - Google Patents
文書処理装置および文書処理方法 Download PDFInfo
- Publication number
- JP2007150606A JP2007150606A JP2005341139A JP2005341139A JP2007150606A JP 2007150606 A JP2007150606 A JP 2007150606A JP 2005341139 A JP2005341139 A JP 2005341139A JP 2005341139 A JP2005341139 A JP 2005341139A JP 2007150606 A JP2007150606 A JP 2007150606A
- Authority
- JP
- Japan
- Prior art keywords
- information
- sequence
- parameter value
- partial
- code sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Editing Of Facsimile Originals (AREA)
- Record Information Processing For Printing (AREA)
- Storage Device Security (AREA)
- Image Processing (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】入力された文書データから文字列における文書体裁に関するパラメータ値系列をパラメータ値系列抽出部301にて抽出し、文書データに埋め込む付加情報をシフト量として、符号系列生成部302で生成された所定の符号系列をかかるシフト量だけシフトさせた符号化情報系列を情報符号化部303にて生成し、修正パラメータ値系列生成部304にてパラメータ値系列に符号化情報系列を合成した修正パラメータ値系列を生成し、文書修正部305にてかかる修正パラメータ値系列により文書データを修正する。
【選択図】図2
Description
それに対して、電子文書は一旦紙の上に印刷され、紙文書化されてしまうと、その複写や社外への持ち出しを防止する術が無い。そのため、電子文書に比べると紙文書の機密漏洩対策の進展は遅れが目立っているのが現状である。
このような追跡情報においては、不可視性およびコンテンツとの不可分性が高いことが望まれる。例えば、追跡情報をバーコードのような可視性の高い記録方法で記録すると、紙文書上のどこに追跡情報が記録されているかが明らかであるため、記録情報を解読・改ざんされる恐れが高くなる。また、バーコードはコンテンツと可分であるため、バーコード部を切り取ったり塗りつぶしたりすることにより、流出元の特定を容易に妨害することが可能である。
また、追跡情報は繰り返しコピーに対する耐性が高いものであることも望まれる。流出した機密情報は原本のまま流通するだけでなく、それをコピーしたものや、さらに二次コピー、三次コピーが出回ることも考えられるからである。
例えば、文字位置をシフトして文字の前後の空白長を変化させることにより情報を埋め込む方法が存在する(例えば、特許文献1参照)。この方法では、情報ビットを埋め込む対象となる文字の前後の空白長をP、Sとした場合、情報ビットが1ならP>S、ゼロならP<Sとなるよう文字位置をシフトさせることにより情報を埋め込む。この操作を、埋め込み情報のビット数に相当する数の文字に対して行なうことにより、文書に付加情報を埋め込む。埋め込みの際、句読点前後の文字位置をシフトさせると目に付きやすいため、句読点周辺の文字は情報埋め込みに使用しないなどの工夫もなされている。
例えば、特許文献1のような文字位置のシフト量に情報を埋め込む方法では、繰り返しコピーによる画質劣化によって文字間の空白長が変化してしまい、埋め込んだ情報が正しく復元できない場合が生じる。これを避けるには文字位置のシフト量を大きくして、空白長が多少変化しても文字前後の空白長の大小関係が維持されるようにする必要がある。ところが、文字位置のシフト量を大きくすると、文書に加えた変更が視覚的に明らかになってしまい、埋め込み情報の不可視性が損なわれることとなる。
また、文字列が見た目に自然に見えるように前後の文字に合わせて文字間隔を調節した、所謂カーニングの施された文書では、文字間隔が一定ではないために、元々P>Sの関係にあった文字前後の空白長を、P<Sとなるように変更しようとすると文字位置を大きくシフトする必要があり、やはり不可視性を損なうという問題が生じる。
また、「の」、「は」などの埋め込み対象文字の出現頻度が小さい文書には情報を埋め込むことができないという問題もある。
また他の目的は、繰り返しコピーに対するロバスト性の高い付加情報の記録を可能とすることにある。
なお、ここでの文書データには、PostScript等のページ記述言語やワードプロセッサ出力形式の電子文書データ、スキャナやデジタルカメラにより撮影された文書のラスタデータ等が含まれる。また、文字列における文書体裁には、文字間隔、文字位置、単語間隔、行間隔、文字高さ、文字幅、文字の傾き等が含まれる。以下、同様である。
この場合に、符号系列生成部で生成された所定の符号系列と同一の符号系列とかかる符号系列のシフトバージョンとを生成する符号系列群生成部と、パラメータ系列抽出部にて抽出されたパラメータ値系列を分割して複数の部分パラメータ値系列を生成する部分パラメータ値系列生成部と、部分パラメータ値系列生成部にて生成された部分パラメータ値系列と、符号系列群生成部により生成された符号系列およびかかる符号系列のシフトバージョンとの相関値に基づき、部分パラメータ値系列毎に埋め込まれた付加情報を復元し、さらに復元された部分パラメータ値系列毎の付加情報を連結して文書データに埋め込まれた情報を復元する情報復元部とをさらに備えたことを特徴とすることもできる。
この場合に、符号系列生成部で生成された部分付加情報毎の固有の符号系列と同一の符号系列と、符号系列のシフトバージョンとを生成する符号系列群生成部と、パラメータ系列抽出部にて抽出されたパラメータ値系列を分割して複数の部分パラメータ値系列を生成する部分パラメータ値系列生成部と、部分パラメータ値系列生成部で生成された部分パラメータ値系列と、符号系列群生成部で生成された符号系列およびかかる符号系列のシフトバージョンとの相関値に基づき、部分パラメータ値系列毎に埋め込まれた付加情報を復元し、さらにかかる部分パラメータ値系列毎に埋め込まれた付加情報を連結して文書データに埋め込まれた情報を復元する情報復元部とをさらに備えたことを特徴とすることもできる。
この場合に、入力された文書データから文字列における文書体裁に関するパラメータ値系列を抽出するパラメータ系列抽出部と、パラメータ系列抽出部にて抽出されたパラメータ値系列を分割して複数の部分パラメータ値系列を生成する部分パラメータ値系列生成部と、符号系列生成部で生成された所定の符号系列と同一の符号系列とかかる符号系列のシフトバージョン、および符号化情報系列に同期させた同期用符号と同一の符号系列とかかる符号系列のシフトバージョンとを生成する符号系列群生成部と、部分パラメータ値系列生成部で生成された部分パラメータ値系列と、符号系列群生成部で生成された符号系列およびかかる符号系列のシフトバージョンとの相関値に基づき、部分パラメータ値系列毎に埋め込まれた付加情報を復元するとともに、パラメータ値系列と、同期用符号系列およびかかる符号系列のシフトバージョンとの相関値に基づき、パラメータ値系列毎に埋め込まれた同期用符号系列の位置を検出し、検出された同期用符号系列位置と部分パラメータ値系列との位置関係を検出して部分パラメータ値系列の付加情報の順番を決定し、部分パラメータ値系列の付加情報をかかる順番に従って連結して文書データに埋め込まれた付加情報を復元する情報復元部とをさらに備えたことを特徴とすることもできる。
ここで、付加情報を分割して複数の部分付加情報を生成し、部分付加情報毎の部分符号化情報系列を生成し、さらにかかる部分符号化情報系列を連結して符号化情報系列を生成し、かかる符号化情報系列を用いて文書データを修正することを特徴とすることもできる。
ここで、抽出されたパラメータ値系列を分割して複数の部分パラメータ値系列を生成し、生成された部分パラメータ値系列と、符号系列およびかかる符号系列のシフトバージョンとの相関値に基づき、部分パラメータ値系列毎の付加情報を復元し、さらに復元された部分パラメータ値系列毎の付加情報を連結して文書データに埋め込まれた付加情報を復元することを特徴とすることもできる。
[実施の形態1]
図1は本実施の形態が適用される文書処理装置1の構成を示したブロック図である。図1に示す文書処理装置1は、付加情報の埋め込み対象となる文書データ等を処理部30に入力する第1文書入力部10、付加情報の埋め込まれたラスタデータ等を処理部30に入力する第2文書入力部20、第1文書入力部10から入力された文書データ等に埋め込むべき付加情報を入力する埋め込み情報入力部40、第1文書入力部10から入力された文書データ等に対して、埋め込み情報入力部40から入力された付加情報を埋め込む処理、または第2文書入力部20から入力されたラスタデータ等から埋め込まれた付加情報を復元する処理を実行する処理部30、処理部30により付加情報の埋め込み処理が施された文書データ等を所定の形式で出力する文書出力部50、処理部30により復元された付加情報を出力する情報出力部60を備えている。
文書処理装置1における情報埋め込み処理は、処理部30内に構築された情報埋め込み処理部300で実行される。図2は、情報埋め込み処理部300の機能構成を説明するブロック図である。図2に示したように、情報埋め込み処理部300は、パラメータ値系列抽出部301、符号系列生成部302、情報符号化部303、修正パラメータ値系列生成部304、文書修正部305を備えて構成されている。
符号系列生成部302は、埋め込み情報入力部40から入力される付加情報を符号化した符号化情報を生成するためのものであり、単一の符号系列を生成する。
情報符号化部303は、埋め込み情報入力部40から入力された付加情報を、符号系列生成部302により生成された符号系列によって符号化した符号化情報系列を生成するものである。ここでは、入力された情報に応じて符号系列のシフト量を変えたものを符号化情報系列とする。
文書修正部305は、第1文書入力部10から入力された文書の体裁を、修正パラメータ値系列生成部304により求められた修正パラメータ値系列の各シンボル値に応じて修正するものである。そして、ここでは、修正後の文書上の文字列から得られる文字間隔、文字位置、単語間隔、行間隔、文字高さ、文字幅、文字の傾き等の、文書体裁に関するパラメータ値が、修正パラメータ値系列の各シンボル値に等しくなるよう修正される。
次のパラメータ値系列抽出ステップ(S102)において、パラメータ値系列抽出部301は、第1文書入力部10から入力された電子文書データや文書のラスタデータを解析し、文書上の文字列を構成する各文字間の間隔を求め、これを文書体裁に関するパラメータ値の系列とする。
具体的には、図4に示したように、第1文書入力部10から入力された文書上の文字列を構成する各文字間の間隔を並べた系列を、この文書のパラメータ値系列a(k)、(k=0,1,2,・・・,L−1)とする。文字間隔としては文書上のどの位置における文字間隔を用いても良いが、本実施の形態では、文書先頭からL個分(L≧2n)の文字間隔を用いるものとする。また、文書上の1行から得られる文字間隔数がL個に満たない場合は、続く複数行から得られる文字間隔パラメータを連結して系列長Lのパラメータ値系列を得るものとする。
また、電子文書データがスキャナやデジタルカメラにより撮影された文書のラスタデータである場合は、文字認識の前処理として一般的に行われる文字の切り出し処理を行い、切り出された各文字矩形間の距離を文字間隔とすることができる。文字の切り出し処理についても特定の方法に限定されるものではなく、一般に用いられる適当な手法を用いることが可能である。
なお、本実施の形態では、情報を埋め込むための文書体裁に関するパラメータとして文字間隔を用いるが、パラメータ値としては文字位置、単語間隔、行間隔、文字高さ、文字幅、文字の傾き、さらにはこれらのいくつかを組み合わせたものを利用することも可能である。
符号系列生成部302により生成される符号系列は、シンボル値の平均が小さな値で、ランダム性を有するものが用いられる。また、生成される符号系列は図5に示すような鋭い自己相関特性を持つものとする。このような性質を有する公知の符号系列としてはm系列があるが、符号系列生成部302により生成される符号系列はこれらに限るものではなく、上記の性質を有するものであれば良い。
ここでは、符号系列生成部302により生成される符号系列として、1周期の系列長がLのm系列を用いる例について記す。ただし、系列長Lは2n以上とする。また、符号系列をpn(k)で表し、そのシンボル値は±1のいずれかをとるものとする。すなわち、符号系列pn(k)は、次式(1)で表される。なお、以下の記載において、式(1)から式(26)は、[数1]から[数26]に対応するものとする。
また、ここで注目すべきは、本実施の形態では、nビットの情報を埋め込むに際して、文字間隔の系列a(k)の変動幅を [−δ,δ]に納めることができることである。つまり、nビットの情報を埋め込むに際して、それに対応したn個の符号化情報系列を多重化する従来の方法では、文字間隔の系列a(k)を[−nδ,nδ]の範囲で変動させる必要があった。これに対して、本実施の形態では文字間隔の系列a(k)の変動幅を従来の1/nにすることができるため、埋め込み情報の不可視性を大幅に改善することが可能となる。
一方、文書データがスキャナやデジタルカメラにより撮影された文書のラスタデータである場合は、パラメータ値系列抽出ステップ(S102)で行なった文字の切り出し処理の結果を利用し、切り出された各文字矩形間の距離が修正パラメータ値系列d(k)の各シンボル値に等しくなるよう、各文字画像を再配置する。
また上述したように、本実施の形態で用いられる符号系列は、シンボル値の平均が小さな値で、ランダム性を有するものである。このことを前提に式(3)を眺めると、各文字の間隔a(k)はランダムに広げられたり狭められたりし、かつ、ある一定の範囲(例えば1行)を見れば、修正量の和は小さな値になることがわかる。つまり、修正後の各行の長さは元文書の行の長さとほとんど変わらないため、情報埋め込み処理の不可視性を高めることが可能となる。
さらに本実施の形態の情報埋め込み処理方法は、文字画像そのものに情報を埋め込むものである。そのため、繰り返しコピーをとった場合でも、文字そのものが消えてしまわない限り埋め込み情報が保存され、繰り返しコピーによる画質劣化に対して堅牢である(ロバスト性が高い)という特長も併せ持っている。
本具体例では、埋め込むべき情報bを3ビットの情報、その値を(b=5)とし、符号系列の系列長Lを15とする簡単な例を示す。なお、本来、埋め込み情報の不可視性を高めるためには、符号系列の系列長Lを数百から数千に設定する必要があるが、ここでは理解を容易にするために、L=15とする。すなわち、本具体例では次式(4)を用いるものとする。
また、情報の埋め込み強度は、δ=2とする。符号系列の系列長Lを数百から数千とすれば、情報の埋め込み強度として小さな値を設定し、埋め込み情報の不可視性を高めることができる。しかし、この例では系列長L=15と小さいので、情報の埋め込み強度はある程度大きな値にする必要がある。
これらの前提の下に、修正パラメータ値系列d(k)を式(3)に従って求めると次式(7)のようになる。
文書処理装置1における埋め込み情報復元処理は、処理部30内に構築された埋め込み情報復元処理部350で実行される。図8は、埋め込み情報復元処理部350の機能構成を説明するブロック図である。図8に示したように、埋め込み情報復元処理部350は、パラメータ値系列抽出部301、符号系列群生成部307、埋め込み情報復元部306を備えて構成されている。
符号系列群生成部307は、上述した情報埋め込み処理部300で生成されたものと同一の符号系列と、そのシフトバージョンを生成するためのものであり、符号系列の生成部は情報埋め込み処理部300と同一の構成をとることができる。
埋め込み情報復元部306は、パラメータ値系列抽出部301により抽出された、付加情報の埋め込まれた文書の文書体裁に関するパラメータ値系列から、埋め込み情報を復元するためのものである。このパラメータ値系列に対して、符号系列群生成部307により生成されたそれぞれの符号系列との間で復号処理を行うことにより、埋め込まれた付加情報を復元する。
次のパラメータ値系列抽出ステップ(S202)において、第2文書入力部20から得られた文書のラスタデータを解析し、文書上の文字列を構成する各文字間の間隔を求め、これを文書体裁に関するパラメータ値の系列とする。
本実施の形態では、付加情報の埋め込まれた紙に出力された文書の画像から埋め込み情報を復元する場合について説明するが、紙に出力する前のPostScript等のページ記述言語やワードプロセッサ出力形式の電子文書データを入力データとしても良い。いずれの場合についても、文字間隔系列の抽出方法は上述した情報埋め込み時と同様であるため、説明は省略する。
図10のフローチャートに示したように、符号系列群生成部307では、初期設定が行われた後(S301)、上述した情報埋め込み処理部300で生成されたものと同一の符号系列と、そのシフトバージョンが生成され、その各々と文字間隔の系列a’(k)との相関値が求められる(S302)。文字間隔の系列a’(k)とシフト量iを持つ符号系列pn(k+i)との相関値R(i)は次式(9)のように書ける。
このことを説明するため、式(9)を式(2)と式(8)とを用いて次式(10)のように書き換える。
それに対して、式(11)の最終行の第1項と第3項とはそれぞれ、文字間隔の系列および誤差成分と、符号系列との相互相関値を表しており、第2項と比較するとその絶対値ははるかに小さな値となる。なぜなら既に述べたように、符号系列はシンボル値の平均が小さな値で、ランダム性を有するため、自身以外のいかなる信号とも低相関となるからである。
さらに第1項は、情報埋め込みの対象となる元文書の文字間隔が等間隔である必要はなく、文字列が見た目に自然に見えるように前後の文字に合わせて文字間隔を調節した、所謂カーニングの施されたものであっても良いことを示している。第1項におけるa(k)は元文書の文字間隔の系列を表しているが、これがkにより様々な値をとるものであっても、符号系列の持つ上記の性質により低相関となるためである。
このようにして埋め込み情報復元部306により復元された埋め込み情報は、情報出力部60から出力される(S205)。
本具体例では、上述した情報埋め込み処理の具体例で得られた情報埋め込み済みの文書を繰り返しコピーし、画質劣化の発生した文書から、元の3ビットの情報を復元する手順を示す。
そこで、この誤差成分e(k)が次のようなものであったとする。
図12に示した結果より、シフト量が5の時に最大相関値が得られ、3ビットの埋め込み情報b=5が復元された。
また、情報が埋め込まれた文書画像、または電子文書データを入力し、入力された文書上の文字列から文書体裁に関するパラメータ値系列を求める。次に、このパラメータ値系列と、所定の符号系列およびそのシフトバージョンとの間の相関値を求める。そして、最大相関値が得られた符号系列のシフト量を埋め込んだ情報とし、情報を復元している。
また、付加情報は文書上の文字列から得られる文字間隔、文字位置、単語間隔、行間隔、文字高さ、文字幅等、文書体裁に関する文書コンテンツ自体のパラメータ値に直接埋め込まれるため、文書コンテンツと不可分であり、情報の改ざん・除去を困難にすることができる。
さらに、符号系列による復号処理の結果、文書体裁に関するパラメータ値や繰り返しコピーに起因する画像劣化成分など、付加情報以外の成分は大幅に低減される。したがって、カーニング処理の施された文書や、繰り返しコピーした紙文書からも安定して埋め込み情報を復元することができる。
実施の形態1では、情報埋め込み処理部300において、nビットの埋め込み情報bを1つの符号系列pn(k)で符号化した符号化情報系列c(k)を生成し、これを修正パラメータ値系列生成部304により文書体裁に関するパラメータ値の系列a(k)に埋め込む処理を行なう場合について説明した。実施の形態2では、より多ビットの情報を埋め込む場合であって、埋め込み情報bを複数の部分埋め込み情報系列に分割し、それぞれの部分埋め込み情報系列を符号化し、これを連結したものを符号化情報系列c(k)として情報埋め込み処理を行なう場合について説明する。なお、実施の形態1と同様な構成については同様な符号を用い、ここではその詳細な説明を省略する。
これに対して、実施の形態1のように単一の符号系列を用いる場合は、系列長m×Lのパラメータ値系列に対して用いることのできる符号系列の長さはm×Lとなるため、この符号系列が表現できる情報は最大log2m×L=log2m+log2Lビットとなる。
m≧2に対しては常にmlog2L≧(log2m+log2L)となるため、本実施の形態のように埋め込み情報を部分系列に分解することにより、同じ長さのパラメータ値系列に、より多くの情報を埋め込むことが可能となる。
実施の形態2では、情報埋め込み処理部300において、埋め込み情報bを複数の部分埋め込み情報系列に分割して、それぞれの部分符号化情報系列cq(k)を求め、これらを連結して得た系列長m×Lの符号化情報系列c(k)をパラメータ値の系列a(k)に埋め込む処理を行なう場合について説明した。実施の形態3では、部分符号化情報系列を連結する代わりに、部分符号化情報系列を多重化することにより系列長Lの符号化情報系列c(k)を生成して、情報埋め込み処理を行なう場合について説明する。なお、実施の形態1と同様な構成については同様な符号を用い、ここではその詳細な説明を省略する。
したがって、パラメータ値の系列a’(k)と符号系列群内の各符号系列との相関値を、シフト量を変えながら求め、最大相関が得られるシフト量imaxを求めれば、bq=imaxとして部分埋め込み情報系列bqを復元することができる。これらを連結して、系列長m×nの埋め込み情報b(式(23))を復元することができる。
実施の形態2では、情報埋め込み処理部300において、埋め込み情報bを複数の部分埋め込み情報系列に分割して、それぞれの部分符号化情報系列cq(k)を求め、これらを連結して得た系列長m×Lの符号化情報系列c(k)をパラメータ値の系列a(k)に埋め込む処理を行なう場合について説明した。本実施の形態では、実施の形態2のようにして求めた系列長m×Lの符号化情報系列c(k)を、さらに周期的に繰り返して、文書体裁に関するパラメータ値の系列a(k)に埋め込む処理を行なう場合について説明する。なお、実施の形態1と同様な構成については同様な符号を用い、ここではその詳細な説明を省略する。
実施の形態2での手順に従えば、ここから3種類の部分埋め込み情報系列ba、bb、bcを復元することができるが、それらが部分埋め込み情報系列b0、b1、b2のどれに対応するかを判別することはできない。したがって、埋め込んだ情報bは次式(25)に示すように3通りの可能性を持つ。
そこで、本実施の形態では、図14に示すような同期用符号を、周期的に符号化情報系列c(k)に多重化してパラメータ値系列に埋め込む。同期用符号はシンボル値の平均が小さな値で、ランダム性を有し、かつ図5に示すような鋭い自己相関特性を持つものとする。
次に、同期用符号のシフト量を変えながら最大相関が得られる位置を検出する。同期用符号は図5に示すような鋭い自己相関特性を持つため、シフトゼロの位置でのみ大きな相関値を発生する。従って、この位置からc0、c1、c2の順に部分符号化情報系列が配置されていることがわかるため、次のようにして埋め込み情報b(式(26))を復元することができる。
また、検出される部分埋め込み情報系列の正しい順序を、誤り検出ビット等を付加することなく知ることができるため、より多くの情報を埋め込むことができる。
Claims (12)
- 文字列からなる文書データに付加情報を埋め込むことが可能な文書処理装置であって、
入力された前記文書データから前記文字列における文書体裁に関するパラメータ値系列を抽出するパラメータ系列抽出部と、
前記文書データに埋め込む付加情報を入力する情報入力部と、
所定の符号系列を生成する符号系列生成部と、
前記情報入力部から入力された前記付加情報をシフト量として、前記符号系列生成部により生成された前記所定の符号系列を当該シフト量だけシフトさせた符号化情報系列を生成する情報符号化部と、
前記パラメータ値系列に前記符号化情報系列を合成した修正パラメータ値系列を生成する修正パラメータ系列生成部と、
生成された前記修正パラメータ値系列により前記文書データを修正する文書修正部と
を備えたことを特徴とする文書処理装置。 - 前記符号系列生成部で生成された前記所定の符号系列と同一の符号系列と当該符号系列のシフトバージョンとを生成する符号系列群生成部と、
前記パラメータ系列抽出部により抽出された前記パラメータ値系列と、前記符号系列群生成部により生成された前記符号系列および当該符号系列のシフトバージョンとの相関値に基づき、前記文書データに埋め込まれた付加情報を復元する情報復元部とをさらに備えたことを特徴とする請求項1記載の文書処理装置。 - 前記情報入力部から入力された前記付加情報を分割して複数の部分付加情報を生成する部分情報生成部をさらに備え、
前記情報符号化部は、前記部分情報生成部で生成された前記部分付加情報毎の部分符号化情報系列を生成し、さらに当該部分符号化情報系列を連結して前記符号化情報系列を生成することを特徴とする請求項1記載の文書処理装置。 - 前記符号系列生成部で生成された前記所定の符号系列と同一の符号系列と当該符号系列のシフトバージョンとを生成する符号系列群生成部と、
前記パラメータ系列抽出部にて抽出された前記パラメータ値系列を分割して複数の部分パラメータ値系列を生成する部分パラメータ値系列生成部と、
前記部分パラメータ値系列生成部にて生成された前記部分パラメータ値系列と、前記符号系列群生成部により生成された前記符号系列および当該符号系列のシフトバージョンとの相関値に基づき、当該部分パラメータ値系列毎に埋め込まれた付加情報を復元し、さらに復元された当該部分パラメータ値系列毎の付加情報を連結して前記文書データに埋め込まれた情報を復元する情報復元部とをさらに備えたことを特徴とする請求項3記載の文書処理装置。 - 前記情報入力部から入力された前記付加情報を分割して複数の部分付加情報を生成する部分情報生成部をさらに備え、
前記符号系列生成部は、前記部分情報生成部により生成された前記部分付加情報毎に固有の前記符号系列を生成し、前記情報符号化部は、当該部分付加情報毎の当該符号系列により当該部分付加情報毎の部分符号化情報系列を生成し、さらに当該部分符号化情報系列を多重化して前記符号化情報系列を生成することを特徴とする請求項1記載の文書処理装置。 - 前記符号系列生成部で生成された前記部分付加情報毎の固有の前記符号系列と同一の符号系列と、当該符号系列のシフトバージョンとを生成する符号系列群生成部と、
前記パラメータ系列抽出部にて抽出された前記パラメータ値系列を分割して複数の部分パラメータ値系列を生成する部分パラメータ値系列生成部と、
前記部分パラメータ値系列生成部で生成された前記部分パラメータ値系列と、前記符号系列群生成部で生成された前記符号系列および当該符号系列のシフトバージョンとの相関値に基づき、当該部分パラメータ値系列毎に埋め込まれた付加情報を復元し、さらに当該部分パラメータ値系列毎に埋め込まれた付加情報を連結して前記文書データに埋め込まれた情報を復元する情報復元部とをさらに備えたことを特徴とする請求項5記載の文書処理装置。 - 前記情報入力部から入力された前記付加情報を分割して複数の部分付加情報を生成する部分情報生成部をさらに備え、
前記情報符号化部は、前記部分情報系列生成部で生成された前記部分付加情報毎の部分符号化情報系列を周期的に反復して生成し、さらに当該部分符号化情報系列を連結して前記符号化情報系列を生成するとともに、当該符号化情報系列に同期させた同期用符号を生成し、前記修正パラメータ系列生成部は、当該同期用符号を前記修正パラメータ値系列に多重化させることを特徴とする請求項1記載の文書処理装置。 - 入力された前記文書データから前記文字列における文書体裁に関するパラメータ値系列を抽出するパラメータ系列抽出部と、
前記パラメータ系列抽出部にて抽出された前記パラメータ値系列を分割して複数の部分パラメータ値系列を生成する部分パラメータ値系列生成部と、
前記符号系列生成部で生成された前記所定の符号系列と同一の符号系列と当該符号系列のシフトバージョン、および前記符号化情報系列に同期させた同期用符号と同一の符号系列と当該符号系列のシフトバージョンとを生成する符号系列群生成部と、
前記部分パラメータ値系列生成部で生成された前記部分パラメータ値系列と、前記符号系列群生成部で生成された前記符号系列および当該符号系列のシフトバージョンとの相関値に基づき、当該部分パラメータ値系列毎に埋め込まれた付加情報を復元するとともに、前記パラメータ値系列と、前記同期用符号系列と当該符号系列のシフトバージョンとの相関値に基づき、当該パラメータ値系列毎に埋め込まれた同期用符号系列の位置を検出し、検出された当該同期用符号系列位置と前記部分パラメータ値系列との位置関係を検出して当該部分パラメータ値系列の当該付加情報の順番を決定し、当該部分パラメータ値系列の当該付加情報を当該順番に従って連結して前記文書データに埋め込まれた付加情報を復元する情報復元部とをさらに備えたことを特徴とする請求項7記載の文書処理装置。 - 文字列からなる文書データに付加情報を埋め込むことが可能な文書処理方法であって、
文字列からなる文書データを入力し、
入力された前記文書データから前記文字列における文書体裁に関するパラメータ値系列を抽出し、
前記文書データに埋め込む付加情報をシフト量として、所定の符号系列を当該シフト量だけシフトさせた符号化情報系列を生成し、
前記パラメータ値系列に前記符号化情報系列を合成した修正パラメータ値系列を生成し、
前記修正パラメータ値系列により前記文書データを修正することを特徴とする文書処理方法。 - 前記付加情報を分割して複数の部分付加情報を生成し、
前記部分付加情報毎の部分符号化情報系列を生成し、さらに当該部分符号化情報系列を連結して前記符号化情報系列を生成し、当該符号化情報系列を用いて前記文書データを修正することを特徴とする請求項9記載の文書処理方法。 - 付加情報が埋め込まれた文書データから当該付加情報を復元することが可能な文書処理方法であって、
文字列からなる文書データを入力し、
入力された前記文書データから前記文字列における文書体裁に関するパラメータ値系列を抽出し、
前記付加情報が埋め込まれた際に使用された符号系列と同一の符号系列と当該符号系列のシフトバージョンとを生成し、
前記パラメータ値系列と、前記符号系列および当該符号系列のシフトバージョンとの相関値に基づき、前記文書データに埋め込まれた付加情報を復元することを特徴とする文書処理方法。 - 抽出された前記パラメータ値系列を分割して複数の部分パラメータ値系列を生成し、
生成された前記部分パラメータ値系列と、前記符号系列および当該符号系列のシフトバージョンとの相関値に基づき、当該部分パラメータ値系列毎の付加情報を復元し、さらに復元された当該部分パラメータ値系列毎の付加情報を連結して前記文書データに埋め込まれた付加情報を復元することを特徴とする請求項11記載の文書処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005341139A JP4613807B2 (ja) | 2005-11-25 | 2005-11-25 | 文書処理装置および文書処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005341139A JP4613807B2 (ja) | 2005-11-25 | 2005-11-25 | 文書処理装置および文書処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007150606A true JP2007150606A (ja) | 2007-06-14 |
JP4613807B2 JP4613807B2 (ja) | 2011-01-19 |
Family
ID=38211500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005341139A Expired - Fee Related JP4613807B2 (ja) | 2005-11-25 | 2005-11-25 | 文書処理装置および文書処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4613807B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009118327A (ja) * | 2007-11-08 | 2009-05-28 | Fuji Xerox Co Ltd | 画像形成装置、プログラム、および媒体 |
JP2010044559A (ja) * | 2008-08-12 | 2010-02-25 | Chugoku Electric Power Co Inc:The | ファイルアクセス管理システム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11145840A (ja) * | 1997-09-02 | 1999-05-28 | Sony Corp | 送信及び/又は記録装置、受信及び/又は再生装置、送受信/記録再生装置、送受信システム、送信及び/又は記録方法、受信及び/又は再生方法、伝送方法、並びに、記録媒体 |
JP2002101397A (ja) * | 2000-06-28 | 2002-04-05 | Sony Corp | 付加情報埋め込み装置及び付加情報埋め込み方法、並びに記録媒体 |
JP2004104494A (ja) * | 2002-09-10 | 2004-04-02 | Canon Inc | 電子透かし埋め込み装置及びその制御方法 |
JP2004522384A (ja) * | 2001-07-27 | 2004-07-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号への補助データの埋め込み |
-
2005
- 2005-11-25 JP JP2005341139A patent/JP4613807B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11145840A (ja) * | 1997-09-02 | 1999-05-28 | Sony Corp | 送信及び/又は記録装置、受信及び/又は再生装置、送受信/記録再生装置、送受信システム、送信及び/又は記録方法、受信及び/又は再生方法、伝送方法、並びに、記録媒体 |
JP2002101397A (ja) * | 2000-06-28 | 2002-04-05 | Sony Corp | 付加情報埋め込み装置及び付加情報埋め込み方法、並びに記録媒体 |
JP2004522384A (ja) * | 2001-07-27 | 2004-07-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号への補助データの埋め込み |
JP2004104494A (ja) * | 2002-09-10 | 2004-04-02 | Canon Inc | 電子透かし埋め込み装置及びその制御方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009118327A (ja) * | 2007-11-08 | 2009-05-28 | Fuji Xerox Co Ltd | 画像形成装置、プログラム、および媒体 |
JP2010044559A (ja) * | 2008-08-12 | 2010-02-25 | Chugoku Electric Power Co Inc:The | ファイルアクセス管理システム |
Also Published As
Publication number | Publication date |
---|---|
JP4613807B2 (ja) | 2011-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3628312B2 (ja) | 透かし情報埋め込み装置,及び,透かし情報検出装置 | |
US8427509B2 (en) | Method for embedding messages into documents using distance fields | |
JP4277800B2 (ja) | 透かし情報検出方法 | |
US20040001606A1 (en) | Watermark fonts | |
US8014559B2 (en) | Information embedding apparatus, information embedding method, information extracting apparatus, information extracting method, computer program product | |
JP4400565B2 (ja) | 透かし情報埋め込み装置及び、透かし情報検出装置 | |
JP2007226678A (ja) | 同定機能付き印刷物、画像生成装置、画像処理装置及びその方法 | |
KR20070052332A (ko) | 화상 처리 방법 및 화상 처리 장치 | |
JP4613807B2 (ja) | 文書処理装置および文書処理方法 | |
Varna et al. | Data hiding in hard-copy text documents robust to print, scan and photocopy operations | |
JP2007088693A (ja) | 画像処理システム,改ざん検証装置,改ざん検証方法およびコンピュータプログラム | |
KR100467930B1 (ko) | 텍스트 문서로/로부터 워터마크를 삽입 및 추출하는방법과 그 장치 | |
JP2008085579A (ja) | 情報埋め込み装置、情報読み取り装置、情報埋め込み方法、情報読み取り方法、およびコンピュータプログラム | |
WO2015038063A1 (en) | Method and system for embedding data in a text document | |
JP2007174181A (ja) | 文書処理装置、文書処理方法および文書処理プログラム | |
CN110378829B (zh) | 信息提供和水印提取的方法、装置及设备 | |
JP2006261974A (ja) | 情報埋め込み方法、情報復元方法、情報埋め込み装置及び情報復元装置 | |
Pamboukian et al. | Reversible data hiding and reversible authentication watermarking for binary images | |
JP4192906B2 (ja) | 透かし情報検出装置及び透かし情報検出方法 | |
KR100938539B1 (ko) | 정보 처리 장치 및 그 방법 | |
JP2005142969A (ja) | 画像処理システム | |
JP4260076B2 (ja) | 文書作成装置、文書検証装置、文書作成方法、文書検証方法、文書作成プログラム、文書検証プログラム、文書作成プログラムを格納した記録媒体、および文書検証プログラムを格納した記録媒体 | |
JP4575873B2 (ja) | 画像処理装置 | |
JP2006270434A (ja) | 情報埋め込み方法、情報復元方法、情報埋め込み装置及び情報復元装置 | |
Garg et al. | Identifying the Leak Sources of Hard Copy Documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081022 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100921 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101004 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131029 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |