JP3833154B2 - 画像処理装置、及び画像処理方法、並びにプログラム、記憶媒体 - Google Patents

画像処理装置、及び画像処理方法、並びにプログラム、記憶媒体 Download PDF

Info

Publication number
JP3833154B2
JP3833154B2 JP2002226588A JP2002226588A JP3833154B2 JP 3833154 B2 JP3833154 B2 JP 3833154B2 JP 2002226588 A JP2002226588 A JP 2002226588A JP 2002226588 A JP2002226588 A JP 2002226588A JP 3833154 B2 JP3833154 B2 JP 3833154B2
Authority
JP
Japan
Prior art keywords
character
image processing
characters
extracting
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002226588A
Other languages
English (en)
Other versions
JP2003152988A5 (ja
JP2003152988A (ja
Inventor
北洋 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002226588A priority Critical patent/JP3833154B2/ja
Priority to CNB021419965A priority patent/CN1226860C/zh
Priority to KR10-2002-0052878A priority patent/KR100485554B1/ko
Publication of JP2003152988A publication Critical patent/JP2003152988A/ja
Publication of JP2003152988A5 publication Critical patent/JP2003152988A5/ja
Application granted granted Critical
Publication of JP3833154B2 publication Critical patent/JP3833154B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、1文字が複数の文字片から成る文字を含む文書画像に対して電子透かしの埋め込みを行う画像処理装置、1文字が複数の文字片から成る文字を含む文書画像に対して埋め込まれた電子透かしを抽出する画像処理装置、及び画像処理方法、プログラム、記憶媒体に関するものである。
【0002】
【従来の技術】
近年プリンタ、複写機などのデジタル画像形成装置において、その画質の向上は著しく、容易に高画質の印刷物を手にすることができるようになってきている。すなわち誰もが高性能スキャナ、プリンタ、複写機そしてコンピュータによる画像処理により、要求される印刷物を得ることが可能となってきている。そのため、文書の不正コピー、改ざん等の問題が発生し、それらを防止、あるいは抑止させるため、印刷物そのものにアクセス制御情報を埋め込もうという動きが近年活発となってきている(電子透かし)。
【0003】
このような要望を実現する手法としては、印刷物にアクセス制御情報を目に見えないように埋め込むもの、文書の余白にアクセス制御情報に対応したビットマップパターンを埋め込むもの、文書画像にスクランブル暗号をかけるもの等が現在一般的である。そのうち、アクセス制御情報を目に見えないように埋め込むものは、一般的な実現方法として、英文字列間のスペースの量をコントロールすることにより情報を埋め込むタイプ、文字の回転の量をコントロールすることにより情報を埋め込むタイプ、文字の拡大縮小の量をコントロールすることにより情報を埋め込むタイプ、また文字を変形させて情報を埋め込むタイプ等が提案されている。
【0004】
図9は、英文文字列間のスペースの量をコントロールすることで情報の埋め込みを行う方法を説明する図である。ここで、801〜804をスペースと呼ぶ。また、スペース801の間隔をp、スペース802の間隔をsとする。この状態において、埋め込む情報のビットが0ならばスペース801,802の間隔p、sを、p←(1+p)(p+s)/2、s←(1−p)(p+s)/2と変更し、埋め込む情報のビットが1ならば、p←(1−p)(p+s)/2、s←(1+p)(p+s)/2とする。これはスペース803,804にも同様に適用可能である。
【0005】
図10は、文字の回転の量をコントロールすることで情報の埋め込みを行う方法を説明する図である。ここで、同図左は回転前の状態、同図右は回転後の状態を示している。901は、文字の回転角度を示す。この回転の角度を図9に示した方法と同様に、埋め込む情報のビットに応じて変化させる。
【0006】
図11は、文字の拡大縮小の量をコントロールすることで情報を埋め込む方法を説明する図である。1001は元のサイズを示す。1002は、拡大後のサイズを示す。この拡大の量を図9に示した方法と同様に、埋め込む情報のビットに応じて変化させる。縮小の場合も同じである。
【0007】
【発明が解決しようとする課題】
しかしながら、上記アクセス制御情報を目に見えないように埋め込む手法は、機密性を保つためには有利だが、画像的に冗長度が少ない文書画像(通常二値画像)に情報を埋め込むため、文字、スペースに違和感を生じ、原稿品位の劣化が目立ちやすくなる。また、一般にそのような画像は印刷耐性(紙へ出力した後の情報保持力)も弱い。
【0008】
本発明は以上の問題に鑑みてなされたものであり、字体の劣化を最小限に抑えつつ、一定以上の情報埋め込み精度、量を確保することを目的とする。
【0009】
【課題を解決するための手段】
本発明の目的を達成するために、例えば本発明の画像処理装置は以下の構成を備える。
【0010】
すなわち、1文字が複数の文字片から成る文字を含む文書画像に対して透かし情報を埋め込む画像処理装置であって、
前記文書画像から文字を抽出する抽出手段と、
前記抽出手段により抽出された文字のうち、文字の文字片構成が所定の構成をとる文字を選択する選択手段と、
前記選択手段により選択された文字の所定の文字片の位置を変化させることで、当該文字に透かし情報を埋め込む埋め込み手段と
を備えることを特徴とする。
【0011】
本発明の目的を達成するために、例えば本発明の画像処理装置は以下の構成を備える。
【0012】
すなわち、1文字が複数の文字片から成る文字を含む文書画像に対して埋め込まれた透かし情報を抽出する画像処理装置であって、
前記文書画像から文字を抽出する文字抽出手段と、
前記文字抽出手段により抽出された文字のうち、文字の文字片構成が所定の構成をとる文字を選択する選択手段と、
前記選択手段が選択した文字の文字片の位置に基づいて、前記透かし情報を抽出する透かし情報抽出手段と
を備えることを特徴とする。
【0013】
本発明の目的を達成するために、例えば本発明の画像処理方法は以下の構成を備える。
【0014】
すなわち、1文字が複数の文字片から成る文字を含む文書画像に対して透かし情報を埋め込む画像処理方法であって、
前記文書画像から文字を抽出する抽出工程と、
前記抽出工程で抽出された文字のうち、文字の文字片構成が所定の構成をとる文字を選択する選択工程と、
前記選択工程で選択された文字の所定の文字片の位置を変化させることで、当該文字に透かし情報を埋め込む埋め込み工程と
を備えることを特徴とする。
【0015】
本発明の目的を達成するために、例えば本発明の画像処理方法は以下の構成を備える。
【0016】
すなわち、1文字が複数の文字片から成る文字を含む文書画像に対して埋め込まれた透かし情報を抽出する画像処理方法であって、
前記文書画像から文字を抽出する文字抽出工程と、
前記文字抽出工程で抽出された文字のうち、文字の文字片構成が所定の構成をとる文字を選択する選択工程と、
前記選択工程で選択された文字の文字片の位置に基づいて、前記透かし情報を抽出する透かし情報抽出工程と
を備えることを特徴とする。
【0017】
【発明の実施の形態】
以下、添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。
【0018】
[第1の実施形態]
図1は、本実施形態における、文書画像に対して電子透かしの埋め込みを行う電子透かし埋め込み装置の基本構成を示すブロック図である。
【0019】
同図において、2は電子透かしを埋め込む対象文書を入力するスキャナ、カメラ、あるいはファイル読み込み装置などにより構成される入力部、4は各種処理を行うプロセッサ、6はプロセッサ4への命令を入力するキーボード、8は埋め込み情報、あるいは読み込んだ文書画像を保存するディスク、10はプロセッサ4において行われる各種処理のために一時的にデータなどを記憶する、あるいは入力部2で読み込んだ文書画像を蓄積するメモリ、12はプロセッサ4への命令入力、および処理の状態を示すディスプレイ、14はアクセス制御情報が埋め込まれた文書画像を出力するプリンタや、インターネット、LAN等のネットワークインターフェースにより構成される出力部である。
【0020】
一方、図2は、図1に示した電子透かし埋め込み装置により電子透かしが埋め込まれた文書画像から、電子透かしを抽出する電子透かし抽出装置の基本構成を示す図である。
【0021】
同図において、22は電子透かしが埋め込まれた文書を入力するスキャナ、カメラ、あるいはファイル読み込み装置、ネットワークインターフェースなどにより構成される入力部、24は各種処理を行うプロセッサ、26はプロセッサ24への命令を入力するキーボード、28は読み込んだ文書画像を保存、あるいは読み込んだ文書のオリジナルファイル検索のためのディスク、30はプロセッサ24において行われる各種処理のために一時的にデータなどを記憶する、あるいは入力部22で読み込んだ文書画像を蓄積するメモリ、32はプロセッサ24への命令入力、および処理の状態を示すディスプレイ、34,36はそれぞれ読み取った文書アクセス制御情報を活用するためのネットワークインターフェース、プリンタである。
【0022】
尚、本実施形態では、電子透かし埋め込み装置と電子透かし抽出装置とを個々の装置として扱うが、これに限定されるものではなく、これらの装置(電子透かし埋め込み装置、電子透かし抽出装置)を1つの装置内における電子透かし埋め込み部、電子透かし抽出部として用いても良い。
【0023】
次に、電子透かしの埋め込み処理の大まかな流れについて説明する。キーボード6から入力された命令に従い、まず、入力部2より電子化された被埋め込み文書画像を取得し、メモリ10に展開する。さらに埋め込み情報(文書アクセス制御情報)をキーボード6、あるいはディスク8より入力し、プロセッサ4によりその情報をメモリ10上に展開されている文書画像に埋め込む。所定の文書アクセス制御情報が埋め込まれた文書画像は、出力部14により電子透かし埋め込み済文書として出力される。
【0024】
次に、出力部14により出力された電子透かし埋め込み済み文書から電子透かしの抽出を行う処理の大まかな流れについて説明する。キーボード26から入力された命令に従い、まず、入力部22より電子透かし埋め込み済文書を入力し、メモリ30に展開する。次にプロセッサ24によりメモリ30上に展開された文書画像から埋め込まれた文書アクセス制御情報を読み出し、その指示に基づいて所定の処理を行う。所定の処理とは、例えば、不正読み取りが発覚した場合に外部へ通報する、オリジナル文書の検索を内部ディスク28、または外部に対して行う、あるいは属性情報をプリントアウトする等であり、これらの処理のためネットワークI/F34、プリンタ36は使用される。
【0025】
次に、プロセッサ4が1枚の文書画像に電子透かしを埋め込む処理について詳細に説明する。同処理のフローチャートを図3に示す。
【0026】
ステップS200では、入力部2から文書を取込み、電子画像データとしてメモリ10に転送する。また本ステップでは、読み込んだ文書の方向、傾斜補正等の前処理も行う。ステップS202では、ステップS200においてメモリ10に展開された文書画像に対して領域識別を施し、画像中の文字ブロック(テキスト)をすべて抽出する。これは例えば特開平6-068301号公報に記述されているブロックセレクション技術等を応用して実現させることが可能である。ステップS204では、ステップS202で抽出された全ての文字ブロックに含まれる文字に対して文字認識を施し、文字認識結果としての文字コードを生成する。
【0027】
ステップS206では、ステップS202で抽出された文字ブロックに含まれる文字の中から、文書アクセス制御情報を埋め込む対象文字を抽出する。抽出する対象文字は予め定められたフォントサイズの文字とする。本ステップにおける処理の詳細は後述する。ステップS208では、ステップS206で抽出された文字に埋め込む文書アクセス制御情報を入力する。ここで、文書アクセス制御情報とは、例えば、複写制限情報、改ざん防止情報、オリジナル文書管理情報等である。
【0028】
ステップS210では、ステップS208で入力された文書アクセス制御情報をステップS206で抽出された文字に埋め込む。本ステップにおける処理の詳細は後述する。ステップS212では、ステップS210で文書アクセス制御情報を埋め込んだ文書画像を出力する。
【0029】
次に、プロセッサ24が1枚の電子透かし埋め込み済み文書画像から電子透かしを抽出する処理について詳細に説明する。同処理のフローチャートを図4に示す。
【0030】
ステップS300では、入力部22から電子透かし埋め込み済文書を取込み、電子画像データとしてメモリ30に転送する。本ステップにおける処理は、ステップS200と同様に、読み込んだ文書の方向、傾斜補正等の前処理も含む。
【0031】
ステップS302では、ステップS300においてメモリ30に展開された電子透かし埋め込み済文書画像に対して領域識別を施し、文書画像中の文字ブロックをすべて抽出する。本ステップにおける処理はステップS202における処理と同様にして行う。ステップS304では、ステップS302で抽出された全ての文字ブロックに文字認識を施す。本ステップにおける処理はステップS204における処理と同様にして行う。
【0032】
ステップS306では、ステップS302で抽出された文字ブロックに含まれる文字の中から、文書アクセス制御情報が埋め込まれている文字のみを抽出する。本ステップにおける処理の詳細は後述する。ステップS308では、ステップS306で抽出された文字から文書アクセス制御情報を読み出す。本ステップにおける処理の詳細は後述する。
【0033】
ステップS310では、ステップS308で読み出された文書アクセス制御情報に従って所定の制御を行い、例えば、コピー禁止処理、文書検索処理等を行う。
【0034】
図5は、ステップS206〜S210,及びS306における処理の詳細なフローチャートである。ステップS400では、文字認識結果による文字コードをメモリ10内の文字抽出用ワークメモリに転送する。ステップS402では、文書中に含まれる全ての文字コードを文字抽出用ワークメモリに転送したか否かを判定する。転送が全て終了している場合は処理をステップS404へ、そうでない場合は処理をステップS400へ移行する。
【0035】
ステップS404では、文字抽出用ワークメモリに転送された文字コードを用いて、予め設定されている文字を文字毎にカウントする。ここで、予め設定されているとは、例えば10ポイントのフォントサイズを有し、「構成部首が3個以上の漢字」というように、ある程度複雑な部首構成をとっている漢字をあらかじめ設定しておくことである。つまり、ステップS404では、文字抽出用ワークメモリに転送された文字コードのうち、予め設定された文字の文字コードと同じ文字コードの数をカウントする。このような設定を行うことにより、一定以上の情報を目立たないようにしかも確実に埋め込むことが可能となる。これについては後ほど詳しく説明する。
【0036】
ステップS406では、ステップS404でカウントされた文字をカウント数によりソーティングする。ステップS408では、カウント数がある程度以上、すなわち文書中に出現頻度の高い文字が一定以上あるか否かを判定する。これは、電子透かしの埋め込みの精度を確保するため、対象とする文字を一定数以上とり、同じ文字に対し同じ情報を繰り返し埋め込むための措置である。またこれは、電子透かしの抽出の精度を確保するためでもある。ここでいう一定数以上とは多ければ多いほど精度が上がるが、例えば2回程度でもよい。このことについての詳細は後述する。
【0037】
ここで、一定以上対象文字数がないと判断された場合、所定の情報量の埋め込み/抽出は不可能と判断し、処理はステップS414へ移行し、そうでない場合はステップS410へ処理を移行する。
【0038】
ステップS410では、埋め込み/抽出対象文字の中で文書中最も出現頻度の高い文字を選択し、埋め込み/抽出操作のための基準値を算出する。この基準値についての詳細は後述する。
【0039】
ステップS412では、基準値を求めた文字以外、すなわち上述の出現頻度が2番目以降の文字をステップS406でソーティングした結果より求め、文書アクセス制御情報の埋め込み/抽出操作を行う。具体的な手法は、後述する。
【0040】
ステップS414では、ステップS408で埋め込み/抽出対象文字が少なく、埋め込み/抽出不可と判断された場合、所定の処理を行うルーチンである。所定の処理とは、例えば埋め込み/抽出不可の警告をディスプレイ12,もしくは32に表示する等の処理である。
【0041】
図6は、ステップS412で行われる文書アクセス制御情報の埋め込み処理の原理を説明する図で、図7は実際に、文書に9ビットの情報を埋め込む処理を説明する図である。図6(a)は、基準値を求める方法を説明する図であり、同図(b)〜(i)は夫々3ビットの情報(8種類の情報)を同図(a)に示した文字へ埋め込む方法を説明する図である。以下の説明では、文書アクセス制御情報を9ビットの情報とするが、これに限定されるものではない。また、図6,7では、例えば部首(文字片)の個数が3個、例えば”型”という文字のパターンのような、小さな部首が上部に2個、大きな部首が下部に1個あるようなパターンを取り上げ説明する。なお、図は説明のために多少誇張して表現されている。
【0042】
まず、ステップS206で文字ブロックから抽出される文字画像(図6では”型”の漢字の画像)を個々の部首に分解し、その基準値を求める。文字を個々の部首に分解する方法としては特には限定しないので、一般に開示されている方法を用いて良い。基準値とは、文書アクセス制御情報を目に見えない形で文書に埋め込む際に最も重要な値である。ここで言う基準値は、図6(a)に定義されているように、文字画像の4端の座標の相対距離、K,P,M,Nで表される。
【0043】
具体的な情報の埋め込み手法であるが、ここでは先ほど定義した4つの基準値K,P,M,Nを使用して1文字あたり3ビットの情報を埋め込むことを考える。ステップS410で最も信頼度の高い、すなわち出現頻度が最も高い文字の基準値K,P,M,Nを求める(図7における3つ目のステップに相当)。これに対し、埋め込まれるべき文書アクセス制御情報(9ビット)を用意し、3ビット毎に、ステップS412で選択した2番目以降の文字に対して、図6(b)〜(i)に示すいずれかの処理(文字の各部首の相対位置を変化させる処理)を行う(図7の4つ目のステップに相当)。具体的には、3ビット毎の情報を2番目以降の文字に対して埋め込む際、例えば最初の3ビットを(ソーティングの結果)2番目の文字、次の3ビットを3番目の文字、最後の3ビットを4番目の文字に対して埋め込む。しかし、この順に限定されるものではなく、その逆、すなわち、例えば最初の3ビットを4番目の文字、次の3ビットを3番目の文字、最後の3ビットを2番目の文字に対して埋め込んでも良い。
【0044】
いずれにせよ、3ビット毎の情報を何番目の文字に埋め込んだかの情報(埋め込み情報)をメモリ10に記憶しておく。この埋め込み情報の例を図12に示す。同図において、埋め込み情報1201はメモリ10内に格納されており、埋め込み情報1201は、最初の3ビットを埋め込んだ文字のソーティングの順番、2番目の3ビットを埋め込んだ文字のソーティングの順番、3番目の3ビットを埋め込んだ文字のソーティングの順番の情報により構成されている。
【0045】
電子透かしの抽出処理においてこの埋め込み情報を参照することで、各文字から3ビット毎の情報を抽出した際に、どの順序でこれら3ビット毎の情報を並べ替えて元の9ビットの文書アクセス制御情報を復元するかを特定することができるからである。電子透かしの抽出処理についての詳細は後述する。
【0046】
各文字に3ビット毎の情報を埋め込む際、上述の通り文字の部首の位置を埋め込む情報に応じて変化させるが、その変化のパターンは図6(b)〜(i)に示すとおりである。
【0047】
又、上述の説明からも分かるとおり、対象文字の数(最低出現頻度)を調整することにより、電子透かしの埋め込み/抽出の精度と、埋め込みビット数のバランスを保つことができる。
【0048】
図6(b)〜(i)においてK’,P’,M’,N’は、位置を変化させた後の4端の相対距離である。
【0049】
文字の劣化を防ぐために、最も大きな部首、この場合は、下の部首だが、これは動かさないようにする。以上説明したような手順で任意の情報を埋め込むことが可能となる。
【0050】
一方、電子透かしの抽出の際には、上述の方法と同様にして基準値を求め、出現頻度が第2位以下の文字の各部首の相対位置を基準値と比較し、各文字に埋め込まれたビット配列を抽出する。またこのとき、メモリ10内には上述の通り埋め込み情報が格納されているので、この埋め込み情報を参照し、抽出したビット配列が埋め込まれた文字が何番目の文字であるかを特定し、元の文書アクセス制御情報を復元する。
【0051】
以上の説明により、本実施形態における画像処理装置及び画像処理方法によって、領域識別、文字認識を行った上で、部首構成の複雑な文字の部首毎の相対位置変化を巧みに活用することにより、字体の劣化を最小限に抑えつつも、一定以上の情報埋め込み精度、量(出現頻度によるソーティングで制御可能)を確保する。又、電子透かしの抽出時においても、ノイズ耐性の高い電子透かしを実現させることが可能となった。また、フォントサイズの依存性も原理的に全くないため、文字数の少ない原稿に対しても、有効な手法であることは明白である。
【0052】
[第2の実施形態]
第1の実施形態では、埋め込み対象として採用した部首構成は図6で示されたような単一のパターンだったが、これに限ることはなく、図8に示すように一定以上の部首を持つ複数の漢字パターンを同時に設定しても良い。この場合、夫々の部首構成を有する文字に対して、第1の実施形態で用いた方法を採用すればよく、埋め込み情報量はさらに増大する。
【0053】
[第3の実施形態]
第1の実施形態では、1文字あたり3ビット埋め込んでいたが、これに限ることはなく、部首の移動パターンのとりうる組み合わせ内のビット数であれば、自由に設定しても良い。ただし、埋め込みビット数を増加させると、文字の変形度合いは大きくなる。
【0054】
[第4の実施形態]
第1の実施形態では、漢字に透かし情報を埋め込んでいたが、何もこれに限ることはなく、複数の構成要素(文字片)から成る文字であれば、例えば、ハングル、タイ語などに埋め込むこともまったく同様に可能である。
【0055】
[第5の実施形態]
例えば図6(a)に示す基準値を用いて、「型」の漢字に「000」のビット列を埋め込む場合、N’=Nとするが、ビット列を埋め込んだ文書画像にノイズが重畳されるなどの外乱が影響した場合にこのビット列「000」を埋め込んだ漢字「型」からビット列「000」を抽出する処理は、困難なものとなる。すなわち、抽出処理においてN’を求めても、N’=Nとは厳密にはならないことがあり、その結果、ビット列「000」の抽出ができないことがあるからである。
【0056】
そこで、抽出処理においてN’とNとの比較により幅を持たせるように変更しても良い。すなわち|N’−N|<εを満たせば、N’=Nであると判断する。この処理は他の基準値にも適用することができ、他にも例えば|M’−M|<εを満たせば、M’=Mであると判断してもよい。
【0057】
[第6の実施形態]
第1の実施形態では、文書アクセス制御情報を埋め込む対象文字として同じフォントサイズを有する文字を用いていた。これは夫々の対象文字に文書アクセス制御情報を埋め込むことで移動させる部首の移動量(例えばKからK’への変化量でも良い)を一定にし、部首の移動後の文字のバランスを各対象文字間でほぼ一定にするためである。
【0058】
しかし、夫々の対象文字のフォントサイズが同じでなくても、各フォントサイズ毎に移動させる部首の移動量を予め決めておけば、部首の移動後の文字のバランスを各対象文字間でほぼ一定にすることができる。また各フォントサイズ毎の部首の移動量を埋め込み時に求めても良い。その場合、例えば10ポイントの文字で部首の移動量をcとすると、12ポイントでは(c×(12ポイントの文字のサイズ)/(10ポイントの文字のサイズ))を計算することで求めることができる。
【0059】
[第7の実施形態]
第1の実施形態では、基準値を求めるために使用する文字として、最も出現頻度の高い文字を採用していたが、何もこれに限ることはなく、例えば各部首パターンにおいて、あらかじめ画数、部首の作り等を基に、部首を動かしても視覚上目立たないグループと、そうでないグループに分けて、それぞれ埋め込み対象文字、基準文字として設定し、実際に出現した複数の基準文字グループ内の文字を基準文字としても良い。その場合の基準値は、例えば、部首を動かすと視覚上目立つグループに含まれる各文字毎に基準値の平均値を求めることで得られる。
【0060】
[第8の実施形態]
第1の実施形態では、基準値を求めるために使用する文字として、最も出現頻度の高い文字を採用していたが、何もこれに限ることはなく、例えば文書、あるいは文字ブロックの最初の文字にしても良い。この場合、最初の文字が所定の部首パターンに該当しない場合は、その次の文字というように制御を行う。
【0061】
[第9の実施形態]
第1の実施形態では、基準値を求めるために使用する文字として、最も出現頻度の高い文字を採用していたが、何もこれに限ることはなく、例えば出現頻度第2位以降で所定順位までの文字を基準文字としても良い。この場合、基準値は、夫々の基準文字に対する基準値の平均値を求めることで得られる。
【0062】
[その他の実施の形態]
さらに、本発明は上記実施形態を実現するための装置及び方法のみに限定されるものではなく、上記システム又は装置内のコンピュータ(CPUあるいはMPU)に、上記実施形態を実現するためのソフトウエアのプログラムコードを供給し、このプログラムコードに従って上記システムあるいは装置のコンピュータが上記各種デバイスを動作させることにより上記実施形態を実現する場合も本発明の範疇に含まれる。
【0063】
またこの場合、前記ソフトウエアのプログラムコード自体が上記実施形態の機能を実現することになり、そのプログラムコード自体、及びそのプログラムコードをコンピュータに供給するための手段、具体的には上記プログラムコードを格納した記憶媒体は本発明の範疇に含まれる。
【0064】
この様なプログラムコードを格納する記憶媒体としては、例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
【0065】
また、上記コンピュータが、供給されたプログラムコードのみに従って各種デバイスを制御することにより、上記実施形態の機能が実現される場合だけではなく、上記プログラムコードがコンピュータ上で稼働しているOS(オペレーティングシステム)、あるいは他のアプリケーションソフト等と共同して上記実施形態が実現される場合にもかかるプログラムコードは本発明の範疇に含まれる。
【0066】
更に、この供給されたプログラムコードが、コンピュータの機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに格納された後、そのプログラムコードの指示に基づいてその機能拡張ボードや機能格納ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上記実施形態が実現される場合も本発明の範疇に含まれる。
【0067】
【発明の効果】
以上説明したとおり、本発明によって、字体の劣化を最小限に抑えつつ、一定以上の情報埋め込み精度、量を確保することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における、文書画像に対して電子透かしの埋め込みを行う電子透かし埋め込み装置の基本構成を示すブロック図である。
【図2】図1に示した電子透かし埋め込み装置により電子透かしが埋め込まれた文書画像から、電子透かしを抽出する電子透かし抽出装置の基本構成を示すブロック図である。
【図3】プロセッサ4が1枚の文書画像に電子透かしを埋め込む処理のフローチャートである。
【図4】プロセッサ24が1内の電子透かし埋め込み済みの文書画像から電子透かしを抽出する処理のフローチャートである。
【図5】ステップS206,S306における処理の詳細なフローチャートである。
【図6】ステップS412で行われる文書アクセス制御情報の埋め込み処理の原理を説明する図である。
【図7】実際に文書に9ビットの情報を埋め込む処理を説明する図である。
【図8】一定以上の部首を持つ複数の漢字パターンを示す図である。
【図9】英文文字列間のスペースの量をコントロールすることで情報の埋め込みを行う方法を説明する図である。
【図10】文字の回転の量をコントロールすることで情報の埋め込みを行う方法を説明する図である。
【図11】文字の拡大縮小の量をコントロールすることで情報の埋め込みを行う方法を説明する図である。
【図12】埋め込み情報の例を示す図である。

Claims (18)

  1. 1文字が複数の文字片から成る文字を含む文書画像に対して透かし情報を埋め込む画像処理装置であって、
    前記文書画像から文字を抽出する抽出手段と、
    前記抽出手段により抽出された文字のうち、文字の文字片構成が所定の構成をとる文字を選択する選択手段と、
    前記選択手段により選択された文字の所定の文字片の位置を変化させることで、当該文字に透かし情報を埋め込む埋め込み手段と
    を備えることを特徴とする画像処理装置。
  2. 前記抽出手段は、
    前記文書画像から文字ブロックを抽出する文字ブロック抽出手段と、
    前記文字ブロック抽出手段により抽出された文字ブロックに含まれる文字に対して文字認識を行い、認識結果として文字コードを生成し、前記文字の画像を前記文字ブロックから抽出する文字認識手段と
    を備えることを特徴とする請求項1に記載の画像処理装置。
  3. 前記選択手段は、前記抽出手段により抽出された文字のうち、文字片の文字片構成が所定の構成をとる文字の数を文字毎にカウントするカウント手段を備え、
    前記カウント手段によるカウント数が所定のカウント数以上である文字の数が一定数以上である場合に、前記埋め込み手段は前記選択手段により選択された文字に前記透かし情報を埋め込むことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記カウント手段は、文字片が所定の構成をとる文字の数を当該文字の文字コードを用いて文字毎にカウントすることを特徴とする請求項3に記載の画像処理装置。
  5. 更に、前記透かし情報を埋め込む際に用いる基準値を算出する算出手段を備えることを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。
  6. 前記算出手段は、基準値算出のために選択された文字の4端の座標の相対距離を前記基準値として算出することを特徴とする請求項5に記載の画像処理装置。
  7. 前記算出手段は、基準値算出のために選択された文字の幅、高さに対する、当該文字の各文字片の幅、高さの割合を前記基準値として算出することを特徴とする請求項5に記載の画像処理装置。
  8. 前記埋め込み手段は更に、前記透かし情報をどの文字に埋め込んだかを示す情報を生成することを特徴とする請求項5乃至7のいずれか1項に記載の画像処理装置。
  9. 1文字が複数の文字片から成る文字を含む文書画像に対して埋め込まれた透かし情報を抽出する画像処理装置であって、
    前記文書画像から文字を抽出する文字抽出手段と、
    前記文字抽出手段により抽出された文字のうち、文字の文字片構成が所定の構成をとる文字を選択する選択手段と、
    前記選択手段が選択した文字の文字片の位置に基づいて、前記透かし情報を抽出する透かし情報抽出手段と
    を備えることを特徴とする画像処理装置。
  10. 前記文字抽出手段は更に、
    前記文書画像から文字ブロックを抽出する文字ブロック抽出手段と、
    前記文字ブロック抽出手段により抽出された文字ブロックに含まれる文字に対して文字認識を行い、認識結果として文字コードを生成し、前記文字の画像を前記文字ブロックから抽出する文字認識手段と
    を備えることを特徴とする請求項9に記載の画像処理装置。
  11. 前記透かし情報抽出手段は、前記透かし情報をどの文字に埋め込んだかを示す情報を参照することで、前記透かし情報を抽出することを特徴とする請求項9に記載の画像処理装置。
  12. 更に、前記透かし情報を抽出する際に用いる基準値を算出する算出手段を備えることを特徴とする請求項9乃至11のいずれか1項に記載の画像処理装置。
  13. 前記透かし情報は、文書アクセス制御情報、複写制限情報、改ざん防止情報、オリジナル文書管理情報の少なくとも何れかを含むことを特徴とする請求項1乃至12のいずれか1項に記載の画像処理装置。
  14. 前記文字片は、漢字の部首を含むことを特徴とする請求項1乃至13のいずれか1項に記載の画像処理装置。
  15. 1文字が複数の文字片から成る文字を含む文書画像に対して透かし情報を埋め込む画像処理方法であって、
    前記文書画像から文字を抽出する抽出工程と、
    前記抽出工程で抽出された文字のうち、文字の文字片構成が所定の構成をとる文字を選択する選択工程と、
    前記選択工程で選択された文字の所定の文字片の位置を変化させることで、当該文字に透かし情報を埋め込む埋め込み工程と
    を備えることを特徴とする画像処理方法。
  16. 1文字が複数の文字片から成る文字を含む文書画像に対して埋め込まれた透かし情報を抽出する画像処理方法であって、
    前記文書画像から文字を抽出する文字抽出工程と、
    前記文字抽出工程で抽出された文字のうち、文字の文字片構成が所定の構成をとる文字を選択する選択工程と、
    前記選択工程で選択された文字の文字片の位置に基づいて、前記透かし情報を抽出する透かし情報抽出工程と
    を備えることを特徴とする画像処理方法。
  17. コンピュータに請求項15又は16に記載の画像処理方法を実行させるためのプログラム。
  18. 請求項17に記載のプログラムを格納し、コンピュータが読み取り可能な記憶媒体。
JP2002226588A 2001-09-03 2002-08-02 画像処理装置、及び画像処理方法、並びにプログラム、記憶媒体 Expired - Fee Related JP3833154B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2002226588A JP3833154B2 (ja) 2001-09-03 2002-08-02 画像処理装置、及び画像処理方法、並びにプログラム、記憶媒体
CNB021419965A CN1226860C (zh) 2001-09-03 2002-09-02 图像处理装置和图像处理方法
KR10-2002-0052878A KR100485554B1 (ko) 2001-09-03 2002-09-03 화상 처리 장치, 화상 처리 방법, 및 기록 매체

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001266436 2001-09-03
JP2001-266436 2001-09-03
JP2002226588A JP3833154B2 (ja) 2001-09-03 2002-08-02 画像処理装置、及び画像処理方法、並びにプログラム、記憶媒体

Publications (3)

Publication Number Publication Date
JP2003152988A JP2003152988A (ja) 2003-05-23
JP2003152988A5 JP2003152988A5 (ja) 2005-07-14
JP3833154B2 true JP3833154B2 (ja) 2006-10-11

Family

ID=26621566

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002226588A Expired - Fee Related JP3833154B2 (ja) 2001-09-03 2002-08-02 画像処理装置、及び画像処理方法、並びにプログラム、記憶媒体

Country Status (1)

Country Link
JP (1) JP3833154B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8587837B2 (en) 2010-06-30 2013-11-19 Ricoh Company, Ltd. Image processing apparatus embedding additional information in document data

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7428076B2 (en) * 2004-08-02 2008-09-23 Seiko Epson Corporation Smart copying for variable cost, editable printouts

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8587837B2 (en) 2010-06-30 2013-11-19 Ricoh Company, Ltd. Image processing apparatus embedding additional information in document data

Also Published As

Publication number Publication date
JP2003152988A (ja) 2003-05-23

Similar Documents

Publication Publication Date Title
US5765176A (en) Performing document image management tasks using an iconic image having embedded encoded information
Kanungo et al. A statistical, nonparametric methodology for document degradation model validation
JP4136731B2 (ja) 情報処理方法及び装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US6526155B1 (en) Systems and methods for producing visible watermarks by halftoning
JP4009655B2 (ja) デジタル像符牒の処理方法及びシステム
EP1906645B1 (en) Electronic watermark embedment apparatus and electronic watermark detection apparatus
JP4557765B2 (ja) 画像処理装置およびその方法
US20090021793A1 (en) Image processing device, image processing method, program for executing image processing method, and storage medium for storing program
US6072871A (en) Method and system for identifying the source of documents generated by software and documents generated thereby
JP2000299778A (ja) ウォーターマークの付加方法及び装置、読取方法及び装置、記録媒体
CN1259709A (zh) 在文档中嵌入信息的方法和系统
CN101207680B (zh) 图像处理设备和图像处理方法
JP4194462B2 (ja) 電子透かし埋め込み方法、電子透かし埋め込み装置、及びそれらを実現するプログラム並びにコンピュータ可読記憶媒体
Tan et al. Print-Scan Resilient Text Image Watermarking Based on Stroke Direction Modulation for Chinese Document Authentication.
US20080309981A1 (en) Two-dimensional code generating device
JP3833154B2 (ja) 画像処理装置、及び画像処理方法、並びにプログラム、記憶媒体
US7058214B2 (en) Image processing apparatus, imaging processing method and storage medium
KR100485554B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 기록 매체
JP3848150B2 (ja) 画像処理装置及びその方法
JP4958868B2 (ja) 文書特徴量抽出装置及び方法
JP3943925B2 (ja) 文書ファイルへの電子透かしの埋め込み方法と埋め込み装置
US6937741B1 (en) Image processing apparatus and method, and storage medium therefor
JP2004336220A (ja) 画像生成装置、画像生成方法、画像記録媒体及び画像生成プログラム
JP2008172519A (ja) 情報埋め込み装置、埋め込み情報取得装置
JP2003152988A5 (ja)

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041122

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060718

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110728

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120728

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120728

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130728

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees