JP2010124451A - 文書処理装置および文書処理方法 - Google Patents
文書処理装置および文書処理方法 Download PDFInfo
- Publication number
- JP2010124451A JP2010124451A JP2009175801A JP2009175801A JP2010124451A JP 2010124451 A JP2010124451 A JP 2010124451A JP 2009175801 A JP2009175801 A JP 2009175801A JP 2009175801 A JP2009175801 A JP 2009175801A JP 2010124451 A JP2010124451 A JP 2010124451A
- Authority
- JP
- Japan
- Prior art keywords
- character
- watermark information
- document
- document image
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0051—Embedding of the watermark in the spatial domain
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0062—Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
【課題】文書に埋め込まれた文字間透かし情報の有無を高速に判定する。
【解決手段】ステップS203〜S206において、文書画像における文字間隔値を抽出して該文字間隔値のばらつきとして分散を算出する。そしてステップS207で、該算出された分散が、ステップS201で予め設定された閾値よりも小さい場合に、文書画像に文字間透かし情報が埋め込まれていると判定する。このように文字間隔値の分散を用いることにより、文字間透かし情報の有無を高速に判定できる。このとき、文書上の全部の文字でなく一部の文字の間隔値を用いて判定を行うことで、さらなる高速化が可能である。
【選択図】図2
【解決手段】ステップS203〜S206において、文書画像における文字間隔値を抽出して該文字間隔値のばらつきとして分散を算出する。そしてステップS207で、該算出された分散が、ステップS201で予め設定された閾値よりも小さい場合に、文書画像に文字間透かし情報が埋め込まれていると判定する。このように文字間隔値の分散を用いることにより、文字間透かし情報の有無を高速に判定できる。このとき、文書上の全部の文字でなく一部の文字の間隔値を用いて判定を行うことで、さらなる高速化が可能である。
【選択図】図2
Description
本発明は文書処理装置および文書処理方法に関し、特に、文書画像に文字間隔を利用した透かし情報が埋め込まれているか否かを判定する文書処理装置および文書処理方法に関する。
文書画像に著作権や複写制御等の情報を不可視な状態で持たせるため、文字間の空白長である文字間隔を微小に変更して情報を埋め込む方法が知られている(例えば、特許文献1参照)。以下、このように文字間隔を利用して埋め込まれた情報を文字間透かしと称する。
文字間隔を用いた情報埋め込み規則としては、例えば、まず、各文字の外接矩形と、その外接矩形間の距離、つまり、文字間隔値として、隣り合う1ペアP,Sを順次抽出し、ペアにおける各文字間隔の大小関係に応じて「0」または「1」を規定する。この「0」および「1」のデータ列により、文字間透かしを表現している。
このように文書画像に埋め込まれた文字間透かしは、以下のように抽出される。まず、各文字の外接矩形と、その外接矩形間の距離つまり文字間隔値P,Sを抽出し、文字間隔値P,Sのペア毎に、その大小関係を調べ、埋め込み時に使用した規則に従って、情報が「0」であるか「1」であるかを判定していく。そして、得られた「0」または「1」の情報を連結したデータ列を検証することによって透かし情報の有無をまず判定し、透かし情報が有ると判定された場合に、該情報を抽出する。
しかしながら、上記従来の文字透かしの埋め込み方法によれば、透かし情報の有無判定を行うためには、「0」と「1」のデータ列の抽出処理まで行う必要があり、非常に処理時間がかかってしまう。
例えば、複写機において透かし情報に基づく複写許可制御を行う場合、一連の複写動作に遅延が発生することを避けるために、透かし情報の有無判定はできるだけ短時間で行うことが要求される。
本発明は上述した問題を解決するためになされたものであり、文書画像に対して文字間透かし情報の有無を高速に判定可能とする文書処理装置および画像処理方法を提供することを目的とする。
上記目的を達成するための一手段として、本発明の文書処理装置は以下の構成を備える。
すなわち、文書画像に対し、文字間隔を利用した透かし情報が埋め込まれているか否かを判定する文書処理装置であって、文書画像を入力する入力手段と、前記文書画像における文字間隔値を抽出する文字間隔値抽出手段と、前記文字間隔値のばらつきを算出する計算手段と、前記計算手段で算出されたばらつきの値を、予め設定された閾値と比較することによって、前記文書画像に透かし情報が埋め込まれているか否かを判定する判定手段と、を有することを特徴とする。
上記構成からなる発明によれば、文書画像に対して文字間透かし情報の有無を高速に判定することが可能となる。
以下、添付の図面を参照して、本発明をその好適な実施形態に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
<第1実施形態>
本実施形態においては、文書画像に対し、文字間隔を利用した文字間透かし情報が埋め込まれているか否かを高速に判定することを特徴とする。ここで、図3に、本実施形態における判定対象となる、文字間透かし情報の埋め込み例を示す。図3によれば、「電子透かし情報」という文字列に対し、2つの文字間隔値を使って1ビットの情報を埋め込む例を示している。
本実施形態においては、文書画像に対し、文字間隔を利用した文字間透かし情報が埋め込まれているか否かを高速に判定することを特徴とする。ここで、図3に、本実施形態における判定対象となる、文字間透かし情報の埋め込み例を示す。図3によれば、「電子透かし情報」という文字列に対し、2つの文字間隔値を使って1ビットの情報を埋め込む例を示している。
まず、ステップS1において、一般的な文字認識技術のひとつである文字外接矩形抽出技術等を利用して、各文字の外接矩形と、その外接矩形間の距離、つまり、文字間隔値P,Sを抽出する。次に、ステップS2において、ペアとなる文字間隔値P,Sが同じ値になるように正規化する。そして、ステップS3において、2値情報の「0」を埋め込む場合にはP>Sとなるように、「1」を埋め込む場合にはP<Sとなるように、文字を動かして文字間隔が制御されている。
具体的には、例えば、予め文字動作量Xを規定しておき、P>Sとする場合にはP=P+X,S=S−Xとし、P<Sとする場合にはP=P−X,S=S+Xとすることで、文字間隔制御を実現している。本実施形態では、処理対象となる文書において、図3に示すような文字間透かしの有無を高速に判定する。
図1は、本実施形態における文書処理装置の主要な機能構成を示すブロック図である。図1に示すように、本実施形態における文書処理装置は、原稿入力部101、文字抽出部102、文字間隔値抽出部103、計算部104、判定部105から構成される。原稿入力部101は、記録紙上の印刷画像や電子(PDF等)画像に限らず文書画像を入力する。文字抽出部102は、入力した文書画像から文字部分のみを抽出する。文字間隔値抽出部103は、文字と文字の文字間隔値を抽出する。また、計算部104は、抽出した文字間隔値のばらつきを計算する。判定部105は、該計算結果に基づいて透かし情報の有無を判定する。
以下、本実施形態における文字間透かし情報の有無判定処理について、図2のフローチャートを用いて説明する。
まず、ステップS201において、判定部105が、文書画像に透かし情報が含まれるか否かの判定に用いる分散閾値Aを設定する。この分散閾値Aは、判定部105に保持しておけば良く、ここでは例として、分散閾値Aを1.0とする。
次に、ステップS202において、原稿入力部101が、原稿としての文書画像を入力し、原稿データIとして文字抽出部102に供給する。ここで、文書画像が紙原稿であるとすると、原稿入力部101は、電荷結合素子CCDまたは光学センサ等の読取ユニットを用いて文書画像を入力する。原稿入力部101は、画像入力指示に応じて、読取ユニットによる文書画像の撮影、電気信号処理、デジタル信号処理等を行って、原稿データIを生成する。また、文書処理装置内において原稿データIをPDF等のデータ形式で処理する場合は、原稿入力部101はその形式に従って処理を実行する。
そして、ステップS203において、文字抽出部102が、原稿データIから文字部分を抽出する。さらに、ステップS204において、文字間隔値抽出部103が、該抽出した文字の文字間隔値を順次抽出する。この際、原稿データIの全ての文字と文字間隔値を抽出する必要は無く、高速化のために予め定めた文字数、および該文字数に対応する文字間隔値を抽出するように設定にしておいても良い。
なお、本実施形態で抽出対象としている文字間透かし情報は、2つの文字間隔の大小関係によって情報を埋め込んでいるため、2つの文字間隔値を1ペアとして、全Nペアにおける2N個の文字間隔値を取得する必要がある。つまり、文字間隔値としては2の倍数個を取得すべきであり、2個が最低個数となる。以下では説明を簡便とするために、ある1行中の12個の文字間隔値を抽出する例について説明する。
本実施形態における文字間隔値の定義としては、文字と文字の間の空白部分であっても良いし、一つの文字の幅部分と空白部分の幅との和を一つの文字間隔値としても良く、装置内の処理を鑑みて最適な定義を設定すれば良い。
以上のように、ステップS204で文字間隔値を抽出すると、次にステップS205及びステップ206において、計算部104が、文字間隔値のばらつきを計算する。詳細には、ステップS205において、計算部104が、ペアとなる文字間隔値ごとに2つの文字間隔値の差を算出する。ステップS206において、計算部104が、この差におけるばらつきを計算する。
ここで、本実施形態におけるばらつき計算の具体例を示す。本実施形態では、ばらつき計算として分散を用いることとし、以下、文字間透かしの有無に応じた分散の算出例を示す。
図4に、文字間透かしが埋め込まれた文書画像における分散の算出例を示す。文字間隔値として順に17,10,12,20,・・・が抽出されたとすると、ペアごとに2つの文字間隔値の差(絶対値)を算出すると、順に7,8,8,8,・・・となる。図4に示す例は、上述した文字動作量Xを4に設定した場合であるため、ペアとなる文字間隔PとSの差は2Xとなり、理論上は8となるはずであるが、コピーによる文字の太り等の影響により、この差の平均Aveとして7.67が得られる。これらの差毎に、この平均Aveを用いて偏差の2乗の平均を計算することによって、分散Vとして0.22が得られる。
ここで、差の平均Aveを、先頭から複数個の差によって算出することで、分散Vの算出を高速化することができる。例えば、図4にある「差」の先頭からの3値である7,8,8を用いて平均Aveを算出し、以降の偏差の計算にはこの平均Aveを用いることで、すべての差の値が抽出されるのを待つこと無しに、偏差の計算を開始することができる。つまり、各文字間隔値によるシーケンシャルな処理を効率的に行うことができ、処理の高速化が図れる。
一方、原稿入力部101に透かし情報を有さない(文字間隔が操作されていない)通常原稿が入力される場合もある。このように、文字間透かしが埋め込まれていない文書画像における分散結果の一例を図5に示す。文字間隔値として順に13,14,15,17,・・・が抽出されたとすると、ペアごとに2つの文字間隔値の差(絶対値)を算出すると、順に1,2,4,・・・となる。この場合、この差の平均Aveは3.0となる。これらの差毎に、この平均Aveを用いて偏差の2乗の平均を計算することによって、分散Vとして6.0が得られる。
このように、一般に文字間透かしの有無に応じて、ペアごとの文字間隔値の差の分散が異なってくる。すなわち、文字間透かしが有る場合には分散は相対的に小さく、文字間透かしがない場合には分散は相対的に大きくなる傾向がある。
そこで、ステップS207において、判定部105が、ステップS206で算出した分散Vを、ステップS201で設定した分散閾値A=1.0と比較する。そして、V<Aである場合(ステップS207でYES)、ステップS208で「透かし情報有り」と判定する。一方、V<AでなければステップS209で「透かし情報無し」と判定する。
また、ステップS201における分散閾値設定の際には、コピーを繰り返した原稿においては文字自体の太り、つまり、文字間隔値が狭まることもあるので、その点も考慮して閾値を設定すると良い。
さらに判定精度を上げるために、差の平均Aveに閾値を設けることも有効である。すなわち、ステップS201において、分散閾値Aだけでなく、平均Aveの閾値Bも設定しておく。そして、例えば、文字動作量X=4であれば、コピーによる文字太りも考慮し、平均Aveとして2X=8に対してマージンを持たせ、閾値Bを6〜10の範囲に設定しておく。そして、ステップS207において、平均Aveが平均閾値Bの範囲内(6<Ave<10)であるという第1の条件と、分散Vが分散閾値Aより小さい(V<A)という第2の条件を考慮する。すなわち、第1および第2の条件の両方を満足する場合に、ステップS208で「透かし情報有り」と判定するようにすれば良い。
なお、本実施形態で説明した文字間透かしの有無判定に対する、さらなる性能向上策について、図6(a)を用いて説明する。図6(a)に示す文書画像601において、文字間隔値を取得するブロックを、主走査方向の矢印A,B,Cで示したように複数の箇所に設定しておくことが有効である。その際の文字間透かしの有無の判定方法としては、矢印A,B,Cの少なくとも一つ、もしくは全てにおいて、得られた分散が分散閾値Aより低い場合に「透かし情報有り」と判定することが考えられる。
また、矢印A、B、Cについて、簡単に説明するために、本実施形態では、これら3箇所を明示して説明しているが、実際には、矢印A、B、C以外にも副走査方向に矢印は存在する。よって、副走査方向に4つ以上、周期的かつ離散的に矢印が点在している場合もここでの説明内容に含まれる。また点在する矢印の数は、原稿のサイズ(A4、A3等)に応じて適宜変化させるべきである。
もし、矢印A、B、C、…の少なくとも一つにおける分散が分散閾値Aより低い場合に「透かし情報有り」と判定するモード(第1モードとする)を採用することを想定する。この場合、文書画像中の一部にでも透かし情報が埋め込まれていそうなブロック(文字列)を検出できたときに「透かし情報有り」と判定することができる。即ち、この判定は、透かし情報の存在について反応性が良い判定である。
一方、もし、矢印A、B、C、…の全てにおいて、得られた分散が分散閾値Aより低い場合に「透かし情報有り」と判定するモード(第2モードとする)を採用すると想定する。この場合、文書画像中の全てに透かし情報が埋め込まれていないと「透かし情報有り」と判定しない。よって、この判定は、透かし情報の存在について反応性は悪い。しかしながら、「透かし情報有り」と誤判定してしまうことによる後段の無駄な処理を発生することを抑制することができるという効果がある。
また、本実施形態では、上記第1モードと第2モードの設定あるいは切替を、ユーザが必要に応じて、所定の入力・指示部から入力・指示することができる。
なお、上記第1、第2モードとして説明した判定方法の更なる改良として、以下のような判定方法(第3モード)を利用することも有効である。本実施形態では、第1、第2モードの代わりとして、またはこれらモードと並列して第3モードが利用できる。第3モードでは、矢印A、B、C、…のうち、得られた分散が分散閾値Aより低いものが、所定の割合以上あった場合に「透かし情報有り」と判定する。
具体例として、副走査方向に点在する矢印(A、B、C、…)が20個からなり、かつ、各矢印の部分で得られた分散が分散閾値Aより低いものが10個あった場合を考える。この場合、「透かし情報有り」と判定された判定箇所(矢印)は50%であり、所定の割合(ここでは40%とする)を超えていると判定する。注目する点は、この第3モードにおいては、上記閾値の役割となる割合(40%)をユーザによって変更することができる点である。よって、この割合を0.01%とすれば、第1モードと同様の判定もできる。また、この割合を99.9%とすれば第2モードと同様の判定もできる。この第3モードの判定基準となる割合の設定は、上述した所定の入力・指示部からユーザが入力・指示できる。
以上においては、副走査方向に複数個の判定箇所(矢印A、B、C、…)を配置することを説明したが、より精度の高い判定をするためには、主走査方向へも離散的に判定箇所(矢印)を配置することが好ましい。具体的には、矢印Aで示す判定領域と同ラインにおいて、矢印Aとは少し離れた位置に存在する矢印A’を配置する。同じく、矢印Bで示す判定領域と同ラインにおいて、矢印Bとは少し離れた位置に存在する矢印B’を配置する。同様に、矢印C’を配置する。不図示の他の矢印Z(Zは変数)についても、同様に矢印Z’を配置する。
そして、これら全ての矢印について、それぞれ上述した「透かし情報有り」であるか「透かし情報無し」であるかの判定を行う。そして、各矢印に対する判定結果は、上述した第3モードの判定手法に基づいて、文書画像の全体として「透かし情報有り」であるか「透かし情報無し」であるかの判定が行われる。このようにすることにより、主走査方向と副走査方向の2次元方向において、離散的に透かし情報の有無を判定することになり、判定の精度はより高くなるであろう。
更に、ユーザには予想できない構造の文書画像にも対応するために、図6(b)の矢印のようにランダムな位置から文字間隔値を取得する方法も有効である。この場合、文書画像602におけるDの領域内(換言すれば、各行の最後尾に相当する領域)に該当する矢印からの文字間隔値の取得は注意を要する。背景技術として説明した図3の文字間透かし方法において、一行の文字数が偶数個であれば、最後の文字とその前の文字の間隔値は分散の計算から除外する必要がある(埋め込み時にこの2つの文字は動かしていないため)。
そのために、一行の文字数を行頭(図6では左端)からあらかじめ数え、結果が偶数であれば、この最後の文字間隔値を計算から除外する処理を行う。これにより正確な分散の計算が行える利点がある。もしくは、行末(図6では右端)から行頭に向けて処理を行う場合、次のような判定を行なう。つまり、「1.行末から数え最初の文字間隔値からペアを作っていき分散を計算して判定した判定結果」と、「2.行末から数え2番目の文字間隔値からペアを作っていき分散を計算して判定した判定結果」とを求める。そして、これらの1と2における判定結果の内、いずれかが「透かし情報有り」と判定できれば、最終的に「透かし情報有り」と判定するようにすればよい。これにより、一行全体の文字間隔値を数える必要がないので高速に透かし情報有無の判定が行えるという利点がある。
以上説明した様に第1実施形態によれば、文書画像における文字間隔のばらつきに基づいて文字間透かし情報の有無を判定する。したがって、文書画像に対して実際に埋め込まれた値をデータ列として抽出・検証する場合と比べて、高速かつ確実に、文字間透かし情報の有無を判定することが可能となる。
これにより、文字間透かしの有無によって入力文書に対する処理を切り替えるシステムにおいて、適切な処理が高速に行えるため、システム全体としての処理効率が向上する。例えば、複写機において文字間透かしに基づく複写許可制御を行う場合にも、複写動作を遅延させることがない。
<第2実施形態>
以下、本発明に係る第2実施形態について説明する。第2実施形態は、上述した第1実施形態の変形例として実現される。すなわち、第1実施形態では、1文字おきに文字を動かして文字間隔を制御することで、文字間透かしを埋め込んだ文書画像を処理する例を示している。第2実施形態では、「句読点」等については意図的に文字間隔制御を禁止する文書画像を処理対象とする。
以下、本発明に係る第2実施形態について説明する。第2実施形態は、上述した第1実施形態の変形例として実現される。すなわち、第1実施形態では、1文字おきに文字を動かして文字間隔を制御することで、文字間透かしを埋め込んだ文書画像を処理する例を示している。第2実施形態では、「句読点」等については意図的に文字間隔制御を禁止する文書画像を処理対象とする。
例えば、図7に示すように、動かす対象文字が「句読点」等である場合には、これを動かしてしまうと、場合によっては句読点が右にずれて右横の外接矩形に近づき、文書に違和感が生じてしまう。このような場合、句読点を意図的に動かさないことで、むしろ文書品質を維持することができる。このように「句読点」等を動かさない文書画像を処理対象とした場合、第1実施形態によって文字間透かし情報を抽出すると、以下のような不具合が発生する。すなわち、該動かさない文字の前後の文字間隔値(図7ではP2とS2)を含んで分散が算出されるため、文字間透かしの有無判定を誤ってしまう可能性がある。そこで、第2実施形態では、文字間透かし情報の抽出時に、「句読点」等については移動されないものとして検出を行い、この部分については文字間透かし情報抽出を禁止することを特徴とする。
以下、第2実施形態における文字間透かし有無の判定処理について、特に上述した第1実施形態との相違点を中心に説明する。なお、第2実施形態における文書処理装置の構成は、上述した第1実施形態における図1と同様であるため、ここでは説明を省略する。
図8は、第2実施形態における文字間透かし情報の有無判定処理を示すフローチャートである。
まず、ステップS801において、判定部105が、文書画像に透かし情報が含まれるか否かの判定に用いる分散閾値Aと、文字間隔値の適正な差を選択するための適正差閾値Bを設定する。この分散閾値Aおよび適正差閾値Bは、第1実施形態と同様に、判定部105に保持しておけば良く、ここでは例としてA=1.0、B=20とする。
次に、ステップS802〜S805において、第1実施形態のステップS202〜S205と同様に、入力された原稿から文字部分を抽出して、文字間隔値を取得し、さらにペアとなる文字間隔値ごとに2つの文字間隔値の差を算出する。
ここでは、例として、図9に示すように、ある1行中の12個の文字間隔値を抽出するとし、この中に句読点部分が含まれているとする。すなわち、文字間隔値として順に17,10,12,20,・・・,10,60が抽出されたとすると、ペアごとに2つの文字間隔値の差(絶対値)を算出すると、順に7.0,8.0,・・・,7.0,50.0となる。この場合、最後の2つの文字間隔値10と60が読点部分に相当し、その差は50.0である。
以上のように、ステップS805において、ペア毎の差が算出されると、次に、ステップS806及びステップS807において、この差におけるばらつきを計算する。すなわち、まずステップS806で、各差をステップS801で設定した適正差閾値B=20と比較することにより、適正な差を選別する。具体的には、例えば、図9に示す各差のうち、適正差閾値B=20を超えるもの、すなわち「50.0」を、ばらつきの算出対象から除外する。そして、ステップS807において、残った差(図9の黒枠内)を用いて、第1実施形態と同様に分散Vを計算する。図9に示す例においては、50.0を除外した差から平均Aveを算出することによって、分散Vとして0.24が得られる。
そして、ステップS808において、判定部105において、ステップS807で算出した分散V=0.24を、ステップS201で設定した分散閾値A=1.0と比較する。この場合、V<Aであるため、ステップS809において、「透かし情報有り」と判定する。一方、V<Aでない場合、ステップS810において、「透かし情報無し」と判定して、処理を終了する。
なお、第2実施形態では、不適正な差を除外し、残った差を用いて分散を計算する例を示しているが、これに限定されず、除外した分の文字間隔の数を補充してから、平均、分散を計算するようにしても良い。
また、除外対象となる差を決定する方法としても、第2実施形態のように、差の値によって決定する以外に、文字間隔値もしくは分散の値に基づいて、除外対象を決定するようにしても良い。
また、第2実施形態では「句読点」によって文字間隔の差が大きくなる場合の対策を示したが、別の課題として、「カンマ」等、文字間隔の差が小さくなる場合や、文書上のノイズや追記等によって不適当な文字間隔値を取得してしまう場合が考えられる。その対策としては、ステップS806で適正な差を選別する際に、複数の差のうち、中間に該当する差を選別して利用することが考えられる。例えば、6個の文字間隔値の差が7,8,8,7,2,50であった場合、最大値である50と最小値である2を省いた残り4個の値(7,8,8,7)を用いて、分散を計算する。これにより、より適切な分散を算出することができ、透かし情報有無の判定の信頼度を向上させることができる。なお、ここでは中間に該当する値を用いる例を示したが、除外対象を最小値のみまたは最大値のみとする当、ユースケースに応じて不適切な差の除外基準を設定すれば良い。
以上説明した様に、第2実施形態によれば、文書品質を保つために「句読点」等については文字間隔制御を禁止する文書画像についても、高速かつ確実に透かし情報の有無を判定することができる。
なお、第1および第2実施形態においては、計算部104において分散を算出し、判定部105で閾値と比較する例を示したが、偏差や標準偏差等、入力値のばらつきを示す値であれば分散に代えて適用可能である。
また、第1および第2実施形態においては、図3に示すような、1ペアの文字間隔の大小関係によって透かし情報が埋め込まれた文書画像を処理対象として説明した。しかしながら、本発明において処理対象となりうる文書画像における文字間透かしは、他の方法によって埋め込まれていても良い。例えば、最初の文字間隔を基準文字間隔として、この基準文字間隔と他の文字間隔との差分によって順次情報を埋め込む等、文字間隔を操作して透かし情報を埋め込む方法であれば本発明は適用可能である。
また、第1および第2実施形態では横書きの文書画像に対して文字間透かしの有無判定を行う例を示したが、縦書きの文書に対しても本実施形態が同様に適用できることは言うまでもない。
<第3実施形態>
以下、本発明に係る第3実施形態について説明する。第3実施形態においては、上述した第1および第2実施形態による透かし情報の有無判定処理を、実際の透かし情報の抽出時に利用する例を示す。
以下、本発明に係る第3実施形態について説明する。第3実施形態においては、上述した第1および第2実施形態による透かし情報の有無判定処理を、実際の透かし情報の抽出時に利用する例を示す。
図11(a)は、第3実施形態における文書処理装置の主要な機能構成を示すブロック図であり、上述した第1実施形態で図1と同様の構成には同一番号を付し、説明を省略する。図11においては、判定部105の指示に応じて透かし情報の抽出を行う透かし情報抽出部106を備えることを特徴とする。
図12は、第3実施形態における文字間透かし情報の抽出処理を示すフローチャートである。
ここでは、入力画像として図10に示す形式の文書画像1001を想定し、該文書画像1001に対して透かし情報の抽出を行う例を示す。文書画像1001には、文字列Dから文字列Eまでの文書領域Bにのみ文字間透かし情報が埋め込まれており、残る標題Aおよび文書領域Cの文字列には透かし情報は埋め込まれていないものとする。
まず、ステップS1201において、判定部1105が、第1実施形態と同様に、文書画像に透かし情報が含まれるか否かの判定に用いる分散閾値Aを設定する。この分散閾値Aは、判定部1105に保持しておけば良く、ここでは例としてA=1.0とする。
次にステップS1202において、原稿入力部1101が、原稿として図10に示す文書画像1001を入力し、原稿データIとして文字抽出部1102に供給する。
そして、ステップS1203において、文字抽出部102が、原稿データIを文字認識技術を利用してブロック分割し、該ブロック分割された領域から文字列を切り出す、所謂行切りを行う。例えば、図10に示す文書画像1001であれば、ブロック分割によって標題A,文書領域B,文書領域Cが抽出され、さらに行切りにより、標題Aである文字列、文書領域B内の文字列DからEまで、文書領域C内の文字列F以降、の各行が抽出される。
続いて、ステップS1204において、文字抽出部1102が、まず、最初の一行分(図10では標題A)について、各文字の外接矩形を抽出(文字切り)する。この際、行内の全ての文字と文字間隔値を抽出する必要は無く、高速化のために予め定めた文字数、および該文字数に対応する文字間隔値を抽出するように設定にしておいても良い。そして、ステップS1205において、文字間隔値抽出部1103が、該抽出した文字の文字間隔値を順次抽出する。
以上のように、ステップS1205で文字間隔値を抽出すると、次にステップS1206及びステップS1207において、計算部1104が、文字間隔値のばらつきを計算する。詳細には、ステップS1206において、計算部1104が、ペアとなる文字間隔値ごとに2つの文字間隔値の差を算出する。ステップS1207において、計算部1104が、この差における分散Vを算出する。
次に、ステップS1208において、判定部1105が、分散Vと分散閾値Aを比較する。この場合、図10に例示する標題Aには透かし情報は入っていないため、分散V>分散閾値Aとなり、ステップS1210に進む。ステップS1210において、判定部1105が、現在の処理行が最後の行であるか否かを判定し、最後の行ではないためステップS1204に戻る。
ステップS1204において、図10に示す標題Aの次の行である文字列Dの一行分について、各文字の外接矩形を抽出する。
この場合、図10において文字列Dを含む文書領域Bには透かし情報が入っている。そのため、ステップS1205〜S1207によって算出される分散Vは、ステップS1208で分散V<分散閾値Aとなる。この場合、ステップS1209に進み、透かし情報抽出部106が、判定部105の指示に従って、文字列Dから透かし情報の抽出を行う。その後、ステップS1210に進み、最後の行の処理が終了するまで、ステップS1204からの処理を繰り返す。
このように、第3実施形態によれば、最後の行まで一行ずつ、透かし情報の有無判定を行い、透かし情報が有ると判定された行のみに対し、透かし情報の抽出を試みる。例えば、図10に示す例では、透かし情報を含む文書領域Bの文字列のみに対して情報抽出を試み、透かし情報を含まない標題Aと文書領域Cに対しては情報抽出を行わない(禁止する)。
なお、第3実施形態では一行ずつ透かし情報の有無判定を行う例を示しているが、これに限定されず、各文書領域の最初の行だけについて、判定を行っても良く、これにより、処理全体を更に高速化できる。例えば、図10に例示した文書画像1001であれば、まず、文書領域Bの先頭文字列Dを判定し、該判定結果が「透かし情報有り」であれば、文書領域B全体に対して一気に透かし情報の抽出を行う。そして、次に、文書領域Cの先頭文字列Fを判定し、判定結果が「透かし情報無し」であれば、そこで処理を終了する。
以上説明した様に第3実施形態によれば、同一文書画像内で透かし情報が入っている領域と、入っていない領域が混在している場合にも、透かし情報が入っている領域を高速に特定し、効率的な情報抽出を行うことが可能である。
<第4実施形態>
本実施形態では、第1乃至3実施形態の文書処理装置を組み込んだ、複合機(MFP:Multi Function Peripheral)の制御について説明する。本実施形態で説明しない動作については、上述の第1乃至3実施形態で説明した動作を行っているものとする。
本実施形態では、第1乃至3実施形態の文書処理装置を組み込んだ、複合機(MFP:Multi Function Peripheral)の制御について説明する。本実施形態で説明しない動作については、上述の第1乃至3実施形態で説明した動作を行っているものとする。
図11(b)は、本実施形態における文書処理装置の主要な機能構成を示すブロック図である。図11(b)は、図1(a)の機能構成に対して、MFP制御部1107、プリンタ等の出力部1108、表示部1109が追加されている。
MFPのユースケースの一例として、不正コピー防止機能がある。これは、機密文書等に透かし情報を埋め込んでおき、無条件にコピーさせることを防ぐ機能である。
まず、ユーザは、MFPを使って文書のコピーを実行する。具体的には、スキャナとなる原稿入力部1101に文書をセットし、表示部1109を用いてコピー処理の指示を行う。
その後の処理は、第1及び第2実施形態と同様に透かし情報の有無の判定を行う(図2のフローチャート)。ここでは、詳細説明は割愛し、判定部1105での透かし情報の有無の判定後の処理を説明する。
まず、判定部1105で、「透かし情報有り」と判定された場合は、透かし情報抽出部1106は、文書画像全体の透かし情報の抽出を行い、その透かし情報をMFP制御部1107に通知する。MFP制御部1107では、透かし情報から機密文書であると判定した場合は、コピー処理を強制終了する。そして、表示部1109に、例えば、「コピー禁止文書です」のような通知を表示する。別の方法として、判定部1105で「透かし情報有り」と判定された段階で、MFP制御部1107で機密文書であると判定するようにしてもよい。
まず、判定部1105で、「透かし情報有り」と判定された場合は、透かし情報抽出部1106は、文書画像全体の透かし情報の抽出を行い、その透かし情報をMFP制御部1107に通知する。MFP制御部1107では、透かし情報から機密文書であると判定した場合は、コピー処理を強制終了する。そして、表示部1109に、例えば、「コピー禁止文書です」のような通知を表示する。別の方法として、判定部1105で「透かし情報有り」と判定された段階で、MFP制御部1107で機密文書であると判定するようにしてもよい。
一方、判定部1105で「透かし情報無し」と判定された場合は、透かし情報抽出部1106は、その結果をMFP制御部1107に通知する。次に、MFP制御部1107では、「透かし情報無し」なので機密文書でないと判定し、出力部1108より、原稿入力部1101で読み取った文書画像をそのまま出力する。つまり、コピー処理を実行する。表示部1109には、例えば、「コピー終了」のような通知を表示する。
MFPでのその他のユースケースとしては、機密文書の情報漏洩追跡がある。これは、機密文書等に透かし情報として、印刷日時、印刷者、配布先者、MFP個体番号等の情報漏洩追跡用(印刷元特定用)の透かし情報を埋め込んだ文書画像を印刷する。そして、機密文書が外部に漏洩し、その後、文書が入手できれば、MFPを使って本発明による「透かし情報有無」を判定し、判定の結果、「透かし情報有り」となったら、文書全体から透かし情報を抽出、分析することで漏洩元を追跡(特定)できる。印刷者等の漏洩元を追跡する一連の情報をID番号で管理できるのであれば、透かし情報としてID番号だけを埋め込む方法でもよい。
以上説明した様に、第4実施形態によれば、第1乃至第3実施形態の構成を利用することで、不正コピー防止機能や情報漏洩追跡機能を高速に実現することができる。具体的には、透かし情報の有無の判定結果に基づいて、文書画像を出力する制御の制御内容を表示部に通知することができる。
<第5実施形態>
以下、本発明に係る第5実施形態について説明する。第5実施形態においては、上述した第1乃至第4実施形態に係る処理を、コンピュータシステムにおいて行なうことを特徴とする。
以下、本発明に係る第5実施形態について説明する。第5実施形態においては、上述した第1乃至第4実施形態に係る処理を、コンピュータシステムにおいて行なうことを特徴とする。
図13は、第5実施形態におけるコンピュータシステムの基本構成を示すブロック図である。このコンピュータシステムにおいて、上述した各実施形態における全ての機能を実行させるには、各機能構成をプログラムにより表現し、このコンピュータシステムに読み込ませることになる。
図13において、1301はCPUであり、RAM1302やROM1303に格納されているプログラムやデータを用いて、システム全体の制御を行うと共に、上述した各実施形態で説明した各処理を行なう。1302はRAMであり、外部記憶装置1308からロードされたプログラムやデータ、他のコンピュータシステム1314からI/F(インターフェース)1315を介してダウンロードしたプログラムやデータを一時的に記憶するエリアを備える。RAM1302はまた、CPU1301が各種の処理を行なうために必要とする作業用エリアを備える。1303はROMであり、コンピュータシステムにおける機能プログラムや設定データ等を記憶する。
1304はディスプレイ制御装置であり、画像や文字等をディスプレイ1305に表示させるための制御を行なう。1305はディスプレイであり、画像や文字などを表示する。なお、ディスプレイ1305としてはCRTや液晶画面などが適用可能である。1306は操作入力デバイスであり、キーボードやマウス等、CPU1301に各種のユーザ指示を入力可能なデバイスにより構成される。1307は、操作入力デバイス1306を介して入力された各種の指示等を、CPU1301に通知するためのI/Oである。1308は、ハードディスク等の大容量情報記憶装置として機能する外部記憶装置であり、OS(オペレーティングシステム)や上記各実施形態に係る処理をCPU1301に実行させるためのプログラム、入出力原稿画像、等を記憶する。外部記憶装置1308への情報の書き込みや、外部記憶装置1308からの情報の読み出しは、I/O1309を介して行われる。
1310は文書や画像を印刷出力するためのプリンタであり、出力データはI/O1311を介してRAM1302、もしくは外部記憶装置1308から送られる。なお、プリンタ1310としては、例えばインクジェットプリンタ、レーザビームプリンタ、熱転写型プリンタ、ドットインパクトプリンタなどが挙げられる。1312は文書や画像を読み取るためのスキャナであり、入力データはI/O1313を介してRAM1302、もしくは外部記憶装置1308に送られる。そして1316は、CPU1301、ROM1303、RAM1302、I/O1311、I/O1309、ディスプレイ制御装置1304、I/F1315、I/O1307、I/O1313を繋ぐバスである。
以上説明したように第5実施形態によれば、上述した第1乃至第4実施形態で示した文字間透かし情報の有無判定、および透かし情報の検出処理を、コンピュータシステムにおいて実現することが可能となる。
なお、第5実施形態では、上記第1乃至第4実施形態の機能を実現するためのプログラムを用意し、これをCPU901の制御の下に実行する例を示したが、その一部を専用のハードウェア回路等によって実現するようにしても良い。この専用ハードウェア回路としては、スキャナ1312やプリンタ1310等の外部装置内に備えられたものを適用することも可能である。
なお、上記各実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体(コンピュータ可読記憶媒体)を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が、そのプログラムを読み出して実行する処理である。
Claims (16)
- 文書画像に対し、文字間隔を利用した透かし情報が埋め込まれているか否かを判定する文書処理装置であって、
文書画像を入力する入力手段と、
前記文書画像における文字間隔値を抽出する文字間隔値抽出手段と、
前記文字間隔値のばらつきを算出する計算手段と、
前記計算手段で算出されたばらつきの値を、予め設定された閾値と比較することによって、前記文書画像に透かし情報が埋め込まれているか否かを判定する判定手段と、
を有することを特徴とする文書処理装置。 - 前記文字間隔値抽出手段は、予め設定された数の文字間隔値を抽出する
ことを特徴とする請求項1に記載の文書処理装置。 - 前記文字間隔値抽出手段は、前記予め設定された数の文字間隔値として、2の倍数個の文字間隔値を抽出する
ことを特徴とする請求項2に記載の文書処理装置。 - 前記計算手段は、2個の文字間隔値を1ペアとしてその差を求め、各ペアにおける差についてのばらつきを算出する
ことを特徴とする請求項1乃至3のいずれか1項に記載の文書処理装置。 - 前記判定手段は、前記ばらつきの値が前記閾値よりも小さく、かつ、前記各ペアにおける差の平均が予め設定された範囲内である場合に、前記文書画像に透かし情報が埋め込まれていると判定する
ことを特徴とする請求項4に記載の文書処理装置。 - 前記計算手段は、予め設定された複数個の差の平均を求め、該平均を用いて前記ばらつきを算出する
ことを特徴とする請求項5に記載の文書処理装置。 - 前記計算手段は、前記各ペアにおける差のうち、予め設定された適正差閾値を超えるものは前記ばらつきの算出対象から除外する
ことを特徴とする請求項5または6に記載の文書処理装置。 - 前記判定手段は、前記ばらつきの値が前記閾値よりも小さい場合に、前記文書画像に透かし情報が埋め込まれていると判定する
ことを特徴とする請求項1乃至4のいずれか1項に記載の文書処理装置。 - 前記判定手段で前記文書画像に透かし情報が埋め込まれていると判定された場合に、該透かし情報を抽出する透かし情報抽出手段を更に有する
ことを特徴とする請求項1乃至8のいずれか1項に記載の文書処理装置。 - 前記計算手段は、前記ばらつきとして分散を算出する
ことを特徴とする請求項1乃至9のいずれか1項に記載の文書処理装置。 - 前記計算手段は、前記ばらつきとして偏差もしくは標準偏差を算出する
ことを特徴とする請求項1乃至9のいずれか1項に記載の文書処理装置。 - 前記判定手段の判定結果に基づいて、前記文書画像の出力を制御する制御手段と、
前記制御手段による制御内容を表示する表示手段と
を更に有することを特徴とする請求項1乃至11のいずれか1項に記載の文書処理装置。 - 前記透かし情報として、情報漏洩追跡用の透かし情報を埋め込んだ文書画像を印刷する印刷手段を更に備え、
前記判定手段の判定の結果、前記情報漏洩追跡用の透かし情報が前記入力手段で入力した文書画像に含まれる場合、該情報漏洩追跡用の透かし情報を抽出、分析することで、該文書画像の漏洩元を特定する
ことを特徴とする請求項1乃至12のいずれか1項に記載の文書処理装置。 - 文書画像に対し、文字間隔を利用した透かし情報が埋め込まれているか否かを判定する文書処理方法であって、
文書画像を入力する入力ステップと、
前記文書画像における文字間隔値を抽出する文字間隔値抽出ステップと、
前記文字間隔値のばらつきを算出する計算ステップと、
前記計算ステップにおいて算出されたばらつきの値を、予め設定された閾値と比較することによって、前記文書画像に透かし情報が埋め込まれているか否かを判定する判定ステップと、
を有することを特徴とする文書処理方法。 - 文書画像に対し、文字間隔を利用した透かし情報が埋め込まれているか否かを判定する文書処理を、コンピュータに機能させるためのプログラムであって、
文書画像を入力する入力手段と、
前記文書画像における文字間隔値を抽出する文字間隔値抽出手段と、
前記文字間隔値のばらつきを算出する計算手段と、
前記計算手段で算出されたばらつきの値を、予め設定された閾値と比較することによって、前記文書画像に透かし情報が埋め込まれているか否かを判定する判定手段と、
して機能させることを特徴とするプログラム。 - 請求項15に記載のプログラムを記憶したコンピュータ可読記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009175801A JP2010124451A (ja) | 2008-10-24 | 2009-07-28 | 文書処理装置および文書処理方法 |
US12/604,461 US8401971B2 (en) | 2008-10-24 | 2009-10-23 | Document processing apparatus and document processing method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008274869 | 2008-10-24 | ||
JP2009175801A JP2010124451A (ja) | 2008-10-24 | 2009-07-28 | 文書処理装置および文書処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010124451A true JP2010124451A (ja) | 2010-06-03 |
Family
ID=42117531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009175801A Withdrawn JP2010124451A (ja) | 2008-10-24 | 2009-07-28 | 文書処理装置および文書処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8401971B2 (ja) |
JP (1) | JP2010124451A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567938B (zh) * | 2010-12-23 | 2014-05-14 | 北大方正集团有限公司 | 用于西文水印处理的水印图像分块方法和装置 |
KR20160026906A (ko) * | 2013-05-24 | 2016-03-09 | 라이프 테크놀로지스 코포레이션 | 시스템에서 소모품의 검출을 위한 방법 및 시스템 |
GB2572386B (en) * | 2018-03-28 | 2021-05-19 | Canon Europa Nv | An image processing system and an image processing method |
CN113656836B (zh) * | 2021-08-25 | 2023-10-27 | 北京百度网讯科技有限公司 | 文档处理方法、装置、设备、存储介质和计算机程序产品 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2713911B2 (ja) * | 1987-07-08 | 1998-02-16 | 株式会社東芝 | 郵便物処理装置 |
JP3728209B2 (ja) | 2001-01-30 | 2005-12-21 | キヤノン株式会社 | 画像処理方法及び装置及びコンピュータプログラム及び記憶媒体 |
US7039215B2 (en) * | 2001-07-18 | 2006-05-02 | Oki Electric Industry Co., Ltd. | Watermark information embedment device and watermark information detection device |
US20040001606A1 (en) * | 2002-06-28 | 2004-01-01 | Levy Kenneth L. | Watermark fonts |
EP1398732A3 (en) * | 2002-09-04 | 2006-09-27 | Matsushita Electric Industrial Co., Ltd. | Digital watermark-embedding and detecting |
US8014557B2 (en) * | 2003-06-23 | 2011-09-06 | Digimarc Corporation | Watermarking electronic text documents |
JP4956363B2 (ja) * | 2007-10-10 | 2012-06-20 | キヤノン株式会社 | 情報処理装置及びその制御方法 |
JP2010124450A (ja) * | 2008-10-24 | 2010-06-03 | Canon Inc | 文書処理装置および文書処理方法 |
-
2009
- 2009-07-28 JP JP2009175801A patent/JP2010124451A/ja not_active Withdrawn
- 2009-10-23 US US12/604,461 patent/US8401971B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20100104130A1 (en) | 2010-04-29 |
US8401971B2 (en) | 2013-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4310288B2 (ja) | 画像処理装置及びその方法、プログラム並びに記憶媒体 | |
EP2341466B1 (en) | Method and apparatus for authenticating printed documents using multi-level image comparison based on document characteristics | |
JP2010187376A (ja) | 文書画像サイズ変更方法 | |
KR100741627B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및 기억매체 | |
JP2010003087A (ja) | 画像処理装置および画像処理方法 | |
US8416464B2 (en) | Document processing apparatus and document processing method | |
JP2010056689A (ja) | 画像処理装置及び画像処理方法 | |
JP2010124451A (ja) | 文書処理装置および文書処理方法 | |
US8780404B2 (en) | Information processing apparatus, method for controlling same, and storage medium on which computer program has been recorded | |
JP5049922B2 (ja) | 画像処理装置及び画像処理方法 | |
JP4928998B2 (ja) | 画像形成装置、及び画像形成方法 | |
JP2020198085A (ja) | 画像処理装置、画像処理プログラム及び画像処理方法 | |
JP2010103862A (ja) | 文書処理装置および文書処理方法 | |
JP2005217859A (ja) | 画像形成装置及び画像形成方法 | |
JP3796425B2 (ja) | 画像処理装置及び方法並びにコンピュータプログラム及び記録媒体 | |
JP6025475B2 (ja) | 像域判定装置、像域判定方法、及び画像処理装置 | |
JP4361457B2 (ja) | 画像形成装置およびプログラム | |
JP2009141525A (ja) | 画像処理装置及び画像処理方法 | |
JP2008098946A (ja) | 画像処理装置及びその制御方法 | |
JP3720748B2 (ja) | 画像処理装置及びその制御方法並びにコンピュータプログラム及び記録媒体 | |
JP4360418B2 (ja) | 画像処理装置、ビューワ、画像処理プログラム及び画像処理システム | |
KR20070074204A (ko) | 특정 객체를 고해상도로 이미지 처리하는 프린터 드라이버및 이미지 처리 방법 | |
JP2007299321A (ja) | 情報処理装置、情報処理方法、情報処理プログラム、及び、情報記憶媒体 | |
JP5173690B2 (ja) | 情報処理装置及び情報処理方法、並びに、コンピュータプログラム及びコンピュータ可読記録媒体 | |
JP2019195117A (ja) | 情報処理装置、情報処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20121002 |