JP4164458B2 - 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 - Google Patents

情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 Download PDF

Info

Publication number
JP4164458B2
JP4164458B2 JP2004064492A JP2004064492A JP4164458B2 JP 4164458 B2 JP4164458 B2 JP 4164458B2 JP 2004064492 A JP2004064492 A JP 2004064492A JP 2004064492 A JP2004064492 A JP 2004064492A JP 4164458 B2 JP4164458 B2 JP 4164458B2
Authority
JP
Japan
Prior art keywords
character
image
information
character image
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004064492A
Other languages
English (en)
Other versions
JP2005253004A (ja
JP2005253004A5 (ja
Inventor
貴巳 江口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004064492A priority Critical patent/JP4164458B2/ja
Publication of JP2005253004A publication Critical patent/JP2005253004A/ja
Publication of JP2005253004A5 publication Critical patent/JP2005253004A5/ja
Application granted granted Critical
Publication of JP4164458B2 publication Critical patent/JP4164458B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、文書画像への情報の埋め込み、並びに、埋め込まれた情報を抽出する技術に関するものである。
近年、文字データ、画像データ、音声データなどメディアの電子化やネットワーク化が促進されていくなかで、デジタルデータそのものの不正コピー防止や、デジタルデータとメタデータの関連付けが求められている。
一方、文書・画像において配布形態は依然として印刷物で行われることが多い。このように、デジタルデータと印刷物とが併用されているので、デジタルデータを印刷物として配布する際の配布先の形態や、印刷物とデジタルデータとをリンクさせるような何らかの手段が求められてきている。
このような状況において、静止画などの多値画像や文書画像については、電子透かしによって透かし情報を埋め込む手法が提案されてきており、注目されている。電子透かしによる埋め込みとは、ディジタルの画像データや音声データ、文字データなどに人に知覚出来ないようにオリジナルデータの一部を変更して透かし情報を埋め込む技術のことを言う。
多値画像に対する電子透かし技術としては、一般的に画素の濃度の冗長性を利用した種々の方法が知られている。例えば、各画素値を変化させて埋め込む方法である(非特許文献1)。
一方、文字等で構成される文書画像のような二値画像は冗長度が少なく、電子透かし技術を実現するのが難しいが、文書画像特有の特徴を利用した電子透かし方法がいくつか知られている。例えば、行のベースラインを動かす方法(特許文献1)、単語間空白長を操作する方法(特許文献2、特許文献3)、文字間の空白長を操作する方法(非特許文献2)、文字を回転して傾斜を変化させる方法(非特許文献3)などが挙げられる。
ここでは、文字間の空白長を操作して情報を埋め込む方法を図19と図20を用いて説明する。
図19は、透かし情報の埋め込み前の文書画像の一部を示している。また、図20は、図19の文書画像の一部に対して透かし情報を埋め込んだ後の文書画像の一部を示す図である。
図19に示される各文字間の空白長P0、S0、P1、S1は、透かし情報が埋め込まれると、図20に示される各文字間の空白長P0’、S0’、P1’、S1’になる。図19及び図20では、文字が5文字、文字間の空白が4つある。埋め込む情報1ビットに対して2つの空白長を割り当てることになるので、4つの空白によって2ビットの情報を埋め込むことが可能である。
従って、今、バイナリ(二進)の「01」を埋め込む場合には、図19においてP0とS0との間の「子」という文字画像を左に、P1とS1との間の「か」という文字画像を右にシフト(移動)させて、図20に示す様な文書画像を生成することになる。
図22は、文字を回転して傾斜を変化させることによる電子透かしによって透かし情報が埋め込まれた場合の文字画像を示している。例えば,時計回りに回転された場合に「1」が埋め込まれ(図22における1)、反時計回りに回転された場合に「0」が埋め込まれるものとする(図22における2)。図22では,「透」の文字画像が時計回りに回転され、また「し」の文字画像が反時計回りに回転されているので、この場合にはバイナリで「10」という情報が埋め込まれていることになる。
Techniques for data hiding W. Bender, D. Gruhl, N. Morimoto, A. Lu IBM Systems Journal, vol.35, nos.3&4, 1996. King Mongkut大学による"Electronic document data hiding technique using inter-character space", The 1998 IEEE Asia-Pacific Conf. On Circuits and Systems,1998,pp.419-422.) "和文書へのシール画像による電子透かし"(中村康弘,松井甲子雄),情報処理学会論文誌 Vol.38 No.11 Nov. 1997. 特許第3136061号公報 米国特許第6086706号公報 特開平9−186603号公報
上記のように、文書用電子透かしにおいて、外接矩形の回転や、前後の空白の大小関係や、非隣接の大小関係、行をまたがる外接矩形間距離の大小関係など、さまざまな情報を利用して情報を埋め込む方法が提案されている。しかしながら、あらかじめ外接矩形が傾いていたり、文字間の空白長を操作する方法では、外接矩形間の位置関係から、どうしても情報を埋め込めない場所が生じてしまう。例えば、文字画像をシフトする場合を考察する。このとき、図21に示す如く、注目文字画像とその隣接する文字画像との距離が1画素の場合、注目文字画像の位置をいずれに移動したとしても、その移動方向にある隣接文字と接してしまう。これでは、外接矩形が正しく認識されなくなるので、埋め込まれた情報を抽出する側で正しく情報抽出を行うことができない。これは、文字回転の場合も同様である。
本発明はかかる問題点に鑑みなされたものであり、文書画像中に、文字間が狭い部分に対する埋め込み可能性を高くし、以って、より多くの情報埋め込みを可能にする技術を提供しようとするものである。
この課題を解決するため、例えば本発明の情報処理装置は以下の構成を備える。すなわち、
文書画像に情報を埋め込む情報処理装置であって、
入力した文書画像中の各文字画像の外接矩形の位置とサイズに関する情報を抽出する抽出手段と、
抽出した各文字画像の位置と外接矩形のサイズを示す情報を、文字の並び方向である行を単位に記憶する記憶手段と、
該記憶手段に記憶された情報に基づき、前記文書画像中の各文字画像の位置を、行を単位に正規化する正規化手段と、
該正規化手段の正規化後の文書画像中の着目行中の着目文字画像を挟む両隣の文字画像の位置を固定にし、前記着目文字画像の位置を行頭若しくは行末の方向に移動することで、前記着目文字画像に1ビットの透かし情報を埋め込む埋め込み手段と、
該埋め込み手段による埋め込み後の文字画像で構成される出力用の文書画像を生成する画像生成手段とを備え、
前記正規化手段は、
前記記憶手段に記憶された情報を参照して、着目行の各文字画像間の総空白長を算出し、前記着目行の平均文字間隔を算出する算出手段と、
前記着目行の各文字画像間の空白長が前記算出手段で算出した前記平均空白長となるように、前記記憶手段に記憶された前記着目行の各文字画像の位置の情報を更新すると共に、前記更新後の各文字画像の位置情報に従って前記文書画像中の着目行の各文字画像の位置を更新する手段とを備える
本発明によれば、文書画像内の行単位に、その行中に含まれる文字画像の文字間隔を正規化するので、情報の埋め込み可能な箇所を多くでき、もって、埋め込み情報量を稼ぐことが可能になる。
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。
<第1の実施形態>
図1は、第1の実施形態における電子透かし埋め込み装置の構成概念図である。なお、本第1の実施形態では、各文字の回転によって情報を埋め込む技術を例にして説明することとする。
本第1の実施形態による電子透かし情報埋め込み装置は、入力部101(イメージスキャナ等)から入力された文書画像100内の文書解析を行って文字の大きさおよび位置情報を認識する文書解析部102と、文字認識を行って文字コード情報、フォント情報を認識する認識処理部103と、認識処理部103における文字認識に用いられる辞書である認識辞書105と、文字認識結果に基づいて、文書画像を正規化する正規化部104と、入力された検証画像100及び正規化された文書画像106を利用して透かし情報107(予めユーザによって入力もしくは登録された情報)を埋め込む透かし情報埋め込み部108と、電子透かし埋め込み済み画像110を生成する画像出力部109から構成される。
図2は、実施形態における電子透かし抽出する側の装置(以下、電子透かし抽出装置)の構成概念図である。この電子透かし情報抽出装置は、入力部201から入力された検証画像200内の文書解析を行って文字の大きさおよび位置情報を認識する文書解析部202と、透かし情報204を抽出する透かし情報抽出部203から構成される。
図1、図2は文書用電子透かし抽出装置および埋め込み装置の構成概念図を示したが、その具体的構成を示すのであれば図23のようになる。
図23において,コンピュータ2301は、一般に普及しているパーソナルコンピュータ等の汎用の情報処理装置であり、スキャナ等の画像入力装置2317から読み取られた画像を入力し、編集や保管を行うことが可能である。また、画像入力装置2317で得られた画像をプリンタ2316から印刷させることができる。尚、ユーザからの各種指示等は、マウス(登録商標)2313、キーボード2314からの入力操作により行われる。コンピュータ2301の内部では、バス2307により後述する各ブロックが接続され、種々のデータの受け渡しが可能である。
図23において、MPU2302は、コンピュータ2301内部の各ブロックの動作を制御し、あるいは内部に記憶されたプログラムを実行することができる。主記憶装置(RAMで構成される)2303は、MPU2302において行われる処理のために、一時的にプログラムや処理対象の画像データを格納しておく装置である。ハードディスク(HDD)2304は、主記憶装置2303等に転送されるOS、アプリケーションプログラムや画像データをあらかじめ格納したり、処理後の画像データを保存することのできる装置である。
スキャナインタフェース(I/F)2315は、原稿やフィルム等を読み取って、画像データを生成するスキャナ2317と接続され、スキャナ2317で得られた画像データを入力することのできるI/Fである。プリンタインタフェース2308は、画像データを印刷するプリンタ2316と接続され、印刷する画像データをプリンタ2316に送信することのできるI/Fである。
CDドライブ2309は、外部記憶媒体の一つであるCD(CD−R/CD−RW)に記憶されたデータを読み込んだり、あるいは書き出すことができる装置である。FDDドライブ2311は、CDドライブ2309と同様にFDDからの読み込みや、FDDへの書き出しをすることができる装置である。DVDドライブ2310は、FDDドライブ2311と同様に、DVDからの読み込みや、DVDへの書き出しをすることができる装置である。尚、CD、FDD、DVD等に画像編集用のプログラム、あるいはプリンタドライバが記憶されている場合には、これらプログラムをHDD2304上にインストールし、必要に応じて主記憶装置2303に転送されるようになっている。
インタフェース(I/F)2312は、マウス2313やキーボード2314からの入力指示を受け付けるために、これらと接続されるI/Fである。また、モニタ2306は、透かし情報の抽出処理結果や処理過程を表示することのできる表示装置である。さらに、ビデオコントローラ2305は、表示データをモニタ2306に送信するための装置である。
尚、実施形態における装置は、複数の機器(例えば、ホストコンピュータ、インタフェース機器、リーダ、プリンタ等)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置等)に適用してもよい。
上記構成において、マウス2313やキーボード2314からの入力指示により主記憶装置2303にロードしたプログラムを2302のMPUなどを用いて実行することによって電子透かしの埋め込み装置、或いは、抽出装置として機能することになる。このとき、モニタ2306により実行状況や、その結果をモニタすることも可能である。
以上、実施形態の装置構成を説明したが、図1の構成にける文書解析部102、認識処理部103、正規化部104、透かし情報埋め込み部108等は、MPU2302が実行するプログラムによって実現しているものとし、図1の各構成部分について詳しく説明する。
文書解析部102においては、入力された文書画像から外接四角形(矩形)の抽出が行われる。文字の外接矩形は、文字に外接する矩形であって、本来は、文字認識を行う領域を指す情報であるが、電子透かしにおいては、埋め込み操作の対象となる文字領域を示すものである。文書画像の各画素値を垂直座標軸に対して射影し、空白部分(黒色である文字のない部分)を探索して行を判別して行分割を行う。その後、行単位で文書画像を水平座標軸に対して射影し、空白部分を探索して文字単位に分割する。これによって、各文字を外接矩形で切り出すことが可能となる。文字解析部102での解析結果と、入力部101より入力した文書画像データは認識処理部103に渡されることになる。
文字解析部102が認識処理部103に渡す解析結果は、例えば図24に示すような形式であり、記憶手段である主記憶装置2303(もしくはHDD2304)に格納される。図示の如く、行単位の情報であって、先頭には何行目かを示す情報、該当する行内にいくつの外接矩形があるかを示す情報、そして、各外接矩形に関するデータがその個数分だけ後続し、最後に行末を示す情報(EOL(=End Of Line))で構成される。最終行の行末には1ページの終わりであることを示す情報(EOP(End Of Page))が付加される。ここで、1つの外接矩形に関するデータは、図示のように、外接矩形の位置(実施形態では矩形の左下隅の座標位置)、外接矩形のサイズ(高さと幅)、並びに、文字コード、フォン種別を格納するフィールドで構成される。ただし、この段階では、文字コード、フォント種別は不明であるので、該当するフィールドは確保するに留める。なお、図24に示されるデータを、以後、文書画像属性データと呼ぶことにする。
図3は、認識処理部103の細部構成を示すブロック図である。本実施形態では、認識処理部103は、光学的文字認識(OCR)によって文字認識が行われるものとする。OCR技術を用いることによって、文字の微小な回転等を施した文書画像からでも文字を識別することが可能である。また、文字情報(文字コード)だけではなく、マルチフォントの識別も可能である。なお、フォント識別に関する技術は、例えば、「橋本新一郎編著、「文字認識概論」電子通信協会刊」を参照されたい。
さて、認識処理部103における特徴抽出部103aは、文書解析部102からの解析結果である文書画像属性データ(図24参照)に基づき、入力した文書画像から該当する外接矩形を切り出し、その切り出した文字画像の特徴量を抽出する。認識部103bは、特徴抽出部103aで得られた特徴量と、認識辞書105(図23でのHDD2304等に予め格納されている)で保持している標準的な各フォントセット(字体)毎の文字の特徴量とを比較して文字認識を行うと共にフォント種別をも識別する。そして、文書画像造成データを、文字認識結果を反映させるために更新する。すなわち、文書画像属性データ内の各「外接矩形データ」中の文字コード及びフォント種別のフィールドに、認識した結果を格納する処理を行うことになる。
図4は、正規化部104の細部構成を示すブロック図である。正規化部104は、図示のように、フォント記憶部104e(実施形態ではスケーラブルなアウトラインベクトルフォントデータがHDD2304に記憶されているとする)、画像生成部104f、文字間スペース得算出部104g、ピッチ判定部104iで構成される。
画像生成部104fは、文字認識処理後の文書画像属性データから、1行分のデータを読み出す。すなわち、或る行の文字コード情報104a、フォント情報104b、文字画像(外接矩形)の位置及びサイズ情報を、その行中に含まれる外接矩形の数だけ入力する。文字間スペース算出部104gは、注目行に含まれる全文字の空白長を合算する。ピッチ判定部104iは、文字間スペース算出部104gにて算出された全空白長を、その行に含まれる「文字数−1」で除算することで、平均文字ピッチ、すなわち、隣接する文字間の平均空白長を算出する。そして、算出された平均文字ピッチに基づき、文書画像属性データ内の該当する行に含まれる全「外接矩形データ」中の「位置」フィールドを更新し正規化する。この結果、原画像の注目行中に、極端に文字間隔が狭い箇所があったとしても、或る程度の長さの空白長さが割り当てられることになり、文字間操作による情報埋め込みが可能にすることを可能にしている。
正規化部104は、この更新されたデータに従い、フォント記憶部104eから文字コードに応じたフォントデータを読出し、外接矩形サイズに合致する文字パターンを生成し、正規化後の位置に従ってその発生した文字パターンを主記記憶装置2303に確保された領域に展開する。そして、この処理を注目行に含まれる全文字について繰り返し行う。1行分の文字パターンの展開処理が終わると、次の行の文字パターンの展開を行い、最終行の行末文字まで繰り返すことになる。
こうして正規化後の1ページ分の文書画像が生成されると、その結果及び図24の文書画像属性データを透かし情報埋め込み部108に渡す。透かし情報埋め込み部108は、最終的な文書画像属性データ(図24参照)、及び、埋め込もうとする情報に基づいて、正規化後の文書画像中の各文字画像を微小角だけ回転させる。回転処理後の文書画像は、画像出力部109を介して出力されることになる。なお、画像出力部109は、プリンタであるとするが、記憶媒体に画像データとして記憶保存する手段であっても構わない。
以上であるが、実施形態における電子透かし埋め込み装置の動作処理手順を整理するため、図5のフローチャートに従って説明することとする。同図は、図23に示すMPU2302が実行する処理手順(主記憶装置2303にロードされるプログラム)である。
まず、透かし情報の埋め込み対象となる文書原稿100が図23のスキャナ2317に代表される画像入力部101で読取られ、文書画像データとして文書解析部102に入力される(ステップS601)。なお、ここでは、この文書画像データは印刷物をスキャナ2317などから入力し、それをビットマップ化したものとなるが、文書編集アプリケーションプログラムを利用して作成された電子データ、またはハードディスク2304やCDドライブ2309、DVDドライブ2310、FDDドライブ2311などに接続された各記憶媒体に格納されたアプリケーションプログラム固有の形式、テキスト形式などをはじめとする種々の電子データを画像処理ソフトなどによって変換し、ビットマップ化したものでも勿論構わない。
次に、文書解析部102では、入力された文書画像データから外接矩形の抽出が行われ、第1段階の文書画像属性データを生成する(ステップS602)。
次いで、認識処理部103により文字認識が行われ、文書画像属性データを更新する(ステップS603)。
図6はこの文字認識処理の動作手順を示すフローチャートである。まず、文書解析部102で得られた文書画像属性データにおける外接矩形の位置及びサイズに従い、1文字画像単位に切り出し、特徴抽出部部103aにおいて、文字の特徴が抽出される(ステップS603a)。ここで、文字の特徴抽出とは、切り出された文字を具体的に判別するために、文字に含まれる所定の特徴量を取り出す操作のことである。本実施形態における特徴量としては、例えば、各文字の外接矩形領域をさらに小領域に分割し、その小領域内の方向成分のヒストグラムをとって文字の特徴量としたり、画素値の分布の偏りを特徴量とすることができる。また、外接矩形の中心等を当該文字の位置情報とする。
そして、識別部103bにおいて、抽出された特徴量と認識辞書105で保持されている文字やフォントが有する特徴量とが比較され、文字の特定(文字コードの生成)やフォントの識別が行われる(ステップS603b)。得られた文字コード、フォント種別で文書画像属性データを更新することは既に説明した通りである。
図5の説明に戻る。上記のようにして得られた各外接矩形に関する情報(位置、サイズ、文字コード、フォント種別)に基づいて、正規化部104は正規化文書画像106を生成する(ステップS604)。
図7は、実施形態における正規化部104が処理するステップS604の詳細フローチャートである。
先ず、文書画像属性データから1行分の属性データを入力する(ステップS604a)。そして、文字間スペース算出部104gにて、注目行のスペース長(各文字間スペースの合算)を算出する(ステップS604b)。このあと、ピッチ判定部104iにて、注目行に含まれる「文字数−1」で、スペース長を除算することで、各文字間の平均ピッチ(平均空白長)を算出する。そして、入力した属性データを算出した平均ピッチに従って更新し(ステップS604d)、注目行の文字画像イメージをフォントデータを利用して生成する(ステップS604e)。そして、全行に対して処理したか否かを判断し(ステップS604f)、全行に対する処理が完了していないと判断した場合には、ステップS604a以降の処理を繰り返すことになる。
再び図5の説明に戻る。上記のようにして正規化処理が行われ、正規化後の文書画像の生成、及び、その際の文書画像属性データが求められると、処理はステップS605に進み、透かし情報(例えば、PC等に適用する場合にはキーボードより入力した文字列(ユーザ名等)、或いは、予め記憶された情報等でも良いが、複写機等に適用する場合には、その複写機を特定する情報等でも良い)を埋め込む。実施形態の場合、文書画像属性データが既に用意されているので、この情報に従い、正規化後の文書画像中の各文字画像を回転させて、情報の埋め込みを行う。
そして、埋め込み後の文書画像を出力し(ステップS606)、原稿1枚に対する埋め込み処理を終了する。
ここで、ステップS605における埋め込み処理を、図8のフローチャートに従って説明する。
埋め込まれる透かし情報は予め二進(バイナリ)で用意されているものとする。
先ず、情報を埋め込む外接矩形を文書画像属性情報を参照して決定する(ステップS605a)。次に、透かし情報の先頭から未埋め込みの1ビットを選択する(ステップS605b)。そして、埋め込まれる透かし情報のビットが「1」であるか否かが判断される(ステップS605c)。その結果、当該ビットが「1」の場合(Yes)、正規化後の文書画像内の注目外接矩形内の文字イメージを、その外接矩形中心位置の回りに時計回りに所定角度θだけ回転させる(ステップS605d)。一方、当該ビットが「0」の場合(No)には、反時計周りにθ角だけ回転させる(ステップS605e)。そして、埋め込んだビットが、透かし情報の最終ビットであるか否かが判断される(ステップS605f)。その結果、まだ透かし情報の最終ビットではない場合(No)、ステップS605aに戻って次の外接矩形を選択する。一方、透かし情報の末尾の場合(Yes)、透かし情報のビットの埋め込み処理を終了する。
なお、埋め込みは、文字画像が存在する限り、繰り返し行ってよい。また、埋め込み後の文書画像の出力先はプリンタに限らず、記憶装置、或いは、ネットワーク上の他の装置であっても構わない。
次に、本実施形態における電子透かし抽出装置について説明する。装置構成は図2、図23で示した通りであるので、ここでは処理手順を図9に従って説明することとする。

まず、透かし情報の抽出対象となる検証画像200が図23のスキャナ2317に代表される画像入力手段201を介して、文書解析手段202に入力される(ステップS901)。なお、この検証画像は印刷物を2317のスキャナに限らない。例えば、ネットワーク上からダウンロードしてもよいし、CDROM等の記憶媒体に格納されているのであれば、そこから読み出すようにしてもよい。
次に、文書解析部202で、情報埋め込み時と同様に、文書解析を行う(ステップS902)。そして、文書解析部202で得られた外接矩形情報に基づいて、透かし情報抽出部203において電子透かし抽出を行う(ステップS903)。
この電子透かし処理を更に詳しく説明すると、図10のような処理になる。
まず、外接矩形が選択される(ステップS903a)。次に、選択した外接矩形の重心を算出する(ステップS903b)。次に、選択した外接矩形内の文字画像の回転角度を判断する。
もし時計回りθ角だけ回転していれば(Yes)、透かし情報を「1」として主記憶装置に格納する(ステップS903d)。また、反時計回りにθだけ回転していれば、透かし情報を「0」として記憶する(ステップS903e)。更に、そのいずれでもない(回転していない)と判断した場合には、埋め込まれていないと判断する。
処理は、いずれの場合にも、ステップS903fに進み、検証画像にまだ処理すべき外接矩形が残っていないかどうか判定する。もしまだ残っている場合(No)、ステップS903a以降の処理を繰り返す。文書の終わりに達している場合(No)、抽出された「0」「1」の値を透かし情報204として決定する。なお、透かし情報は、ユーザに報知するため、表示処理を行ってもよいし、文字コードであるのであれば、そのビット配列ではなく文字(文字列)を表示させてもよい。
以上であるが、本実施形態によれば、埋め込み対象の文書画像中に文字間が狭い箇所があったとしても、その文字が存在する行中の許容範囲で文字間を空けることが可能となり、文字回転による隣接する文字と接触しにくくすることができ、より多くの情報を埋め込むことが可能になる。
なお、正規化部104では正規化した文書画像を生成するものとして説明したが、正規化部104では文書画像属性データの更新に留め、透かし情報埋め込み部108にて埋め込む情報に応じて各文字の角度を決定し、その後で実際に文字パターンの展開処理を行っても構わない。
また、実施形態では出力する文書画像中の文字画像は、文字認識して得られた文字コード、並びに、フォント種別に応じて生成するものとしたが、入力した文書画像における角外接矩形内の文字イメージをそのまま採用しても構わない。この場合、認識処理が存在しない分だけ処理が単純化されるので、最終的に出力画像を得るまでにかかる時間はごく短時間になり、複写機等に適用したとしても、普通に原稿を読み取り、複写するかの如く処理することが可能になる。
なお、上記実施形態では、文字画像の回転角θを特に限定していないが、違和感を抱かず、且つ、ある程度の埋め込み抽出精度となる値が望ましいので、上限は10度程度であろう。
また、上記説明からも理解できるように、正規化すると、行中の文字間の空白長は適度な間隔になるが、オリジナルの原稿画像中の全文字の文字間スペースがそもそも小さい場合には、正規化したとしても、文字画像回転によって隣接する文字画像と接触してしまうことも起こり得る。このような状況の場合、残念ながら上記実施形態の埋め込みは正常にできないことになる。従って、正規化した際の各行の文字間スペースが、予め設定された閾値以下の場合には、埋め込みが行えない旨のメッセージを表示し、それ以上の処理を行わないようにしてもよい。
<変形例の説明>
上記実施形態では、正規化部104では、1行の文字画像群の文字間隔を等間隔にすることで、埋め込み可能とする箇所を増やすものであったが、無条件に文字間を等間隔にすると不自然なものとなる場合がある。例えば、1行中に全角文字列と半角文字列が混在している場合、上記処理によると、半角文字、全角文字を問わず、各文字間が平均化してしまい、結果的に、全角文字で構成される文字間隔は狭く、半角文字で構成される文字間隔は広くなってしまう。これは、固定ピッチの文字と、プロポーショナル文字についても言えることである。
そこで、正規化する際、注目行を構成する各文字の間隔を抽出し、その分布(ヒストグラム)を求め、ピークが2つ存在する場合(もしくは、文字サイズ(幅)の分布のピークが2つ存在する場合でもよい)、それぞれに属する文字毎にピッチを求めるようにすれば、違和感のない文書画像を生成することが可能となる。ただし、この場合には半角文字(もしくはプロポーショナル文字)と全角文字(もしくは固定ピッチ文字)とが隣接する場合の空白部分は、埋め込み対象外にすることが望まれる。
なお、半角文字と全角文字の識別は、上記のように、文字幅(外接矩形幅)の分布を求めればよいし、固定ピッチ、プロポーショナル文字の識別に関する技術は例えば特開平8−50633号公報に記載の技術を用いればよいであろう。
<第2の実施形態>
上記実施形態では、文字画像の回転により、付加情報を埋め込む例であるが、文字間を変更すること埋め込む例を第2の実施形態として説明する。
図11は、本第2の実施形態における電子透かし埋め込み装置の構成概念図である。本第2の実施形態では、認識処理部103を不要にしている。また、正規化部1103、透かし情報埋め込み部1106以外は上記第1の実施形態と同じである。
図12は、第2の実施形態における電子透かし埋め込み装置の動作手順を説明するためのフローチャートである。
先ず、スキャナ2317等から検証しようとする文書原稿を画像データとして入力し(ステップS1201)、原稿画像を解析して文字画像の外接矩形の位置及びサイズを得る(ステップS1202)。このとき、図24に示す文書画像属性データを生成するが、本第2の実施形態の場合、文字認識処理を行わないので、図24に示すデータ構造において「文字コード」、並びに、「フォント種別」のフィールドは存在しない。
次に、正規化部1103にて、正規化処理を行う(ステップS1203)。この正規化処理は、先の第1の実施形態の図7と略同じであるが、文書画像を新規に作成するのではなく、読取った原稿画像内の、外接矩形内の文字画像をそのまま移動することになる。
図13は、第2の実施形態における正規化処理の詳細を示すフローチャートである。この正規化処理は、第1の実施形態における図7とほぼ同じであるが、本第2の実施形態では文字認識を行わず、ステップS1201で入力した文書画像中の各文字画の位置を変更することになる。
先ず、文書画像属性データから1行分の属性データを入力する(ステップS1203a)。そして、文字間スペース算出部104gにて、注目行のスペース長(各文字間スペースの合算)を算出する(ステップS1203b)。このあと、ピッチ判定部104iにて、注目行に含まれる「文字数−1」で、スペース長を除算することで、各文字間の平均ピッチ(平均空白長)を算出する。そして、入力した属性データを、算出した平均ピッチに従って更新し(ステップS1203d)、注目行内の全文字画像の位置を、更新後の文書画像属性データに従って調整(文字の並び方向に沿って移動)する。そして、全行に対して処理したか否かを判断し(ステップS1203f)、全行に対する処理が完了していないと判断した場合には、ステップS1203a以降の処理を繰り返すことになる。
次いで、正規化処理で更新された文書画像属性データに従い、正規化して得た文書画像中の各文字画像の位置を調整して、透かし情報の埋め込みを行う(ステップS1204)。最後に、埋め込まれた文書画像を出力する(ステップS1205)。
図12に説明を戻す。上記のようにして、正規化処理が行われると、処理はステップS1204に進んで、透かし情報の埋め込みを行う。この埋め込み処理を図14のフローチャートに従って説明する。
先ず、透かし情報が埋め込まれる先頭の外接矩形から偶数番目の文字画像を選択する(ステップS1204a)。次に、透かし情報の先頭ビットを選択する(ステップS1204b)。例えば、0101111・・・という情報が透かし情報として入力されていた場合、先頭の文字は「0」である。次に、埋め込まれる透かし情報のビットが「1」であるか否かが判断される(ステップS1204c)。その結果、当該ビットが「1」の場合(Yes)、注目文字画像の左側の空白長P、右側の空白長Sに対して、P>Sとなるように注目文字画像の位置を変更する(ステップS1204d)。ただし、もし位置変更しなくてもP>Sが成り立つならば移動をする必要はない。一方、埋め込むビットが「0」の場合(No)、P<Sとなるように変更する(ステップS1204e)。ただし、この場合にも、既にP<Sが成り立つならば移動をする必要はない。
そして、当該ビットが末尾か否かが判断される(ステップS1204f)。その結果、最終ビットの場合(Yes)、透かし情報のビットの埋め込み処理を終了する。一方、まだ最終ビットではない場合(No)、ステップS1204aに戻って埋め込みを続行する。
以上の結果、或る行に着目したとき、その2番目、4番目、6番目…と偶数番目に出現する文字画像の位置が調整され、埋め込みが行われることになる。
埋め込み処理が終わると、図12のステップS1205に進み、文字画像位置変更後の文書画像の出力処理が行われることになる。
以上、本第2の実施形態における電子透かし埋め込み装置について説明したが、埋め込まれた情報を抽出する側の装置では、基本的に既に説明した第1の実施形態における図9の処理手順に従って処理することになる。但し、同図のステップS903での処理内容は、図15のようになる。以下、同図に従って説明する。
まず、抽出対象の外接矩形を選択する(ステップS903a−2)。この選択する外接矩形は、各行の先頭から遇数番目に出現する外接矩形となる。そして、外接矩形パラメータの比較を行う(ステップS903b−2)。すなわち、注目外接矩形の左側の空白長Pが、右側の空白長Sより大きければ、透かし情報を「1」と判断し(ステップS903c−2)、P<Sであれば(小)透かし情報を「0」と判断する(ステップS903d−2)。等しい場合には、埋め込まれていないと判断する。そして、選択した外接矩形が最終外接矩形であれば(ステップS903e−2でYes)、終了し、NoであればステップステップS903a−2に戻り処理を継続する。
以上説明したように本第2の実施形態によれば、第1の実施形態と同様の効果を奏することが可能となる。ただし、埋め込み対象の文字画像が1つ置きになるので、文書画像中の全文字数の1/2が埋め込む情報の最大量となる。
なお、位置調整する文字画像は各行の偶数番目としたが、行頭の文字画像を除く(行末の文字画像も除く)奇数番目であっても構わないのは明らかである。
また、埋め込んだ文書画像を印刷出力する場合、その文書画像中に埋め込まれた情報を抽出するためにはイメージスキャナ等で読取ることが必要になろう。昨今のイメージスキャナはその読取り解像度は1000dpiを越えるものも珍しくないが、写真等を読取る場合と違って、文書を読取るイメージスキャナの場合は200dpi程度の解像度で十分であることを鑑みた場合、上記P、Sの関係は200dpi程度のイメージスキャナで読取った際に、十分に識別できる程度にすることが望ましい。換言すれば、電子透かし情報を埋め込む際にも、単純にP>Sや、P<Sとするのではなく、P>S+Δ、P<S+Δなる関係を満たすように埋め込むことが望まれる。
<第3の実施形態>
上記第1、第2の実施形態での正規化処理は、行中の文字画像の全空白長を等分、もしくは、半角・全角、固定ピッチ・プロポーショナル文字の2種類に分けてそれぞれの空白帳を等分にするものであった。すなわち、文字ピッチを入力した文書画像に依存して決定した。
しかし、標準ピッチを定め、各文字画像を標準ピッチでそろえることにより正規化を行うようにしても構わない。標準ピッチとは、文字の大きさの平均から定まる文字ピッチである。文字の大きさに対し1対1で対応するテーブルを読み出して定めることにする。ここで、画質を保つために、文字ピッチがあまりに大きいときは文字ピッチを変更しないようにする。この閾値をLとする。その他は全て第1、第2の実施形態と同様である。
図16は、本第3の実施形態における正規化部の動作手順を示したフローチャートである。
まず、文書解析部1102で生成された文字の大きさおよび位置情報を示す文書画像属性データを入力する(ステップS1203a−2)。次に、標準ピッチを算出する(ステップS1203b−2)。次に、位置変更対象の文字を選択する(ステップS1203c−2)。次に、選択した文字のピッチが閾値Lより小さいかどうか判定する(ステップS1203d−2)。もし大きければ(No)、ステップS1203c−2にもどり、次の文字を選択する。もし小さければ(Yes)、文字がこの平均ピッチになるように、文字の位置を変更する(ステップS1203e−2)。続いて、文字がまだ残っているか確認する(ステップS1203f−2)。もし残っていれば(Yes)、ステップS1203c−2にもどり、次の文字を選択する。もし全ての文字について処理が終わっていれば(No)、変更後文字位置にもとづいて、正規化文書画像を生成する(ステップS1203g−2)。
埋め込み・抽出方法は第1、第2の実施形態と同じであるが、閾値Lより大きなピッチには埋め込まないし、抽出も行わない。例えば、第2の実施形態に適用する場合には、図14の代わりに図17のような処理を行うことになる。すなわち、ピッチがL以上ある場合には埋め込み対象外にするため、図17におけるステップS1204b−2を新に設ける。
一方、透かし情報抽出する側の処理では、図15の代わりに、図18のような処理を行えばよい。すなわち、すなわち、ピッチがL以上ある場合には埋め込み情報の抽出対象とするため、図18におけるステップS903b−3を新に設ける。これ以外は、第2の実施形態と同様である。
本第3の実施形態は、単語をスペースで区切る英語もしくはそれに類する構造を持つ文書に適したものとなる。
<その他の実施形態>
上記各実施形態では、文字間空白長、回転に適合する例を説明した。また、対象となる文書画像は、横書きを前提にして説明した。縦書きの場合には、文字画像の並び方向が横書きに対して90度回転したものとなり、外接矩形の高さと幅の関係も入れ代わる。また、文字間の空白長を調整する場合には、文字画像の上下移動となるだけであるので、同様に適用できるのは明らかである。
更に、実施形態におけるそのほとんどの機能は、パーソナルコンピュータ上で実行されるコンピュータプログラムによって実現できるのは明らかであるから、本発明は当然、そのようなコンピュータプログラムをも範疇とする。また、通常、コンピュータプログラムは、CDROM等のコンピュータ可読記憶媒体に記憶されていて、コンピュータにセットしてシステムにコピー、もしくはインストールすることで実行可能となるから、このようなコンピュータ可読記憶媒体も本発明の範疇に含まれる。
第1の実施形態における電子透かし埋め込み装置の構成概念図である。 第1乃至第3の実施形態における電子透かし抽出装置の構成概念図である。 図1における認識処理部のブロック構成図である。 図1における正規化部104のブロック構成図である。 第1の実施形態における電子透かし埋め込み手順を示すフローチャートである。 図5における認識処理の処理内容を示すフローチャートである。 図5における正規化処理の処理内容を示すフローチャートである。 図5における埋め込み処理の処理内容を示すフローチャートである。 第1乃至第3の実施形態における電子透かし抽出手順を示すフローチャートである。 図9における情報抽出処理の第1の実施形態の処理手順を示すフローチャートである。 第2及び第3の実施形態における電子透かし埋め込み装置の構成概念図である。 第2及び第3の実施形態における電子透かし埋め込み手順を示すフローチャートである。 図12の正規化処理に相当する第2の実施形態の処理手順を示すフローチャートである。 図12の埋め込み処理に相当する第2の実施形態の処理手順を示すフローチャートである。 第2の実施形態における透かし情報抽装置の動作手順を示すフローチャートである。 図12の正規化処理に相当する第3の実施形態の処理手順を示すフローチャートである。 図12の埋め込み処理に相当する第3の実施形態の処理手順を示すフローチャートである。 第3の実施形態における透かし情報抽出装置の動作手順を示すフローチャートである。 文字の間隔を利用した電子透かし埋め込みを行う場合の原画像の例を示す図である。 文字の間隔を利用した電子透かし埋め込みを行った後の画像を示す図である。 文字配置位置変更での埋め込みの問題点を説明するための図である。 文字の傾きを利用した電子透かし埋め込み方法を説明するための概要図である。 実施形態における装置の具体的なブロック構成図である。 第1の実施形態で生成する文書画像属性データの構造を示す図である。

Claims (6)

  1. 文書画像に情報を埋め込む情報処理装置であって、
    入力した文書画像中の各文字画像の外接矩形の位置とサイズに関する情報を抽出する抽出手段と、
    抽出した各文字画像の位置と外接矩形のサイズを示す情報を、文字の並び方向である行を単位に記憶する記憶手段と、
    該記憶手段に記憶された情報に基づき、前記文書画像中の各文字画像の位置を、行を単位に正規化する正規化手段と、
    該正規化手段の正規化後の文書画像中の着目行中の着目文字画像を挟む両隣の文字画像の位置を固定にし、前記着目文字画像の位置を行頭若しくは行末の方向に移動することで、前記着目文字画像に1ビットの透かし情報を埋め込む埋め込み手段と、
    該埋め込み手段による埋め込み後の文字画像で構成される出力用の文書画像を生成する画像生成手段とを備え、
    前記正規化手段は、
    前記記憶手段に記憶された情報を参照して、着目行の各文字画像間の総空白長を算出し、前記着目行の平均文字間隔を算出する算出手段と、
    前記着目行の各文字画像間の空白長が前記算出手段で算出した前記平均空白長となるように、前記記憶手段に記憶された前記着目行の各文字画像の位置の情報を更新すると共に、前記更新後の各文字画像の位置情報に従って前記文書画像中の着目行の各文字画像の位置を更新する手段とを備える
    ことを特徴とする情報処理装置。
  2. 前記正規化手段は、行に含まれる文字画像の半角/全角、或いは、固定ピッチ/プロポーショナル文字で外接矩形を分類し、分類された外接矩形毎に平均文字間隔間隔を設定することを特徴とする請求項1に記載の情報処理装置。
  3. 前記正規化手段は、前記記憶手段に記憶された情報に基づき、行中の着目する文字画像とその左隣の文字画像の間の空白長が所定長より大きい場合、前記着目文字を正規化対象外とし、且つ、前記着目文字は前記透かし情報の埋め込み対象外とすることを特徴とする請求項1に記載の情報処理装置。
  4. 文書画像に情報を埋め込む情報処理方法であって、
    入力した文書画像中の各文字画像の外接矩形の位置とサイズに関する情報を抽出する抽出工程と、
    抽出した各文字画像の位置と外接矩形のサイズを示す情報を、文字の並び方向である行を単位に記憶手段に格納する格納工程と、
    該記憶手段に記憶された情報に基づき、前記文書画像中の各文字画像の位置を、行を単位に正規化する正規化工程と、
    該正規化工程の正規化後の文書画像中の着目行中の着目文字画像を挟む両隣の文字画像の位置を固定にし、前記着目文字画像の位置を行頭若しくは行末の方向に移動することで、前記着目文字画像に1ビットの透かし情報を埋め込む埋め込み工程と、
    該埋め込み工程による埋め込み後の文字画像で構成される出力用の文書画像を生成する画像生成工程とを備え、
    前記正規化工程は、
    前記記憶手段に記憶された情報を参照して、着目行の各文字画像間の総空白長を算出し、前記着目行の平均文字間隔を算出する算出工程と、
    前記着目行の各文字画像間の空白長が前記算出工程で算出した前記平均空白長となるように、前記記憶手段に記憶された前記着目行の各文字画像の位置の情報を更新すると共に、前記更新後の各文字画像の位置情報に従って前記文書画像中の着目行の各文字画像の位置を更新する工程とを備える
    ことを特徴とする情報処理方法。
  5. 請求項1乃至のいずれか1項に記載の情報処理装置の機能をコンピュータに実行させるためのコンピュータプログラム。
  6. 請求項に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
JP2004064492A 2004-03-08 2004-03-08 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 Expired - Fee Related JP4164458B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004064492A JP4164458B2 (ja) 2004-03-08 2004-03-08 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004064492A JP4164458B2 (ja) 2004-03-08 2004-03-08 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Publications (3)

Publication Number Publication Date
JP2005253004A JP2005253004A (ja) 2005-09-15
JP2005253004A5 JP2005253004A5 (ja) 2007-03-01
JP4164458B2 true JP4164458B2 (ja) 2008-10-15

Family

ID=35033025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004064492A Expired - Fee Related JP4164458B2 (ja) 2004-03-08 2004-03-08 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Country Status (1)

Country Link
JP (1) JP4164458B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7505180B2 (en) * 2005-11-15 2009-03-17 Xerox Corporation Optical character recognition using digital information from encoded text embedded in the document
JP4719717B2 (ja) 2006-06-27 2011-07-06 株式会社リコー 画像処理装置、画像処理方法及び画像処理プログラム
JP5173690B2 (ja) * 2007-10-11 2013-04-03 キヤノン株式会社 情報処理装置及び情報処理方法、並びに、コンピュータプログラム及びコンピュータ可読記録媒体
US8125691B2 (en) 2007-10-11 2012-02-28 Canon Kabushiki Kaisha Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information
JP4956366B2 (ja) * 2007-10-16 2012-06-20 キヤノン株式会社 画像処理装置

Also Published As

Publication number Publication date
JP2005253004A (ja) 2005-09-15

Similar Documents

Publication Publication Date Title
JP4310288B2 (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
JP4854491B2 (ja) 画像処理装置及びその制御方法
JP4393161B2 (ja) 画像処理装置及び画像処理方法
JP2003230001A (ja) 文書用電子透かし埋め込み装置及び文書用電子透かし抽出装置並びにそれらの制御方法
JP4194462B2 (ja) 電子透かし埋め込み方法、電子透かし埋め込み装置、及びそれらを実現するプログラム並びにコンピュータ可読記憶媒体
JP2008109394A (ja) 画像処理装置及びその方法、プログラム
JP2004265384A (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
JP4164463B2 (ja) 情報処理装置及びその制御方法
JP4208780B2 (ja) 画像処理システム及び画像処理装置の制御方法並びにプログラム
JP2006050551A (ja) 画像処理装置及びその方法、並びにプログラム及び記憶媒体
JP4673200B2 (ja) 印刷処理システムおよび印刷処理方法
KR100905857B1 (ko) 정보 처리 장치 및 정보 처리 장치의 제어 방법
JP4338189B2 (ja) 画像処理システム及び画像処理方法
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP2004246577A (ja) 画像処理方法
JP4164458B2 (ja) 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2006023944A (ja) 画像処理システム及び画像処理方法
JP3728209B2 (ja) 画像処理方法及び装置及びコンピュータプログラム及び記憶媒体
JP2007129557A (ja) 画像処理システム
JP4179977B2 (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
JP2005149097A (ja) 画像処理システム及び画像処理方法
JP2009278181A (ja) 電子透かし情報埋め込み装置及び方法、並びに、電子透かし情報抽出装置及び方法
JP4324058B2 (ja) 画像処理装置及びその方法
JP2010108296A (ja) 情報処理装置、情報処理方法
JP4310176B2 (ja) 画像処理装置、画像処理方法およびプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070117

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080425

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080722

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080728

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130801

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees