JP4871793B2 - 情報処理装置及びその方法 - Google Patents

情報処理装置及びその方法 Download PDF

Info

Publication number
JP4871793B2
JP4871793B2 JP2007159492A JP2007159492A JP4871793B2 JP 4871793 B2 JP4871793 B2 JP 4871793B2 JP 2007159492 A JP2007159492 A JP 2007159492A JP 2007159492 A JP2007159492 A JP 2007159492A JP 4871793 B2 JP4871793 B2 JP 4871793B2
Authority
JP
Japan
Prior art keywords
information
embedded
input
embedding
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007159492A
Other languages
English (en)
Other versions
JP2008312063A5 (ja
JP2008312063A (ja
Inventor
玲 呂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007159492A priority Critical patent/JP4871793B2/ja
Priority to KR1020080055719A priority patent/KR100938539B1/ko
Priority to CN2008101110836A priority patent/CN101325642B/zh
Publication of JP2008312063A publication Critical patent/JP2008312063A/ja
Publication of JP2008312063A5 publication Critical patent/JP2008312063A5/ja
Application granted granted Critical
Publication of JP4871793B2 publication Critical patent/JP4871793B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking

Description

本発明は、文書へ情報を埋め込む技術及び埋め込まれた情報を抽出する技術に関する。
文字単位で透かし情報を埋め込む場合には、埋め込み前に外接矩形を1文字単位で抽出する必要がある。しかし、例えば、辺と旁で構成される文字を別々に2文字として抽出してしまうような抽出誤りが発生することがある。このような場合に、抽出誤りが発生したまま透かし情報が埋め込まれると、埋め込まれた透かし情報を再び抽出する際に、透かし情報がずれてしまう。例えば、図1(a)が、本来、外接矩形として抽出されるべき文字を表し、その文字に対して、図1(b)のような透かし情報を埋め込んだとする。しかし、図1(c)のように、外接矩形が抽出された場合は、外接矩形抽出されたそれぞれの文字から情報を抽出する。そのため、結果として、図1(d)のような透かし情報が抽出されてしまう。特許文献1では、透かし情報と同期情報とを各文字に順番に埋め込む技術が開示されている。
特開2004−247883号公報
しかし、特許文献1で開示されている技術では、外接矩形の抽出誤りの位置を特定することができず、このため、外接矩形に透かし情報を何度も埋め込む必要がある。また、抽出誤りが発生した外接矩形から後ろの透かし情報はすべてずれてしまうため、参照することができない。
従って、本発明の目的は、外接矩形の抽出誤りに起因する埋め込み情報のズレを検出することにある。
本発明においては、
文書中の各文字に、nビット(nは2以上の整数)の情報を埋め込む情報処理装置であって、
文字で構成される文書を入力する文書入力手段と、
前記文書に埋め込むべき埋め込み情報を入力する埋め込み情報入力手段と、
複数ビットで構成され、予め設定されたビットパターンからなる同期情報を入力する同期情報入力手段と、
入力した埋め込み情報を構成するビットと、前記同期情報を構成するビットとを合成することで、合成埋め込み情報を生成する合成手段と、
該合成手段で生成された合成埋め込み情報を前記文書入力手段で入力した文書中の各文字に埋め込み、埋め込み後の文書を出力する埋め込み手段と、を備え、
前記埋め込み手段は、
個の埋め込みパターンを記憶する記憶手段と、
前記合成手段で生成された前記合成埋め込み情報中の、少なくとも1ビットの前記同期情報を含むnビットの値に従って、前記記憶手段に記憶された埋め込みパターンのいずれか1つを選択し、選択された埋め込みパターンで埋め込み対象の文字の外接矩形内の文字画像をマスクするマスク手段とを有する
ことを特徴とする情報処理装置が提供される。
また、本発明においては、
上記のようにして生成された文書画像から情報を抽出する情報処理装置であって、
文書画像を入力する文書画像入力手段と、
入力された文書画像中の各文字の外接矩形を求め、当該外接矩形内の文字が、2 個(nは2以上の整数)の埋め込みパターンのうちのいずれでマスクされたかを判定することで、前記外接矩形内の文字に埋め込まれた情報を抽出する合成埋め込み情報抽出手段と、
該合成埋め込み情報抽出手段で抽出された合成埋め込み情報を同期情報と埋め込み情報とに分離する分離手段と、
同期情報を入力する同期情報入力手段と、
前記分離手段で分離された同期情報と、前記同期情報入力手段で入力された同期情報とを比較することで、前記合成埋め込み情報抽出手段の抽出誤りを判定し、抽出誤りがあったかと判定した場合には、前記分離手段で分離された同期情報と前記入力手段で入力された同期情報とが一致するように、前記合成埋め込み情報を訂正する訂正手段と、
を備えることを特徴とする情報処理装置が提供される。
また、本発明においては、
文書中の各文字に、nビット(nは2以上の整数)の情報を埋め込む情報処理方法であって、
文字で構成される文書を入力する文書入力工程と、
前記文書に埋め込むべき埋め込み情報を入力する埋め込み情報入力工程と、
複数ビットで構成され、予め設定されたビットパターンからなる同期情報を入力する同期情報入力工程と、
入力した埋め込み情報を構成するビットと、前記同期情報を構成するビットとを合成することで、合成埋め込み情報を生成する合成工程と、
該合成工程で生成された合成埋め込み情報を前記文書入力工程で入力した文書中の各文字に埋め込み、埋め込み後の文書を出力する埋め込み工程と、を備え、
前記埋め込み工程は、
前記合成工程で生成された前記合成埋め込み情報中の、少なくとも1ビットの前記同期情報を含むnビットの値に従って、記憶手段に記憶された2 個の埋め込みパターンのいずれか1つを選択し、選択された埋め込みパターンで埋め込み対象の文字の外接矩形内の文字画像をマスクするマスク工程とを有する
ことを特徴とする情報処理方法が提供される。
また、本発明においては、上記のようにして生成された文書画像から情報を抽出する情報処理方法であって、
文書画像を入力する文書画像入力工程と、
入力された文書画像中の各文字の外接矩形を求め、当該外接矩形内の文字が、2 個(nは2以上の整数)の埋め込みパターンのうちのいずれでマスクされたかを判定することで、前記外接矩形内の文字に埋め込まれた情報を抽出する合成埋め込み情報抽出工程と、
該合成埋め込み情報抽出工程で抽出された合成埋め込み情報を同期情報と埋め込み情報とに分離する分離工程と、
同期情報を入力する同期情報入力工程と、
前記分離工程で分離された同期情報と、前記同期情報入力工程で入力された同期情報とを比較することで、前記合成埋め込み情報抽出工程の抽出誤りを判定し、抽出誤りがあったと判定した場合、前記分離工程で分離された同期情報と、前記入力工程で入力された同期情報とが一致するように、前記合成埋め込み情報を訂正する訂正工程と、
を備えることを特徴とする情報処理方法が提供される。
本発明によれば、外接矩形の抽出誤りに起因する埋め込み情報のズレを検出することができる。
まず、情報処理装置の全体構成について、図面を参照して詳細に説明する。
[全体構成]
図4は、本発明の一実施形態に係る情報処理装置(埋め込み処理)の概略構成図である。本情報処理装置は、文書中の各文字の外接矩形を求め、この外接矩形で示される領域内の文字毎に情報を埋め込むものである。なお、ここでは、1文字にnビット(nは2以上の整数)の情報を埋め込むものとする。
まず、文字で構成される文書400を光学的に読取り、文書画像データとして文書入力部401に入力された後、文書解析部402で文書400中の外接矩形(文字領域)の抽出が行われる。次に、文書400に埋め込むべき埋め込み情報403が埋め込み情報入力部404に入力される。その後、複数ビットで構成され、予め設定されたビットパターンからなる同期情報が同期情報入力部405に入力される。その後、合成部406において、入力した埋め込み情報403を構成するn−1ビットと、同期情報の1ビットとを交互に並べて合成することで、合成埋め込み情報を生成する。
次に、埋め込み部407において、合成部406で生成された合成埋め込み情報を、文書入力部401で入力した文書400中の文字に埋め込み、埋め込み後の文書409を文書出力部408から出力する。
なお、埋め込み部407は、1文字にnビットを埋め込むための2個の埋め込みパターンを記憶する記憶部を備える。また、埋め込み部407は、合成部406で生成された合成埋め込み情報中のnビットの値に従って、記憶部に記憶された埋め込みパターンのいずれか一つを選択し、埋め込み対象の文字の外接矩形内の文字画像をマスクするマスク部を備える。
また、本実施形態では、埋め込み情報入力部404から入力された埋め込み情報403に誤り訂正情報を付加する誤り訂正情報付加部(不図示)を備える。合成部406は、埋め込み情報入力部404の誤り訂正情報付加部より出力された誤り訂正情報の付加結果と、同期情報入力部405で入力した同期情報と、を合成する。
図5は、本発明の一実施形態に係る情報処理装置(抽出処理)の概略構成図である。本情報処理装置は、文書画像を入力し、文書画像中の各文字の外接矩形を求め、この外接矩形内の文字に埋め込まれた情報を抽出するものである。
まず、文書画像500が文書画像入力部501から入力される。次に、文書解析部502において、文書画像入力部501で入力された文書画像500中の各文字の外接矩形を求め、この外接矩形の領域内の文字に埋め込まれた情報を合成埋め込み情報抽出部503で抽出する。次に、合成埋め込み情報抽出部503で抽出された合成埋め込み情報、分離抽出部504において、同期情報と埋め込み情報とに分離する。ここでは、合成埋め込み情報から、埋め込み情報を構成するn−1ビットと、同期情報の1ビットとを交互に分離する。あるいは、合成埋め込み情報から、まず、同期情報を抽出し、同期情報を除外した情報を、文書画像500に埋め込まれた埋め込み情報としてもよい。
同期情報入力部506において、記憶部505に記憶された複数ビットで構成され、予め設定されたビットパターンからなる同期情報を入力する。誤り訂正部507は、同期情報抽出部503で抽出された同期情報と、同期情報入力部506で入力した同期情報と、を比較することで合成埋め込み情報抽出部503の抽出誤りを判定する。ここで、抽出誤りがあると判定された場合には、同期情報抽出部504で抽出された同期情報と、同期情報入力部506で入力された同期情報とが一致するように合成埋め込み情報を訂正する。なお、訂正には、ビット挿入、ビット削除、ビット反転を行って訂正を行う。埋め込み情報出力部508は、誤り訂正部507で処理された後の埋め込み情報を出力する。
図6は、本発明の一実施形態に係る情報処理装置の電気的な構成図である。なお、本発明の情報処理装置を実現するにあたっては、図5に示すすべての機能を用いることが必須であるわけではない。
コンピュータ601は、一般に普及しているパーソナルコンピュータや組み込みシステム等の汎用の情報処理装置である。コンピュータ601は、スキャナ617等の画像入力装置から読み取られた画像を入力し、編集や保管を行うことが可能である。また、画像入力装置で得られた画像をプリンタ616から印刷させることも可能である。なお、ユーザからの指示は、マウス613、キーボード614、タッチパネル619等からの入力操作により行われる。コンピュータ601の内部では、バス607によって各ブロックが接続されているため、種々のデータの受け渡しが可能である。
CPU602は、コンピュータ601内部の各ブロックの動作を制御し、又は内部に記憶されたプログラムを実行することができる。主記憶装置(RAMで構成される)603は、CPU602において行われる処理のために、一時的にプログラムや処理対象の画像データを格納する装置である。ハードディスク(HDD)604は、主記憶装置603等に転送されるプログラムや画像データをあらかじめ格納したり、処理後の画像データを保存したりすることができる装置である。
スキャナインタフェース615は、原稿やフィルム等を読み取って、画像データを生成するスキャナ617と接続され、スキャナ617で得られた画像データを入力することのできるインタフェースである。プリンタインタフェース608は、画像データを印刷するプリンタ616と接続され、印刷する画像データをプリンタ616に送信することのできるインタフェースである。
CDドライブ609は、外部記憶媒体の1つであるCD(CD−R/CD−RW)に記憶されたデータを読み込んだり書き出したりすることができる装置である。FDDドライブ611は、CDドライブ609と同様にFDDからの読み込みや、FDDへの書き出しができる装置である。DVDドライブ610は、FDDドライブ611と同様に、DVDからの読み込みや、DVDへの書き出しができる装置である。なお、CD、FDD、DVD等にプログラムが記憶されている場合には、これらのプログラムをHDD604にインストールし、必要に応じて主記憶装置603に転送されるようになっている。
入力インタフェース612は、マウス613やキーボード614からの入力指示を受け付けるために接続されたインタフェースである。タッチパネルインタフェース618は、タッチパネル619からの入力指示を受けるために接続されるインタフェースである。また、モニタ606は、埋め込み情報の抽出処理結果や処理過程を表示することのできる表示装置である。さらに、ビデオコントローラ605は、表示データをモニタ606に送信するための装置である。
なお、本発明は、複数の機器(例えば、ホストコンピュータ、インタフェース機器、リーダ、プリンタ等)から構成されるシステムに適用してもよいし、1つの機器からなるMFPに適用してもよい。
上記の構成において、主記憶装置603にロードしたプログラムをCPU602等で実行することにより、情報処理装置として機能する。
次に、上述した構成を備える情報処理装置で行われる各処理について、各実施形態において具体的に説明する。
<第1実施形態>
図7は、第1実施形態に係る情報処理装置の動作手順を示すフローチャート、図8は、合成部406での埋め込み情報生成処理を具体例を挙げて説明するための図である。
まず、埋め込み情報を埋め込む対象となる文書400が、スキャナ617等の文書入力部401を介して、文書解析部402に入力される(ステップS701)。文書400は、印刷物をスキャナ617等から入力し、それをビットマップ化したものでも良い。また、種々の電子データを画像処理ソフト等によって変換し、ビットマップ化したものでも良い。なお、種々の電子データは、図6のハードディスク604やCDドライブ609、DVDドライブ610、FDDドライブ611等に接続された各記憶媒体に格納されたものである。
次に、文書解析部402では、文書入力部401に入力された文書400の外接矩形(文字領域)の抽出が行われる(ステップS702)。なお、文字の外接矩形は、本来は、文字認識を行う領域を指す情報であるが、文書へ情報を埋め込む技術又は埋め込まれた情報を抽出する技術においては、埋め込み操作の対象となる文字領域を示すものである。具体的には、文書画像の各画素値を垂直座標軸に対して射影し、空白部分(有意画素のない部分)を探索して行を判別して行分割を行う。その後、行単位で文書400を水平座標軸に対して射影し、空白部分を探索して文字単位に分割する。これにより、各文字を外接矩形で切り出すことが可能となる。
次に、文書400に埋め込むべき埋め込み情報403が、キーボード614等の埋め込み情報入力部404から入力される(ステップS703)。埋め込み情報403は、あらかじめ記憶装置に蓄積したものから選択してもよい。
次に、埋め込み情報入力部404で入力された埋め込み情報から誤り訂正符号が生成される(ステップS704)。例えば、図8で示すように、埋め込み情報801から誤り訂正符号802が生成される。
次に、合成部406で埋め込み情報に同期情報を並べて付加した合成埋め込み情報を生成する(ステップS705)。例えば、図8で示すように、合成埋め込み情報805は、埋め込み情報801に同期情報803を並べて埋め込んだ情報である。1文字に2ビットの情報が埋め込まれる場合には、埋め込み情報の1ブロック(例えば、図8の804)は1ビットの埋め込み情報と、1ビットの同期情報と、から構成される。1文字にnビット(n>1)の情報が埋め込まれる場合には、埋め込み情報の1ブロックはn−1ビットの埋め込み情報と、1ビットの同期情報と、から構成される。これにより、文字毎に同期情報を1ビットずつ埋め込むことができる。
なお、同期情報は周期N(N>1)である任意の符号であれば良い。本実施形態では、同期情報として疑似雑音系列を埋め込む。図8で示す同期情報803は、周期7の疑似雑音系列を示す。
次に、ステップS702で抽出した外接矩形を1つ読み込み(ステップS706)、埋め込み部407によりその外接矩形内の文字に合成埋め込み情報が埋め込まれる(ステップS707)。読み込まれた外接矩形には、図8に示す1ブロックの合成埋め込み情報が埋め込まれる。
図9は、埋め込み部407での合成埋め込み情報の埋め込み処理の説明図である。本処理は、異なる4種類の埋め込みパターン(ここでは、ドットパターン)を用いて、文字に合成埋め込み情報を埋め込むものである。例えば、文字に合成埋め込み情報「00」(2進数で表示)を埋め込むのに、ドットパターン0(図9で示す900)で文字を構成する(図9で示す910)。文字に合成埋め込み情報「01」を埋め込むのに、ドットパターン1(図9で示す901)で文字を構成する(図9で示す911)。文字に合成埋め込み情報「10」を埋め込むのに、ドットパターン2(図9で示す902 )で文字を構成する(図9で示す912)。文字に合成埋め込み情報「11」を埋め込むのに、ドットパターン3(図9で示す903)で文字を構成する(図9で示す913)。また、文字の輪郭にはドットパターンを埋め込まないようにすると、文字自体が認識しやすいので、望ましい。なお、ドットパターンは、同じ濃度を持ち、お互いの相互相関が低いものであれば、図9で示したパターンでなくてもよい。。ここでは、ドットパターンを用いた例を示したが、ドットパターンでなくても、1文字にnビット(nは2以上の整数)埋め込める埋め込み方式であれば構わない。例えば、多段階に文字の濃淡を変更する、あるいは、カラーや、パターン・模様を用いるものでも構わない。
次に、注目外接矩形が文書400中の最終の外接矩形であるか否かが判断される(ステップS708)。ステップS708において、その注目外接矩形が最終の外接矩形ではないと判断された場合には、ステップS706に戻って、次の外接矩形を読み込む。一方、ステップS708において、最終の外接矩形であると判断された場合には、合成埋め込み情報を埋め込んだ文書409が生成される(ステップS709)。図4で示すように、この埋め込み文書409は、文書出力部408から出力される。なお、文書出力部408での出力は、プリンタでの印刷、記憶装置等への画像データとしての記憶、又はネットワーク等から他の端末等への送信等の種々の形態で行うことができる。
図10は、第1実施形態に係る情報処理装置(抽出処理)の動作手順を示すフローチャート、図11は、合成埋め込み情報抽出部503での合成埋め込み情報抽出処理を具体例を挙げて説明するための図である。
まず、文書画像入力部501を介して、文書解析部502に文書画像が入力され(ステップS1001)、文書画像から外接矩形の抽出を行った後に、文字切り出しを行う(ステップS1002)。この処理は、埋め込み処理を行う情報処理装置の文字解析部402と同じ処理である。
次に、文字毎に埋め込まれた合成埋め込み情報を抽出する(ステップS1003)。合成埋め込み情報は、合成埋め込み情報抽出部503で外接矩形に埋め込まれた埋め込みパターン(ドットパターン)を検出することで抽出できる。本実施形態では、1つの外接矩形から2ビットの情報が抽出される。例えば、図11において、文字列「ABC・・・」から合成埋め込み情報1101が抽出され、文字「A」から合成埋め込み情報「10」が抽出されていることから、埋め込み情報は「1」であることがわかる。次に、分離部504において、抽出された合成埋め込み情報から同期情報を取り出す(ステップS1004)。例えば、図11で示すように、同期情報1102が取り出される。これは、合成埋め込み情報の各ブロックから1ビットずつ取り出して、並べたものである。
次に、誤り訂正部507において、分離部540で分離された同期情報と、同期情報入力部506で入力された同期情報とを比較することにより、誤り箇所を検出する(ステップS1005)。例えば、図11で示すように、入力された同期情報が「0110100・・・」であり、分離された同期情報が「01100100・・・」である場合には、両者の比較により、抽出情報の3番目と4番目に誤りが発生したことがわかる。
なお、本実施形態において、同期情報は、疑似雑音系列(PN系列)で表現されるため、同期情報の相互相関を取ることで同期誤り位置を検出しても良い。疑似雑音系列は、Paa(k)=1(k=0),−1/n(0<k<n)という自己相関関数をもつ系列である。図12は、周期7の疑似雑音系列の自己相関関数の説明図である。この自己相関関数を用いた場合には、同期情報に誤りが発生していない場合には、求められた相互相関値は1又は−1/7になるが、同期情報に誤りが発生している場合には、相互相関値は1又は−1/7以外になるので、誤り箇所を容易に発見することができる。
ステップS1005において、同期誤りが検出された場合には、ステップS1006に進む。誤り訂正部507において、検出した誤り箇所の同期情報を訂正する。なお、同期誤り訂正の種類にはビットの挿入、削除、反転がある。入力された同期情報と分離された同期情報とが一致するように、分離された同期情報を訂正する。結果として、文字の辺と旁が分離して外接矩形が抽出された場合は、誤り箇所のビットが削除される。また、文字と文字が結合して外接矩形が抽出された場合は、ビットが挿入される。
図13は、誤り訂正部507での同期誤り訂正処理を具体例を挙げて説明するための図である。文字を「ABC」、埋め込み情報を「S」、同期情報を「X」とする。ただし、文字「B」は、外接矩形の抽出において、2つの文字として認識され、分離するような文字ではないが、ここでは、外接矩形の抽出において、2つの文字として抽出されるものとする。1301において、同期誤り箇所1302が検出された場合には、同期誤りが訂正される(図13で示す1303)。ここでは、1ビット挿入誤りが発生したため、誤り箇所の1ビットの同期情報が削除される。次に、同期誤り訂正によって埋め込み情報の位置が訂正される(図13で示す1304)。係る同期誤り訂正処理によって、埋め込み情報の同期誤り訂正を行う。
ステップS1006において、同期誤り訂正が終了すると、ステップS1005に戻り、次の同期誤り箇所を検出する。一方、ステップS1005において、同期誤りの箇所が検出されない場合には、分離部504で分離された埋め込み情報の誤り訂正を行う(ステップS1007)。この処理は、誤り訂正部507で実行され、誤り訂正符号による訂正を行う。次に、埋め込み情報出力部508において、埋め込み情報を出力して(ステップS1008)、処理を終了する。
なお、一般的なGMD(Generalized Minimum Distance decoding)法を用いて、受信した各シンボルの信頼度を合わせて用いることで、復号の信頼性を向上させてもよい。この信頼度は、従前に抽出誤りがあると判定されたものは、抽出誤りが発生しやすい部位であるという考えに基づいている。抽出された埋め込み情報には、各々信頼度(例えば、R=1)を付加して、この信頼度Rに基づいて、埋め込み情報の誤り訂正を行う。埋め込み情報ビットが同期誤り訂正された場合には、信頼度Rを低く設定してもよい。例えば、訂正後の信頼度をR(n)、訂正前の信頼度をR(n−1)として、R(n)=R(n−1)*0.8で示すように、埋め込み情報が誤り訂正された場合には、信頼度を訂正前の80%に設定することができる。また、文字のフォントが小さい場合には、文字面積が小さく、埋め込み情報の抽出率が悪化するため、埋め込み情報の信頼度と文字面積を連動しても良い。また、文字から抽出したドットパターンの類似度と埋め込み情報の信頼度を連動してもよい。
なお、同期誤りを検出した場合、誤り位置を文字解析部502に通知し、矩形抽出をやり直してもよい。ここでは図14に示すフローチャートを用いて説明する。ステップS1005において、同期誤りが検出された場合には、誤り位置を文字解析部502に通知し、再び外接矩形の抽出を行ってもよい。なお、前述した処理と同様であるステップS1001からステップS1004の説明は省略する。ステップS1005において、同期誤り箇所が検出された場合には、ステップS1002に戻る。次に、誤り箇所の位置情報を用いて外接矩形を訂正し(ステップS1002)、訂正箇所の合成埋め込み情報を再抽出する(ステップS1003)。これにより、文字切り誤りが発生した場合でも、正確に埋め込み情報を抽出することができる。
なお、本実施形態では、埋め込み情報403を構成するn−1ビットと、同期情報を構成する1ビットとを、1文字に埋め込む例を示したが、これに限定されない。例えば、1文字に2ビットの同期情報を埋め込んでも構わない。つまり、1文字に、同期情報が少なくとも1ビット埋め込まれていればよい。さらに、合成埋め込み情報の生成の仕方においても、同期情報を構成する1ビットを、埋め込み情報を構成するn−1ビットの後に合成する例を示したが、これに限定されない。例えば、埋め込み情報の前や、埋め込み情報の間であっても構わず、抽出側と同期情報の箇所が共有できていればよい。
<第1実施形態−変形例1>
本変形例では、文字サイズに応じて埋め込む同期情報が選択できるように工夫を加えた。なお、埋め込み情報埋め込み処理におけるステップS705以外は、第1実施形態と同様であるため、説明を省略する。
本変形例に係る情報処理装置(埋め込み処理)の構成は、共通構成で説明したもの(図4)に加えて、第1の周期のビットパターンと、第1の周期よりも長い第2の周期のビットパターンと、を記憶するビットパターン記憶部を備える。また、埋め込み対象の文字の外接矩形のサイズを検出する検出部を備える。さらに、検出部に検出された外接矩形の面積が予め設定された閾値よりも大きい場合には、第1の周期のビットパターンを選択し、外接矩形の面積が予め設定された閾値以下の場合には第2の周期のビットパターンを選択する選択部を備える。ビットパターン入力部は、選択部で選択したビットパターンを入力する。
ここで、同期情報の選択方法について、詳細に説明する。図15は、第1実施形態の変形例1におけるステップS705の詳細な動作手順を示すフローチャート、図16及び17は、第1実施形態の変形例1に係る外接矩形誤りの説明図である。
まず、1文字の外接矩形面積を算出する(ステップS705a)。この外接矩形面積は、ステップS702で算出した外接矩形情報から算出することができる。なお、外接矩形の面積を算出するに際して、文書画像の最初の文字のみから外接矩形面積を算出してもよいし、文書画像全体の外接矩形面積の平均を算出してもよい。また、各段落の最初の文字のみを抽出して外接矩形面積の平均を算出してもよいし、文書画像の中でランダムに選択した文字から外接矩形面積を算出してもよい。
次に、算出された外接矩形面積が、任意の閾値Mより大きいか否かを比較する。なお、閾値Mは、ユーザが予め任意に定めることができる。外接矩形面積が閾値Mより大きい場合には、短い周期(第1の周期)の同期情報を選択する(ステップS705c)。例えば、周期が2の同期情報「0101・・・」を利用しても良い。これは、外接矩形の面積が大きい場合には、辺と旁が2つに分離する矩形抽出誤り(図16(c)で示す文字「静」)しか発生しないためである。このような矩形抽出誤りは、短い周期の同期情報でも容易に発見できる。
一方、外接矩形の面積が閾値M以下である場合には、第1の周期よりも長い周期(第2の周期)の同期情報を選択する(ステップS705d)。これは、外接矩形の面積が小さい場合には、図17で示すように、多数の文字にまたがった矩形抽出誤りが発生しやすいためである。次に、選択された同期情報を埋め込み情報に付加する(ステップS705e)。
なお、埋め込み情報を抽出する際に埋め込まれた同期情報の種類は、ステップS705aを実行することで容易に判断できる。
<第2実施形態>
本実施形態では、入力された文書画像が、埋め込み情報が埋め込まれている文書画像であるか否かを容易に判断できるように工夫を加えた。本実施形態では、埋め込み情報抽出処理において、第1実施形態に部分的に処理を追加しただけであるため、共通の部分については共通の符号を付し、説明を省略する。
図2は、第2実施形態に係る情報処理装置(抽出処理)の動作手順を示すフローチャート、図3は、第2実施形態に係るステップS1801の詳細な動作手順を示すフローチャートである。
まず、文書画像を読み取り(ステップS1001)、読み取った文書画像の外接矩形を抽出する(ステップS1002)。次に、抽出した同期情報と埋め込んだ同期情報との相互相関値を算出し(ステップS1801)、正しい相互相関値があるか否かを判断する(ステップS1802)。ステップS1802において、正しい相互相関値があると判断された場合には、その文書画像には埋め込み情報が埋め込まれていると判断され、第1実施形態と同じ手順で埋め込み情報を抽出する。一方、ステップS1802において、正しい相互相関値がないと判断された場合には、その文書画像には埋め込み情報が埋め込まれていないと判断され、埋め込み情報抽出の処理を終了する。なお、本実施形態では、少なくとも1箇所の相互相関値が正しいと判断された場合には、文書画像には埋め込み情報が埋め込まれていると判断される。
ここで、図3を用いて、ステップS1801における相互相関値の算出手順について説明する。まず、連続した外接矩形を取り出す(ステップS1801a)。なお、取り出す外接矩形の数は、例えば、最小の同期情報の周期の2倍とする。また、外接矩形は、文書画像の任意の箇所から取り出してもよい。
次に、取り出した外接矩形から同期情報を抽出し(ステップS1801b)、抽出した同期情報と、埋め込んだ同期情報と、の相互相関値を算出する(ステップS1801c)。なお、埋め込み情報が埋め込まれている文書画像には疑似雑音系列が埋め込まれているため、正しい場合の相互相関値は、1又は−1/Nである。
<その他の実施形態>
本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(又は記憶媒体)を装置に供給し、その装置のコンピュータが記録媒体に格納されたプログラムコードを読込み実行することによっても実現可能である。なお、コンピュータには、CPUやMPUが含まれる。この場合、記録媒体から読み出されたプログラムコード(コンピュータプログラム)自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体(コンピュータ可読記憶媒体)は、本発明を構成することになる。
また、コンピュータが読み出したプログラムコードの指示に基づいて、コンピュータ上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を実行することによって、前述した実施形態の機能が実現される場合も含まれる。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、プログラムコードの指示に基づいて、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を実行することによって、前述した実施形態の機能が実現される場合も含まれる。
本発明を上記記録媒体に適用する場合には、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
なお、上述の実施形態では、合成埋め込み情報に誤り訂正符号を付加したが、本発明においては、誤り訂正符号を付加することは必須ではない。
従来の外接矩形抽出処理の説明図である。 第2実施形態に係る情報処理装置(抽出処理)の動作手順をを示すフローチャートである。 第2実施形態に係るステップS1801の詳細な動作手順を示すフローチャートである。 本発明の一実施形態に係る情報処理装置(埋め込み処理)の概略的な構成図である。 本発明の一実施形態に係る情報処理装置(抽出処理)の概略的な構成図である。 本発明の一実施形態に係る情報処理装置の電気的な構成図である。 第1実施形態に係る情報処理装置(埋め込み処理)の動作手順を示すフローチャートである。 合成部406での合成処理を具体例を挙げて説明するための図である。 埋め込み部407での合成埋め込み情報の埋め込み処理を説明するための図である。 第1実施形態に係る情報処理装置(抽出処理)の動作手順を示すフローチャートである。 合成埋め込み情報抽出部503での合成埋め込み情報の抽出処理を具体例を挙げて説明するための図である。 周期7の疑似雑音系列の自己相関関数の説明図である。 制御部507での同期誤り訂正処理を具体例を挙げて説明するための図である。 第1実施形態に係る情報処理装置(抽出処理)の動作手順を示すフローチャートである。 第1実施形態の変形例1に係るステップS705の詳細な動作手順を示すフローチャートである。 第1実施形態の変形例1に係る外接矩形誤りの説明図である。 第1実施形態の変形例1に係る外接矩形誤りの説明図である。
符号の説明
400 文書
401 文書入力部
402 文書解析部
403 埋め込み情報
404 埋め込み情報入力部
405 同期情報入力部
406 合成部
407 埋め込み部
408 文書出力部
409 埋め込み文書

Claims (9)

  1. 文書中の各文字に、nビット(nは2以上の整数)の情報を埋め込む情報処理装置であって、
    文字で構成される文書を入力する文書入力手段と、
    前記文書に埋め込むべき埋め込み情報を入力する埋め込み情報入力手段と、
    複数ビットで構成され、予め設定されたビットパターンからなる同期情報を入力する同期情報入力手段と、
    入力した埋め込み情報を構成するビットと、前記同期情報を構成するビットとを合成することで、合成埋め込み情報を生成する合成手段と、
    該合成手段で生成された合成埋め込み情報を前記文書入力手段で入力した文書中の各文字に埋め込み、埋め込み後の文書を出力する埋め込み手段と、を備え、
    前記埋め込み手段は、
    個の埋め込みパターンを記憶する記憶手段と、
    前記合成手段で生成された前記合成埋め込み情報中の、少なくとも1ビットの前記同期情報を含むnビットの値に従って、前記記憶手段に記憶された埋め込みパターンのいずれか1つを選択し、選択された埋め込みパターンで埋め込み対象の文字の外接矩形内の文字画像をマスクするマスク手段とを有する
    ことを特徴とする情報処理装置。
  2. 更に、第1の周期のビットパターンと、当該第1の周期よりも長い第2の周期のビットパターンを記憶するビットパターン記憶手段と、
    埋め込み対象の文字の外接矩形のサイズを検出する検出手段と、
    該検出手段により検出された外接矩形の面積が予め設定された閾値よりも大きい場合には、前記第1の周期のビットパターンを選択し、前記外接矩形の面積が前記予め設定された閾値以下の場合には前記第2の周期のビットパターンを選択する選択手段と、
    前記選択手段で選択したビットパターンを入力するビットパターン入力手段と、
    を備えることを特徴とする請求項1記載の情報処理装置。
  3. 更に、前記埋め込み情報入力手段で入力した前記埋め込み情報に誤り訂正情報を付加する誤り訂正情報付加手段を備え、
    前記合成手段は、前記誤り訂正情報付加手段によって付加された前記誤り訂正情報の付加結果と、前記同期情報入力手段で入力された同期情報と、を合成することを特徴とする請求項1又は2に記載の情報処理装置。
  4. 請求項1の情報処理装置で生成された文書画像から情報を抽出する情報処理装置であって、
    文書画像を入力する文書画像入力手段と、
    入力された文書画像中の各文字の外接矩形を求め、当該外接矩形内の文字が、2 個(nは2以上の整数)の埋め込みパターンのうちのいずれでマスクされたかを判定することで、前記外接矩形内の文字に埋め込まれた情報を抽出する合成埋め込み情報抽出手段と、
    該合成埋め込み情報抽出手段で抽出された合成埋め込み情報を同期情報と埋め込み情報とに分離する分離手段と、
    同期情報を入力する同期情報入力手段と、
    前記分離手段で分離された同期情報と、前記同期情報入力手段で入力された同期情報とを比較することで、前記合成埋め込み情報抽出手段の抽出誤りを判定し、抽出誤りがあったと判定した場合には、前記分離手段で分離された同期情報と前記入力手段で入力された同期情報とが一致するように、前記合成埋め込み情報を訂正する訂正手段と、
    を備えることを特徴とする情報処理装置。
  5. 前記同期情報入力手段で入力される同期情報は、疑似雑音系列であることを特徴とする請求項に記載の情報処理装置。
  6. 文書中の各文字に、nビット(nは2以上の整数)の情報を埋め込む情報処理方法であって、
    文字で構成される文書を入力する文書入力工程と、
    前記文書に埋め込むべき埋め込み情報を入力する埋め込み情報入力工程と、
    複数ビットで構成され、予め設定されたビットパターンからなる同期情報を入力する同期情報入力工程と、
    入力した埋め込み情報を構成するビットと、前記同期情報を構成するビットとを合成することで、合成埋め込み情報を生成する合成工程と、
    該合成工程で生成された合成埋め込み情報を前記文書入力工程で入力した文書中の各文字に埋め込み、埋め込み後の文書を出力する埋め込み工程と、を備え、
    前記埋め込み工程は、
    前記合成工程で生成された前記合成埋め込み情報中の、少なくとも1ビットの前記同期情報を含むnビットの値に従って、記憶手段に記憶された2 個の埋め込みパターンのいずれか1つを選択し、選択された埋め込みパターンで埋め込み対象の文字の外接矩形内の文字画像をマスクするマスク工程とを有する
    ことを特徴とする情報処理方法。
  7. 請求項1の情報処理装置で生成された文書画像から情報を抽出する情報処理方法であって、
    文書画像を入力する文書画像入力工程と、
    入力された文書画像中の各文字の外接矩形を求め、当該外接矩形内の文字が、2 個(nは2以上の整数)の埋め込みパターンのうちのいずれでマスクされたかを判定することで、前記外接矩形内の文字に埋め込まれた情報を抽出する合成埋め込み情報抽出工程と、
    該合成埋め込み情報抽出工程で抽出された合成埋め込み情報を同期情報と埋め込み情報とに分離する分離工程と、
    同期情報を入力する同期情報入力工程と、
    前記分離工程で分離された同期情報と、前記同期情報入力工程で入力された同期情報とを比較することで、前記合成埋め込み情報抽出工程の抽出誤りを判定し、抽出誤りがあったと判定した場合、前記分離工程で分離された同期情報と、前記入力工程で入力された同期情報とが一致するように、前記合成埋め込み情報を訂正する訂正工程と、
    を備えることを特徴とする情報処理方法。
  8. コンピュータが読込み実行することで、前記コンピュータを、請求項1乃至5のいずれか1項に記載の情報処理装置として機能させることを特徴とするコンピュータプログラム。
  9. 請求項に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
JP2007159492A 2007-06-15 2007-06-15 情報処理装置及びその方法 Expired - Fee Related JP4871793B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007159492A JP4871793B2 (ja) 2007-06-15 2007-06-15 情報処理装置及びその方法
KR1020080055719A KR100938539B1 (ko) 2007-06-15 2008-06-13 정보 처리 장치 및 그 방법
CN2008101110836A CN101325642B (zh) 2007-06-15 2008-06-13 信息处理装置及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007159492A JP4871793B2 (ja) 2007-06-15 2007-06-15 情報処理装置及びその方法

Publications (3)

Publication Number Publication Date
JP2008312063A JP2008312063A (ja) 2008-12-25
JP2008312063A5 JP2008312063A5 (ja) 2010-03-04
JP4871793B2 true JP4871793B2 (ja) 2012-02-08

Family

ID=40188950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007159492A Expired - Fee Related JP4871793B2 (ja) 2007-06-15 2007-06-15 情報処理装置及びその方法

Country Status (3)

Country Link
JP (1) JP4871793B2 (ja)
KR (1) KR100938539B1 (ja)
CN (1) CN101325642B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081736B (zh) * 2009-11-27 2014-11-26 株式会社理光 从可移植电子文档中提取字符外接矩形的设备和方法
JP5906788B2 (ja) * 2012-02-17 2016-04-20 オムロン株式会社 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004247883A (ja) 2003-02-12 2004-09-02 Canon Inc 画像処理方法
JP4232676B2 (ja) 2004-04-05 2009-03-04 沖電気工業株式会社 情報検出装置,画像処理システム,および情報検出方法
CN1276387C (zh) * 2004-06-10 2006-09-20 上海交通大学 基于图像连通性的自适应同步水印方法
JP2006050551A (ja) 2004-06-30 2006-02-16 Canon Inc 画像処理装置及びその方法、並びにプログラム及び記憶媒体
JP4324058B2 (ja) * 2004-08-31 2009-09-02 キヤノン株式会社 画像処理装置及びその方法
JP4532331B2 (ja) * 2004-12-08 2010-08-25 株式会社リコー 情報埋め込み装置、情報抽出装置、情報埋め込み方法、情報抽出方法、情報埋め込みプログラム、及び情報抽出プログラム
JP4310288B2 (ja) * 2005-04-12 2009-08-05 キヤノン株式会社 画像処理装置及びその方法、プログラム並びに記憶媒体
CN100365655C (zh) * 2005-08-16 2008-01-30 北京交通大学 一种抵抗旋转伸缩和位移攻击的数字水印方法

Also Published As

Publication number Publication date
CN101325642B (zh) 2010-08-25
KR100938539B1 (ko) 2010-01-25
KR20080110532A (ko) 2008-12-18
CN101325642A (zh) 2008-12-17
JP2008312063A (ja) 2008-12-25

Similar Documents

Publication Publication Date Title
JP4310288B2 (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
US8391607B2 (en) Image processor and computer readable medium
JPH10143604A (ja) パタン抽出装置
JP4207049B2 (ja) 同定機能付き印刷物、画像生成装置、画像処理装置及びその方法
JP2006050551A (ja) 画像処理装置及びその方法、並びにプログラム及び記憶媒体
JP2007179111A (ja) コードパターン、印刷物、画像生成装置、画像処理装置、画像生成方法及び情報特定方法
JP2004180277A (ja) 電子透かし埋め込み方法、電子透かし抽出方法、それらの装置及びプログラム並びに記憶媒体
CN103995816A (zh) 信息处理设备和信息处理方法
KR100905857B1 (ko) 정보 처리 장치 및 정보 처리 장치의 제어 방법
US7627136B2 (en) Information embedding device, information detecting device, information embedding and detecting system, information embedding method, information detecting method, information embedding program, information detecting program, information embedding and detecting program, and recording medium
CN101833747A (zh) 一种生成基于数字水印的安全字库的方法及系统
JP2004023565A (ja) 電子透かし埋め込み装置、電子透かし抽出装置、及びそれらの方法
JP4871793B2 (ja) 情報処理装置及びその方法
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
JP2016063507A (ja) 画像処理装置及び画像処理プログラム
US20040142096A1 (en) Digital watermark embedding method, digital watermark extraction method, digital watermark embedding apparatus, and digital watermark extraction apparatus
JP4867401B2 (ja) 画像処理装置及びプログラム
JP5867790B2 (ja) 画像処理装置
JP2004247883A (ja) 画像処理方法
JP3780181B2 (ja) 画像処理装置及びデータ処理装置とその方法及び記憶媒体
JP2002232679A (ja) 画像処理方法及び装置及びコンピュータプログラム及び記憶媒体
JP2010108296A (ja) 情報処理装置、情報処理方法
CN104516579A (zh) 信息处理装置以及信息处理方法
JP2006279090A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4575873B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100120

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110701

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110812

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111021

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees