JP2010103862A - 文書処理装置および文書処理方法 - Google Patents

文書処理装置および文書処理方法 Download PDF

Info

Publication number
JP2010103862A
JP2010103862A JP2008274868A JP2008274868A JP2010103862A JP 2010103862 A JP2010103862 A JP 2010103862A JP 2008274868 A JP2008274868 A JP 2008274868A JP 2008274868 A JP2008274868 A JP 2008274868A JP 2010103862 A JP2010103862 A JP 2010103862A
Authority
JP
Japan
Prior art keywords
character string
string information
information
line
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008274868A
Other languages
English (en)
Inventor
Masanori Yokoi
優智 横井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008274868A priority Critical patent/JP2010103862A/ja
Priority to US12/604,483 priority patent/US20100104131A1/en
Publication of JP2010103862A publication Critical patent/JP2010103862A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0051Embedding of the watermark in the spatial domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0062Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

【課題】一般に文書画像にはノイズや追記などが付加されることが多く、また、1行の文字数が少ない箇所も存在する。このような文書画像に対して文字列矩形を求め、行間隔を取得した場合、行間透かし情報を抽出するのに適切な行間隔が得られるとは限らないため、行間透かし情報を誤抽出してしまう場合もある。
【解決手段】
文書画像における文字列情報として文字列の高さと行間隔値を取得し(S504)、文字列の高さと前記行間隔値のばらつきとして分散をそれぞれ算出する(S505)。そして、算出された分散の値が閾値以下であれば(S506)、当該文字列情報は行間透かしを抽出するのに適切であるとみなし、該文字列情報から行間透かし情報を抽出する(S507)。
【選択図】 図5

Description

本発明は文書処理装置および文書処理方法に関し、特に、文書画像に対して行間隔を利用して埋め込まれている透かし情報を抽出する文書処理装置および文書処理方法に関する。
文書画像に著作権や複写制御等の情報を非可視な状態で持たせるため、行間隔を微小に変更して情報を埋め込む方法が知られている(例えば、非特許文献1参照)。以下、このように行間隔を利用して埋め込まれた情報を行間透かしと称する。
ここで図2を用いて、一般的な行間透かしの概念について説明する。文書画像から行間透かしとして埋め込まれた情報を抽出する場合には、まず当該文書画像内の文字列間の行間隔を求める必要がある。行間隔を求めるために、一般的には文書画像に対して黒画素連結矩形つまり文字列矩形を求め、当該文字列矩形から行間隔を導出する。そして、導出された行間隔と埋め込み時に使用した規則とに従って、情報を抽出する。ここで埋め込み時に使用した規則とは例えば図2に示すように、「0」/「1」の2値情報のうち「0」を埋め込みたい場合は、行間隔LS(i),LS(i+1)に対し、LS(i)>LS(i+1)となるよう設定する。一方、「1」を埋め込みたい場合には、行間隔LS(i),LS(i+1)に対し、LS(i)<LS(i+1)となるよう設定する。
「電子透かしの基礎 - マルチメディアのニュープロテクト技術 -」森北出版株式会社 松井甲子雄 著 p198-p199
しかしながら、一般的な文書画像には図3に示すように、ノイズや追記などが付加されることが多く、また、1行の文字数が少ない箇所も存在する。このような文書画像に対して、文字列矩形を求め、行間隔を取得した場合、取得箇所によって行間隔が大きく異なることがある。
ここで、図3に示す文書画像を例として、文字列矩形が取得箇所によって異なる様子を示す。図3に示す文書画像においては、行間透かしが埋め込まれている文字列群において、1行の文字数が少ない箇所があり、さらに、追記が付加されたりノイズが発生している例を示す。図4は、図3に示す文書画像に対して文字列矩形を求めたものである。なお、図4では行間隔と区別するため、文字列矩形内を黒く塗潰して表現している。図4に示す文書画像において、縦方向の矢印で示される走査A,B,Cでは、取得される行間隔が走査箇所、すなわち取得箇所によって明らかに異なってくることが分かる。
図4に示す文字列矩形によれば、取得された行間隔の情報だけでは、対応する取得箇所がノイズや追記がある、または文字数が少ない箇所がある等、行間隔取得には不適当な箇所(以下、抽出不適箇所)であったのか否かを判断することは困難であった。また、これらの取得箇所から透かし情報を抽出した場合、行間隔が異なっているため透かし情報が誤って抽出される可能性があった。
本発明は上述した問題を解決するためになされたものであり、文書画像に埋め込まれた行間透かし情報を高精度に抽出可能とする文書処理装置および画像処理方法を提供することを目的とする。
上記目的を達成するための一手段として、本発明の文書処理装置は以下の構成を備える。
すなわち、文書画像から、行間隔を利用して埋め込まれた行間透かし情報を抽出する文書処理装置であって、文書画像を入力する入力手段と、前記文書画像における文字列情報として、文字列の高さと行間隔値を取得する文字列情報取得手段と、前記文字列の高さと前記行間隔値のばらつきをそれぞれ算出するばらつき算出手段と、前記ばらつき算出手段で算出されたばらつきの値に応じて、前記文字列情報が行間透かし情報を抽出するのに適切であるか否かを判定する文字列情報判定手段と、前記文字列情報判定手段で前記文字列情報が適切であると判定された場合に、該文字列情報から行間透かし情報を抽出する透かし情報抽出手段と、を有することを特徴とする。
上記構成からなる発明によれば、文書画像に埋め込まれた行間透かし情報を高精度に抽出することができる。
以下、添付の図面を参照して、本発明をその好適な実施形態に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
<第1実施形態>
本実施形態においては、文書画像に対し、行間隔を利用して埋め込まれた行間透かし情報を高精度に抽出することを特徴とする。図1は、本実施形態における文書処理装置の主要な機能構成を示すブロック図である。図1に示すように、本実施形態における文書処理装置11は、画像入力部101、文字列情報取得部102、文字列情報判定部103、透かし情報抽出部104、制御部105、操作部106から構成され、各部は以下のような機能を有する。すなわち、画像入力部101は、行間透かしが埋め込まれた文書画像の電子データである画像データの読み取り、または生成を行う。文字列情報取得部102は、画像データから文字列矩形を導出し、行間隔と文字列の高さを含む文字列情報を取得する。文字列情報判定部103は、取得した文字列情報から行間隔と文字列の高さのばらつきを算出し、該文字列情報がノイズや追記がある、または文字数が少ない等の抽出不適箇所に相当するものであるか否かを判定する。透かし情報抽出部104は、文字列情報判定部103の判定結果に応じて、透かし情報を抽出する。また制御部105は、上述した各機能部が連係して動作するよう、統括的な制御を行い、操作部106は、ユーザからの指示を受け付ける。
以下、本実施形態における行間透かし情報の抽出処理について、図5のフローチャートを用いて説明する。なお、図5のフローチャートに示す処理は、例えばユーザによる操作部106を介した画像読取指示をトリガとして実行される。
まずステップS501において、文書処理装置11に対して行間透かし入り画像が入力されると、画像入力部101が該行間透かし入り画像を読み取り、画像データIとして文字列情報取得部102に供給する。
ここで、行間透かし入り画像とは、例えば図2を用いて上述したように行間隔LS(i),LS(i+1)に対し、「0」/「1」の2値情報のうち「0」を埋め込みたい場合は、LS(i)>LS(i+1)となるように、行間隔が制御されている。一方、「1」を埋め込みたい場合には、LS(i)<LS(i+1)となるよう制御されている。
なお、行間透かし入り画像が紙原稿であるとすると、画像入力部101は電荷結合素子CCDまたは光学センサを有し、画像入力指示に応じて文書画像の撮影、電気信号処理、デジタル信号処理等を行って、画像データIを生成する。また、文書処理装置11内において画像データIをPDF等のデータ形式で処理する場合は、画像入力部101はその形式に従う。
そしてステップS502において文字列情報取得部102が、画像データIから矩形画像IRを作成する。詳細には、画像データIを上端部より順次走査して黒画素と白画素の境界部分を特定し、黒画素が存在する領域を黒画素で塗潰すことによって、矩形画像IRが生成される。ここで、上述した図4は、図3に示した画像データIから生成した矩形画像IRの例を示したものであるが、図4によれば、ノイズや追記も文字列矩形として含まれていることが分かる。
なお、矩形画像IRの作成方法はこの例に限らず、例えば、単位面積あたりの黒画素の濃度から文字列領域を特定し文字列矩形を生成する方法等、一般に文字認識技術において周知である文字領域分割技術を適用することができる。
次にステップS503において文字列情報取得部102は、矩形画像IRに対して文字列情報取得箇所の開始位置Xを決定する。そしてステップS504で該開始位置Xに従って、矩形画像IRから文字列情報LIを取得し、該LIを文字列情報判定部103へ供給する。
ここで文字列情報LIとは、文字列矩形画像IRにおける文字列の高さLT(図4の黒画素部分に対応)と行間隔LS(図4の白画素部分に対応)が順次格納されているデータ配列である。この文字列情報LIはすなわち、図4に示す走査A,B,Cのように、開始位置X(図4のX1,X2,X3)から文字列方向と直交する方向への走査によって得られる。例えば図4に示す走査Aによれば、LTは84,75,85,86,86,85、LSは2,3,70,71,81、として得られる。なお、ここでLTおよびLSの単位はピクセルである。
なお、矩形画像IRに対して文字列情報を取得する箇所、つまり図4に示す走査A,B,Cの主走査の座標となる開始位置Xの決定方法については特に限定されない。例えば、抽出時に予め定めた一定間隔毎に順次走査しても良いし、矩形画像IRの右部、中央部、左部の3箇所を走査するものとしても良いし、またはランダムに選択した走査を行っても良い。
次にステップS505において文字列情報判定部103は、文字列情報取得部102より供給された文字列情報LIから、文字列の高さLTと行間隔LSのばらつきを別々に求める。
これは、本実施形態が以下の特性に着目してなされているためである。すなわち、文字数が少ない箇所がなく、かつ埋め込み時と同じ文字列と行間隔のみで構成された箇所から文字列情報を取得した場合には、文字列の高さLT(図4の黒画素部分)と行間隔LS(図4の白画素部分)のばらつきが低くなる。一方、ノイズや追記がある、または文字数が少ない箇所がある等、行間透かし情報の誤抽出の要因となり得る抽出不適箇所から文字列情報を取得した場合には、文字列の高さLTと行間隔LSのばらつきが大きくなる。
したがって本実施形態では、文字列情報を取得した走査が、ノイズや追記、文字数が少ない箇所等、行間透かし情報の誤認識の要因となり得る抽出不適箇所を含んでいるか否かを判断する。そして、抽出不適箇所を含まない走査によって、すなわち抽出対象箇所より得られた文字列情報から、行間透かし情報の抽出を行うことにより、行間透かし情報の抽出精度を向上させることが可能となる。
以下、本実施形態では、上記文字列の高さLTと行間隔LSのばらつきを分散を用いて求める例を示すが、分散以外にも標準偏差を用いても良い。
例えば、n個のデータxi(i=1〜n)があるとすると、その分散σ2は、それらデータの平均xaveを用いて以下のように表される。
Figure 2010103862
ステップS505では上記式(1)を用いて、文字列の高さLTと行間隔LSの分散を算出する。そしてステップS506において文字列情報判定部103は、ステップS505で算出した分散の結果に基づいて、抽出不適箇所であるか否かの判定を行う。この判定方法としては例えば、予め所定の閾値Tを設けておき、分散を該閾値Tと比較することによって行う。すなわち、分散の値が閾値T以上ならば抽出不適箇所であると判定し、閾値T以下ならば抽出不適箇所でない、すなわち抽出対象箇所であると判定する。なお、閾値Tの値としては、予め指定した固定値であっても良いし、透かし情報埋め込み時に抽出不適箇所から分散を算出しておき、該算出結果を閾値Tとして抽出側で利用しても良い。
ここで、文字列情報判定部103における分散の算出および該分散による抽出不適箇所の判定処理(ステップS505,S506)について、具体例を示して説明する。
例えば文字列情報取得部102において図4に示すように、走査A(開始位置X1)における文字列情報LIとして、文字列の高さLTおよび行間隔LSが以下のように得られたとする。なお、LT,LSの単位はピクセルである。
LT(1)=84,LT(2)=75,LT(3)=85,LT(4)=86,LT(5)=86,LT(6)=85
LS(1)=2,LS(2)=3,LS(3)=70,LS(4)=71,LS(5)=81
この場合、式(1)から、文字列の高さLTの分散は14.9、行間隔LSの分散は1241.8として算出される。ここで閾値T=30とすると、LTの分散はTよりも小さいが行間隔LSの分散がTより大きいため、走査Aは抽出不適箇所を走査したものと判断する。そして、該判定結果を文字列情報取得部102へ送信する。図4によれば、走査Aには追記の箇所が含まれていることが分かる。
すると文字列情報取得部102は、文字列情報判定部103からの判定結果を受信すると、新たに走査開始位置を決定し、該開始位置から文字列情報LIを取得して文字列情報判定部103へ供給する。
次に、図4における走査B(開始位置X2)の文字列情報LIとして、文字列の高さLTおよび行間隔LSが以下のように得られたとする。
LT(1)=84,LT(2)=30,LT(3)=85,LT(4)=86,LT(5)=85,
LS(1)=40,LS(2)=10,LS(3)=227,LS(4)=81
すると式(1)から、文字列の高さLTの分散は484.4、行間隔LSの分散は6937.3として算出される。すると閾値T=30であるから、LT,LSはいずれもTより大きいため、走査Aの場合と同様に、走査Bは抽出不適箇所を走査したものと判断され、該判定結果が文字列情報取得部102へ送信される。図4によれば、走査Bには文字数が少ない箇所が含まれていることが分かる。
そして同様に、図4における走査C(開始位置X3)の文字列情報LIとして、文字列の高さLTおよび行間隔LSが以下のように得られたとする。
LT(1)=84,LT(2)=85,LT(3)=86,LT(4)=86,LT(5)=85,
LS(1)=80,LS(2)=70,LS(3)=71,LS(4)=81
すると式(1)から、文字列の高さLTの分散は0.6、行間隔LSの分散は25.3として算出される。すると閾値T=30であるから、LT,LSはいずれもTより小さいため、走査Cは抽出不適箇所を含まない、すなわち抽出対象箇所であると判断され、文字列情報LIが透かし情報抽出部104へ供給される。
以上のように、ステップS506でばらつきが大きい、すなわち抽出不適箇所である場合はステップS503に戻って新たな開始位置による走査を行うが、ばらつきが小さい、すなわち抽出対象箇所である場合にはステップS507に進む。
ステップS507では透かし情報抽出部104が、文字列情報判定部103より供給された文字列情報LIの行間隔LSを用いて、埋め込まれている行間透かし情報を抽出する。
なお、ステップS507における行間透かし情報の抽出は、埋め込み時に使用した規則を用いて行う。例えば上述したように、行間隔をLS(i),LS(i+1) (但し、i=1,3,5,・・・,N-1)とし、2値情報の「0」がLS(i)>LS(i+1)、「1」がLS(i)<LS(i+1)となるように、行間隔を制御して埋め込むとする。このとき、行間隔LS(i),LS(i+1)がそれぞれ以下のような値であったとする。
LS(1)=80,LS(2)=70,LS(3)=71,LS(4)=81
この場合、抽出される行間透かし情報は以下のようになる。
LS(1)>LS(2)なので「0」,LS(3)<LS(4)なので「1」
以上説明したように本実施形態によれば、文書画像内の文字矩形列における文字高さLTおよび行間隔LSのばらつき(分散)に基づいて、行間透かしを抽出するのに適切な走査位置を判定するため、行間透かしの誤抽出が回避され、高精度な抽出が可能となる。
なお本実施形態においては、1つの走査線上の文字列情報LIに対してばらつきを算出し、行間透かし情報の誤抽出を引き起こす要因を持つ抽出不適箇所であるか否かの判定を行う例を示したが、本発明の判定方法はこれに限定されない。例えば、複数の走査線上の文字列情報LIを同時に取得して、該複数の走査線に対する判定処理を同時に行っても良い。また、1つの走査線上の文字列情報LIを、透かし情報抽出に最低限必要な範囲ごとに分割し、範囲ごとの判定を行っても良い。
また本実施形態では図4に示すように、文書画像における文字矩形列を黒画素、行間隔を白画素として説明したが、本発明はこれに限定されない。例えば、文書画像がネガポジ反転した場合や、黒・白画素以外の有色画素で構成されている場合においても、本発明は適用可能である。
また本実施形態では、図2に示すような、2つの行間隔の大小関係によって透かし情報が埋め込まれた文書画像を処理対象として説明した。しかしながら本発明において処理対象となりうる文書画像における行間透かしは、他の方法によって埋め込まれていても良い。例えば、最初の行間隔を基準行間隔として、この基準行間隔との他の行間隔との差分によって順次情報を埋め込む等、行間隔を操作して透かし情報を埋め込む方法であれば本発明は適用可能である。
また本実施形態では、説明を簡単化するために図3に示すような文字のみで構成された文書画像を処理対象として説明したが、本発明は、例えば図や表、グラフ等が含まれた文書画像に対しても有効である。
<第2実施形態>
以下、本発明に係る第2実施形態について説明する。
上述した第1実施形態では、文書の副走査方向に1箇所を走査した文字列情報に対して分散を算出し、該走査箇所が抽出不適箇所であるか否かを判定する例を示した。しかしながらこのような判定を行うと、走査内に1箇所でも抽出不適箇所があった場合には、透かし情報が抽出できないことになってしまう。そこで第2実施形態では、文書の副走査方向に複数箇所を走査するものとし、さらに各走査を所定単位に分割して、該分割された走査範囲(以下、抽出単位幅)ごとに文字列情報を取得する。すなわち、分散を算出する範囲を小さくして、抽出不適箇所を含まない抽出対象箇所を特定し、該抽出対象箇所の文字列情報同士を結合していくことによって、行間透かし情報を正確に抽出する。
なお、第2実施形態における文書処理装置の構成は、上述した第1実施形態で示した図1と同様であるが、文字列情報取得部102と文字列情報判定部103の動作が異なる。したがって、以下では第2実施形態の文字列情報取得部102と文字列情報判定部103における特徴的な動作のみを説明し、その他の構成における処理については説明を省略する。
以下、第2実施形態においては、1つの走査から、文字列の高さLTを3つと、行間隔LSの2つからなる範囲を、上記抽出単位幅として抽出するものとする。また、少なくとも2箇所の走査を行うものとし、各走査においてそれぞれ、上記抽出単位幅を取得する。
なお、第2実施形態において抽出単位幅を構成する文字列情報の数は、該抽出単位幅のサイズに依存する。例えば、透かし情報が図2に示すように2組の行間隔の大小関係によって埋め込まれている場合、抽出単位幅は上述したように、文字列の高さLTが3つと行間隔LSが2つとなる。しかしながら本発明はこの例に限定されず、例えば抽出単位幅の倍数からなる範囲を単位として、抽出不適箇所の検出処理を行うことも可能である。
ここで図6に、第2実施形態における文字列情報取得の概念を示す。図6は、上述した第1実施形態における図4と同様に、ある文書画像における文字列矩形の例を示し、文字列矩形を黒画素で、行間隔を白画素で表現した例を示しており、該文字矩形画像に対して開始位置X1,X3による2つの走査を行うとする。すなわち、開始位置X1には走査Aと走査Cが対応し、開始位置X3には走査Bと走査Dが対応する。これら各走査A,B,C,Dは第2実施形態における抽出単位幅に相当し、その副走査方向の長さが異なるものの、それぞれは3つのLTと2つのLSによって構成されている。
図6に示す例によれば文字列情報取得部102においてまず第1の抽出単位幅として、走査Aと走査Bによって、文字列情報LIとして、文字列の高さLTおよび行間隔LSが以下のように得られる。なお、LT,LSの単位はピクセルである。
走査A:LT(1)=84,LT(2)=85,LT(3)=86
LS(1)=80,LS(2)=70,
走査B:LT(1)=84,LT(2)=50,LT(3)=85
LS(1)=17,LS(2)=13
すると文字列情報判定部103では第1実施形態と同様に、各走査に対して式(1)より分散を算出して、抽出不適箇所であるか否かの判定を行う。この場合、走査Aに対するLT,LSの分散はそれぞれ0.7,25.0、走査Bに対するLT,LSの分散はそれぞれ264.7,4.0として算出される。ここで閾値T=30とすると、走査Aは抽出不適箇所を含まない走査であり、また走査Bは抽出不適箇所(図中網掛け領域)を含む走査であると判断される。すると文字列情報判定部103は、該判定結果と、走査AにおけるLTとLSの値の総計SUMを、文字列情報取得部102へ送信する。なお、SUMは次の抽出単位幅の捜査開始位置設定に利用される値であるため、現在の抽出単位幅における最終のLT(走査AであればLT(3))については総計対象から除外する。すなわち図6によれば、走査AにおけるSUMは、LT(1)=84,LT(2)=85,LS(1)=80,LS(2)=70の合計値として求められ、SUM=319となる。
次に文字列情報取得部102は、文字列情報判定部103から判定結果とSUMを受信すると、第2の抽出単位幅として次の走査開始位置を設定する。図6の例では、主走査方向がX1とX3で、かつ副走査方向がSUM(319)以降の位置、すなわち走査C,Dの開始位置に設定する。そして、走査C,Dによって文字列情報LIを取得し、これを文字列情報判定部103へ供給する。なお、主走査方向における開始位置としては前回の走査と同様のX1,X3に限らず、例えば図6に示すX2,X4のように、開始位置を変更しても良い。
文字列情報判定部103は走査C,Dについても走査A,Bと同様に、取得した文字列情報LIに基づき、各走査が抽出不適箇所を含んでいるか否かを判定する。
図6に示す例によれば、主走査開始位置がX1,X3、総計SUM=319であるから、各走査による文字列情報LIとして、LTおよびLSが以下のように得られる。
走査C:LT(1)=86,LT(2)=50,LT(3)=86
LS(1)=15,LS(2)=5
走査D:LT(1)=86,LT(2)=86,LT(3)=85
LS(1)=70,LS(2)=80
この場合、式(1)より、走査Cに対するLT,LSの分散はそれぞれ288.0,25、走査Dに対するLT,LSの分散はそれぞれ0.2,25として算出される。すると閾値T=30であるから、走査Cは抽出不適箇所(図中網掛け領域)を含む走査であり、走査Dは抽出不適箇所を含まない走査であると判断される。
図6に示す例では、以上の第1の抽出単位幅に対応する走査A,B、および第2の抽出単位幅に対応する走査C,Dによって、全ての走査が終了したものとする。すると文字列情報判定部103は次に、分散が閾値よりも小さい走査、つまり抽出対象箇所の走査によって得られた文字列情報を結合する。この場合、走査Aと走査Dが該当するため、これらの文字列情報LIの結合結果は以下のようになる。
LT(1)=84,LT(2)=85,LT(3)=86,LT(4)=86,LT(5)=85
LS(1)=80,LS(2)=70,LS(3)=70,LS(4)=80
以上のように結合された文字列情報LIは、透かし情報抽出部104へ供給され、以降は上述した第1実施形態と同様に、行間透かし情報が抽出される。
なお第2実施形態では、ある抽出単位幅において分散が閾値よりも小さくなるような走査が無かった場合、すなわち全ての走査が抽出不適箇所を含んでいると判定された場合には、該抽出単位幅において走査開始位置の変更や走査箇所を増やす等の対策を行う。それでも当該抽出単位幅において抽出対象箇所が検出されない場合には、その抽出単位幅からの透かし情報抽出は不可能であると判断する。その場合、予め定められた値をSUMに設定して、該SUM以降の新たな抽出単位幅について、抽出不適箇所の有無を検証していく。
一方、ある抽出単位幅において分散が閾値よりも小さくなるような走査が複数あった場合には、その何れか1つを選択すれば良い。例えば、分散値が最も小さい走査を選択する等が考えられる。
以上説明した様に第2実施形態によれば、文書において分散を算出する範囲を、抽出単位幅として分割して設定する。これにより、抽出単位幅ごとに抽出対象箇所を特定してこれらを結合することができるため、行間透かし情報を第1実施形態よりもさらに正確に抽出することが可能となる。
<第3実施形態>
以下、本発明に係る第3実施形態について説明する。
上述した第1および第2実施形態では、矩形画像IRを作成する際に、画像データIを上端部より順次走査していき、黒画素と白画素の境界部分を特定することによって文字列矩形を生成していた。しかしながらこの方法では画像データIに対して全走査を行う必要があるため、処理時間がかかってしまう。例えば、画像データIに埋め込まれている情報が複写制御情報である場合、複写機内で全走査を行って該情報を抽出し、該抽出した情報から複写可能か否かの判断を行い、その後、複写処理を行うため、一枚の文書の複写処理にかなりの時間を要してしまう。
そこで第3実施形態においては、矩形画像IRの作成時間を短縮するために、画像データIを主走査方向に縮小することによって、1行を1オブジェクトとした矩形画像IRを生成することを特徴とする。
なお、第3実施形態における文書処理装置の構成は、上述した第1実施形態で示した図1と同様であるが、文字列情報取得部102の動作が異なる。したがって、以下では第3実施形態の文字列情報取得部102における特徴的な動作のみを説明し、その他の構成における処理については説明を省略する。
文字列情報取得部102は、画像入力部101より供給された画像データIを水平方向と垂直方向へ縮小し、水平方向の縮小データである縮小画像データIshと、垂直方向の縮小データである縮小画像データIsvを生成する。ここで図7に、図3に示した画像データIを水平または垂直方向へ縮小した画像縮小データIsh,Isvの例を示す。
なお、画像データIの縮小を水平・垂直方向ともに行う理由としては、例えば90度傾きのある画像等、画像データIの入力方向が不定であるため、すなわち主走査方向が不定であって行間隔がどの方向に存在するかが分からないためである。もちろん、画像データIの入力方向が特定できるのであれば、水平方向または垂直方向のいずれか1方向のみの縮小を行うようにしても良い。
図7に示す例では、水平方向へ縮小されたIshが有効である。すなわち第3実施形態では画像データIを縮小することにより、図7に示すIshのように、1行が縮小されて1つのオブジェクトとして得られ、すなわち行単位に1つの文字列矩形として認識できるため、行間透かしの抽出を高速に行うことが可能となる。なお、第3実施形態における画像データIの縮小は、文字列矩形が認識できる程度に行うものとする。
なお、図7に示すIshとIsvのいずれの縮小画像データを有効とすべきか、すなわちどちらの縮小画像データに対して透かし情報の抽出を行うかは、例えば両方に対して一旦テスト走査を行って、行間隔値等が得られる方を選択することができる。
ここで、縮小方法として例えば、画像データIのある点の画素値を、周囲の4つの格子点の画素値から算出して縮小するバイリニア法を適用した場合、その縮小画像には図8に示すように、白画素でも黒画素でもない中間調部分(図中グレーで表現)が生じる。このような場合、当該部分を黒画素に変換する。なお、第3実施形態における縮小方法はバイリニア法に限らず、ニアレストレイバー、バイキュービック等、種々の縮小方法が適用可能である。
第3実施形態では、以上のように生成された画像縮小データIshまたはIsvから、文字列情報LIを取得する。なお、文字列情報LIの取得方法については上述した第1および第2実施形態と同様であるため、説明を省略する。
なお、画像データIの縮小により生成された矩形画像IR(この場合Ish)においては、図9に示すように、行間隔が微小に異なっている箇所が存在する。そのため、より抽出精度を向上させるためには、文字列情報の取得を複数走査によって行えば良い。そして、複数の走査において適切な文字列情報が取得できた場合には、走査ごとに行間透かし情報を抽出して多数決を行って、最も多く抽出された行間透かし情報を検出するようにしても良い。
以上説明した様に第3実施形態によれば、画像データIを縮小して矩形画像IRを生成することによって、行間透かし情報の抽出にかかる時間を短縮することができる。
<第4実施形態>
以下、本発明に係る第4実施形態について説明する。第4実施形態においては、上述した第1乃至第3実施形態に係る処理を、コンピュータシステムにおいて行なうことを特徴とする。
図10は、第4実施形態におけるコンピュータシステムの基本構成を示すブロック図である。このコンピュータシステムにおいて、上述した各実施形態における全ての機能を実行させるには、各機能構成をプログラムにより表現し、このコンピュータシステムに読み込ませることになる。
図10において、1001はCPUであり、RAM1002やROM1003に格納されているプログラムやデータを用いて、システム全体の制御を行うと共に、上述した各実施形態で説明した各処理を行なう。1002はRAMであり、外部記憶装置1008からロードされたプログラムやデータ、他のコンピュータシステム1014からI/F(インターフェース)1015を介してダウンロードしたプログラムやデータを一時的に記憶するエリアを備える。RAM1002はまた、CPU1001が各種の処理を行なうために必要とする作業用エリアを備える。1003はROMであり、コンピュータシステムにおける機能プログラムや設定データ等を記憶する。
1004はディスプレイ制御装置であり、画像や文字等をディスプレイ1005に表示させるための制御を行なう。1005はディスプレイであり、画像や文字などを表示する。なお、ディスプレイ1005としてはCRTや液晶画面などが適用可能である。1006は操作入力デバイスであり、キーボードやマウス等、CPU1001に各種のユーザ指示を入力可能なデバイスにより構成される。1007は、操作入力デバイス1006を介して入力された各種の指示等を、CPU1001に通知するためのI/Oである。1008は、ハードディスク等の大容量情報記憶装置として機能する外部記憶装置であり、OS(オペレーティングシステム)や上記各実施形態に係る処理をCPU1001に実行させるためのプログラム、入出力原稿画像、等を記憶する。外部記憶装置1008への情報の書き込みや、外部記憶装置1008からの情報の読み出しは、I/O1009を介して行われる。
1010は文書や画像を印刷出力するためのプリンタであり、出力データはI/O1011を介してRAM1002、もしくは外部記憶装置1008から送られる。なお、プリンタ1010としては、例えばインクジェットプリンタ、レーザビームプリンタ、熱転写型プリンタ、ドットインパクトプリンタなどが挙げられる。1012は文書や画像を読み取るためのスキャナであり、入力データはI/O1013を介してRAM1002、もしくは外部記憶装置1008に送られる。そして1016は、CPU1001、ROM1003、RAM1002、I/O1011、I/O1009、ディスプレイ制御装置1004、I/F1015、I/O1007、I/O1013を繋ぐバスである。
以上説明したように第4実施形態によれば、上述した第1乃至第3実施形態で示した行間透かし情報の検出処理を、コンピュータシステムにおいて実現することが可能となる。 なお第4実施形態では、上記第1乃至第3実施形態の機能を実現するためのプログラムを用意し、これをCPU1001の制御の下に実行する例を示したが、その一部を専用のハードウェア回路等によって実現するようにしても良い。この専用ハードウェア回路としては、スキャナ1012やプリンタ1010等の外部装置内に備えられたものを適用することも可能である。
なお、上記各実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
<他の実施形態>
本発明は例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、スキャナ、webアプリケーション等)から構成されるシステムに適用しても良いし、また、1つの機器からなる装置に適用しても良い。
本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される。なお、この場合のプログラムとは、実施形態において図に示したフローチャートに対応したコンピュータ可読のプログラムである。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、以下に示す媒体がある。例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD-ROM、CD-R、CD-RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD-ROM,DVD-R)などである。
プログラムの供給方法としては、以下に示す方法も可能である。すなわち、クライアントコンピュータのブラウザからインターネットのホームページに接続し、そこから本発明のコンピュータプログラムそのもの(又は圧縮され自動インストール機能を含むファイル)をハードディスク等の記録媒体にダウンロードする。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD-ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせることも可能である。すなわち該ユーザは、その鍵情報を使用することによって暗号化されたプログラムを実行し、コンピュータにインストールさせることができる。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。さらに、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、実行されることによっても、前述した実施形態の機能が実現される。すなわち、該プログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行うことが可能である。
本発明に係る第1実施形態における文書処理装置の主要な機能構成を示すブロック図である。 行間透かし情報が埋め込まれた文書原稿例を示す図である。 本実施形態における処理対象となる文書の画像データIを例示する図である。 画像データIに対する矩形画像IRを例示する図である。 本実施形態における本実施形態における行間透かし情報の抽出処理を示すフローチャートである。 第2実施形態における文字列情報取得の概念を示す図である。 第3実施形態において画像データを水平および垂直方向に縮小した縮小画像データ例を示す図である。 第3実施形態において中間調として算出された画素を黒画素へ変換する例を示す図である。 第3実施形態における縮小画像データの走査概念を示す図である。 第4実施形態におけるコンピュータシステムの基本構成を示すブロック図である。

Claims (15)

  1. 文書画像から、行間隔を利用して埋め込まれた行間透かし情報を抽出する文書処理装置であって、
    文書画像を入力する入力手段と、
    前記文書画像における文字列情報として、文字列の高さと行間隔値を取得する文字列情報取得手段と、
    前記文字列の高さと前記行間隔値のばらつきをそれぞれ算出するばらつき算出手段と、
    前記ばらつき算出手段で算出されたばらつきの値に応じて、前記文字列情報が行間透かし情報を抽出するのに適切であるか否かを判定する文字列情報判定手段と、
    前記文字列情報判定手段で前記文字列情報が適切であると判定された場合に、該文字列情報から行間透かし情報を抽出する透かし情報抽出手段と、
    を有することを特徴とする文書処理装置。
  2. 前記文字列情報判定手段は、前記ばらつき算出手段で算出した文字列の高さのばらつき及び行間隔値のばらつきの値を、予め設定された閾値と比較することによって、当該文字列情報が適切であるか否かを判定することを特徴とする請求項1に記載の文書処理装置。
  3. 前記文字列情報取得手段は、前記文字列情報判定手段において前記文字列情報が適切でないと判定された場合に、前記文書画像における次の文字列情報取得箇所の開始位置を設定することを特徴とする請求項1または2に記載の文書処理装置。
  4. 前記文字列情報取得手段は、前記文書画像の複数箇所から前記文字列情報を取得し、
    前記文字列情報判定手段は、前記ばらつき算出手段で算出された前記複数の文字列情報におけるばらつきの値に応じて、該複数の文字列情報から行間透かし情報を抽出するのに適切な文字列情報を選択する
    ことを特徴とする請求項1乃至3のいずれか1項に記載の文書処理装置。
  5. 前記文字列情報取得手段は、前記文書画像の副走査方向に対する複数の走査によって、複数箇所の前記文字列情報を取得することを特徴とする請求項4に記載の文書処理装置。
  6. 前記文字列情報取得手段は、前記文書画像の副走査方向に対する走査を、予め定められた抽出単位幅に分割し、該抽出単位幅ごとに前記文字列情報を取得することを特徴とする請求項4に記載の文書処理装置。
  7. 前記文字列情報判定手段は、前記文字列情報取得手段で取得された前記抽出単位幅ごとの前記文字列情報が適切であるか否かを判定して、適切であると判定された前記抽出単位幅の文字列情報同士を結合し、
    前記透かし情報抽出手段は、前記文字列情報判定手段で結合された文字列情報から行間透かし情報を抽出する
    ことを特徴とする請求項6に記載の文書処理装置。
  8. 前記文字列情報取得手段は、予め定められた数の文字列の高さと行間隔値からなる範囲を前記抽出単位幅として、前記文字列情報を取得することを特徴とする請求項6または7に記載の文書処理装置。
  9. 前記文字列情報取得手段は、前記文書画像を主走査方向へ縮小した画像から、前記文字列情報を取得することを特徴とする請求項1乃至8のいずれか1項に記載の文書処理装置。
  10. 前記文字列情報取得手段は、前記文書画像に対する文字列矩形画像を作成し、該文字列矩形画像に基づいて、文字列の高さおよび行間隔値を前記文字列情報として取得することを特徴とする請求項1乃至9のいずれか1項に記載の文書処理装置。
  11. 前記ばらつき算出手段は、ばらつきとして分散を算出することを特徴とする請求項1乃至10のいずれか1項に記載の文書処理装置。
  12. 前記ばらつき算出手段は、ばらつきとして偏差もしくは標準偏差を算出することを特徴とする請求項1乃至10のいずれか1項に記載の文書処理装置。
  13. 文書画像から、行間隔を利用して埋め込まれた行間透かし情報を抽出する文書処理方法であって、
    文書画像を入力する入力ステップと、
    前記文書画像における文字列情報として、文字列の高さと行間隔値を取得する文字列情報取得ステップと、
    前記文字列の高さと前記行間隔値のばらつきをそれぞれ算出するばらつき算出ステップと、
    前記ばらつき算出ステップにおいて算出されたばらつきの値に応じて、前記文字列情報が行間透かし情報を抽出するのに適切であるか否かを判定する文字列情報判定ステップと、
    前記文字列情報判定ステップにおいて前記文字列情報が適切であると判定された場合に、該文字列情報から行間透かし情報を抽出する透かし情報抽出ステップと、
    を有することを特徴とする文書処理方法。
  14. コンピュータを請求項1乃至12のいずれか1項に記載の文書処理装置における各手段として機能させるためのプログラム。
  15. 請求項14に記載のプログラムを記憶したコンピュータ可読な記憶媒体。
JP2008274868A 2008-10-24 2008-10-24 文書処理装置および文書処理方法 Withdrawn JP2010103862A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008274868A JP2010103862A (ja) 2008-10-24 2008-10-24 文書処理装置および文書処理方法
US12/604,483 US20100104131A1 (en) 2008-10-24 2009-10-23 Document processing apparatus and document processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008274868A JP2010103862A (ja) 2008-10-24 2008-10-24 文書処理装置および文書処理方法

Publications (1)

Publication Number Publication Date
JP2010103862A true JP2010103862A (ja) 2010-05-06

Family

ID=42117532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008274868A Withdrawn JP2010103862A (ja) 2008-10-24 2008-10-24 文書処理装置および文書処理方法

Country Status (2)

Country Link
US (1) US20100104131A1 (ja)
JP (1) JP2010103862A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7292984B2 (ja) * 2019-06-13 2023-06-19 キヤノン株式会社 行分割装置および方法、ならびにプログラム
EP3901926A1 (en) * 2020-04-21 2021-10-27 Deutsche Post AG Validation method and apparatus for identification documents

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2713911B2 (ja) * 1987-07-08 1998-02-16 株式会社東芝 郵便物処理装置
US7039215B2 (en) * 2001-07-18 2006-05-02 Oki Electric Industry Co., Ltd. Watermark information embedment device and watermark information detection device
US20040001606A1 (en) * 2002-06-28 2004-01-01 Levy Kenneth L. Watermark fonts
EP1398732A3 (en) * 2002-09-04 2006-09-27 Matsushita Electric Industrial Co., Ltd. Digital watermark-embedding and detecting
US8014557B2 (en) * 2003-06-23 2011-09-06 Digimarc Corporation Watermarking electronic text documents
JP4956363B2 (ja) * 2007-10-10 2012-06-20 キヤノン株式会社 情報処理装置及びその制御方法
JP2010124450A (ja) * 2008-10-24 2010-06-03 Canon Inc 文書処理装置および文書処理方法

Also Published As

Publication number Publication date
US20100104131A1 (en) 2010-04-29

Similar Documents

Publication Publication Date Title
JP5132438B2 (ja) 画像処理装置および画像処理方法
JP4310288B2 (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
JP5015540B2 (ja) 電子透かし埋め込み装置および検出装置
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
US8588460B2 (en) Electronic watermark embedding device, electronic watermark detecting device, and programs therefor
US8416464B2 (en) Document processing apparatus and document processing method
US8064636B2 (en) Image processing apparatus and method of controlling the same
JP4673200B2 (ja) 印刷処理システムおよび印刷処理方法
US8059859B2 (en) Image processing apparatus and method of controlling the same
JP2002199206A (ja) メッセージ埋込並びに抽出方法、装置および媒体
US8401971B2 (en) Document processing apparatus and document processing method
JP2010103862A (ja) 文書処理装置および文書処理方法
JP2009060230A (ja) 画像形成装置及び画像形成装置の制御方法並びにそのプログラム及び記憶媒体
US8126193B2 (en) Image forming apparatus and method of image forming
US8125691B2 (en) Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information
JP2008034973A (ja) 画像読取装置、画像読取装置の制御方法およびプログラム
JP4861251B2 (ja) 画像処理装置およびその制御方法
JP4789867B2 (ja) 画像処理装置およびその制御方法
JP5233839B2 (ja) 情報抽出装置、情報抽出方法、情報抽出プログラム、及び記憶媒体
JP5173690B2 (ja) 情報処理装置及び情報処理方法、並びに、コンピュータプログラム及びコンピュータ可読記録媒体
JP2008301284A (ja) 画像処理装置およびその制御方法
JP2009010937A (ja) 画像処理装置およびその制御方法
JP2008301283A (ja) 画像処理装置およびその制御方法
JP4861250B2 (ja) 画像処理装置およびその制御方法
JP2005157526A (ja) データ入力方法,データ入力システム,および帳票

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120110