JP2014500688A - 西洋語の透かし処理をするための透かし画像の分割方法と装置 - Google Patents

西洋語の透かし処理をするための透かし画像の分割方法と装置 Download PDF

Info

Publication number
JP2014500688A
JP2014500688A JP2013545033A JP2013545033A JP2014500688A JP 2014500688 A JP2014500688 A JP 2014500688A JP 2013545033 A JP2013545033 A JP 2013545033A JP 2013545033 A JP2013545033 A JP 2013545033A JP 2014500688 A JP2014500688 A JP 2014500688A
Authority
JP
Japan
Prior art keywords
character
image block
text
western
watermark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013545033A
Other languages
English (en)
Other versions
JP2014500688A5 (ja
JP5669957B2 (ja
Inventor
王高▲陽▼
▲其▼文法
王立▲東▼
▲楊▼斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Peking University Founder Research and Development Center
Original Assignee
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Peking University Founder Research and Development Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd, Peking University Founder Research and Development Center filed Critical Peking University
Publication of JP2014500688A publication Critical patent/JP2014500688A/ja
Publication of JP2014500688A5 publication Critical patent/JP2014500688A5/ja
Application granted granted Critical
Publication of JP5669957B2 publication Critical patent/JP5669957B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0051Embedding of the watermark in the spatial domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0062Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0083Image watermarking whereby only watermarked image required at decoder, e.g. source-based, blind, oblivious
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

本発明は西洋語の透かし処理をするための透かし画像の分割方法を提供し、この方法は、西洋語画像を行列分割によって複数の文字画像ブロックを取得するステップと、文字画像ブロックから有効な文字画像ブロックを識別するステップと、西洋語画像がラージフォントテキストに対応するか、スモールフォントテキストに対応するかを判断するように、有効な文字画像ブロックのサイズを統計するステップと、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うステップと、単語グループを、透かし画像ブロックに対応する複数の部分に均等に分割するステップとを備える。また、本発明は西洋語の透かし処理をするための透かし画像の分割装置を提供する。本発明は透かしの埋め込み処理の操作性を確保することができる。

Description

発明の詳細な説明
[技術分野]
本発明は、デジタル組版分野に関し、具体的に、西洋語の透かし処理をするための透かし画像の分割方法と装置に関する。
[背景技術]
電子商取引(e-commerce)と電子政府(e-government)が発展するにつれて、企業単位、事業単位、政党・政府機関及び国家安全などの関係部門は契約、秘密などの重要な書類が含まれる大量の文書資料を処理すべきである。これらのテキスト書類の版権保護と書類内容の安全が重要な問題であり、デジタル透かし技術は上記の問題を解決する手段を提供する。
デジタル透かしでは、特定の情報をオーディオ、画像、または映像などのデジタル信号に埋め込む。デジタル透かしを有する信号をコピーすると、埋め込まれた情報も同時にコピーされる。デジタル透かしは、見える透かしと隠す透かしとに分類され、見える透かしは可視の透かし(visible watermarking)であり、それに含まれる情報が画像または映像を見るのと同時に見られる。通常、見える透かしに版権所有者の名前またはシンボルが含まれる。テレビ局はテレビ画面の隅で配置するシンボルも見える透かしの一種である。
隠す透かしがデジタルデータの形でオーディオ、画像、または映像に埋め込まれるが、一般的な状況では見えない。隠す透かしの一つの重要な応用が版権保護であり、これによって、権限のないまま無断でデジタル媒質を複製やコピーすることを避けたり、防止したりする。ステガノグラフィー(Steganography)もデジタル透かしの一つの応用であり、デジタル信号に隠される情報によって互いに交流できる。デジタル写真に含まれる注釈データは写真を取る時間、使用されるレンズの絞りとカメラのシャッター、更にカメラのブランドなどの情報を記録でき、これもデジタル透かしの一つの応用である。ある書類フォーマットにこれらの「metadata(メタデータ)」と呼ばれる付加情報が含まれる。
なお、たくさんのテキスト書類はデジタル形で存在するだけではなく、また印刷、コピーすることによって紙の形で伝播し、その中に、西洋語のテキストがかなりある。国際化がますます進んでいるのに伴い、西洋語のテキストを通じて交流することも頻繁になるので、これらのテキストに対する安全保護が強く要求される。デジタル化技術が非常に速く発展するにつれて、印刷、コピーすることによって紙の形を通じて交流することが既にかなり普及されており、たくさんの重要な情報または機密情報が紙書類の形で漏洩される。そのため、紙書類に基づいて、印刷とコピーを防止できる2値テキストの透かし技術を研究することが特に重要である。
1.出願番号が200710121642.7である特許文献は2値画像におけるデジタル透かしを埋め込む方法を開示し、この方法は、2値画像の一部または全部を少なくとも二つの透かし画像ブロックを分割するステップと、それぞれの透かし画像ブロックにおける黒い画素点の数に基づいてグループに分けて、複数のグループを取得するステップと、それぞれの前記グループにおけるデータに対してアダマール(hadamard)変換を行うステップとを備える。量子化方法を使用し、埋め込み待ちの透かし信号を埋め込み、逆アダマール変換を行ってそれぞれの透かし画像ブロックにおける変更すべき画素点の数を取得することによって、透かしを埋め込んだり、抽出したりする目的を達する。
2.出願番号が200810055770.0である特許文献は2値テキスト画像におけるデジタル透かしを埋め込む方法と装置を開示し、この方法は、2値画像の一部または全部を埋め込む部分と調整部分とを分割するステップと、前記埋め込む部分と調整部分におけるそれぞれの集合に含まれる黒い画素点の数の平均値を計算するステップと、前記平均値と埋め込む部分におけるそれぞれの集合に含まれる黒い画素点の数に基づいて色変更パラメータを計算するステップと、前記色変更パラメータに基づいて埋め込む部分と調整部分におけるそれぞれの集合に含まれる黒い画素点の数を変更し、透かしの埋め込みを実現するステップとを備える。
3.出願番号が200610114048.0である特許文献はモノクロ2値テキスト画像におけるデジタル透かしの埋め込みと抽出を行う方法と装置を開示し、この埋め込み方法は、テキスト画像における有効文字エリアの位置を測定するステップと、有効文字エリアをグループに分け、それぞれの文字エリアにおける黒点の数を統計するステップと、グループ内の文字エリアにおける黒点の数の間の関係、透かしのビット・ストリング(bit string)及び第一ステップ長さに基づいて、それぞれの文字エリアにおける変転すべき画素の第一数を算出するステップと、第一数に従ってそれぞれの文字エリアにおける画素を変転するステップとを備える。また、この抽出する方法は、テキスト画像における有効文字エリアの位置を測定するステップと、有効文字エリアをグループに分け、それぞれの文字エリアにおける黒点の数を統計するステップと、それぞれのグループ内の文字エリアにおける黒点の数の間の相対関係及び第一ステップ長さに基づいて、埋め込まれた透かし情報のビット・ストリングを抽出するステップとを備える。
上記の2値テキスト透かしの技術において、透かし画像ブロックは透かしを埋め込むエリアとして特に重要である。上記の特許出願1において、透かし画像ブロックを直接的に透かしを埋め込むエリアとする。特許出願2において、2値テキスト画像部分を透かし画像ブロックである埋め込む部分に分割する。特許出願3において、テキスト画像において、グループ分けされた有効文字エリアが透かし画像ブロックとする。上記の特許出願がいずれも透かし画像ブロックにおける黒い画素点の数を変更することによって透かしを埋め込み、透かし画像ブロックにおける黒い画素点の数を量子化することによって透かしを抽出する。
そのため、上記の方法はいずれも二つの前提に基づく。即ち、
1.文字を分割する結果が正しくなければならない。現在の文字分割アルゴリズムは大体光学式文字識別OCR(Optical Character Recognition)システムの文字識別結果に依存するが、OCR識別の速度と効率を考慮し、それに、接触している西洋語に対して、OCR識別も一定のエラー率があるため、通常はデジタル透かしシステムにおいてOCRメカニズムを使用しない。
2.透かし画像ブロックの黒い画像点の数の変化範囲が大きくない。例えば、中国語のテキストにおいて、一つの漢字を一つの透かし画像ブロックとする。中国語が角張った文字であり、各文字の面積差が少ないため、透かし画像ブロックにおける黒い画素点の数の差も少なく、透かしの埋め込みと抽出の正確さを確保することができる。
しかしながら、以下の問題によって、上記の方法は西洋語にあまり適応しない。即ち、
(a)西洋語は印刷される前後に接触現象がよく発生し、例えば、「mn」、「tt」などが挙げられ、印刷・スキャンされる前後に文字分割の一致性を確保できない。シングルの西洋語を透かし画像ブロックとすれば、文字の接触は必ず透かしが埋め込まれると抽出される前後の文字画像ブロックを分割する系列の再同期性に影響し、透かしを埋め込むと抽出する成功率に影響する。
(b)それぞれの西洋語単語の長さの差が大きく、単語に含まれる文字画像ブロックの黒い点数の変化範囲も大きい。例えば、「My extraordinary power」が挙げられ、それぞれの単語の長さの差が数倍になる。シングルの西洋語単語を透かし画像ブロックとすれば、透かし画像ブロックにおける黒い画素点の数が不安定であり、透かし操作を完成できない。
(c)西洋語テキストのフォントサイズが変化することによって文字サイズが変化する。例えば、「Here」と「Here」に含まれる黒い画素点の数の差がかなり大きい。異なるフォントサイズのテキストによって、異なる量子化方法を使用すべきである。
そのため、西洋テキストに対して、透かし画像ブロックを得るために、以下の条件を満足すべきであり、
1.文字接触による透かし画像ブロックが非同期の影響を避けることができる。
2.透かし画像ブロックにおける黒い画素点の数の差が大きくない。
3.異なるフォントサイズのテキストに対して、サイズの大きさを順番にして透かし画像ブロックを適応的に分割できる。
[発明の概要]
本発明は従来の技術において西洋語画像に対して、透かし画像ブロックを正確に分割しにくい問題を解決するために、西洋語の透かし処理をするための透かし画像の分割方法と装置を提供することを目的とする。
本発明は、西洋語の透かし処理をするための透かし画像の分割方法であって、この方法は、西洋語画像を行列分割によって複数の文字画像ブロックを取得するステップと、文字画像ブロックから有効な文字画像ブロックを識別するステップと、西洋語画像はラージフォントサイズテキストに対応するか、スモールフォントサイズテキストに対応するかを判断するように、有効な文字画像ブロックのサイズを統計するステップと、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うステップと、単語グループを透かし画像ブロックに対応する複数の部分に均等に分割するステップとを備えることを特徴とする。
また、本発明は西洋語の透かし処理をするための透かし画像の分割装置であって、この装置は、西洋語画像を行列分割によって複数の文字画像ブロックを取得する分割モジュールと、文字画像ブロックから有効な文字画像ブロックを識別する識別モジュールと、西洋語画像はラージフォントサイズテキストに対応するか、スモールフォントサイズテキストに対応するかを判断するように、有効な文字画像ブロックのサイズを統計する統計モジュールと、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うグループ分けモジュールと、単語グループを透かし画像ブロックに対応する複数の部分に均等に分割する均等分割モジュールとを備えることを特徴とする。
本発明の上記した実施例で、西洋語の透かし処理をするための透かし画像の分割方法と装置において、文字のフォントサイズに基づいて透かし画像ブロックを合理的に設置するため、従来の技術における西洋語に対して透かし画像ブロックを正確に分割しにくい問題を解決でき、透かしの埋め込み処理する操作性を確保することができる。
以下で説明される図面は、本発明を更に理解するためのものであり、本願の一部分となる。本発明の実施例及びその説明は本発明を解釈するが、本発明に対する不当な制限を構成しない。
本発明の実施例で、西洋語の透かし処理をするための透かし画像の分割方法を示すフローチャートである。 本発明の実施例で、ラージフォントテキストか、スモールフォントテキストかを判断する方法を示すフローチャートである。 本発明の実施例で、有効な文字エリアをグループに分ける方法を示すフローチャートである。 本発明の実施例で、西洋語2値画像の行高さと中心線を示す模式図である。 本発明の実施例で、西洋語2値画像の有効な文字画像ブロックを示す模式図である。 本発明の実施例で、西洋語2値画像が分割された結果を示す模式図である。 本発明の実施例で、西洋語2値画像の単語グループ分けの結果を示す模式図である。 本発明の実施例で、単語グループにおける文字の有効長さを計算する模式図である。 本発明の実施例で、透かし画像ブロックを取得する模式図である。 本発明の実施例で、スモールフォントサイズの西洋語テキストの透かし画像ブロックの模式図である。 本発明の実施例で、スモールフォントサイズの西洋語テキストが印刷・スキャンされた後の透かし画像ブロックの模式図である。 本発明の実施例で、異常な間隔があって、一部の文字が接触する場合に、スモールフォントサイズの西洋語テキストの透かし画像ブロックの模式図である。 本発明の実施例で、ラージフォントサイズの西洋語テキストの透かし画像ブロックの模式図である。 本発明の実施例で、ラージフォントサイズの西洋語テキストが印刷・スキャンされた後の透かし画像ブロックの模式図である。 本発明の実施例で、単語分割を計算するプロセスにおける分割閾値を示す模式図である。 本発明の実施例により提供される西洋語の透かし処理をするための透かし画像の分割装置を示す模式図である。
以下、図面を参照しながら実施例で本発明を詳細に説明する。
図1で示されるように、本発明の一実施例は西洋語の透かし処理をするための透かし画像の分割方法であって、西洋語画像を行列分割によって複数の文字画像ブロックを取得するステップS10と、文字画像ブロックから有効な文字画像ブロックを識別するステップS20と、西洋語画像はラージフォントサイズテキストに対応するか、スモールフォントサイズテキストに対応するかを判断するように、有効な文字画像ブロックのサイズを統計するステップS30と、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うステップS40と、単語グループを透かし画像ブロックに対応する複数の部分に均等に分割するステップS50とを備える。
この実施例において有効な文字画像のサイズを統計することによって、西洋語の単語はフォントが異なる場合に、行列分割の特性を十分に考慮し、ラージフォントテキストとスモールフォントサイズの文字テキストが区分される。ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でテキストをグループに適応的に分けて、取得された透かし画像ブロックにおける黒い画素点の数の差が小さくなり、透かしの埋め込み処理の操作性を確保することができる。
なお、本実施例の均等に分けた単語グループが複数であり、印刷される前後に西洋語の間隔は不安定である特性を十分に考慮し、埋め込まれる前に、間隔を拡大すべき文字と間隔を縮小すべき文字を確定し修正を適当に行う。印刷される前後の西洋語の単語を分割する結果の一致性を確保でき、透かしの埋め込みと抽出を行う処理の頑健性を向上することができる。
好ましくは、ステップS10を行う前に、西洋語画像を取得し、西洋語に対してノイズ除去処理を行い、2値化の西洋語画像を取得する。このステップは西洋語画像の前処理を実施し、コンピューターで簡単に実現できる。本好ましい実施例はノイズ除去処理によって、より良い西洋語の2値テキスト画像を取得できる。
好ましくは、ステップS20においては、文字画像ブロックを句読点画像ブロックと有効な文字画像ブロックとに分ける。西洋語テキストに句読点とアルファベットとが主に含まれ、通常、句読点が小さいので、透かしに埋め込むことが不適である。本好ましい実施例は文字画像ブロックにおける句読点画像ブロックと有効な文字画像ブロックとに分けることによって、句読点を除外できる。
好ましくは、文字画像ブロックを句読点画像ブロックと有効な文字画像ブロックとに分ける際には、
条件1:w>Nt1×H
条件2:Uの下端と上端がどちらもmの同じ側に位置する
条件3:Uの下端と上端がそれぞれにmの両側に位置し、かつ、w<Nt2×H
を満足するかを判断し、条件1〜3のいずれか1条件を満足する場合に、Uに対応する文字画像ブロックが句読点画像ブロックと判断され、条件1〜3のいずれも満足しない場合に、Uに対応する文字画像ブロックが有効な文字画像ブロックと判断されており、ここで、Uが文字画像ブロックの集合Ωにおける文字画像ブロックの外接長方形の枠であり、HはUが位置する行の行高さであり、mはUが位置する中線であり、hとwはそれぞれUの高さと幅であり、Nt1とNt2はプリセット係数である。
本好ましい実施例において、具体的な数値化を判断するプロセスが提供され、コンピューターでプログラミングによって実現することが便利である。
好ましくは、Nt1=4、Nt2=0.35に設定する。本好ましい係数は発明者によって大量の実験を行った上で得られた最適な係数である。もちろん、上記した値の近くに設定してもよく、同様に本発明の主旨に属する。
好ましくは、ステップS30においては、
Figure 2014500688
を計算し、H≧Thsize(Thsizeはプリセット閾値である)の場合に、Uが位置する行はラージフォントサイズの文字行と判断され、H<Thsizeの場合に、Uが位置する行はスモールフォントサイズの文字行と判断され、西洋語画像におけるラージフォントサイズの文字行の行数Nlargeとスモールフォントサイズの文字行の行数Nsmallとを統計し、Nlarge≧Nsmallの場合に、西洋語画像はラージフォントサイズテキストに対応すると判断され、Nlarge<Nsmallの場合に、西洋語画像はスモールフォントサイズテキストに対応すると判断される。
本好ましい実施例において、具体的な数値化を判断するプロセスが提供され、コンピューターでプログラミングによって実現することが便利である。
好ましくは、Thsize=88に設定する。本好ましい閾値は発明者によって大量の実験を行った上で得られた最適な係数である。もちろん、上記した値の近くに設定してもよく、同様に本発明の主旨に属し、本発明の保護範囲内に含まれる。
図2は本発明の実施例で、ラージフォントテキストか、スモールフォントテキストかを判断する方法を示すフローチャートである。本発明は初歩的な行列分割によって複数の文字画像ブロックの外接長方形の枠を取得する。文字画像ブロックの統計特性によってラージフォントサイズの文字行か、スモールフォントサイズの文字行かを判断してから、ラージフォントテキストか、スモールフォントテキストかを判断する。具体的には、
S201:文字画像ブロックを取得する。
初歩的な行列分割によって複数の文字画像ブロックの外接長方形の枠を取得する。図4Aで示されるように、現在の文字画像集合Ωに対して、Hは現在の行高さであり、mが現在の行の中線である。図4Bで示されるように、文字画像ブロックUはΩにおけるいずれかの外接長方形の枠である。h、wはそれぞれUの高さと幅である。
S202:句読点画像ブロックと有効な文字画像ブロックとに分ける。
文字画像ブロックUが以下の三つの条件のいずれか1条件を満足する場合に、Uが句読点画像ブロックと判断し、以下の三つの条件のいずれも満足しない場合に、Uが有効な文字画像ブロックと判断する。即ち、
条件1:w>Nt1×H
条件2:Uの下端と上端がどちらもmの同じ側に位置する
条件3:Uの下端と上端がそれぞれにmの両側に位置し、かつ、w<Nt2×H
通常はNt1=4、Nt2=0.35である。
ここで、条件1は下線「_」のような句読点を除外するためであり、条件2はコンマ、句点、クォーテーション・マークなどの句読点を除外するためであり、条件3はハイフン「−」などの句読点を除外するためである。
ステップS202が実行された後に、全ての文字画像ブロックUは句読点画像ブロックと有効な文字画像ブロックとに分けられることが明らかである。
S203:有効な文字画像ブロックの統計特性を計算する。
現在の行において、有効な文字画像ブロックUの数がmとされる場合に、現在の有効な文字画像ブロックの有効高さHsは、
Figure 2014500688
であり、ここで、h1+h2+・・・hmはそれぞれ現在の行の有効な文字画像ブロック1、2・・・mの高さである。
S204:ラージフォントサイズの文字行か、スモールフォントサイズの文字行かを判断する。
≧Thsizeの場合に、現在の行はラージフォントサイズの文字行と判断され、H<Thsizeの場合に、現在の行はスモールフォントサイズの文字行と判断される。通常は、Thsize=88である。
S205:テキストのタイプを判断する。
テキストにおけるラージフォントサイズの文字行の行数Nlargeとスモールフォントサイズの文字行の行数Nsmallとをそれぞれ統計し、Nlarge≧Nsmallの場合に、当該テキストはラージフォントテキストと判断され、Nlarge<Nsmallの場合に、当該テキストはスモールフォントテキストと判断される。
好ましくは、ステップS50においては、単語列が投影する有効長さに基づいて単語グループを一定の数の部分に均等に分け、各部分の幅と位置する文字の最大高さとを組合せて新たな外接長方形の枠が形成され、外接長方形の枠は透かし画像ブロックに対応する。
図3は本発明の実施例で、有効な文字エリアをグループに分ける方法を示すフローチャートである。ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行う。それぞれのグループをその中の単語列が投影する有効長さに基づいて一定の数の部分に均等に分け、各部分の幅と位置する文字の最大高さとを組合せて新たな外接長方形の枠が形成され、それぞれの新たな外接長方形の枠は透かし画像ブロックに対応する。これによって、有効エリアをグループに分けることが完成し、具体的には、
S301:テキストのタイプと単語の分割結果を取得する。
ステップS30によってテキストのタイプが既に判断され、つまり、ラージフォントテキストか、スモールフォントテキストかが判断された。単語分割について、1行において全ての隣接する有効な文字画像ブロックの外接長方形の間の距離を昇順で並べる。この新しい系列に2種類のデータが含まれると考えられ、単語における文字の間隔と、単語同士の間隔である。明らかに、単語同士の間隔は単語における文字の間隔より大きい。図9で示されるように、上記した2種類のデータを区分するために、昇順で並べる系列から分割閾値を選択する。従って、正確で安定的な分割閾値を取得することが単語を分割することのキーである。
大津法と2ピーク方法(two-peak method)などの画像2値化方法によって上記した系列における2種類のデータを区分できる。なお、分割閾値の左サブ系列と右サブ系列の分散が両方とも比較的に小さい統計特性を考えて、系列における左分散と右分散の合計が最も小さい点を計算する方法によって最適な分割閾値を確定する。分割閾値が取得された後に、分割閾値より小さいである文字間隔に対応する文字画像ブロックを一つの単語に合併する。結果として、図5で示されるような単語分割の結果が取得された。
S302:一部の文字を局所的に調整する。
単語分割の閾値の近くの有効な文字画像ブロックを、間隔を拡大すべき文字とし、有効な文字画像ブロックの間隔が非常に小さくて、印刷された後に文字が接触しがちである有効な文字画像ブロックを間隔を縮小すべき文字とする。取得された有効な文字画像ブロックの属性に基づいて、相応する文字を移動する。間隔を拡大すべき文字が右に移動され、間隔を拡大すべき文字の右側にある全てのテキスト内容が右に移動される。間隔を縮小すべき文字が左に移動され、間隔を縮小すべき文字の右側にある全てのテキスト内容が左に移動される。
S303:単語をグループに分ける。
図6で示されるように、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数で単語グループGに分ける。各ラージフォントテキストのグループにNt3個の単語が含まれ、各スモールフォントテキストのグループにNt4個の単語が含まれる。通常はNt3=4、Nt4=4である。
S304:文字の有効長さを計算する。
図7Aで示されるように、あるグループGに対して、グループにおける合計m個の有効な文字画像ブロックUの有効長さLは
Figure 2014500688
である。当該グループを定数S個の部分に均等に分ける。そこで、各部分の有効長さL=L/Sである。ここで、Sの値は透かし処理次第である。例えば、出願番号は200710121642.7である特許において、Sの値と使用されるアダマール行列の階数と同じである。通常、S=4である。
S305:透かし画像ブロックを取得する。
図7Bで示されるように、各部分の有効長さを有効な文字画像ブロックに対応してグループを分けるとともに、各部分に含まれる文字の最大高さを新たな外接長方形の枠に組合せ、各新たな外接長方形の枠が一つの透かし画像ブロックに対応する。
S個の透かし画像ブロックごとに一つのグループが分けられ、分けられたグループに基づいてデジタル透かしに対して埋め込みと抽出を行う。
図8A、図8Bはそれぞれのスモールフォントサイズの西洋語テキストが印刷・スキャンされる前後の透かし画像ブロックである。図8Cは本発明の実施例で、異常な間隔があって、一部の文字が接触する場合に取得された透かし画像ブロックである。図8D、図8Eはそれぞれのラージフォントサイズの西洋語テキストが印刷・スキャンされる前後の透かし画像ブロックである。本発明により取得された透かし画像ブロックは印刷・スキャンの操作の影響を受けず、しかも、文字が接触することと、文字テキストのフォントサイズが異なることによる影響を避けることが分かる。
図10は本発明の実施例で、西洋語の透かし処理をするための透かし画像の分割装置を示す模式図であり、この装置は、西洋語画像を行列分割によって複数の文字画像ブロックを取得する分割モジュール10と、文字画像ブロックから有効な文字画像ブロックを識別する識別モジュール20と、西洋語画像はラージフォントサイズテキストに対応するか、スモールフォントサイズテキストに対応するかを判断するように、有効な文字画像ブロックのサイズを統計する統計モジュール30と、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うグループ分けモジュール40と、単語グループを透かし画像ブロックに対応する複数の部分に均等に分割する均等分割モジュール50とを備える。
この実施例は透かしの埋め込み処理の操作性を確保することができ、当該透かし画像ブロックの再同期性と、透かしの埋め込みと抽出を行う処理の頑健性を向上することができる。
好ましくは、識別モジュール20は、
条件1:w>Nt1×H
条件2:Uの下端と上端がどちらもmの同じ側に位置する
条件3:Uの下端と上端がそれぞれにmの両側に位置し、かつ、w<Nt2×H
を満足するかを判断する判断モジュールと、条件1〜3のいずれか1条件を満足する場合に、Uに対応する文字画像ブロックを句読点画像ブロックと判断し、条件1〜3のいずれも満足しない場合に、Uに対応する文字画像ブロックを有効な文字画像ブロックと判断する確定モジュールとを備えており、ここで、Uが文字画像ブロックの集合Ωにおける文字画像ブロックの外接長方形の枠であり、HはUが位置する行の行高さであり、mはUが位置する中線であり、hとwはそれぞれUの高さと幅であり、Nt1とNt2はプリセット係数であることを特徴とする装置。
好ましくは、統計モジュール30は
Figure 2014500688
を計算する計算モジュールと、H≧Thsize(Thsizeはプリセット閾値である)の場合に、Uが位置する行をラージフォントサイズの文字行と判断し、H<Thsizeの場合に、Uが位置する行をスモールフォントサイズの文字行と判断する確定モジュールと、西洋語画像におけるラージフォントサイズの文字行の行数Nlargeとスモールフォントサイズの文字行の行数Nsmallとを統計する行数統計モジュールと、Nlarge≧Nsmallの場合に、西洋語画像をラージフォントサイズテキストに対応すると判断し、Nlarge<Nsmallの場合に、西洋語画像をスモールフォントサイズテキストに対応すると判断するテキスト確定モジュールとを備える。
以上の説明で分かるように、本発明の上記の実施例は西洋語画像の透かし処理をする正確さを最終的に向上することができる。本発明において、フォントサイズが異なる西洋語単語の異なる行列分割特性を十分に考えた上で、フォントサイズが大きいテキストとフォントサイズが小さいテキストを区分する閾値を取得し、閾値によって大きいテキストか、フォントサイズが小さいテキストかを判断する。テキストのタイプによって異なる個数の単語でグループに分け、分けられた透かし画像ブロックにおける黒い画素点の数の差が小さくなり、透かし処理の頑健性を著しく向上できる。本発明において、印刷される前後に、西洋語単語同士の間における間隔は不安定の状況を十分に考えて、透かしを埋め込む時に、西洋語単語の分割閾値の局所特性を考えて、閾値の近くにある西洋語単語の内部文字の間の距離に対して微調整を行い、印刷・スキャンされる前後に文字分割の一致性を確保でき、当該透かし画像ブロックの再同期性と、透かしの埋め込みと抽出を行う処理の頑健性をいっそうに向上することができる。
言うまでもなく、当業者であれば分かるように、上記した本発明の各モジュールや各ステップは、汎用のコンピューター装置によって実現でき、単一のコンピューター装置に集積されても良く、複数のコンピューター装置からなるネットワークに配置されても良く、任意に、各モジュールや各ステップは、コンピューター装置にて実行可能なプログラムコードで実現でき、それらを記憶装置に記憶して計算装置に実行させても良く、あるいは、それぞれ各集積回路モジュールとして作成しても良く、あるいは、それらの中の複数のモジュール又はステップを単一の集積回路モジュールとして作成して実現しても良い。このように、本発明は、いかなる特定のハードウェアとソフトウェアとの組合せに限定されない。
以上は、本発明の好ましい実施例に過ぎず、本発明を限定するものではない。本発明に対して、様々な変更や変化が可能である。本発明の主旨と原則を離脱しない範囲で、いかなる変更、均等代替、改良なども本発明の保護範囲内に含まれる。

Claims (11)

  1. 西洋語の透かし処理をするための透かし画像の分割方法であって、
    西洋語画像を行列分割によって複数の文字画像ブロックを取得するステップと、
    前記文字画像ブロックから有効な文字画像ブロックを識別するステップと、
    前記西洋語画像がラージフォントテキストに対応するか、スモールフォントテキストに対応するかを判断するように、前記有効な文字画像ブロックのサイズを統計するステップと、
    前記ラージフォントテキストと前記スモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うステップと、
    前記単語グループを、透かし画像ブロックに対応する複数の部分に均等に分割するステップと、
    を備えることを特徴とする方法。
  2. 前記文字画像ブロックから有効な文字画像ブロックを識別するステップにおいては、
    前記文字画像ブロックを句読点画像ブロックと前記有効な文字画像ブロックとに分けることを特徴とする請求項1に記載の方法。
  3. 前記文字画像ブロックを句読点画像ブロックと前記有効な文字画像ブロックとに分ける際には、
    条件1:w>Nt1×H
    条件2:Uの下端と上端がどちらもmの同じ側に位置する
    条件3:Uの下端と上端がそれぞれmの両側に位置し、かつ、w<Nt2×H
    を満足するかを判断し、
    条件1〜3のいずれか1条件を満足する場合に、Uに対応する前記文字画像ブロックが句読点画像ブロックと判断され、条件1〜3のいずれも満足しない場合に、Uに対応する前記文字画像ブロックが有効な文字画像ブロックと判断されており、
    ここで、Uが前記文字画像ブロックの集合Ωにおける前記文字画像ブロックの外接長方形の枠であり、HはUが位置する行の行高さであり、mはUが位置する中線であり、hとwはそれぞれUの高さと幅であり、Nt1とNt2はプリセット係数であることを特徴とする請求項2に記載の方法。
  4. t1=4、Nt2=0.35に設定することを特徴とする請求項3に記載の方法。
  5. 前記有効な文字画像ブロックのサイズを統計するステップにおいては、
    Figure 2014500688
    を計算し、
    ≧Thsize(Thsizeはプリセット閾値である)の場合に、Uが位置する行はラージフォントサイズの文字行と判断され、H<Thsizeの場合に、Uが位置する行はスモールフォントサイズの文字行と判断され、
    前記西洋語画像における前記ラージフォントサイズの文字行の行数Nlargeと前記スモールフォントサイズの文字行の行数Nsmallとを統計し、
    large≧Nsmallの場合に、前記西洋語画像は前記ラージフォントサイズテキストに対応すると判断され、Nlarge<Nsmallの場合に、前記西洋語画像は前記スモールフォントサイズテキストに対応すると判断されることを特徴とする請求項3に記載の方法。
  6. Thsize=88に設定することを特徴とする請求項5に記載の方法。
  7. 前記単語グループを透かし画像ブロックに対応する複数の部分に均等に分割するステップにおいては、
    単語列が投影する有効長さに基づいて前記単語グループを一定の数の部分に均等に分け、
    前記数の部分の幅と、位置する文字の最大高さとを組合せて新たな外接長方形の枠が形成され、前記外接長方形の枠は透かし画像ブロックに対応することを特徴とする請求項1に記載の方法。
  8. 西洋語画像を行列分割前に、
    前記西洋語画像を取得し、
    前記西洋語に対してノイズ除去処理を行い、2値化の前記西洋語画像を取得することを特徴とする請求項1に記載の方法。
  9. 西洋語の透かし処理をするための透かし画像の分割装置であって、
    西洋語画像を行列分割によって複数の文字画像ブロックを取得する分割モジュールと、
    前記文字画像ブロックから有効な文字画像ブロックを識別する識別モジュールと、
    前記西洋語画像はラージフォントサイズテキストに対応するか、スモールフォントサイズテキストに対応するかを判断するように、前記有効な文字画像ブロックのサイズを統計する統計モジュールと、
    前記ラージフォントテキストと前記スモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うグループ分けモジュールと、
    前記単語グループを透かし画像ブロックに対応する複数の部分に均等に分割する均等分割モジュールと、
    を備えることを特徴とする装置。
  10. 前記識別モジュールは、
    条件1:w>Nt1×H
    条件2:Uの下端と上端がどちらもmの同じ側に位置する
    条件3:Uの下端と上端がそれぞれにmの両側に位置し、かつ、w<Nt2×H
    を満足するかを判断する判断モジュールと、
    条件1〜3のいずれか1条件を満足する場合に、Uに対応する前記文字画像ブロックを句読点画像ブロックと判断し、条件1〜3のいずれも満足しない場合に、Uに対応する前記文字画像ブロックを有効な文字画像ブロックと判断する確定モジュールとを備えており、
    ここで、Uが前記文字画像ブロックの集合Ωにおける前記文字画像ブロックの外接長方形の枠であり、HはUが位置する行の行高さであり、mはUが位置する中線であり、hとwはそれぞれUの高さと幅であり、Nt1とNt2はプリセット係数であることを特徴とする請求項9に記載の装置。
  11. 前記統計モジュールは、
    Figure 2014500688
    を計算する計算モジュールと、
    ≧Thsize(Thsizeはプリセット閾値である)の場合に、Uが位置する行をラージフォントサイズの文字行と判断し、H<Thsizeの場合に、Uが位置する行をスモールフォントサイズの文字行と判断する行確定モジュールと、
    前記西洋語画像における前記ラージフォントサイズの文字行の行数Nlargeと前記スモールフォントサイズの文字行の行数Nsmallとを統計する行数統計モジュールと、
    large≧Nsmallの場合に、前記西洋語画像を前記ラージフォントサイズテキストに対応すると判断し、Nlarge<Nsmallの場合に、前記西洋語画像を前記スモールフォントサイズテキストに対応すると判断するテキスト確定モジュールと、
    を備えることを特徴とする請求項10に記載の装置。
JP2013545033A 2010-12-23 2011-12-23 西洋語の透かし処理をするための透かし画像の分割方法と装置 Expired - Fee Related JP5669957B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201010620424.XA CN102567938B (zh) 2010-12-23 2010-12-23 用于西文水印处理的水印图像分块方法和装置
CN201010620424.X 2010-12-23
PCT/CN2011/084577 WO2012083882A1 (zh) 2010-12-23 2011-12-23 用于西文水印处理的水印图像分块方法和装置

Publications (3)

Publication Number Publication Date
JP2014500688A true JP2014500688A (ja) 2014-01-09
JP2014500688A5 JP2014500688A5 (ja) 2014-10-16
JP5669957B2 JP5669957B2 (ja) 2015-02-18

Family

ID=46313189

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013545033A Expired - Fee Related JP5669957B2 (ja) 2010-12-23 2011-12-23 西洋語の透かし処理をするための透かし画像の分割方法と装置

Country Status (5)

Country Link
US (1) US9111341B2 (ja)
EP (1) EP2657902B1 (ja)
JP (1) JP5669957B2 (ja)
CN (1) CN102567938B (ja)
WO (1) WO2012083882A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102938841B (zh) * 2012-11-30 2015-02-11 西安空间无线电技术研究所 在承载图像中隐藏信息、图像质量评价及信息传输方法
CN105224833B (zh) * 2014-06-30 2018-03-30 北京金山安全软件有限公司 利用数字水印识别应用程序是否是正版的方法及系统
CN105631486A (zh) * 2014-10-27 2016-06-01 深圳Tcl数字技术有限公司 图像文字识别方法及装置
TWI643159B (zh) * 2017-11-16 2018-12-01 國立臺北科技大學 基於奇偶特性隱寫資料於區塊截斷編碼影像的方法、影像壓縮裝置及電腦可讀取的記錄媒體
GB2572386B (en) * 2018-03-28 2021-05-19 Canon Europa Nv An image processing system and an image processing method
CN108830772A (zh) * 2018-05-25 2018-11-16 珠海奔图电子有限公司 水印编码转换方法及装置
US10939013B2 (en) 2018-09-07 2021-03-02 International Business Machines Corporation Encoding information within features associated with a document
WO2021056183A1 (en) * 2019-09-24 2021-04-01 Citrix Systems, Inc. Watermarks for text content
CN113450243A (zh) * 2020-03-24 2021-09-28 北京四维图新科技股份有限公司 水印添加方法和设备
CN114596188A (zh) * 2022-02-22 2022-06-07 北京百度网讯科技有限公司 水印检测方法、模型训练方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001078006A (ja) * 1999-08-06 2001-03-23 Internatl Business Mach Corp <Ibm> 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置
JP2005341493A (ja) * 2004-05-31 2005-12-08 Ricoh Co Ltd 情報埋め込み装置、情報検出装置、情報埋め込み・検出システム、情報埋め込み方法、情報検出方法、情報埋め込み・検出、情報埋め込みプログラム、情報検出プログラム、情報埋め込み・検出プログラムおよび記録媒体
JP2008098946A (ja) * 2006-10-11 2008-04-24 Canon Inc 画像処理装置及びその制御方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5848191A (en) * 1995-12-14 1998-12-08 Xerox Corporation Automatic method of generating thematic summaries from a document image without performing character recognition
JP2003230001A (ja) * 2002-02-01 2003-08-15 Canon Inc 文書用電子透かし埋め込み装置及び文書用電子透かし抽出装置並びにそれらの制御方法
US8127137B2 (en) * 2004-03-18 2012-02-28 Digimarc Corporation Watermark payload encryption for media including multiple watermarks
US7644281B2 (en) * 2004-09-27 2010-01-05 Universite De Geneve Character and vector graphics watermark for structured electronic documents security
CN100367274C (zh) * 2005-06-24 2008-02-06 清华大学 一种在英文文本中嵌入和提取水印的方法
CN1897522B (zh) * 2005-07-15 2010-05-05 国际商业机器公司 水印嵌入和/或检测的方法、装置及系统
CN101169779A (zh) * 2007-11-30 2008-04-30 清华大学 在英文文本中嵌入和提取频域水印的方法
JP2009141525A (ja) * 2007-12-04 2009-06-25 Canon Inc 画像処理装置及び画像処理方法
CN101251892B (zh) * 2008-03-07 2010-06-09 北大方正集团有限公司 一种字符切分方法和装置
JP2010124451A (ja) * 2008-10-24 2010-06-03 Canon Inc 文書処理装置および文書処理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001078006A (ja) * 1999-08-06 2001-03-23 Internatl Business Mach Corp <Ibm> 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置
JP2005341493A (ja) * 2004-05-31 2005-12-08 Ricoh Co Ltd 情報埋め込み装置、情報検出装置、情報埋め込み・検出システム、情報埋め込み方法、情報検出方法、情報埋め込み・検出、情報埋め込みプログラム、情報検出プログラム、情報埋め込み・検出プログラムおよび記録媒体
JP2008098946A (ja) * 2006-10-11 2008-04-24 Canon Inc 画像処理装置及びその制御方法

Also Published As

Publication number Publication date
EP2657902A1 (en) 2013-10-30
EP2657902B1 (en) 2017-03-08
CN102567938A (zh) 2012-07-11
US20140003649A1 (en) 2014-01-02
EP2657902A4 (en) 2013-12-25
US9111341B2 (en) 2015-08-18
WO2012083882A1 (zh) 2012-06-28
CN102567938B (zh) 2014-05-14
JP5669957B2 (ja) 2015-02-18

Similar Documents

Publication Publication Date Title
JP5669957B2 (ja) 西洋語の透かし処理をするための透かし画像の分割方法と装置
Amano et al. A feature calibration method for watermarking of document images
CN107248134B (zh) 一种文本文档中的信息隐藏方法和装置
US7106884B2 (en) Digital watermark embedding apparatus for document, digital watermark extraction apparatus for document, and their control method
US7965892B2 (en) Image processing apparatus, control method thereof, and program
US10949509B2 (en) Watermark embedding and extracting method for protecting documents
US8077910B2 (en) Digital watermark embedding and detection
AU2009200307B2 (en) Image processing system and image processing program
TW200540728A (en) Text region recognition method, storage medium and system
JP2008085920A (ja) 電子透かし埋め込み装置および検出装置
JP2007221794A (ja) 低解像度のグリフ・イメージから高忠実度のグリフ・プロトタイプを作成するための方法および装置
CN111738898A (zh) 文本数字水印嵌入\提取方法及装置
JP4595014B2 (ja) 電子透かし埋め込み装置および検出装置
KR20210081267A (ko) 화상 처리 장치, 저장 매체, 및 화상 처리 방법
US8848984B2 (en) Dynamic thresholds for document tamper detection
US20130050765A1 (en) Method and apparatus for document authentication using image comparison on a block-by-block basis
US20080050016A1 (en) Image processing apparatus, image processing method, computer readable medium, and computer data signal
US20110170133A1 (en) Image forming apparatus, method of forming image and method of authenticating document
JP4275973B2 (ja) 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法
CN112650992A (zh) 一种基于数字水印的文档追踪加密方法
CN101751655A (zh) 数字水印的嵌入方法、提取方法及其装置
JP2004127203A (ja) 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体
CN112990178B (zh) 一种基于字符切分的文本数字信息嵌入、提取方法及系统
RU2431192C1 (ru) Способ внедрения скрытого цифрового сообщения в печатаемые документы и извлечения сообщения
JP2005286963A (ja) 印刷用媒体への情報埋め込み装置,情報読み取り装置および情報を埋め込んだ媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140415

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20140415

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20140527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140610

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20140827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141216

R150 Certificate of patent or registration of utility model

Ref document number: 5669957

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350