JP2011139449A - メッセージを構造化された形状内に埋め込む方法およびシステム - Google Patents

メッセージを構造化された形状内に埋め込む方法およびシステム Download PDF

Info

Publication number
JP2011139449A
JP2011139449A JP2010276493A JP2010276493A JP2011139449A JP 2011139449 A JP2011139449 A JP 2011139449A JP 2010276493 A JP2010276493 A JP 2010276493A JP 2010276493 A JP2010276493 A JP 2010276493A JP 2011139449 A JP2011139449 A JP 2011139449A
Authority
JP
Japan
Prior art keywords
glyph
data segment
symbol
modified
landmarks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010276493A
Other languages
English (en)
Other versions
JP5436402B2 (ja
JP2011139449A5 (ja
Inventor
Shantanu Rane
シャンタヌ・ラーネ
Samarjit Das
サマルジット・ダス
Vetro Anthony
アンソニー・ヴェトロ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2011139449A publication Critical patent/JP2011139449A/ja
Publication of JP2011139449A5 publication Critical patent/JP2011139449A5/ja
Application granted granted Critical
Publication of JP5436402B2 publication Critical patent/JP5436402B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32203Spatial or amplitude domain methods
    • H04N1/32229Spatial or amplitude domain methods with selective or adaptive application of the additional information, e.g. in selected regions of the image
    • H04N1/3224Spatial or amplitude domain methods with selective or adaptive application of the additional information, e.g. in selected regions of the image in edge regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0051Embedding of the watermark in the spatial domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0062Embedding of the watermark in text images, e.g. watermarking text documents using letter skew, letter distance or row distance

Abstract

【課題】この発明の実施の形態は、シンボルをグリフに埋め込むためのシステムおよび方法である。
【解決手段】前記グリフの輪郭を表わす1組の目印を決定する工程と、2つの境界標間の、前記シンボルを埋め込むのに適するデータセグメントを決定する工程と、前記シンボルが修正変更されたグリフに埋め込まれるように、前記シンボルにしたがってデータセグメントを修正変更して前記修正変更されたグリフを生成する工程と、前記修正変更されたグリフを出力する工程と、を含むシステムおよび方法を開示する。
【選択図】図1

Description

[関連出願]
次の特許および特許出願が、引用によってここに組込まれる。
2002年5月28日に許可された、Frisken(フリンケン)外による、「Detail−Directed Hierarchical Distance Fields(詳細に指定された階層的距離フィールド)」と題する米国特許第6,396,492号;
2006年2月21日に許可された、Frisken他による、「Tiled Generation of Adaptively Sampled Distance Fields(適応的にサンプリングされた距離フィールドのタイル状の生成)」と題する米国特許第7,002,570号;
2006年4月25日に許可された、Frisken他による、「Method for Antialiasing an Object Represented as a Two−Dimensional Distance Field in Image−Order(画像順に2次元の距離フィールドとして表わされたオブジェクトをアンチエイリアシングするための方法」と題する米国特許第7,034,845号;
2006年10月17日に許可された、Frisken他による、「Method and Apparatus for Antialiasing a Set of Objects Represented as a Set of Two−Dimensional Distance Fields in Image−Order(画像順に1組の2次元の距離フィールドとして表わされるオブジェクトをアンチエイリアシングするための方法および装置」と題する米国特許第7,123,271号;
2008年12月8日にRane(レイン)外により出願された「Method for Embedding a Message into a Document(メッセージを文書の中へ埋め込むための方法)」と題する米国特許出願第12/329,869号;
2008年12月31日にRane外により出願された、「Method for Embedding Messages into Documents Using Distance Fields(距離フィールドを使用してメッセージを文書の中へ埋め込むための方法)」と題する米国特許出願第12/347,277号。
この発明は、一般的には、メッセージを構造化された形状内に埋め込むことに関し、より詳細には、メッセージをグリフ(絵文字)(glyphs)に埋め込むことおよび検知することに関するものである。
透かし
メッセージは、透かしとして、文書にしばしば埋め込まれている。埋め込まれたメッセージは、セキュリティ、プライバシおよび著作権保護のために使用することができる。
紙の「ハードコピー」文書用の透かし入れは電子の「ソフトコピー」文書とは異なる。ソフトコピー文書に対して、透かし挿入、文書複写、文書劣化、文書圧縮および透かし抽出のような、透かしを含むすべてのオペレーションは、デジタルドメイン中で行なわれる。ハードコピー文書に対して、透かし挿入がディジタル(電子)的に発生することもあるが、印刷、ファックス、ホトコピー(写真複写)等のオペレーションは、ハードコピー文書自体を含んでいる。さらに、透かし抽出は、ハードコピー文書のスキャン(走査)されたバージョン(形式)上で行なわれる。したがって、ハードコピー文書における透かしは、文書がコピーされるか、スキャンされるか、ファックスされるか、あるいはそれら以外に操作される場合に、劣化されうる。
グリフ(Glyph)
グリフは、ここに定義されるように、基本的なグラフィックオブジェクトである。グリフの中で最も一般的な例はテキスト文字あるいはグラフィーム(書記素)である。グリフはまた、リガチャ(ligatures)、すなわち合わせ文字あるいは発音区別符号でもよい。グリフはまた、ピクトグラムや表意文字でもありうる。グリフという用語はまた、非文字あるいはマルチ文字パターンにも使用することができる。ここで使用されるように、グリフは、多次元の、或る任意の図形形状かオブジェクトである。
メッセージの埋め込み
メッセージを画像、映像および音声のような信号に埋め込むための方法は知られている。しかしながら、メッセージを、グリフのようなグラフィックオブジェクト内に、目障りにならずに埋め込むことは困難である。グリフへの小さな変化、たとえば間隔や方向、さえも、人間の視覚システムによって容易に検知することができる。したがって、メッセージを隠すための、グリフへの変更は、非常に小さく、且つ同時に検知可能でなければならない。これらの矛盾する要件はこの問題を挑戦的な(興味深い)ものにする。
この問題は、ハードコピーの透かし入れの場合には、さらに難しい。ハードコピー文書は経時的に物理的な劣化をする場合がある。
文書の電子バージョンにおいて検知できたメッセージが、その印刷された書類が写真複写されるかスキャン(走査)される場合に、失われる場合がある。たとえば、グレーレベルにおける微妙な変化が複写の後に失われる。
従来のメッセージ埋め込み方法
いくつかの従来のメッセージ埋め込み方法は、テキスト文書を画像として扱い、また画像ベースの透かし入れ技術を使用する。しかしながら、それらの方法は、主として個々の文字のビットマップ化された表現あるいはカラー(色)とシェード(濃淡)とのハーフトーンの表現で動作するプリンタではうまくいかない。
別の従来手法は、差異が目には分からないがスキャナーによって検知することができるように、文字の色を僅かに変更する。埋め込まれたメッセージは目に見えないので、透かしを変更することは難しい。しかしながら、文書がコピーされるときに、色またはグレーレベルの小さな差異は容易に失われるので、この方法は写真複写に対して堅牢ではない。
また別の方法は、個々の文字、語あるいは連続したテキスト行の間の距離を調整する。低い埋め込み割合では、その方法は、読者にはほとんど目に見えず、複写しても生き残る。しかしながら、高い埋め込み割合では、文字間、語間あるいは行間の非均一な距離は、攻撃者には容易に見ることができ、また通常の読者にはまた悩ましい(いらいらさせる)ものである。
さらに別の方法は、文字全体を平常より狭くあるいは広くするために、ディザリングを使用する。しかしながら、その方法によって作成された文書は、メッセージを破壊せずに、容易に写真複写することができない。
さらにまた別の方法は、テキストの位置に関係なく、ドットの擬似ランダムパターンを文書の背景に埋め込む。ドットは、比較的目だたないが、それでもなお、コンピュータによって容易に検知し削除することができる。さらに、ドットは、小さいので、写真複写の1つのインスタンス(事例)以上には生き残らないかもしれない。
距離フィールド
グラフィックオブジェクト、たとえばグリフ、の形状は、コンピュータシステムのメモリ内でn次元空間におけるサンプルポイント(点)の集合として表わすことができる。各サンプルポイントに関係しているのは、サンプルから最も近い形状の境界までの最小距離である。距離は、サンプルがオブジェクトの内部にあるか外部にあるかを示すためにプラスまたはマイナスであり、またサンプルが境界上にある場合には零である。関連する距離値を有するサンプルの集合は、サンプリングされた距離フィールドと呼ばれる。距離フィールドはまた、コンピュータシステムのメモリに格納された分析手順として表わすことができる。
ここに定義されるように、距離フィールドはすべてのタイプの距離フィールド、すなわち、サンプリングされたものとサンプリングされなかったものとの双方、を指す。
距離フィールドは、色、グレーレベル、密度およびテクスチャーのような、グリフの形状以外の属性を表わすために使用することができる。より正確には、グリフを表わす距離フィールドの距離値からグリフの他の属性を表わす値へのマッピングがある。
適応的にサンプリングされた距離フィールド(ADFs)
適応的にサンプリングされた距離フィールド(ADF)では、サンプルの密度は、形状の異なる部分を表わすのに必要とされる詳細度に依存する。たとえば、複雑な局部的変動は多くのサンプルを必要とするかもしれない。したがって、ADFは、任意形状、たとえばテキスト文字、漫画およびロゴのようなグリフ、の処理を可能にする表現である。
この発明の目的は、ソフトコピーおよびハードコピー文書の内部にメッセージを透かしとして埋め込むための方法を提供することである。
この発明の他の目的は、メッセージが文書の読者に目だたない(目障りでない)ような方法を提供することである。
この発明の他の目的は、比較的大きなメッセージを埋め込むのに適しているような方法を提供することである。
この発明の他の目的は、埋め込まれたメッセージが文書の物理的な劣化に対して堅牢であるような方法を提供することである。
この発明の他の目的は、埋め込まれたメッセージが文書の物理的な複写(コピー)に対して堅牢であるような方法を提供することである。
この発明の他の目的は、埋め込まれたメッセージを電子バージョンの文書から抽出できるような方法を提供することである。
この発明の実施の形態は、グリフの輪郭を表わす1組の目印(ランドマーク)を決定する工程と、2つの目印間の、前記シンボルを埋め込むのに適するデータセグメントを決定する工程と、前記シンボルが修正変更されたグリフに埋め込まれるように、前記シンボルにしたがってデータセグメントを修正変更して前記修正変更されたグリフを生成する工程と、前記修正変更されたグリフを出力する工程と、を含む、シンボルをグリフに埋め込むためのシステムおよび方法を開示する。
この発明は、グリフの輪郭が1組の曲線、たとえばベジェ曲線、によって表わされる場合、該曲線を少し変更(攪乱)することにより、メッセージに対応する多数の似た外観の形状になりうるという認識に基づく。したがって、グリフの曲線の修正変更によって、たとえば、該曲線を表わす、距離フィールドの距離値の修正変更によって、該グリフの形状は、メッセージを文書に埋め込みつつ、目だたない方法で修正変更することができる。
この発明の実施の形態による、1組のグリフを含む文書にメッセージを埋め込むための方法のブロック図である。 この発明の実施の形態による、1組の目印を有するグリフの形状の輪郭を表わす概略図である。 この発明の実施の形態による、データセグメントにシンボルを埋め込む概略図である。 修正変更されたグリフに埋め込まれていたシンボルを抽出するための方法のブロック図である。 この発明の実施の形態による、プロクラステス解析を使用して、データセグメント同士を比較するための方法のブロック図である。
実施の形態1.
ここに記述された例示のグリフおよび文書は、特定の種類のデータ構造である、適応的にサンプリングされた距離フィールド(ADFs)によって表わされる。しかしながら、ここに記述されたすべての実施の形態は、基礎をなすデータ構造から独立している。たとえば、これらの実施の形態は、また他のタイプの距離フィールド、たとえば規則的にサンプリングされた距離フィールドや手続き的な距離フィールドで働く。
この発明の実施の形態は、メッセージのシンボルをグリフに埋め込むための方法を提供する。上述のように、グリフは多次元であり、たとえば、テキスト文字、任意のオブジェクト、あるいは多様体、たとえば微分可能多様体、である。説明を簡単にするため、この発明の実施の形態は2次元のグリフを使用して記述される。しかしながら、我々の発明は、より高い次元のグリフに適用可能である。
たとえば、この発明のいくつかの実施の形態では、輪郭はグリフから抽出され、その輪郭はベジェ曲線を使用して表わされ、またベジェ曲線は形状の変化を与えるために僅かに修正変更される(乱される)。この結果、グリフの形状が変更修正され、それは人間の視覚システムでは通常の視聴条件の下で一般的には検出できない。したがって、そのような形状の僅かな変化を見つけ出して変更するのは難しい。その一方で同時に、この変化は文書の写真複写のようなオペレーション(操作)に対して弾力的である。ADFあるいは規則的にサンプリングされた距離フィールドあるいは他の適切な表現が、修正変更された形状を格納したり表わしたりするためにのみ使用される。
メッセージの埋め込み
図1は、メッセージ110のシンボル(S)115を1組のグリフ125、たとえばグリフ’125’、に埋め込むための方法100を示す。グリフ125”はグリフ’125’の視覚的な例示である。グリフは、たとえば、文書120上で表示することができ、あるいはコンピュータメモリに格納されることができる。
各シンボルは有限のアルファベット{0、1、・・・、K−1}から選択される。パラメーターMおよびK116が前もって決められている。いくつかの実施の形態では、メッセージ110は、M個より多くのシンボルを含む。それらの実施の形態では、メッセージは2つ以上のグリフ125へ埋め込まれる。別の実施の形態では、メッセージはM個のグリフに埋め込まれる。すなわち、1つのシンボルが各グリフに埋め込まれる。メッセージのシンボルは、情報ビットおよび、任意ではあるが(必要に応じて)、エラー訂正シンボルを含む。
グリフ’125’は構造化される。構造化されたグリフは、ここに定義されるように、スプライン、ウェーブレットあるいは距離フィールドに基づいたストラクチャーのようなデータ構造の内部に格納することができる形状を有する。我々の発明の実施の形態は、選択されたデータ構造から独立している。たとえば、一実施の形態は、ADFのデータ構造を使用する。ADFは、形状がツリーに基づいた表現で効率的に格納されることを可能にし、様々な分解能および次元で形状のレンダリング(表現)を可能にする。
メッセージ110はグリフの形状の輪郭に埋め込まれる。輪郭は曲線、たとえば線、によって、あるいはグリフの境界を定義する面によって、表わすことができる。輪郭は形状の固有の特徴であり、それはコピーやスキャニングのような品質を劣化させるプロシジャー(処理手順)の下でも埋め込まれた情報を保存することを可能にする。輪郭を表わす曲線は、たとえばベジェ曲線やスプライン曲線でもよい。実施の形態では、グリフの形状の輪郭を1組の目印(ランドマーク)135として表す130。図2により詳細に以下に記述されるように、目印の組は、形状の粗い(概略的な)表現を与える、1次的(主要)および2次的(補助的)な目印を含む。
それらの目印に基づいて、輪郭の1組のデータセグメント145が決定140され、そこでは、各データセグメントは、シンボルを埋め込むために修正変更されるのに適している。ここに定義され、また以下により詳細に説明されるように、データセグメントはグリフの形状の輪郭の一部であり、微分可能多様体、たとえば微分可能な曲線であり、それは内部の1次的な(主要な)目印を有しない。データセグメントは、シンボル115を埋め込むために、徐々に、たとえば、曲線に沿って、修正変更150され、修正変更されたグリフ156を生成する。グリフ156’はグリフ’156の視覚的な例示である。
修正変更されたグリフは、たとえばADFを使用して記憶装置のために、あるいは修正変更された文書155に組み込むために、出力される。修正変更されたグリフ156を含む修正変更された文書155は、シンボル115が文書155から抽出される前に、レンダリング(表示)されることができる。レンダリングの例は、修正変更された文書155のコピー、印刷、ファックス、電子メール、表示、スキャニング、あるいはそれらの組合せを含む。
目印(ランドマーク)
図2は、グリフの形状の輪郭が1組の目印でどのように表わされるかを示す。
グリフ、たとえばグリフ205、がADFとして既に格納されている場合には、輪郭215は直接利用可能である。グリフが画像として与えられる場合、輪郭は、たとえばエッジ抽出を使用して、決定210される。その後、輪郭の離散的な曲率プロファイルが決定220され、また、高い曲率を有するプロファイルの部分を特定するために、曲率閾値240が使用される。高い曲率の点は1次的な(主要な)目印225であり、グリフの形状に対する1次的な(主要な)ビジュアルキューとして役立つ。その後、2つの1次的な目印間の輪郭上の多角形近似230により、1組の2次的な(補助的な)目印235を決定する。1次的および2次的な目印の組は、グリフの形状の粗い(概略的な)表現を与える。
一実施の形態では、多角形近似は1次的な目印に基づいて2次的な目印を得るために使用される。別の実施の形態では、予め決められた数の2次的な目印が、2つの1次的な目印の間の曲線の長さを横断して2次的な目印を互いに等距離をおいてマーク付けすることにより得られる。さらに別の実施の形態においては、2つの1次的な目印間の曲線の長さを横断して、如何なる所与の位置でも局部的な曲率に基づいて互いに不等距離をおいて2次的な目印をマーク付けして、したがって、曲率が高い場合には、より多くの2次的な目印を設け、また曲率が低い場合には、より少数の2次的な目印を設けることにより、可変数の2次的な目印が得られる。
データセグメント
データセグメント145は、輪郭を横断して、シンボルを埋め込むのに適している2つの目印間のセグメントを決定することにより選択される。セグメントが微分可能多様体であり、且つ内部の1次的な目印を有さない場合、該セグメントはデータセグメントとして選択される。たとえば、セグメント250および260は両方ともデータセグメントとして選択されることが適切である。一実施の形態では、セグメントの長さは、指定された範囲[lmin、lmax]内にあるように制約される。一実施の形態では、M個のデータセグメントが、埋め込みのために、データセグメントから無作為に選択される。
データセグメントの修正変更
データセグメントは、K個の異なる方法のうちのいずれか1つにより、修正変更される。知覚不能な(目に見えない)ように、変更はセグメントに沿って滑らかに且つ徐々に行われる。さらに、変更は、CまたはCの不連続が導入されないように、行なわれる。ここで、C不連続は形状の輪郭の切れ目であり、また、C不連続は接線における不連続、すなわち鋭いねじれである。グリフの形状の全高および全幅は、その変更の後に、変化してはならない。一実施の形態では、グリフの修正変更された形状の中の目印の総数が未変更のグリフのものと同じであるように、形状変更が行なわれる。代替の実施の形態では、1次的な目印の数だけが保持される。
図3は、シンボル、たとえばビット、をデータセグメントに埋め込む例を示す。曲がったデータセグメント310は、データセグメントに垂直な線320に沿って修正変更され、最大の変更321が該データセグメントに沿って中間にある。不連続の導入を防止するために、その変更はデータセグメントのエッジ322の近くで最小である。
一実施の形態では、データセグメントのアンカーとして使用されるデータセグメントのエッジ(端)にある目印、および該セグメントにおける、内部目印あるいは無作為に選択された点は制御点として使用され、該制御点の位置はデータセグメントを修正変更するために僅かに変化される。
別の実施の形態では、データセグメントの曲線に沿った変形は、±3σに位置するデータセグメントとエッジとを介して、途中に位置するモードσを有するガウス分布に従う。この実施の形態では、修正変更されるデータセグメント330は1ビットを表わすが、未変更のデータセグメント310は0ビットを表わす。
望まれる知覚不能のレベルに依存して、実施の形態により多数の修正変更を使用することができる。輪郭にM個のデータセグメントがある場合、M個のシンボルの各一意の組合せは一意の修正変更された輪郭に関係している。したがって、輪郭はK個の修正バージョン(形式)で表わすことができる。
一実施の形態では、修正変更されたグリフ156は、ADFを使用して格納される。修正変更されたグリフの輪郭は、一つの接続された組の立方体のベジェ曲線として表わされる。各曲線は目印の位置によって表わされる。ベジェ曲線上のすべての目印の座標は、修正変更されたグリフの輪郭経路情報を含む。この輪郭経路情報はADFとして格納される。輪郭経路情報は、正規化された空間座標[Xmin、Xmax、Ymin、Ymax]=[0、1、0、1]に関して与えられ、またグリフがレンダリング(表示)される毎に、ADFモジュールは該正規化された座標を画像の座標へ写像する。
シンボルの抽出
図4は、修正変更されたグリフに埋め込まれていたシンボル、たとえば電子ドキュメント410あるいは印刷され、写真複写され、スキャン(走査)されたページから抽出されたテキスト文字415、を抽出する方法400を示す。本方法400は、データセグメント442の修正バージョンと共に未変更のデータセグメントのデータベース441にアクセスし、また個々の修正変更されたデータセグメントに関連する埋め込まれたシンボルにアクセスする。データベース441はまたオリジナル、すなわち修正変更されたグリフ435の未変更のバージョンを含んでいる。
グリフ415の輪郭435が決定430される。本方法400は、グリフ415のアイデンティティ(同一性)を知る。たとえば、一実施の形態では、本方法400は、殆どのスキャナーにおいて利用可能な光学式文字認識(OCR)を使用して、グリフを認識する。グリフの修正変更は非常に小さいので、OCRは修正変更されたグリフおよび未修正変更のグリフに対して同じように良く働く。別の実施の形態では、認識されたグリフは登録され、すなわち、必要に応じてサイズを調整され、データベース441に存在する未変更のグリフと整列され、正規化された座標フレームに対応するピクセルグリッド上に写像される。また輪郭の決定が、その登録済みのグリフに対して行なわれる。
輪郭はデータセグメントを含み、それらのデータセグメントは埋め込まれたシンボルで潜在的に修正変更され、たとえば、データセグメント445が抽出440される。グリフがデータベース441で登録されるので、輪郭のどの部分がデータセグメントかが知られる。そのデータベースを使用して、マスク446が各候補データセグメントの近似位置の回りに形成され、また、そのマスクの外側の輪郭が廃棄される。
たとえば、8接続されているピクセルに基づいた輪郭トレーシング方法が、そのマスクのエリア内の輪郭セグメントを抽出するために使用される。トレーシングは候補データセグメントに最も近いピクセルで始められる。一実施の形態において、或る輪郭セグメントが決定された後、該輪郭セグメントの長さが、未変更のデータセグメントの対応する輪郭セグメントの長さと比較される。輪郭セグメントの長さが所定の範囲[lmin、lmax]外にある場合、本方法は該輪郭セグメントを無視し、マスクのエリア内の別の輪郭セグメントを検知することを試みる。有効な輪郭セグメントが検知される場合、本方法は、たとえば、輪郭データセグメント445をデータベース441内のデータセグメント442の修正変更されたバージョンと比較することによって、埋め込まれたシンボル455を抽出450し、そして一致した修正変更されたデータセグメントに関連したシンボル455を選択する。
最も近い修正変更されたデータセグメント442を決定する詳細が、図5に関連して以下に述べられる。
プロクラステス解析
図5は、この発明の一実施の形態による、データセグメント間のプロクラステス距離540を決定するために、プロクラステス解析530を使用して、抽出されたデータセグメント445をデータベース441からの修正変更されたデータセグメント442、たとえば修正変更されたデータセグメント510、と比較する方法を示す。プロクラステス距離を得るための本方法は以下の通りである。
抽出されたデータセグメントは、n次元のベクトルs525を生成するセグメントの長さに沿ったN個の離散的な点で一様にサンプリングされる。ベクトルsは、
Figure 2011139449
による変換およびスケール正規化によって、ユニットハイパースフィア(単位超球)550、すなわちプレシェイプスフィア(前形状球)、に写像される。ここで、
Figure 2011139449
はN×Nの恒等行列であり、1は1の列ベクトルであり、wはi番目のデータセグメントのプレシェイプ(前形状)であり、単位超球上にある。同様に、本方法は、単位超球上の修正変更されたデータセグメントのn次元のプレシェイプベクトル(前形状ベクトル)vi、j、j=0、1、2、・・・、K−1を得る。
データセグメントiに対応する抽出されたプレシェイプベクトルwは、修正変更されたデータセグメントvi、jのそれぞれに関して回転正規化されて、ベクトル
Figure 2011139449
を生成する。ここで、
Figure 2011139449
である。前形状空間における回転正規化の後、プロクラステス距離は
Figure 2011139449
により決定される。
埋め込まれたメッセージの決定
i番目のデータセグメントにおけるメッセージシンボル
Figure 2011139449
は、
Figure 2011139449
により決定される。
前述の関係により、本方法は、抽出されたデータセグメントにプロクラステス距離において最も近いデータベース内の修正変更されたデータセグメントに関連したシンボルを選択する。いくつかの実施の形態において、シーケンス{b}、m={1、2、・・・、M}はグリフに埋め込まれたメッセージである。ここで、Mは、グリフのデータセグメントに埋め込まれたシンボルの総数である。一実施の形態では、1ビットのみが各形状の内部に埋め込まれる。この場合、同一のビット(0または1)がすべてのM個のデータセグメントに埋め込まれる。このビットはM個のデータセグメントに亘る多数決投票によって回復され、それによって、誤り訂正符号の機能性を与える。
この発明の実施の形態は、劣化したり、裂かれたり、皺が寄ったハードコピー文書からの抽出を含む(但しこれに限定されないが)、以下のメッセージ抽出を必要とする数多くのアプリケーションにおいて使用される:ハードコピー文書のスキャンされたバージョンからの抽出;複数回写真複写された文書からの抽出;ビットマップ画像ファイル(BMP)、JPEGファイル、タグ付けされた画像ファイルフォーマット(TIFF)ファイル、生のイメージデータファイル、あるいは他の画像フォーマット、のような電子イメージ文書からの抽出;マイクロソフトワード、パワーポイント、アイワークキーノート(iWork Keynote)、アイワークページ(iWork Pages)、PDF、あるいはポストスクリプト(PS)ファイルのような電子ドキュメントからの抽出;およびカメラまたはカメラホンを使用して形状を撮影する間に生じた歪みのある状態での抽出。
この発明は或る好ましい実施の形態に関連して記述されたが、この発明の趣旨および範囲内で様々な他の改変および変更を行うことができることが理解されるであろう。したがって、この発明の真実の趣旨および範囲内に入るような、すべての変更例および変形例をカバーすることが、添付のクレームの目的である。

Claims (20)

  1. シンボルをグリフに埋め込むための方法であって、その方法の工程を実行するためのプロセッサを含み、
    前記グリフの輪郭を表わす1組の目印を決定する工程と、
    2つの目印間の、前記シンボルを埋め込むのに適するデータセグメントを決定する工程と、
    前記シンボルが修正変更されたグリフに埋め込まれるように、前記シンボルにしたがって前記データセグメントを修正変更して前記修正変更されたグリフを生成する工程と、
    前記修正変更されたグリフを出力する工程と、
    を含む、方法。
  2. 前記1組の目印は1次的な目印を含み、また、前記データセグメントは微分可能多様体であり、且つ該データセグメントは内部に前記1次的な目印を含まない、請求項1の方法。
  3. 前記修正することは、
    前記2つの目印をアンカーとして選択すること、
    前記データセグメントを該データセグメントの長さに沿って徐々に修正変更すること、
    をさらに含む、請求項1の方法。
  4. 前記データセグメントはベジェ曲線であり、また前記修正することは、
    前記シンボルにより前記ベジェ曲線に沿ってデータセグメントを徐々に修正変更すること、
    を含む、請求項1の方法。
  5. 前記出力することは、修正変更された文書内の前記修正変更されたグリフをレンダリング(表示)することをさらに含み、また、前記シンボルは前記修正変更されたグリフに埋め込まれている、請求項1の方法。
  6. 前記データセグメントの端部で前記2つの目印を選択することをさらに含む、請求項1の方法。
  7. 適応的にサンプリングされた距離フィールド(ADFs)によって前記グリフを表わすことをさらに含む、請求項1の方法。
  8. 前記グリフは構造化されている、請求項1の方法。
  9. 前記グリフを有限のアルファベットから選択することをさらに含む、請求項1の方法。
  10. 前記グリフに埋め込まれるべき前記シンボルはM個以下のシンボルを含むメッセージの一部であり、
    前記方法は、
    K個のシンボルの有限のアルファベットから前記グリフを選択すること、ここで、パラメーターMおよびKは予め決められており、
    前記シンボルを複数のグリフに埋め込むこと、
    をさらに含む、請求項1の方法。
  11. 前記グリフの輪郭を離散的な曲率プロファイルとして決定すること、
    閾値に基づいて前記輪郭の高い曲率の点を決定すること、
    前記高い曲率の点を1次的な目印として選択すること、
    をさらに含む、請求項1の方法。
  12. 任意の1次的な2つの目印間の輪郭上で多角形近似を使用して、2次的な目印を決定することをさらに含む、請求項11の方法。
  13. 2つの1次的な目印間の前記グリフの輪郭を横断して2次的な目印を決定することをさらに含む、請求項11の方法。
  14. 所定の範囲内の長さを有するデータセグメントを選択することをさらに含む、請求項2の方法。
  15. 前記グリフの輪郭の不連続あるいは切れ目および前記グリフの接線における不連続が導入されないように、前記データセグメントを修正変更することをさらに含む、請求項1の方法。
  16. 前記データセグメントを介してほぼ中間に配置されたモードを有するガウス分布に基づいて前記データセグメントを修正変更することをさらに含む、請求項1の方法。
  17. プロクラステス解析に基づいて前記グリフから前記シンボルを抽出することをさらに含む、請求項1の方法。
  18. シンボルをグリフに埋め込むためのシステムであって、
    前記グリフの輪郭を表わす1組の目印を決定する手段と、
    2つの目印間で、前記シンボルを埋め込むのに適するデータセグメントを決定する手段と、
    前記シンボルが修正変更されたグリフに埋め込まれるように、前記シンボルにしたがって前記データセグメントを修正変更して前記修正変更されたグリフを生成する手段と、
    を含むシステム。
  19. 前記1組の目印は1次的な目印を含み、また、前記データセグメントは微分可能多様体であり、且つ該データセグメントは内部に前記1次的な目印を含まない、請求項18のシステム。
  20. 1次的な目印を輪郭の高い曲率の点として決定する手段と、
    2つの1次的な目印間の前記グリフの輪郭に基づいて2次的な目印を決定する手段と、
    をさらに含む、請求項18のシステム。
JP2010276493A 2009-12-30 2010-12-13 メッセージを構造化された形状内に埋め込む方法およびシステム Expired - Fee Related JP5436402B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/650,289 2009-12-30
US12/650,289 US8630444B2 (en) 2009-12-30 2009-12-30 Method for embedding messages into structure shapes

Publications (3)

Publication Number Publication Date
JP2011139449A true JP2011139449A (ja) 2011-07-14
JP2011139449A5 JP2011139449A5 (ja) 2013-11-28
JP5436402B2 JP5436402B2 (ja) 2014-03-05

Family

ID=44187627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010276493A Expired - Fee Related JP5436402B2 (ja) 2009-12-30 2010-12-13 メッセージを構造化された形状内に埋め込む方法およびシステム

Country Status (2)

Country Link
US (1) US8630444B2 (ja)
JP (1) JP5436402B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5586705B2 (ja) * 2012-07-05 2014-09-10 株式会社東芝 オブジェクトにデータを埋め込む装置及び方法、並びに埋め込まれたデータを抽出する装置及び方法
JP2022523651A (ja) * 2019-01-17 2022-04-26 北京悦時網絡科技発展有限公司 ワードコードを生成する方法、ワードコードを認識する方法、及びその装置、コンピュータープログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2753508C (en) * 2011-09-23 2013-07-30 Guy Le Henaff Tracing a document in an electronic publication
US20160124031A1 (en) * 2014-11-04 2016-05-05 Walid G. Morsi Ibrahim Smart multi-purpose monitoring system using wavelet design and machine learning for smart grid applications
US10984173B2 (en) * 2019-02-26 2021-04-20 Adobe Inc. Vector-based glyph style transfer

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006074166A (ja) * 2004-08-31 2006-03-16 Canon Inc 画像処理装置及びその方法
WO2007049340A1 (ja) * 2005-10-25 2007-05-03 Fujitsu Limited 電子透かしの埋め込み及び検出

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6256398B1 (en) * 1998-08-22 2001-07-03 Kenneth H. P. Chang Encoding and decoding a message within an image
US7106332B2 (en) * 2003-03-25 2006-09-12 Mitsubishi Electric Research Laboratories, Inc. Method for converting two-dimensional pen strokes to distance fields
US20060061088A1 (en) * 2004-09-23 2006-03-23 Xerox Corporation Method and apparatus for internet coupon fraud deterrence

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006074166A (ja) * 2004-08-31 2006-03-16 Canon Inc 画像処理装置及びその方法
WO2007049340A1 (ja) * 2005-10-25 2007-05-03 Fujitsu Limited 電子透かしの埋め込み及び検出

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5586705B2 (ja) * 2012-07-05 2014-09-10 株式会社東芝 オブジェクトにデータを埋め込む装置及び方法、並びに埋め込まれたデータを抽出する装置及び方法
JP2022523651A (ja) * 2019-01-17 2022-04-26 北京悦時網絡科技発展有限公司 ワードコードを生成する方法、ワードコードを認識する方法、及びその装置、コンピュータープログラム
JP7130881B2 (ja) 2019-01-17 2022-09-05 北京悦時網絡科技発展有限公司 ワードコードを生成する方法、ワードコードを認識する方法、及びその装置、コンピュータープログラム

Also Published As

Publication number Publication date
US8630444B2 (en) 2014-01-14
JP5436402B2 (ja) 2014-03-05
US20110158464A1 (en) 2011-06-30

Similar Documents

Publication Publication Date Title
US8427509B2 (en) Method for embedding messages into documents using distance fields
Amano et al. A feature calibration method for watermarking of document images
US7536026B2 (en) Image processing apparatus and method
JP4004528B2 (ja) デジタル像符牒の処理方法及びシステム
US20040001606A1 (en) Watermark fonts
US20110052094A1 (en) Skew Correction for Scanned Japanese/English Document Images
JP4310288B2 (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
JP5015540B2 (ja) 電子透かし埋め込み装置および検出装置
EP1667422A1 (en) Printed matter processing system, watermark-containing document printing device, watermark-containing document read device, printed matter processing method, information read device, and information read method
US7287284B2 (en) Information processing method and apparatus, and computer program and computer-readable storage medium
US8275168B2 (en) Orientation free watermarking message decoding from document scans
US10949509B2 (en) Watermark embedding and extracting method for protecting documents
JP5436402B2 (ja) メッセージを構造化された形状内に埋め込む方法およびシステム
US8588460B2 (en) Electronic watermark embedding device, electronic watermark detecting device, and programs therefor
Tan et al. Print-Scan Resilient Text Image Watermarking Based on Stroke Direction Modulation for Chinese Document Authentication.
Mizumoto et al. Robustness investigation of DCT digital watermark for printing and scanning
JP2002199206A (ja) メッセージ埋込並びに抽出方法、装置および媒体
JP2007158413A (ja) 画像処理方法及び装置
Das et al. Hiding information inside structured shapes
Liu et al. Researches on text image watermarking scheme based on the structure of character glyph
CN116977149A (zh) 一种针对文本图像的抗打印扫描数字水印的嵌入及其提取方法
CN114201944A (zh) 字体变形方法及其构成的水印嵌入和提取方法
Kasprzak et al. Printed steganography applied for the authentication of identity photos in face verification
US20100142004A1 (en) Method for Embedding a Message into a Document
JP2007157076A (ja) 画像処理装置及び画像処理方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131009

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131009

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20131009

TRDD Decision of grant or rejection written
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20131101

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131210

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees