JP5802997B2 - 隠された画像のシグナリング - Google Patents

隠された画像のシグナリング Download PDF

Info

Publication number
JP5802997B2
JP5802997B2 JP2013509146A JP2013509146A JP5802997B2 JP 5802997 B2 JP5802997 B2 JP 5802997B2 JP 2013509146 A JP2013509146 A JP 2013509146A JP 2013509146 A JP2013509146 A JP 2013509146A JP 5802997 B2 JP5802997 B2 JP 5802997B2
Authority
JP
Japan
Prior art keywords
image
image data
data
domain
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013509146A
Other languages
English (en)
Other versions
JP2013532406A (ja
JP2013532406A5 (ja
Inventor
ジェフリー, ビー. ローズ,
ジェフリー, ビー. ローズ,
Original Assignee
ディジマーク コーポレイション
ディジマーク コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US12/774,512 external-priority patent/US8401224B2/en
Application filed by ディジマーク コーポレイション, ディジマーク コーポレイション filed Critical ディジマーク コーポレイション
Publication of JP2013532406A publication Critical patent/JP2013532406A/ja
Publication of JP2013532406A5 publication Critical patent/JP2013532406A5/ja
Application granted granted Critical
Publication of JP5802997B2 publication Critical patent/JP5802997B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32154Transform domain methods
    • H04N1/32187Transform domain methods with selective or adaptive application of the additional information, e.g. in selected frequency coefficients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • G06T1/0064Geometric transfor invariant watermarking, e.g. affine transform invariant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32309Methods relating to embedding, encoding, decoding, detection or retrieval operations in colour image data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0052Embedding of the watermark in the frequency domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0601Image watermarking whereby calibration information is embedded in the watermark, e.g. a grid, a scale, a list of transformations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32128Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title attached to the image data, e.g. file header, transmitted message header, information on the same page or in the same computer file as the image
    • H04N1/32133Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title attached to the image data, e.g. file header, transmitted message header, information on the same page or in the same computer file as the image on the same paper sheet, e.g. a facsimile page header
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3269Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3269Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs
    • H04N2201/327Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs which are undetectable to the naked eye, e.g. embedded codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3273Display

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

この技術は、主に、画像−印刷された物体に見られるような−とのスマートフォンのインタラクションに関する。
[関連出願データ]
この技術は、米国特許第6,122,403号、第6,408,082号、及び第6,590,996号、並びに公開された出願第20060115110号、第20070189533号、第20080112596号、第20080300011号、第20090116683号、第20100046842号、第20100048242号、第20100150434号、第20100317399号、第20100261465号、第20110098029号、第20100165158号、第20110098056号、及び第20100228632号に詳述された譲受人の以前の成果に対する改良を含み、さまざまな実施形態においてそれらを利用する。読者は、そのような従来の成果に精通しており、ここで詳細に説明される技術を利用する実装にそのような教示を組み込むことができるものと想定される。
スマートフォンが、ますます「ビジュアル検索(visual search)」アプリケーションで使用されつつある。1つのビジュアル検索アプリケーションは、印刷された画像に(雑誌又は製品パッケージなどに)ステガノグラフィにより符号化された(すなわち、隠された)デジタルウォーターマークデータを復号し、電話が関連する情報及びサービスにつながるか、又はその他のアクションを行うことを可能にする。例示的なデジタルウォーターマーク技術及びビジュアル検索アプリケーションは、上に挙げた特許文献に詳述されている。
米国特許第6,122,403号
遠近の歪み(perspective distortion)が、デジタルウォーターマークデータの適切な復号を妨げる場合がある可能性がある。つまり、ウォーターマークが付けられた物体が(例えば、15度又は30度を超える)比較的大きな軸外れの(off−axis)角度でスマートフォンにより撮像される場合、隠されたウォーターマークデータは、復号アルゴリズムがその隠されたウォーターマークデータを認識できないほど視点の向いている角度(perspective viewing angle)によって、歪められる可能性がある。
関連する問題は、消費者の混乱である。消費者がスマートフォンを使用して雑誌のページを撮像し、ウォーターマークが即座に検出されない場合、それはページがスマートフォンが反応すべきウォーターマークを含まないからであろうか。それとも、それは雑誌のページが不適当な遠近感で示されるからであろうか。
こうしたことから、正確なスマートフォンの配置を必要とせずにウォーターマークデータの存在を消費者に知らせることが望ましい。
消費者が遠近の歪みが比較的少ない(例えば、15度又は30度未満)画像を撮ることを補助することも望ましい。
この技術の一態様によれば、隠されたデータの存在が、30度、45度、若しくは60度、又はそれらよりも大きな角度を超える視点の角度(perspective angle)に妨げられることなく信頼性高く検出される。
この技術の別の態様によれば、スマートフォンが、撮影された画像が比較的小さな遠近の歪みしか持たないようにユーザがスマートフォンを位置付けるのを補助する(例えば、ディスプレイスクリーン上の)フィードバックを提供する。
この技術の上述の及び多くのその他の特徴及び利点は、添付の図面を参照することによって進行する以下の詳細な説明からより容易に明らかになるであろう。
さまざまなキーによって符号化された複数のホットスポット領域を含む画像を示す図である。これらは、YB−ドーム空間クロマキー(YB−Dome spatial chromakey)とみなされることができる。示されているのは、空間的に重なり合う「アナログの」クロマ符号化をされた(chroma−encoded)領域である。これらは、人の目には実質的に「不可視」であるが、デジタルウォーターマーク検出器によって見られる。 スマートフォンがインタラクションして異なる楽音を生成することができる図1と同様の別の画像を示す図である。 図1Aの画像と併せて使用され得る方法の流れ図である。 図1の画像内の1つ又は複数のホットスポット領域の検出によってスマートフォンにおいてトリガされ得るさまざまな挙動のうちの一部を示す図である。示されているのは、オーディオモードとHotMap(GLO)モードの両方である。 この技術にしたがって符号化された画像とのユーザのインタラクションが動きを使用することができることを示す図である。 空間周波数ドメインにおける画像の輝度及び2つの色差(chrominance)チャネルへの分解と、Y−Bチャネルにおけるキーの埋め込みとを示す図である。特に詳細に示されているのは、そのような信号がどのようにして特定の周波数帯域を−既に存在する図版と分け合う必要なしに−占有することができるのかを含めた、YB−ドーム信号空間(YB−Dome signal space)の割り当てである。 画像の空間周波数に応じた、図5の3つのチャネルに対する人間の視覚系の感度を示すグラフである。 単一の色差チャネル内に符号化され得る複数の異なるキーを示す図である。 スマートフォンの視野の部分的領域が画像内のキーを検出するために使用され得ることを示す図である。 キーが画像の遠近の歪み又はその他の歪みによってどのようにワープされ(warped)、そのような歪みが判定されることを可能にすることができるのかを示す図である。 キーが画像の遠近の歪み又はその他の歪みによってどのようにワープされ(warped)、そのような歪みが判定されることを可能にすることができるのかを示す図である。 キーを表すために使用され得る、フーリエ空間における区分けされた弧の中の異なるスペクトルの信号エネルギーを示す図である。 キーを表すために使用され得る、フーリエ空間における区分けされた弧の中の異なるスペクトルの信号エネルギーを示す図である。 キーが、調波関係(harmonic relationship)を持つことができ、2進符号化に関連して使用されることができることを示す図である。 キーが、調波関係(harmonic relationship)を持つことができ、2進符号化に関連して使用されることができることを示す図である。 キーが、調波関係(harmonic relationship)を持つことができ、2進符号化に関連して使用されることができることを示す図である。 フーリエ空間における別のキーの表現を示す図である。 空間周波数ドメインにおけるさらにその他のマーカー信号を示す図である。 図13のマーカー信号を含む印刷された物体の混合したドメインの図である。
図1に示されるように、画像10は、適切な装備が整ったモバイルデバイス(例えば、スマートフォン/セル電話)によって感知され得るが、人間には感知不可能である1つ又は複数の領域(CK1、CK2など)を定義するようにこの技術の一態様にしたがって符号化される。そのようなモバイルデバイスがこれらの領域のうちの1つを感知するとき、そのようなモバイルデバイスは、それに応じてアクションを行う。
画像10の内容は、任意であることができる。(隠された領域を除く)詳細は、説明を明瞭にするために図示されていない。
領域は任意の形状である可能性があり、ほんの数個だけが示されている。示されるように、それらの領域は、階層化されるようにして重なり合うことができる。各領域は、その領域に関連するキー(例えば、CK1、CK2など)を有する。好ましい実施形態は色差に基づく埋め込みの構成を使用するので、これらのキーは、クロマキーと呼ばれることがある。しかし、その他の埋め込みの構成が、代替的に使用され得る。
(図面の表題の「YB」は、黄−青を指す。「ドーム」は、以下でさらに詳述されるように、キーが明示されるフーリエ空間内の弧状領域を指す)。
図1Aは、象徴的な硫黄島の写真に隠されているが、しかし、説明の目的で目に見えるように示される7つの領域を使用する例示的な図を示す。最も左の領域がスマートフォンによって感知されるとき、そのスマートフォンは、Cの高さの音符を鳴らす。隣接する領域は、電話が「E」の高さを鳴らすようにする。隣の領域は、同様に「G」の高さを鳴らすようにする。
最も上の領域は、同様に、電話が「C」の高さの音符を鳴らすようにする。しかし、その下は、電話が音符E♭を鳴らすようにする領域である。その下は、上述の「G」の領域である。
ユーザが適切にプログラムされたスマートフォンを左から右に画像を水平に横切って電話をさっと動かし、したがって、電話のカメラが領域の水平な行を順に「見る」場合、Cメジャーコード進行が、鳴らされる。反対に、ユーザが画像内の示された領域を垂直に下に向かって横切って電話をさっと動かす場合、Cマイナーコード進行が、鳴らされる。
より具体的には、この例において、領域は、4つの異なるキーを用いて符号化される。最も左の領域及び最も上の領域は両方とも同じ音符に対応するので、同じキー(CK1)が、それらの領域の両方に対して使用される。異なるキーCK2、CK3、及びCK4が、その他の3つの領域に対して使用される。
示された例において、画像10は、補助データの複数ビットのペイロード(例えば、32ビット又は128ビット)をステガノグラフィにより伝達するために−ただし、これは常に必要とされるわけではない−知られている方法でデジタルウォーターマーク(DWM)も付けられる。これらの複数のビットは、どの応答がどのキーに関連付けられるべきかを決定する際にスマートフォンによって調べられるデータ構造を識別することができる。
複数ビットの補助データによるデータ構造の識別は、さまざまな手段による可能性がある。1つの手段は、ローカルの若しくはリモートのテーブル、又はデータベースのレコードへのポインタ(例えば、アドレス)である。この場合、データ構造は、CK1が検出される場合、電話が「C」の音符(すなわち、262Hz)を鳴らすべきであることを示す。完全なテーブルは、以下のように電話に異なるキーに応答するように命じることができる。
Figure 0005802997
このテーブルは例示的であるに過ぎず、例示的な応答は、−単に説明の都合で−よく起こる可能性がある応答よりも基本的である。
音は、対応するキー領域の最初の検出から始まる決まった継続時間、例えば、1秒間鳴る可能性があり、又は音は、領域がスマートフォンのカメラの視野の中にある限り続く可能性がある。後者の場合、カメラが示された領域の一部−又はすべて−を見ることができるようにカメラを位置付けることによって、複数の音のコード(chord)が鳴らされることができる。コードは、カメラが画像から離れるように動かされるときにより多くの音で拡大され、カメラがより近くに動かされるときにより少ない音に分解する。
どの応答が異なるキーに関連付けられるべきかを示すための補助データの使用は、「決まった」画像を用いる場合でさえも、ユーザエクスペリエンスの簡単で動的な再プログラミングを可能にする。例えば、単純に、例示的な補助データ(ウォーターマーク)が指すテーブル内のデータを変更することによって、画像は、全く異なる応答の組を−すべて画像の修正なしに−トリガすることができる。
たった今説明された方法を詳細に示す流れ図が、図2に示される。
図3及び図4は、スマートフォンのカメラが画像内の異なる隠された領域を検出し、電話が動かされるときに異なる出力を生成することができるたった今検討された特徴をさらに示す。
図3の「GLO」は、Graphic Latent Overlayの頭字語である。この技術は、公開された特許明細書第20080300011号及び第20090116683号を含む文献に詳述されており、携帯電話で撮影された画像内の第1の特徴(通常はステガノグラフィにより符号化された特徴)の検出が、電話のスクリーン上の第2のグラフィカルな特徴の表示−第1の特徴が検出された画像上に重ねられる−をトリガする構成を指す。場合によっては、重ねられる特徴は、スクリーン上で、電話の視野内の第1の特徴の位置に依存する位置に示される。重ねられる特徴は、第1の特徴の明らかなワープに対応してワープされる可能性もある。
関連する技術が、特許公報第20110098029号及び第20110098056号に詳述されており、これらの特許公報において、そのような重ねられる特徴は「飾り(bauble)」と呼ばれる(並びに撮影された画像の可視の特徴及び/又はステガノグラフィによる特徴に基づく可能性がある)。
したがって、キー領域が感知されるときに音符を奏でる代わりに、電話は、撮影された画像にグラフィカルな表示を重ねることによって応答することができる。
もちろん、音符を奏でることと、グラフィカルな表示を重ねることとは、キー領域の検出がトリガすることができる無数の挙動のうちの数個である。任意の考え得るアクション又はスクリプトが、(「ホットスポット」とみなされ得る)隠された領域のうちの1つ又は複数が感知されるときに同様にトリガされることができる。
ホッケーチームのメンバーの写真を特定の例として考える。各選手の顔の楕円形領域が、異なる隠されたキーCK1〜CK20によって印を付けられる。ユーザがスマートフォンのカメラを特定の選手の顔に向けるとき、対応するキーが検出される。ウォーターマークも、画像から検出される(及び画像全体に広がる可能性がある)。ウォーターマークのペイロードは、キーCK1〜CK20のそれぞれに関するエントリを有する、上の表1のようなテーブルを指す。そして今度は、このテーブルが、NHLのウェブサーバ又はクラウドに存在する、そのそれぞれの選手に関するシーズンハイライトを示すFlashビデオの表示へのリンクを記憶することができる。ユーザがチームの写真の中の異なる顔を見るためにスマートフォンのカメラを動かすとき、昨シーズンからの異なるビデオの再生が、ユーザの電話で実行される。
(ウォーターマークのペイロードは、その他の目的で働く可能性もある。例えば、ペイロードは、複数のキーが撮影された画像内で検出される場合に応答をしないようにスマートフォンに命令する1つ又は複数のフラグビットを含み得る。代替的に、それらは、カメラを画像内の1つの特定の特徴(顔)にもっと近づけるように向けるようにユーザに促すようにスマートフォンに命じることができる。すべての従来技術のウォーターマークのシグナリングの使用も、この構成と併せて使用され得る)。
通常、画像は空間(又はピクセル)ドメインで知覚されるが、当業者によく知られているように、いくつかのその他の表現も有用である。概して、これらのその他の表現は、「変換ドメイン(transform domain)」と呼ばれる。1つのよく知られている変換ドメインは、フーリエ空間(画像で使用されるときは、通常、空間周波数ドメインと呼ばれる)である。例えば、画像(全体か、又はより普通には正方形の領域、例えば、8×8ピクセル若しくは32×32ピクセルに分割されるかのいずれか)に、例えば、離散フーリエ変換(DFT)又は離散コサイン変換(DCT)を適用することによって、画像は、係数−それぞれが対応する空間周波数成分の振幅を示す−の組に分解される。結果として生じる情報の組が、図5の複素半平面の座標系に示され得る。
図5の左の部分は、サンプル画像(例えば、既に示された硫黄島)の代表的な空間周波数ドメインの表現を示す。この画像は、補助データを伝達する従来技術のデジタルウォーターマークによって符号化される。(好適なウォーターマークが特許第6,590,996号に詳述されている)。ウォーターマーク信号のエネルギーは、画像のエネルギーの残りの間に散在させられ、図5においては別々に識別できない。
画像は、輝度並びに2つの色差チャネル:R−G(赤−緑)及びY−B(黄−青)−それらのチャネルのそれぞれがそのチャネル独自のフーリエ空間表現を持つ−などの成分画像平面に分割されることができる。フーリエ空間内のこれらの3つのチャネルが、図5の右側に示される。
示された実施形態において、画像の領域へのキーの符号化は、色差チャネルのうちの1つ(例えば、Y−B)にエネルギーを追加することによって行われる。これは、人間の視覚系(HVS)が輝度に対してよりも色に対して感度が低いので、好ましくない可視的影響なしに行われることができる。
これは、周期/度(cycles per degree)で表された、空間周波数に応じた、輝度、赤−緑の色差、及び黄−青の色差に対するHVSの感度をプロットする図6に示される。(このグラフは、12インチの距離から見て集められたデータに基づく)。見て分かるように、HVSの感度は、10周期/度(cpd)を超える色差の空間周波数で急激に落ち込み、20周期/度で劇的に下がっている。25又は30周期/度をよりも上の感度は、実質的に0である。
対照的に、カメラで使用されるイメージセンサーは、通常、そのような空間周波数の色差の特徴を区別することができる。
したがって、図1又は図1AにおけるCK1などのキーを画像領域に符号化するために、エネルギーが、望ましくは、−概して、影響が人間の観察者には分からないが、光学式センサーのデータからは容易に検出され得る−10、20、25、又は30cpdを超える周波数で、黄−青の色差チャネルに追加されることができる。
好ましい実施形態において、追加されるエネルギーは、示された周波数以下が除外される必要はない。しかし、追加されるエネルギーのほとんど(例えば、50%、75%、95%、又は98%を超える)が、その範囲内にあることが望ましい。
この実施形態において、及びその他の実施形態において、追加されるエネルギーの大きさ(magnitude)は、所望の可視性(又は不可視性)のレベルを達成するように調整されることもできる。その他の実施形態において、追加されるエネルギーの大きさが視覚的に問題にならないほど十分に低い場合は、主に10cpd未満の周波数の信号エネルギーが使用され得る。
フーリエ空間における好適な符号化の一例が、黒い帯によって図5の右下に示される。この追加される信号エネルギーは、(位相を含む)これらのスペクトルの周波数の既に存在する画像のエネルギーよりも支配的になるが、通常、その影響は人間の観察者には実質的に感知不可能である。影響は、色差空間の領域を切り出して、それを隠されたキーを表すことに割り当てることである。このように符号化されるので、適切な装備が整ったスマートフォンの検出器が、画像内の隠された領域の存在を素早く発見し、その範囲を判定し、そのような発見に応答することができる。
多くの場合、図1のCK1、CK2などの異なるキーを区別することができることが望ましい。これは、(位相を含む)選択された(例えば、Y−B)色差チャネルの信号エネルギーの異なるフーリエドメインの区域で異なるキーを表すことによって行われ得る。そのような構成が、図7の右上に示される。
特に、この空間ドメインのプロットは、10個のキー150a〜150jを示す。図1において、領域CK1は、キーストーン形状のフーリエ区域150aに対応する信号エネルギーをその画像領域に追加することによって符号化されることができる。同様に、画像領域CK2〜CK5は、キーストーンの区域150b〜150eによって示される空間周波数のエネルギーを追加することによって符号化されることができる。5つの追加的なキーが、150f〜150jとラベル付けされた空間周波数の区域に対応するエネルギーを追加することによって表され得る。(検討されたプロットは10個の異なる鍵を包含することが認識されるであろう。画像の特定の領域は、必ずしも、フーリエ空間内のこの示された信号の構成を有するとは限らない。むしろ、キーストーンの特徴のうちの1つ又は数個だけが存在する可能性が高い)。
やはり、図面は、これらの隠された信号の役に立つ次元(dimension)である位相を示さない。位相成分は、これらのキー(すなわち、増加する信号対雑音比)の検出に確実性を与える。
1つの特定の実施形態において、異なるキーは、(+1/−1に類似する)反対の位相の極性である可能性がある。1つのキーCK−aが、キーストーンの区域150aにわたる特定の位相プロファイル(phase profile)を伴ってその区域によって表される可能性があり、別のキーCK−bは、同じキーストーンの区域150a内であるが、キーCK−aに対して位相が180度ずれた位相プロファイルを有するエネルギーによって表される可能性がある。これは、キー空間を2倍にする結果となる(例えば、10個の区域150a〜150jが20個の区別可能なキーを表すことができる)。
さらなる複数キー構成が、図7の右下に示される。ここでは、フーリエ空間内のN個の互いに直交する信号が、使用される。例示を目的として、簡単な例は、1つの信号が画像周波数(image frequency)fの正弦波であることである。別の信号は、同じ周波数の余弦信号を含み得る。第3の信号は、周波数2fの正弦信号を含み得るなどである。(フーリエ空間内の直交信号は簡単な図面に表すのが難しいが、そのような信号の設計は、当業者の能力のうちである。1つの見解によれば、2つのキーは、それらのキーの位相プロファイルの積が0になる場合、直交している)。
概して、画像内のすべてのキーは、通常、描画された画像においてキーが人間に感知されないようにするレベルの同じ大きさで符号化される。すべてのキーにわたって一様な大きさを有することは、1つのキーの検出が、その他のキーの存在を見分けるのを助けるために使用され得る大きさの情報を提供するので、検出において有用である可能性がある。
一部の実施形態において、特定のキーが、異なる大きさを有する可能性がある(例えば、それらのキーが、部分的に「オン(on)」である可能性がある)。これは、符号化する空間をさらに拡張するために使用され得る。例えば、キーCK−cが、キーCK−dの大きさの半分である大きさを有する可能性があるが、それらのキーは、スペクトルの周波数の内容及び位相プロファイルにおいてその他の点では同じである。単一のキーの2値(例えば、+の位相及び−の位相)の代わりに、4値及びその他の多値シンボルが、使用され得る。
異なる大きさの間の関係が検出器によって知られている(例えば、一部のキーが100%「オン」であり、その他のキーが50%「オン」であり、さらにその他のキーが25%「オン」である)場合、この知識は、キーを区別する際に基礎としてやはり使用され得る。(これらは、「アナログキー」とみなされることができる)。
複数のキーを使用するシステムにおいては、それぞれのキーが、異なるアクション(例えば、図1Aの例における異なる音)をトリガすることができる。さらなるアクションが、複数のキーが画像領域に重ねられるときに(例えば、図1においてCK5がCK1に重なり合う場合に)トリガされ得る。したがって、10個のキーのシステムにおいて、10個の個々のキーに対応する10個の応答が存在する可能性がある。9個のさらなる応答が、キー1がキー2〜10のうちの1つを重ねられる領域に対応する可能性がある。8個のさらなる応答が、キー2がキー3〜10を重ねられる領域に対応する可能性がある。7個のさらなる応答が、キー3がキー4〜10と共存する領域に対応する可能性があり、以下同様である。したがって、最大2つのキーの階層だけを想定するシステムにおいては、55個の異なる状態が定義され得る。(3つ以上のキーが重ねられる場合、当然、あり得る状態の幾何級数的増加が起こる)。
キーが異なる大きさを有する場合、キーによってトリガされる応答は、それに応じて変わり得る。例えば、図1Aの音の例において、キーCK3がその他のキーの半分の大きさである場合、そのキーCK3の対応する音は、その他のキーによってトリガされる音の半分のボリュームで鳴らされることができる。
スマートフォンの検出器は、その検出器が遭遇すると予測する異なるキーに関するフーリエドメインのテンプレートを適用する−隠された信号の存在を探す−ことができる。これは、それぞれのキーのテンプレートのそれぞれとの乗算を実行する−結果として得られる出力信号が閾値を超えるかどうかを判定する−相関検出器を含み得る。
(1つ又は複数の)テンプレートは、探索される(1つ又は複数の)キーの正確な境界よりもフーリエ空間の多くを包含することができ、画像が歪んでいる(その結果、フーリエ空間内のキーが歪んでいる)場合のキーの検出を可能にする。
概して、スマートフォンのカメラは、長方形の視野(例えば、2048×1536ピクセル)を有する。場合によっては、スマートフォンのカメラがこの視野の部分的領域内のキーにのみ応答することが望ましい。そのような構成が図8に示され、この構成においては、カメラの視野全体は画像フレーム190であるが、応答は、部分的領域192内で見つかったキーによってのみトリガされる。部分的領域の形状は任意であることができ、(幅約250ピクセル×高さ約900ピクセルの)示された長方形は例示的であるに過ぎない。
別の構成において、区域192は円又は楕円である。さらに、領域192からのサンプリングされた画像データの使用を制御するソフトウェアが、最も鋭敏な検出のために領域の中央ではすべてのピクセルを用い、領域192の周辺近くではピクセルのより密度の低いサンプリングを使用し、したがって、感度又は鋭敏さが次第に弱まる中心フィルタ(foveal filter)を適用する可能性がある。(より遠いピクセルを考慮から外す代わりに、中心から離れたピクセルのグループが平均されて、中心効果(foveal effect)、すなわち、区域の中心の密なピクセル情報及びより遠い距離のより低解像度のピクセル情報を生じることができる)。
(そのような中心フィルタリングは、特徴及び物体認識、マシンビジョン、ウォーターマークの復号、フィンガープリントの計算、画像に基づく文脈の決定、並びに上に挙げた特許公報で詳述されたその他の種類の処理を含む多くの異なる種類の画像処理の前置きである可能性がある)。
この技術を使用するカメラを備えた検出器は、キー領域の空間的広がりを識別することができ、例えば、10個の撮像されたピクセル以下(例えば、5〜10「ワクセル(waxel)」−ウォーターマーク信号の要素)の精度で領域の境界を識別する。したがって、検出器は、隠されたキーを「撮像」することができ、例えば、画像内のそれらの隠されたキーの位置の仮想的なマップを生成する。
キーの幾何学形状が前もって分かっている場合(例えば、キーが円、又は正方形、又は正三角形である場合)、撮影された画像におけるそれらのキーの形状が、画像の任意の軸外れの観察を特徴づけるために使用されることができる。そして今度は、この情報が、画像内に符号化された任意のウォーターマーク信号の検出を支援するために使用されることができる。
例えば、デバイスのプロセッサは、知られているキーの形状の歪みに対応して画像データを再サンプリングすることができる。キーが同じ長さの2つの平行な辺を含むことが分かっているが、第1の辺が撮影された画像においては第2の辺よりも50%短いように見える場合、第1の辺に沿った画像の点が、第2の辺に沿って2倍の空間周波数でプロセッサによって再サンプリングされることができる−補間されたサンプリングレートが中間の平行な線に沿って使用される。次に、ウォーターマークの復号プロセスが、再サンプリングされた画像に対して適用されることができる−この再サンプリングされた画像からは、遠近のワープ(perspective warp)のこの態様が実質的に取り除かれる。
遠近感を扱うことに対するより洗練されたアプローチは、幾何学的なキーの形状の知識を必要としない。むしろ、そのアプローチは、キーのフーリエドメインの表現の知識に依存する。
説明するために、元の画像が、図9Aに示されるフーリエドメインの形状を有するキーを含み得る。画像が軸外れの視点から撮影される場合、キーの形状は、膨らむ可能性があり、例えば、図9Bに示されるフーリエドメインの表現をもたらす。図9Aから図9Bへの変形は、カメラによって見られる画像の明白な変形(例えば、アフィンワープ及び遠近のワープ)を明らかにする。
(例えば、スマートフォンの)プログラムされたプロセッサは、フーリエ空間において弧状の特徴の力まかせ探索を実行し、次に、発見された弧の形状から画像の対応するワープパラメータを探ることができる。別のアプローチは、特許第6,408,082号及び第6,590,996号で詳述された技術と同種の技術を用いて、フーリエ−メリンに基づく処理を使用してフーリエドメインの画像データ内の歪んだ弧の区域を見つける。
詳細に説明されたキーは、通常、フーリエ空間内で目立ち、−少なくとも大雑把に−そのような方法によってワープパラメータを容易に決定することを可能にする。画像を見る視点の大まかな感覚がそれによって識別され(例えば、5度又は10度以内まで)、画像データが、それに応じて、例えば、軸が合ったカメラの視点から撮影されたかのように再サンプリングされることができる。次に、(例えば、たった今挙げられた特許に示されたとおりに)通常はデジタルウォーターマーク信号に見られるキャリブレーション信号が、再サンプリングされた画像内の残りの小さな歪みを取り除き、大きなペイロードのウォーターマークデータの正確な読み取りを可能にするために使用されることができる。
当業者は、挙げられたウォーターマーク技術のキャリブレーション信号が、探索空間アクセラレータ(search−space accelerator)として働くことを認めるであろう。本明細書において詳述されるキー技術は、補足的なキャリブレーション信号とみなされることができ、検出器は、軸外れのカメラアングルを探索するように調整されることができる。この目的のキーは、フーリエY−B大きさ空間(Fourier Y−B magnitude space)において対にされた互い違いの真珠の首飾り状の特徴(すなわち、図12に示されるような、フーリエドメインにおけるピークの2つの同心の輪)の形態をとる可能性がある。そのとき、検出器は、テンプレート−画像が軸外れの段階的な角度で(例えば、0度〜45度まで5度刻みで)見られる場合にこれらのキーの特徴がフーリエドメインに現れるときにこれらのキーの特徴(又はその他の知られているキーの特徴)に対応し、フーリエ−メリン分析を使用する−の群を適用することができる。
このオペレーションは、クラウドに基づくプロセッサによる、例えば、250ms以下の高速な実行に好適である。スマートフォンは、カメラの視野の中心から32×32ピクセルの領域をクラウドのプロセッサに(ピクセルドメインでか、又はフーリエ空間への変換後かのいずれかで−おそらくは、ウォーターマーク信号を壊さない圧縮をして)送信することができる。そして今度は、クラウドのプロセッサが、上述のテンプレートを受け取られたデータに適用してキー信号を見つけ、見ている角度の推定値を電話に返す。次に、電話は、推定された見ている角度に応じて画像を再サンプリングし、上述のウォーターマークの復号プロセスを適用してウォーターマークのペイロードを抽出する。
(電話とクラウドの間の処理のその他の分担が同様に可能であり、例えば、クラウドが、ウォーターマークのペイロードの抽出を含む処理のすべてを行う)。
一部の実施形態において、キーは、画像/文書の認証を補助するために「壊れやすい」性質を持つように設計される可能性がある。例えば、隠されたキーが、検出するための撮像センサーの高周波数の限界にあるか、又はその近くにあるスペクトルの周波数によって構成される可能性がある。これらの信号の大きさは、キーが元の画像内でかろうじて検出可能であるように調整されることもできる。そのような元の画像がスキャン及び再印刷される場合、この小さな振幅及び/又は高い周波数のデータは、劣化する可能性が高く、したがって、そのデータはもはや検出可能ではない。CCD、CMOS、及びその他のイメージセンサーが、組み合わされるシステムにおいて所望の性質を実現するために、そのような技術を意識して設計されることができる。
この技術の1つの応用は、例えば、金庫を開けること、アラームを設定することなどに通常使用される種類のものに類似したキーパッドである。例えば、スマートフォンは、印刷媒体又はその他のスクリーンから1枚の画像を撮影し、その画像から復号されたウォーターマーク又はその他の補助データを参照することにより、タッチパッドを示すグラフィックを重ねることができる。ユーザは、スクリーン上に表示されたさまざまなボタンに触れることができる。タッチセンシティブスクリーンは、これらのタッチに対応する撮影された画像内のピクセル領域が判定されることができる出力座標データを提供する。撮影された画像内のこれらの領域で検出された隠されたキーが認識され、一連のそのようなキーが、ユーザによって入力された「組み合わせ」又はその他の符号(例えば、CK4、CK2、CK5、CK9)を定義する。入力された符号が記憶されたシーケンスに一致する場合、アクションが行われる可能性がある。又はその他のアクションが、キーストロークに応じて行われることができる(例えば、公開された出願第20100261465号で詳述されたように、サーモスタットを再プログラミングする)。
変更実施形態においては、隠されたキーの輪郭が、撮影された画像から識別され、グラフィックの重なりとして目に見えるようにされる。やはり、これらは、所望の順序で触れられることができる。ウォーターマークと併せてキーを参照することによって、応答のアクションが行われ得る。
さらなる変更形態においては、グラフィックの重なりが、さらなるキーが触れられるときに変化することができる。
詳述された構成は、デジタルウォーターマークを用いて、感知されたキー領域に対応するアクションが決定されることができる補助情報を伝達するが、これは必須ではない。その他の伝達手段、例えば、RFIDチップ、バーコード、ヘッダデータなどが、利用され得る。代替的に、画像のフィンガープリントが計算され、画像を識別するためにデータベース内の基準情報とマッチングされることができ、この識別は、キーと適切な応答の間の関連付けを決定することができるメタデータを識別するためにも役立つことができる。(画像/映像のフィンガープリンティングの例は、特許出願第7,020,304号(Digimarc)、第7,486,827号(Seiko−Epson)、第20070253594号(Vobile)、第20080317278号(Thomson)、及び第20020044659号(NEC)に詳述されている)。
さらにその他の構成においては、補助データは必要でない。その代わりに、異なるキーが、スマートフォン又はその他の場所に記憶された−補助データによって指し示されるか、又はその他の方法で示されるのではない−データテーブルなどの知られている基準によって意味を与えられる可能性がある。キーが検出されるとき、どの挙動が実行されるべきかを決定するために基準が調べられる。
詳述された構成は、概して、フーリエ変換(例えば、FFT)を使用するが、任意の数のその他の画像変換が、代替的に使用され得る。例は、DCT、ウェーブレット、ハール、ハフなどを含む。
図1Aに示されたコード進行などの音のシグネチャ(tonal signature)が、画像の信頼性又はその他の属性の迅速な検査として使用され得ることを認識されたい。
キーは隠されるか又は不可視であると言及されたが、これはすべて、特定の用途のニーズを満たすように調整され得る程度の問題である。例えば、一部の用途では、ある程度の可視性が許容される。
本明細書において使用されるとき、「主に」は、半分(50%)を超えることを意味する。「大部分は」は、75%を超えることを意味する。「実質的に」は、95%を超えることを意味する。「ほぼ完全に」は、98%を超えることを意味し、「完全に」は、100%を意味する。
区分けされた弧領域の例は、図5及び図6にて黒一色に示された領域である。これらの区域は、複素平面の原点を含まない−したがって、軸のまわりの鏡像を得る場合、中心に隙間が存在する。言い換えれば、区分けされた弧領域は、概して、原点から非ゼロの距離離れた−最小の画像周波数に対応する−境界の部分となる弧のセグメントによって部分的に特徴づけられる。実際には、区分けされた弧領域は、同様に、原点からの有限の半径である−最大の画像周波数を示す−外周によって境界を定められる。同様に、区分けされた弧領域は、概して、横(u)軸又は縦(v)軸のいかなる部分も含まない。特定の実装においては、1つの区分けされた弧領域が存在する可能性があり、又はいくつかの区分けされた弧領域が存在する可能性がある。(多くの場合、そのような領域は、v軸などの軸のまわりに鏡像を得ることができる)。
加えられる/減じられる信号エネルギーは、通常、区分けされた弧領域内に配される。しかし、その信号エネルギーは、領域を完全に占有する必要はない。例が、図10Aの変換ドメイン平面100に示される。弧領域102は、内周104及び外周106によって定義される。領域102は、原点108を含まない。領域102は、横軸110又は縦軸112も含まない。この区分けされた弧領域102内にあるのは、スペクトルのエネルギーが増やされた1つ又は複数の空間周波数の区域114である。変更実施形態においては単一の周波数が使用される可能性があるが、概して、それぞれのそのような区域は、2つ以上の周波数(例えば、インパルス関数)を含む。通常、各区域は、変換平面において少なくとも1つの、そして通常は2つの方向に広がりを持つ。
図10Aに示される変換ドメインの信号エネルギーの区域は、(例えば、軸116のまわりに)特定の対称性を持つが、これは必須ではない。例えば、図10Bは、別の構成を示す。さまざまな場合に、非対称の構成が望ましい。
場合によっては、画像を符号化する際に使用されるさまざまな空間周波数の区域は、調波関係を有する可能性がある。図11A及び11Bは、1つのそのような構成を示す。図11Aは、第1の区域130を示す。図11Bは、第2の区域132を示す。区域132は、区域130の周波数の2倍である周波数を含む。さらなる調波が、同様に使用され得る。
同様に、異なる区域の使用が、2進信号符号化のために使用され得る。区域130が、例えば、10進数の「1」に対応する最下位ビットを表す可能性があり。区域132が、例えば、10進数の「2」に対応する最下位から1つ上のビットを表す可能性があり。したがって、図11Cのように両方の区域に信号エネルギーを追加することは、10進数の「3」に対応する。
変形実施形態において、1つの色差チャネルに追加された信号エネルギーは、その他の色差チャネルから信号エネルギーを減じることによって相補的な方法で釣り合わされる。そのような形態の埋め込みは、公開された特許出願第20100150434号にさらに詳述されている。このアプローチは、可視的な劣化なしにより低い周波数の色差信号の使用を可能にし、上述の教示にしたがって処理されるときに検出器における増大された信号対雑音比をもたらす。(この技法による映像においては、相補的に減じるオペレーションは、同じフレームに対して、又は映像シーケンスの次のフレームに対して適用され得る)。
画像全体に単一のキーで印を付けることができるが、画像の一部がそのように印を付けられることがより典型的である。通常、画像領域の20%未満が、任意の特定のキーで印を付けられる。より典型的には(例えば、図1及び図1Aに示されるように)、連続的なキー領域は、画像フレーム全体の10%、5%、3%、又は1.5%未満を含む。
実際の応用においては、Adobe Illustratorなどの図版オーサリングツールが、画像にキーを追加するためにおそらく使用される。隠されたキーは、ユーザに形状を示すために、破線の輪郭、区別のつくクロスハッチングなどによってユーザのスクリーン上に可視的に表され得る。これらは、Adobeによって普及されたようなツールを用いて知られている方法でドラッグされ、サイズ変更されることができる。オーサリングソフトウェアは、隠された形態のキーを含め、スクリーン上に画像を描画する−任意の色空間の変換、及び印刷のワークフローに固有のその他の歪みを近似する−印刷プレビュー機能をさらに含む可能性がある。(印刷プロセスの種類又は忠実度、例えば、高解像度/最高の彩度、低解像度/低い彩度などに応じて、異なる印刷プレビューオプションが提供され得る)。ソフトウェアは、2つのビュー(オーサリング及び印刷プレビュー)が横に並んで表示される表示モードを含み得る。
追加されたキーを画像から感知し、定量的データをアーティストに返す対応する試験アプリケーションソフトウェアが、アーティストによって使用されるスマートフォン用に提供され得る。図版に対して変更がなされるとき、このソフトウェアアプリケーションは、即座にフィードバックを提供することができる。診断ウィンドウが、スマートフォンのスクリーン又は(電話が無線で又はUSBなどによってリンクされ得る)オーサリング端末に表示されることができる。これらの診断ウィンドウは、キー信号の強度、キー領域の外見上のサイズ、キーの検出の信頼のレベルなどを示すことができる。
混合したドメインの表示
この技術の別の態様によれば、スマートフォンは、カメラによって撮影された未処理の画像と、カメラで撮影された画像に基づく(例えば、空間周波数又はフーリエドメインの)変換ドメインの情報との両方を含む表示を示す。
上の検討は、ステガノグラフィによるウォーターマークの検出器がウォーターマークが存在するかどうかを判定するのを支援するために画像に符号化され得る例示的な基準信号を詳細に示した。それらの基準信号は、それらの基準信号を普通の人間の観察者には感知できないようにする−十分に高い周波数及び/又は色差で−空間周波数ドメインに符号化される。
この技術のさらなる態様によれば、特定のそのような変換ドメインに基づく情報が、観察者に見えるようにされる。
図13は、印刷されたホスト画像に追加される基準信号210の例示的な空間周波数ドメインの図を示し、実数成分が横軸によって示され、虚数成分が縦軸によって示される(いわゆる「u、v」平面)。示される基準信号は、高過ぎて人間は知覚できないが、スマートフォンのカメラのイメージセンサーによって生成されるデータ内で検出可能である周波数(すなわち、原点からの距離)の空間ドメインのインパルスの五角形配置212を含む。(ホスト画像の対応する空間周波数ドメインの図は図13には示されないが、概して、u、v平面中に散らばった−多くは横軸及び縦軸に沿って集まった−信号を含む)。
図13の図において、マーカー212は、円215上に中心が置かれる。(使用されている特定の色のドメインにおける)人間の視覚の限界が、より小さな円217によって示される。円217の外側の空間周波数成分で構成される特徴(例えば、マーカー212)は、周波数が高過ぎるので人間の観察者には識別できない。(マーカー212が空間周波数がより低いならば、それらのマーカー212は、細かな杉綾織に似ているピクセルパターンに対応するであろう。しかし、より高い周波数においては、目は、織り目のパターンを見分けることはできない。むしろ、織り目が消えて見た目には模様がなくなる)。
4つの五角形マーカー212が示されているが、もちろん、より少ない又はより多い数も、使用され得る。同様に、マーカーは、形状が五角形である必要はない。
スマートフォンのカメラが基準パターン210を検出するとき、スマートフォンのカメラは、それによって、カメラと印刷された物体の間の相対的な距離と、物体に対するカメラのあらゆる回転及び傾きとを認識することができる。例えば、カメラが物体に近づくように動かされるとき、拡大された画像の構成要素は、より低い成分の空間周波数を有するように感知される。したがって、五角形マーカーは、原点に近づくように移動する。カメラが(基準信号がホスト画像内にもともと符号化されていた向きに対して)回転される場合、五角形マーカーは、同様に回転されたように見える。カメラが−印刷された画像の一部が、印刷された画像のその他の部分よりもセンサーに近づくように−傾けられる場合、五角形のパターンは、歪められる。(五角形マーカーの中心214は、もはやu、vの原点付近に中心が置かれる円215上に位置せず、そうではなく、それらの中心は、楕円上に位置する)。
図14は、例示的なスマートフォンの表示220を示す。この図において、スマートフォンは、シリアルの箱の一部−その図版222がスクリーンのほとんどを占めている−を撮像している。スクリーン上に重ね合わされているのは、上2つの五角形基準マーカーを含む検出された基準信号の半平面の描写である。示された表示は、2つの決まった目標領域224−円形の破線で境界が示される−も含む。電話をシリアルの箱に向かって、又はシリアルの箱から遠ざかるように動かすこと、及び必要に応じて傾けること/回転することによって、ユーザは、五角形マーカー212を2つの照準領域224内に移動させることができる。この位置で、シリアルの箱からのウォーターマーク信号の読み取りが、最適化される(すなわち、スマートフォンのカメラが、箱の平面図を撮影するように位置付けられる)。スマートフォンは、ウォーターマークを即座に(おそらくはマーカーが照準領域に合わせられる前に)読み取り、電話は、検出されたデータに応答して対応するアクションを行う。
望ましくは、変換ドメインの重なりが、検出された基準信号の強度とともに変化する可視性(強度)で示される。(例えば、パターン検出器の検出測定尺度の出力によって)基準信号が検出されない場合、重なりは表示されない。より強い信号ほど、重ねられるマーカー信号は、より大きなコントラスト−背景画像222と比較して−で表示される。一部の実施形態において、マーカーは、検出された基準信号の強度に応じて色差又は明度が変わる色合いで表示される。
1つの特定の実装においては、撮影された画像の空間周波数の表現は、閾値未満のいかなる空間周波数成分も表示されないように閾値を決められる。これは、撮影されたシリアルの箱の図版222のフーリエドメインの表現によって表示が劣化させられることを防ぐ。そうではなく、重ねられる信号だけが、マーカー信号に対応する。
同様に、空間周波数データは、高域通過スペクトルフィルタリングされることができ、したがって、閾値の空間周波数(例えば、図13の円217によって示された空間周波数)を超える画像の構成要素だけが、示される。
円形の目標領域224は、必須ではない。その他の視覚的手引きが表示される可能性があり、又はそれらはすべて省略される可能性がある。後者の場合、ユーザは、マーカー224が同じ高さである(すなわち、水平に横切る)ように電話を位置付けるように指示される可能性がある。(先の段落で説明されたように)変換されたデータがスペクトルフィルタリングされる場合、ユーザは、マーカーがちょうど現れるまで電話を対象物に向かって、又は対象物から離して位置付けるように指示される可能性がある。(実際には、マーカー212の5つの点は、少し、小さな妖精の姿−特にカラーで描画されるときに頭、2本の腕、及び2本の脚−のように見える)。したがって、ユーザは、「妖精を探せ」と指示される可能性がある。それらの見た目は、各マーカーの5つの構成要素に異なる色を与えることによって特に目立つようにされ、時間とともに色を変える−人目を引く、ちらちら光る効果をもたらす−ことができる。
図14に示される特定の実施形態において、空間周波数情報は、長方形のボックス226に示される。空間周波数情報のフレームの役割をすることに加えて、このボックスは、変換ドメインの分析が実行される、図版222内のピクセルの長方形の部分的領域を定義するようにも働く。言い換えると、画像のフレーム全体をフーリエドメインに変換する代わりに、ボックス226内のそれらのピクセルのみをそのように変換する。これは、電話のプロセッサの負担を軽減する。(ボックス226は、中心領域(fovea region)−プロセッサがユーザが電話を最適に位置付けるのを補助するときに、プロセッサがその注意を集中するピクセルの部分的領域−とみなされ得る)。領域226のピクセルの輝度は、−ユーザに対してその領域をさらに目立たせるために−若干上げられるか、又は下げられる可能性がある。
結言
本明細書の前の部分は、譲受人の以前の特許出願との本明細書の関連を示したが、それは繰り返すに値する。これらの開示の内容は、一緒に併せて読まれ、全体として理解されるべきである。出願人は、各開示の特徴がその他の開示の特徴と組み合わせられることを意図し、本明細書によって明示的に教示する。したがって、例えば、本明細書において説明された構成及び詳細は、公開された出願第20110098029号、第20110098056号、及び20100228632号に記載のシステム及び方法のさまざまな実装で使用されることができ、一方、それらの特許出願の構成及び詳細が、本明細書に記載のシステム及び方法の実装で使用されることができる。その他の上述の文献に関しても同様である。したがって、本出願において開示された方法、要素、及び概念は、それらの挙げられた文献に詳述された方法、要素、及び概念と組み合わされることを理解されたい。一部が本明細書において特に詳細に説明されたが、多くは−順序の入れ替え及び組み合わせの数が多いこと、並びに簡潔さが必要であることが理由で−説明されなかった。しかし、すべてのそのような組み合わせの実装は、これらの教示から当業者に容易に理解できる。
本明細書に開示されたさまざまな実施形態の中の要素及び教示は、交換され、組み合わされるようにやはり意図される。
例示的な例を参照して出願人の発明の成果の原理を説明し、示したが、この技術はそのように限定されないことが認められるであろう。
例えば、スマートフォンについて繰り返し言及がなされたが、任意のデバイスが使用され得ることが理解されるであろう。上に挙げられた文献は、そのようなシステムで使用され得るさまざまなデバイス及び多様なハードウェア構成の一部を詳述する。
特に想定されるスマートフォンは、AppleのiPhone4と、GoogleのAndroidの仕様にしたがうスマートフォン(例えば、HTC Corp.によって製造されたVerizonのDroid Eris電話、及びMotorolaのDroid2電話)とを含む。用語「スマートフォン」(又は「セル電話」)は、すべてのそのようなデバイスを含み、厳密に言ってセルラでなく、電話でもないデバイスさえも含むと理解されるべきである。
(iPhoneの、そのタッチインターフェースを含む詳細は、Appleの公開された特許出願第20080174570号に示されている)。
本開示において参照されたスマートフォン及びその他のコンピュータの設計は、当業者によく知られている。大まかに言えば、それぞれは、1つ又は複数のプロセッサ、1つ又は複数のメモリ(例えば、RAM)、ストレージ(例えば、ディスク又はフラッシュメモリ)、ユーザインターフェース(例えば、キーパッド、TFT LCD又はOLEDディスプレイスクリーン、タッチセンサー又はその他のジェスチャーセンサー、カメラ又はその他の光学式センサー、コンパスセンサー、3D磁力計、3軸加速度計、1つ又は複数のマイクロホンなどをグラフィカルユーザインターフェースを提供するためのソフトウェア命令と一緒に含み得る)、これらの要素の間の相互接続(例えば、バス)、並びにその他のデバイスとの通信のためのインターフェース(GSM(登録商標)、CDMA、W−CDMA、CDMA2000、TDMA、EV−DO、HSDPA、WiFi、WiMax、若しくはBluetooth(登録商標)などの無線、及び/又はイーサネット(登録商標)ローカルエリアネットワーク、T−1インターネット接続などによる有線である可能性がある)を含む。
本明細書において詳述されたプロセス及びシステムのコンポーネントは、マイクロプロセッサ(例えば、Atom及びA4)、グラフィックス処理ユニット(GPU、nVidiaのTegra APX2600など)、並びにデジタル信号プロセッサ(例えば、Texas InstrumentsのTMS320シリーズのデバイス)などを含むさまざまなプログラム可能なプロセッサ用の汎用プロセッサ命令を含むコンピューティングデバイス用の命令として実装され得る。これらの命令は、ソフトウェア、ファームウェアなどとして実装され得る。これらの命令は、プログラマブルロジックデバイス、フィールドプログラマブルゲートアレイ(例えば、XilinxのVirtexシリーズのデバイス)、フィールドプログラマブルオブジェクトアレイ(field programmable object array)、並びに特定用途向け回路−デジタル、アナログ、及びアナログ/デジタル混合回路を含む−を含むさまざまな形態のプロセッサ回路で実装されることもできる。命令の実行は、プロセッサの間に分散される、及び/又はデバイス内のプロセッサにまたがって、若しくはデバイスのネットワーク中に並列化される可能性がある。コンテンツ信号データの処理も、異なるプロセッサ及びメモリデバイスの間に分散され得る。「クラウド」コンピューティングリソースも、使用され得る。「プロセッサ」、「コンポーネント」などの言及は、特定の形態の実装を必要とするということではなく、機能を指すと理解されるべきである。
詳述された機能を実装するためのソフトウェア命令は、本明細書で与えられた説明から当業者によって容易に書かれる、例えば、C、C++、Visual Basic、Java(登録商標)、Python、Tcl、Perl、Scheme、Rubyなどで記述されることができる。この技術の特定の実装によるセル電話及びその他のデバイスは、さまざまな機能及び動作を実行するためのソフトウェアモジュールを含み得る。
知られているブラウザソフトウェア、通信ソフトウェア、及びメディア処理ソフトウェアが、本明細書において詳細に説明された使用のうちの多くのために構成され得る。
コンテンツの所有者が(例えば、ウォーターマークによってトリガされる特定のアクションの呼び出しによって)特定の属性及び体験をコンテンツに割り当てるサービスは、概して、ユーザデバイスの−OS内にあるか、又はアプリケーションソフトウェアとしての−ソフトウェアを使用する。代替的に、このサービスは、−部分的に−リモートのリソースを用いて実装され得る。
通常、ソフトウェア及びハードウェアの構成データ/命令は、ネットワークを介してアクセスされ得る磁気ディスク又は光ディスク、メモリカード、ROMなどの有形の媒体によって運ばれる1つ又は複数のデータ構造で命令として記憶される。一部の実施形態は、組み込みシステム−(例えば基本的なセル電話によくあるように)オペレーティングシステムのソフトウェアとアプリケーションソフトウェアがユーザには判別できない専用コンピュータシステム−として実装され得る。本明細書で詳述された機能は、オペレーティングシステムのソフトウェア、アプリケーションソフトウェア、及び/又は組み込みシステムのソフトウェアで実装され得る。
機能のうちの異なるものは、異なるデバイスに実装され得る。例えば、スマートフォンがリモートのサービスプロバイダのサーバと通信するシステムにおいては、異なるタスクは、完全に一方のデバイス又は他方のデバイスによって実行される可能性があり、又は実行は、デバイスの間に分散される可能性がある。コンテンツからのウォーターマークデータの抽出は、そのようにして分散され得るプロセスの一例である。したがって、オペレーションが特定のデバイス(例えば、スマートフォン)によって実行されるという説明は限定的ではなく例示的であり、別のデバイス(例えば、リモートのサーバ)によるオペレーションの実行、又はデバイス間で分担されたオペレーションの実行も、はっきりと想定されることを理解されたい。
(同様にして、データが特定のデバイスに記憶されるという説明も例示的であり、データは、任意の場所に記憶されること、すなわち、ローカルのデバイスに記憶されること、リモートのデバイスに記憶されること、クラウドに記憶されること、分散して記憶されることなどが可能である)。
本開示は特定の動作の順序及び特定の要素の組み合わせを詳細に説明したが、その他の想定される方法は、動作の順序を変える(場合によっては一部の動作を省略し、その他の動作を追加する)ことができ、その他の想定される組み合わせは、一部の要素を省略し、その他の要素を追加することなどができることが認められるであろう。
完全なシステムとして開示されたが、詳述された構成の部分的組み合わせも、個別的に想定される。
この技術が静止画との関連で説明されたが、この技術は、例えば、多くの連続的なフレーム又はフィールド(field)を含む映像での使用に同様に適している。(静止画は、任意の知られている形態、例えば、印刷された形態、又は電子的なディスプレイスクリーンに表示された形態をとり得る)。
本明細書を過度に冗長にすることなく包括的な開示を提供するために、出願人は、本明細書において参照される特許出願及びその他の文献を参照により援用する。(そのような資料は、その教示の詳細に関連して上で挙げられたとしても、その全体が援用される)。これらの参考文献は、本明細書において詳述された構成に組み込まれることができ、本明細書において詳述された技術及び教示が組み込まれることができる技術及び教示を開示する。読者は、そのような従来の成果に精通していると想定される。
認識されるであろうように、本明細書は、多くの新規性のある構成を詳細に説明した。実務上の制約により、多くのそのような構成は、本出願の元の出願において請求されていないが、出願人は、優先権を主張するその後の出願においてそのようなその他の主題を請求するように意図する。発明の構成のうちの一部の不完全な抜粋が、以下の段落で精査される。
1つの構成は、メモリに記憶されたソフトウェアによって構成されるプロセッサを有するデバイスを用いてカラー画像に印を付ける方法である。方法は、−空間又はピクセルドメインの画像内で−少なくとも1つの2次元の画像の部分的領域を識別するステップを含む。次いで、1つ又は複数のクロマキーが、その部分的領域の変換ドメインの表現を変更することによってその部分的領域に符号化され、この変更は、変換ドメイン空間において主に区分けされた弧領域内に位置する画像信号エネルギーを追加することを含む。
さらなる構成において、そのような変更された画像は、異なる補助情報と一緒に送信されるか、又は記憶される。そのようなさらなる構成において、補助情報と併せた符号化された(1つ又は複数の)クロマキーは、部分的領域がイメージセンサーを含むモバイルデバイスによって感知されるときの画像の部分的領域に対する応答を協力して定義する働きをする。
別の構成は、プロセッサ部分及びカメラ部分を含む可搬型のユーザデバイスを使用する方法である。方法は、カメラ部分によって撮影された画像を変換して、変換ドメインの対応するデータを生成するステップを含む。次いで、この変換ドメインの情報が、変換ドメインの区分けされた弧領域の信号エネルギー(「キー」)の存在を検出するために分析される。
さらなる構成において、方法は、複数ビットの補助データを受け取るステップと、そのような複数ビットの補助データの使用によって、検出されたキーに対応する応答を決定するステップとをさらに含む。
さらに別の構成は、(例えば、スマートフォンのカメラの)センサーを用いてシーンから画像データを撮影するステップと、前記シーンの少なくとも一部の変換ドメインの表現を計算するステップと、前記変換ドメインの表現に基づく表現をスクリーン上に表示するステップとを含む。(そのような表現は、ピクセル−それらのピクセルの位置は、撮影された画像データの空間周波数属性に基づく−を含み得る。同様に、そのような表現は、ピクセル−それらのピクセルの輝度又は色は、変換された画像データの空間周波数の係数の振幅に基づく−を含み得る)。
さらに別の構成は、(例えば、スマートフォンのカメラの)センサーを用いて物体から画像データを撮影するステップと、撮影された画像データの少なくとも一部に基づいて変換ドメインの表現を計算するステップと、前記変換ドメインの表現に基づく表示をスクリーン上に表示するステップと、前記表示された変換ドメインの表現を参照することによって、ユーザが物体に対してセンサーを動かすのを手引きするステップとを含む。
さらに別の構成は、2Dイメージセンサーを含むデバイスを用いてシーンから画像データを撮影するステップであり、センサーが、(例えば、通常のCMOS又はCCDセンサーのように)そのセンサー中に一様な密度の感知素子を有する、ステップと、画像データに中心フィルタリング関数を適用するステップであり、(中心区域(foveal zone)内で維持される画像データのより密度の高いサンプリングと比較して)画像データのより密度の低いサンプリングが、中心区域の外で維持される、ステップと、中心フィルタリングされた画像データをさらに処理するステップと、を含む。
上述の方法を具現化する又は使用する装置、部分的組み合わせ、及びコンピュータ可読媒体も、はっきりと想定される。
この技術の原理が適用され得る多くの実施形態に鑑みて、詳細に説明された実施形態は例示的であるに過ぎず、出願人の発明の成果の範囲を限定するとみなされるべきでないことが認識されるべきである。むしろ、出願人は、以下の特許請求の範囲及びその均等物の範囲及び趣旨の中にあるすべての実施形態を請求する。(この特許請求の範囲は、本開示において出願人が進歩的であるとみなすものの一部のみを含む。出願人は、将来、追加的な特許請求の範囲を提出する権利を留保するので、請求されなかった主題を放棄することは意図されていない)。

Claims (19)

  1. 画像データを受け取るステップと、
    受け取られた画像データにしたがって可搬型のデバイスのスクリーン上に画像を表示するステップと、
    前記受け取られた画像データの少なくとも一部を変換して、前記少なくとも一部に対応するフーリエドメインのデータを得るステップと、
    前記表示された画像と一緒に、前記スクリーン上に前記フーリエドメインのデータの視覚的表現を表示するステップと、
    を含む、方法。
  2. 前記デバイスのカメラ部分を用いて、物体から前記画像データを撮影するステップ、
    を含む請求項1に記載の方法。
  3. 可搬型のデバイスの位置付け補助を前記スクリーン上に表示するステップであって、前記位置付け補助が目標領域を含み、前記カメラ部分がユーザにより前記物体に対し動かされることにより、前記視覚的表現が前記目標領域の中に配置可能となる、当該ステップ、
    をさらに含む請求項2に記載の方法。
  4. 閾値の空間周波数を超える前記フーリエドメインのデータの成分に関してのみ前記視覚的表現を表示するステップ、
    を含む請求項1に記載の方法。
  5. 前記視覚的表現が、フーリエドメインのインパルスの五角形配置を含む請求項1に記載の方法。
  6. 前記フーリエドメインのデータの前記視覚的表現が、人間の知覚にとっては周波数が高過ぎる感知不能な画像細部を表す請求項1に記載の方法。
  7. 前記フーリエドメインのデータの前記視覚的表現が、前記感知不能な画像細部の強度とともに変化する可視性で表示される請求項6に記載の方法。
  8. 前記可視性が、前記感知不能な画像細部の強度とともに非線形に変化し、前記感知不能な画像細部の強度が閾値未満である場合、前記フーリエドメインのデータの視覚的表現が表示されない請求項7に記載の方法。
  9. 前記フーリエドメインのデータの前記視覚的表現が、前記感知不能な画像細部の強度とともに変化する色で表示される請求項6に記載の方法。
  10. 前記受け取られた画像データの一部のみを変換するステップ、
    を含む請求項1に記載の方法。
  11. 前記可搬型のデバイスのスクリーン上に表示される前記フーリエドメインのデータの視覚的表現が、実数成分が横軸によって示され虚数成分が縦軸によって示される平面であるu、v平面の一部の描写を含む請求項1に記載の方法。
  12. カメラ、スクリーン及び処理回路を含む可搬型のデバイスであって、
    前記処理回路が、
    物体から画像データを撮影する動作と、
    撮影された画像データにしたがって前記スクリーン上に画像を表示する動作と、
    前記撮影された画像データを変換して、前記撮影された画像データに対応するフーリエドメインのデータを得る動作と、
    前記表示された画像と一緒に、前記スクリーン上に前記フーリエドメインのデータの視覚的表現を表示する動作と、
    を含む動作を、当該デバイスに実行させるように構成される、
    当該デバイス。
  13. 前記処理回路が、
    メモリ内の命令によって構成されるプロセッサ、
    を備える、請求項12に記載のデバイス。
  14. 可搬型のデバイスのカメラのセンサーを用いて物体から画像データを撮影するステップと、
    撮影された画像データの少なくとも一部に基づいて変換ドメインの表現を計算するステップと、
    前記変換ドメインの表現を含む表示を可搬型のデバイスのスクリーン上に表示するステップと、
    前記表示された変換ドメインの表現を参照することによって、ユーザが前記物体に対して前記可搬型のデバイスを動かすのを手引きするステップと、
    を含む、方法。
  15. 前記変換ドメインが、空間周波数ドメインを含む請求項14に記載の方法。
  16. 前記手引きするステップが、
    (a)前記変換ドメインの表現と、(b)前記カメラが前記物体の特定の図を有するときに前記変換ドメインの表現が位置合わせされる視覚的手引きと、の両方を含む表示を、前記可搬型のデバイスのスクリーン上に表示するサブステップ、
    を含む請求項14に記載の方法。
  17. 前記特定の図が、前記物体の平面図を含む請求項16に記載の方法。
  18. 一様な密度の感知素子を有する2Dイメージセンサーを含む可搬型のデバイスを用いて、あるシーンから画像データを撮影するステップと、
    前記画像データに中心フィルタリング関数を適用し、中心区域外の比較的低い解像度の画像データの組、及び前記中心区域内の比較的高い解像度の画像データの組を生成するステップと、
    中心フィルタリングされた画像データをさらに処理するステップであって、前記中心フィルタリングされた画像データの変換ドメインの表現を計算するサブステップ、及び、前記変換ドメインの表現を含む表示を前記デバイスのスクリーン上に表示するサブステップを含む、当該ステップと、
    を含む、方法。
  19. コンピューティングデバイスに、
    空間周波数ドメインではなく空間ドメインの画像データを受け取る動作と、
    受け取られた画像データを変換して、前記受け取られた画像データに対応するフーリエドメインのデータを得る動作と、
    ディスプレイスクリーン上に表示するためのデータを生成する動作であって、生成されるデータが、前記画像データの視覚的表現を伴う、前記フーリエドメインのデータの視覚的表現に対応する、当該動作と、
    を含む複数の動作を実行させるための命令を記憶した、
    コンピュータ読み取り可能な記録媒体。
JP2013509146A 2010-05-05 2011-05-02 隠された画像のシグナリング Expired - Fee Related JP5802997B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US12/774,512 2010-05-05
US12/774,512 US8401224B2 (en) 2010-05-05 2010-05-05 Hidden image signalling
US201161467862P 2011-03-25 2011-03-25
US61/467,862 2011-03-25
PCT/US2011/034829 WO2011139980A1 (en) 2010-05-05 2011-05-02 Hidden image signaling

Publications (3)

Publication Number Publication Date
JP2013532406A JP2013532406A (ja) 2013-08-15
JP2013532406A5 JP2013532406A5 (ja) 2014-06-19
JP5802997B2 true JP5802997B2 (ja) 2015-11-04

Family

ID=44904012

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013509146A Expired - Fee Related JP5802997B2 (ja) 2010-05-05 2011-05-02 隠された画像のシグナリング

Country Status (6)

Country Link
US (4) US8331724B2 (ja)
EP (1) EP2567346B1 (ja)
JP (1) JP5802997B2 (ja)
KR (1) KR101542756B1 (ja)
CN (1) CN103038781B (ja)
WO (1) WO2011139980A1 (ja)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8903847B2 (en) 2010-03-05 2014-12-02 International Business Machines Corporation Digital media voice tags in social networks
JP5802997B2 (ja) * 2010-05-05 2015-11-04 ディジマーク コーポレイション 隠された画像のシグナリング
US8688090B2 (en) 2011-03-21 2014-04-01 International Business Machines Corporation Data session preferences
US20120246238A1 (en) 2011-03-21 2012-09-27 International Business Machines Corporation Asynchronous messaging tags
US20120244842A1 (en) 2011-03-21 2012-09-27 International Business Machines Corporation Data Session Synchronization With Phone Numbers
US8620021B2 (en) 2012-03-29 2013-12-31 Digimarc Corporation Image-related methods and arrangements
WO2013149267A2 (en) * 2012-03-29 2013-10-03 Digimarc Corporation Image-related methods and arrangements
US20130314541A1 (en) * 2012-04-16 2013-11-28 Digimarc Corporation Methods and arrangements for object pose estimation
US9618327B2 (en) * 2012-04-16 2017-04-11 Digimarc Corporation Methods and arrangements for object pose estimation
CN107104731B (zh) 2012-05-24 2019-09-03 松下电器(美国)知识产权公司 信息通信方法、信息通信装置及记录介质
US9094616B2 (en) 2012-10-16 2015-07-28 Vidinoti Sa Method and system for image capture and facilitated annotation
CN104871179A (zh) * 2012-10-16 2015-08-26 维迪诺蒂有限公司 用于图像捕捉和便于注解的方法和系统
US8988574B2 (en) 2012-12-27 2015-03-24 Panasonic Intellectual Property Corporation Of America Information communication method for obtaining information using bright line image
US9608727B2 (en) 2012-12-27 2017-03-28 Panasonic Intellectual Property Corporation Of America Switched pixel visible light transmitting method, apparatus and program
US10530486B2 (en) 2012-12-27 2020-01-07 Panasonic Intellectual Property Corporation Of America Transmitting method, transmitting apparatus, and program
US9088360B2 (en) 2012-12-27 2015-07-21 Panasonic Intellectual Property Corporation Of America Information communication method
US10523876B2 (en) 2012-12-27 2019-12-31 Panasonic Intellectual Property Corporation Of America Information communication method
CN104885381B (zh) 2012-12-27 2017-12-19 松下电器(美国)知识产权公司 信息通信方法
US9252878B2 (en) 2012-12-27 2016-02-02 Panasonic Intellectual Property Corporation Of America Information communication method
EP2940889B1 (en) 2012-12-27 2019-07-31 Panasonic Intellectual Property Corporation of America Visible-light-communication-signal display method and display device
US9560284B2 (en) 2012-12-27 2017-01-31 Panasonic Intellectual Property Corporation Of America Information communication method for obtaining information specified by striped pattern of bright lines
US10303945B2 (en) 2012-12-27 2019-05-28 Panasonic Intellectual Property Corporation Of America Display method and display apparatus
US10951310B2 (en) 2012-12-27 2021-03-16 Panasonic Intellectual Property Corporation Of America Communication method, communication device, and transmitter
SG11201505027UA (en) 2012-12-27 2015-07-30 Panasonic Ip Corp America Information communication method
US9608725B2 (en) 2012-12-27 2017-03-28 Panasonic Intellectual Property Corporation Of America Information processing program, reception program, and information processing apparatus
US9087349B2 (en) 2012-12-27 2015-07-21 Panasonic Intellectual Property Corporation Of America Information communication method
US8922666B2 (en) 2012-12-27 2014-12-30 Panasonic Intellectual Property Corporation Of America Information communication method
WO2014103157A1 (ja) 2012-12-27 2014-07-03 パナソニック株式会社 映像表示方法
EP2940901B1 (en) 2012-12-27 2019-08-07 Panasonic Intellectual Property Corporation of America Display method
US9311640B2 (en) 2014-02-11 2016-04-12 Digimarc Corporation Methods and arrangements for smartphone payments and transactions
US8704939B1 (en) * 2013-03-20 2014-04-22 Lg Electronics Inc. Mobile device and method for controlling the same
WO2014148741A1 (en) 2013-03-20 2014-09-25 Lg Electronics Inc. Mobile device and method for controlling the same
US8866953B2 (en) 2013-03-20 2014-10-21 Lg Electronics Inc. Mobile device and method for controlling the same
US9818150B2 (en) * 2013-04-05 2017-11-14 Digimarc Corporation Imagery and annotations
CN103529941A (zh) * 2013-07-15 2014-01-22 李华容 一种基于二维图形的手势识别设备及手势识别方法
US8958602B1 (en) * 2013-09-27 2015-02-17 The United States Of America As Represented By The Secretary Of The Navy System for tracking maritime domain targets from full motion video
US9482657B2 (en) * 2013-11-07 2016-11-01 Ppg Industries Ohio, Inc. Formulation of complex coating mixtures with effect pigments
US10230782B2 (en) * 2013-11-18 2019-03-12 Microsoft Technology Licensing, Llc Unbalanced mapping between desktop and mobile pages
CN105338339B (zh) * 2014-07-29 2018-02-27 联想(北京)有限公司 信息处理方法及电子设备
US9613244B2 (en) 2015-05-07 2017-04-04 Datalogic IP Tech, S.r.l. 2D indicia pose estimation and consequent grid localization and/or synchronization
KR101648966B1 (ko) * 2015-05-11 2016-08-30 강릉원주대학교산학협력단 인지적 한계를 기초로 핑거프린트의 생성 또는 정합을 수행하는 장치 및 방법
KR101981924B1 (ko) * 2015-11-30 2019-08-30 한국전자통신연구원 미디어 콘텐츠 식별 방법
US9563798B1 (en) 2016-08-23 2017-02-07 V.L. Engineering, Inc. Reading invisible barcodes and other invisible insignia using physically unmodified smartphone
CN106973385A (zh) * 2016-11-29 2017-07-21 维沃移动通信有限公司 一种共享热点方法及移动终端
CN107707924B (zh) * 2017-09-27 2020-04-28 天津大学 一种基于频率约束的相机与屏幕通信方法
CN111435849B (zh) * 2019-01-11 2021-11-09 华为技术有限公司 一种通信方法及设备
CN111246469B (zh) * 2020-03-05 2020-10-16 北京花兰德科技咨询服务有限公司 人工智能保密通信系统及通信方法
CN113448483A (zh) * 2020-03-26 2021-09-28 北京破壁者科技有限公司 互动方法、装置、电子设备和计算机存储介质
CN112861561B (zh) * 2021-03-09 2022-11-11 上海交通大学 一种基于屏幕调光特征的二维码安全增强方法及装置

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8518803D0 (en) * 1985-07-25 1985-08-29 Rca Corp Locating target patterns within images
US5432349A (en) * 1993-03-15 1995-07-11 The United State Of America As Represented By The Secretary Of The Navy Fourier transform microscope for x-ray and/or gamma-ray imaging
US5862260A (en) 1993-11-18 1999-01-19 Digimarc Corporation Methods for surveying dissemination of proprietary empirical data
US6408082B1 (en) 1996-04-25 2002-06-18 Digimarc Corporation Watermark detection using a fourier mellin transform
US6614914B1 (en) 1995-05-08 2003-09-02 Digimarc Corporation Watermark embedder and reader
US5748763A (en) 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
US6516079B1 (en) 2000-02-14 2003-02-04 Digimarc Corporation Digital watermark screening and detecting strategies
US5646997A (en) 1994-12-14 1997-07-08 Barton; James M. Method and apparatus for embedding authentication information within digital data
US6988202B1 (en) 1995-05-08 2006-01-17 Digimarc Corporation Pre-filteriing to increase watermark signal-to-noise ratio
US6590996B1 (en) 2000-02-14 2003-07-08 Digimarc Corporation Color adaptive watermarking
US5613004A (en) 1995-06-07 1997-03-18 The Dice Company Steganographic method and device
US5822360A (en) 1995-09-06 1998-10-13 Solana Technology Development Corporation Method and apparatus for transporting auxiliary data in audio signals
US5859920A (en) 1995-11-30 1999-01-12 Eastman Kodak Company Method for embedding digital information in an image
US7412072B2 (en) 1996-05-16 2008-08-12 Digimarc Corporation Variable message coding protocols for encoding auxiliary data in media signals
US5889868A (en) 1996-07-02 1999-03-30 The Dice Company Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
JP3982836B2 (ja) 1996-07-16 2007-09-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 情報信号に埋め込まれた透かし情報の検出方法
US5825892A (en) 1996-10-28 1998-10-20 International Business Machines Corporation Protecting images with an image watermark
US8005254B2 (en) * 1996-11-12 2011-08-23 Digimarc Corporation Background watermark processing
JP2000048478A (ja) 1998-05-26 2000-02-18 Yamaha Corp ディジタルコピー制御方法及びそれを用いた装置
US6442283B1 (en) 1999-01-11 2002-08-27 Digimarc Corporation Multimedia data embedding
US7013021B2 (en) 1999-03-19 2006-03-14 Digimarc Corporation Watermark detection utilizing regions with higher probability of success
US6442284B1 (en) 1999-03-19 2002-08-27 Digimarc Corporation Watermark detection utilizing regions with higher probability of success
US6535617B1 (en) * 2000-02-14 2003-03-18 Digimarc Corporation Removal of fixed pattern noise and other fixed patterns from media signals
US6763124B2 (en) 2000-04-19 2004-07-13 Digimarc Corporation Embedding digital watermarks in spot colors
US7305104B2 (en) * 2000-04-21 2007-12-04 Digimarc Corporation Authentication of identification documents using digital watermarks
US6714683B1 (en) 2000-08-24 2004-03-30 Digimarc Corporation Wavelet based feature modulation watermarks and related applications
US6760464B2 (en) 2000-10-11 2004-07-06 Digimarc Corporation Halftone watermarking and related applications
US20030026453A1 (en) 2000-12-18 2003-02-06 Sharma Ravi K. Repetition coding of error correction coded messages in auxiliary data embedding applications
US6483927B2 (en) 2000-12-18 2002-11-19 Digimarc Corporation Synchronizing readers of hidden auxiliary data in quantization-based data hiding schemes
US6845170B2 (en) * 2001-01-11 2005-01-18 Sony Corporation Watermark resistant to resizing and rotation
US6836569B2 (en) * 2001-04-13 2004-12-28 Erwan Le Pennec Method and apparatus for processing or compressing n-dimensional signals by foveal filtering along trajectories
US7046819B2 (en) 2001-04-25 2006-05-16 Digimarc Corporation Encoded reference signal for digital watermarks
JP4005780B2 (ja) * 2001-07-12 2007-11-14 興和株式会社 電子透かしの埋め込みおよび検出
US6724914B2 (en) 2001-10-16 2004-04-20 Digimarc Corporation Progressive watermark decoding on a distributed computing platform
JP3907439B2 (ja) * 2001-10-26 2007-04-18 キヤノン株式会社 携帯端末システム及び携帯端末及び画像処理装置及びその動作方法
CN100375079C (zh) * 2002-04-28 2008-03-12 联想(北京)有限公司 使用手机实现购物前随时随地鉴真的服务方法及系统
WO2003098540A1 (en) 2002-05-14 2003-11-27 Mediasec Technologies, Gmbh Visible authentication patterns for printed document
US7519819B2 (en) 2002-05-29 2009-04-14 Digimarc Corporatino Layered security in digital watermarking
US7129981B2 (en) * 2002-06-27 2006-10-31 International Business Machines Corporation Rendering system and method for images having differing foveal area and peripheral view area resolutions
JP2006524458A (ja) * 2003-04-11 2006-10-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 透かし検出の方法
US8301893B2 (en) * 2003-08-13 2012-10-30 Digimarc Corporation Detecting media areas likely of hosting watermarks
US8140848B2 (en) 2004-07-01 2012-03-20 Digimarc Corporation Digital watermark key generation
JP2006038779A (ja) * 2004-07-30 2006-02-09 Hitachi High-Technologies Corp パターン形状評価方法、評価装置、及び半導体装置の製造方法
JP5279270B2 (ja) * 2004-08-06 2013-09-04 ディジマーク コーポレイション 携帯コンピューティング装置における高速信号検出および分散コンピューティング
US8891811B2 (en) 2004-09-17 2014-11-18 Digimarc Corporation Hierarchical watermark detector
JP4911903B2 (ja) * 2005-02-21 2012-04-04 インターナショナル・ビジネス・マシーンズ・コーポレーション 表示装置、表示システム、表示方法、及びプログラム
JP2007124088A (ja) * 2005-10-26 2007-05-17 Olympus Corp 画像撮影装置
JP4695972B2 (ja) * 2005-12-14 2011-06-08 キヤノン株式会社 画像処理装置、撮像装置および画像処理方法
KR100776663B1 (ko) * 2006-08-30 2007-11-19 한국전자통신연구원 워터마크 추출 기능을 갖는 카메라가 장착된 휴대 단말장치 및 그 방법
US7991157B2 (en) 2006-11-16 2011-08-02 Digimarc Corporation Methods and systems responsive to features sensed from imagery or other data
US8565815B2 (en) 2006-11-16 2013-10-22 Digimarc Corporation Methods and systems responsive to features sensed from imagery or other data
JP5203787B2 (ja) * 2008-04-17 2013-06-05 株式会社日立ハイテクノロジーズ データ解析装置
US9117268B2 (en) 2008-12-17 2015-08-25 Digimarc Corporation Out of phase digital watermarking in two chrominance directions
US8175617B2 (en) 2009-10-28 2012-05-08 Digimarc Corporation Sensor-based mobile search, related methods and systems
US8121618B2 (en) 2009-10-28 2012-02-21 Digimarc Corporation Intuitive computing methods and systems
JP5802997B2 (ja) * 2010-05-05 2015-11-04 ディジマーク コーポレイション 隠された画像のシグナリング
US9398210B2 (en) * 2011-02-24 2016-07-19 Digimarc Corporation Methods and systems for dealing with perspective distortion in connection with smartphone cameras

Also Published As

Publication number Publication date
US8532334B2 (en) 2013-09-10
JP2013532406A (ja) 2013-08-15
US20130100301A1 (en) 2013-04-25
WO2011139980A1 (en) 2011-11-10
US20150156384A1 (en) 2015-06-04
US20140009629A1 (en) 2014-01-09
EP2567346A4 (en) 2016-01-06
US20120077542A1 (en) 2012-03-29
US8890950B2 (en) 2014-11-18
US8331724B2 (en) 2012-12-11
EP2567346A1 (en) 2013-03-13
KR101542756B1 (ko) 2015-08-12
KR20130032309A (ko) 2013-04-01
CN103038781A (zh) 2013-04-10
EP2567346B1 (en) 2017-06-14
CN103038781B (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
JP5802997B2 (ja) 隠された画像のシグナリング
US8401224B2 (en) Hidden image signalling
US20220335561A1 (en) Embedding signals in a raster image processor
US10997685B2 (en) Methods and systems for signal processing
US8565815B2 (en) Methods and systems responsive to features sensed from imagery or other data
US8891815B2 (en) Invisible information embedding apparatus, invisible information detecting apparatus, invisible information embedding method, invisible information detecting method, and storage medium
JP2020064637A (ja) 畳み込みニューラルネットワークを介してイメージ偽変造を探知するシステム、方法、及びこれを利用して無補正探知サービスを提供する方法
JP6512706B2 (ja) 透かし入り二次元コード、認証システム、認証方法、及びプログラム
JP2015106862A (ja) コンテンツ情報取得装置およびそのプログラム、ならびに、コンテンツ配信装置
Liu et al. Toward a two-dimensional barcode with visual information using perceptual shaping watermarking in mobile applications
WO2016063570A1 (ja) 撮像抽出装置
JP2014219822A (ja) コンテンツ表示装置、コンテンツ表示方法、プログラム、及び、コンテンツ表示システム
US20200118296A1 (en) Determine image capture position information based on a quasi-periodic pattern
JP2019091976A (ja) プログラム、画像処理装置、および画像処理方法
JP6296319B1 (ja) 情報処理装置、表示方法、読取方法、およびコンピュータ読み取り可能な非一時的記憶媒体
Gourrame et al. Print-cam Resilient Watermarking based on Fourier Transform
Baldessari et al. Blind Print-Cam Data Hiding Exploiting Color Perception
WO2015146237A1 (ja) 静止画の関連情報検出装置,検出方法,検出プログラムならびにそのプログラムを格納した記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140430

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140430

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150807

R150 Certificate of patent or registration of utility model

Ref document number: 5802997

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees