JP6041789B2 - 入力信号を符号化する方法 - Google Patents
入力信号を符号化する方法 Download PDFInfo
- Publication number
- JP6041789B2 JP6041789B2 JP2013241500A JP2013241500A JP6041789B2 JP 6041789 B2 JP6041789 B2 JP 6041789B2 JP 2013241500 A JP2013241500 A JP 2013241500A JP 2013241500 A JP2013241500 A JP 2013241500A JP 6041789 B2 JP6041789 B2 JP 6041789B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- distance
- embedding
- signals
- embedded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
信号比較は、信号処理における最も重要で普及したタスクのうちの1つである。多数の用途は基本的に以下の2つの質問、すなわち、(1)信号をどのように比較するべきか?(2)1組の信号及びクエリ信号を所与として、いずれの信号がクエリ信号の最近傍であるか、すなわち、データベース内のいずれの他の信号がクエリ信号に最も類似しているか?に対する回答を求めることに依拠する。
通常の画像取出し用途では、クエリ画像(データ又は信号の形態)がクライアントによって未知のオブジェクト又はシーンから取得される。クエリ画像は、サーバーにあるデータベース内に記憶された既知のオブジェクト又はシーンのデータベース内の画像と比較され、類似した画像が判定される。上記で説明したように、類似度は未知のデータにおける特徴と既知のデータにおける特徴との間の距離として表すことができる。そのような用途の性能は、距離を効率的に符号化することによって大幅に改善することができる。探索は迅速で計算効率を良くするべきである一方、送信は帯域幅効率を良くするべきである。
コーディング理論が関与する1つの態様は、データの符号化に関するレート歪み(R−D)を最適化すること、すなわち、データにおいて被る歪みを最小にしながら、データを符号化するのに最小数のビットを用いることに取り組む。本明細書において用いられるとき、データ及び信号は交換可能に用いることができる。
埋込みは高次元データ(又は信号)をより低次元に変換し、データの相対的ジオメトリの或る態様、例えばデータの類似度の観点では距離が保持されるようにする。ジオメトリが保持されるので、距離計算は元の高次元データではなく低次元データ、多くの場合、低レートのデータ埋込みに対し直接実行することができる。
汎用スカラー量子化は、スカラー量子化を変更し、量子化器が不連続の量子化領域を有するように設計する。この手法もジョンソン−リンデンシュトラウス型の射影、それに続くスケーリング、ディザリング、及びスカラー量子化
本発明による埋込みの曖昧性を理解するために、ほとんどの埋込みによって提供される距離保証の一般的な形態を考える。詳細には、埋込みf:S→W、並びに信号空間における距離メトリックdS(・,・)及び埋込み空間における距離メトリックdW(・,・)を考える。入力信号x及びyの埋め込みは、全てのεについて埋込みが以下を満たす場合、(g,ε,τ)埋込みである。
量子化されたJ−L埋込みでは、g(d)=dであり、1までの一定の傾き(constant slope of to 1)を有する。このため、式(9)における分母は一定である。曖昧性を低減するには、分子を可能な限り低減するべきである。これにはεの大きさとτの大きさとの間のトレードオフが必要となる。値εは射影の次元Kによって制御される一方、値τは次元Bごとのレートによって制御される。Kが増大するとεは減少する。同様に、Bが増大するとτは減少する。
汎用埋込みでは、信号モデルにおけるいかなる情報も量子化器を設計するのに用いられない。これは、J−L埋込み及び圧縮検知(CS)等のランダム化されたサンプリング方法の大きな利点である。量子化されたJ−L埋込みと対照的に、汎用埋込みは埋込み次元あたり1ビットを用いる。このため、レートRによって、式(2)における埋込み保証の定数τのみでなく、射影の次元K=Rも決まる。
図2に示すように、図1に示すような方法811は以下のように画像取出し用途において用いることができる。クライアント810のユーザーは、クエリ画像801内のオブジェクトに関する情報を取り出すことを所望する。画像に関する埋込み情報815は、既知のオブジェクトの画像のデータベース825に接続されたサーバー820に提供される。各画像はオブジェクトのメタデータ826と関連付けられる。サーバーは埋め込み情報をデータベース内の画像に関する類似した情報と比較し(821)、所定の距離判定基準を用いてクエリ画像内のオブジェクトと最も一致する画像を判断し、そのオブジェクトの関連メタデータ830をクライアントに提供する。本明細書において説明されるように、これらのタスクは、クエリ画像及びデータベース画像から抽出された特徴の埋込みを求めることによって効率的に達成することができる。また、画像取出しについて説明しているが、本発明の同様の実施形態は、中でもビデオ、オーディオ又は発話等の他の種類の信号を取り出すのに用いることができる。
汎用埋込みの場合、サーバーは埋込みの仕様に従って埋込みパラメーター、例えばランダム行列A、ディザーベクトルw及びスケーリング係数Δを生成する。データベースを構築するのに、サーバーはS個の既知のオブジェクトの1組の画像I1,...,ITを取得する。オブジェクトごとに、サーバーは特定用途向けのメタデータDS(s∈{1,...,S})を得るか又は生成する。
クライアントが、例えば一時的なソフトウェア更新からサーバーによって用いられるか又はクライアントにおいてソフトウェアインストールの一部として含まれる埋込みパラメーターにアクセスを有することが仮定される。
サーバーはクライアントから{f(x1),...,f(xM)}を受信する。特徴ベクトルf(xm)ごとに、サーバーは、サーバーデータベースにおける、すなわち特徴{f(y1),...,f(yL)}の中の最近傍を求める。結果は埋込みf(xm)ごとに1対のM個の最近傍対である。M個の対から、サーバーは埋込み距離の観点から最近傍のJ個の対{f(x(j)),f(y(j))}(j=1,2,...,J)を選択する。例えばJ=20である。
本発明の実施の形態による符号化方法によって用いられる量子化された埋め込みはペアワイズ距離を保持し、それによってデータ又は信号は比較することができる。1つの用途ではデータは画像を表す。最近傍を特定することに対する特定の用途の問題では、符号化によって小さな距離しか保持する必要がない。この場合、汎用量子化埋込みは、量子化されたジョンソン−リンデンシュトラウス(J−L)埋込みよりも性能が優れている。これは、J−L埋込みでは距離の保持が不均一であることに起因する。
Claims (14)
- 入力信号を符号化する方法であって、
前記入力信号をランダムに射影するステップであって、それにより射影信号を生成するステップと、
前記射影信号をディザリングするステップであって、それによりディザリングされた信号を生成するステップと、
前記ディザリングされた信号をスケーリングするステップであって、それによりスケーリングされた信号を生成するステップと、
非単調スカラー量子化器を用いて前記スケーリングされた信号を量子化するステップであって、それにより埋込み信号を生成するステップと、を含み、前記ディザリング、前記射影及び前記量子化のパラメーターは、前記入力信号と別の同様に埋め込まれた入力信号との間の距離を、該距離が所定のしきい値距離未満である限り保持し、前記ステップはプロセッサにおいて実行される、入力信号を符号化する方法。 - 前記入力信号は、画像、ビデオ、オーディオ、発話及びそれらの組合せからなる群から選択される、請求項1に記載の方法。
- 前記入力信号は、画像、ビデオ、オーディオ信号、発話信号及びそれらの組合せから抽出された特徴からなる群から選択される、請求項1に記載の方法。
- 前記埋込み信号は前記入力信号よりも少ないビットを用いる、請求項1に記載の方法。
- 2つの入力信号間の前記距離は、対応する埋込み信号間のハミング距離を用いて求められる、請求項1に記載の方法。
- 前記スケーリングは前記信号の全ての係数について同一のスケーリング係数を用いる、請求項1に記載の方法。
- 前記スケーリングは前記信号の係数ごとに異なるスケーリング係数を用いる、請求項1に記載の方法。
- 請求項1に記載の方法であって、前記埋込み信号はクエリベクトルを形成し、該方法は、
クライアントからサーバーに前記クエリベクトルを送信するステップと、
クエリ信号を用いて、前記サーバー上のデータベースを類似した信号を求めて探索するステップと、
関連データを前記サーバーから前記クライアントに返すステップと、
を更に含む、請求項1に記載の方法。 - 前記関連データは前記信号のメタデータである、請求項8に記載の方法。
- 前記関連データは前記信号に類似した他の信号である、請求項8に記載の方法。
- 前記データベースは1組の埋込み信号を含む、請求項8に記載の方法。
- 前記探索するステップは最近傍探索を用いて行われる、請求項8に記載の方法。
- 前記類似した信号のクラスを用いるステップであって、それにより前記クエリ信号のクラスを求めるステップをさらに含む、請求項8に記載の方法。
- 前記用いるステップは、
前記類似した信号の前記クラスを検査するステップと、
前記クエリ信号の前記クラスを、選択された信号の前記クラスにおいて最も多く生じるクラスとして決定するステップと、
を含む、請求項13に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/733,517 | 2013-01-03 | ||
US13/733,517 US8768075B2 (en) | 2011-11-08 | 2013-01-03 | Method for coding signals with universal quantized embeddings |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014132439A JP2014132439A (ja) | 2014-07-17 |
JP6041789B2 true JP6041789B2 (ja) | 2016-12-14 |
Family
ID=51411484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013241500A Active JP6041789B2 (ja) | 2013-01-03 | 2013-11-22 | 入力信号を符号化する方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6041789B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9337815B1 (en) * | 2015-03-10 | 2016-05-10 | Mitsubishi Electric Research Laboratories, Inc. | Method for comparing signals using operator invariant embeddings |
US9818336B2 (en) * | 2016-03-22 | 2017-11-14 | Snaptrack Inc. | Vector dithering for displays employing subfields having unevenly spaced gray scale values |
CN113168839B (zh) * | 2018-12-13 | 2024-01-23 | 杜比实验室特许公司 | 双端媒体智能 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8631053B2 (en) * | 2009-08-31 | 2014-01-14 | Mitsubishi Electric Research Laboratories, Inc. | Method for securely determining Manhattan distances |
US8891878B2 (en) * | 2012-06-15 | 2014-11-18 | Mitsubishi Electric Research Laboratories, Inc. | Method for representing images using quantized embeddings of scale-invariant image features |
US8837727B2 (en) * | 2011-11-08 | 2014-09-16 | Mitsubishi Electric Research Laboratories, Inc. | Method for privacy preserving hashing of signals with binary embeddings |
-
2013
- 2013-11-22 JP JP2013241500A patent/JP6041789B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014132439A (ja) | 2014-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6599294B2 (ja) | 異常検知装置、学習装置、異常検知方法、学習方法、異常検知プログラム、および学習プログラム | |
Wang et al. | Exploring DCT coefficient quantization effects for local tampering detection | |
JP5911578B2 (ja) | 画像の特徴点位置情報を符号化する方法、コンピュータプログラム、モバイルデバイス | |
JP5950864B2 (ja) | スケール不変の画像特徴の量子化された埋込みを用いて画像を表現する方法 | |
US8768075B2 (en) | Method for coding signals with universal quantized embeddings | |
Boufounos et al. | Efficient Coding of Signal Distances Using Universal Quantized Embeddings. | |
Zhang et al. | A joint compression scheme of video feature descriptors and visual content | |
WO2023051783A1 (zh) | 一种编码方法、解码方法、装置、设备及可读存储介质 | |
JP2020191077A (ja) | 画像コーディング方法及び装置並びに画像デコーディング方法及び装置 | |
WO2015135493A1 (zh) | 一种局部特征描述子压缩方法、装置及存储介质 | |
US20100114871A1 (en) | Distance Quantization in Computing Distance in High Dimensional Space | |
WO2021081913A1 (zh) | 向量查询方法、装置、电子设备及存储介质 | |
JP6041789B2 (ja) | 入力信号を符号化する方法 | |
Hou et al. | Sparse representation for colors of 3D point cloud via virtual adaptive sampling | |
Vázquez et al. | Using normalized compression distance for image similarity measurement: an experimental study | |
Li et al. | Compact video fingerprinting via structural graphical models | |
JP5634075B2 (ja) | 画像のシーケンスを処理する方法および装置、画像データを処理する装置、ならびにコンピュータプログラム製品 | |
Vedaldi et al. | Joint data alignment up to (lossy) transformations | |
Lv et al. | Compressed binary image hashes based on semisupervised spectral embedding | |
Chen et al. | Efficient video hashing based on low‐rank frames | |
Nie et al. | Robust video hashing based on representative-dispersive frames | |
Laimeche et al. | A new feature extraction scheme in wavelet transform for stego image classification | |
Rane et al. | Quantized embeddings: An efficient and universal nearest neighbor method for cloud-based image retrieval | |
CN111601181B (zh) | 生成视频指纹数据的方法及装置 | |
CN111611450A (zh) | 跨媒介数据融合方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160711 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20160711 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20161003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161011 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6041789 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |