JP6271092B2 - 信号の埋め込みを生成する方法およびシステム - Google Patents

信号の埋め込みを生成する方法およびシステム Download PDF

Info

Publication number
JP6271092B2
JP6271092B2 JP2017528864A JP2017528864A JP6271092B2 JP 6271092 B2 JP6271092 B2 JP 6271092B2 JP 2017528864 A JP2017528864 A JP 2017528864A JP 2017528864 A JP2017528864 A JP 2017528864A JP 6271092 B2 JP6271092 B2 JP 6271092B2
Authority
JP
Japan
Prior art keywords
signal
embedding
signals
database
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017528864A
Other languages
English (en)
Other versions
JP2017539023A (ja
Inventor
ボウフォウノス、ペトロス・ティー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2017539023A publication Critical patent/JP2017539023A/ja
Application granted granted Critical
Publication of JP6271092B2 publication Critical patent/JP6271092B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03KPULSE TECHNIQUE
    • H03K5/00Manipulating of pulses not covered by one of the other main groups of this subclass
    • H03K5/125Discriminating pulses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32154Transform domain methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Nonlinear Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、包括的には、信号処理に関し、より詳細には、変換を受ける信号を比較することに関する。
多くの用途では、変換を受けた画像を表す信号、音信号、または産業オートメーション信号等の信号を比較することが望ましい。これらの変換は、平行移動、回転、拡大縮小等を含むことができる。さらに、信号は、変換の或る態様を制御するパラメーターを用いてパラメーター化することができる。例えば、変換が回転である場合、パラメーターは、回転の角度とすることができる。同様に、変換が平行移動である場合、パラメーターは、平行移動の量とすることができる。
そのような比較が必要であるいくつかの例がある。例えば、多くの用途では、コーナー、車両、または顔の画像等の処理されている画像の構成要素を識別することが必要である。これらの構成要素を識別するには、実例またはテンプレートである顔または自動車の画像が、識別されるために処理されている画像の要素と比較されるべきである。しかしながら、処理されている画像内の顔または自動車は、必ずしも、実例の画像内の顔または自動車と同じ縮尺、位置、または向きを有しない。
同様に、多くの産業用途では、機器監視センサーから取得された信号を、適切な機器動作の例であるテンプレート信号と比較することが望ましい。これらの信号が類似していないとき、これは、機器の機能不良を示すものであり、オペレーターに警告を発するべきである。しかしながら、そのような信号は、多くの場合、テンプレート信号と比較して、時間が平行移動(遅延)している。
そのような比較を行うにはいくつかの手法がある。最も一般的なものは、第1の信号を第2の信号の全ての変換と比較し、最もよく一致する信号を選択することである。この一致の質は、これらの信号が変換の下でどれだけ類似しているかを示す。この手法の1つの例は、これらの信号の自己相関を求め、この自己相関のピークを選択することである。これは、複数の用途において非常に一般的な手法である。この比較は、多くの場合、「インプレース(その場)」で、すなわち、全ての変換を明示的に求めることなく、行われる可能性がある。
図1は、従来の信号比較技法の概略図である。信号101および102は、類似し得るが、例えば、時間の平行移動に起因して何らかの方法で変換されている場合がある。一方、2つの信号103および104は、変換を考慮に入れても類似しない場合がある。類似性を特徴付ける距離メトリックを求めることが望まれている。例えば、1つの実施の形態では、この距離は、ユークリッド距離である。通常、これは、相互相関110を用いて実行される。この相互相関は、全ての可能な変換(すなわち、時間の平行移動)の下で2つの信号の相関を求める。これによって、全ての変換の下で信号の対応する信号距離115が得られる。この相互相関および対応する距離から、最大相関111、および対応する最小距離116が求められる。
その手法に関する問題は、単一の信号を、例えば、データベースに記憶された2つ以上の信号と比較して類似性を求める必要があるときの、本来的な計算複雑さである。なぜならば、信号のペアの比較は、検討された変換のうちのいくつかに従って本質的に多くの信号を比較し、最もよく一致するものを選択するからである。この計算は、比較が「インプレース」であっても、かなり大規模になる可能性がある。この問題は、以下で説明する代替の不変の手法において軽減される。
1つの代替の手法は、元の変換に対して不変である方法で、元の信号をさらに変換することである。換言すれば、元の信号が、所望の不変性に従って異なるシフト、回転または縮尺等を有するときであっても、変換された信号は同じである。この変換された信号は、その後、比較され、この比較の出力は、信号の類似性を求めるのに用いられる。
この変換は、通常、上記で説明したような信号の全てのペアの比較よりも、はるかに低い計算集約性を有する。このため、或る信号とデータベース内の多くの信号との比較をはるかに効率的にすることができる。他方、不変性手法に関する問題のうちの1つは、多くの場合、有意義な比較を行うのに十分な情報も保持する適切な不変性を有する変換を見つけることが困難または不可能であるということである。
類似の手法は、信号から所望の変換に対して不変である特徴を抽出するが、信号全体を変換しないものである。その場合、それらの特徴が比較され、一致するものが求められる。これは、縮尺不変特徴変換(SIFT)または勾配の圧縮ヒストグラム(CHoG)および他の類似の方法等の多くの一般的な画像記述子において採用される手法である。その手法の利点は、不変の記述子を抽出することが信号全体を変換することよりも容易であるということである。欠点は、これらの記述子が通常、画像内の物体の検出等の特定の用途および作業を念頭に置いて設計され、特に、この作業向けに調節されているということである。異なる作業ごとに、その作業に対して調節された適切な特性を有する異なる記述子を設計する必要がある。
上記問題を克服し、計算効率性を維持するために、本発明の実施の形態は、作用素不変埋め込み(operator invariant embeddings:演算子不変埋め込み)を生成する方法を提供する。これらの埋め込みは、従来の手法の欠点を伴うことなく、従来の手法の利点を組み合わせる方法を提供する。埋め込みは、従来の手法と異なり、汎用的であり、用途ごとまたは信号のタイプごとに特に設計する必要がない特徴抽出メカニズムを提供する。
さらに、埋め込み生成から得られた或る特定の情報を保持することが所望される場合、埋め込みは、作用素不変変換とみなすことができる。この場合、信号を埋め込みから回復することができる。埋め込みの計算は、信号を中間信号の集合およびそれらの全ての変換と比較することによって求めることができる。
後者の場合、各信号は、少数の中間信号の全ての変換と比較される。これらの比較は、他の信号から抽出された特徴と比較される特徴集合としての機能を果たす。このため、信号を、他の全ての信号の全ての変換と比較する計算コストは、削減される。なぜならば、網羅的な比較は、少数のテンプレート信号の変換の場合にしか行われないからである。この比較の結果が特徴であり、この特徴は、他の全ての信号から抽出された特徴と比較され、これは、はるかに高速な比較である。
従来の信号比較技法の概略図である。 本発明の1つの実施の形態による埋め込みを生成するプロセスの概略図である。 本発明の実施の形態による単一の係数または特徴を抽出するプロセスの概略図である。 本発明の実施の形態による単一の係数または特徴を抽出するプロセスの概略図である。 本発明の1つの実施の形態による信号クエリ実行の概略図である。 本発明の代替の実施の形態による信号クエリ実行の概略図である。 本発明の代替の実施の形態によるリモートに生成されたクライアント/サーバークエリの概略図である。 本発明の1つの実施の形態による図3Aおよび図3Bに示す概略図に対応する擬似コードである。
作用素不変埋め込み
図2は、作用素に対して不変である信号の埋め込みを生成する方法の1つの実施の形態を示している。測定ベクトルe 210のそれぞれは、取得された信号x 201を測定するのに用いられ、xの埋め込みをy 240として生成する。
信号は、前処理ステップにおいて、例えばセンサー205、例えばカメラ、マイクロフォン、または他のタイプのセンサーを用いて取得することができる(205)。信号は、視覚信号、例えば画像若しくはビデオ、オーディオ信号、例えば音声および音楽、または産業オートメーション信号とすることができる。代替的にまたは付加的に、信号は、当該信号から特徴を抽出するアプリケーション、例えば、画像処理アプリケーションまたは音声処理アプリケーションによって取得することができる。信号は、工場機器、機械システム、電池を含む電力貯蔵システム等の電気システムを検知するセンサーによって取得することもできる。
信号201は、測定プロセス220を用いて一組の測定ベクトルe 210のそれぞれによって測定され、一組の対応する係数230が生成される。全ての係数がベクトルに組み合わされて、埋め込み240 yが生成される。
本方法は、当該技術分野において知られているように、バスによってメモリおよび入力/出力インターフェースに接続されたプロセッサ200において実行することができる。
その後、埋め込みは、以下で説明するように、信号の類似性を比較するのに用いることができる。
信号類似性
2つの信号を比較するために、類似度または非類似度が、多くの場合に用いられる。類似度は、2つの信号が類似しているときは高く、2つの信号が類似していないときは低い。非類似度は、信号が類似しているときは低く、信号が類似していないときは高い。
非類似度の一例は、信号距離であり、これは、信号比較において非常に一般的に用いられる尺度である。対象となる信号の集合をSとし、2つの信号x、x’∈Sが与えられると、
Figure 0006271092
距離は、以下のように定義される。
Figure 0006271092
ここで、p≧1である。非常に類似している信号は、これらの信号が類似しているとき、小さな距離を有する。すなわち、x=x’であり、距離は0である。
一方の信号が、他方の信号の倍数である場合、いくつかの特定のアプリケーションは、それらの信号を同じであるとみなすことができるが、
Figure 0006271092
距離は、大きくなる可能性がある。その理由のために、多くの場合に、代替の類似度が用いられる。この代替の類似度は、最初に信号を正規化することと、次にそれらの信号の
Figure 0006271092
距離を求めることと、を含む。この尺度は、以下の式となる。
Figure 0006271092
別の部類の有用な類似度は、ダイバージェンスである。これらのダイバージェンスは、距離に類似している。例えば、ブレグマン(Bregman)ダイバージェンスが、多くの場合、信号を比較するのに用いられる。ブレグマンダイバージェンスは、三角不等式も対称性も満たさない場合もあるし、満たす場合もある。
最も有用な類似度のうちの1つは、信号相関cであり、以下のように定義される。
Figure 0006271092
距離尺度と同様に、信号にスカラーを乗算することによって、相関尺度によって測定されるそれらの信号の類似性が影響を受ける可能性がある。そのような場合、正規化された信号を用いる相関係数は、以下のとおりである。
Figure 0006271092
複数の用途において、互いに逆である2つの信号、すなわち、x≒−x’、または或るc>0についてx≒−cx’は、引き続き類似しているとみなされるべきである。そのような用途では、相関または相関係数の大きさ、すなわち、|c(x,x’)|または|ρ(x,x’)|は、信号のより適切な類似度である。
多くの場合に好ましい代替の類似度は、動径基底カーネルとして知られている関数に基づいている。動径基底カーネルは、カーネルが2つの信号の距離||x−x’||の関数にすぎないという定義特性(defining property)を有する。すなわち、カーネルは、或る適切なk(・)およびpについて以下のように定義される。
Figure 0006271092
最も一般的な動径基底カーネルのうちの2つが、ラプラシアンカーネルおよびガウシアンカーネルであり、それぞれ以下のように定義される。
Figure 0006271092
もちろん、他にもいくつかの類似度が存在し、この後に続く展開において用いることができる。
本発明の実施の形態による作用素不変埋め込みを設計するために、信号x、x’に加えて、パラメーターαによってパラメーター化された作用素Tα:S→Sを考慮する。埋め込みは、この作用素に対して不変であるように設計される。作用素Tαは、シフト、縮尺変更、回転等が画像等の信号をどのように変換するのかを特徴付ける。この作用素は、複数の変換、例えば、回転および縮尺変更の双方、若しくは回転およびシフトの双方、または3つ全てを特徴付けることもできる。
パラメーターαは、変換の特定の特性を特徴付ける。例えば、変換が回転である場合、αは回転の角度とすることができる。変換が平行移動である場合、αは平行移動の量とすることができる。作用素が複数の変換を組み合わせる場合、αは、各変換に必要とされるパラメーターのタプレット(tuplet)とすることができ、例えば、平行移動量および回転量の双方を含む。パラメーターαは、例えば、回転における値の範囲α∈Rを取ることができる。ここで、Rは、0〜2πまたはπ〜πの角度の範囲とすることができる。
パラメーターαの各値について、Tαを反転する変換に応じた反転値
Figure 0006271092
が存在する。すなわち、
Figure 0006271092
である。例えば、αの分だけ右への回転は、αの分だけ左への回転、すなわち−αの分だけ右への回転を用いて反転される。この回転は、2π−αの分だけ右への回転とも等価である。同様に、縮尺変更パラメーターαは、1/αによる縮尺変更を用いて反転される。
埋め込みは、作用素E:S→Vでもある。ここで、Sは、上記のように信号空間であり、Vは、埋め込み空間である。通常、埋め込み空間Vは、或るMについて、
Figure 0006271092
または
Figure 0006271092
である。この作用素は、全てのα∈Rおよび全てのx∈SについてE(x)≒E(Tα(x))である場合、Tαに対してほぼ不変であり、この近似式は、E(・)がTα(・)に対して正確に不変である場合、正確な等式となる。
非類似度は、一般に、d(x,x’)を用いて表されるか、または用途によって適宜、類似度s(x,x’)を用いて表される。類似性は、xがx’に類似している場合には高い値を有し、類似していない場合には低い値を有する。非類似性は、xがx’に類似している場合には低い値を有し、類似していない場合には高い値を有する。
E(・)を生成するために、複数の測定ベクトルe,i=1,・・・,M 210が用いられる。通常の実施の形態では、ベクトルは、ランダムに生成される。ベクトルの個数Mは、用途に依存する。例えば、Mは、速度と精度との間のトレードオフに基づくことができる。Mが大きいほど、精度は高くなる。一般に、Mは、信号の次元数よりもはるかに小さくあるべきであり、また、比較される信号の数に依存することができる。例えば、以下で説明するように、データベースのクエリおよび検索の用途では、Mは、データベース内の信号の数とともに対数的に増加する。通常の数は、用途タイプに依存する。例えば、埋め込みを用いて、画像内でテンプレートを探すとき、Mは、数百未満、通常は、200未満であることが予想される。
信号空間Sがどのようなものであるのかに応じて、ベクトルは、複数の方法で生成することができる。例えば、ベクトルは、Sにおける単位球面上の一様分布を用いて生成することができる。または、例えば、
Figure 0006271092
または
Figure 0006271092
である場合、各eは、ランダムな実N次元ベクトルまたは複素N次元ベクトルとして生成することができ、各ベクトル成分は、i.i.d.実正規分布またはi.i.d.複素正規分布から取り出される。代替的に、分布は、一様分布、ラーデマッヘル(Rademacher)分布、または他の部分ガウス実分布若しくは部分ガウス複素分布とすることができる。
測定プロセス220の実施の形態は、図3Aおよび図3Bを参照して、より詳細に説明される。
測定プロセス220を用いて信号201を測定するために、本発明の1つの実施の形態は、パラメーター集合から十分に微細な有限格子
Figure 0006271092
を生成する。すなわち、
Figure 0006271092
である。ここで、
Figure 0006271092
は、格子点の数である。一般に、格子が、全てのパラメーターα∈Rについて十分に微細である場合、十分に小さな許容誤差εについて
Figure 0006271092
である。例えば、αが平行移動および回転の双方を捕捉するものである場合、複数の許容誤差値を有する同様の保証が、マルチパラメーター格子用に提供されるべきである。ほとんどの実施態様において、格子は、パラメーターと、当該パラメーターを反転したものとを含むことが必要でなくても、これらを含む。すなわち、
Figure 0006271092
である。
図3Aは、各格子点につき1つである複数の変換を用いて各測定ベクトル210を変換するのに格子点がどのように用いられるのかを、例によって示している。特に、各格子点について、変換
Figure 0006271092
320は、測定ベクトルeを変換するのに用いられる。変換された各測定ベクトルは、類似性メトリックまたは非類似性メトリックを用いて信号201と比較される(310)。一致するものが選択され、信号と、変換された測定ベクトルの一致するものとの内積が求められる(340)。好ましい実施の形態では、一致するものは、選択されたメトリックに従って、最もよく一致したものとなるように選択される(330)。しかしながら、一致するものは、例えば、2番目に最もよく一致するものまたは3番目に最もよく一致するものとなる可能性もあるし、同じ測定ベクトルの異なる変換を用いると2つ以上の一致するものとなる可能性もある。図における例では、最もよく一致するものは、
Figure 0006271092
を通じた変換である。内積の結果yは、埋め込み240 yのi番目の係数230である。
代替のまたは追加の実施の形態が、図3Bに示されている。図3Bにおいて、信号201は、変換320において各パラメーターを用いて変換され、その結果は、類似性メトリックまたは非類似性メトリックを用いて測定ベクトル210と比較される(310)。係数230を生成するために、選択された一致するもの330を用いて、変換された信号と測定ベクトルとの内積340が計算される。
図3Aおよび図3Bの概略図に従って埋め込みを求める手順の擬似コードが図7に示されている。
好ましい実施の形態では、各測定ベクトルについて、本手順は、最初に、この測定ベクトルと信号との類似性を最大にするこの測定ベクトルの変換を求める(ステップ2)。これを行うために、本手順は、用途によって非類似性関数および類似性関数のうちのいずれが利用可能であるかに応じて、非類似性関数d(・,・)を最小にするかまたは類似性関数s(・,・)を最大にする。次に、本手順は、この変換を用いて信号を測定する(ステップ3)。ステップ2および3は、それぞれ以下の公式に置き換えることができることに留意されたい。
Figure 0006271092
全てではないが、ほとんどの変換において、双方の公式は等価であり、交換可能に用いることができる。
図7における公式は、図3Aに示す実施の形態に対応し、(8)および(9)における代替の公式は、図3Bの実施の形態に対応する。図7における擬似コードは、通常、実際のシステムにおいて実施が容易であり、特に、多数の信号を測定するときに実施が容易である。
埋め込み関数の主な出力は、測定値のベクトルyである。任意選択で、用途がシフトを必要としている場合、この関数は、最適な変換パラメーター
Figure 0006271092
も返す。いくつかの実施の形態では、パラメーターを用いて、埋め込みから信号を再構成または近似的に再構成することができる。パラメーターを用いて、類似している信号の相対変換を見つけることもできる。
2つの信号x、x’およびそれらの埋め込みy=E(x)、y’=E(x’)が与えられると、次に、それらの類似性または非類似性は、Vにおける近似的に定義された類似性関数s(y,y’)または非類似性関数d(y,y’)を用いて評価することができる。この類似性または非類似性は、パラメーター集合Rから取得されたパラメーターを用いて、xの全ての変換をx’の全ての変換と比較したときの最大の類似性または最小の非類似性を近似的に表す。
実施の形態が、埋め込みを計算するのに用いられる最適な変換パラメーターも保持している場合、2つの信号を埋め込むのに用いられるパラメーターを比較して、これらの信号を整合または一致させる最適な変換を生成することができる。例えば、パラメーターの平均若しくは中央の相対値、または最もよく一致する係数の平均若しくは中央の相対値は、一方の信号が他方の信号に一致するために受けるべき相対変換の推定値とすることができる。
埋め込みベクトルは、適切な量子化関数を用いてq=Q(y)に量子化することもできる。これは、例えば、埋め込みを記憶または送信すべきであり、用いられるビットレートを削減する必要がある場合に、非常に有用である。
埋め込みとの比較に基づいて信号取り出しの速度をさらに改善するために、埋め込みのハッシュh=H(y)を求めることもでき、このハッシュは、さらに局所鋭敏ハッシュ(LSH:locality sensitive hash)とすることができる。
使用法およびプロトコル
これらの埋め込みのいくつかの使用法がある。最も重要なもののうちの1つは、データベース、例えば画像のデータベースからの作用素不変信号取り出しである。この用途では、着信したクエリ信号に類似した信号を得るために、信号のデータベースが、作用素不変方法を用いて検索される。データベースは、当該データベース内の全ての信号の埋め込みを求め、これらの埋め込みをインデックスとしてデータベースに記憶することによる適切な作用素不変埋め込みを用いて準備される。
クエリが実行されると、クエリ信号の埋め込みが最初に求められる。この埋め込みは、データベース内の全ての信号の埋め込みと比較される。用途に応じて、最も密接に一致するもの若しくは複数の最も密接に一致するものが返されるか、または密接に一致するものがデータベースに存在する表示若しくは存在しない表示が返される。これは、クエリ信号を、パラメーター空間内の全てのパラメーターについてのデータベース内の全ての信号の全ての変換と比較するという代替形態と対比したとき、はるかに高速な比較である。データベースを準備する初期計算コストは、特に、多くのクエリを実行する必要があるときは少ない。
データベース内の全ての信号から、局所鋭敏ハッシュがそれらの埋め込みから求められ、信号およびその埋め込みとともに記憶されている場合に、クエリ時間をさらに削減することができる。クエリが実行されると、ハッシュが、同じハッシュ関数を用いて埋め込みから求められる。同じハッシュを有するデータベース内の少数の信号のみが比較のために選択される。
図4および図5は、本発明の実施の形態による、信号のデータベースを準備し、このデータベースにクエリする方法を概略的に示している。
図4は、上記で説明した埋め込みをハッシュすることなくどのように用いて、信号のデータベース450を準備し、このデータベースにクエリすることができるのかを示している。データベースは、最初に、次のように準備される(420)。各信号x 421について、埋め込みyが計算される(422)。この埋め込みは、信号とともにペア(x,y)423を形成する。このペアは、インデックスエントリーである。全てのインデックスエントリーが、データベース450に記憶されたインデックスに記憶され、当該技術分野において既知のインデックス付け方法を用いてデータベースをインデックス付けするのに用いられる。
クエリ信号x’ 411を用いてデータベースにクエリするために、このクエリ信号の埋め込みy’ 412を計算することによってクエリが準備される(410)。クエリは、クエリ信号の埋め込みy’をデータベース450内の信号のそれぞれの埋め込みyと比較する(413)ことによって実行される。一致する信号が、クエリ結果として選択される。最もよく一致するものまたはいくつかの一致するものは、クエリ結果414を含む。これらのステップも、データベースに接続されたプロセッサにおいて実行することができる。
クエリの出力415は、クエリ結果に基づいている。例えば、この出力は、一致する信号自体とすることもできるし、一致する信号に関連付けられたメタデータとすることもできるし、ユーザーに対してアクセスを許可するかまたは不許可とするような、一致する信号に基づく判定とすることもできる。
図5は、埋め込みをハッシュとともにどのように用いて、信号のデータベースを準備し、このデータベースにクエリすることができるのかを示している。図4と同様に、データベースは、最初に、各信号x 521の埋め込みyを計算する(522)ことによって準備される(520)。ハッシュhは、埋め込み523から計算される。全ての信号からのハッシュは、インデックスエントリーであり、データベース550のインデックス524を作成するのに用いられる。このインデックスは、当該技術分野において既知のインデックス付け方法を用いて、信号と、埋め込みのハッシュによるそれらの信号の埋め込みとをインデックス付けする。
クエリは、同様の形式で準備される(510)。クエリ信号511の埋め込みが計算され(512)、埋め込みのハッシュが計算される(513)。ハッシュと、全ての実施の形態ではなくいくつかの実施の形態では埋め込み自体とを用いて、データベースがクエリされる。
クエリは、データベースのインデックスから、クエリハッシュと同じハッシュを有する全ての信号のリストを取り出すことによって実行される(514)。これらは全て、データベースからの一致する信号である。クエリ埋め込みも取り出しにおいて用いられる場合、一致する信号の数を減らすために、取り出された信号の埋め込みは、クエリ信号の埋め込みとも比較することができる。これらの一致する信号がクエリ結果515である。いくつかの実施の形態では、複数のハッシュを用いて、当該技術分野においてよく知られた方法を用いた取り出しの精度を高めることができる。
図4における実施の形態と同様に、この実施の形態では、クエリの出力516は、クエリ結果に基づいている。例えば、この出力は、一致する信号自体とすることもできるし、一致する信号に関連付けられたメタデータとすることもできるし、ユーザーに対してアクセスを許可するかまたは不許可とするような、一致する信号に基づく判定とすることもできる。
図6に示す好ましい実施の形態では、クエリがリモートに生成される。すなわち、クエリ準備510を実行し、サーバー602に記憶されたデータベース550にネットワークを用いてクエリするクライアント601が存在する。このデータベースは、上記で説明したプロトコルを用いて既に準備されている(520)。そのような場合、クライアントは、信号、または信号の圧縮したものを送信することができ、データベースは、場合によっては信号を伸長した後に上記プロトコルに従う。代替的に、クライアントは、他の或る方法で埋め込みを求め、埋め込みを量子化し、または埋め込みを符号化若しくは圧縮することができ、この埋め込みをサーバーに送信して、検索プロトコル514を続けることができる。サーバーは、一致する信号515を取り出し、クエリ出力516をクライアントに送信する。図6は、図5において説明したインデックス付きデータベースを用いたクライアント/サーバーの実施の形態を例示しているが、同様の方法で、図4において説明したデータベース準備に基づくクライアント/サーバーの実施の形態を実施することも可能である。

Claims (37)

  1. 作用素に対して不変である、信号の埋め込みを生成する方法であって、
    測定ベクトルの集合からの各ベクトルを用いて前記信号を測定して、対応する係数の集合を生成するステップであって、各測定ベクトルと前記信号とを比較し、前記作用素を用いて各測定ベクトルおよび前記信号を変換する、測定するステップと、
    既定の基準に従った1つまたは複数の一致する係数の集合を選択するステップと、
    前記一致する係数を組み合わせて、前記信号の前記埋め込みを生成するステップであって、前記埋め込みは、作用素不変である、生成するステップと
    を含み、前記ステップは、プロセッサにおいて実行される、方法。
  2. 2つの信号のそれぞれについて前記埋め込みを生成するステップと、
    前記2つの信号の前記埋め込みを比較して、比較結果を生成するステップと
    をさらに含む、請求項1に記載の方法。
  3. 信号のデータベースに記憶された各信号について前記埋め込みを生成するステップと、
    各信号を前記埋め込みに関連付けて、インデックスエントリーを生成するステップと、
    前記インデックスエントリーをインデックステーブルに記憶するステップと
    をさらに含む、請求項1に記載の方法。
  4. クエリ信号の埋め込みを生成するステップと、
    前記インデックスエントリーを用いて、前記クエリ信号の前記埋め込みを、前記データベースに記憶された前記信号の前記埋め込みと比較するステップと、
    前記クエリ信号の前記埋め込みに対応する、一致する埋め込みを有する前記データベース内の前記信号を取り出すステップと
    をさらに含む、請求項3に記載の方法。
  5. 前記測定ベクトルの集合をランダムに生成するステップ
    をさらに含む、請求項1に記載の方法。
  6. 前記選択するステップは、類似性メトリックを用いる、請求項1に記載の方法。
  7. 前記選択するステップは、非類似性メトリックを用いる、請求項1に記載の方法。
  8. 前記比較するステップは、類似性メトリックを用いる、請求項2に記載の方法。
  9. 前記比較するステップは、非類似性メトリックを用いる、請求項2に記載の方法。
  10. 前記一致する係数は、最もよく一致する係数である、請求項1に記載の方法。
  11. 前記非類似性メトリックは、2つの信号間の距離を計算するものである、請求項7または9に記載の方法。
  12. 前記距離は、ユークリッド距離である、請求項11に記載の方法。
  13. 前記非類似性メトリックは、ダイバージェンスである、請求項7または9に記載の方法。
  14. 前記ダイバージェンスは、ブレグマンダイバージェンスである、請求項13に記載の方法。
  15. 前記類似性メトリックは、相関である、請求項6または8に記載の方法。
  16. 前記類似性メトリックは、相関の大きさである、請求項6または8に記載の方法。
  17. 前記類似性メトリックは、類似性カーネルを用いて測定される、請求項6または8に記載の方法。
  18. 前記類似性カーネルは、動径基底カーネルである、請求項17に記載の方法。
  19. 前記作用素は、シフト、縮尺変更、または回転、およびそれらの組み合わせを特徴付ける、請求項1に記載の方法。
  20. 前記作用素は、前記信号の変換を特徴付ける、請求項1に記載の方法。
  21. 前記変換の特定の特性が、パラメーターによって特徴付けられる、請求項20に記載の方法。
  22. 前記測定ベクトルの数は、前記信号の次元数よりも少ない、請求項1に記載の方法。
  23. 前記測定ベクトルは、信号空間における単位球面上に一様に分布している、請求項1に記載の方法。
  24. 前記埋め込みを量子化するステップ
    をさらに含む、請求項1に記載の方法。
  25. 前記埋め込みを前記比較するステップは、前記埋め込みのハッシュを用いる、請求項1または4に記載の方法。
  26. 前記関連付けるステップも、前記埋め込みのハッシュを用いて、インデックスエントリーを生成する、請求項3に記載の方法。
  27. 前記信号は、画像である、請求項1に記載の方法。
  28. 前記信号は、センサーによって生成される、請求項1に記載の方法。
  29. 前記センサーは、機械システムを検知するものである、請求項28に記載の方法。
  30. 前記機械システムは、工場機器である、請求項29に記載の方法。
  31. 前記センサーは、電気システムを検知するものである、請求項29に記載の方法。
  32. 前記電気システムは、電力貯蔵システムである、請求項31に記載の方法。
  33. 前記電力貯蔵システムは、電池を含む、請求項32に記載の方法。
  34. 前記データベースに記憶された前記信号に関連付けられたメタデータを取り出すステップ
    をさらに含む、請求項4に記載の方法。
  35. 作用素に対して不変である、信号の埋め込みを生成するシステムであって、
    前記信号を取得する手段と、
    前記取得する手段に接続されたプロセッサであって、
    測定ベクトルの集合からの各ベクトルを用いて前記信号を測定して、対応する係数の集合を生成し、なお、前記測定は、各測定ベクトルと前記信号とを比較し、前記作用素を用いて各測定ベクトルおよび前記信号を変換し、
    既定の基準に従って1つまたは複数の一致する係数の集合を選択し、
    前記一致する係数を組み合わせて、前記信号の前記埋め込みを生成し、ここで、前記埋め込みは、作用素不変である、
    ように構成されたプロセッサと
    を備える、システム。
  36. 前記取得する手段は、センサーを含む、請求項35に記載のシステム。
  37. 前記プロセッサは、クライアントであり、該クライアントは、クエリ信号の埋め込みを生成するように構成され、
    信号および該信号のそれぞれの前記埋め込みを記憶するデータベースを備えるサーバーと、
    前記クエリ信号の前記埋め込みを前記データベースに記憶された全ての前記信号の前記埋め込みと比較することと、
    前記クエリ信号の前記埋め込みと一致する前記埋め込みに対応する前記データベース内の前記信号を取り出すことと
    をさらに備える請求項35に記載のシステム。
JP2017528864A 2015-03-10 2016-02-23 信号の埋め込みを生成する方法およびシステム Active JP6271092B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/643,153 2015-03-10
US14/643,153 US9337815B1 (en) 2015-03-10 2015-03-10 Method for comparing signals using operator invariant embeddings
PCT/JP2016/055962 WO2016143569A1 (en) 2015-03-10 2016-02-23 Method and system for generating embedding for signal

Publications (2)

Publication Number Publication Date
JP2017539023A JP2017539023A (ja) 2017-12-28
JP6271092B2 true JP6271092B2 (ja) 2018-01-31

Family

ID=55640798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017528864A Active JP6271092B2 (ja) 2015-03-10 2016-02-23 信号の埋め込みを生成する方法およびシステム

Country Status (5)

Country Link
US (1) US9337815B1 (ja)
EP (1) EP3269132A1 (ja)
JP (1) JP6271092B2 (ja)
CN (1) CN107408129B (ja)
WO (1) WO2016143569A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
WO2020132693A1 (en) * 2018-12-21 2020-06-25 Waymo Llc Searching an autonomous vehicle sensor data repository

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3960151B2 (ja) * 2002-07-09 2007-08-15 ソニー株式会社 類似時系列検出方法及び装置、並びにプログラム
DE102004028694B3 (de) * 2004-06-14 2005-12-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen eines Informationssignals in eine Spektraldarstellung mit variabler Auflösung
DE102004028693B4 (de) * 2004-06-14 2009-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Bestimmen eines Akkordtyps, der einem Testsignal zugrunde liegt
US8754947B2 (en) * 2008-05-07 2014-06-17 Evertz Microsystems Ltd. Systems and methods for comparing media signals
US8891878B2 (en) * 2012-06-15 2014-11-18 Mitsubishi Electric Research Laboratories, Inc. Method for representing images using quantized embeddings of scale-invariant image features
US8768075B2 (en) * 2011-11-08 2014-07-01 Mitsubishi Electric Research Laboratories, Inc. Method for coding signals with universal quantized embeddings
JP6041789B2 (ja) * 2013-01-03 2016-12-14 三菱電機株式会社 入力信号を符号化する方法
CN104009973B (zh) * 2014-05-08 2017-04-05 电子科技大学 一种基于集合多项式变换与调和的指纹细节信息隐藏与恢复方法

Also Published As

Publication number Publication date
JP2017539023A (ja) 2017-12-28
CN107408129A (zh) 2017-11-28
CN107408129B (zh) 2020-09-25
US9337815B1 (en) 2016-05-10
WO2016143569A1 (en) 2016-09-15
EP3269132A1 (en) 2018-01-17

Similar Documents

Publication Publication Date Title
JP5926291B2 (ja) 類似画像を識別する方法および装置
Jégou et al. Aggregating local image descriptors into compact codes
Husain et al. Improving large-scale image retrieval through robust aggregation of local descriptors
AU2011326269B2 (en) Vector transformation for indexing, similarity search and classification
KR100353798B1 (ko) 영상 객체 모양 정보 추출 방법 및 그를 이용한 내용기반 이미지 검색 시스템 및 그 방법
Revaud et al. Event retrieval in large video collections with circulant temporal encoding
WO2017020741A1 (zh) 图像检索、获取图像信息及图像识别方法、装置及系统
JP5950864B2 (ja) スケール不変の画像特徴の量子化された埋込みを用いて画像を表現する方法
Zhou et al. Towards codebook-free: Scalable cascaded hashing for mobile image search
US10796196B2 (en) Large scale image recognition using global signatures and local feature information
EP3023882B1 (en) Method and apparatus for generating fingerprint of an audio signal
KR20130142191A (ko) 비주얼 탐색을 위한 강건한 특징 매칭
JP2019502982A5 (ja)
US20130343654A1 (en) Generating a binary descriptor representing an image patch
JP2017529584A (ja) 指紋照合及びカメラ識別を向上させる方法、デバイス、及びそのシステム
JP6271092B2 (ja) 信号の埋め込みを生成する方法およびシステム
Lv et al. Compressed binary image hashes based on semisupervised spectral embedding
JP2014178857A (ja) 画像検索システム及び画像検索方法
JP2009134466A (ja) 認識処理装置、方法及びコンピュータプログラム
Du et al. Large-scale signature matching using multi-stage hashing
WO2021007999A1 (zh) 视频帧处理方法及装置
KR20140077409A (ko) 다수의 특징을 이용한 순차적 바이너리 코드 학습 방법 및 학습 장치
Prakhya et al. On creating low dimensional 3D feature descriptors with PCA
Du et al. Mvss: Mobile visual search based on saliency
Vijayanandh et al. Tamper detection of medical images using statistical moments against various attacks

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20171002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171226

R150 Certificate of patent or registration of utility model

Ref document number: 6271092

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250