JP7256834B2 - マルチメディアコンテンツの検索方法、マルチメディアコンテンツの検索装置、電子デバイス、記憶媒体及びコンピュータプログラム製品 - Google Patents

マルチメディアコンテンツの検索方法、マルチメディアコンテンツの検索装置、電子デバイス、記憶媒体及びコンピュータプログラム製品 Download PDF

Info

Publication number
JP7256834B2
JP7256834B2 JP2021048959A JP2021048959A JP7256834B2 JP 7256834 B2 JP7256834 B2 JP 7256834B2 JP 2021048959 A JP2021048959 A JP 2021048959A JP 2021048959 A JP2021048959 A JP 2021048959A JP 7256834 B2 JP7256834 B2 JP 7256834B2
Authority
JP
Japan
Prior art keywords
vector
vectors
multimedia content
classification
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021048959A
Other languages
English (en)
Other versions
JP2021103557A (ja
Inventor
涼 陰
乾坤 盧
蓮 趙
林 劉
青 許
翔 賀
▲ヤ▼博 範
玉磊 錢
峰 任
志鵬 金
巧華 王
磊 申
雲政 劉
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Publication of JP2021103557A publication Critical patent/JP2021103557A/ja
Application granted granted Critical
Publication of JP7256834B2 publication Critical patent/JP7256834B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/535Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/45Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本願は、コンピュータの技術分野におけるスマート検索の技術分野に関し、特にマルチメディアコンテンツの検索方法、マルチメディアコンテンツの検索装置、電子デバイス、記憶媒体及びコンピュータプログラム製品に関する。
幾つかのシーンにおいて、常に検索により、関連のマルチメディアコンテンツを取得する必要があり、例えば、画像を検索することにより広告画像を実現する。しかしながら、現在で検索際にクエリ情報(例えば、広告及び画像の説明テキスト)に対して言葉分割を行い、かつ一次スクリーニングを行って、スクリーニングされた結果に対してマルチメディアコンテンツの特徴を抽出してマルチメディアコンテンツの特徴データベースを作成し、その後にクエリ情報の特徴及びマルチメディアコンテンツの特徴を利用して類似度の計算を行い、即ちグローバル空間において力まかせ検索を行うことに相当し、このような検索に多くの時間を消費するため、検索効率が低くなる。
本願は、検索効率が低いという課題を解決するために、マルチメディアコンテンツの検索方法、マルチメディアコンテンツの検索装置、電子デバイス、記憶媒体及びコンピュータプログラム製品を提供する。
本願の第1の態様として、クエリ情報のクエリベクトルを取得することと、対応するマルチメディアコンテンツに関連付けられるベクトルを複数含む分類を複数含む検索ライブラリから、前記クエリベクトルにマッチングする第1の分類を決定することと、前記第1の分類において、前記クエリベクトルにマッチングするターゲットベクトルをクエリし、かつ前記ターゲットベクトルに対応するマルチメディアコンテンツを取得することとを含み、前記クエリベクトルは、クエリ情報のベクトルを回転させ量子化したベクトルであり、前記検索ライブラリ内のベクトルは、回転して量子化されたベクトルであり、かつ回転前に、前記検索ライブラリ内のベクトルの該当する分類の中心点ベクトルによりベクトル中心化処理が行われ、前記検索ライブラリ内のベクトルの回転の前に、共分散行列に対して固有値分解を行って固有値と固有ベクトルを得て、前記検索ライブラリ内のベクトルの回転のための転置行列を構築し、前記共分散行列は、
Figure 0007256834000001
との式により計算され、covは、前記共分散行列を表し、cは、前記検索ライブラリ内のベクトルの該当する分類の内の全てのベクトル内積の和であり、nは、前記検索ライブラリ内のベクトルの該当する分類でのベクトル本数であり、vは、前記検索ライブラリ内のベクトルの該当する分類の中心点ベクトルであるマルチメディアコンテンツの検索方法を提供する。
本願の第2の態様として、エリ情報のクエリベクトルを取得する第1の取得モジュールと、対応するマルチメディアコンテンツに関連付けられるベクトルを複数含む分類を複数含む検索ライブラリから、前記クエリベクトルにマッチングする第1の分類を決定する決定モジュールと、前記第1の分類において、前記クエリベクトルにマッチングするターゲットベクトルをクエリし、かつ前記ターゲットベクトルに対応するマルチメディアコンテンツを取得する第2の取得モジュールとを備え、前記クエリベクトルは、クエリ情報のベクトルを回転させ量子化したベクトルであり、前記検索ライブラリ内のベクトルは、回転して量子化されたベクトルであり、かつ回転前に、前記検索ライブラリ内のベクトルの該当する分類の中心点ベクトルによりベクトル中心化処理が行われ、前記検索ライブラリ内のベクトルの回転の前に、共分散行列に対して固有値分解を行って固有値と固有ベクトルを得て、前記検索ライブラリ内のベクトルの回転のための転置行列を構築し、前記共分散行列は、
Figure 0007256834000002
との式により計算され、covは、前記共分散行列を表し、cは、前記検索ライブラリ内のベクトルの該当する分類の内の全てのベクトル内積の和であり、nは、前記検索ライブラリ内のベクトルの該当する分類でのベクトル本数であり、vは、前記検索ライブラリ内のベクトルの該当する分類の中心点ベクトルであるマルチメディアコンテンツの検索装置を提供する。
本願の第3の態様として、少なくとも1つのプロセッサと、少なくとも1つの該プロセッサに通信可能に接続されているメモリとを備え、該メモリには、少なくとも1つの前記プロセッサに実行可能で、少なくとも1つの前記プロセッサによって実行されると、少なくとも1つの前記プロセッサに上記のマルチメディアコンテンツの検索方法を実行させる命令が記憶されている電子デバイスを提供する。
本願の第4の態様として、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、上記のマルチメディアコンテンツの検索方法を前記コンピュータに実行させる非一時的なコンピュータ読み取り可能な記憶媒体を提供する。
本願の第5の態様として、プロセッサによって実行されると、上記のマルチメディアコンテンツの検索方法が実現されるコンピュータプログラムを提供する。
本願に係る技術手段は、検索効率を向上させる。
本部分で説明された内容は、本開示の実施例の主要又は重要な特徴を特定することを意図するものではなく、本開示の範囲を限定するためのものでもないことを理解されたい。本開示の他の特徴は、以下の明細書により容易に理解される。
図面は、本解決手段をよりよく理解するためのものであり、本願を限定するものではない。
本願に係るマルチメディアコンテンツの検索方法のフローチャートである。 本願に係る中心ベクトルを決定する概略図である。 本願に係るマルチメディアコンテンツの検索装置の構造図である。 本願の実施例に係るマルチメディアコンテンツの検索方法を実現する電子デバイスのブロック図である。
以下、図面を参照しながら、本願の例示的な実施例を説明し、理解を容易にするために、本願の実施例の様々な詳細を含み、それらが例示的なものであると見なされるべきである。したがって、本願の範囲及び精神から逸脱することなく、ここで説明された実施例に対して様々な変更及び修正を行うことができることは、当業者によって認識される。同様に、以下の説明では、明確さと簡潔さのために、公知の機能及び構造についての説明は省略される。
図1を参照すると、図1は、本願に係るマルチメディアコンテンツの検索方法のフローチャートであり、図1に示されるように、ステップS101からステップS103を含む。
ステップS101として、クエリ情報のクエリクエリベクトルを取得する。
クエリ情報は、ユーザが入力したクエリ情報、又は電子デバイスが自動的に生成したクエリ情報であってよく、かつ画像、文字、音声などの情報であってよい。
クエリベクトルは、クエリ情報の量子化によるベクトルであってもよく、クエリ情報の固有ベクトルであってもよい。
ステップS102として、対応するマルチメディアコンテンツに関連付けられるベクトルを複数含む分類を複数含む検索ライブラリから、クエリベクトルにマッチングする第1の分類を決定する。
検索ライブラリは、ローカル又はリモートの検索ライブラリであってよく、かつ分散型検索ライブラリ又は非分散型検索ライブラリであってよい。
検索ライブラリは、複数のベクトルを含む分類を複数含む。さらに、複数の分類は、クラスタリングアルゴリズムにより複数のベクトルをクラスタリングして得られた複数の分類であってよく、例えば、分散型k平均値クラスタリング(k-means)アルゴリズムにより複数の分類を取得する。
なお、本願では、分類を粗分類器又はクラスタリングとして呼んでよい。
クエリベクトルにマッチングする第1の分類は、分類内のベクトルがクエリベクトルにマッチングする1つ以上の分類であってよく、ここでのマッチングとは、類似するか又はベクトル残差の小さいことを意味してよい。
本願では、ベクトルが対応するマルチメディアコンテンツに関連付けられることは、各マルチメディアコンテンツが1つ以上のベクトルに関連付けられることであってよく、かつマルチメディアコンテンツに関連付けられるベクトルは、マルチメディアコンテンツの関連情報を量子化して得られたベクトルであってよく、例えば、キーワード、記載情報、ラベル、画像コンテンツ、名称などの情報を量子化して得られたベクトルである。又は、マルチメディアコンテンツの固有ベクトルであってよい。
本願では、マルチメディアコンテンツは、画像、ビデオ又はテキストであってもよく、画像と、ビデオと、テキストとの間の組み合わせであってもよい。
ステップS103として、第1の分類において、クエリベクトルにマッチングするターゲットベクトルをクエリし、かつターゲットベクトルに対応するマルチメディアコンテンツを取得する。
第1の分類において、クエリベクトルにマッチングするターゲットベクトルをクエリするステップは、第1の分類において、クエリベクトルにマッチングする1つ以上のベクトルをクエリするステップであってもよい。ここでのマッチングは、類似度マッチング又は残差マッチングであってよく、例えば、残差マッチングである。
好ましくは、近似最近傍探索(Approximate Nearest Neighbor、ANN)の方式を使用して第1の分類において上記ターゲットベクトルを決定することができる。
ターゲットベクトルを決定すると、それに関連付けられるマルチメディアコンテンツをさらに決定することができる。
本願は、マルチメディアコンテンツの関連ベクトルを検索ライブラリのインデックスとし、かつ分類を予め決定して、分類において検索することにより、検索効率を向上させることを実現することができる。
また、本願において使用されるベクトルは、w2vモデル、bertモデル又はernieモデルなどのモデルによって得られたベクトルであってもよい。ベクトルを使用して検出を行うため、類似度の計算をより正確にし、リコールの正確率をさらに向上させる。さらに、ベクトルによりマルチメディアコンテンツを検索するため、検索際に転置インデックスの方式を使用して力まかせ計算を避け、最終的なマルチメディアコンテンツをリコールすることを実現することができる。
なお、本願は、広告設定シーンに適用されてもよく、当然のことながら、これに限定されるものではなく、他のマルチメディアコンテンツの検索のシーンに適用されてもよい。
さらに、上記のマルチメディアコンテンツの検索方法は、サーバ、コンピュータ、携帯電話などの電子デバイスに適用することができる。
好ましい実施形態として、検索ライブラリから、クエリベクトルにマッチングする第1の分類を決定するステップは、検索ライブラリ内の複数の分類の中心点ベクトルとクエリベクトルとの残差をそれぞれ計算し、かつ残差に基づいて第1の分類を決定することを含み、検索ライブラリ内の各分類は、中心点ベクトルを含んでいてもよい。
第1の分類は、複数の分類のうちの、残差が最も小さい1つ以上の分類、又は残差に基づく順序付けにおける最初のN個の分類であってもよい。さらに、残差を中心点ベクトルとクエリベクトルとの間の距離、例えば、対称的な距離(SDC)又は非対称的な距離(ADC)として理解してもよい。さらに、第1の分類は、残差に対してローカル回転(local rotation)を行って最初のN個の分類を採用するものであってもよい。ローカル回転が採用する回転ベクトルのノルムは1であってもよく、このようにADCを使用して順序付けるとき、回転後に最初のN個の分類をADC順序付けとして採用することは、既存の順序と同等である。
最も小さい1つ以上の分類、又は残差に基づく順序付けにおける最初のN個の分類について、本実施形態においては、クエリベクトルと中心点ベクトルとの残差を計算するだけで、第1の分類を決定することができるため、計算量を削減して、検索効率をさらに向上させることができる。
好ましくは、検索ライブラリのターゲット分類の中心点ベクトルは、ターゲット分類に含まれる全てのベクトルの和及び/又はターゲット分類に含まれるベクトル数量に基づいて決定されるものであり、ターゲット分類は、上記検索ライブラリ内のいずれか1つの分類であってもよい。
ターゲット分類に含まれる全てのベクトルの和及び/又はターゲット分類に含まれるベクトル数量に基づいて決定されるものは、分類の反復プロセスにおいて、ターゲット分類に含まれる全てのベクトルの和及び/又はターゲット分類に含まれるベクトル数量に基づいて決定された中心点ベクトルの変化量、例えば、距離の残差であってもよい。例えば、各分類に対して1つの中心点ベクトルを予め選択した後に、分類の反復プロセスにおいて、分類に含まれる全てのベクトルの和及び分類に含まれるベクトル数量に基づいて中心点ベクトルの変化量を計算して、新たな中心点ベクトルを決定する。また、ベクトルと中心点との距離については、各ベクトルを幾つかのセグメントに分け(中心点ベクトルに対しても同じ操作を行う)、各セグメントから中心点ベクトルの対応するセグメントまでの距離の和を計算して、セグメントから中心点ベクトルまでの距離を得ることができ、このように異なるセグメントのベクトルをそれぞれコードすることにより検索効率を向上させることができる。
図2に示されるように、テーブル(例えば、elf_table)において記憶されているものは、分類の中心点のid、分類内の全てのベクトルの和、及び分類内のベクトルの本数を含む分類の中心点に関する記載情報である。分散型システムでは、各ノードは、テーブルにおいて記憶されている全ての分類の中心点を独立に取得し、分類内の全てのベクトルの和及び/又はベクトルの本数に基づいて各中心点(又はクラスター重心点と呼ばれる)を計算する。新たな中心点を計算するとき、本ノード全てのベクトルの中心点の変化量を順次計算する。ここで中心点を再計算することなく、中心点の変化量のみを計算し、このように、まず、中心点を毎回再計算するときにベクトルのシリアル化及び逆シリアル化と統合による時間のオーバーヘッドを避け、次に、毎回反復後にどれくらいのベクトルが中心点で変化するかを記録しやすく、かつこれを条件としてアルゴリズムが収束したか否かを判断する。
また、検索ライブラリのターゲット分類の中心点ベクトルについては、ターゲット分類に含まれる全てのベクトルの和及び/又はターゲット分類に含まれるベクトル数量に基づいて分類内の中心に位置するベクトルを決定することができる。
本実施形態においては、中心点ベクトルは、ターゲット分類に含まれる全てのベクトルの和及びターゲット分類に含まれるベクトル数量に基づいて決定されるため、反復時に中心点ベクトルをタイムリーに更新することを保証することができる。
なお、本願では、分類の中心点ベクトルにより第1の分類を決定することに限定されず、例えば、各分類の他のコンテンツ、例えば、分類の特徴情報などに基づいて第1の分類を決定してもよい。
好ましい実施形態として、第1の分類において、クエリベクトルにマッチングするターゲットベクトルをクエリし、かつターゲットベクトルに対応するマルチメディアコンテンツを取得するステップは、クエリベクトルと第1の分類内の複数のサブ中心ベクトル(又は副中心点ベクトルと呼ばれる)との残差を計算し、かつ残差に基づいて複数のサブ中心ベクトルのうちの、1以上の整数であるN個のサブ中心ベクトルをクエリベクトルにマッチングするターゲットベクトルとすることと、ターゲットベクトルに対応するマルチメディアコンテンツを取得することとを含んでいてもよい。
本実施形態においては、各分類は、1つの中心点ベクトルを含み、複数のサブ中心点ベクトルをさらに含み、即ち1つの分類は、2つのレベルの中心点ベクトルを含む。また、各中心点ベクトルは、1つ以上のベクトルに対応してよい。
同様に、残差を副中心点ベクトルとクエリベクトルとの間の距離、例えば、対称的な距離(SDC)又は非対称的な距離(ADC)として理解してよい。
残差に基づいて複数のサブ中心ベクトルのうちのN個のサブ中心ベクトルをクエリベクトルにマッチングするターゲットベクトルとすることは、残差に基づいて複数のサブ中心ベクトルを残差に基づいて順序付けて最初のN個のサブ中心ベクトルを採用する。
本実施形態においては、残差に基づいてターゲットベクトルを決定するため、ターゲットベクトルを正確に決定することができるとともに、計算量を削減することができる。
さらに、クエリベクトルとサブ中心ベクトル(又は検索対象ベクトルと呼ばれる)との距離を計算するとき、非対称的な距離(ADC)を優先的に使用して測定を完了する。例えば、クエリベクトルx及びサブ中心ベクトルyに対して、xとyとの間の距離の代わりに、xと量子化後のyを示すq(y)とを使用する。量子化後のq(y)の個数がサブ量子化器の個数のみに関連付けられるため、x及びq(y)をルックアップテーブルとして示して速いクエリ速度を実現することができる。
なお、本願では、分類のサブ中心点ベクトルによりターゲットベクトルを決定することに限定されず、例えば、サブ中心ベクトルを計算せずに、分類の各ベクトルとクエリベクトルとの残差を直接的に計算して最終的なターゲットベクトルを決定してもよい。
好ましい実施形態として、クエリベクトルは、クエリ情報のベクトルを回転させ量子化したベクトルであり、検索ライブラリ内のベクトルは、回転して量子化されたベクトルであり、かつ回転前に、分類中心の中心点ベクトルによりベクトル中心化処理が行われてもよい。
クエリベクトルは、クエリ情報のベクトルを回転させ量子化したベクトルであることは、クエリ情報のベクトルを回転ベクトルにより回転させて、直積量子化(Product Quantization、PQ)を行って、クエリベクトルを得たことであってもよい。回転ベクトルは、ノルムが1であってもよい。
検索ライブラリ内のベクトルは、分類中心ベクトルを使用して全てのベクトルを順次通過させ、各ベクトルに対して中心化処理を行うベクトル中心化と、まず各ノード内に計算し、同じ分類でのベクトル内積値を積算し、検索ライブラリの新たなテーブルに更新し、次に各ノードが最終的な共分散の推定を得て共分散行列を計算する共分散行列の計算と、行列に対して固有値分解を行って固有値と固有ベクトルを得て、転置行列R、即ち回転のための行列を構築するプロセスと、転置行列Rを使用して分類での全てのベクトルを新たな空間に投影し、即ちベクトルを転置行列Rに掛けるプロセスと、新たな空間内のベクトルに対してPQ量子化を行い、検索ライブラリ内の各ベクトルをさらに得るプロセスと、により得ることができる。
上記の共分散行列は、下式により計算されてもよい。
Figure 0007256834000003
ここで、covは、共分散行列を表し、cは、分類の内の全てのベクトル内積の和であり、nは、分類でのベクトル本数であり、vは、分類の中心点ベクトルである。
なお、異なる分類において、異なる共分散行列を算出して、異なる回転をさらに完了する。転置行列Rを使用して分類での全てのベクトルを新たな空間に投影するプロセスは、検索ライブラリ内のベクトルの回転である。
ベクトル中心化、共分散行列の計算、及び新たな空間に投影することは、ノード間で並行して(並行粒度がトレーニングデータである)分散的に行われてよい。このように、ノード数の計算を増加することにより、大規模データセットのインデックス構築をサポートするため、短時間でインデックスライブラリ構築と検索マッチングとを完了することができる。
各ノードが最終的な共分散の推定を得て共分散行列を計算することと、転置行列Rを構築することについては、各ノードにより、一部の分類中心点ベクトルのみを計算して並行してもよい。
なお、検索ライブラリ内のベクトルは、いずれも予め設定されたものであり、例えば、トレーニングプロセスにおいて各ベクトルを決定する。
本実施形態においては、クエリベクトルは、クエリ情報のベクトルを回転させ量子化したベクトルであり、検索ライブラリ内のベクトルは、回転して量子化されたベクトルであり、かつ回転前に、分類中心の中心点ベクトルによりベクトル中心化処理が行われた。このように、ベクトルに対してローカル好適化(又はローカル最適化と呼ばれる)処理を行うことにより、計算量をさらに削減し、検索効率をさらに向上させることができる。
また、本願では、検索ライブラリ内のベクトルは、ローカル最適の直積量子化(LOPQ)アルゴリズムによって直接的に得られてもよい。
また、本願では、検索ライブラリ内のマルチメディアコンテンツは、検索ライブラリの分類前にマルチメディアコンテンツのユーザIDを拡張して、より多くのユーザのマルチメディアコンテンツを取得する。例えば、より多くのユーザの広告画像を取得して、マルチメディアコンテンツシーンの好適化を実現し、検索が優れた拡張可能性及び汎用性を備えるという効果を達成することができるものであってもよい。即ち分類を行う前にレイヤ(layer)を追加して、より多くのマルチメディアコンテンツシーンを取得する。その後に制約条件に基づいて分類を行い、さらに分類において単独のLOPQリコールを行うことができる。それにより先にリコールして後にスクリーニングするという方式を変更し、制約条件シーンでのリコール率を向上させる。
本願は、マルチメディアコンテンツの関連ベクトルを検索ライブラリのインデックスとし、かつ分類を先に決定し、次に分類において検索を行うことにより、検索効率を向上させることを実現することができる。
図3を参照すると、図3は、本願に係るマルチメディアコンテンツの検索装置の構造図である。
マルチメディアコンテンツの検索装置300は、図3に示されるように、クエリ情報のクエリベクトルを取得する第1の取得モジュール301と、対応するマルチメディアコンテンツに関連付けられるベクトルを複数含む分類を複数含む検索ライブラリから、クエリベクトルにマッチングする第1の分類を決定する決定モジュール302と、第1の分類において、クエリベクトルにマッチングするターゲットベクトルをクエリし、かつターゲットベクトルに対応するマルチメディアコンテンツを取得する第2の取得モジュール303とを備える。
好ましくは、決定モジュール302は、検索ライブラリ内の複数の分類の中心点ベクトルとクエリベクトルとの残差をそれぞれ計算し、かつ残差に基づいて第1の分類を決定し、検索ライブラリ内の各分類は、中心点ベクトルを含んでいてもよい。
好ましくは、検索ライブラリのターゲット分類の中心点ベクトルは、ターゲット分類に含まれる全てのベクトルの和及び/又はターゲット分類に含まれるベクトル数量に基づいて決定されるものであり、ターゲット分類は、検索ライブラリ内のいずれか1つの分類であってもよい。
好ましくは、第2の取得モジュール303は、クエリベクトルと第1の分類内の複数のサブ中心ベクトルとの残差を計算し、かつ残差に基づいて複数のサブ中心ベクトルのうちの、1以上の整数であるN個のサブ中心ベクトルをクエリベクトルにマッチングするターゲットベクトルとし、ターゲットベクトルに対応するマルチメディアコンテンツを取得してもよい。
好ましくは、クエリベクトルは、クエリ情報のベクトルを回転させ量子化したベクトルであり、検索ライブラリ内のベクトルは、回転して量子化されたベクトルであり、かつ回転前に、分類中心の中心点ベクトルによりベクトル中心化処理が行われてもよい。
本実施例に係るマルチメディアコンテンツの検索装置は、上記のマルチメディアコンテンツの検索方法の実施例において実現された様々なプロセスを実現することができ、かつ同じ有益な効果を達成することができ、重複を避けるために、ここでは説明を省略する。
本願の実施例において、本願は、電子デバイス及び記憶媒体を提供する。
図4は、本願の実施例に係るマルチメディアコンテンツの検索方法の電子デバイスのブロック図である。
電子デバイスは、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及びその他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを意図する。電子デバイスは、パーソナルデジタルアシスタント、セルラー電話、スマートフォン、ウェアラブルデバイス及びその他の類似の計算装置などの様々な形態のモバイル装置を表してもよい。本明細書に示すコンポーネント、それらの接続及び関係、並びにそれらの機能は、単なる例に過ぎず、本明細書で説明及び/又は要求された本願の実現を限定することを意図しない。
図4に示されるように、電子デバイスは、少なくとも1つ以上のプロセッサ401と、メモリ402と、各コンポーネントを接続し高速インタフェース及び低速インタフェースを有するインタフェースとを備える。
各コンポーネントは、異なるバスを利用して互いに接続され、かつ共通マザーボード上に取り付けられてもよく、必要に応じて他の方式で取り付けられてもよい。プロセッサは、電子デバイス内で実行された、外部入力/出力装置(例えば、インタフェースに結合された表示デバイス)上にGUIのグラフィック情報を表示するようにメモリ内又はメモリ上に記憶されている命令を含む命令を処理することができる。他の実施形態では、必要があれば、複数のプロセッサ及び/又は複数のバスを、複数のメモリ及び複数のメモリと共に使用してもよい。同様に、複数の電子デバイスを接続してもよく、各デバイスは、一部の必要な操作を提供する(例えば、サーバアレイ、1組のブレードサーバ、又はマルチプロセッサシステムとする)。図4においては、単一のプロセッサ401を用いたものを一例とする。
メモリ402は、本願に係る非一時的なコンピュータ読み取り可能な記憶媒体である。
メモリ402には、少なくとも1つのプロセッサに実行可能で、上記のマルチメディアコンテンツの検索方法を少なくとも1つのプロセッサに実行させる命令が記憶されている。本願の非一時的なコンピュータ記憶媒体には、本願に係るマルチメディアコンテンツの検索方法をコンピュータに実行させるコンピュータ命令が記憶されている。
メモリ402は、非一時的なコンピュータ読み取り可能な可読記憶媒体として、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュール、例えば、上記のマルチメディアコンテンツの検索方法に対応するプログラム命令/モジュール(例えば、図3に示す第1の取得モジュール301、決定モジュール302及び第2の取得モジュール303)を記憶する。
プロセッサ401は、メモリ402内に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理を実行して、上記のマルチメディアコンテンツの検索方法におけるマルチメディアコンテンツの検索方法を実現する。
メモリ402は、オペレーティングシステム及び機能に必要な少なくとも1つのアプリケーションプログラムを記憶可能なプログラム記憶領域と、マルチメディアコンテンツの検索方法に係る電子デバイスの使用により作成されたデータなどを記憶可能なデータ記憶領域とを含んでいてもよい。また、メモリ402は、高速ランダムアクセスメモリを含んでいてもよく、少なくとも1つの磁気ディスクメモリデバイス、フラッシュメモリデバイス、又は他の非一時的な固体メモリデバイスなどの非一時的なメモリを含んでいてもよい。他の実施例では、メモリ402は、好ましくは、プロセッサ401に対して遠隔に配置されたメモリを含み、これらのリモートメモリは、ネットワークを介してマルチメディアコンテンツの検索方法の電子デバイスに接続されてもよい。ネットワークの一例としては、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク及びそれらの組み合わせを含むが、これらに限定されない。
マルチメディアコンテンツの検索方法の電子デバイスは、入力装置403及び出力装置404をさらに備えていてもよい。プロセッサ401、メモリ402、入力装置403及び出力装置404は、バス又は他の方式で接続されてもよく、図4においては、バスによる接続を一例とする。
入力装置403は、入力された数字又は文字情報を受信するとともに、マルチメディアコンテンツの検索方法の電子デバイスのユーザ設定及び機能制御に関連するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ以上のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置404は、表示デバイス、補助照明装置(例えば、LED)及び触覚フィードバック装置(例えば、振動モータ)などを含んでいてもよい。表示デバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ及びプラズマディスプレイなどを含んでいてもよいが、これらに限定されない。他の実施例として、表示デバイスは、タッチスクリーンであってもよい。
ここで説明されたシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現されてよい。これらの様々な実施形態は、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行及び/又は解釈されてよい1つ以上のコンピュータプログラムにおいて実施されるものを含んでいてもよい。プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置及び少なくとも1つの出力装置からデータと命令を受信し、かつデータと命令を記憶システム、少なくとも1つの入力装置及び少なくとも1つの出力装置に伝送することができる。
これらの計算プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、かつ高レベルなプロセス及び/又はオブジェクト指向のプログラミング言語、及び/又はアセンブリ/機械言語により実施することができる。本明細書で使用されるように、用語「機械可読媒体」及び「コンピュータ可読媒体」とは、機械命令及び/又はデータをプログラマブルプロセッサに提供する任意のコンピュータプログラム製品、デバイス、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジック装置(PLD))を意味し、機械可読信号としての機械命令を受信する機械可読媒体を含む。用語「機械可読信号」とは、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
ユーザとの対話を提供するために、コンピュータ上で、ここで説明されたシステム及び技術を実施することができ、コンピュータは、ユーザに情報を表示する表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニター)と、キーボード及びポインティング装置(例えば、マウス又はトラックボール)とを有し、ユーザは、キーボード及びポインティング装置により、入力をコンピュータに提供することができる。他の種類の装置も、ユーザとの対話を提供してよく、例えば、ユーザに提供されるフィードバックは、任意の形式の感覚フィードバック(例えば、視覚的フィードバック、聴覚的フィードバック又は触覚フィードバック)であってよく、任意の形式(サウンド入力、音声入力又は触覚入力を含む)を用いてユーザからの入力を受信することができる。
ここで説明されたシステム及び技術は、バックエンドコンポーネントを含む計算システム(例えば、データサーバとする)、ミドルウェアコンポーネントを含む計算システム(例えば、アプリケーションサーバ)、フロントエンドコンポーネントを含む計算システム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータであり、ユーザは、グラフィカルユーザインタフェース又はウェブブラウザを介して、ここで説明されたシステム及び技術の実施形態と対話することができる)、あるいはこのようなバックグラウンドコンポーネント、ミドルウェアコンポーネント又はフロントエンドコンポーネントの任意の組み合わせを含む計算システムにおいて実施することができる。システムのコンポーネントは、任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)により互いに接続することができる。通信ネットワークの一例としては、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)及びインターネットを含む。
コンピュータシステムは、クライアント及びサーバを含んでいてもよい。クライアントとサーバとは、一般的に、互いに離れ、通常、通信ネットワークを介して対話する。クライアントとサーバとの関係は、対応するコンピュータ上で実行され、互いにクライアント-サーバの関係を有するコンピュータプログラムによって生成される。
本願の実施例の技術手段によれば、候補テーマ概念の品詞シリアルに基づいて候補テーマ概念をフィルタリングすることにより、テーマ概念の掘り起こしに必要な人件費を下げる。
上記様々な形式のフローを使用して、ステップを再順序付けたり、追加したり、削除したりしてよいことを理解されたい。例えば、本願に記載された各ステップは、並列的に実行されてもよく、順次実行されてもよく、異なる順序で実行されてもよく、本願に開示されている技術手段の所望の結果を達成できる限り、本明細書はここで限定するものではない。
上記発明を実施するための形態は、本願の保護範囲を限定するものではない。設計要件及びその他の要因に応じて、様々な修正、組み合わせ、部分組み合わせ及び置換を行うことができることは、当業者に理解されるところである。本願の精神及び原則内で行われるいかなる修正、同等置換、改善などは、いずれも本願の保護範囲に含まれるべきである。

Claims (11)

  1. マルチメディアコンテンツの検索装置によって実行されるマルチメディアコンテンツの検索方法であって、
    クエリ情報のクエリベクトルを取得することと、
    対応するマルチメディアコンテンツに関連付けられるベクトルを複数含む分類を複数含む検索ライブラリから、前記クエリベクトルにマッチングする第1の分類を決定することと、
    前記第1の分類において、前記クエリベクトルにマッチングするターゲットベクトルをクエリし、かつ前記ターゲットベクトルに対応するマルチメディアコンテンツを取得することとを含み、
    前記クエリベクトルは、クエリ情報のベクトルを回転させ量子化したベクトルであり、前記検索ライブラリ内のベクトルは、回転して量子化されたベクトルであり、かつ回転前に、前記検索ライブラリ内のベクトルの該当する分類の中心点ベクトルによりベクトル中心化処理が行われ、
    前記検索ライブラリ内のベクトルの回転の前に、共分散行列に対して固有値分解を行って固有値と固有ベクトルを得て、前記検索ライブラリ内のベクトルの回転のための転置行列を構築し
    前記共分散行列は、
    Figure 0007256834000004
    との式により計算され、
    covは、前記共分散行列を表し、cは、前記検索ライブラリ内のベクトルの該当する分類の内の全てのベクトル内積の和であり、nは、前記検索ライブラリ内のベクトルの該当する分類でのベクトル本数であり、vは、前記検索ライブラリ内のベクトルの該当する分類の中心点ベクトルである、マルチメディアコンテンツの検索方法。
  2. 前記検索ライブラリから、前記クエリベクトルにマッチングする前記第1の分類を決定することは、
    前記検索ライブラリ内の複数の前記分類の中心点ベクトルと前記クエリベクトルとの残差をそれぞれ計算し、かつ該残差に基づいて前記第1の分類を決定することを含み、前記検索ライブラリ内の各前記分類は、中心点ベクトルを含む請求項1に記載のマルチメディアコンテンツの検索方法。
  3. 前記検索ライブラリのターゲット分類の前記中心点ベクトルは、前記ターゲット分類に含まれる全てのベクトルの和及び/又は前記ターゲット分類に含まれるベクトル数に基づいて決定されるものであり、前記ターゲット分類は、前記検索ライブラリ内のいずれか1つの分類である請求項2に記載のマルチメディアコンテンツの検索方法。
  4. 前記第1の分類において、前記クエリベクトルにマッチングする前記ターゲットベクトルをクエリし、かつ前記ターゲットベクトルに対応する前記マルチメディアコンテンツを取得することは、
    前記クエリベクトルと前記第1の分類内の複数のサブ中心ベクトルとの残差を計算し、かつ該残差に基づいて前記複数のサブ中心ベクトルのうちの、1以上の整数であるN個の前記サブ中心ベクトルを前記クエリベクトルにマッチングする前記ターゲットベクトルとすることと、該ターゲットベクトルに対応する前記マルチメディアコンテンツを取得することとを含む請求項1に記載のマルチメディアコンテンツの検索方法。
  5. クエリ情報のクエリベクトルを取得する第1の取得モジュールと、
    対応するマルチメディアコンテンツに関連付けられるベクトルを複数含む分類を複数含む検索ライブラリから、前記クエリベクトルにマッチングする第1の分類を決定する決定モジュールと、
    前記第1の分類において、前記クエリベクトルにマッチングするターゲットベクトルをクエリし、かつ前記ターゲットベクトルに対応するマルチメディアコンテンツを取得する第2の取得モジュールとを備え、
    前記クエリベクトルは、クエリ情報のベクトルを回転させ量子化したベクトルであり、前記検索ライブラリ内のベクトルは、回転して量子化されたベクトルであり、かつ回転前に、前記検索ライブラリ内のベクトルの該当する分類の中心点ベクトルによりベクトル中心化処理が行われ、
    前記検索ライブラリ内のベクトルの回転の前に、共分散行列に対して固有値分解を行って固有値と固有ベクトルを得て、前記検索ライブラリ内のベクトルの回転のための転置行列を構築し
    前記共分散行列は、
    Figure 0007256834000005
    との式により計算され、
    covは、前記共分散行列を表し、cは、前記検索ライブラリ内のベクトルの該当する分類の内の全てのベクトル内積の和であり、nは、前記検索ライブラリ内のベクトルの該当する分類でのベクトル本数であり、vは、前記検索ライブラリ内のベクトルの該当する分類の中心点ベクトルである、マルチメディアコンテンツの検索装置。
  6. 前記決定モジュールは、前記検索ライブラリ内の複数の前記分類の中心点ベクトルと前記クエリベクトルとの残差をそれぞれ計算し、かつ該残差に基づいて前記第1の分類を決定し、前記検索ライブラリ内の各前記分類は、中心点ベクトルを含む請求項に記載のマルチメディアコンテンツの検索装置。
  7. 前記検索ライブラリのターゲット分類の前記中心点ベクトルは、前記ターゲット分類に含まれる全てのベクトルの和及び/又は前記ターゲット分類に含まれるベクトル数に基づいて決定されるものであり、前記ターゲット分類は、前記検索ライブラリ内のいずれか1つの分類である請求項に記載のマルチメディアコンテンツの検索装置。
  8. 前記第2の取得モジュールは、前記クエリベクトルと前記第1の分類内の複数のサブ中心ベクトルとの残差を計算し、かつ該残差に基づいて前記複数のサブ中心ベクトルのうちの、1以上の整数であるN個の前記サブ中心ベクトルを前記クエリベクトルにマッチングする前記ターゲットベクトルとし、該ターゲットベクトルに対応する前記マルチメディアコンテンツを取得する請求項に記載のマルチメディアコンテンツの検索装置。
  9. 少なくとも1つのプロセッサと、
    少なくとも1つの該プロセッサに通信可能に接続されているメモリとを備え、
    該メモリには、少なくとも1つの前記プロセッサに実行可能で、少なくとも1つの前記プロセッサによって実行されると、少なくとも1つの前記プロセッサに請求項1から請求項のいずれかに記載のマルチメディアコンテンツの検索方法を実行させる命令が記憶されている電子デバイス。
  10. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令は、請求項1から請求項のいずれかに記載のマルチメディアコンテンツの検索方法を前記コンピュータに実行させる非一時的なコンピュータ読み取り可能な記憶媒体。
  11. プロセッサによって実行されると、請求項1から請求項のいずれかに記載のマルチメディアコンテンツの検索方法が実現されるコンピュータプログラム。
JP2021048959A 2020-04-08 2021-03-23 マルチメディアコンテンツの検索方法、マルチメディアコンテンツの検索装置、電子デバイス、記憶媒体及びコンピュータプログラム製品 Active JP7256834B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010271903.9 2020-04-08
CN202010271903.9A CN113495965A (zh) 2020-04-08 2020-04-08 一种多媒体内容检索方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
JP2021103557A JP2021103557A (ja) 2021-07-15
JP7256834B2 true JP7256834B2 (ja) 2023-04-12

Family

ID=75111499

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021048959A Active JP7256834B2 (ja) 2020-04-08 2021-03-23 マルチメディアコンテンツの検索方法、マルチメディアコンテンツの検索装置、電子デバイス、記憶媒体及びコンピュータプログラム製品

Country Status (5)

Country Link
US (1) US11663260B2 (ja)
EP (1) EP3822824A1 (ja)
JP (1) JP7256834B2 (ja)
KR (1) KR102656114B1 (ja)
CN (1) CN113495965A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377976B (zh) * 2021-08-16 2022-09-09 北京达佳互联信息技术有限公司 资源搜索方法、装置、计算机设备及存储介质
CN114415890A (zh) * 2022-01-20 2022-04-29 北京大学第三医院(北京大学第三临床医学院) 医师评价系统的界面定制方法及教师端平台
CN116186046B (zh) * 2023-02-24 2024-02-20 深圳市乐信信息服务有限公司 设备数据的修改方法、装置、计算机设备及存储介质
CN116578867A (zh) * 2023-04-20 2023-08-11 华为技术有限公司 标识生成方法及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013012076A (ja) 2011-06-29 2013-01-17 Kddi Corp 高次元の特徴ベクトルを高精度で検索する検索装置及びプログラム
JP2013065146A (ja) 2011-09-16 2013-04-11 Rakuten Inc 画像検索装置およびプログラム
JP2015228083A (ja) 2014-05-30 2015-12-17 株式会社デンソーアイティーラボラトリ 特徴ベクトル変換装置及びコンテンツ検索装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6134541A (en) * 1997-10-31 2000-10-17 International Business Machines Corporation Searching multidimensional indexes using associated clustering and dimension reduction information
US6675174B1 (en) * 2000-02-02 2004-01-06 International Business Machines Corp. System and method for measuring similarity between a set of known temporal media segments and a one or more temporal media streams
CN104199842B (zh) 2014-08-07 2017-10-24 同济大学 一种基于局部特征邻域信息的相似图片检索方法
CN104615676B (zh) * 2015-01-20 2018-08-24 同济大学 一种基于最大相似度匹配的图片检索方法
CN105045841B (zh) * 2015-07-01 2017-06-23 北京理工大学 结合重力传感器与图像特征点角度的图像特征查询方法
US10719509B2 (en) * 2016-10-11 2020-07-21 Google Llc Hierarchical quantization for fast inner product search
CN106844715A (zh) 2017-02-08 2017-06-13 摩登大道时尚电子商务有限公司 一种图片检索匹配方法和装置
CN110175249A (zh) 2019-05-31 2019-08-27 中科软科技股份有限公司 一种相似图片的检索方法及系统
CN110674328A (zh) * 2019-09-27 2020-01-10 长城计算机软件与系统有限公司 一种商标图像检索方法、系统、介质及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013012076A (ja) 2011-06-29 2013-01-17 Kddi Corp 高次元の特徴ベクトルを高精度で検索する検索装置及びプログラム
JP2013065146A (ja) 2011-09-16 2013-04-11 Rakuten Inc 画像検索装置およびプログラム
JP2015228083A (ja) 2014-05-30 2015-12-17 株式会社デンソーアイティーラボラトリ 特徴ベクトル変換装置及びコンテンツ検索装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GONG, Yunchao et al.,Iterative Quantization: A Procrustean Approach to Learning Binary Codes for Large-Scale Image Retrieval,IEEE Transactions on Pattern Analysis and Machine Intelligence,IEEE,2013年12月,Vol. 35, No.12,pp.2916-2929

Also Published As

Publication number Publication date
KR102656114B1 (ko) 2024-04-11
US11663260B2 (en) 2023-05-30
KR20210038472A (ko) 2021-04-07
JP2021103557A (ja) 2021-07-15
EP3822824A1 (en) 2021-05-19
US20210209146A1 (en) 2021-07-08
CN113495965A (zh) 2021-10-12

Similar Documents

Publication Publication Date Title
JP7256834B2 (ja) マルチメディアコンテンツの検索方法、マルチメディアコンテンツの検索装置、電子デバイス、記憶媒体及びコンピュータプログラム製品
CN111522986B (zh) 图像检索方法、装置、设备和介质
JP7166322B2 (ja) モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP7194163B2 (ja) マルチメディアリソースの推薦方法、マルチメディアリソースの推薦装置、電子機器、非一時的なコンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
JP7304370B2 (ja) ビデオ検索方法、装置、デバイス及び媒体
US20210397947A1 (en) Method and apparatus for generating model for representing heterogeneous graph node
JP7170082B2 (ja) 情報を生成するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
US20230022550A1 (en) Image processing method, method for training image processing model devices and storage medium
US20210209446A1 (en) Method for generating user interactive information processing model and method for processing user interactive information
JP7369740B2 (ja) 検索語の推薦方法と装置、目的モデルの訓練方法と装置、電子デバイス、記憶媒体、及びプログラム
US11455306B2 (en) Query classification and processing using neural network based machine learning
US20170161641A1 (en) Streamlined analytic model training and scoring system
US20220058222A1 (en) Method and apparatus of processing information, method and apparatus of recommending information, electronic device, and storage medium
JP2022050379A (ja) 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
US20190095500A1 (en) Statistical processing of natural language queries of data sets
KR102633433B1 (ko) 얼굴이미지의 분류방법, 분류장치, 전자기기 및 저장매체
JP2021192286A (ja) モデル訓練、画像処理方法及びデバイス、記憶媒体、プログラム製品
CN116057518A (zh) 使用机器学习模型的自动查询谓词选择性预测
JP7241122B2 (ja) スマート応答方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
WO2023130960A1 (zh) 服务资源确定方法、装置及服务资源确定系统
CN110659422A (zh) 检索方法、装置、电子设备及存储介质
JP7212714B2 (ja) 関係ネットワーク生成方法、装置、電子設備、記憶媒体、及びプログラム
CN110727672A (zh) 数据映射关系查询方法、装置、电子设备及可读介质
US20210357453A1 (en) Query usage based organization for very large databases
CN111667055A (zh) 用于搜索模型结构的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230331

R150 Certificate of patent or registration of utility model

Ref document number: 7256834

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150