JP5661813B2 - セマンティックオブジェクトの特徴付けおよび検索 - Google Patents
セマンティックオブジェクトの特徴付けおよび検索 Download PDFInfo
- Publication number
- JP5661813B2 JP5661813B2 JP2012556120A JP2012556120A JP5661813B2 JP 5661813 B2 JP5661813 B2 JP 5661813B2 JP 2012556120 A JP2012556120 A JP 2012556120A JP 2012556120 A JP2012556120 A JP 2012556120A JP 5661813 B2 JP5661813 B2 JP 5661813B2
- Authority
- JP
- Japan
- Prior art keywords
- semantic
- hash code
- representing
- representation
- binary hash
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012512 characterization method Methods 0.000 title description 20
- 230000009466 transformation Effects 0.000 claims description 87
- 239000013598 vector Substances 0.000 claims description 75
- 238000000034 method Methods 0.000 claims description 50
- 238000000844 transformation Methods 0.000 claims description 37
- 238000000605 extraction Methods 0.000 claims description 13
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 2
- 238000011017 operating method Methods 0.000 claims 3
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 26
- 230000008569 process Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000013515 script Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 6
- 238000011524 similarity measure Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
一般に、セマンティックオブジェクトの特徴付けはコンピュータに実装される技術であって、セマンティックオブジェクトの第1の表現またはビューを第1のバイナリハッシュコードの形式で特徴付けし、同一のセマンティックオブジェクトの第2の表現またはビューを第2のバイナリハッシュコードの形式で特徴付けしたバージョンと比較すると、オブジェクトが同一のオブジェクトであることを示す類似度を、第1および第2のバイナリハッシュコードが表すようにする技術である。
同一のセマンティックオブジェクトの2つの表現/ビューを直接使用するのではなく、フォーマット、言語、文字体系などに関して独自の特徴表現を採用する。そのような独自の表現を取得するために、特徴ベクトルを各オブジェクトのビューごとに形成する。オブジェクトに適切な任意の特色付けの方法を採用して特徴ベクトルを生成することができる。例えば、人名の場合、文字nグラムを特徴として抽出しバイナリ化して、バイナリ特徴ベクトルを形成することができる。なお、利用可能な可能性のある特色付けの方法はこれだけではない。例えば、名前から抽出された音節を特徴として使用することも可能であり、特徴ベクトルをバイナリ化するのではなく実数で構成することもできる。主成分分析または任意の他の次元縮小技術を特徴ベクトルに対して使用することにより、低次元の表現を求めることも可能である。
V={vi}N i=1
を求める。ここで、
同性質のオブジェクト訓練ペアから計算された変換AおよびBを、1ビットハッシュ関数として採用し、変換を作成するために使用される表現/ビュー(例えば、言語)に関連するセマンティックオブジェクト(例えば、人名)を表現する特徴ベクトルから、バイナリハッシュコードを作成する。従って、上述の例において、Aを使用して、人の英語での名前を表現する特徴ベクトルからバイナリハッシュコードを作成することができ、Bを使用して、人のカンナダ語での名前を表現する特徴ベクトルからバイナリハッシュコードを作成することができる。
上述の様式で作成される各バイナリハッシュコードは、ハッシュコードの作成に使用される変換に関連する表現またはビュー(例えば、言語)によるセマンティックオブジェクト(例えば、人名)のデータベースディレクトリに、加えることができる。これにより、検索可能なデータベースを作成するが、このデータベースおいては、データベース内の項目が第1の表現またはビューを表すセマンティックオブジェクトであり、第2の表現またはビューを表すセマンティックオブジェクトを、該検索可能なデータベースに対して検索クエリとして提示すると、検索クエリのセマンティックオブジェクトに対応する、データベースからの任意のセマンティックオブジェクトの識別を含む出力が行われる。
ここまで、本明細書に記載されるセマンティックオブジェクトの特徴付けでは、単一部分セマンティックオブジェクトの特徴付けを扱っている。例えば、単一の単語から成る名前などである。しかし、これを拡張させて、複数の単語から成る名前などの、複数部分オブジェクトを扱うことができる。一般的な例としては、人の姓と名がある。これは2つの単語から成る名前を構成する。人名を探してディレクトリを検索する場合、そのフルネームの使用を有利とすることができる。
ここで、本明細書に記載されるセマンティックオブジェクトの特徴付けおよび検索の実施形態の一部を実装することができる、適切なコンピューティング環境の簡単な概要について説明する。技術的な実施形態は、多数の汎用または専用のコンピューティングシステム環境または構成を用いて操作可能である。適切な周知のコンピューティングシステム、環境、および/または、構成の例に含まれるものには、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップの装置、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラム可能家庭用電化製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたは装置の内のいずれかを含む分散コンピューティング環境、などがあるが、これに限定しない。
セマンティックオブジェクトと表現またはビューとの、上で説明した名前−言語の例以外のある他の例には、セマンティックオブジェクトがユーザによりクエリされるエンティティであり、2つの表現またはビューがこのエンティティに関連するウェブページからの画像特徴とテキスト特徴であるという場合を含む。従って、同一のセマンティックオブジェクトについて、マルチモーダル検索の操作を向上させるために使用可能な2つのビューが存在する。別の例は、セマンティックオブジェクトが文書であり、2つの表現またビューが第1の言語による文書と第2の言語による文書である場合である。2つの言語による配列された同性質の文書のセットからハッシュ関数を学習後、ハッシュ関数を使用してどちらかの言語による文書コレクションをクロス言語検索することが可能である。さらに別の例には、セマンティックオブジェクトが単語であり、その2つのビューがその単語の文字配列と音素配列であるものがある。発音辞書からハッシュ関数を学習後、該ハッシュ関数を使用して、テキスト中の未知語を探して辞書における最も近い音素配列を検索することができる。
Claims (15)
- セマンティックオブジェクトを特徴付けるためのコンピュータの動作方法であって、
前記方法は、セマンティックオブジェクトの第1の表現またはビューを、前記セマンティックオブジェクトを表現する第1のバイナリハッシュコードの形式で特徴付けし、前記セマンティックオブジェクトを表現する第2のバイナリハッシュコードの形式における同一のセマンティックオブジェクトの第2の表現またはビューの特徴付けしたバージョンと比較すると、前記第1および第2のバイナリハッシュコードが、前記オブジェクトが同一のオブジェクトであることを示す類似度を表し、前記方法は、
同性質のセマンティックオブジェクトのペアを入力するステップであって、前記同性質のセマンティックオブジェクトのペアは、前記第1および第2の表現またはビューで提示される同一のセマンティックオブジェクトを含む、入力するステップと、
同性質のセマンティックオブジェクトの各ペアのそれぞれのセマンティックオブジェクトを特徴抽出にかけ、前記セマンティックオブジェクトを表現する特徴ベクトルを作成するステップと、
前記同性質のセマンティックオブジェクトのペアを表現する特徴ベクトルに基づき、前記第1の表現またはビューに対する所定数の変換と、前記第2の表現またはビューに対する同数の変換とを確立するステップであって、前記第1または第2の表現またはビューの内の一方に対して確立される変換は、前記表現またはビューを表すセマンティックオブジェクトを表現する特徴ベクトルに適用されると、前記セマンティックオブジェクトを表現する前記第1のバイナリハッシュコードを作成し、前記第1または第2の表現またはビューの内の他方に対して確立された変換を、前記他方の表現またはビューを表す同一のセマンティックオブジェクトを表現する特徴ベクトルに適用する時に作成される前記セマンティックオブジェクトを表現する前記第2のバイナリハッシュコードと、前記第1のバイナリハッシュコードは実質上類似する、確立するステップと、
前記第1の表現またはビューに対して確立された変換を使用して、前記第1の表現またはビューを表すセマンティックオブジェクトを、前記セマンティックオブジェクトを表現する前記第1のバイナリハッシュコードとして特徴付けするステップと
を含む方法。 - 前記第1の表現またはビューに対して確立された変換を使用して、前記第1の表現またはビューを表すセマンティックオブジェクトを、前記セマンティックオブジェクトを表現する第1のバイナリハッシュコードの形式で特徴付けするステップは、
前記セマンティックオブジェクトを、前記第1の表現またはビューを表す同性質のセマンティックオブジェクトの各ペアにおける前記セマンティックオブジェクトに適用されるものと同じ特徴抽出にかけ、前記セマンティックオブジェクトを表現する特徴ベクトルを作成するステップと、
前記第1の表現またはビューに対して確立された変換のそれぞれについて、前記変換を前記セマンティックオブジェクトを表現する特徴ベクトルに適用し、その結果をバイナリ化し、前記セマンティックオブジェクトを表現する前記第1のバイナリハッシュコードのビットを作成するステップと、
前記作成されたビットを所定の順序で連結し、前記セマンティックオブジェクトを表現する前記第1のバイナリハッシュコードを作成するステップと
を含む、請求項1に記載の方法。 - 同性質のセマンティックオブジェクトの各ペアのそれぞれのセマンティックオブジェクトを特徴抽出にかけ、前記セマンティックオブジェクトを表現する特徴ベクトルを作成するステップは、バイナリ特徴ベクトルまたは実数値特徴ベクトルの内の1つを作成するステップを含む、請求項1に記載の方法。
- 同性質のセマンティックオブジェクトの各ペアのそれぞれのセマンティックオブジェクトを特徴抽出にかけ、前記セマンティックオブジェクトを表現する特徴ベクトルを作成するステップは、次元縮小技術を使用して低次元の表現を作成するステップを含む、請求項3に記載の方法。
- 前記同性質のセマンティックオブジェクトのペアを表現する特徴ベクトルに基づき、第1の表現またはビューに対する所定数の変換と、第2の表現またはビューに対する同数の変換とを確立するステップは、
正準相関分析を使用して、前記第1および第2の表現またはビューのそれぞれの候補の変換を計算するステップと、
前記第1の表現またはビューに対する第1の変換セットを、前記第1の表現またはビューについて計算された候補の変換から確立し、前記第2の表現またはビューに対する第2の変換セットを、前記第2の表現またはビューについて計算された候補の変換から確立するステップであって、セマンティックオブジェクトの同性質のペアのそれぞれに対して、前記第1の変換セットを、前記第1の表現またはビューを表すセマンティックオブジェクトの前記同性質のペアのセマンティックオブジェクトを表現する特徴ベクトルに適用し、かつ、前記第2の変換セットを、前記第2の表現またはビューを表すセマンティックオブジェクトの前記同性質のペアのセマンティックオブジェクトを表現する特徴ベクトルに適用すると、セマンティックオブジェクトの前記同性質のペアの全てについて作成される、結果として得られる第1および第2のバイナリハッシュコードの間の総ハミング距離を最小化する、確立するステップと
を含む、請求項1に記載の方法。 - 前記同性質のセマンティックオブジェクトのペアを表現する特徴ベクトルに基づき、第1の表現またはビューに対する所定数の変換と、第2の表現またはビューに対する同数の変換とを確立するステップは、
前記第1の変換セットを、作成される前記第1のバイナリハッシュコードのビットのほぼ半分が第1の二進値を表し、かつ残りのビットが他方の二進値を表すという制約を示すように、確立するステップと、
前記第2の変換セットを、作成される前記第2のバイナリハッシュコードのビットのほぼ半分が前記第1の二進値を表し、かつ残りのビットが他方の二進値を表すという制約を示すように、確立するステップと
をさらに含む、請求項5に記載の方法。 - 前記同性質のセマンティックオブジェクトのペアを表現する特徴ベクトルに基づき、第1の表現またはビューに対する所定数の変換と、第2の表現またはビューに対する同数の変換とを確立するステップは、
前記第1の変換セットを、作成される前記第1のバイナリハッシュコードのビットが無相関であるという制約を示すように確立するステップと、
前記第2の変換セットを、作成される前記第2のバイナリハッシュコードのビットが無相関であるという制約を示すように確立するステップと
をさらに含む、請求項6に記載の方法。 - 検索可能なデータベースを作成するためのコンピュータの動作方法であって、前記データベース内の項目は、第1の表現またはビューを表すセマンティックオブジェクトであり、前記データベースに含まれるセマンティックオブジェクトと同一であるが第2の表現またはビューを表すセマンティックオブジェクトを、前記検索可能なデータベースに対して検索クエリとして提示すると、前記検索クエリの前記セマンティックオブジェクトに対応する、前記第1の表現またはビューを表すセマンティックオブジェクトの識別を含む出力を行い、前記方法は、
前記第1の表現またはビューに対する所定数の変換と、前記第2の表現またはビューに対する同数の変換とを確立するステップであって、前記第1または第2の表現またはビューの内の一方に対して確立される変換を、前記表現またはビューを表すセマンティックオブジェクトを表現する特徴ベクトルに適用すると、前記セマンティックオブジェクトを表現する第1のバイナリハッシュコードを作成し、前記第1または第2の表現またはビューの内の他方に対して確立された変換を、前記他方の表現またはビューを表す同一のセマンティックオブジェクトを表現する特徴ベクトルに適用する時に作成される前記セマンティックオブジェクトを表現する第2のバイナリハッシュコードと、前記第1のバイナリハッシュコードは実質上類似する、確立するステップと、
前記第1の表現またはビューに対して確立された変換を使用して、前記データベースに含まれる前記セマンティックオブジェクトのそれぞれを、前記セマンティックオブジェクトを表現する前記第1のバイナリハッシュコードの形式で特徴付けするステップであって、前記データベースに含まれるセマンティックオブジェクトを特徴付ける前記第1のバイナリハッシュコードは、前記データベース内の他のセマンティックオブジェクトを特徴付ける前記第1のバイナリハッシュコードと実質上異なる、特徴付けするステップと、
前記データベースに含まれる前記セマンティックオブジェクトのそれぞれを特徴付ける前記第1のバイナリハッシュコードを、前記データベースにおける、それぞれに対応するセマンティックオブジェクトにそれぞれ関連付けるステップと
を含む方法。 - 検索クエリが第2の表現またはビューを表すデータベースに入力されるときは常に、
前記検索クエリを表現する特徴ベクトルを生成するステップと、
前記第2の表現またはビューに対して確立される変換のそれぞれについて、前記変換を前記検索クエリを表現する特徴ベクトルに適用し、その結果をバイナリ化し、前記検索クエリを表現する前記第2のバイナリハッシュコードのビットを作成するステップと、
前記作成されたビットを所定の順序で連結して、前記検索クエリを表現する前記第2のバイナリハッシュコードを作成するステップと、
前記検索クエリを表現する前記第2のバイナリハッシュコードに対して所定の類似度を表す第1のバイナリハッシュコードを有する、前記データベースに含まれるセマンティックオブジェクト(単数または複数)を発見するステップと、
前記検索クエリを表現する前記第2のバイナリハッシュコードに対して所定の類似度を表すことが発見された第1のバイナリハッシュコードを有する、前記データベースに含まれる一致するセマンティックオブジェクト(単数または複数)の識別を出力するステップと
を含む請求項8に記載の方法。 - 前記検索クエリを表現する第2のバイナリハッシュコードに対して所定の類似度を表す第1のバイナリハッシュコードを有する、前記データベースに含まれるセマンティックオブジェクト(単数または複数)を発見するステップは、
前記検索クエリを表現する前記第2のバイナリハッシュコードと前記データベースに含まれる前記セマンティックオブジェクトのそれぞれに関連する前記第1のバイナリハッシュコードとの間のハミング距離の値をそれぞれ計算するステップと、
第1のバイナリハッシュコードと前記検索クエリを表現する前記第2のバイナリハッシュコードとの間の最小であるハミング距離を表す第1のバイナリハッシュコードを有する、前記データベースに含まれる前記セマンティックオブジェクト(単数または複数)を発見するステップと
を含む、請求項9に記載の方法。 - 前記検索クエリを表現する第2のバイナリハッシュコードに対して所定の類似度を表す第1のバイナリハッシュコードを有する、前記データベースに含まれるセマンティックオブジェクト(単数または複数)を発見するステップは、
前記検索クエリを表現する前記第2のバイナリハッシュコードと前記データベースに含まれる前記セマンティックオブジェクトのそれぞれに関連する前記第1のバイナリハッシュコードとの間のハミング距離の値をそれぞれ計算するステップと、
第1のバイナリハッシュコードと前記検索クエリを表現する前記第2のバイナリハッシュコードとの間の、ハミング距離の閾値よりも小さいハミング距離を表す第1のバイナリハッシュコードを有する、前記データベースに含まれる前記セマンティックオブジェクト(単数または複数)を発見するステップと
を含む、請求項9に記載の方法。 - 前記データベースに入力される検索クエリは、単一のセマンティックオブジェクトに組み合わされた複数のセマンティックオブジェクトを含み、前記データベースに含まれる前記セマンティックオブジェクトの内の少なくとも一部が、単一のセマンティックオブジェクトに組み合わされた複数のセマンティックオブジェクトである、請求項9に記載の方法。
- 前記データベースに入力された検索クエリは、複数のセマンティックオブジェクトを含み、前記特徴ベクトルの生成、変換の適用およびバイナリ化、連結、発見ならびに出力するステップを、前記検索クエリの前記複数のセマンティックオブジェクトのそれぞれに対して繰り返し、前記方法は、
重み付き二部グラフを構築するステップであって、前記検索クエリのセマンティックオブジェクトのそれぞれは、前記グラフの第1のノードセットを形成し、前記検索クエリのセマンティックオブジェクトのそれぞれに対して出力された識別された一致するセマンティックオブジェクト(単数または複数)が前記グラフの第2のノードセットを形成する、構築するステップと、
前記第1のノードセットに関連する前記セマンティックオブジェクトのそれぞれのバイナリハッシュコードと、前記第2のノードセットに関連する前記セマンティックオブジェクトのそれぞれのバイナリハッシュコードとの間の類似度を、既知でない場合にそれぞれ計算するステップと、
前記第1のノードセットに関連する各セマンティックオブジェクトと、前記第2のノードセットに関連するセマンティックオブジェクトとの間に、それらのバイナリハッシュコードに基づくセマンティックオブジェクト間の類似度が閾値と交差する場合に、エッジを割り当てるステップであって、前記エッジの重みを前記類似度と等しく設定する、割り当てるステップと、
前記グラフにおける最大重み付き二部グラフマッチングを求めるステップと、
前記マッチングの重みを計算するステップと、
前記マッチングの重みを、前記第1および第2のノードセット間のノード数の差に基づき正規化するステップと
をさらに含む請求項9に記載の方法。 - 前記データベースに含まれるセマンティックオブジェクトのそれぞれを特徴付ける前記第1のバイナリハッシュコードを、前記データベースにおける、それぞれに対応するセマンティックオブジェクトにそれぞれ関連付けるステップは、
前記データベースに含まれる前記セマンティックオブジェクトに対応するデータベースディレクトリを含むハッシュテーブルを確立するステップと、
前記データベースに含まれる前記セマンティックオブジェクトのそれぞれを特徴付ける前記第1のバイナリハッシュコードを前記ハッシュテーブルに追加するステップと、
前記データベースに含まれる前記セマンティックオブジェクトのそれぞれを特徴付ける前記第1のバイナリハッシュコードを、前記ハッシュテーブル内における、それぞれに対応するデータベースディレクトリエントリに関連付けるステップと
を含む、請求項8に記載の方法。 - 人の名前を特徴付けるためのコンピュータの動作方法であって、
第1の言語による人の名前を前記名前を表現する第1のバイナリハッシュコードの形式で特徴付けし、第2の言語による同一の名前を前記名前を表現する第2のバイナリハッシュコードの形式で特徴付けしたバージョンと比較すると、前記第1および第2のバイナリハッシュコードは、それらの名前が同一の名前であることを示す類似度を表し、前記方法は、
同性質の名前のペアを入力するステップであって、前記同性質の名前の各ペアは、前記第1および第2の言語で提示される人の名前を含み、同性質の名前の各ペアは異なる名前に対応する、入力するステップと、
同性質の名前の各ペアを特徴抽出にかけ、前記名前を表現するバイナリ特徴ベクトルを作成するステップと、
前記同性質の名前のペアを表現する特徴ベクトルに基づき、前記第1の言語に対する所定数の変換と、前記第2の言語に対する同数の変換とを確立するステップであって、前記第1または第2の言語の内の一方に対して確立された変換を、前記言語による名前を表現する特徴ベクトルに対して適用すると、前記名前を表現する前記第1のバイナリハッシュコードを作成し、前記第1または第2の言語の内の他方に対して確立された変換を、前記他方の言語による同一の名前を表現する特徴ベクトルに適用する時に作成し、前記名前を表現する前記第2のバイナリハッシュコードと、前記第1のバイナリハッシュコードが実質上類似する、確立するステップと、
前記第1の言語に対して確立された変換を使用して、第1の言語による人の名前を前記名前を表現する前記第1のバイナリハッシュコードとして特徴付けるステップと
を含む方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/715,174 US8543598B2 (en) | 2010-03-01 | 2010-03-01 | Semantic object characterization and search |
US12/715,174 | 2010-03-01 | ||
PCT/US2011/026358 WO2011109251A2 (en) | 2010-03-01 | 2011-02-25 | Semantic object characterization and search |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013521574A JP2013521574A (ja) | 2013-06-10 |
JP2013521574A5 JP2013521574A5 (ja) | 2014-03-20 |
JP5661813B2 true JP5661813B2 (ja) | 2015-01-28 |
Family
ID=44505854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012556120A Active JP5661813B2 (ja) | 2010-03-01 | 2011-02-25 | セマンティックオブジェクトの特徴付けおよび検索 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8543598B2 (ja) |
EP (1) | EP2542988B1 (ja) |
JP (1) | JP5661813B2 (ja) |
CN (1) | CN102782682B (ja) |
CA (1) | CA2788670C (ja) |
HK (1) | HK1178277A1 (ja) |
WO (1) | WO2011109251A2 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8463053B1 (en) | 2008-08-08 | 2013-06-11 | The Research Foundation Of State University Of New York | Enhanced max margin learning on multimodal data mining in a multimedia database |
US8463797B2 (en) * | 2010-07-20 | 2013-06-11 | Barracuda Networks Inc. | Method for measuring similarity of diverse binary objects comprising bit patterns |
DE102011101154A1 (de) * | 2011-05-11 | 2012-11-15 | Abb Technology Ag | Verfahren und Einrichtung zur einheitlichen Benennung von gleichen Parametern unterschiedlicher Feldgeräte eines Automatisierungssystems |
US9489636B2 (en) * | 2012-04-18 | 2016-11-08 | Tagasauris, Inc. | Task-agnostic integration of human and machine intelligence |
JP5930056B2 (ja) * | 2012-09-27 | 2016-06-08 | 日本電気株式会社 | バイナリデータ変換方法と装置及びプログラム |
CN103092828B (zh) * | 2013-02-06 | 2015-08-12 | 杭州电子科技大学 | 基于语义分析和语义关系网络的文本相似度度量方法 |
US9171063B2 (en) | 2013-03-13 | 2015-10-27 | Facebook, Inc. | Short-term hashes |
EP3044702A4 (en) * | 2013-09-13 | 2017-05-10 | Fishberg, Keith | Amenity, special service and food/beverage search and purchase booking system |
US20150278774A1 (en) * | 2014-03-31 | 2015-10-01 | Bank Of America Corporation | Techniques for hash indexing |
US9805099B2 (en) | 2014-10-30 | 2017-10-31 | The Johns Hopkins University | Apparatus and method for efficient identification of code similarity |
JP6712796B2 (ja) * | 2015-11-10 | 2020-06-24 | 国立大学法人 東京大学 | 画像を媒介した異言語文書間の学習法及び装置、言語横断文書検索方法及び装置 |
WO2017099806A1 (en) * | 2015-12-11 | 2017-06-15 | Hewlett Packard Enterprise Development Lp | Hash suppression |
CN105843960B (zh) * | 2016-04-18 | 2019-12-06 | 上海泥娃通信科技有限公司 | 基于语义树的索引方法和系统 |
US10642881B2 (en) * | 2016-06-30 | 2020-05-05 | Intel Corporation | System architecture for universal emotive autography |
CN106502996A (zh) * | 2016-12-13 | 2017-03-15 | 深圳爱拼信息科技有限公司 | 一种基于语义匹配的裁判文书检索方法和服务器 |
US10817774B2 (en) * | 2016-12-30 | 2020-10-27 | Facebook, Inc. | Systems and methods for providing content |
IL258689A (en) | 2018-04-12 | 2018-05-31 | Browarnik Abel | A system and method for computerized semantic indexing and searching |
US11175930B1 (en) * | 2018-04-27 | 2021-11-16 | Intuit, Inc. | Deducing a requirement to present optional data entry fields based on examining past user input records |
US11403327B2 (en) * | 2019-02-20 | 2022-08-02 | International Business Machines Corporation | Mixed initiative feature engineering |
US11797843B2 (en) * | 2019-03-06 | 2023-10-24 | Samsung Electronics Co., Ltd. | Hashing-based effective user modeling |
US11238103B2 (en) | 2019-09-13 | 2022-02-01 | Ebay Inc. | Binary coding for improved semantic search |
CN110674719B (zh) * | 2019-09-18 | 2022-07-26 | 北京市商汤科技开发有限公司 | 目标对象匹配方法及装置、电子设备和存储介质 |
US11163805B2 (en) * | 2019-11-25 | 2021-11-02 | The Nielsen Company (Us), Llc | Methods, systems, articles of manufacture, and apparatus to map client specifications with standardized characteristics |
US20230367974A1 (en) * | 2022-05-16 | 2023-11-16 | Microsoft Technology Licensing, Llc | Cross-orthography fuzzy string comparisons |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0856175A4 (en) | 1995-08-16 | 2000-05-24 | Univ Syracuse | SYSTEM AND METHOD FOR RETURNING MULTI-LANGUAGE DOCUMENTS USING A SEMANTIC VECTOR COMPARISON |
US6002997A (en) | 1996-06-21 | 1999-12-14 | Tou; Julius T. | Method for translating cultural subtleties in machine translation |
WO1999026235A2 (en) * | 1997-11-17 | 1999-05-27 | Telcordia Technologies, Inc. | Method and system for determining approximate hamming distance and approximate nearest neighbors in an electronic storage device |
GB2337611A (en) | 1998-05-20 | 1999-11-24 | Sharp Kk | Multilingual document retrieval system |
US6311183B1 (en) | 1998-08-07 | 2001-10-30 | The United States Of America As Represented By The Director Of National Security Agency | Method for finding large numbers of keywords in continuous text streams |
US6154747A (en) * | 1998-08-26 | 2000-11-28 | Hunt; Rolf G. | Hash table implementation of an object repository |
US6466901B1 (en) | 1998-11-30 | 2002-10-15 | Apple Computer, Inc. | Multi-language document search and retrieval system |
JP3685660B2 (ja) * | 1999-09-13 | 2005-08-24 | 沖電気工業株式会社 | 対訳情報収集装置 |
US6701014B1 (en) | 2000-06-14 | 2004-03-02 | International Business Machines Corporation | Method and apparatus for matching slides in video |
WO2002086737A1 (en) | 2001-04-20 | 2002-10-31 | Wordsniffer, Inc. | Method and apparatus for integrated, user-directed web site text translation |
US20050216253A1 (en) * | 2004-03-25 | 2005-09-29 | Microsoft Corporation | System and method for reverse transliteration using statistical alignment |
US7693683B2 (en) * | 2004-11-25 | 2010-04-06 | Sharp Kabushiki Kaisha | Information classifying device, information classifying method, information classifying program, information classifying system |
CA2591897C (en) | 2005-01-04 | 2013-03-19 | Thomson Global Resources | Systems, methods, software, and interfaces for multilingual information retrieval |
CN101124579A (zh) * | 2005-02-24 | 2008-02-13 | 富士施乐株式会社 | 单词翻译装置、翻译方法以及翻译程序 |
CN100474301C (zh) * | 2005-09-08 | 2009-04-01 | 富士通株式会社 | 基于数据挖掘获取词或词组单元译文信息的系统和方法 |
US20070185868A1 (en) * | 2006-02-08 | 2007-08-09 | Roth Mary A | Method and apparatus for semantic search of schema repositories |
US8010534B2 (en) * | 2006-08-31 | 2011-08-30 | Orcatec Llc | Identifying related objects using quantum clustering |
KR100775585B1 (ko) * | 2006-12-13 | 2007-11-15 | 삼성전자주식회사 | 문자 메시지에 대한 음악 추천 방법 및 그 시스템 |
KR20090024460A (ko) | 2007-09-04 | 2009-03-09 | 엘지전자 주식회사 | 다국어 호환이 가능한 정보 검색 장치 및 방법 |
EP2201484A4 (en) | 2007-09-21 | 2010-09-22 | Google Inc | INTERLANGUE RESEARCH |
US7917488B2 (en) | 2008-03-03 | 2011-03-29 | Microsoft Corporation | Cross-lingual search re-ranking |
AU2009228204B2 (en) | 2008-03-26 | 2015-01-15 | Zonit Structured Solutions, Llc | Power distribution systems and methodology |
KR101116581B1 (ko) | 2008-06-30 | 2012-03-15 | 주식회사 한글과컴퓨터 | 다국어 독음 검색 장치 |
-
2010
- 2010-03-01 US US12/715,174 patent/US8543598B2/en active Active
-
2011
- 2011-02-25 WO PCT/US2011/026358 patent/WO2011109251A2/en active Application Filing
- 2011-02-25 EP EP11751118.8A patent/EP2542988B1/en active Active
- 2011-02-25 CN CN201180011755.6A patent/CN102782682B/zh active Active
- 2011-02-25 CA CA2788670A patent/CA2788670C/en active Active
- 2011-02-25 JP JP2012556120A patent/JP5661813B2/ja active Active
-
2013
- 2013-04-26 HK HK13105103.8A patent/HK1178277A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
CN102782682A (zh) | 2012-11-14 |
US8543598B2 (en) | 2013-09-24 |
WO2011109251A2 (en) | 2011-09-09 |
JP2013521574A (ja) | 2013-06-10 |
EP2542988B1 (en) | 2018-06-20 |
EP2542988A4 (en) | 2017-01-04 |
EP2542988A2 (en) | 2013-01-09 |
CN102782682B (zh) | 2015-07-29 |
US20110213784A1 (en) | 2011-09-01 |
CA2788670A1 (en) | 2011-09-09 |
HK1178277A1 (en) | 2013-09-06 |
WO2011109251A3 (en) | 2011-12-29 |
CA2788670C (en) | 2017-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5661813B2 (ja) | セマンティックオブジェクトの特徴付けおよび検索 | |
JP5346279B2 (ja) | 検索による注釈付与 | |
CN106844368B (zh) | 用于人机对话的方法、神经网络系统和用户设备 | |
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
WO2020062770A1 (zh) | 一种领域词典的构建方法、装置、设备及存储介质 | |
US9659004B2 (en) | Retrieval device and method | |
JP2013521574A5 (ja) | ||
JP2018527656A (ja) | 画像の高次元特徴の類似性を比較するための方法及びデバイス | |
JP2020500371A (ja) | 意味的検索のための装置および方法 | |
US8463808B2 (en) | Expanding concept types in conceptual graphs | |
WO2019082362A1 (ja) | 単語意味関係推定装置および単語意味関係推定方法 | |
CN110674087A (zh) | 文件查询方法、装置及计算机可读存储介质 | |
CN117453861A (zh) | 基于对比学习与预训练技术的代码搜索推荐方法和系统 | |
CN112559691A (zh) | 语义相似度的确定方法及确定装置、电子设备 | |
JP6495206B2 (ja) | 文書概念ベース生成装置、文書概念検索装置、方法、及びプログラム | |
CN114385777A (zh) | 文本数据处理方法、装置、计算机设备和存储介质 | |
JP2011159100A (ja) | 逐次類似文書検索装置、逐次類似文書検索方法およびプログラム | |
JP2010009237A (ja) | 多言語間類似文書検索装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP6334491B2 (ja) | 概念ベース生成装置、概念検索装置、方法、及びプログラム | |
CN114723073B (zh) | 语言模型预训练、产品搜索方法、装置以及计算机设备 | |
JP2012252392A (ja) | キーワードリスト生成プログラム、キーワードリスト生成方法及びキーワードリスト生成装置 | |
CN117709349A (zh) | 一种基于多信息融合的短文本命名实体消歧方法 | |
KR20170064683A (ko) | 다중 스펙트럴 해싱 및 스케일된 오픈-엔드 동적 타임 워핑에 기반한 허밍 질의 방법 및 시스템 | |
KR20230135372A (ko) | Ai기반 자연어처리를 통한 지능형 검색 시스템 | |
JP5995219B2 (ja) | 対訳辞書生成装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20130712 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130719 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140128 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141002 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5661813 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |