JP7203981B2 - 地理位置を検索するための類似性モデル作成方法、装置、電子デバイス、記憶媒体およびプログラム - Google Patents
地理位置を検索するための類似性モデル作成方法、装置、電子デバイス、記憶媒体およびプログラム Download PDFInfo
- Publication number
- JP7203981B2 JP7203981B2 JP2021536167A JP2021536167A JP7203981B2 JP 7203981 B2 JP7203981 B2 JP 7203981B2 JP 2021536167 A JP2021536167 A JP 2021536167A JP 2021536167 A JP2021536167 A JP 2021536167A JP 7203981 B2 JP7203981 B2 JP 7203981B2
- Authority
- JP
- Japan
- Prior art keywords
- vector representation
- neural network
- similarity
- character
- geolocation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Remote Sensing (AREA)
- Library & Information Science (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
履歴閲覧ログを使用して、地理位置間の共起関係に基づいて前記ポジティブサンプルと前記ネガティブサンプルを拡張することと、
拡張されたトレーニングサンプルを使用して第1のニューラルネットワークと第2のニューラルネットワークを含む類似性モデルを取得することと、を含み、
ここで、前記トレーニングは、
第1のニューラルネットワークを使用して検索語のベクトル表示を決定し、第2のニューラルネットワークを使用して、拡張されたポジティブサンプルのベクトル表示と拡張されたネガティブサンプルのベクトル表示をそれぞれ決定することと、
前記検索語のベクトル表示とポジティブサンプルのベクトル表示との類似性である第1の類似性と、前記検索語のベクトル表示とネガティブサンプルのベクトル表示との類似性である第2の類似性の差別を最大化するように、前記第1のニューラルネットワークと前記第2のニューラルネットワークをトレーニングすることと、を含む
地理位置を検索するための類似性モデル作成方法を提供した。
履歴閲覧ログを使用して、地理位置間の共起関係に基づいて前記ポジティブサンプルと前記ネガティブサンプルを拡張するサンプル拡張ユニットと、
拡張されたトレーニングサンプルを使用して第1のニューラルネットワークと第2のニューラルネットワークを含む類似性モデルを取得し、具体的に、
第1のニューラルネットワークを使用して検索語のベクトル表示を決定し、第2のニューラルネットワークを使用して、拡張されたポジティブサンプルのベクトル表示と拡張されたネガティブサンプルのベクトル表示をそれぞれ決定することと、
前記検索語のベクトル表示とポジティブサンプルのベクトル表示との類似性である第1の類似性と、前記検索語のベクトル表示とネガティブサンプルのベクトル表示との類似性である第2の類似性の差別を最大化するように、前記第1のニューラルネットワークと前記第2のニューラルネットワークをトレーニングすることと、を実行するモデルトレーニングユニットと、を含むことを特徴とする地理位置を検索するための類似性モデル作成装置を提供した。
前記少なくとも1つのプロセッサと通信可能に接続されたメモリとを含み、
前記メモリは、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに前記のいずれか一項に記載の方法を実行させる命令を記憶する電子デバイスを提供した。
第五の局面では、プロセッサによって前記いずれか一項に記載の方法を実現するコンピュータプログラムを提供した。
本願で提供される類似モデルは、ユーザが入力した検索語を受信した後、トレーニングされた類似性モデルを使用してユーザが入力した検索語にマッチングする地理位置を検索し、地理位置検索を実現する。この出願で提供される類似性モデルは、少なくとも第1のニューラルネットワークおよび第2のニューラルネットワークを含む。第1のニューラルネットワークは、検索語のベクトル表示を決定し、第2のニューラルネットワークは、地図データベース中の各地理位置のベクトル表示を決定する。次に、検索語のベクトル表示と各地理位置のベクトル表示との類似性が計算され、類似性に基づいて検索された地理位置が決定される。
cがキャラクターであると仮定すると、そのキャラクターは辞書でサポートされている任意の言語のキャラクターであり、Cはcに対応するベクトル表示であり、Cは次のように表される。
ただし、D(c)は国際キャラクターベクトル表示辞書で採用されているマッピング関数である。
アドレス-「北京市西城区西直門南街甲15-6号2階」,
ラベル-「チェーン」、「交通便利」、「仕事の食事」、「洋食のファーストフード」など、
評価-「味が良い」、「人気がある」、「親子に適している」など。
・・・
H(p1,p2,…,pn)=z
また、地図データベース中の各地理位置のベクトル表示は、検索プロセス中にリアルタイムで決定できる。しかしながら、好ましくは、予め決定した後、検索プロセスで直接に呼び出すことができる。すなわち、地理データベース中の各地理位置のベクトル表示が、事前にオフラインで実行されたプロセスであると決定される。
=cosine(y,z)
最後に、決定された類似性に従って、検索された地理位置が決定される。類似性は、地理位置ランキングの基礎として独立して使用することも、独立しない方法で使用することもできる。つまり、類似性は、特徴ベクトルの1つによって既存のランキングモデルに統合することができる。
ユーザは、「エッフェル塔」という検索語を入力した。検索語の各キャラクターと地理位置の説明テキストの各キャラクターは、国際キャラクターベクトル表示辞書を介して同じベクトル空間にマッピングされるため、説明テキストにフランス名「La Tour Eiffel」又は英語名「Eiffel Tower」を使用しても、同じベクトル空間内で非常に近い距離があり、言語間の地理位置検索ニーズを実現することができる。
ユーザが「KFC」という検索語を入力した。検索語の各キャラクターと地理位置の説明テキストの各キャラクターが同じベクトル空間にマッピングされた後、各キャラクターのベクトル表示を使用して検索語のベクトル表示と地理位置のベクター表示を取得するため、説明テキストで「Kentucky Fried Chicken」というフルネームが使用されている場合でも、同じベクトル空間内で非常に近い距離があり、語意に基づく地理位置検索のニーズを実現することができる。
クリック数が少ない地理位置、クリックされていない地理位置(例えば新たに出現する地理位置など)でも、良好な検索ランキング結果をできるだけ得るために、本実施例では、既存の高頻度でクリックされた地理位置と、低頻度またはクリックされていない地理位置を別の観点から関連付けている。したがって、履歴クリックログに加えて、モデルトレーニングプロセスに歴史閲覧ログを導入し、共起関係を閲覧することによって地理位置間の関連を作成する。
クリックされていない地理位置の説明テキスト中の各キャラクターのベクトル表示と、クリックされていない地理位置と閲覧共起関係を有する地理位置の説明テキスト中の各キャラクターのベクトル表示とを、第2のニューラルネットワークに入力し、第2のニューラルネットワークネットワークによって出力された各地理位置のベクトル表示を、語意図中の対応地理位置間の関連パラメータに従って、重み付けして、ネガティブサンプルのベクトル表示を取得する。
ただし、yは検索語のベクトル表示であり、z+はポジティブサンプルのベクトル表示であり、z-はネガティブサンプルのベクトル表示であり、γはハイパーパラメータである。
図6は、本願の実施例によって提供される地理位置を検索するための装置構造図であり、この装置は、サーバ側に配置できるアプリケーションプログラム又はサーバ側アプリケーションプログラムのプラグインやソフトウェア開発キット(Software Development Kit、SDK)などの機能ユニットであるが、これは、本発明の実施例において特に限定されない。図6に示すように、この装置は、サンプル取得ユニット01、サンプル拡張ユニット02、モデルトレーニングユニット03を含み、さらに語意図構築ユニット04、検索ユニット05を含む。各構成ユニットの主な機能は次のとおりである。
第1のニューラルネットワークを使用して検索語のベクトル表示を決定し、第2のニューラルネットワークを使用して、拡張されたポジティブサンプルのベクトル表示と拡張されたネガティブサンプルのベクトル表示をそれぞれ決定する。
Claims (21)
- 履歴クリックログから、検索語と、ポジティブサンプルとする検索語に対応するクリックされた地理位置と、ネガティブサンプルとするクリックされていない地理位置を含むトレーニングデータを取得することと、
履歴閲覧ログを使用して、地理位置間の共起関係に基づいて前記ポジティブサンプルと前記ネガティブサンプルを拡張することと、
拡張されたトレーニングサンプルを使用してトレーニングし、第1のニューラルネットワークと第2のニューラルネットワークを含む類似性モデルを取得することと、を含み、
前記トレーニングは、
第1のニューラルネットワークを使用して前記検索語のベクトル表示を決定し、第2のニューラルネットワークを使用して、拡張されたポジティブサンプルのベクトル表示と拡張されたネガティブサンプルのベクトル表示をそれぞれ決定することと、
前記検索語のベクトル表示とポジティブサンプルのベクトル表示との類似性である第1の類似性と、前記検索語のベクトル表示とネガティブサンプルのベクトル表示との類似性である第2の類似性の差分を最大化するように、前記第1のニューラルネットワークと前記第2のニューラルネットワークをトレーニングすることと、を含む
ことを特徴とする地理位置を検索するための類似性モデル作成方法。 - 履歴閲覧ログを使用して、地理位置間の共起関係に基づいて前記ポジティブサンプルと前記ネガティブサンプルを拡張することは、
前記ポジティブサンプルを拡張するように、前記クリックされた地理位置と閲覧共起関係を有する各第1の地理位置を語意図に基づいて取得し、前記ネガティブサンプルを拡張するように、前記クリックされていない地理位置と閲覧共起関係を有する各第2の地理位置を語意図に基づいて取得することができることを含む
ことを特徴とする請求項1に記載の方法。 - 前記第2のニューラルネットワークを使用して、拡張されたポジティブサンプルのベクトル表示と拡張されたネガティブサンプルのベクトル表示をそれぞれ決定することは、
前記第2のニューラルネットワークを使用して、拡張されたポジティブサンプル中の各地理位置のベクトル表示および拡張されたネガティブサンプル中の各地理位置のベクトル表示をそれぞれ決定することと、
前記拡張されたポジティブサンプル中の各地理位置のベクトル表示を、語意図中の各第1の地理位置と前記クリックされた地理位置との間の関連パラメータに従って重み付け処理し、ポジティブサンプルのベクトル表示を取得し、前記拡張されたネガティブサンプル中の各地理位置のベクトル表示を、前記語意図中の各第2の地理位置と前記クリックされていない地理位置との関連パラメータに従って重み付け処理し、ネガティブサンプルのベクトル表示を取得することと、を含む
ことを特徴とする請求項1に記載の方法。 - 前記語意図は履歴閲覧ログに基づいて作成され、
前記語意図中のノードは地理位置であり、閲覧共起関係がある地理位置に対して、対応ノード間の関連を作成し、地理位置間の関連パラメータは、最初に地理位置間の共起状況に応じて決定され、トレーニングプロセスにおいて更新される
ことを特徴とする請求項2又は3に記載の方法。 - 前記類似性モデルは、拡張されたトレーニングデータ中の各キャラクターのベクトル表示を決定するためのキャラクターベクトル表示辞書をさらに含み、
前記第1のニューラルネットワークを使用して、前記検索語のベクトル表示を決定することは、
前記検索語の各キャラクターのベクトル表示を前記第1のニューラルネットワークに入力して、検索語のベクトル表示を取得することを含み、
前記第2のニューラルネットワークを使用して、拡張されたポジティブサンプル中の各地理位置のベクトル表示および拡張されたネガティブサンプル中の各地理位置のベクトル表示を決定することは、
拡張されたポジティブサンプルまたは拡張されたネガティブサンプル中の各地理位置に対して、この地理位置の説明テキスト中の各キャラクターのベクトル表示を前記第2のニューラルネットワークに入力してこの地理位置のベクトル表示を取得することをそれぞれ実行することを含む
ことを特徴とする請求項3に記載の方法。 - ユーザが入力した検索語を受信すると、トレーニングにより得られた前記類似性モデルを用いて、前記ユーザが入力した検索語にマッチングする地理位置を検索する
ことを特徴とする請求項1に記載の方法。 - トレーニングにより得られた前記類似性モデルを用いて、前記ユーザが入力した検索語にマッチングする地理位置を検索することは、
前記第1のニューラルネットワークを使用して、前記ユーザが入力した検索語のベクトル表示を決定することと、
前記ユーザが入力した検索語のベクトル表示と、前記第2のニューラルネットワークによって決定される地図データベース中の各地理位置のベクトル表示との間の類似性を決定することと、
前記類似性に基づいて、検索された地理位置を決定することと、を含む
ことを特徴とする請求項6に記載の方法。 - 前記類似性モデルは、さらにキャラクターベクトル表示辞書をさらに含み、
前記第1のニューラルネットワークを使用して前記ユーザが入力した検索語のベクトル表示を決定することは、
前記キャラクターベクトル表示辞書を使用して、前記ユーザが入力した検索語の各キャラクターのベクトル表示を決定し、前記ユーザが入力した検索語中の各キャラクターのベクトル表示を前記第1のニューラルネットワークに入力して前記ユーザが入力した検索語のベクトル表示を取得することを含み、
前記第2のニューラルネットワークを使用して地図データベース中の地理位置のベクトル表示を決定することは、
前記キャラクターベクトル表示辞書を使用して、地図データベース中の地理位置の説明テキスト中の各キャラクターのベクトル表示を決定し、この地理位置の説明テキスト中の各キャラクターのベクトル表示を前記第2のニューラルネットワークに入力して、この地理位置のベクトル表示を取得することを含む
ことを特徴とする請求項7に記載の方法。 - 前記キャラクターベクトル表示辞書は、少なくとも2つの言語のキャラクターを同じベクトル空間にマッピングするための国際キャラクターベクトル表示辞書である
ことを特徴とする請求項5又は8に記載の方法。 - 前記地理位置の説明テキストは、名称、ラベル、アドレス、評価および写真説明テキストのうちの少なくとも1つを含む
ことを特徴とする請求項5又は8に記載の方法。 - 前記類似性に基づいて検索された地理位置を決定することは、
地図データベース中の地理位置を、類似性の高い順にランキングし、ランキング結果に基づいて、検索された地理位置を決定すること、または、
前記類似性を使用して類似性特徴を決定し、前記類似性特徴を予めトレーニングされたランキングモデルの入力ベクトルの1つとして使用し、前記ランキングモデルを使用して、地図データベース中の各地理位置のランキング結果について検索された地理位置を決定すること、を含む
ことを特徴とする請求項7に記載の方法。 - 履歴クリックログから、検索語と、ポジティブサンプルとする検索語に対応するクリックされた地理位置と、ネガティブサンプルとするクリックされていない地理位置を含むトレーニングデータを取得するサンプル取得ユニットと、
履歴閲覧ログを使用して、地理位置間の共起関係に基づいて前記ポジティブサンプルと前記ネガティブサンプルを拡張するサンプル拡張ユニットと、
拡張されたトレーニングサンプルを使用して第1のニューラルネットワークと第2のニューラルネットワークを含む類似性モデルを取得し、具体的に、
第1のニューラルネットワークを使用して、検索語のベクトル表示を決定し、第2のニューラルネットワークを使用して、拡張されたポジティブサンプルのベクトル表示と拡張されたネガティブサンプルのベクトル表示をそれぞれ決定することと、
前記検索語のベクトル表示とポジティブサンプルのベクトル表示との類似性である第1の類似性と、前記検索語のベクトル表示とネガティブサンプルのベクトル表示との類似性である第2の類似性の差分を最大化するように、前記第1のニューラルネットワークと前記第2のニューラルネットワークをトレーニングすることと、を実行するモデルトレーニングユニットと、を含む
ことを特徴とする地理位置を検索するための類似性モデル作成装置。 - 前記サンプル拡張ユニットは、具体的に
前記ポジティブサンプルを拡張するように前記クリックされた地理位置と閲覧共起関係を有する各第1の地理位置を語意図に基づいて取得し、前記ネガティブサンプルを拡張するように前記クリックされていない地理位置と閲覧共起関係を有する各第2の地理位置を語意図に基づいて取得し、
前記モデルトレーニングユニットは、前記第2のニューラルネットワークを使用して、拡張されたポジティブサンプルのベクトル表示と拡張されたネガティブサンプルのベクトル表示をそれぞれ決定する時に、具体的に
前記第2のニューラルネットワークを使用して、拡張されたポジティブサンプル中の各地理位置のベクトル表示および拡張されたネガティブサンプル中の各地理位置のベクトル表示をそれぞれ決定することと、
前記拡張されたポジティブサンプル中の各地理位置のベクトル表示を、前記語意図中の各第1の地理位置と前記クリックされた地理位置との間の関連パラメータに従って重み付け処理し、ポジティブサンプルのベクトル表示を取得し、前記拡張されたネガティブサンプル中の各地理位置のベクトル表示を、前記語意図中の各第2の地理位置と前記クリックされていない地理位置との関連パラメータに従って重み付け処理し、ネガティブサンプルのベクトル表示を取得することと、を実行する
ことを特徴とする請求項12に記載の装置。 - 語意図作成ユニット、をさらに含み、履歴閲覧ログに基づいて語意図を作成し、前記語意図中のノードが地理位置であり、閲覧共起関係がある地理位置に対して対応ノード間の関連を作成し、地理位置間の関連パラメータが、最初に地理位置間の共起状況に応じて決定され
前記モデルトレーニングユニットは、さらに、トレーニングプロセスにおいて前記語意図中の地理位置間の関連パラメータを更新する
ことを特徴とする請求項13に記載の装置。 - 前記類似性モデルは、拡張されたトレーニングデータ中の各キャラクターのベクトル表示を決定するためのキャラクターベクトル表示辞書をさらに含み、
前記モデルトレーニングユニットは、具体的に、
前記検索語の各キャラクターのベクトル表示を前記第1のニューラルネットワークに入力して、検索語のベクトル表示を取得し、
拡張されたポジティブサンプルまたは拡張されたネガティブサンプル中の各地理位置に対して、この地理位置の説明テキスト中の各キャラクターのベクトル表示を前記第2のニューラルネットワークに入力してこの地理位置のベクトル表示を取得することをそれぞれ実行するために用いられる
ことを特徴とする請求項13に記載の装置。 - ユーザが入力した検索語を受信すると、トレーニングにより得られた前記類似性モデルを用いて、前記ユーザが入力した検索語にマッチングする地理位置を検索する検索ユニット、をさらに含む
ことを特徴とする請求項12に記載の装置。 - 前記類似性モデルは、さらにキャラクターベクトル表示辞書をさらに含み、
前記検索ユニットは、具体的に
前記キャラクターベクトル表示辞書を使用して、前記ユーザが入力した検索語の各キャラクターのベクトル表示を決定し、前記ユーザが入力した検索語中の各キャラクターのベクトル表示を前記第1のニューラルネットワークに入力して前記ユーザが入力した検索語のベクトル表示を取得し、
前記ユーザが入力した検索語のベクトル表示と地図データベース中の各地理位置のベクトル表示との類似性を決定し、
前記類似性に基づいて検索された地理位置を決定することに用いられ、
ここで、地図データベース中の各地理位置のベクトル表示は、前記キャラクターベクトル表示辞書を使用して地図データベース中の地理位置の説明テキスト中の各キャラクターのベクトル表示を決定した後、この地理位置の説明テキスト中の各キャラクターのベクトル表示を前記第2のニューラルネットワークに入力して取得されることである
ことを特徴とする請求項16に記載の装置。 - 前記キャラクターベクトル表示辞書は、少なくとも2つの言語のキャラクターを同じベクトル空間にマッピングするために使用される国際キャラクターベクトル表示辞書である
ことを特徴とする請求項15又は17に記載の装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されたメモリとを含み、
前記メモリは、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1~11のいずれか一項に記載の方法を実行させる命令を記憶する
電子デバイス。 - コンピュータに請求項1~11のいずれか一項に記載の方法を実行させるコンピュータ命令を記憶する
非一時的なコンピュータ読み取り可能な記憶媒体。 - プロセッサによって請求項1~11のいずれか一項に記載の方法を実現するコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010335198.4A CN111666292B (zh) | 2020-04-24 | 2020-04-24 | 用于检索地理位置的相似度模型建立方法和装置 |
CN202010335198.4 | 2020-04-24 | ||
PCT/CN2020/131320 WO2021212826A1 (zh) | 2020-04-24 | 2020-11-25 | 用于检索地理位置的相似度模型建立方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022532967A JP2022532967A (ja) | 2022-07-21 |
JP7203981B2 true JP7203981B2 (ja) | 2023-01-13 |
Family
ID=72382913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021536167A Active JP7203981B2 (ja) | 2020-04-24 | 2020-11-25 | 地理位置を検索するための類似性モデル作成方法、装置、電子デバイス、記憶媒体およびプログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US11836174B2 (ja) |
EP (1) | EP3933609A4 (ja) |
JP (1) | JP7203981B2 (ja) |
KR (1) | KR20210087099A (ja) |
CN (1) | CN111666292B (ja) |
WO (1) | WO2021212826A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111666292B (zh) * | 2020-04-24 | 2023-05-26 | 百度在线网络技术(北京)有限公司 | 用于检索地理位置的相似度模型建立方法和装置 |
CN112308603A (zh) * | 2020-10-13 | 2021-02-02 | 深圳坤湛科技有限公司 | 基于相似性扩展的快速门店选址方法及装置、存储介质 |
CN113342912B (zh) * | 2021-05-24 | 2022-03-18 | 北京百度网讯科技有限公司 | 地理位置区域的编码方法、建立编码模型的方法及装置 |
CN113505204B (zh) * | 2021-09-09 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 召回模型训练方法、搜索召回方法、装置和计算机设备 |
WO2024071729A1 (ko) * | 2022-09-28 | 2024-04-04 | 경북대학교 산학협력단 | 2단계 사전 학습 기반의 인공지능을 이용한 음성 인식 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104123319A (zh) | 2013-04-28 | 2014-10-29 | 百度在线网络技术(北京)有限公司 | 对具有地图需求的搜索项进行解析的方法和装置 |
CN108197203A (zh) | 2017-12-28 | 2018-06-22 | 百度在线网络技术(北京)有限公司 | 一种门脸头图挑选方法、装置、服务器和存储介质 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR0107329A (pt) | 2000-10-17 | 2002-08-27 | Koninkl Philips Electronics Nv | Processo de codificação para codificar um elemento de descrição de uma instância de um esquema tipo xml, processo de decodificação para decodificar um fragmento compreendendo um conteúdo e uma sequência de informação de identificação, codificador para codificar um elemento de descrição de uma instância de um esquema tipo xml, decodificador para decodificar um fragmento compreendendo um conteúdo e uma sequência de informação de identificação, sistema de transmissão, sinal para transmissão através de uma rede de transmissão, e, tabela destinada a ser usada em um codificador |
CN101136028B (zh) | 2006-07-10 | 2012-07-04 | 日电(中国)有限公司 | 基于自然语言的位置查询系统以及基于关键词的位置查询系统 |
US8170352B2 (en) | 2008-03-24 | 2012-05-01 | Sophos Plc | String searching facility |
US8838512B2 (en) | 2011-04-18 | 2014-09-16 | Microsoft Corporation | Random walk on query pattern graph for query task classification |
US9129029B1 (en) * | 2011-05-19 | 2015-09-08 | Google Inc. | Ranking content using location-based query log analysis |
US20130326025A1 (en) * | 2012-05-16 | 2013-12-05 | Mile Newbold Clark | System and Method for Differentiating and Calculating Royalties for Copyright-Protected Song Samples Used by Artists in New Works |
CN103714092A (zh) | 2012-09-29 | 2014-04-09 | 北京百度网讯科技有限公司 | 一种地理位置的搜索方法和装置 |
US20160012482A1 (en) * | 2014-07-10 | 2016-01-14 | Google Inc. | Cross-Vertical Distribution of Sponsored Content |
CN104834721A (zh) | 2015-05-12 | 2015-08-12 | 百度在线网络技术(北京)有限公司 | 基于位置的搜索处理方法及装置 |
CN106610972A (zh) * | 2015-10-21 | 2017-05-03 | 阿里巴巴集团控股有限公司 | 查询改写方法及装置 |
US10546015B2 (en) * | 2015-12-01 | 2020-01-28 | Facebook, Inc. | Determining and utilizing contextual meaning of digital standardized image characters |
CN106547887B (zh) * | 2016-10-27 | 2020-04-07 | 北京百度网讯科技有限公司 | 基于人工智能的搜索推荐方法和装置 |
CN107220312B (zh) | 2017-05-12 | 2020-08-14 | 华中科技大学 | 一种基于共现图的兴趣点推荐方法及系统 |
CN107562716A (zh) | 2017-07-18 | 2018-01-09 | 阿里巴巴集团控股有限公司 | 词向量处理方法、装置以及电子设备 |
CN107491547B (zh) * | 2017-08-28 | 2020-11-10 | 北京百度网讯科技有限公司 | 基于人工智能的搜索方法和装置 |
CN110019668A (zh) | 2017-10-31 | 2019-07-16 | 北京国双科技有限公司 | 一种文本检索方法及装置 |
CN108415900A (zh) * | 2018-02-05 | 2018-08-17 | 中国科学院信息工程研究所 | 一种基于多级共现关系词图的可视化文本信息发现方法及系统 |
US20200004886A1 (en) * | 2018-06-28 | 2020-01-02 | Microsoft Technology Licensing, Llc | Generating supervised embedding representations for search |
CN109408814B (zh) | 2018-09-30 | 2020-08-07 | 中国地质大学(武汉) | 基于释义基元词的中英跨语言词汇表征学习方法及系统 |
CN110162593B (zh) * | 2018-11-29 | 2023-03-21 | 腾讯科技(深圳)有限公司 | 一种搜索结果处理、相似度模型训练方法及装置 |
CN109801100A (zh) * | 2018-12-26 | 2019-05-24 | 北京达佳互联信息技术有限公司 | 广告投放方法、装置和计算机可读存储介质 |
CN110765368B (zh) | 2018-12-29 | 2020-10-27 | 滴图(北京)科技有限公司 | 用于语义检索的人工智能系统和方法 |
CN110674419B (zh) | 2019-01-25 | 2020-10-20 | 滴图(北京)科技有限公司 | 地理信息检索方法、装置、电子设备及可读存储介质 |
WO2021000362A1 (zh) | 2019-07-04 | 2021-01-07 | 浙江大学 | 一种基于深度神经网络模型的地址信息特征抽取方法 |
CN111026937B (zh) * | 2019-11-13 | 2021-02-19 | 百度在线网络技术(北京)有限公司 | 提取poi名称的方法、装置、设备和计算机存储介质 |
CN111666461B (zh) | 2020-04-24 | 2023-05-26 | 百度在线网络技术(北京)有限公司 | 检索地理位置的方法、装置、设备和计算机存储介质 |
CN111666292B (zh) | 2020-04-24 | 2023-05-26 | 百度在线网络技术(北京)有限公司 | 用于检索地理位置的相似度模型建立方法和装置 |
-
2020
- 2020-04-24 CN CN202010335198.4A patent/CN111666292B/zh active Active
- 2020-11-25 JP JP2021536167A patent/JP7203981B2/ja active Active
- 2020-11-25 KR KR1020217019225A patent/KR20210087099A/ko not_active Application Discontinuation
- 2020-11-25 WO PCT/CN2020/131320 patent/WO2021212826A1/zh unknown
- 2020-11-25 EP EP20900684.0A patent/EP3933609A4/en not_active Ceased
- 2020-11-25 US US17/416,705 patent/US11836174B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104123319A (zh) | 2013-04-28 | 2014-10-29 | 百度在线网络技术(北京)有限公司 | 对具有地图需求的搜索项进行解析的方法和装置 |
CN108197203A (zh) | 2017-12-28 | 2018-06-22 | 百度在线网络技术(北京)有限公司 | 一种门脸头图挑选方法、装置、服务器和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20220335074A1 (en) | 2022-10-20 |
CN111666292B (zh) | 2023-05-26 |
EP3933609A4 (en) | 2022-03-23 |
US11836174B2 (en) | 2023-12-05 |
CN111666292A (zh) | 2020-09-15 |
WO2021212826A1 (zh) | 2021-10-28 |
EP3933609A1 (en) | 2022-01-05 |
JP2022532967A (ja) | 2022-07-21 |
KR20210087099A (ko) | 2021-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7203981B2 (ja) | 地理位置を検索するための類似性モデル作成方法、装置、電子デバイス、記憶媒体およびプログラム | |
US11868357B2 (en) | Search result ranking and presentation | |
JP2022050379A (ja) | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
KR20210086436A (ko) | 질의 응답 처리 방법, 장치, 전자 기기 및 저장 매체 | |
EP3916579A1 (en) | Method for resource sorting, method for training sorting model and corresponding apparatuses | |
WO2021212827A1 (zh) | 检索地理位置的方法、装置、设备和计算机存储介质 | |
JP2022097396A (ja) | 対話理解モデルの訓練方法、装置、デバイス及び記憶媒体 | |
US20130339001A1 (en) | Spelling candidate generation | |
JP2017504876A (ja) | テキストのコンテキストベースの定義および翻訳を提供するためのシステムおよび方法 | |
JP2021166098A (ja) | 検索語の推薦方法と装置、目的モデルの訓練方法と装置、電子デバイス、記憶媒体、及びプログラム | |
WO2017180212A1 (en) | Related entity discovery | |
KR102090237B1 (ko) | 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램 | |
WO2021139209A1 (zh) | 查询自动补全的方法、装置、设备和计算机存储介质 | |
JP7146961B2 (ja) | 音声パッケージの推薦方法、装置、電子機器および記憶媒体 | |
CN110147494B (zh) | 信息搜索方法、装置,存储介质及电子设备 | |
US20150169539A1 (en) | Adjusting Time Dependent Terminology in a Question and Answer System | |
CN110275962B (zh) | 用于输出信息的方法和装置 | |
WO2021042084A1 (en) | Systems and methods for retreiving images using natural language description | |
CN112328896B (zh) | 用于输出信息的方法、装置、电子设备和介质 | |
CN116383340A (zh) | 信息搜索方法、装置、电子设备和存储介质 | |
WO2023225919A1 (zh) | 一种视觉搜索方法及装置 | |
CN118690071A (zh) | 一种优化搜索结果多样性的方法和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210621 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7203981 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |