JP7319391B2

JP7319391B2 - 地理的位置を検索する方法、装置、機器、コンピュータ記憶媒体及びコンピュータプログラム

Info

Publication number: JP7319391B2
Application number: JP2021568840A
Authority: JP
Inventors: ファン，チーチョウ; ワン，ハイフォン; ファン，ミャオ
Original assignee: バイドゥオンラインネットワークテクノロジー（ペキン）カンパニーリミテッド
Priority date: 2020-04-24
Filing date: 2020-11-25
Publication date: 2023-08-01
Anticipated expiration: 2040-11-25
Also published as: EP3926493A1; EP3926493B1; EP3926493A4; CN111666461B; KR20210145811A; CN111666461A; US20220121692A1; WO2021212827A1; JP2022533200A

Description

本出願は出願日が２０２０年０４月２４日であり、出願番号が２０２０１０３３４２２４１であり、発明の名称が「地理的位置を検索する方法、装置、機器、およびコンピュータ記憶媒体」である中国特許出願の優先権を主張する。
本開示は、コンピュータアプリケーション技術の分野に関し、特に、人工知能技術の分野に関する。

地図アプリケーションにとって、地理的位置検索は、ユーザが最も高頻度に使用する機能の一つである。クライアント側でもウェブページ側でも、ユーザは検索機能の入口にテキストまたは音声の形式で検索語を入力して地理的位置を検索することができる。

従来の地理的位置を検索する方法は、検索語と地理的位置名の文字の表面上の意味にマッチングする方式を使用して検索することが多く、セマンティックに関する地理的位置検索を十分に満たすことができず、さらに、言語にわたる地理的位置検索のニーズを十分に満たすことができない。

例えば、中国のユーザが、フランスのパリのエッフェル塔を検索する時に、中国語の検索語を使用して検索する確率が高い。しかし、国際化された地図業務として、エッフェル塔は、現地文字、すなわち、フランス語、または国際的に使用されている英語で使う確率が高い。したがって、単純な文字の表面上の意味にマッチングすることは、言語にわたる検索のニーズを十分に満たすことができない。

これに鑑みて、本開示は、言語にわたる地理的位置検索のニーズをよりよく満たすように、地理的位置を検索する方法、装置、機器、およびコンピュータ記憶媒体を提供する。

第１の態様によれば、本開示は地理的位置を検索する方法を提供し、当該方法は、
国際文字ベクトル表現辞書を使用して、ユーザによって入力された検索語における各文字のベクトル表現をそれぞれ決定するステップと、
検索語における各文字のベクトル表現を予めトレーニングされた第１のニューラルネットワークに入力して、検索語のベクトル表現を取得するステップと、
前記検索語のベクトル表現と地図データベース内の各地理的位置のベクトル表現の類似度を決定するステップと、
前記類似度に基づいて、検索された地理的位置を決定するステップと、を含み、
前記地理的位置のベクトル表現は、国際文字ベクトル表現辞書を使用して地理的位置の記述テキスト内の各文字のベクトル表現を決定した後に、前記地理的位置の記述テキスト内の各文字のベクトル表現を予めトレーニングされた第２のニューラルネットワークに入力することで取得され、前記国際文字ベクトル表現辞書は、少なくとも２つの言語の文字を同一のベクトル空間にマッピングするために用いられる。

第２の態様によれば、本開示は地理的位置を検索する装置を提供し、当該装置は、
国際文字ベクトル表現辞書を使用して、ユーザによって入力された検索語における各文字のベクトル表現をそれぞれ決定するための第１のベクトル決定ユニットと、前記国際文字ベクトル表現辞書は、少なくとも２つの言語の文字を同一のベクトル空間にマッピングするために用いられる第１のベクトル決定ユニットと、
検索語における各文字のベクトル表現を予めトレーニングされた第１のニューラルネットワークに入力して、検索語のベクトル表現を取得するための第２のベクトル決定ユニットと、
前記検索語のベクトル表現と地図データベース内の各地理的位置のベクトル表現の類似度を決定するための類似度決定ユニットであって、前記地理的位置のベクトル表現は、国際文字ベクトル表現辞書を使用して地理的位置の記述テキスト内の各文字のベクトル表現を決定した後に、前記地理的位置の記述テキスト内の各文字のベクトル表現を予めトレーニングされた第２のニューラルネットワークに入力することで取得される類似度決定ユニットと、
前記類似度に基づいて、検索された地理的位置を決定するための検索処理ユニットと、を含む。

第３の態様によれば、本開示は電子機器をさらに提供し、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが上記の任意の一つの方法を実行することができる。

第４の態様によれば、本開示はコンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供し、前記コンピュータ命令は、前記コンピュータに上記の任意の一つの方法を実行させる。
上記の技術案から分かるように、本開示では、国際文字ベクトル表現辞書を使用して、異なる言語の文字をいずれも同一のベクトル空間にマッピングし、各文字のベクトル表現に基づいて検索語のベクトル表現と地理的位置のベクトル表現をそれぞれ取得し、さらに、検索語のベクトル表現と地理的位置のベクトル表現との間の類似度に基づいて、検索された地理的位置を決定する。このような方式は言語にわたる地理的位置検索のニーズをよりよく満たすことができる。

上記選択可能な方式が有する他の効果は、以下で具体的な実施例を併せて説明する。

図面は、本開示をより良く理解するためのものであり、本開示を限定しない。
本開示の実施例に適用可能な例示的なシステムアーキテクチャを示す。本開示の実施例により提供される類似度モデルの計算フレームワークの概略図である。本開示の実施例１により提供される地理的位置を検索する方法のフローチャートである。本開示の実施例２により提供されるトレーニング類似度モデルの方法のフローチャートである。本開示の実施例２により提供されるトレーニング類似度モデルの原理の概略図である。本開示の実施例３により提供されるトレーニング類似度モデルの方法のフローチャートである。本開示の実施例３により提供されるセマンティックグラフを構築する概略図である。本開示の実施例３により提供されるトレーニング類似度モデルの原理の概略図である。本開示の実施例により提供される地理的位置を検索する装置の構造図である。本開示の実施例を実現するための電子機器のブロック図である。

以下、図面に基づいて、本開示の例示的な実施例を表現する。理解を容易にするために、本開示の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本開示の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。類似として、簡明のために、以下の表現では、よく知られた機能と構造の表現は省略される。

図１は本開示の実施例に適用可能な例示的なシステムアーキテクチャを示す。図２に示すように、当該システムアーキテクチャは、端末装置１０１および１０２、ネットワーク１０３、およびサーバ１０４を含むことができる。ネットワーク１０３は端末装置１０１、１０２とサーバ１０４との間の通信リンクを提供する媒体とする。ネットワーク１０３は、有線、無線通信リンク、または光ファイバケーブルなどのような、様々な接続タイプを含むことができる。

ユーザは端末装置１０１および１０２を使用して、ネットワーク１０３を介してサーバ１０４とインタラクションすることができる。端末装置１０１および１０２には、地図アプリケーション、音声インタラクションアプリケーション、ウェブブラウザアプリケーション、通信系アプリケーションなど、様々なアプリケーションがインストールされていることができる。

端末装置１０１および１０２は、地図アプリケーションをサポートおよび表示することができる様々な電子機器であってもよい。例えば、スマートフォン、タブレットコンピュータ、ＰＣ、スマートテレビなどを含むが、これらに限定されない。本開示によって提供される装置はサーバ１０４上で設置および実行することができる。これは複数のソフトウェアまたはソフトウェアモジュール（例えば、分散サービスを提供するために）として実現することができ、単一のソフトウェアまたはソフトウェアモジュールとして実現することができ、ここでは具体的に限定しない。

例えば、地理的位置を検索する装置は、上記のサーバ１０４内に設置して実行し、サーバ１０４は、端末装置１０１または１０２の検索要求を受信することができ、当該検索要求には検索語が含まれる。地理的位置を検索する装置は、本開示の実施例により提供される方式を使用して地理的位置の検索を行い、検索結果を端末装置１０１または１０２に返す。サーバ１０４に地図データベースが維持されており、当該地図データベースはサーバ１０４のローカルに記憶することができ、他のサーバに記憶してサーバ１０４から呼び出すこともできる。サーバ１０４はユーザが地図アプリケーションを使用する関連行為を取得して記録することができるので、例えば、履歴クリックログ、履歴閲覧ログなどを形成することができる。

サーバ１０４は単一のサーバであってもよく、複数のサーバによって構成されるサーバグループであってもよい。図１の端末装置、ネットワーク、およびサーバの数は単なる例示であることを理解されたい。実現のニーズに応じて、任意の数の端末装置、ネットワーク、およびサーバを有することができる。

本開示の核心思想は、国際文字ベクトル表現辞書を使用して、異なる言語の文字をいずれも同一のベクトル空間にマッピングし、各文字のベクトル表現に基づいて検索語のベクトル表現と地理的位置のベクトル表現をそれぞれ取得し、さらに、検索語のベクトル表現と地理的位置のベクトル表現との間の類似度に基づいて、検索された地理的位置を決定する。以下、実施例を組み合わせて本開示により提供される方法及び装置を詳細に説明する。

実施例１、
本開示で実現される地理的位置を検索する方法は、類似度モデルに基づいており、図２に示すように、類似度モデルは、国際文字ベクトル表現辞書（図では「辞書」と呼ばれる）、第１のニューラルネットワーク、および第２のニューラルネットワークを含むことができる。地理的位置を検索する方法は、図３に示すように、以下のようなステップを含むことができる。
３０１ａでは、ユーザによって入力された検索語を取得した後、国際文字ベクトル表現辞書を使用して、ユーザによって入力された検索語における各文字のベクトル表現をそれぞれ決定する。ユーザが検索語「ＫＦＣ」を入力することを例として、それぞれ国際文字ベクトル表現辞書を使用して、「Ｋ」の文字ベクトル表現、「Ｆ」の文字ベクトル表現、および「Ｃ」の文字ベクトル表現を決定する。

本開示に関する国際文字ベクトル表現辞書は、様々な異なる言語の文字を量子化する時に、すべて量子化して一つのベクトル表現を取得することができるように、少なくとも２つの言語の文字をすべて同一のベクトル空間にマッピングする。すべての言語の文字をマッピングして取得されるベクトル表現は同じ次元を有する。

ｃが一つの文字であると仮定すると、当該文字は、辞書によってサポートされる任意の言語の文字であってもよく、Ｃはｃに対応するベクトル表現であると、Ｃは、以下のように表現される。
Ｃ＝Ｄ（ｃ）
その中、Ｄ（）は、国際文字ベクトル表現辞書で使用されるマッピング関数である。

同様に、３０１ｂでは、地図データベース内の各地理的位置の記述テキスト内の各文字は、国際文字ベクトル表現辞書で各文字のベクトル表現としてマッピングすることもできる。その中、本開示に関する地理的位置は、地図データベース内の地理的位置を含み、地図アプリケーションにおける地理的位置ポイントを指し、当該地理的位置ポイントは、ユーザが検索、及び閲覧して、ユーザへの推奨などが可能である。これらの地理的位置ポイントは、経緯度、名称、行政住所、タイプなどの基本的な属性を有する。地理的位置ポイントは、ＰＯＩ（ＰｏｉｎｔＯｆＩｎｔｅｒｅｓｔ、興味ポイント）、ＡＯＩ（ＡｒｅａｏｆＩｎｔｅｒｅｓｔ、興味面）、ＲＯＩ（ＲｅｇｉｎｏｆＩｎｔｅｒｅｓｔ、興味領域）などを含むことができるが、これらに限定されない。

検索プロセス中に、名称上で地理的位置が検索語とマッチングするようにするだけでなく、他の地理的位置の記述情報と検索語がマッチングするように検索することができることを実現するために、本開示では、地理的位置の記述テキスト内の各文字をベクトル表現としてそれぞれ決定した後、再び、さらに、地理的位置のベクトル表現を決定することができる。記述テキストは、名称、ラベル、住所、評価、写真記述テキストのうちの少なくとも一つを含むことができるが、これらに限定されない。これらの記述テキストの情報は、地図データにも記憶および維持される。

例えば、地理的位置ポイント「ケンタッキー（西直門南大街店）」にとって、記述テキストは、以下を含む。
名称-「ケンタッキー（西直門南大街店）」、
住所-「北京市西城区西直門南大街甲１５－６号２階」、
ラベル-「チェーン」、「便利な交通」、「ワーキングランチ」、「西洋のファーストフード」など、
評価-「美味しい」、「人気がある」、「親子に適している」など
…
上記の記述テキスト内の各文字を国際文字ベクトル表現辞書で各文字のベクトル表現としてマッピングすることができる。

３０２ａでは、検索語の各文字のベクトル表現を第１のニューラルネットワークに入力し、検索語のベクトル表現を出力として取得する。３０２ｂでは、地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークに入力し、当該地理的位置のベクトル表現を取得する。このようにして、地図データベース内の各地理的位置のベクトル表現をそれぞれ取得することができる。

本開示では、第１のニューラルネットワーク、および第２のニューラルネットワークのタイプに制限されず、二つのニューラルネットワークの出力ベクトルの次元が一致していればよい。例えば、二つのニューラルネットワークは、ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋｓ、畳み込みニューラルネットワーク）、ＥＲＮＩＥ（ＥｎｈａｎｃｅｄＲｅｐｒｅｓｅｎｔａｔｉｏｎｔｈｒｏｕｇｈｋＮｏｗｌｅｄｇｅＩｎｔＥｇｒａｔｉｏｎ、知識拡張セマンティック表現モデル）を使用することができる。なお、本開示の実施例に関する「第１」、「第２」などの限定は、名称のみを区別し、順序、数量、重要度などの意味を持たない限定である。

検索語が一連のｍ個の文字q₁,q₂,…,q_mで構成され、ある地理的位置の記述テキストがｎ個のp₁,p₂,…,p_n文字で構成されると仮定すると、対応する文字ベクトル表現を取得した後、各一つのニューラルネットワーク（設定G( )は、クエリワードに対応するニューラルネットワークであり、H( )は、地理的位置に対応するニューラルネットワークである）を介して、次元が同じであるベクトルyとzをそれぞれ取得し、
G(q₁,q₂,…,q_m)=y
H(p₁,p₂,…,p_n)=z
また、地図データベース内の各地理的位置のベクトル表現は、検索プロセスにリアルタイムで決定することができる。しかしながら、予め決定した後に検索プロセスに結果を直接に呼び出すことができ、すなわち、３０１ｂと３０２ｂは、既に予めオフラインで実行された処理である。

３０３では、検索語のベクトル表現と地図データベース内の各地理的位置のベクトル表現の類似度を決定する。コサイン類似度などのような方式を使用してベクトルyとzとの間の類似度sを量子化することができる。
s=S(q₁,q₂,…,q_m;p₁,p₂,…,p_n)
=cosine(y,z)
３０４では、決定された類似度に基づいて、検索された地理的位置を決定する。類似度は、独立に地理的位置ソートの根拠とすることができ、非独立の方式で、すなわち、類似度は、特徴ベクトルのうちの一つとして、従来のソートモデルに統合することができる。

類似度が独立に地理的位置ソートの根拠とする時、類似度にしたがって高い方から低い方に各地理的位置をソートし、ソート結果によって検索された地理的位置を決定することができる。例えば、前のＮ個に配列された地理的位置を検索された地理的位置として選択し、Ｎは予め設定された正の整数である。また、例えば、類似度が予め設定された類似度閾値を超えた地理的位置を検索された地理的位置として選択する。また、例えば、類似度に基づいて高い方から低い方への順序で地理的位置を表示し、ユーザの操作（例えば一つのページは、５つの地理的位置を展示することができ、ユーザがプルダウンの更新操作をする場合、下の５つの地理的位置を展示する）によって表示される地理的位置の数量を決定する。

非独立の方式を使用する時、類似度を使用して類似度特徴を決定し、類似度特徴を予めトレーニングされたソートモデルの入力ベクトルの一つとし、ソートモデルが各地理的位置に対するソート結果を使用して検索された地理的位置を決定することができる。

当該実施例１の実現方法を通じて、以下のような検索ニーズを達成することができる。
検索ニーズ１：
ユーザが検索語「エッフェル塔」を入力すると、国際文字ベクトル表現辞書で検索語における各文字および地理的位置の記述テキスト内の各文字をすべて同一のベクトル空間にマッピングするため、記述テキストでフランス語名「ＬａＴｏｕｒＥｉｆｆｅｌ」または英語名「ＥｉｆｆｅｌＴｏｗｅｒ」を使用しても、同一のベクトル空間で非常に近い距離を有することができ、言語にわたる地理的位置検索のニーズを実現することができる。

検索ニーズ２：
ユーザが検索語「ＫＦＣ」を入力すると、検索語における各文字および地理的位置の記述テキスト内の各文字をすべて同一のベクトル空間にマッピングした後、各文字のベクトル表現を使用して検索語のベクトル表現および地理的位置のベクトル表現を取得する。記述テキストでフルネーム「ＫｅｎｔｕｃｋｙＦｒｉｅｄＣｈｉｃｋｅｎ」を使用しても、同一のベクトル空間で非常に近い距離を有することができ、セマンティックに基づく地理的位置検索のニーズを実現することができる。

上記の実施例１を実現しようとすると、類似度モデルを予めトレーニングする必要がある。以下、実施例２と実施例３をそれぞれ組み合わせて上記の類似度モデルのトレーニングプロセスに対して詳細に説明する。

実施例２、
本実施例では、履歴クリックログを使用して類似度モデルのトレーニングを実現する。履歴クリックログは、ユーザが検索された地理的位置に対してクリックしたか否かに関する検索履歴記録に基づいて生成されたログである。本実施例により提供されるトレーニング類似度モデルのプロセスは、図４に示すように、以下のようなステップを含むことができる。
４０１では、履歴クリックログからトレーニングデータを取得し、トレーニングデータは、検索語、および正のサンプルとする検索語に対応するクリックされた地理的位置と負のサンプルとするクリックされていない地理的位置を含む。

本ステップにおいてトレーニングデータを取得する時、各トレーニングデータは、実際に、一つの正と負のサンプルペアを含む。同一の検索語にとって、それに対応する検索結果から一つのクリックされた地理的位置を正のサンプルとして選択し、次に、クリックされなかった地理的位置から一つを負のサンプルとして選択する。

例えば、履歴クリックログに、検索語「ＫＦＣ」に対応する検索結果は、ケンタッキー（西直門店）、ケンタッキー（回龍観店）、ケンタッキー（三元橋店）などの地理的位置を含むと仮定する。ユーザが「ケンタッキー（回龍観店）」をクリックし、他の地理的位置はクリックしてなかった場合、その中の一つのトレーニングデータは、正のサンプルペアとする「ＫＦＣ」－「ケンタッキー（回龍観店）」と、負のサンプルペアとする「ＫＦＣ」－ケンタッキー（三元橋店）を含むことができる。

このような方式を使用して多くのトレーニングデータを選択することができる。

４０２では、トレーニングデータを使用して上記の国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングして、第１の類似度と第２の類似度の差を最大化し、第１の類似度は、検索語のベクトル表現と正のサンプルのベクトル表現の類似度であり、第２の類似度は、検索語のベクトル表現と負のサンプルのベクトル表現の類似度である。

具体的には、図５に示すように、まず、国際文字ベクトル表現辞書を使用して（図に「辞書」よばれる）、トレーニングデータ内の各文字のベクトル表現、すなわち、検索語における各文字のベクトル表現、正のサンプルとするクリックされた地理的位置の記述テキスト内の各文字のベクトル表現、負のサンプルとするクリックされていない地理的位置の記述テキスト内の各文字のベクトル表現をそれぞれ決定することができる。

ここのすべての文字は、言語に関係なく、すべて国際文字ベクトル表現辞書で同一のベクトル空間にマッピングすることができる。すべての文字のベクトル表現はすべて同じ次元を持っている。

次に、検索語における各文字のベクトル表現を第１のニューラルネットワークに入力し、検索語のベクトル表現を取得し、正のサンプルの地理的位置の記述テキスト内の各文字のベクトル表現および負のサンプルの地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、正のサンプルのベクトル表現および負のサンプルのベクトル表現を取得する。本開示では、第１のニューラルネットワーク、および第２のニューラルネットワークのタイプに制限せず、二つのニューラルネットワークの出力ベクトルの次元のみが一致すればよい。例えば、二つのニューラルネットワークは、ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋｓ、畳み込みニューラルネットワーク）、ＥＲＮＩＥ（ＥｎｈａｎｃｅｄＲｅｐｒｅｓｅｎｔａｔｉｏｎｔｈｒｏｕｇｈｋＮｏｗｌｅｄｇｅＩｎｔＥｇｒａｔｉｏｎ、知識拡張セマンティック表現モデル）を使用することができる。

次に、検索語のベクトル表現と正のサンプルのベクトル表現の第１の類似度、および同一の検索語のベクトル表現と負のサンプルのベクトル表現の第２の類似度を決定する。

第１の類似度および第２の類似度を使用して、上記の国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングして、第１の類似度と第２の類似度の差を最大化することができる。

つまり、トレーニング目標は、第１の類似度を最大化し、第２の類似度を最小化し、第１の類似度および第２の類似度の差をできるだけ最大化することである。

トレーニング目標は最小化された損失関数に表示することができ、損失関数Ｌｏｓｓは、
Ｌｏｓｓ=max[0,γ+ cosine(y,z⁺)- cosine(y,z^-)]
を使用することができ、yは、検索語のベクトル表現であり、z⁺は、正のサンプルのベクトル表現であり、z^-は、負のサンプルのベクトル表現であり、γは、ハイパーパラメータである。

トレーニングプロセス中に、トレーニング目標に達成するまで、Ｌｏｓｓの値を使用して、国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークのパラメータを含むモデルパラメータを反復的に更新する。例えば、Ｌｏｓｓの値は予め設定された要求を満たし、反復回数は予め設定された要求を満たすなどである。

本実施例により提供されるモデルトレーニング方法は、地理的位置検索で文字の表面上の意味にマッチングする必要がある限制を突破して、以下のような検索ニーズを満たすことができる。
例えば、いくつかの地理的位置については、いくつかのユーザ内で広く伝わっているふざけた名称、略称、またはニックネームなどがよくある。これらの呼称が即時に采集されて同義辞書が確立されてない場合、ユーザが実際に必要とする地理的位置検索を実現することは困難になる。例えば、ケンタッキーにとって、多くのユーザは、それをふざけた名称として「開封料理」と呼んでいる。しかし、本開示により提供される方式を使用して、ユーザが検索語「開封料理」を入力し、地理的位置の検索結果で「ケンタッキー」に関連する地理的位置をクリックしたユーザがありまたはユーザが増える場合、上記のトレーニングプロセスを通じて両者の間の類似度関連を確立することができ、実際の検索プロセスにおいて、ユーザが検索語「開封料理」を入力する時、ケンタッキーに関する地理的位置を検索して取得することができる。

しかしながら、本実施例でトレーニングされた類似度モデルは、既存の、クリック履歴がある検索語および地理的位置を非常に依存する傾向がある。高頻度で出現されてクリックされた検索語および地理的位置について、モデルは検索結果の順序付けに非常によい効果をもっている。しかし、出現された回数が少ない検索語および地理的位置、さらに出現されたことがない検索語および地理的位置について、モデルによる検索結果は非常に低くなり、すなわち、履歴クリックログが少ないコールドスタート問題を実現することができない。この技術的問題を解決するために、本開示は好ましいモデルトレーニング方式をさらに提供し、以下の実施例３で詳細に説明する。

実施例３、
できるだけクリック回数が少ない地理的位置、さらにクリックされたことがない地理的位置（例えば新出現の地理的位置）でもすべて良い検索ソート結果を取得することができるために、本実施例では、既存の高頻度クリックの地理的位置、および低頻度またはクリックされたことがない地理的位置を、別の観点から関連付けを確立する。したがって、履歴クリックログ以外に、モデルトレーニングプロセスに履歴閲覧ログを導入し、共現関係を閲覧することによって地理的位置間の関連付けを確立する。

図６は本開示の実施例３により提供されるトレーニング類似度モデルの方法のフローチャートである。図６に示すように、当該方法は、以下のようなステップを含むことができる。
６０１では、履歴クリックログからトレーニングデータを取得し、トレーニングデータは、検索語と、正のサンプルとする検索語に対応するクリックされた地理的位置と、負のサンプルとするクリックされていない地理的位置を含む。

本ステップは実施例２の４０１と同じであり、ここでは説明を省略する。

６０２では、履歴閲覧ログを使用して、地理的位置間の閲覧共現関係に基づいて前記正のサンプルと負のサンプルを拡張する。

履歴クリックログ以外に、本開示は履歴閲覧ログをさらに引用する。履歴閲覧ログは地理的位置に対するユーザの閲覧行為記録から取得される。ユーザの検索プロセス中の閲覧行為、地図アプリケーションで地理的位置をランダムに見る閲覧行為、地図アプリケーションの情報推奨による閲覧行為などを含むが、これらに限定されない。

より直感的に理解するために、図７を例として説明する。図７では、検索語「ｑ１」、「ｑ２」、および「ｑ３」について、履歴クリックログにｑ１に対応するクリックされた地理的位置Ｐ１、ｑ２に対応するクリックされた地理的位置Ｐ２、およびｑ３に対応するクリックされた地理的位置Ｐ３があり、クリックに基づく連携は図７に実線で表示する。しかし、履歴閲覧ログに基づいて、ユーザがＰ１を閲覧する時にＰ２、Ｐ４も閲覧することを取得することができる。Ｐ１とＰ２は閲覧共現関係があり、Ｐ１とＰ３は閲覧共現関係が存在すると見なすことができる。一つのセッションで前後に複数の地理的位置を閲覧した場合、当該複数の地理的位置間に共現関係があると見なす。

図７では、地理的位置間に基づいて閲覧共現関係の関連付けを破線で表示する。サンプルの拡張を容易にするために、履歴閲覧ログに基づいて、上記の地理的位置間の関連付けを使用してセマンティックグラフを構成することができる。セマンティックグラフにおいて、ノードは地理的位置であり、地理的位置間の関連付けは地理的位置間に閲覧共現関係が存在することを表示し、地理的位置間に関連パラメータも存在し、図７の辺に注記したように、「ａ１２」は、Ｐ１とＰ２との間の関連パラメータであり、「ａ１４」は、Ｐ１とＰ４との間の関連パラメータであり、「ａ２３」は、Ｐ２とＰ３との間の関連パラメータであり、このように類推する。関連パラメータは地理的位置間の閲覧共現の度合いを反映し、最初は対応する地理的位置間の共現状況によって決定することができ、例えば、共現回数によって決定し、共現回数が高いほど、対応する関連パラメータ値が大きくなる。当該関連パラメータ値は、後続のトレーニングプロセスにも役割を果たし、具体的には、ステップ６０３に関する説明を参照する。

本ステップでは、セマンティックグラフからクリックされた地理的位置に閲覧共現関係が存在する各地理的位置をそれぞれ取得して正のサンプルを拡張し、クリックされていない地理的位置に閲覧共現関係が存在する地理的位置を取得して負のサンプルを拡張することができる。セマンティックグラフを使用して正のサンプルと負のサンプルを拡張する方式は、セマンティックグラフから地理的位置間の閲覧共現関係を直接に見つけることができ、より便利であり、より効率的である。

例えば、一つのトレーニングデータについて、ｑ１－Ｐ１は正のサンプルペアであり、ｑ１－Ｐ７は負のサンプルペアである。拡張した後に、Ｐ１、Ｐ２、Ｐ４を拡張して正のサンプルにおける地理的位置を構成し、Ｐ７、Ｐ３を拡張して負のサンプルにおける地理的位置を構成することができる。

６０３では、拡張した後のトレーニングデータを使用して国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングして、第１の類似度と第２の類似度の差を最大化し、前記第１の類似度は、検索語のベクトル表現と前記正のサンプルのベクトル表現の類似度であり、前記第２の類似度は、検索語のベクトル表現と負のサンプルのベクトル表現の類似度である。

具体的には、図８に示すように、まず、国際文字ベクトル表現辞書を使用して、トレーニングデータ内の各文字のベクトル表現をそれぞれ決定することができる。すなわち、検索語における各文字のベクトル表現、正のサンプルとするクリックされた地理的位置と、クリックされた地理的位置に閲覧共現関係が存在する地理的位置の記述テキスト内の各文字のベクトル表現、負のサンプルとするクリックされていない地理的位置と、クリックされていない地理的位置に閲覧共現関係が存在する地理的位置の記述テキスト内の各文字のベクトル表現である。

次に、検索語における各文字のベクトル表現を第１のニューラルネットワークに入力し、検索語のベクトル表現を取得する。

クリックされた地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークに入力し、クリックされていない地理的位置のベクトル表現を取得し、クリックされた地理的位置に閲覧共現関係が存在する地理的位置（図には閲覧共現地理的位置と呼ばれる）の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、閲覧共現の地理的位置に対応するベクトル表現を取得する。第２のニューラルネットワークによって出力された各地理的位置のベクトル表現をセマンティックグラフにおける対応する地理的位置間の関連パラメータに従って重み付け処理を行い、正のサンプルのベクトル表現を取得する。

なお、図７に示すセマンティックグラフを例として、ｑ１に対応する正のサンプルの地理的位置は、Ｐ１、Ｐ２、およびＰ４を含み、第２のニューラルネットワークは、Ｐ１のベクトル表現Ｖ１、Ｐ２のベクトル表現Ｖ２、およびＰ４のベクトル表現Ｖ４をそれぞれ取得した後、以下の重み付け処理を行い、正のサンプルのベクトル表現z⁺を取得することができ、
z⁺=Ｖ１+ａ１２*Ｖ２+ａ１４*Ｖ４。

クリックされていない地理的位置の記述テキスト内の各文字のベクトル表現、およびクリックされていない地理的位置に閲覧共現関係が存在する地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、第２のニューラルネットワークによって出力された各地理的位置のベクトル表現をセマンティックグラフにおける対応する地理的位置間の関連パラメータに従って重み付け処理を行い、負のサンプルのベクトル表現を取得する。

上記の例を続けて、ｑ１に対応する負のサンプル地理的位置は、Ｐ７、およびＰ３を含み、第２のニューラルネットワークは、Ｐ７のベクトル表現Ｖ７と、Ｐ３のベクトル表現Ｖ３をそれぞれ取得する。図７に示すセマンティックグラフにしたがって、以下の重み付け処理を行い、負のサンプルのベクトル表現z^-を取得する。
z^-=Ｖ７+ａ３７*Ｖ３
次に、検索語のベクトル表現と正のサンプルのベクトル表現の第１の類似度、および同一の検索語のベクトル表現と負のサンプルのベクトル表現の第２の類似度を決定する。

第１の類似度および第２の類似度を使用して、前記国際文字ベクトル表現辞書、セマンティックグラフ、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングして、第１の類似度と第２の類似度の差を最大化する。

つまり、トレーニング目標は、第１の類似度を最大化し、第２の類似度を最小化し、第１の類似度および第２の類似度の差を可能な限り最大化する。

トレーニング目標は、同様に、損失関数を最小化するように表示することができ、損失関数Ｌｏｓｓは、
Ｌｏｓｓ=max[0, γ+ cosine(y,z⁺)- cosine(y,z^-)]
を使用することができ、yは、検索語のベクトル表現であり、z⁺は、正のサンプルのベクトル表現であり、z^-は、負のサンプルのベクトル表現であり、γは、ハイパーパラメータである。

トレーニングプロセス中に、トレーニング目標に達成するまで、Ｌｏｓｓの値を使用して、国際文字ベクトル表現辞書、セマンティックグラフ、第１のニューラルネットワーク、および第２のニューラルネットワークのパラメータを含むモデルパラメータを反復的に更新する。例えば、Ｌｏｓｓの値は予め設定された要求を満たし、反復回数は予め設定された要求を満たすなどである。

トレーニングプロセス中にセマンティックグラフにおける関連パラメータも更新され、各地理的位置間の閲覧共現に基づく関連関係が徐々に最適化されて、トレーニング目標を達成する。

本実施例により提供されるモデルトレーニング方法は、クリック回数係数に対応する地理的位置検索のコールドスタート問題を解決することができ、既に以下のような検索ニーズに達成する。
いくつかの新たに出現した地理的位置について、例えば、「ケンタッキー（回龍観店）」は新しくオープンした店であり、初期は、履歴クリックログに出現されず、またはクリック回数が非常に少ないため、実施例２で確立されたモデルを介して検索して当該新しい地理的位置を取得することが難しい。しかし、本実施例３のモデル確立方式を使用する場合、ユーザが地図を使用するプロセス中に、地図内の閲覧を通じて、一つのセッション中で既に長く出現された地理的位置「ケンタッキー（西直門店）」を同時に閲覧し、「ケンタッキー（回龍観店）」を同時に閲覧し、または地図アプリケーションの情報推奨機能で「ケンタッキー（西直門店）」と「ケンタッキー（回龍観店）」を同時に閲覧する。そうすると、セマンティックグラフで地理的位置「ケンタッキー（西直門店）」と「ケンタッキー（回龍観店）」との間の関連付けを確立する。「ケンタッキー（西直門店）」は長く出現された地理的位置であるため、履歴クリック回数が多い。したがって、類似度モデルを確立するプロセス中に、「ケンタッキー（西直門店）」を正のサンプルとしてトレーニングするプロセス中に、「ケンタッキー（回龍観店）」も正のサンプルのベクトル表現に貢献し、「ケンタッキー（回龍観店）」も「ケンタッキー（西直門店）」の検索語「ＫＦＣ」に関連付けを確立する。そうすると、ユーザが「ＫＦＣ」を検索する時、類似度に基づいて検索結果に「ケンタッキー（回龍観店）」が出現することができるため、「ケンタッキー（回龍観店）」のコールドスタート問題を解決する。

以上は、本開示により提供される方法に対して行う詳細の説明であり、以下は、実施例を組み合わせて本開示により提供される装置を詳細に説明する。

実施例４、
図９は本開示の実施例により提供される地理的位置を検索する装置の構造図である。当該装置は、サーバ側にあるアプリケーションプログラム、またはサーバ側にあるアプリケーションプログラムのプラグインまたはソフトウェア開発キット（ＳｏｆｔｗａｒｅＤｅｖｅｌｏｐｍｅｎｔＫｉｔ、ＳＤＫ）などの機能ユニットであってもよく、本開示の実施例はこれについて特に限定しない。図９に示すように、当該装置は、第１のベクトル決定ユニット０１、第２のベクトル決定ユニット０２、類似度決定ユニット０３、および検索処理ユニット０４を含むことができ、さらに、第１のモデルトレーニングユニット０５または第２のモデルトレーニングユニット０６を含むことができる。その中の各構成ユニットの主な機能は以下の通りである。
第１のベクトル決定ユニット０１は、国際文字ベクトル表現辞書を使用して、ユーザによって入力された検索語における各文字のベクトル表現をそれぞれ決定するために用いられ、国際文字ベクトル表現辞書は、少なくとも２つの言語の文字を同一のベクトル空間にマッピングするために用いられる。

第２のベクトル決定ユニット０２は、検索語における各文字のベクトル表現を予めトレーニングされた第１のニューラルネットワークに入力して、検索語のベクトル表現を取得するために用いられる。

類似度決定ユニット０３は、検索語のベクトル表現と地図データベース内の各地理的位置のベクトル表現の類似度を決定するために用いられる。

その中、地理的位置のベクトル表現は、上記の第１のベクトル決定ユニット０１を多重化して国際文字ベクトル表現辞書を使用して地理的位置の記述テキスト内の各文字のベクトル表現を決定した後に、次に、上記の第２のベクトル決定ユニット０２を多重化して地理的位置の記述テキスト内の各文字のベクトル表現を予めトレーニングされた第２のニューラルネットワークに入力することで取得される。地理的位置のベクトル表現は、地理的位置を検索するプロセス中にリアルタイムで決定することができるが、しかし、好ましい実施方式として、オフラインの方式を使用して予め取得することができ、次に、類似度決定ユニット０３が検索プロセス中にオフラインで取得された地図データにおける地理的位置のベクトル表現をリアルタイムで呼び出すことができる。

その中、地理的位置の記述テキストは、名称、ラベル、住所、評価、写真記述テキストのうちの少なくとも一つを含むことができる。

検索処理ユニット０４は、類似度に基づいて、検索された地理的位置を決定するために用いられる。

具体的には、検索処理ユニット０４は、類似度にしたがって各地理的位置を高い方から低い方へソートし、ソート結果によって検索された地理的位置を決定することができる。

または、検索処理ユニット０４は、類似度を使用して類似度特徴を決定し、類似度特徴を予めトレーニングされたソートモデルの入力ベクトルの一つとし、ソートモデルが各地理的位置に対するソート結果を使用して検索された地理的位置を決定することもできる。

第１のモデルトレーニングユニット０５と第２のモデルトレーニングユニット０６は、上記の国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークによって構成された類似度モデルを予めトレーニングする。本開示には第１のモデルトレーニングユニット０５と第２のモデルトレーニングユニット０６のうちの一つを使用することができる。

第１のモデルトレーニングユニット０５は、
履歴クリックログからトレーニングデータを取得し、トレーニングデータは、検索語と、正のサンプルとする検索語に対応するクリックされた地理的位置と、負のサンプルとするクリックされていない地理的位置を含み、
トレーニングデータを使用して国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングして、第１の類似度と第２の類似度の差を最大化するトレーニングプロセスを予め実行し、第１の類似度は、検索語のベクトル表現と正のサンプルのベクトル表現の類似度であり、第２の類似度は、検索語のベクトル表現と負のサンプルのベクトル表現の類似度である。

具体的には、第１のモデルトレーニングユニット０５は、トレーニングデータを使用して国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングする時に、
国際文字ベクトル表現辞書を使用して、トレーニングデータ内の各文字のベクトル表現をそれぞれ決定し、
検索語における各文字のベクトル表現を第１のニューラルネットワークに入力し、検索語のベクトル表現を取得し、正のサンプルの地理的位置の記述テキスト内の各文字のベクトル表現および負のサンプルの地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、正のサンプルのベクトル表現および負のサンプルのベクトル表現を取得し、
検索語のベクトル表現と正のサンプルのベクトル表現の第１の類似度、および同一の検索語のベクトル表現と負のサンプルのベクトル表現の第２の類似度を決定し、
国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングして、第１の類似度と第２の類似度の差を最大化することを実行する。

第２のモデルトレーニングユニット０６は、
履歴クリックログからトレーニングデータを取得し、トレーニングデータは、検索語と、正のサンプルとする検索語に対応するクリックされた地理的位置と、負のサンプルとするクリックされていない地理的位置を含み、
履歴閲覧ログを使用して、地理的位置間の閲覧共現関係に基づいて正のサンプルと負のサンプルを拡張し、
拡張した後のトレーニングデータを使用して国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングして、第１の類似度と第２の類似度の差を最大化するトレーニングプロセスを予め実行するために用いられ、第１の類似度は、検索語のベクトル表現と正のサンプルのベクトル表現の類似度であり、第２の類似度は、検索語のベクトル表現と負のサンプルのベクトル表現の類似度である。

具体的には、第２のモデルトレーニングユニット０６は、セマンティックグラフからクリックされた地理的位置に閲覧共現関係が存在する各第１の地理的位置をそれぞれ取得して正のサンプルを拡張し、クリックされていない地理的位置に閲覧共現関係が存在する各第２の地理的位置をそれぞれ取得して負のサンプルを拡張することができる。

その中、第２のモデルトレーニングユニット０６は、拡張した後のトレーニングデータを使用して国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングする時、具体的には、
国際文字ベクトル表現辞書を使用して、トレーニングデータ内の各文字のベクトル表現をそれぞれ決定し、
検索語における各文字のベクトル表現を第１のニューラルネットワークに入力し、検索語のベクトル表現を取得し、クリックされた地理的位置の記述テキスト内の各文字のベクトル表現、および各第１の地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、第２のニューラルネットワークによって出力された各地理的位置のベクトル表現をセマンティックグラフにおける対応する地理的位置間の関連パラメータに従って重み付け処理を行い、正のサンプルのベクトル表現を取得し、クリックされていない地理的位置の記述テキスト内の各文字のベクトル表現、および各第２の地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、第２のニューラルネットワークによって出力された各地理的位置のベクトル表現をセマンティックグラフにおける対応する地理的位置間の関連パラメータに従って重み付け処理を行い、負のサンプルのベクトル表現を取得し、
検索語のベクトル表現と正のサンプルのベクトル表現の第１の類似度、および同一の検索語のベクトル表現と負のサンプルのベクトル表現の第２の類似度を決定し、
国際文字ベクトル表現辞書、セマンティックグラフ、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングして、第１の類似度と第２の類似度の差を最大化することを実行することができる。

第２のモデルトレーニングユニット０６を使用する場合、当該装置は、セマンティックグラフ構築ユニット０７をさらに含み、
セマンティックグラフ構築ユニット０７は、履歴閲覧ログに基づいてセマンティックグラフを確立し、セマンティックグラフにおけるノードは地理的位置であり、閲覧共現関係が存在する地理的位置に対して対応するノード間の関連付けを確立するために用いられ、地理的位置間の関連パラメータは、最初に地理的位置間の共現状況に基づいて決定し、
これに対応して、第２のモデルトレーニングユニット０６は、トレーニングプロセス中にセマンティックグラフにおける地理的位置間の関連パラメータを更新する。

第２のモデルトレーニングユニット０６は、履歴クリックログからトレーニングデータを取得する以外に、さらに、履歴閲覧ログから、閲覧共現関係に基づいてトレーニングデータ中の正のサンプルと負のサンプルを拡張することによって、クリック回数係数に対応する地理的位置検索のコールドスタート問題を解決する。したがって、本開示では第２のモデルトレーニングユニット０６を優先的に使用するため、図９には第１のモデルトレーニングユニット０５を破線を使用して表示する。

本開示の実施例によれば、本開示は電子機器および読み取り可能な記憶媒体をさらに提供する。

図１０に示すように、本開示の実施例の地理的位置を検索する方法を実現するための電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブル装置、他の同様のコンピューティング装置などの様々な形式のモバイル装置を表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び／又は要求される本開示の実現を制限することを意図したものではない。

図１０に示すように、当該電子機器は、一つ又は複数のプロセッサ１００１と、メモリ１００２と、高速インターフェースと低速インターフェースを含む各コンポーネントを接続するためのインターフェースと、を含む。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられるか、又は必要に基づいて他の方式で取り付けることができる。プロセッサは、外部入力／出力装置（インターフェースに結合されたディスプレイ装置など）にＧＵＩの図形情報をディスプレイするためにメモリに記憶されている命令を含む、電子機器内に実行される命令を処理することができる。他の実施方式では、必要であれば、複数のプロセッサ及び／又は複数のバスを、複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各電子機器は、部分的な必要な操作（例えば、サーバアレイ、ブレードサーバ、又はマルチプロセッサシステムとする）を提供することができる。図１０では、一つのプロセッサ１００１を例とする。

メモリ１００２は、本開示により提供される非一時的なコンピュータ読み取り可能な記憶媒体である。その中、前記メモリには、少なくとも一つのプロセッサによって実行される命令を記憶して、前記少なくとも一つのプロセッサが本開示により提供される地理的位置を検索する方法を実行することができるようにする。本開示の非一時的なコンピュータ読み取り可能な記憶媒体は、コンピュータが本開示により提供される地理的位置を検索する方法を実行するためのコンピュータ命令を記憶する。

メモリ１００２は、非一時的なコンピュータ読み取り可能な記憶媒体として、本開示の実施例における地理的位置を検索する方法に対応するプログラム命令／モジュールように、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶するために用いられる。プロセッサ１００１は、メモリ１００２に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち上記の方法の実施例における地理的位置を検索する方法を実現する。

メモリ１００２は、ストレージプログラム領域とストレージデータ領域とを含むことができ、その中、ストレージプログラム領域は、オペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラムを記憶することができ、ストレージデータ領域は、当該電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ１００２は、高速ランダムアクセスメモリを含むことができ、非一時的なメモリをさらに含むことができ、例えば、少なくとも一つのディスクストレージ装置、フラッシュメモリ装置、又は他の非一時的なソリッドステートストレージ装置である。いくつかの実施例では、メモリ１００２は、プロセッサ１００１に対して遠隔に設置されたメモリを含むことができ、これらの遠隔メモリは、ネットワークを介して当該電子機器に接続されることができる。上記のネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びその組み合わせを含むが、これらに限定しない。

地理的位置を検索する方法の電子機器は、入力装置１００３と出力装置１００４とをさらに含むことができる。プロセッサ１００１、メモリ１００２、入力装置１００３、及び出力装置１００４は、バス又は他の方式を介して接続することができ、図１０では、バスを介して接続することを例とする。

入力装置１００３は、入力された数字又は文字情報を受信することができ、及び当該電子機器のユーザ設置及び機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、指示杆、一つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置１００４は、ディスプレイ装置、補助照明装置（例えば、ＬＥＤ）、及び触覚フィードバック装置（例えば、振動モータ）などを含むことができる。当該ディスプレイ装置は、ＬＣＤ（液晶ディスプレイ）、ＬＥＤ（発光ダイオード）ディスプレイ、及びプラズマディスプレイを含むことができるが、これらに限定しない。いくつかの実施方式では、ディスプレイ装置は、タッチスクリーンであってもよい。

本明細書で説明されるシステムと技術の様々な実施方式は、デジタル電子回路システム、集積回路システム、特定用途向けＡＳIＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせで実現することができる。これらの様々な実施方式は、一つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該一つ又は複数のコンピュータプログラムは、少なくとも一つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び／又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置に伝送することができる。

これらのコンピューティングプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる）は、プログラマブルプロセッサの機械命令、高レベルのプロセス及び／又はオブジェクト指向プログラミング言語、及び／又はアセンブリ／機械言語でこれらのコンピューティングプログラムを実施することを含む。本明細書に使用されるように、用語「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」は、機械命令及び／又はデータをプログラマブルプロセッサに提供するために使用される任意のコンピュータプログラム製品、機器、及び／又は装置（例えば、磁気ディスク、光ディスク、メモリ、ＰＬＤ（プログラマブルロジック装置））を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。用語「機械読み取り可能な信号」は、機械命令及び／又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。

ユーザとのインタラクションを提供するために、コンピュータ上でここで説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティング装置（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティング装置によって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられることもでき、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力と、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバー）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施方式とインタラクションする）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、ブロックチェーンネットワークと、を含む。

コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。

上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。

上記の具体的な実施方式は、本開示に対する保護範囲の制限を構成するものではない。当業者は、設計要求と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれなければならない。

Claims

コンピュータにより実行される、地理的位置を検索する方法であって、
国際文字ベクトル表現辞書を使用して、ユーザによって入力された検索語における各文字のベクトル表現をそれぞれ決定するステップと、
検索語における各文字のベクトル表現を予めトレーニングされた第１のニューラルネットワークに入力して、検索語のベクトル表現を取得するステップと、
前記検索語のベクトル表現と地図データベース内の各地理的位置のベクトル表現の類似度を決定するステップと、
前記類似度に基づいて、検索された地理的位置を決定するステップと、を含み、
前記地理的位置のベクトル表現は、国際文字ベクトル表現辞書を使用して地理的位置の記述テキスト内の各文字のベクトル表現を決定した後に、前記地理的位置の記述テキスト内の各文字のベクトル表現を予めトレーニングされた第２のニューラルネットワークに入力することで取得され、前記国際文字ベクトル表現辞書は、少なくとも２つの言語の文字を同一のベクトル空間にマッピングするために用いられ、
当該方法は、
履歴クリックログからトレーニングデータを取得し、前記トレーニングデータは、検索語と、正のサンプルとする検索語に対応するクリックされた地理的位置と、負のサンプルとするクリックされていない地理的位置を含み、
履歴閲覧ログを使用して、地理的位置間の閲覧共現関係に基づいて前記正のサンプルと負のサンプルを拡張し、前記クリックされた地理的位置と閲覧共現関係がある各地理的位置を取得して正のサンプルを拡張し、前記クリックされていない地理的位置と閲覧共現関係がある各地理的位置を取得して負のサンプルを拡張し、一つのセッションで前後に複数の地理的位置を閲覧した場合、当該複数の地理的位置間に閲覧共現関係があり、
拡張した後のトレーニングデータを使用して前記国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークのパラメータを更新して、第１の類似度と第２の類似度の差を最大化するトレーニングプロセスを予め実行することをさらに含み、
前記第１の類似度は、前記検索語のベクトル表現と前記正のサンプルのベクトル表現の類似度であり、前記第２の類似度は、前記検索語のベクトル表現と前記負のサンプルのベクトル表現の類似度であり、
前記国際文字ベクトル表現辞書は、検索語における各文字のベクトル表現と、正のサンプルとするクリックされた地理的位置の記述テキスト内の各文字のベクトル表現と、負のサンプルとするクリックされていない地理的位置の記述テキスト内の各文字のベクトル表現とを決定するために用いられる、
地理的位置を検索する方法。
前記地理的位置の記述テキストは、名称、ラベル、住所、評価、写真記述テキストのうちの少なくとも一つを含む、
請求項１に記載の地理的位置を検索する方法。
前記類似度に基づいて、検索された地理的位置を決定するステップは、
類似度にしたがって各地理的位置を高い方から低い方へソートし、ソート結果によって検索された地理的位置を決定するステップと、または、
前記類似度を使用して類似度特徴を決定し、前記類似度特徴を予めトレーニングされたソートモデルの入力ベクトルの一つとし、前記ソートモデルが各地理的位置に対するソート結果を使用して検索された地理的位置を決定するステップと、を含む、
請求項１に記載の地理的位置を検索する方法。
当該方法は、
履歴クリックログからトレーニングデータを取得し、前記トレーニングデータは、検索語と、正のサンプルとする検索語に対応するクリックされた地理的位置と、負のサンプルとするクリックされていない地理的位置を含み、
前記トレーニングデータを使用して前記国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークのパラメータを更新して、第１の類似度と第２の類似度の差を最大化するトレーニングプロセスを予め実行することをさらに含み、
前記第１の類似度は、前記検索語のベクトル表現と前記正のサンプルのベクトル表現の類似度であり、前記第２の類似度は、前記検索語のベクトル表現と前記負のサンプルのベクトル表現の類似度である、
請求項１に記載の地理的位置を検索する方法。
前記トレーニングデータを使用して前記国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングするステップは、
国際文字ベクトル表現辞書を使用して、トレーニングデータ内の各文字のベクトル表現をそれぞれ決定するステップと、
検索語における各文字のベクトル表現を第１のニューラルネットワークに入力し、検索語のベクトル表現を取得し、正のサンプルの地理的位置の記述テキスト内の各文字のベクトル表現および負のサンプルの地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、正のサンプルのベクトル表現および負のサンプルのベクトル表現を取得するステップと、
検索語のベクトル表現と正のサンプルのベクトル表現の第１の類似度、および同一の検索語のベクトル表現と負のサンプルのベクトル表現の第２の類似度を決定するステップと、
前記国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングして、第１の類似度と第２の類似度の差を最大化するステップと、を含む、
請求項４に記載の地理的位置を検索する方法。
前記履歴閲覧ログを使用して、地理的位置間の閲覧共現関係に基づいて前記正のサンプルと負のサンプルを拡張するステップは、
セマンティックグラフから前記クリックされた地理的位置に閲覧共現関係が存在する各第１の地理的位置をそれぞれ取得して前記正のサンプルを拡張し、前記クリックされていない地理的位置に閲覧共現関係が存在する各第２の地理的位置をそれぞれ取得して前記負のサンプルを拡張するステップを含み、
セマンティックグラフにおいて、ノードは地理的位置であり、地理的位置間の関連付けは地理的位置間に閲覧共現関係が存在することを表し、地理的位置間に地理的位置間の閲覧共現関係の度合いを反映する関連パラメータが存在し、前記関連パラメータは最初に地理的位置間に閲覧共現が発生する回数によって決定される、
請求項１に記載の地理的位置を検索する方法。
前記拡張した後のトレーニングデータを使用して前記国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングするステップは、
国際文字ベクトル表現辞書を使用して、トレーニングデータ内の各文字のベクトル表現をそれぞれ決定するステップと、
検索語における各文字のベクトル表現を第１のニューラルネットワークに入力し、検索語のベクトル表現を取得し、前記クリックされた地理的位置の記述テキスト内の各文字のベクトル表現と、前記各第１の地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、第２のニューラルネットワークによって出力された各地理的位置のベクトル表現をセマンティックグラフにおける対応する地理的位置間の関連パラメータに従って重み付け処理を行い、正のサンプルのベクトル表現を取得するステップと、前記クリックされていない地理的位置の記述テキスト内の各文字のベクトル表現、および前記各第２の地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、第２のニューラルネットワークによって出力された各地理的位置のベクトル表現をセマンティックグラフにおける対応する地理的位置間の関連パラメータに従って重み付け処理を行い、負のサンプルのベクトル表現を取得するステップと、
検索語のベクトル表現と正のサンプルのベクトル表現の第１の類似度、および同一の検索語のベクトル表現と負のサンプルのベクトル表現の第２の類似度を決定するステップと、
前記国際文字ベクトル表現辞書、セマンティックグラフ、第１のニューラルネットワーク、および第２のニューラルネットワークのパラメータを更新して、第１の類似度と第２の類似度の差を最大化するステップと、を含む、
請求項６に記載の地理的位置を検索する方法。
地理的位置を検索する装置であって、
国際文字ベクトル表現辞書を使用して、ユーザによって入力された検索語における各文字のベクトル表現をそれぞれ決定するための第１のベクトル決定ユニットであって、前記国際文字ベクトル表現辞書は、少なくとも２つの言語の文字を同一のベクトル空間にマッピングするために用いられる第１のベクトル決定ユニットと、
検索語における各文字のベクトル表現を予めトレーニングされた第１のニューラルネットワークに入力して、検索語のベクトル表現を取得するための第２のベクトル決定ユニットと、
前記検索語のベクトル表現と地図データベース内の各地理的位置のベクトル表現の類似度を決定するための類似度決定ユニットであって、前記地理的位置のベクトル表現は、国際文字ベクトル表現辞書を使用して地理的位置の記述テキスト内の各文字のベクトル表現を決定した後に、前記地理的位置の記述テキスト内の各文字のベクトル表現を予めトレーニングされた第２のニューラルネットワークに入力することで取得される類似度決定ユニットと、
前記類似度に基づいて、検索された地理的位置を決定するための検索処理ユニットと、を含み、
当該装置は、第２のモデルトレーニングユニットをさらに含み、前記第２のモデルトレーニングユニットは、
履歴クリックログからトレーニングデータを取得し、前記トレーニングデータは、検索語と、正のサンプルとする検索語に対応するクリックされた地理的位置と、負のサンプルとするクリックされていない地理的位置を含み、
履歴閲覧ログを使用して、地理的位置間の閲覧共現関係に基づいて前記正のサンプルと負のサンプルを拡張し、前記クリックされた地理的位置と閲覧共現関係がある各地理的位置を取得して正のサンプルを拡張し、前記クリックされていない地理的位置と閲覧共現関係がある各地理的位置を取得して負のサンプルを拡張し、一つのセッションで前後に複数の地理的位置を閲覧した場合、当該複数の地理的位置間に閲覧共現関係があり、
拡張した後のトレーニングデータを使用して前記国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークのパラメータを更新して、第１の類似度と第２の類似度の差を最大化するトレーニングプロセスを予め実行するために用いられ、
前記第１の類似度は、前記検索語のベクトル表現と前記正のサンプルのベクトル表現の類似度であり、前記第２の類似度は、前記検索語のベクトル表現と前記負のサンプルのベクトル表現の類似度であり、
前記国際文字ベクトル表現辞書は、検索語における各文字のベクトル表現と、正のサンプルとするクリックされた地理的位置の記述テキスト内の各文字のベクトル表現と、負のサンプルとするクリックされていない地理的位置の記述テキスト内の各文字のベクトル表現とを決定するために用いられる、
地理的位置を検索する装置。
前記地理的位置の記述テキストは、名称、ラベル、住所、評価、写真記述テキストのうちの少なくとも一つを含む、
請求項８に記載の地理的位置を検索する装置。
前記検索処理ユニットは、具体的には、
類似度にしたがって各地理的位置を高い方から低い方へソートし、ソート結果によって検索された地理的位置を決定し、または、
前記類似度を使用して類似度特徴を決定し、前記類似度特徴を予めトレーニングされたソートモデルの入力ベクトルの一つとし、前記ソートモデルが各地理的位置に対するソート結果を使用して検索された地理的位置を決定するために用いられる、
請求項８に記載の地理的位置を検索する装置。
当該装置は、第１のモデルトレーニングユニットをさらに含み、
前記第１のモデルトレーニングユニットは、
履歴クリックログからトレーニングデータを取得し、前記トレーニングデータは、検索語と、正のサンプルとする検索語に対応するクリックされた地理的位置と、負のサンプルとするクリックされていない地理的位置を含み、
前記トレーニングデータを使用して前記国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークのパラメータを更新して、第１の類似度と第２の類似度の差を最大化するトレーニングプロセスを予め実行するために用いられ、前記第１の類似度は、前記検索語のベクトル表現と前記正のサンプルのベクトル表現の類似度であり、前記第２の類似度は、前記検索語のベクトル表現と前記負のサンプルのベクトル表現の類似度である、
請求項８に記載の地理的位置を検索する装置。
前記第１のモデルトレーニングユニットは、前記トレーニングデータを使用して前記国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングする時、具体的には、
国際文字ベクトル表現辞書を使用して、トレーニングデータ内の各文字のベクトル表現をそれぞれ決定し、
検索語における各文字のベクトル表現を第１のニューラルネットワークに入力し、検索語のベクトル表現を取得し、正のサンプルの地理的位置の記述テキスト内の各文字のベクトル表現および負のサンプルの地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、正のサンプルのベクトル表現および負のサンプルのベクトル表現を取得し、
検索語のベクトル表現と正のサンプルのベクトル表現の第１の類似度、および同一の検索語のベクトル表現と負のサンプルのベクトル表現の第２の類似度を決定し、
前記国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングして、第１の類似度と第２の類似度の差を最大化することを実行する、
請求項１１に記載の地理的位置を検索する装置。
前記第２のモデルトレーニングユニットは、具体的には、セマンティックグラフから前記クリックされた地理的位置に閲覧共現関係が存在する各第１の地理的位置をそれぞれ取得して前記正のサンプルを拡張し、前記クリックされていない地理的位置に閲覧共現関係が存在する各第２の地理的位置をそれぞれ取得して前記負のサンプルを拡張し、
セマンティックグラフにおいて、ノードは地理的位置であり、地理的位置間の関連付けは地理的位置間に閲覧共現関係が存在することを表し、地理的位置間に地理的位置間の閲覧共現関係の度合いを反映する関連パラメータが存在し、前記関連パラメータは最初に地理的位置間に閲覧共現が発生する回数によって決定される、
請求項８に記載の地理的位置を検索する装置。
前記第２のモデルトレーニングユニットは、拡張した後のトレーニングデータを使用して前記国際文字ベクトル表現辞書、第１のニューラルネットワーク、および第２のニューラルネットワークをトレーニングする時、具体的には、
国際文字ベクトル表現辞書を使用して、トレーニングデータ内の各文字のベクトル表現をそれぞれ決定し、
検索語における各文字のベクトル表現を第１のニューラルネットワークに入力し、検索語のベクトル表現を取得し、前記クリックされた地理的位置の記述テキスト内の各文字のベクトル表現と、前記各第１の地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、第２のニューラルネットワークによって出力された各地理的位置のベクトル表現をセマンティックグラフにおける対応する地理的位置間の関連パラメータに従って重み付け処理を行い、正のサンプルのベクトル表現を取得し、前記クリックされていない地理的位置の記述テキスト内の各文字のベクトル表現、および前記各第２の地理的位置の記述テキスト内の各文字のベクトル表現を第２のニューラルネットワークにそれぞれ入力し、第２のニューラルネットワークによって出力された各地理的位置のベクトル表現をセマンティックグラフにおける対応する地理的位置間の関連パラメータに従って重み付け処理を行い、負のサンプルのベクトル表現を取得し、
検索語のベクトル表現と正のサンプルのベクトル表現の第１の類似度、および同一の検索語のベクトル表現と負のサンプルのベクトル表現の第２の類似度を決定し、
前記国際文字ベクトル表現辞書、セマンティックグラフ、第１のニューラルネットワーク、および第２のニューラルネットワークのパラメータを更新して、第１の類似度と第２の類似度の差を最大化することを実行する、
請求項１３に記載の地理的位置を検索する装置。
電子機器であって、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項１～７のいずれかの一つに記載の方法を実行する、
電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項１～７のいずれかの一つに記載の方法を実行させる、
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータに請求項１～７のいずれかの一つに記載の方法を実行させる、
コンピュータプログラム。