JP2012532388A - マップサーチのためのクエリパーシング - Google Patents
マップサーチのためのクエリパーシング Download PDFInfo
- Publication number
- JP2012532388A JP2012532388A JP2012518721A JP2012518721A JP2012532388A JP 2012532388 A JP2012532388 A JP 2012532388A JP 2012518721 A JP2012518721 A JP 2012518721A JP 2012518721 A JP2012518721 A JP 2012518721A JP 2012532388 A JP2012532388 A JP 2012532388A
- Authority
- JP
- Japan
- Prior art keywords
- token
- location
- score
- query
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 195
- 238000012549 training Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 36
- 238000013179 statistical model Methods 0.000 claims description 36
- 238000004891 communication Methods 0.000 claims description 20
- 230000009471 action Effects 0.000 claims description 7
- 238000000638 solvent extraction Methods 0.000 claims 6
- 230000001737 promoting effect Effects 0.000 claims 1
- 230000011218 segmentation Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 46
- 238000005192 partition Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008439 repair process Effects 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 241001465382 Physalis alkekengi Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Remote Sensing (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
-単一のタームである、タームユニグラム(term unigram)、
-2つの隣接するタームから成るタームシーケンスである、タームバイグラム(term bigram)、
-タイプ「None」を伴う隣接するタームのシーケンス、
-全てのタームのシーケンス、
-単一のタイプである、タイプユニグラム(type unigram)、
-2つの隣接するタイプから成るタイプシーケンスであるタイプバイグラム(type bigram)、および
-全てのタイプのシーケンス、に対してカウントされる。例えば、住所
タームユニグラム:「北京」(Beijing)、
タームバイグラム:
全てのタームのシーケンス:
タイプユニグラム:「市」(City)、「区」(District)、「路」(Road);
タイプバイグラム:「市、区」(City, District)、「区、路」(District, Road);
全てのタイプのシーケンス:「市、区、路」(City、District、Road);ということになる。
上述の項目において、タイプ「None」を伴う隣接するタームのシーケンスは、この例の中ではカウントされない。なぜなら、トークンシーケンス[ターム:北京(Beijing)、タイプ:市(City)]、[ターム:
-「項目」フィールド510であって、タームユニグラム、タイプユニグラム、ならびに、タイプ「None」を伴う隣接するタームのシーケンス、全てのタームのシーケンス、タイプバイグラム、および全てのタイプのシーケンスを含む、タームまたはタイプのシーケンス、の1つの内容を記録するフィールドと、
-「項目タイプ」フィールド520であって、項目が、タームユニグラム、タイプユニグラム、タイプバイグラム、タームバイグラム、タイプ「None」を伴う隣接するタームのシーケンス、全てのタームのシーケンス、および全てのタイプのシーケンス、という項目タイプの中の、どのタイプであるかを記録するフィールドと、
-「タイトルの中の発生回数」フィールド530であって、対応する項目がタイトルの中で何回発生するかを記録するフィールドと、
-「アドレスの中の発生回数」フィールド540であって、対応する項目がアドレスの中で何回発生するかを記録するフィールドとを有する。一部の実装形態においては、モデルエントリは同様に、5番目のフィールドであり、項目の言語を示す「言語」フィールド550を持つことができる。
項目のロケーション統計スコア=log(l_count)*l_count/(l_count+q_count)
---方程式(1)
項目のクエリ統計スコア=log(q_count)*q_count/(l_count+q_count)
---方程式(2)
ここで、l_countおよびq_countは、アドレスおよびタイトルにおける項目の発生回数をそれぞれ表し、これらは、統計モデル250の中に格納される。例えば、タームユニグラム
ターム:北京(Beijing)、タイプ:市(City)
ターム:
ターム:
query_conf = query_score / (query_score + location_score)
...方程式(3)
location_conf = location_score / (query_score + location_score)
...方程式(4)
ここで、query_confおよびlocation_confは、それぞれ、項目のクエリ信頼スコアおよびロケーション信頼スコアであり、query_scoreおよびlocation_scoreは、それぞれ、項目のクエリ統計スコアおよびロケーション統計スコアである。次に、分割のクエリ部に対するクエリ信頼スコアは、クエリ部のタームクエリスコアを決定するために使用される、項目のクエリ信頼スコアの平均として定義され(図8B)、また分割のロケーション部に対するロケーション信頼スコアは、ロケーション部のタームロケーション信頼スコアを決定するために使用される、項目のロケーション信頼スコアの平均として定義される(図7B)。ある分割の分割信頼スコアは、この分割のロケーション部のロケーション信頼スコアと、この分割のクエリ部のクエリ信頼スコアとの平均として定義される。一例として、分割信頼スコアは、[0、1]の範囲内の値を有し、分割信頼スコアが高いほど、分割の正しさにおける信頼がある。分割信頼スコアは同様に、パーシングモジュール230により参考として出力することができる追加のパーシング結果である。
120 サーバ
130 ネットワーク
140 マップサーチシステム
200 パーシングシステム
210 トークン化モジュール
220 モデル訓練モジュール
230 パーシングモジュール
240 辞書
250 統計モデル
1002 処理装置
1004 第1のデータストア
1006 第2のデータストア
1008 入力装置
1110 出力装置
1012 ネットワークインターフェース
Claims (57)
- コンピュータ実装されるマップサーチ方法であって、
マップサーチのためのユーザからの入力エントリを、入力検索エントリの中の位置情報を表すロケーション部と前記入力エントリの中の前記ロケーション部に関連する検索対象を表すクエリ部とにパーシングするステップと、
マップサーチを実施して、前記ロケーション部に基づいて地理的領域またはロケーションを取得し、前記クエリ部に関連し、かつ、前記取得された地理的領域またはロケーションの所に、中に、または近くに位置する1つまたは複数のエンティティに関する情報を検索するステップとを含む、ことを特徴とするマップサーチ方法。 - 前記パーシングするステップが、前記入力エントリに基づく前記マップサーチの実施に先立って実行される、ことを特徴とする請求項1に記載のマップサーチ方法。
- 前記パーシングするステップが、
前記入力エントリを1つまたは複数のトークンのトークンシーケンスへとパーシングするステップであって、各トークンが、前記入力エントリのセグメントを表すタームと、前記タームにアノテートされたタイプとを含むステップと、
各タームに対する前記タイプを、前記タームがアドレス関連情報と前記アドレス関連情報のタイプを包含するかどうかを示すために用いるステップとを含む、ことを特徴とする請求項1に記載のマップサーチ方法。 - 前記タームがアドレス関連情報を包含しないということを示すタイプを有するトークンに関連する地理的領域またはロケーションの取得においては、なにも行動を起こさないステップを含む、ことを特徴とする請求項3に記載のマップサーチ方法。
- 前記入力エントリを前記トークンシーケンスへとパーシングする前記ステップは、
前記入力エントリの中のアドレス関連単語を、トークンのタームとして特定するステップと、
前記アドレス関連単語のタイプを、前記トークンの前記タイプとして特定するステップとを含む、ことを特徴とする請求項3に記載のマップサーチ方法。 - 前記入力エントリの中のアドレス関連単語を特定する前記ステップが、
アドレス関連単語の辞書の中のエントリと、前記エントリのタイプとを、トークンの前記アドレス関連単語と前記タイプとを特定するために用いるステップを含む、ことを特徴とする請求項5に記載のマップサーチ方法。 - 前記辞書のアドレス関連単語が、行政区名、道路名、アドレス関連サフィックス、アドレス関連プリフィックス、および番号の、少なくとも1つを含む、ことを特徴とする請求項5に記載のマップサーチ方法。
- アドレス関連サフィックスおよびプリフィックスが、アドレスネームサフィックス、方向プリフィックスまたはサフィックス、および数量サフィックスの少なくとも1つを含む、ことを特徴とする請求項7に記載のマップサーチ方法。
- 前記入力エントリの中の単語を、アドレスに関連していないトークンのタームとして特定するステップと、
「None」を、前記トークンの前記タイプとして割り当てて、前記トークンの前記タームがアドレス関連情報を包含しないことを示すステップとを含む、ことを特徴とする請求項5に記載のマップサーチ方法。 - 前記入力エントリの前記パーシングする前記ステップがさらに、
前記トークンシーケンスの可能な分割位置を決定するステップであって、各可能な分割位置が前記トークンシーケンスを1つまたは2つのサブ-トークンシーケンスへと分割する、ステップと、
前記可能な分割位置のそれぞれに対して可能な分割方法を決定するステップであって、各可能な分割方法が、前記トークンシーケンスを(1)可能なクエリ部および(2)可能なロケーション部の少なくとも1つへと分割する、ステップと、
前記可能な分割方法のそれぞれの正しさについての統計的確率を示す分割スコアを決定するステップと、
最も高い分割スコアを有する前記可能な分割方法を、結果として得られた分割方法として選択するステップとを含む、ことを特徴とする請求項3に記載のマップサーチ方法。 - 「Road」のタイプを伴うトークンと「Number」のタイプを伴うトークンとの間の前記位置が、分割位置であることから除外される、ことを特徴とする請求項10に記載のマップサーチ方法。
- 前記トークンシーケンスを2つのサブ-トークンシーケンスへと分割する可能な分割位置に対して、
前記2つのサブ-トークンシーケンスのそれぞれに対してロケーション統計スコアおよびクエリ統計スコアを決定し、前記可能な分割位置に対応する前記可能な分割方法を、より高いロケーション統計スコアを伴う前記サブ-トークンシーケンスを、前記可能なロケーション部として、また、他のサブ-トークンシーケンスを前記可能なクエリ部として見なすことにより決定するステップと、
前記トークンシーケンスを1つのサブ-トークンシーケンスに分割する、可能な分割位置に対して、
前記可能な分割位置に対応する前記可能な分割方法を、前記サブ-トークンシーケンスの前記ロケーション統計スコアが、前記サブ-トークンシーケンスの前記クエリ統計スコアより高い場合に、前記サブ-トークンシーケンスを前記ロケーション部と見なし、前記サブ-トークンシーケンスの前記クエリ統計スコアが、前記サブ-トークンシーケンスの前記ロケーション統計スコアより高い場合は、前記サブ-トークンシーケンスを前記クエリ部と見なすことにより決定するステップとを含む、ことを特徴とする請求項10に記載のマップサーチ方法。 - 前記可能な分割方法のそれぞれの正しさの統計的確率を示す前記分割スコアを決定する前記ステップは、
各可能な分割方法の正しさの確率を表す、各可能な分割方法に対する分割スコアを、前記ロケーション部の前記ロケーション統計スコアおよび前記クエリ部の前記クエリ統計スコアのどちらかまたは両方に基づいて決定するステップを含む、ことを特徴とする請求項12に記載のマップサーチ方法。 - トークンシーケンスの前記ロケーション統計スコアおよび前記クエリ統計スコアの少なくとも1つが、統計モデルを参照することにより決定され、トークンシーケンスの前記ロケーション統計スコアが、前記トークンシーケンスがロケーションである確率を示し、および前記トークンシーケンスのクエリ統計スコアが、前記トークンシーケンスがクエリである確率を示す、ことを特徴とする請求項12に記載のマップサーチ方法。
- 前記統計モデルが、タイトルおよびアドレスを含む訓練データに基づいて生成される、ことを特徴とする請求項14に記載のマップサーチ方法。
- 生アドレスが、前記生アドレスの中のテイリングタイトルを除去するために前処理され、および生タイトルが、前記生タイトルの中の接頭されている行政区名を除去するために、訓練データとして使用される前に前処理される、ことを特徴とする請求項15に記載のマップサーチ方法。
- 前記統計モデルが、
タイトルおよびアドレスを含む前記訓練データのそれぞれを、1つまたは複数のトークンを含み、各トークンがタームと、前記タームにアノテートされ前記タームの特性を示すタイプとを含むトークンシーケンスへとパーシングするステップと、
前記タイトルおよびアドレスの前記トークンシーケンスの中に含まれる各項目に対して、タイトルの中の発生回数と、アドレスの中の発生回数とを、それぞれカウントおよび格納するステップ、とにより生成され、
各項目は、単一のタームを有するタームユニグラム、2つの隣接するタームのタームシーケンスを有するタームバイグラム、タイプ「None」を伴う隣接するタームのシーケンス、全てのタームのシーケンス、単一のタイプを意味するタイプユニグラム、2つの隣接するタイプシーケンスを意味するタイプバイグラム、および全てのタイプのシーケンス、の任意のものである、ことを特徴とする請求項15に記載のマップサーチ方法。 - 前記トークンシーケンスをロケーション部およびクエリ部へと分割する前記可能な分割方法に対する前記分割スコアは、前記ロケーション部のロケーション統計スコアと前記クエリ部のクエリ統計スコアとを合計することにより決定される、ことを特徴とする請求項13に記載のマップサーチ方法。
- 前記トークンシーケンスをロケーション部またはクエリ部へと分割する前記可能な分割方法に対する前記分割スコアが、前記ロケーション部の前記ロケーション統計スコアまたは前記クエリ部の前記クエリ統計スコアとして定義される、ことを特徴とする請求項13に記載のマップサーチ方法。
- 可能な分割方法ごとに、前記クエリ部のためのクエリ乗数および/または前記ロケーション部のためのロケーション乗数を決定するステップと、
(1)前記ロケーション部の前記ロケーション統計スコアを、前記ロケーション乗数により乗算することにより、および(2)前記クエリ部の前記クエリ統計スコアを前記クエリ乗数により乗算することにより、調整するステップと、
前記トークンシーケンスをロケーション部およびクエリ部へと分割する前記可能な分割方法に対する前記分割スコアを、前記ロケーション部の前記調整されたロケーション統計スコアと前記クエリ部の前記調整されたクエリ統計スコアとを合計することにより決定するステップと、
前記トークンシーケンスをロケーション部またはクエリ部へと分割する前記可能な分割方法に対する前記分割スコアを、前記ロケーション部の前記調整されたロケーション統計スコアまたはクエリ部の前記調整されたクエリ統計スコアとして決定するステップとを含む、ことを特徴とする請求項13に記載のマップサーチ方法。 - 前記クエリ乗数を決定する前記ステップが、
前記クエリ乗数を、前記項目および前記クエリ部の長さに基づいて決定するステップを含む、ことを特徴とする請求項20に記載のマップサーチ方法。 - 前記ロケーション乗数を決定する前記ステップが、
前記ロケーション部に関連するベースロケーション乗数を決定するステップと、
前記ベースロケーション乗数を既定のルールに従って調整するステップと、
前記ロケーション乗数を、前記調整されたベースロケーション乗数として決定するステップとを含む、ことを特徴とする請求項20に記載のマップサーチ方法。 - 前記ベースロケーション乗数を既定のルールに従って調整する前記ステップが、
前記ロケーション部が階層順でアドレス関連単語を包含する場合は、前記ベースロケーション乗数を昇格するステップを含む、ことを特徴とする請求項22に記載のマップサーチ方法。 - 前記ベースロケーション乗数を既定のルールに従って調整する前記ステップが、
前記ロケーション部が階層順でないアドレス関連単語を包含する場合は、前記ベースロケーション乗数を降格するステップを含む、ことを特徴とする請求項22に記載のマップサーチ方法。 - 前記ベースロケーション乗数を既定のルールに従って調整する前記ステップが、
前記ロケーション部が重複したアドレス関連単語を包含する場合は、前記ベースロケーション乗数を降格するステップを含む、ことを特徴とする請求項22に記載のマップサーチ方法。 - トークンシーケンスのためのロケーション統計スコアを決定する前記ステップが、
前記トークンシーケンスのためのタームロケーションスコアを、項目のロケーション統計スコアに基づいて、前記トークンシーケンスのタームに関して決定するステップと、
前記トークンシーケンスに対するタイプロケーションスコアを、項目のロケーション統計スコアに基づいて、前記トークンシーケンスのタイプに関して決定するステップと、
前記トークンシーケンスに対する前記ロケーション統計スコアを、前記トークンシーケンスの前記タームロケーションスコアと前記タイプロケーションスコアとを合計することにより決定するステップとを含み、
項目のロケーション統計スコアおよび項目のクエリ統計スコアは、それぞれ、
項目のロケーション統計スコア= log(l_count)*l_count/(l_count+q_count)、および項目のクエリ統計スコア=log(q_count)*q_count/(l_count+q_count)、で定義され、ここでl_countおよびq_countは、アドレスおよびタイトルの中での前記項目の発生回数が前記統計モデルの中に格納される場合、アドレスおよびタイトルの中での前記項目の発生回数をそれぞれ表し、
前記項目の前記ロケーション統計スコアおよび前記クエリ統計スコアは、前記項目が前記統計モデルの中に対応するエントリを有しない場合は、0と定義される、ことを特徴とする請求項17に記載のマップサーチ方法。 - 前記トークンシーケンスのための前記タームロケーションスコアを決定する前記ステップが、
前記トークンシーケンスの中の最初のトークンを、カレントトークンとして選ぶステップと、
前記カレントトークンの「タームユニグラム」の前記ロケーション統計スコア、および、前記カレントトークンの前記タームで始まる前記トークンシーケンスの項目「タームバイグラム」および「タイプ「None」を伴う隣接するタームのシーケンス」の前記ロケーション統計スコアを決定するステップと、
最も高いロケーション統計スコアを、前記カレントトークンのタームロケーションスコアとして選択するステップと、
前記カレントトークンの前記タームロケーションスコアを決定する際に考慮されなかったネクストトークンを、新規のカレントトークンとして扱って、1つまたは複数の新規カレントトークンを前記トークンシーケンスが終了するまで生成し、各新規カレントトークンのタームロケーションスコアを決定するステップと、
取得された全ての前記タームロケーションスコアを合計して、第1の値を生成するステップと、
前記トークンシーケンスの前記全てのタームのシーケンスのロケーション統計スコアを、第2の値として決定するステップと、
前記第1の値および第2の値のうち、大きい値を前記トークンシーケンスの前記タームロケーションスコアとして選択するステップとを含む、ことを特徴とする請求項26に記載のマップサーチ方法。 - 前記トークンシーケンスに対する前記タイプロケーションスコアを決定する前記ステップが、
前記トークンシーケンスの中の最初のトークンを、カレントトークンとして選ぶステップと、
前記カレントトークンのタイプユニグラムの前記ロケーション統計スコア、および、前記カレントトークンの前記タイプで始まる前記トークンシーケンスの前記タイプバイグラムのロケーション統計スコアを決定するステップと、
前記タイプユニグラムの前記決定されたロケーション統計スコアおよび前記タイプバイグラムの前記ロケーション統計スコアのうち、より高いロケーション統計スコアを、前記カレントトークンのタイプロケーションスコアとして選択するステップと、
前記カレントトークンの前記タイプロケーションスコアを決定する際に考慮されなかったネクストトークンを、新規のカレントトークンとして扱って、1つまたは複数の新規カレントトークンを前記トークンシーケンスが終了するまで生成し、各新規カレントトークンのタイプロケーションスコアを決定するステップと、
取得された全ての前記タイプロケーションスコアを合計して、第1の値を生成するステップと、
前記トークンシーケンスの全てのタイプの前記シーケンスのロケーション統計スコアを、第2の値として決定するステップと、
前記第1の値および第2の値のうち、大きい値を前記トークンシーケンスのタイプロケーションスコアとして選択するステップとを含む、ことを特徴とする請求項26に記載のマップサーチ方法。 - トークンシーケンスに対するクエリ統計スコア決定するステップが、
f1)前記トークンシーケンスに対するタームクエリスコアを、項目のクエリ統計スコアに基づいて、前記トークンシーケンスのタームに関して決定するステップと、
f2)前記トークンシーケンスに対するタイプクエリスコアを、項目のクエリ統計スコアに基づいて、前記トークンシーケンスのタイプに関して決定するステップと、
f3)前記トークンシーケンスに対する前記クエリ統計スコアを、前記トークンシーケンスの前記タームクエリスコアと前記タイプクエリスコアとを合計することにより決定するステップとを含む、ことを特徴とする請求項26に記載のマップサーチ方法。 - 前記ステップf1)が、
f11)前記トークンシーケンスの中の最初のトークンを、カレントトークンとして選ぶステップと、
f12)前記カレントトークンの「タームユニグラム」の前記ロケーション統計スコア、および、前記カレントトークンの前記タームで始まる前記トークンシーケンスの項目「タームバイグラム」および「タイプ「None」を伴う隣接するタームのシーケンス」の前記クエリ統計スコアを決定するステップと、
f13)最も高いクエリ統計スコアを、前記カレントトークンのタームクエリスコアとして選択するステップと、
f14)前記カレントトークンの前記タームクエリスコアを決定するときに考慮されなかったネクストトークンを、新規カレントトークンとして扱い、ステップf11)〜f14)を、前記新規カレントトークンのタームクエリスコアを決定するために、前記トークンシーケンスの終了まで繰り返すステップと、
f15)取得された全ての前記タームクエリスコアを合計するステップと、
f16)前記トークンシーケンスの前記項目「全てのタームのシーケンス」のクエリ統計スコアを決定するステップと、
f17)前記ステップf16)およびf17)で取得された前記結果の間でより大きい1つを、前記トークンシーケンスの前記タームクエリスコアとして決定するステップとを含む、ことを特徴とする請求項29に記載のマップサーチ方法。 - 前記ステップf2)が、
f21)前記トークンシーケンスの中の最初のトークンを、カレントトークンとして選ぶステップと、
f22)前記カレントトークンの「タイプユニグラム」の前記クエリ統計スコア、および前記カレントトークンの前記タイプで始まる前記トークンシーケンスの項目「タイプバイグラム」の前記クエリ統計スコアを決定するステップと、
f23)最も高いクエリ統計スコアを前記カレントトークンのタイプクエリスコアとして選択するステップと、
f24)前記カレントトークンの前記タイプクエリスコアを決定する際に考慮されなかったネクストトークンを、新規カレントトークンとして扱って、ステップf21)〜f24)を、前記新規カレントトークンの前記タイプクエリスコアを決定するために、前記トークンシーケンスの終了まで繰り返すステップと、
f25)取得された全ての前記タイプクエリスコアを合計するステップと、
f26)前記トークンシーケンスの前記項目「全てのタイプのシーケンス」のクエリ統計スコアを決定するステップと、
f27)前記ステップf26)およびf27)で取得された前記結果の間でより大きい1つを、前記トークンシーケンスの前記タイプクエリスコアとして決定するステップとを含む、ことを特徴とする請求項29に記載のマップサーチ方法。 - 前記入力エントリの前記トークンシーケンスへの前記パーシングするステップは、
前記トークンシーケンスの中で、誤ってアノテートされたタイプを修復するステップを含む、ことを特徴とする請求項3に記載のマップサーチ方法。 - 前記トークンシーケンスの中で、誤ってアノテートされたタイプを修復する前記ステップが、
前記タームが前記タイプ「Number」を伴うタームに続かない場合は、タームの前記タイプ「数量サフィックス」を、前記タイプ「None」へと変更するステップを含む、ことを特徴とする請求項32に記載のマップサーチ方法。 - コンピュータ実装されるマップサーチ方法であって、
マップサーチのためにユーザから受信された入力エントリを、1つまたは複数のトークンを含むトークンシーケンスへと分離するステップであって、各トークンが前記入力エントリのセグメントを表すタームと、前記タームにアノテートされ、前記タームの種類を表すタイプとを含む、ステップと、
前記トークンシーケンスの可能な分割位置を決定するステップであって、可能な分割位置が、前記トークンシーケンスを1つまたは2つのサブシーケンスへと分割する、ステップと、
前記可能な分割位置のそれぞれに対する可能な分割方法を決定するステップであって、各可能な分割方法が、前記トークンシーケンスを(1)位置情報を表す可能なロケーション部および(2)前記ロケーション部に関連する検索対象を表す可能なクエリ部の少なくとも1つへと分割する、ステップと、
前記可能な分割方法のそれぞれの正しさの確率に対する分割スコアを決定するステップと、
最も高い分割スコアを有する前記可能な分割方法を、結果として得られた分割方法として選択するステップとを含む、ことを特徴とするマップサーチ方法。 - 前記トークンシーケンスを2つのサブ-トークンシーケンスへと分割する可能な分割位置に対して、
前記2つのサブ-トークンシーケンスのそれぞれに対してロケーション統計スコアおよびクエリ統計スコアを決定し、前記可能な分割位置に対応する前記可能な分割方法を、より高いロケーション統計スコアを伴う前記サブ-トークンシーケンスを、前記可能なロケーション部として、また、他のサブ-トークンシーケンスを前記可能なクエリ部として見なすことにより決定するステップと、
前記トークンシーケンスを1つのサブ-トークンシーケンスに分割する、可能な分割位置に対して、
前記可能な分割位置に対応する前記可能な分割方法を、前記サブ-トークンシーケンスの前記ロケーション統計スコアが、前記サブ-トークンシーケンスの前記クエリ統計スコアより高い場合に、前記サブ-トークンシーケンスを前記ロケーション部と見なし、前記サブ-トークンシーケンスの前記クエリ統計スコアが、前記サブ-トークンシーケンスの前記ロケーション統計スコアより高い場合は、前記サブ-トークンシーケンスを前記クエリ部と見なすことにより決定するステップとを含む、ことを特徴とする請求項34に記載のマップサーチ方法。 - 前記可能な分割方法のそれぞれの正しさの統計的確率を示す前記分割スコアを決定する前記ステップは、
各可能な分割方法の正しさの確率を表す各可能な分割方法に対する分割スコアを、前記ロケーション部の前記ロケーション統計スコアおよび前記クエリ部の前記クエリ統計スコアのどちらかまたは両方に基づいて決定するステップを含む、ことを特徴とする請求項35に記載のマップサーチ方法。 - トークンシーケンスの前記ロケーション統計スコアおよび前記クエリ統計スコアの少なくとも1つが、統計モデルを参照するステップにより決定され、トークンシーケンスの前記ロケーション統計スコアが、前記トークンシーケンスがロケーションである確率を示し、および前記トークンシーケンスのクエリ統計スコアが、前記トークンシーケンスがクエリである確率を示す、ことを特徴とする請求項35に記載のマップサーチ方法。
- 前記統計モデルが、タイトルおよびアドレスを含む訓練データに基づいて生成される、ことを特徴とする請求項37に記載のマップサーチ方法。
- 生アドレスが、前記生アドレスの中のテイリングタイトルを除去するために前処理され、および生タイトルが、前記生タイトルの中の接頭されている行政区名を除去するために、訓練データとして使用される前に前処理される、ことを特徴とする請求項38に記載のマップサーチ方法。
- 前記統計モデルが、
タイトルおよびアドレスを含む前記訓練データのそれぞれを、1つまたは複数のトークンを含み、各トークンがタームと、前記タームにアノテートされ、前記タームの特性を示すタイプとを含むトークンシーケンスへとパーシングするステップと、
前記タイトルおよびアドレスの前記トークンシーケンスの中に含まれる各項目に対して、タイトルの中の発生回数と、アドレスの中の発生回数を、それぞれカウントおよび格納するステップとにより生成され、
各項目は、単一のタームを有するタームユニグラム、2つの隣接するタームのタームシーケンスを有するタームバイグラム、タイプ「None」を伴う隣接するタームのシーケンス、全てのタームのシーケンス、単一のタイプを意味するタイプユニグラム、2つの隣接するタイプシーケンスを意味するタイプバイグラム、および全てのタイプのシーケンス、の任意のものである、ことを特徴とする請求項38に記載のマップサーチ方法。 - コンピュータ実装されるマップサーチを提供するシステムであって、
マップサーチのためにユーザから受信された入力エントリをロケーション部およびクエリ部の少なくとも1つへとパーシングするパーシングモジュールと、
前記パーシングモジュールから出力を受信し、前記パーシングされた前記ロケーション部および前記クエリ部を受信した後、前記パーシングされたロケーション部および前記クエリ部に関連する情報を検索して、マップサーチ結果を前記ユーザに返す検索モジュールとを含む、ことを特徴とするシステム。 - 前記パーシングモジュールが、
前記入力エントリを1つまたは複数のトークンのトークンシーケンスへとパーシングし、各トークンが、前記入力エントリのセグメントを表すタームと、前記タームにアノテートされたタイプとを含む手段と、
各タームに対する前記タイプを、前記タームがアドレス関連情報と前記アドレス関連情報のタイプを包含するかどうかを示すために用いる手段とを含む、ことを特徴とする請求項41に記載のシステム。 - 前記入力エントリを前記トークンシーケンスへパーシングする前記手段が、
前記入力エントリの中のアドレス関連単語を、トークンのタームとして特定する手段と、
前記アドレス関連単語のタイプを、前記トークンの前記タイプとして特定する手段とを含む、ことを特徴とする請求項42に記載のシステム。 - 前記入力エントリのアドレス関連単語を特定する前記手段が、
アドレス関連単語の辞書の中のエントリと、前記エントリのタイプとを、トークンの前記アドレス関連単語と前記タイプとを特定するために用いる手段を含む、ことを特徴とする請求項43に記載のシステム。 - 前記辞書のアドレス関連単語が、行政区名、道路名、アドレス関連サフィックス、アドレス関連プリフィックス、および番号の、少なくとも1つを含む、ことを特徴とする請求項43に記載のシステム。
- 前記入力エントリの中の単語を、アドレスに関連していないトークンのタームとして特定する手段と、
「None」を、前記トークンの前記タイプとして割り当てて、前記トークンの前記タームがアドレス関連情報を包含しないことを示す手段とを含む、ことを特徴とする請求項43に記載のシステム。 - 前記パーシングモジュールがさらに、
前記トークンシーケンスの可能な分割位置を決定する手段であって、各可能な分割位置が前記トークンシーケンスを1つまたは2つのサブ-トークンシーケンスへと分割する、手段と、
前記可能な分割位置のそれぞれに対して可能な分割方法を決定する手段であって、各可能な分割方法が、前記トークンシーケンスを、(1)可能なクエリ部および(2)可能なロケーション部の少なくとも1つへと分割する、手段と、
前記可能な分割方法のそれぞれの正しさについての統計的確率を示す分割スコアを決定する手段と、
最も高い分割スコアを有する前記可能な分割方法を、結果として得られた分割方法として選択する手段とを含む、ことを特徴とする請求項43に記載のシステム。 - 通信を前記パーシングモジュールおよび前記検索モジュール、およびコンピュータに提供するコンピュータネットワークと、
前記コンピュータネットワークと通信しており、ユーザからのマップサーチのための前記入力エントリを受信し、前記検索モジュールから結果を受信するクライアントコンピュータとを含み、
前記コンピュータネットワークが、前記クライアントコンピュータからの前記入力エントリを前記パーシングモジュールへ、前記結果を前記検索モジュールから前記クライアントコンピュータへと向かわせる、ことを特徴とする請求項43に記載のシステム。 - マップサーチのためにユーザから受信された入力エントリを、少なくとも1つのトークンを含むトークンシーケンスへとトークン化し、各トークンが、前記入力エントリのセグメントを表すタームと、前記タームにアノテートされたタイプとを含む、トークンモジュールと、
前記トークンシーケンスの可能な分割位置を決定する手段であって、可能な分割位置が前記トークンシーケンスを1つまたは2つのサブシーケンスへと分割する、手段と、
前記可能な分割位置のそれぞれに対して可能な分割方法を決定する手段であって、各可能な分割方法が、前記トークンシーケンスを可能なクエリ部および可能なロケーション部の少なくとも1つへと分割する、手段と、
可能な分割方法のそれぞれに対して分割スコアを決定する手段と、
最も高い分割スコアを有する前記可能な分割方法を、結果として得られた分割方法として選択する手段と、
前記結果として得られた分割方法を受信してマップサーチを実施し、マップサーチ結果を前記ユーザに対して生成する検索モジュールとを含む、ことを特徴とするコンピュータ実装されるマップサーチを提供するシステム。 - 通信を前記トークンモジュール、全ての前記手段および前記検索モジュール、ならびにコンピュータに提供するコンピュータネットワークと、
前記コンピュータネットワークと通信しており前記入力エントリをマップサーチのために前記ユーザから受信するクライアントコンピュータとを含み、
前記コンピュータネットワークが、前記クライアントコンピュータからの前記入力エントリを前記トークンモジュールへ、前記結果を前記検索モジュールから前記クライアントコンピュータへと向かわせる、ことを特徴とする請求項49に記載のシステム。 - ユーザにより入力された入力エントリを受信するインターフェースと、
処理装置であって、前記入力エントリをパーシングして、前記入力エントリをロケーション部およびクエリ部の少なくとも1つへと分割し、
前記入力エントリに関連する情報を前記パーシングの結果に基づいて検索する、処理装置とを含み、
前記入力エントリが、ロケーション部とクエリ部とに分割された場合は、前記処理装置が、地理的領域を前記ロケーション部に基づいて決定し、クエリ部に関連し、かつ、前記地理的領域内に位置するエンティティに関する情報を検索する、ことを特徴とするコンピュータ実装されるマップサーチを提供するシステム。 - 通信を前記処理装置に提供するコンピュータネットワークと、
前記コンピュータネットワークと通信しており、前記入力エントリを前記ユーザからマップサーチのために受信するクライアントコンピュータとを含み、
前記コンピュータネットワークが、前記インターフェースを介して、前記入力エントリを前記クライアントコンピュータから前記処理装置へと、および前記結果を前記処理装置から前記クライアントコンピュータへと向かわせる、ことを特徴とする請求項51に記載のシステム。 - ユーザにより入力された入力エントリを受信するインターフェースと、
処理装置であって、
前記入力エントリを、少なくとも1つのトークンを含むトークンシーケンスへとトークン化し、各トークンがタームを含み、前記タームが前記入力エントリのセグメントおよび前記タームにアノテートされたタイプを表し、
前記トークンシーケンスの可能な分割位置を決定し、可能な分割位置が、前記トークンシーケンスを1つまたは2つのサブシーケンスに分割し、
前記可能な分割位置のそれぞれに対する可能な分割方法を決定し、各可能な分割方法が、前記トークンシーケンスを可能なクエリ部および/または可能なロケーション部へと分割し、
可能な分割方法のそれぞれに対する分割スコアを決定し、
最も高い分割スコアを有する前記可能な分割方法を、結果として得られた分割方法として選択する処理装置とを含む、ことを特徴とするコンピュータ実装されるマップサーチを提供するシステム。 - 命令を格納する機械読み取り可能な記録媒体であって、前記命令は、機械により実行されるとき前記機械に、
マップサーチのためのユーザからの入力エントリを、前記入力エントリに基づく前記マップサーチの実施に先立って、入力検索エントリの中の位置情報を表すロケーション部および前記入力エントリの中の前記ロケーション部に関連する検索対象を表すクエリ部へとパーシングするステップと、
マップサーチを実施させて、前記ロケーション部に基づいて地理的領域またはロケーションを取得し、また、前記クエリ部に関連し、かつ、前記取得された地理的領域またはロケーションの所に、中に、または近くに位置する1つまたは複数のエンティティに関する情報を検索するステップとを実行させる、ことを特徴とする機械読み取り可能な記録媒体。 - 複数の命令を記録する機械読み取り可能な記録媒体であって、前記命令は、機械により実行されるとき前記機械に、
ユーザから受信された入力エントリを、少なくとも1つのトークンを含むトークンシーケンスへとトークン化し、各トークンがタームを含み、前記タームが前記入力エントリのセグメントおよび前記タームにアノテートされたタイプを表す動作と、
前記トークンシーケンスの可能な分割位置を決定する動作であって、可能な分割位置が、前記トークンシーケンスを1つまたは2つのサブシーケンスに分割する、動作と、
前記可能な分割位置のそれぞれに対する可能な分割方法を決定する動作であって、各可能な分割方法が、前記トークンシーケンスを可能なクエリ部および/または可能なロケーション部へと分割する、動作と、
可能な分割方法のそれぞれに対する分割スコアを決定する動作と、
最も高い分割スコアを有する前記可能な分割方法を、結果として得られた分割方法として選択する動作とを実行させる、ことを特徴とする機械読み取り可能な記録媒体。 - マップサーチのためのユーザからの入力エントリを、前記入力エントリに基づく前記マップサーチの実施に先立って、入力検索エントリの中の位置情報を表すロケーション部および前記入力エントリの中の前記ロケーション部に関連する検索対象を表すクエリ部へとパーシングさせるステップであって、前記入力エントリの前記パーシングが、前記入力エントリにより示されるロケーションに対応するジオコードをあらかじめ検索するステップなしに実行されるステップと、
マップサーチを実施させて、前記ロケーション部に基づいて地理的領域またはロケーションを取得し、また、前記クエリ部に関連し、かつ、前記取得された地理的領域またはロケーションの所に、中に、または近くに位置する1つまたは複数のエンティティに関する情報を検索させるステップとを含む、ことを特徴とするコンピュータ実装されるマップサーチ方法。 - マップサーチのためのユーザからの入力エントリをパーシングさせる前記ステップが、
前記入力エントリを、1つまたは複数のトークンのトークンシーケンスへとパーシングし、各トークンがタームを含み、前記タームが前記入力エントリのセグメントおよび前記タームにアノテートされたタイプを表すステップと、
各タームに対する前記タイプに、前記タームがアドレス関連情報および前記アドレス関連情報のタイプを包含するかどうかを示させるステップとを含む、ことを特徴とする請求項56に記載のマップサーチ方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2009/072667 WO2011003232A1 (en) | 2009-07-07 | 2009-07-07 | Query parsing for map search |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012532388A true JP2012532388A (ja) | 2012-12-13 |
JP5462361B2 JP5462361B2 (ja) | 2014-04-02 |
Family
ID=43428731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012518721A Active JP5462361B2 (ja) | 2009-07-07 | 2009-07-07 | マップサーチのためのクエリパーシング |
Country Status (5)
Country | Link |
---|---|
US (1) | US8745065B2 (ja) |
JP (1) | JP5462361B2 (ja) |
KR (1) | KR101516858B1 (ja) |
CN (1) | CN102483748B (ja) |
WO (1) | WO2011003232A1 (ja) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8150848B2 (en) * | 2008-01-04 | 2012-04-03 | Google Inc. | Geocoding multi-feature addresses |
US8255379B2 (en) * | 2009-11-10 | 2012-08-28 | Microsoft Corporation | Custom local search |
US8595812B2 (en) | 2009-12-18 | 2013-11-26 | Sabre Inc. | Tokenized data security |
US8473431B1 (en) | 2010-05-14 | 2013-06-25 | Google Inc. | Predictive analytic modeling platform |
CA2712028C (en) * | 2010-08-25 | 2011-12-20 | Ibm Canada Limited - Ibm Canada Limitee | Geospatial database integration using business models |
US8533224B2 (en) * | 2011-05-04 | 2013-09-10 | Google Inc. | Assessing accuracy of trained predictive models |
US20120317104A1 (en) * | 2011-06-13 | 2012-12-13 | Microsoft Corporation | Using Aggregate Location Metadata to Provide a Personalized Service |
CN102426596B (zh) * | 2011-11-03 | 2014-07-30 | 北京地拓科技发展有限公司 | 地图加载方法和装置 |
US9009183B2 (en) * | 2011-11-03 | 2015-04-14 | Microsoft Technology Licensing, Llc | Transformation of a system change set from machine-consumable form to a form that is readily consumable by a human |
CN102571910B (zh) | 2011-11-16 | 2014-08-13 | 腾讯科技(深圳)有限公司 | 在社交网络中查找附近用户的方法和服务器 |
US9275147B2 (en) * | 2012-06-18 | 2016-03-01 | Google Inc. | Providing query suggestions |
US9268822B2 (en) * | 2012-07-18 | 2016-02-23 | Salesforce.Com, Inc. | System and method for determining organizational hierarchy from business card data |
EP2883152A4 (en) * | 2012-08-10 | 2016-03-16 | Nokia Technologies Oy | METHOD AND DEVICE FOR PROVIDING A CROWD SOURCE-FINANCED GEOCODING |
US9767121B2 (en) * | 2013-02-12 | 2017-09-19 | C/O Vmobo, Inc. | Location-based mobile search |
CN105532030B (zh) | 2013-03-15 | 2019-06-28 | 美国结构数据有限公司 | 用于分析目标实体的移动的装置、系统和方法 |
CN105209858B (zh) * | 2013-03-15 | 2018-11-16 | 邓白氏公司 | 企业场所数据的非确定性消岐和匹配 |
US9047325B2 (en) * | 2013-04-08 | 2015-06-02 | International Business Machines Corporation | Modularizing complex XML data for generation and extraction |
EP2989563B1 (en) * | 2013-04-23 | 2018-09-19 | Imosphere Ltd | Database management system |
US10204139B2 (en) * | 2013-05-06 | 2019-02-12 | Verizon Patent And Licensing Inc. | Systems and methods for processing geographic data |
CN103631839B (zh) * | 2013-06-27 | 2017-08-29 | 西南科技大学 | 一种页面地域权重模型实现方法 |
US9619499B2 (en) | 2013-08-07 | 2017-04-11 | International Business Machines Corporation | Hardware implementation of a tournament tree sort algorithm |
US9495418B2 (en) | 2013-08-07 | 2016-11-15 | International Business Machines Corporation | Scalable acceleration of database query operations |
US9830354B2 (en) * | 2013-08-07 | 2017-11-28 | International Business Machines Corporation | Accelerating multiple query processing operations |
US9251218B2 (en) | 2013-08-07 | 2016-02-02 | International Business Machines Corporation | Tunable hardware sort engine for performing composite sorting algorithms |
US9727595B2 (en) * | 2013-09-20 | 2017-08-08 | Uber Technologies, Inc. | Location searching with category indices |
GB2522432A (en) * | 2014-01-23 | 2015-07-29 | Locpin Ltd | Computer system and method |
US9465811B2 (en) * | 2014-03-20 | 2016-10-11 | Facebook, Inc. | Polygon-based indexing of places |
US9582515B1 (en) * | 2014-04-11 | 2017-02-28 | Google Inc. | Detecting queries for specific places |
US9519802B2 (en) | 2014-05-07 | 2016-12-13 | American Express Travel Related Services Company, Inc. | Systems and methods for document and data protection |
WO2015191010A1 (en) * | 2014-06-12 | 2015-12-17 | Sun Vasan | Searching for a map using an input image as a search query |
US10127275B2 (en) | 2014-07-11 | 2018-11-13 | International Business Machines Corporation | Mapping query operations in database systems to hardware based query accelerators |
US9953171B2 (en) * | 2014-09-22 | 2018-04-24 | Infosys Limited | System and method for tokenization of data for privacy |
US10310813B2 (en) | 2014-12-29 | 2019-06-04 | International Business Machines Corporation | Hardware implementation of a tournament tree sort algorithm using an external memory |
US20160196349A1 (en) * | 2015-01-07 | 2016-07-07 | Microsoft Technology Licensing, Llc | Geocoding multi-entity queries |
US9881166B2 (en) * | 2015-04-16 | 2018-01-30 | International Business Machines Corporation | Multi-focused fine-grained security framework |
US10002128B2 (en) * | 2015-09-09 | 2018-06-19 | Samsung Electronics Co., Ltd. | System for tokenizing text in languages without inter-word separation |
US10268756B2 (en) | 2015-12-18 | 2019-04-23 | Here Global B.V. | Method and apparatus for providing natural language input in a cartographic system |
US10282466B2 (en) * | 2015-12-31 | 2019-05-07 | Samsung Electronics Co., Ltd. | Machine processing of search query based on grammar rules |
US10671932B1 (en) * | 2017-01-27 | 2020-06-02 | Intuit Inc. | Software application selection models integration |
US11640436B2 (en) * | 2017-05-15 | 2023-05-02 | Ebay Inc. | Methods and systems for query segmentation |
CN107491489A (zh) * | 2017-07-18 | 2017-12-19 | 深圳天珑无线科技有限公司 | 一种地图搜索方法、装置及计算机可读存储介质 |
CN110019617B (zh) * | 2017-12-05 | 2022-05-20 | 腾讯科技(深圳)有限公司 | 地址标识的确定方法和装置、存储介质、电子装置 |
US10606851B1 (en) * | 2018-09-10 | 2020-03-31 | Palantir Technologies Inc. | Intelligent compute request scoring and routing |
US10783175B2 (en) * | 2018-09-28 | 2020-09-22 | Microsoft Technology Licensing, Llc | Expanding search queries using query term weighting |
US11010376B2 (en) | 2018-10-20 | 2021-05-18 | Verizon Patent And Licensing Inc. | Methods and systems for determining search parameters from a search query |
CN109657034A (zh) * | 2018-11-05 | 2019-04-19 | 阿里巴巴集团控股有限公司 | 地址相似度计算方法及其系统 |
US10409641B1 (en) | 2018-11-26 | 2019-09-10 | Palantir Technologies Inc. | Module assignment management |
US11120007B2 (en) | 2018-11-26 | 2021-09-14 | Palantir Technologies Inc. | Module expiration management |
US11293776B2 (en) * | 2018-11-27 | 2022-04-05 | Verizon Patent And Licensing Inc. | Smart geocoding of road intersections |
US20200183936A1 (en) * | 2018-12-10 | 2020-06-11 | Teradata Us, Inc. | Predictive query parsing time and optimization |
CN109783589B (zh) * | 2018-12-13 | 2023-07-25 | 中国平安人寿保险股份有限公司 | 电子地图解析地址的方法、装置及存储介质 |
US11631047B2 (en) * | 2019-04-12 | 2023-04-18 | Flipkart Internet Pvt. Ltd. | System and method of geocoding |
CN111159239B (zh) * | 2019-12-31 | 2024-03-05 | 北京四维图新科技股份有限公司 | 搜索方法和设备 |
CN113094600A (zh) * | 2020-01-08 | 2021-07-09 | 百度在线网络技术(北京)有限公司 | 电子地图的搜索方法、装置、设备和介质 |
CN113849531B (zh) * | 2021-09-23 | 2024-03-22 | 北京百度网讯科技有限公司 | 查询方法及装置 |
CN117786242B (zh) * | 2024-02-26 | 2024-05-28 | 腾讯科技(深圳)有限公司 | 一种基于位置的搜索方法及相关装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63226727A (ja) * | 1987-03-16 | 1988-09-21 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置 |
JPH07160701A (ja) * | 1993-12-13 | 1995-06-23 | Sharp Corp | 住所情報検索装置 |
JP2001249922A (ja) * | 1999-12-28 | 2001-09-14 | Matsushita Electric Ind Co Ltd | 単語分割方式及び装置 |
JP2006162516A (ja) * | 2004-12-09 | 2006-06-22 | Fujitsu Ten Ltd | 情報端末装置 |
JP2008152560A (ja) * | 2006-12-18 | 2008-07-03 | Mitsubishi Electric Corp | 施設検索装置 |
JP2009501976A (ja) * | 2005-07-13 | 2009-01-22 | グーグル・インコーポレーテッド | 位置識別方法 |
JP2009037316A (ja) * | 2007-07-31 | 2009-02-19 | Yahoo Japan Corp | 地図上の領域を求める方法 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002003234A2 (en) | 2000-06-30 | 2002-01-10 | Troy Schultz | Method and apparatus for a gis based search engine utilizing real time advertising |
US20070027672A1 (en) * | 2000-07-31 | 2007-02-01 | Michel Decary | Computer method and apparatus for extracting data from web pages |
US7207012B1 (en) * | 2003-01-30 | 2007-04-17 | Sprint Communications Company L.P. | System and method for mapping deployment status of high bandwidth metropolitan area networks |
AU2004220880B2 (en) | 2003-03-18 | 2010-09-23 | Nokia Corporation | Corpus clustering, confidence refinement, and ranking for geographic text search and information retrieval |
US7257570B2 (en) * | 2003-11-13 | 2007-08-14 | Yahoo! Inc. | Geographical location extraction |
JP4246055B2 (ja) * | 2003-12-19 | 2009-04-02 | アルパイン株式会社 | 車載用ナビゲーション装置及び周辺施設検索表示方法 |
US20070168370A1 (en) * | 2004-11-16 | 2007-07-19 | Hardy Mark D | System and methods for provisioning geospatial data |
US7483881B2 (en) * | 2004-12-30 | 2009-01-27 | Google Inc. | Determining unambiguous geographic references |
US7506254B2 (en) * | 2005-04-21 | 2009-03-17 | Google Inc. | Predictive conversion of user input |
US20080086356A1 (en) * | 2005-12-09 | 2008-04-10 | Steve Glassman | Determining advertisements using user interest information and map-based location information |
WO2008005102A2 (en) * | 2006-05-13 | 2008-01-10 | Sap Ag | Consistent set of interfaces derived from a business object model |
CN101136028B (zh) * | 2006-07-10 | 2012-07-04 | 日电(中国)有限公司 | 基于自然语言的位置查询系统以及基于关键词的位置查询系统 |
US8359309B1 (en) * | 2007-05-23 | 2013-01-22 | Google Inc. | Modifying search result ranking based on corpus search statistics |
US8015196B2 (en) * | 2007-06-18 | 2011-09-06 | Geographic Services, Inc. | Geographic feature name search system |
CN101350013A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地理信息的搜索方法和系统 |
US7983913B2 (en) * | 2007-07-31 | 2011-07-19 | Microsoft Corporation | Understanding spoken location information based on intersections |
JP2009104450A (ja) | 2007-10-24 | 2009-05-14 | Nagoya Institute Of Technology | Webチャットの観測に基づく商品推薦システム |
US8364470B2 (en) * | 2008-01-15 | 2013-01-29 | International Business Machines Corporation | Text analysis method for finding acronyms |
US20090210388A1 (en) * | 2008-02-20 | 2009-08-20 | Microsoft Corporation | Efficiently discovering and synthesizing maps from a large corpus of maps |
GB2460045A (en) | 2008-05-13 | 2009-11-18 | Triad Group Plc | Analysing multiple data sources for a user request using business and geographical data, with selected rule sets to filter the data on the databases. |
US8364462B2 (en) * | 2008-06-25 | 2013-01-29 | Microsoft Corporation | Cross lingual location search |
US8521731B2 (en) * | 2008-07-09 | 2013-08-27 | Yahoo! Inc. | Systems and methods for query expansion in sponsored search |
US8666652B2 (en) * | 2008-09-30 | 2014-03-04 | Sas Institute Inc. | System and method for running stored statistical processes using a web-based graphical information system |
US8015172B1 (en) * | 2009-07-03 | 2011-09-06 | eBridge, Inc. | Method of conducting searches on the internet to obtain selected information on local entities and provide for searching the data in a way that lists local businesses at the top of the results |
KR101289082B1 (ko) | 2009-09-02 | 2013-07-22 | 한국전자통신연구원 | 지역 정보 서비스 제공 시스템 및 그 방법 |
US8255379B2 (en) | 2009-11-10 | 2012-08-28 | Microsoft Corporation | Custom local search |
-
2009
- 2009-07-07 JP JP2012518721A patent/JP5462361B2/ja active Active
- 2009-07-07 KR KR1020127000638A patent/KR101516858B1/ko active IP Right Grant
- 2009-07-07 CN CN200980161026.1A patent/CN102483748B/zh active Active
- 2009-07-07 US US13/383,181 patent/US8745065B2/en not_active Expired - Fee Related
- 2009-07-07 WO PCT/CN2009/072667 patent/WO2011003232A1/en active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63226727A (ja) * | 1987-03-16 | 1988-09-21 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置 |
JPH07160701A (ja) * | 1993-12-13 | 1995-06-23 | Sharp Corp | 住所情報検索装置 |
JP2001249922A (ja) * | 1999-12-28 | 2001-09-14 | Matsushita Electric Ind Co Ltd | 単語分割方式及び装置 |
JP2006162516A (ja) * | 2004-12-09 | 2006-06-22 | Fujitsu Ten Ltd | 情報端末装置 |
JP2009501976A (ja) * | 2005-07-13 | 2009-01-22 | グーグル・インコーポレーテッド | 位置識別方法 |
JP2008152560A (ja) * | 2006-12-18 | 2008-07-03 | Mitsubishi Electric Corp | 施設検索装置 |
JP2009037316A (ja) * | 2007-07-31 | 2009-02-19 | Yahoo Japan Corp | 地図上の領域を求める方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102483748A (zh) | 2012-05-30 |
CN102483748B (zh) | 2016-04-20 |
US20120278339A1 (en) | 2012-11-01 |
WO2011003232A1 (en) | 2011-01-13 |
KR20120123241A (ko) | 2012-11-08 |
KR101516858B1 (ko) | 2015-05-04 |
JP5462361B2 (ja) | 2014-04-02 |
US8745065B2 (en) | 2014-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5462361B2 (ja) | マップサーチのためのクエリパーシング | |
US11514035B1 (en) | Query refinements using search data | |
US10657460B2 (en) | Systems and methods to facilitate local searches via location disambiguation | |
US7890493B2 (en) | Translating a search query into multiple languages | |
US9201931B2 (en) | Method for obtaining search suggestions from fuzzy score matching and population frequencies | |
EP2798540B1 (en) | Extracting search-focused key n-grams and/or phrases for relevance rankings in searches | |
US20170357714A1 (en) | Query Understanding Pipeline | |
US9928296B2 (en) | Search lexicon expansion | |
KR101945749B1 (ko) | 데이터베이스 검색방법, 네비게이션 장치 및 인덱스 구조 생성 방법 | |
US20060212433A1 (en) | Prioritization of search responses system and method | |
CN107203526B (zh) | 一种查询串语义需求分析方法及装置 | |
US20100191758A1 (en) | System and method for improved search relevance using proximity boosting | |
US11640506B2 (en) | Entity disambiguation | |
Luberg et al. | Information retrieval and deduplication for tourism recommender sightsplanner | |
CN116738065B (zh) | 一种企业搜索方法、装置、设备及存储介质 | |
CN107818092B (zh) | 文档处理方法及装置 | |
CN116069897A (zh) | 查询纠错方法、装置、计算机设备、存储介质及程序产品 | |
KR20120009817A (ko) | 검색 서비스 제공 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130910 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5462361 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |