JP7206514B2 - 地理位置点のソート方法、ソートモデルの訓練方法及び対応装置 - Google Patents

地理位置点のソート方法、ソートモデルの訓練方法及び対応装置 Download PDF

Info

Publication number
JP7206514B2
JP7206514B2 JP2021081414A JP2021081414A JP7206514B2 JP 7206514 B2 JP7206514 B2 JP 7206514B2 JP 2021081414 A JP2021081414 A JP 2021081414A JP 2021081414 A JP2021081414 A JP 2021081414A JP 7206514 B2 JP7206514 B2 JP 7206514B2
Authority
JP
Japan
Prior art keywords
data
user
geolocation
sorting
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021081414A
Other languages
English (en)
Other versions
JP2021179990A (ja
Inventor
ファン、ミアオ
フアン、ジジョウ
ホウ、ユファン
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Publication of JP2021179990A publication Critical patent/JP2021179990A/ja
Application granted granted Critical
Publication of JP7206514B2 publication Critical patent/JP7206514B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本出願は、コンピュータ応用技術分野に関し、特にビッグデータ技術に関する。
ユーザは地図型アプリケーションを使用する過程で、いくつかのホテルを探したいが、明確な目標がない場合に、検索ボックスに例えば「ホテル」、「旅館」、「宿屋」などのPOI(Point Of Interest、関心ポイント)タイプに関するキーワードを入力して検索したり、「周辺の発見」という画面で「ホテル」ボタンをクリックして近くのすべてのホテルのタイプのPOIを検索したりするというニーズがよくある。地図型アプリケーションは、候補となるホテル型POIをソートし、ソート結果に基づいてユーザにホテル型POIを推薦する。
しかし、従来技術において、候補のホテル型POIをソートする際に、地理位置、ホテル評価、星評価、価格、人気状況などのホテルの特徴に基づくことが多いが、すべてのユーザにとって、同じ地理位置に基づいて得られたソート結果は同一であり、ユーザのカスタマイズニーズを満たすことができない。
これに鑑み、本出願は、ユーザのカスタマイズ検索ニーズを満たす技術案を提供する。
第1の態様では、本出願は、ユーザからの垂直型の地理位置点検索要求を受信し、前記垂直型の候補地理位置点データを前記ユーザの好みモデルに入力して、各候補地理位置点に対する前記ユーザの好みスコアを得、各候補地理位置点に対する前記ユーザの好みスコアを各候補地理位置点のソート特徴の1つとしてソートモデルに入力して、各候補地理位置点のソートスコアを得、前記各候補位置点のソートスコアに基づいて前記ユーザに返信する検索結果を確定する、ことを含む地理位置点のソート方法を提供する。
第2の態様では、本出願は、地図型アプリケーションデータから第1訓練データを取得し、前記第1訓練データは、ユーザが過去にアクセスした垂直型の地理位置点データを含み、前記アクセスは、検索、クリックまたは実地の訪問を含み、前記第1訓練データを用いて前記ユーザの好みモデルを訓練し、前記ユーザの好みモデルを使用して、第2訓練データにおける前記垂直型の各地理位置点に対する前記ユーザの好みスコアを取得し、前記第2訓練データを用いてソートモデルを訓練し、第2訓練データにおける各地理位置点に対する前記ユーザの好みスコアを前記ソートモデルを訓練するためのソート特徴の1つとすることを含むソートモデルの訓練方法を提供する。
第3の態様では、本出願は、ユーザからの垂直型の地理位置点検索要求を受信する要求受信ユニットと、前記垂直型の候補地理位置点データを前記ユーザの好みモデルに入力して、各候補地理位置点データに対する前記ユーザの好みスコアを得る好み確定ユニットと、各候補地理位置点に対する前記ユーザの好みスコアを各候補地理位置点のソート特徴の1つとしてソートモデルに入力して、各候補地理位置点のソートスコアを得るソート処理ユニットと、前記各候補位置点のソートスコアに基づいて、前記ユーザに返信される検索結果を確定する結果確定ユニットと、を備える地理位置点のソート装置を提供する。
第4の態様では、本出願は、地図型アプリケーションデータからユーザが過去にアクセスした垂直型の地理位置点データを含む第1訓練データを取得し、前記アクセスは、検索、クリックまたは実地の訪問を含む第1データ取得ユニットと、前記第1訓練データを用いて前記ユーザの好みモデルを訓練する第1モデル訓練ユニットと、前記ユーザの好みモデルを利用して、第2訓練データにおける前記垂直型の各地理位置点に対する前記ユーザの好みスコアを取得する好みスコア確定ユニットと、前記第2訓練データを用いてソートモデルを訓練し、第2訓練データにおける各地理位置点に対する前記ユーザの好みスコアを前記ソートモデルを訓練するためのソート特徴の1つとする第2モデル訓練ユニットとを備えるソートモデルの訓練装置を提供する。
第5の態様では、本出願は更に、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信接続されたメモリとを備え、前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに上記のいずれか1項に記載の方法を実行させる電子デバイスを提供する。
第6の態様では、本出願は、コンピュータに上記のいずれか1項に記載の方法を実行させるためのコンピュータコマンドが記憶された非一時的なコンピュータ可読記憶媒体を更に提供する。
以上の技術案からわかるように、本出願は、ユーザが垂直型の地理位置点を検索する際に、ユーザの好みの要素をソートに統合することで、検索結果がユーザのパーソナライズニーズを満たすことができ、ユーザが検索結果の中で自分の好みに合った地理位置点を迅速に見つけることができ、検索結果の中で探したりクリックしたりする回数を減らし、ユーザの時間を節約し、地図型のアプリケーションを使用するユーザの検索体験を向上させることができる。
上記の選択可能な方法が有する他の効果は、以下で具体的な実施形態と合わせて説明する。
図面は、本出願をより良く理解するためのものであり、本出願を限定しない。ここで、
本発明の実施形態が適用され得る例示的なシステムアーキテクチャを示す図である。 本出願の実施形態一により提供される地理位置点のソート方法のフローチャートである。 本出願の実施形態二により提供されるソートモデルを訓練する方法のフローチャートである。 本出願の実施形態三により提供される地理位置点のソート装置の構成図である。 本出願の実施形態四により提供されるソートモデルを訓練する装置の構成図である。 本発明の実施形態を実現するための電子デバイスのブロック図である。
以下、図面に基づいて、本出願の例示的な実施例を説明する。理解を容易にするために、本出願の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本出願の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。
図1は、本発明の実施形態が適用され得る例示的なシステムアーキテクチャを示す図である。図1に示すように、当該システムアーキテクチャは、端末装置101、102、ネットワーク103、およびサーバ104を含むことができる。ネットワーク103は、端末装置101、102とサーバ104との間に通信リンクの媒体を提供する。ネットワーク103は、有線、無線通信リンク、または光ファイバケーブルなどの様々な接続タイプを含むことができる。
ユーザは、端末装置101、102を用いて、ネットワーク103を介してサーバ104とインタラクションすることができる。端末装置101、102には、地図型アプリケーション、音声インタラクション型アプリケーション、ウェブページブラウザアプリケーション、通信型アプリケーションなど、様々なアプリケーションをインストールすることができる。
端末装置101および102は、地図型のアプリケーションをサポートおよび表示することが可能な各種の電子デバイスであれば良く、スマートフォン、タブレット、ウェアラブルデバイスなどを含むが、これらに限定されない。本発明により提供されるデバイスは、上述したサーバ104内に設定され、動作することができる。これは、複数のソフトウェアまたはソフトウェアモジュール(例えば、分散サービスを提供するために)として実現されてもよく、単一のソフトウェアまたはソフトウェアモジュールとして実現されてもよく、ここでは特に限定されない。
例えば、地理位置点のソート装置は、端末装置101または102からの垂直型の地理位置点の検索要求を受信可能な上述のサーバ104内に配置され、動作する。当該検索要求は、ユーザ関連情報と垂直型情報を含む。地理位置点のソート装置は、本発明の実施形態が提供する方法を用いて地理位置点のソートを行い、ソート結果に基づいてユーザに返信する検索結果を確定する。そして、検索結果を端末装置101または102に返信することができる。サーバ104側には地図型のアプリケーションデータが保持されており、この地図型のアプリケーションデータは、サーバ104にローカルに記憶されてもよく、他のサーバに記憶されサーバ104により呼び出されてもよい。
さらに、例えば、ソートモデルを訓練する装置は、地図型のアプリケーションデータを用いてソートモデルを訓練する上述のサーバ104に配置され動作する。
サーバ104は、単一のサーバであってもよく、複数のサーバからなるサーバ群であってもよい。理解すべきなのは、図1における端末装置、ネットワーク、およびサーバの数は、単なる例示的なものである。実現の必要に応じて、任意の数の端末装置、ネットワーク、およびサーバを有することができる。
従来技術において、ホテル型POIに対するソートの特徴は十分ではなく、ユーザのパーソナライズ要素を体現していない。採用された特徴はホテルPOI自体の特性のみに依存しており、ユーザとは無関係であるため、異なるユーザが同じ場所で開始したホテルPOIの検索結果は全く同じであり、ユーザの好みの違いを体現することができない。例えば、あるユーザは収入が高く、消費レベルも高いため、地図型のアプリケーションを使用してホテル型POIの検索を行う場合に、価格が高く、条件が良い近くのホテルに泊まることに希望する。従来技術を使用して検索結果を返す際には、これらの好み情報を考慮せず、他の一般ユーザと同じように扱う。このようにすると、検索結果の上位にランクされたホテルはコストパフォーマンスと人気が高いかもしれないが、高消費、高品質、近くに泊まるという当該ユーザの好みとは一致せず、ユーザ体験が劣る。
本出願の核心的な考え方は、垂直型の地理位置点に対するユーザの好みをソート特徴の1つとして、ソート結果がユーザのパーソナライズニーズを体現するようにソードモデルのソートに組み込むことにある。以下で実施形態と合わせて本出願により提供される方法および装置を詳細に説明する。
本願に係る「地理位置点」とは、地図型アプリケーションデータにおける地理位置点を指す。この地理位置点は、ユーザが検索、閲覧、ユーザへの推薦等を行うことができる。これらの地理位置点には、緯度経度、名称、管理住所、タイプなどの基本的な属性がある。ここで、地理位置点は、POI(Point Of Interest、関心地点)、AOI(Area of Interest、関心エリア)、ROI(Region of Interest、関心地域)等を含んで良いが、これらに限定されない。後続の実施形態においてPOIを例にして説明する。
さらに、本出願に係わる「垂直型」とは、ある特定の分野、特定の需要、または特定の業種のタイプを意味する。本出願で提供される方法は、様々な垂直型に適用可能であり、特に消費型の地理位置点への適用がより適切である。例えば、ホテル型、飲食型、劇場型、スーパーマーケット型などがある。以降の実施形態では、ホテル型を例に説明する。
実施形態一、
図2は、本出願の実施形態一により提供される地理位置点のソート方法のフローチャートである。本実施形態において、ホテル型POIのソートを例にする。図2に示されたように、当該方法は以下のステップを含むことができる。
201では、ユーザからのホテル型POIの検索要求を受信する。
ユーザは、地図型のアプリケーションの検索ボックス内に、「ホテル」、「旅館」、「宿屋」など、垂直型情報を示すキーワードを入力することにより、ホテル型POIの検索要求をトリガすることができる。ユーザは、「周辺検出」機能画面で「ホテル」タブやボタンなどをクリックすることで、ホテル型POIの検索要求をトリガすることもできる。もちろん、この2つの場合に加えて、他の方法でホテル型POIの検索要求をトリガすることも可能であり、本出願でこれを制限しない。
説明すべきなのは、当該検索要求は、ある具体的なPOIに対して検索を行うためではなく、ある具体的な垂直型のPOI情報を検索するためのものであり、より一般化された検索要求と見なすことができる。
202では、ホテル型候補POIにおける少なくとも一部のタイプの特徴データを前処理してその少なくとも一部のタイプの特徴データの地域差を除去する。
まずホテル型候補POIを決定し、地図データベースにおける全てのホテル型POIを候補POIとすることができる。しかし、好ましくは、計算量を削減するために、地図データベースにおけるホテル型POIに対して以下の少なくとも1つのフィルタ処理を行った後、残りのホテル型POIを候補地理位置として良い。
ユーザが位置する現在地に基づいて、現在地から予め設定された距離閾値を超える地理位置点をフィルタリングする。つまり、ユーザから明らかに遠すぎる地理位置点をフィルタリングする。
ユーザの検索履歴に基づいて、ユーザの検索履歴との関連度が予め設定された関連度閾値よりも低いホテル型POIをフィルタリングする。たとえば、ユーザが検索したことのないホテル型POIを直接フィルタリングしたりすることができる。
いくつかの垂直型について、異なる地点のPOIはいくつかの特徴において明らかな地域差を示した。これに対して、ホテル型POIは比較的に明らかである。例えば北京のホテルの価格は全国の大部分の都市に比べて比較的に高いため、特にユーザのアクセス行為が複数の地域で発生する場合に、ユーザの過去のアクセスデータからユーザの好みを抽出することに一定の困難をもたらす。例えば、ユーザ1は北京市の五道口で価格300元のホテル型POIをクリックし、ユーザ2は経済水準の低い小都市で同様に価格300元のホテル型POIをクリックすると、明らかにユーザ2が好むホテルの価格が高い。これは、都市によって価格水準が異なるためである。価格以外の特徴、例えばコメント数、人気なども同様の地域差がある。この差異を解消するために、本ステップでは、ホテル型候補POIのうち地域に敏感なタイプの特徴データを前処理する。たとえば上述ように、ホテル型POIについて、価格特徴データ、コメント特徴データ、人気特徴データなどを前処理する。
本願の実施形態では、ホテル型の候補POIのデータは、一般にホテル型POIの属性に関連する候補POIの各種の特性データを含むことができる。たとえば、価格、コメント、位置、星評価、人気などである。
具体的には、前処理を行う際に、ホテル型の候補POIデータのうちの少なくとも一部のタイプの特徴データを正規性を高めるようにBox-cox変換した後に、正規化処理を行って良い。
Box-cox変換はBoxとcoxが提案した広義のべき乗変換方法であり、主要な特徴がパラメータを導入し、データ自体によりこのパラメータを推定し、採用するデータ変換形式を確定することである。Box-cox変換は、データの正規性、対称性と分散等性を明らかに改善することができる。
地域
Figure 0007206514000001
のPOIが特徴
Figure 0007206514000002
における値の分布を
Figure 0007206514000003
として表すとすると、
Figure 0007206514000004
の各値
Figure 0007206514000005

Figure 0007206514000006
に対して、
Figure 0007206514000007
をパラメータとするBox-cox変換を行い、変換後の
Figure 0007206514000008

Figure 0007206514000009
として表す。
Figure 0007206514000010
次に正規化を行って
Figure 0007206514000011
として表す。
Figure 0007206514000012
ここで、
Figure 0007206514000013

Figure 0007206514000014
はそれぞれ変換後の値集合
Figure 0007206514000015
の平均値と標準偏差を表す。
Figure 0007206514000016
は、地域
Figure 0007206514000017
のホテル型POIの当該特徴
Figure 0007206514000018
におけるすべての値
Figure 0007206514000019
により予め統計され、例えば最尤推定法により、
Figure 0007206514000020
が変換後の分布が正規分布に従うように
Figure 0007206514000021
を計算し、さらに
Figure 0007206514000022

Figure 0007206514000023
も予め計算された。これらのパラメータを保存し、変換を行う際に直接に使用すれば良い。
正規化された
Figure 0007206514000024
は、標準正規分布
Figure 0007206514000025
に近似に従う。このように、異なる地域の特徴
Figure 0007206514000026
の値は、上記の変換後に強い地域差を持たなくなった。
203では、各候補POIデータを当該ユーザの好みモデルに入力して、各候補POIに対する当該ユーザの好みスコアを求める。
本発明の実施形態では、ユーザごとに予め好みモデルをそれぞれ訓練した。ユーザの好みモデルは、POIが入力された場合に、そのPOIに対するユーザの好みスコアを出力することができる。検索要求を開始したユーザをkとして標識する場合に、当該ユーザkに対する好みモデルを用いて、各候補POIに対するユーザkの好みスコアが得られる。
好ましい実施形態として、ユーザの好みモデルは、異常点検出モデルを採用し、異常点検出モデルによる候補POIの異常点スコアに基づいて、候補POIに対するユーザの好みスコアを得る。ここで、異常点スコアは好みスコアと負の相関がある。
ユーザの好みモデルの訓練プロセスは、実施形態二において詳細に説明される。
204では、各候補POIに対する当該ユーザの好みスコアを各候補POIのソート特徴の1つとしてソートモデルに入力して、各候補POIのソートスコアを得る。
本ステップでは、候補POIに対するユーザの好みスコアをそのPOIの1つの付加的な特徴として、ソートモデルが採用する当該候補POIの他の特徴とともにソートモデルに入力して、ソートモデルによりその候補POIのソートスコアを得る。
本願では、ソートモデルのメカニズム自体を変更することではなく、ソートする際に考慮する特徴だけを追加し、ユーザのパーソナライズ要素であるユーザの好みを考慮する。ソートモデルにより採用されるソート特徴は、候補POIに対するユーザの好みに加えて、POIの価格、コメント、星評価、人気、位置などの他の特徴データを含むことができる。ソートモデルの訓練プロセスは、実施形態二において詳細に説明される。
205では、各候補POIのソートスコアに基づいて、ユーザに返信される検索結果を確定する。
本ステップでは、各候補POIのソートスコアの高い順に検索結果をユーザに返信することができる。例えば、検索結果のトップページでは、ソートスコアが上位M個の候補POIが返され、ユーザが次のページをクリックしたり、ドロップダウンしたりすると、M+1番目から2M番目の候補POIが継続して返され、以下同様である。ここで、Mは予め設定された正整数であるか、またはページに表示可能な候補POIの数に基づいて決定される。
実施形態二、
図3は、本出願の実施形態二により提供される、ソートモデルを訓練する方法のフローチャートである。この方法は、図3に示されるように、以下のステップを含むことができる。
301では、地図型アプリケーションデータから第1訓練データを取得する。
ここで、第1訓練データは、ユーザが過去にアクセスしたホテル型POIデータ、例えばユーザが検索したホテル型POIデータ、ユーザがクリックしたホテル型POIデータ、ユーザが実地で訪問したPOIデータなどを含むことができる。
ここで、ユーザが検索したホテル型POIデータは、ユーザが地図型アプリケーションの検索ボックスに入力した具体的なホテル型POIのデータであってよい。
ユーザがクリックしたホテル型POIデータは、ユーザが検索結果でクリックしたホテル型POIのデータ、ユーザが地図画面上でクリックしたホテル型POIのデータ、ユーザが推薦情報の閲覧中にクリックしたホテル型POIのデータなどであってよい。
ユーザが実地で訪問したPOIデータは、ユーザが測位機能によりホテル型POIに滞在したり、チェックインしたり、地図型アプリケーションのホテル予約機能によりホテル予約を行ったり、地図型アプリケーションの会計機能によりホテル会計を行ったりすることであって良く、何れもユーザが実際にそのホテル型POIを訪問したと考えられる。
上記のホテル型POIデータは、ホテル型POIの各種の特性データを含むことができる。これらの特性データは、通常にホテル型POIの属性に関連する。 例えば、価格、コメント、位置、星評価、人気などがある。
302では、ユーザが過去にアクセスしたホテル型POIデータのうちの少なくとも一部のタイプの特徴データを前処理して、当該少なくとも一部のタイプの特徴データの地域差を除去する。
具体的には、ユーザが過去にアクセスしたホテル型POIデータのうち、少なくとも一部のタイプの特徴データをBox-cox変換してから正規化処理することができる。Box-cox変換の方法および正規化の方法は、実施形態一におけるステップ202の関連記載を参照可能である。
前処理を行う少なくとも一部のタイプの特徴データは、地域に敏感なタイプの特徴データを指し、例えばホテル型POIの場合に、価格特徴データ、コメント特徴データ、人気特徴データなどを前処理する。
ここで、Box-cox変換に用いるパラメータ
Figure 0007206514000027

Figure 0007206514000028

Figure 0007206514000029
は、各地域のホテル型POIについて、上記の少なくとも一部のタイプの特徴におけるデータ分布を予め統計して得られたものである。例えば、ホテル型POIを地域ごとに区分し、地域ごとにホテル型POIの特徴データの分布を統計し、
Figure 0007206514000030
が変換された分布が正規分布に従うように最尤推定法により
Figure 0007206514000031
を計算し、さらに
Figure 0007206514000032

Figure 0007206514000033
を予め計算してもよい。
303では、第1訓練データを用いてユーザの好みモデルを訓練する。
第1訓練データは、実際には、ホテル型POIについて当該データを生成したユーザごとに区分し、ユーザごとに当該ユーザが過去にアクセスしたホテル型POIを用いて好みモデルを訓練する。たとえば、L個のユーザがいる場合に、L個のユーザの好みモデルが作成される。
ユーザの好みモデルを訓練する際には、ニューラルネットワークを採用することができる。しかし、ユーザの数が膨大であるため、ニューラルネットワークのような複雑な構造を採用すると、計算および記憶のオーバーヘッドが大きくなる。従って、本出願の実施形態では好ましい実施形態が採用される。すなわち、ユーザの好みモデルに異常点検出モデルを採用し、ユーザがアクセスしたホテル型POIを用いて異常点検出モデルを訓練することができる。すなわち、異常点検出モデルは、ユーザが過去にアクセスしたホテル型POIからその分布をフィッティングする。そして、新たなホテル型POIについては、異常点に該当するか正常点に該当するかを判断することができ、異常点であれば異常点に該当するスコアを付与することができる。もちろん、異常点と正常点を区別するために、異常点スコアを統一的に採用することもできる。
そして、異常点検出モデルによるホテル型POIの異常点スコアに基づいて、垂直型の地理位置点に対するユーザの好みスコアを得る。異常点スコアは好みスコアと負の相関があり、すなわち、異常点検出モデルによるホテル型POIの異常点スコアが高いほど、そのホテル型POIが異常点に属する可能性が高く、ユーザの好みと離れていることを示す。
本願では異常点検出モデルのタイプに制限は加えず、既存の任意の異常点検出モデルを用いて実現することができる。
304では、ユーザの好みモデルを用いて、第2訓練データにおける各ホテル型POIに対するユーザの好みスコアを取得する。
本願の実施形態では、採用される第2訓練データは、従来技術においてソートモデルを訓練する訓練データを踏襲することができる。すなわち、地図型のアプリケーションデータの中の大量のユーザ履歴データから、一方のPOIの順位が他方のPOIよりも優れることを反映できるPOIペアを抽出する。例えば、第2訓練データは、ホテル型に対する同一の検索セッションにおいて、ユーザがクリックしたPOIとクリックしなかったPOIとからなるPOIペアを含むことができる。たとえば、ユーザが1回のホテル型検索に対応する検索結果において、ホテル型POI1をクリックすると、POI1をポジティブサンプルとし、クリックされていない他のホテル型POIの中から例えばPOI2を選択してネガティブサンプルとすることにより、「POI1-POI2」を1つの訓練サンプルとして構成することができる。
本ステップでは、上記POIペアにおける各POIについて、それぞれユーザの好みモデルを用いて、各POIに対するユーザの好みスコアを取得する。
305では、第2訓練データを用いてソートモデルを訓練し、第2訓練データにおける各POIに対するユーザの好みスコアをソートモデルの訓練のソート特徴の1つとする。
第2訓練データを用いてソートモデルを訓練する際に、各訓練サンプルのPOIペアにおける各POIデータに対してそれぞれ特徴データを抽出することができる。これらの特徴データは、例えばPOIの価格、コメント、星評価、人気、位置などの従来技術における特徴データを踏襲することができる。これらの特徴データは、ステップ304で得られた訓練サンプルにおけるPOIに対するユーザの好みスコアとともに、ソート特徴としてソートモデル(LTR、Learning to Rank)に入力され、ソートモデルにより各POIのソートスコアが得られる。ソートモデルを訓練する際に採用される訓練目標は、同一の訓練サンプルにおけるポジティブサンプルPOIのソートスコアとネガティブサンプルPOIのソートスコアとの差を最大化することであり得る。
本願ではソートモデルのメカニズム自体を変更しておらず、ソートする際に考慮する特徴を追加しただけであり、ユーザのパーソナライズ要素であるユーザの好みを考慮することが分かった。
上述のプロセスを経て訓練された後、ユーザの好みモデルおよびソートモデルが共に実施形態一に記載の各ホテル型の候補POIのソートを達成することができる。
以上は、本出願で提供される方法の詳細な説明であり、以下で実施形態と合わせて本出願で提供される装置を詳細に説明する。
実施形態三、
図4は、本出願の実施形態三により提供される地理位置点のソート装置の構成図である。図4に示されたように、当該装置は、要求受信ユニット01と、好み確定ユニット02と、ソート処理ユニット03と、結果確定ユニット04とを含んでもよく、さらに前処理ユニット05を含んでもよい。ここで、各構成ユニットの主な機能は次のとおりである。
要求受信ユニット01は、ユーザからの垂直型の地理位置点の検索要求を受信する。
ユーザは、地図型アプリケーションの検索ボックス内で垂直型の情報を示すキーワードを入力することにより、垂直型の地理位置点の検索要求をトリガすることができる。また、ユーザは、「周辺の発見」機能画面で垂直型のラベルやボタンなどをクリックすることにより、垂直型の地理位置点の検索要求をトリガすることもできる。もちろん、これら2つの場合に加えて、他の方法でトリガすることも可能であり、本願では制限されない。
好み確定ユニット02は、前記垂直型の候補地理位置点データをユーザの好みモデルに入力して、各候補地理位置点に対するユーザの好みスコアを得る。
ここで、候補地理位置点を確定する際には、地図データベースにおける全ての前記垂直型の地理位置点を候補POIとすることができる。しかしながら、計算量を低減するために、地図データベースにおける前記垂直型の地理位置点に対して以下の少なくとも1つのフィルタリング処理を行った後、残りの地理位置点を候補地理位置点とすることが好ましい。
ユーザが位置する現在地に基づいて、現在地から予め設定された距離閾値を超える地理位置点をフィルタリングする。つまり、ユーザから明らかに離れている地理位置点をフィルタリングする。
ユーザの検索履歴に基づいて、ユーザの検索履歴との関連度が予め設定された関連度閾値よりも低い地理位置点をフィルタリングする。たとえば、ユーザが検索したことのない地理位置点を直接にフィルタリングしたりすることができる。
好ましくは、ユーザの好みモデルは、異常点検出モデルを採用し、異常点検出モデルによる候補地理位置点の異常点スコアに基づいて、候補地理位置点に対するユーザの好みスコアを得ることができる。ここで、異常点スコアは好みスコアと負の相関がある。
ソート処理ユニット03は、各候補地理位置点に対するユーザの好みスコアを各候補地理位置点のソート特徴の1つとしてソートモデルに入力して、各候補地理位置点のソートスコアを得る。
本願では、ソートモデルのメカニズム自体を変更することではなく、ソートする際に考慮する特徴だけを追加し、ユーザのパーソナライズ要素であるユーザの好みを考慮する。ソートモデルにより採用されるソート特徴は、候補地理位置点に対するユーザの好みに加えて、例えば地理位置点の価格、コメント、星評価、人気、位置などの他の特徴データを含むことができる。
結果確定ユニット04は、各候補位置点のソートスコアに基づいて、ユーザに返信される検索結果を確定する。
前処理ユニット05は、垂直型の候補地理位置点データのうちの少なくとも一部のタイプの特徴データを前処理して好み確定ユニット02に供給して少なくとも一部のタイプの特徴データの地域差を除去する。
具体的には、前処理ユニット05は、垂直型の候補地理位置点データのうちの少なくとも一部のタイプの特徴データをBox-cox変換してから正規化処理を行う。ここで、Box-cox変換を行う際に用いるパラメータは、各地域の地理位置点の少なくとも一部のタイプの特徴におけるデータ分布について予め統計して得られたものである。
実施形態四、
図5は、本出願の実施形態四により提供されるソートモデルを訓練する装置の構成図である。当該装置は、図5に示されるように、第1データ取得ユニット11、第1モデル訓練ユニット12、好みスコア確定ユニット13、および第2モデル訓練ユニット14を備えても良く、さらに前処理ユニット15を備えてもよい。これらの各構成ユニットの主な機能は次のとおりである。
第1データ取得部11は、地図型のアプリケーションデータから第1訓練データを取得する。第1訓練データは、ユーザが過去にアクセスした垂直型の地理位置点データを含み、アクセスは、検索、クリックまたは実地の訪問を含む。
上述した垂直型の地理位置点データは、垂直型の地理位置点の各種の特徴データを含んで良い。これらの特徴データは、一般的に垂直型の地理位置点データの属性に関する。たとえば、価格、コメント、位置、星評価、人気などがある。
第1モデル訓練ユニット12は、第1訓練データを用いてユーザの好みモデルを訓練する。
ユーザの好みモデルを訓練する際には、ニューラルネットワークを採用することができる。しかし、ユーザの数が膨大であるため、ニューラルネットワークのような複雑な構造を採用すると、計算と記憶のオーバーヘッドが大きくなる。したがって、好ましくは、第1モデル訓練ユニット12は、異常点検出モデルを用いてユーザの好みモデルを訓練し、異常点検出モデルによる垂直型の地理位置点の異常点スコアに基づいて、垂直型の地理位置点に対するユーザの好みスコアを得る。ここで、異常点スコアは好みスコアと負の相関がある。
好みスコア確定ユニット13は、ユーザの好みモデルを用いて、第2訓練データにおける垂直型の各地理位置点に対するユーザの好みスコアを取得する。
本出願では、第2データ取得ユニット(未図示の従来技術におけるユニット)により第2訓練データを取得することができる。本願の実施形態では、採用される第2訓練データは、従来技術におけるソートモデルを訓練する訓練データを踏襲することができる。すなわち、地図型アプリケーションデータの中の大量のユーザ履歴データから、一方の地理位置点の順位が他方の地理位置点よりも優れることを反映できる地理位置点ペアを抽出する。例えば、第2訓練データは、ある垂直型に対する同一の検索セッションにおいてユーザがクリックした地理位置点とクリックしなかった地理位置点とからなる地理位置点ペアを含むことができる。たとえば、ユーザが1回のホテル型検索に対応する検索結果において、ホテル型POI1をクリックすると、POI1をポジティブサンプルとし、クリックされていない他のホテル型POIの中から例えばPOI2を選択してネガティブサンプルとし、「POI1-POI2」により1つの訓練サンプルとして構成することができる。
第2モデル訓練ユニット14は、第2訓練データを用いてソートモデルを訓練し、第2訓練データにおける各地理位置点に対するユーザの好みスコアをソートモデルを訓練するソート特徴の1つとする。
第2訓練データを用いてソートモデルを訓練する際に、各訓練サンプルの地理位置点ペアにおける各地理位置点データに対してそれぞれ特徴データを抽出することができる。これらの特徴データは、従来技術で採用されている特徴データ、例えば地理位置点の価格、コメント、星評価、人気、位置などを踏襲することができる。これらの特徴データは、好みスコア確定ユニット13で得られた訓練サンプルにおける地理位置点に対するユーザの好みスコアとともに、ソート特徴としてソートモデル(LTR、Learning to Rank)に入力され、ソートモデルにより各地理位置点のソートスコアが得られる。ソートモデルを訓練する際に採用される訓練目標は、同一の訓練サンプルにおけるポジティブサンプル地理位置点のソートスコアとネガティブサンプル地理位置点のソートスコアとの間の差を最大化することであり得る。
前処理ユニット15は、ユーザが過去にアクセスした垂直型の地理位置データのうちの少なくとも一部のタイプの特徴データを前処理して第1モデル訓練ユニット12に供給することにより、少なくとも一部のタイプの特徴データの地域差を解消する。
具体的には、前処理ユニット15は、ユーザが過去にアクセスした垂直型の候補地理位置点データのうちの少なくとも一部のタイプの特徴データをBox-cox変換してから正規化処理を行って良い。ここで、Box-cox変換を行う際に用いるパラメータは、各地域の地理位置点の少なくとも一部のタイプの特徴におけるデータ分布について予め統計して得られたものである。
以上の実施形態から分かるように、本出願の実施形態により提供される技術案は、以下の利点を備えることができる。
1)ユーザがホテル型、飲食型、劇場型、スーパーマッケート型などの垂直型の地理位置点を検索する時、 ユーザの好みという要素をソートに組み込むことで、ユーザが検索結果の中で自分の好みに合ったホテルを迅速に見つけることができ、検索結果の中で探したりクリックしたりする回数を減らし、ユーザの時間を節約し、地図型のアプリケーションを使用するユーザの検索体験を向上させることができる。
2)本出願は、既存のソートモデルのソートメカニズムをできるだけ維持した上で、ソートフレームワークを最適化し、既存のソートフレームワークの安定性と効率性を保証する。
本発明の実施形態によれば、本発明は更に電子デバイスおよび可読記憶媒体を提供する。
図6は、本出願の実施形態による地理位置点のソート方法、ソートモデルを訓練する方法の電子デバイスのブロック図である。電子デバイスは、様々な形式のデジタルコンピュータ、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、PDA、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータであることが意図される。電子デバイスは、様々な形式のモバイル装置、例えば、PDA、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似するコンピューティング装置を示してもよい。本文で示された構成要素、それらの接続及び関係、ならびにそれらの機能は例示にすぎなく、本明細書において説明及び/又は請求される本出願の実現を限定することが意図されない。
図6に示すように、この電子デバイスは、一つ又は複数のプロセッサ601、メモリ602、及び各構成要素に接続するための高速インターフェース及び低速インターフェースを含むインターフェースを備える。各構成要素は、異なるバスで相互接続され、そして、共通マザーボードに、又は必要に応じて、他の態様で実装されてもよい。プロセッサは、電子デバイス内で実行されるコマンドを処理してもよく、メモリに記憶される又はメモリ上で外部入力/出力装置(例えば、インターフェースに結合される表示装置)にグラフィカルユーザインターフェースのグラフィカル情報を表示するコマンドを含む。他の実施形態において、必要な場合に、複数のプロセッサ及び/又は複数のバスが、複数のメモリとともに用いられてもよい。同様に、複数の電子デバイスが接続されてもよく、それぞれのデバイスが必要な操作の一部を提供する(例えば、サーババンク、ブレードサーバの集まり、又はマルチプロセッサシステムとする)。図6において、一つのプロセッサ601を例とする。
メモリ602は、本出願で提供される非一時的コンピュータ可読記憶媒体である。なお、前記メモリには、少なくとも1つのプロセッサが本願に提供された地理位置点のソート方法、ソートモデルを訓練する方法を実行するように、前記少なくとも1つのプロセッサに実行可能なコマンドが記憶されている。本出願の非一時的コンピュータ可読記憶媒体は、本願に提供された地理位置点のソート方法、ソートモデルを訓練する方法をコンピュータに実行させるためのコンピュータコマンドを記憶している。
メモリ602は、非一時的コンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能なプログラム、モジュール、例えば、本出願の実施例における地理位置点のソート方法、ソートモデルを訓練する方法に対応するプログラムコマンド/モジュールを記憶するために用いられる。プロセッサ601は、メモリ602に記憶されている非一時的ソフトウェアプログラム、コマンド及びモジュールを実行することで、サーバの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記の方法実施例における地理位置点のソート方法、ソートモデルを訓練する方法を実現する。
メモリ602は、プログラム記憶領域及びデータ記憶領域を含んでもよく、プログラム記憶領域はオペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラムを記憶してもよく、データ記憶領域は当該電子デバイスの使用により作成されたデータなどを記憶してもよい。また、メモリ602は、高速ランダムアクセスメモリを含んでもよく、さらに非一時的メモリ、例えば、少なくとも一つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一時的固体記憶装置を含んでもよい。幾つかの実施例において、メモリ602は、プロセッサ601に対して遠隔設置されたメモリを選択的に含んでもよく、これらのリモートメモリは、ネットワークを介して当該電子デバイスに接続されてもよい。上記のネットワークの実例には、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。
当該電子デバイスは、更に、入力装置603と出力装置604とを備えても良い。プロセッサ601、メモリ602、入力装置603及び出力装置604は、バス又は他の手段により接続されても良く、図6においてバスによる接続を例とする。
入力装置603は、入力された数字又はキャラクタ情報を受信し、当該電子デバイスのユーザ設定及び機能制御に関連するキー信号入力を生成でき、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、一つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置604は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モータ)などを含むことができる。当該表示装置は、液晶ディスプレイ(LCD)、発光ダイオードディスプレイ(LED)、及びプラズマディスプレイを含み得るが、これらに限定されない。いくつかの実施形態では、表示装置はタッチパネルであってもよい。
本明細書に説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(専用集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、記憶システム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及びコマンドを受信し、当該記憶システム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置にデータ及びコマンドを送信するようにつなげられた、特殊用途でもよく一般用途でもよい少なくとも一つのプログラマブルプロセッサを含む、プログラマブルシステム上で実行可能及び/又は解釈可能な一つ又は複数のコンピュータプログラムにおける実行を含んでもよい。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又は、コードとも称される)は、プログラマブルプロセッサの機械命令を含み、高水準のプロセス及び/又はオブジェクト向けプログラミング言語、及び/又はアセンブリ/機械言語で実行されることができる。本明細書で用いられる「機械可読媒体」及び「コンピュータ可読媒体」という用語は、機械可読信号としての機械命令を受け取る機械可読媒体を含むプログラマブルプロセッサに機械命令及び/又はデータを提供するのに用いられる任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、及びプログラマブル論理デバイス)を指す。「機械可読信号」という用語は、プログラマブルプロセッサに機械命令及び/又はデータを提供するために用いられる任意の信号を指す。
ユーザとのインタラクティブを提供するために、本明細書に説明されるシステムと技術は、ユーザに対して情報を表示するための表示装置(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)、ユーザがコンピュータに入力を与えることができるキーボード及びポインティングデバイス(例えば、マウスや、トラックボール)を有するコンピュータ上に実施されることが可能である。その他の種類の装置は、さらに、ユーザとのインタラクションを提供するために使用されることが可能であり、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚的なフィードバック、聴覚的なフィードバック、又は触覚的なフィードバック)であり得、ユーザからの入力は、任意の形態で(音響、音声又は触覚による入力を含む)受信され得る。
本明細書に説明されるシステムと技術は、バックエンド構成要素を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア構成要素を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド構成要素を含むコンピューティングシステム(例えば、グラフィカルユーザインターフェースもしくはウェブブラウザを有するクライアントコンピュータであり、ユーザは、当該グラフィカルユーザインターフェースもしくは当該ウェブブラウザを通じて本明細書で説明されるシステムと技術の実施形態とインタラクションすることができる)、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク(「LAN」)、ワイド・エリア・ネットワーク(「WAN」)、インターネットワークを含む。
コンピュータシステムは、クライアントとサーバーを含み得る。クライアントとサーバーは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバとの関係は、相応するコンピュータ上で実行され、互いにクライアント-サーバの関係を有するコンピュータプログラムによって生じる。
前記の具体的な実施形態は本出願の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本出願の精神及び原則の範囲内で行われる修正、同等の置換、改善は、何れも本出願の保護範囲内に含まれるべきである。

Claims (20)

  1. コンピュータにより実行される、地理位置点のソート方法であって、
    ユーザからの垂直型の地理位置点の検索要求を受信し、
    前記垂直型の候補地理位置点データを前記ユーザの好みモデルに入力して、各候補地理位置点に対する前記ユーザの好みスコアを得、
    各候補地理位置点に対する前記ユーザの好みスコアを各候補地理位置点のソート特徴の1つとしてソートモデルに入力して、各候補地理位置点のソートスコアを得、前記ソート特徴は候補地理位置点自身の特徴をさらに含み、
    前記各候補地理位置点のソートスコアに基づいて前記ユーザに返信される検索結果を確定する、
    ことを含み、
    前記ユーザの好みモデルは、異常点検出モデルを採用し、前記異常点検出モデルによる候補地理位置点の異常点スコアに基づいて、候補地理位置点に対する前記ユーザの好みスコアを得、
    前記異常点スコアは、前記好みスコアと負の相関がある、
    方法。
  2. 前記垂直型の候補地理位置点データを前記ユーザの好みモデルに入力することの前に、
    前記垂直型の候補地理位置点データのうちの少なくとも一部のタイプの特徴データを前処理することにより、前記少なくとも一部のタイプの特徴データの地域差を除去することをさらに含む請求項1に記載の方法。
  3. 前記前処理は、
    前記垂直型の候補地理位置点データのうちの少なくとも一部のタイプの特徴データをBox-cox変換してから正規化処理を行うことを含み、
    Box-cox変換を行う際に使用されるパラメータは、各地域の地理位置点の前記少なくとも一部のタイプの特徴におけるデータ分布について予め統計して得られる請求項2に記載の方法。
  4. 前記垂直型は、ホテル型、飲食型、スーパーマーケット型、または劇場型を含む請求項1に記載の方法。
  5. コンピュータにより実行される、ソートモデルの訓練方法であって、
    地図型アプリケーションデータから第1訓練データを取得し、前記第1訓練データは、ユーザが過去にアクセスした垂直型の地理位置点データを含み、前記アクセスは、検索、クリック、または実地の訪問を含み、
    前記第1訓練データを用いて前記ユーザの好みモデルを訓練し、
    前記ユーザの好みモデルを使用して第2訓練データにおける前記垂直型の各地理位置点に対する前記ユーザの好みスコアを取得し、
    前記第2訓練データを用いてソートモデルを訓練し、第2訓練データにおける各地理位置点に対する前記ユーザの好みスコアを前記ソートモデルを訓練するためのソート特徴の1つと前記ソート特徴は候補地理位置点自身の特徴をさらに含む、
    ことを含み、
    前記ユーザの好みモデルは異常点検出モデルを採用し、前記異常点検出モデルによる垂直型の地理位置点の異常点スコアに基づいて、垂直型の地理位置点に対する前記ユーザの好みスコアを得、
    前記異常点スコアは、前記好みスコアと負の相関がある、
    方法。
  6. 前記第1訓練データを用いて異常点検出モデルを訓練することの前に、
    前記ユーザが過去にアクセスした垂直型の地理位置データのうちの少なくとも一部のタイプの特徴データを前処理することにより、前記少なくとも一部のタイプの特徴データの地域差を除去することをさらに含む請求項に記載の方法。
  7. 前記前処理は、
    前記ユーザが過去にアクセスした垂直型の候補地理位置点データのうちの少なくとも一部のタイプの特徴データをBox-cox変換してから正規化処理を行うことを含み、
    Box-cox変換を行う際に使用されるパラメータは、各地域の地理位置点の前記少なくとも一部のタイプの特徴におけるデータ分布について予め統計して得られる請求項に記載の方法。
  8. 前記第2訓練データは、前記垂直型に対する同一の検索セッションにおいて、ユーザがクリックした地理位置点とクリックしなかった地理位置点とからなる地理位置点ペアを含む請求項に記載の方法。
  9. 地理位置点のソート装置であって、
    ユーザからの垂直型の地理位置点の検索要求を受信する要求受信ユニットと、
    前記垂直型の候補地理位置点データを前記ユーザの好みモデルに入力して、各候補地理位置点データに対する前記ユーザの好みスコアを得る好み確定ユニットと、
    各候補地理位置点に対する前記ユーザの好みスコアを各候補地理位置点のソート特徴の1つとしてソートモデルに入力して、各候補地理位置点のソートスコアを得、前記ソート特徴は候補地理位置点自身の特徴をさらに含むソート処理ユニットと、
    前記各候補地理位置点のソートスコアに基づいて前記ユーザに返信される検索結果を確定する結果確定ユニットと、
    を備え
    前記ユーザの好みモデルは、異常点検出モデルを採用し、前記異常点検出モデルによる候補地理位置点の異常点スコアに基づいて、候補地理位置点に対する前記ユーザの好みスコアを得、
    前記異常点スコアは、前記好みスコアと負の相関がある、
    装置。
  10. 前記垂直型の候補地理位置点データのうちの少なくとも一部のタイプの特徴データを前処理して前記好み確定ユニットに供給することにより、前記少なくとも一部のタイプの特徴データの地域差を除去する前処理ユニットを更に備える請求項に記載の装置。
  11. 前記前処理ユニットは、
    前記垂直型の候補地理位置点データのうちの少なくとも一部のタイプの特徴データをBox-cox変換してから正規化処理を行い、
    Box-cox変換を行う際に使用されるパラメータは、各地域の地理位置点の前記少なくとも一部のタイプの特徴におけるデータ分布について予め統計して得られる、
    請求項10に記載の装置。
  12. ソートモデルの訓練装置であって、
    地図型アプリケーションデータから第1訓練データを取得する第1データ取得ユニットであって、前記第1訓練データはユーザが過去にアクセスした垂直型の地理位置点データを含み、前記アクセスは検索、クリックまたは実地の訪問を含む、第1データ取得ユニットと、
    前記第1訓練データを用いて前記ユーザの好みモデルを訓練する第1モデル訓練ユニットと、
    前記ユーザの好みモデルを利用して、第2訓練データにおける前記垂直型の各地理位置点対する前記ユーザの好みスコアを取得する好みスコア確定ユニットと、
    前記第2訓練データを用いてソートモデルを訓練し、第2訓練データにおける各地理位置点に対する前記ユーザの好みスコアを前記ソートモデルを訓練するためのソート特徴の1つとし、前記ソート特徴は候補地理位置点自身の特徴をさらに含む第2モデル訓練ユニットと、
    を備え
    前記第1モデル訓練ユニットは、異常点検出モデルを用いて前記ユーザの好みモデルを訓練し、前記異常点検出モデルによる垂直型の地理位置点の異常点スコアに基づいて、垂直型の地理位置点に対する前記ユーザの好みスコアを得、
    前記異常点スコアは、前記好みスコアと負の相関がある、
    装置。
  13. 前記ユーザが過去にアクセスした垂直型の地理位置データのうちの少なくとも一部のタイプの特徴データを前処理して前記第1モデル訓練ユニットに提供することにより、前記少なくとも一部のタイプの特徴データの地域差を除去する前処理ユニットを更に備える、請求項12に記載の装置。
  14. 前記前処理ユニットは、
    前記ユーザが過去にアクセスした垂直型の候補地理位置点データのうちの少なくとも一部のタイプの特徴データをBox-cox変換してから正規化処理を行い、
    Box-cox変換を行う際に使用されるパラメータは、各地域の地理位置点の前記少なくとも一部のタイプの特徴におけるデータ分布について予め統計して得られる、
    請求項13に記載の装置。
  15. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信接続されたメモリと、を備え、
    前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項1~のいずれか1項に記載の方法を実行させる電子デバイス。
  16. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信接続されたメモリと、を備え、
    前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項5~8のいずれか1項に記載の方法を実行させる電子デバイス。
  17. コンピュータに請求項1~のいずれか1項に記載の方法を実行させるためのコンピュータコマンドが記憶された非一時的なコンピュータ可読記憶媒体。
  18. コンピュータに請求項5~8のいずれか1項に記載の方法を実行させるためのコンピュータコマンドが記憶された非一時的なコンピュータ可読記憶媒体。
  19. コンピュータに請求項1~のいずれか1項に記載の方法を実行させるためのコンピュータプログラム。
  20. コンピュータに請求項5~8のいずれか1項に記載の方法を実行させるためのコンピュータプログラム。
JP2021081414A 2020-05-15 2021-05-13 地理位置点のソート方法、ソートモデルの訓練方法及び対応装置 Active JP7206514B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010414943.4A CN111737382A (zh) 2020-05-15 2020-05-15 地理位置点的排序方法、训练排序模型的方法及对应装置
CN202010414943.4 2020-05-15

Publications (2)

Publication Number Publication Date
JP2021179990A JP2021179990A (ja) 2021-11-18
JP7206514B2 true JP7206514B2 (ja) 2023-01-18

Family

ID=72647375

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021081414A Active JP7206514B2 (ja) 2020-05-15 2021-05-13 地理位置点のソート方法、ソートモデルの訓練方法及び対応装置

Country Status (5)

Country Link
US (1) US11556601B2 (ja)
EP (1) EP3910491A1 (ja)
JP (1) JP7206514B2 (ja)
KR (1) KR102601545B1 (ja)
CN (1) CN111737382A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110851738B (zh) * 2019-10-28 2021-03-19 百度在线网络技术(北京)有限公司 获取poi状态信息的方法、装置、设备和计算机存储介质
CN114491318B (zh) * 2021-12-16 2023-09-01 北京百度网讯科技有限公司 目标信息的确定方法、装置、设备以及存储介质
CN117314701B (zh) * 2023-11-27 2024-03-08 江西联创精密机电有限公司 一种模拟训练席位配置方法、系统、存储介质及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012053863A (ja) 2010-08-06 2012-03-15 Nippon Telegr & Teleph Corp <Ntt> 情報推薦処理装置とそのプログラム
CN106919641A (zh) 2017-01-12 2017-07-04 北京三快在线科技有限公司 一种兴趣点搜索方法及装置、电子设备
US20180322203A1 (en) 2017-05-03 2018-11-08 Uber Technologies, Inc. Optimizing listing efficiency and efficacy for a delivery coordination system
JP2019185716A (ja) 2018-04-10 2019-10-24 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド エンティティ推薦方法及び装置
JP2020501211A (ja) 2016-11-21 2020-01-16 グーグル エルエルシー 電子地図インターフェース

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2659698C (en) * 2008-03-21 2020-06-16 Dressbot Inc. System and method for collaborative shopping, business and entertainment
US9194716B1 (en) * 2010-06-18 2015-11-24 Google Inc. Point of interest category ranking
CN102594905B (zh) * 2012-03-07 2014-07-16 南京邮电大学 一种基于场景的社交网络位置兴趣点推荐方法
US9916362B2 (en) * 2013-11-20 2018-03-13 Toyota Jidosha Kabushiki Kaisha Content recommendation based on efficacy models
US10235470B2 (en) 2013-12-06 2019-03-19 Here Global B.V. User retrieval enhancement
CN103954277B (zh) * 2014-04-30 2017-05-03 百度在线网络技术(北京)有限公司 检测兴趣点位置的方法及装置
US9565292B2 (en) * 2014-05-28 2017-02-07 Here Global B.V. Method and apparatus for performing an optimized location based search
CN104135716A (zh) * 2014-06-17 2014-11-05 百度在线网络技术(北京)有限公司 一种兴趣点信息的推送方法及系统
US10503764B2 (en) 2015-06-01 2019-12-10 Oath Inc. Location-awareness search assistance system and method
US10528533B2 (en) * 2017-02-09 2020-01-07 Adobe Inc. Anomaly detection at coarser granularity of data
CN108628833B (zh) * 2018-05-11 2021-01-22 北京三快在线科技有限公司 原创内容摘要确定方法及装置,原创内容推荐方法及装置
EP3895096A1 (en) * 2018-12-13 2021-10-20 Datarobot, Inc. Methods for detecting and interpreting data anomalies, and related systems and devices
US11861462B2 (en) * 2019-05-02 2024-01-02 Nicholas John Teague Preparing structured data sets for machine learning
CN110348895A (zh) * 2019-06-29 2019-10-18 北京淇瑀信息科技有限公司 一种基于用户标签的个性化推荐方法、装置和电子设备
CN111026957B (zh) * 2019-11-21 2023-05-05 北京网聘咨询有限公司 基于多维相似度的推荐系统及其方法
US11815360B2 (en) * 2020-04-30 2023-11-14 Grabtaxi Holdings Pte. Ltd. Method for predicting the destination location of a vehicle

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012053863A (ja) 2010-08-06 2012-03-15 Nippon Telegr & Teleph Corp <Ntt> 情報推薦処理装置とそのプログラム
JP2020501211A (ja) 2016-11-21 2020-01-16 グーグル エルエルシー 電子地図インターフェース
CN106919641A (zh) 2017-01-12 2017-07-04 北京三快在线科技有限公司 一种兴趣点搜索方法及装置、电子设备
US20180322203A1 (en) 2017-05-03 2018-11-08 Uber Technologies, Inc. Optimizing listing efficiency and efficacy for a delivery coordination system
JP2019185716A (ja) 2018-04-10 2019-10-24 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド エンティティ推薦方法及び装置

Also Published As

Publication number Publication date
JP2021179990A (ja) 2021-11-18
US20210357468A1 (en) 2021-11-18
US11556601B2 (en) 2023-01-17
EP3910491A1 (en) 2021-11-17
KR20210141393A (ko) 2021-11-23
KR102601545B1 (ko) 2023-11-10
CN111737382A (zh) 2020-10-02

Similar Documents

Publication Publication Date Title
US11397772B2 (en) Information search method, apparatus, and system
JP7206514B2 (ja) 地理位置点のソート方法、ソートモデルの訓練方法及び対応装置
EP3617952A1 (en) Information search method, apparatus and system
US11978447B2 (en) Speech interaction method, apparatus, device and computer storage medium
US20220253612A1 (en) Method and apparatus for acquiring poi state information, device and computer storage medium
US11630560B2 (en) Map information display method and apparatus, electronic device, and computer storage medium
CN111666292B (zh) 用于检索地理位置的相似度模型建立方法和装置
CN112612957A (zh) 兴趣点的推荐方法、兴趣点推荐模型的训练方法、装置
US20230214689A1 (en) Method and apparatus for processing dialogue, electronic device, and storage medium
US20230004614A1 (en) Method and Apparatus for Displaying Map Points of Interest, And Electronic Device
CN111666461B (zh) 检索地理位置的方法、装置、设备和计算机存储介质
CN111737430A (zh) 实体链接方法、装置、设备以及存储介质
JP2024507902A (ja) 情報検索方法、装置、電子機器および記憶媒体
CN112100480A (zh) 搜索方法、装置、设备及存储介质
US20220172310A1 (en) House-renting recommendation method, electronic device and storage medium
CN113449754B (zh) 标签的匹配模型训练和展示方法、装置、设备及介质
US20210389156A1 (en) Map rendering method and apparatus, device, and storage medium
CN114238745A (zh) 一种提供搜索结果的方法及装置、电子设备和介质
CN113407579A (zh) 群组查询方法、装置、电子设备及可读存储介质
CN112100522A (zh) 用于检索兴趣点的方法、装置、设备及介质
CN112861023A (zh) 地图信息处理方法、装置、设备、存储介质及程序产品
CN113868532B (zh) 一种地点推荐方法、装置、电子设备及存储介质
CN111767372B (zh) 语音查询的解析方法、解析模型的训练方法、装置、设备
US11683656B2 (en) Recommendation of region of interest
KR102565762B1 (ko) 경제 상태 모니터링 방법, 경제 상태 모니터링 모델 구축 방법 및 대응하는 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210513

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221212

R150 Certificate of patent or registration of utility model

Ref document number: 7206514

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150