JP2019537394A - Site detection - Google Patents

Site detection Download PDF

Info

Publication number
JP2019537394A
JP2019537394A JP2019536471A JP2019536471A JP2019537394A JP 2019537394 A JP2019537394 A JP 2019537394A JP 2019536471 A JP2019536471 A JP 2019536471A JP 2019536471 A JP2019536471 A JP 2019536471A JP 2019537394 A JP2019537394 A JP 2019537394A
Authority
JP
Japan
Prior art keywords
site
data
sites
mobile device
location
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019536471A
Other languages
Japanese (ja)
Other versions
JP7032408B2 (en
Inventor
カトガテイ・バーク・カピシオグル
エンリケ・クルス
アーロン・ミッチェル
ステファニー・ヤン
Original Assignee
フォースクエア・ラボズ・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フォースクエア・ラボズ・インコーポレイテッド filed Critical フォースクエア・ラボズ・インコーポレイテッド
Publication of JP2019537394A publication Critical patent/JP2019537394A/en
Application granted granted Critical
Publication of JP7032408B2 publication Critical patent/JP7032408B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/18Service support devices; Network management devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/38Services specially adapted for particular environments, situations or purposes for collecting sensor information
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Remote Sensing (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Economics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本開示の例は、現場検知のためのシステムおよび方法について記述している。複数の態様において、センサのセットを含むモバイルデバイスが、検知された移動イベントまたはユーザ対話データに応答してセンサデータを収集および格納することが可能である。センサデータは、モバイルデバイスのロケーションに対応する候補現場のセットを生成するために使用されることが可能である。候補現場は、現場検知システムに提供されることが可能である。現場検知システムは、候補現場を処理して特徴のセットを生成することが可能である。特徴のセットは、1つもしくは複数の確率モデルに適用されること、および/またはそれらの確率モデルを生成するために使用されることが可能である。確率モデルは、候補現場のそれぞれに関する信頼性メトリックを生成することが可能である。いくつかの態様においては、セットから上位「N」個の現場が選択されることが可能である。上位「N」個の現場は次いで、ユーザに提示されること、および/または1つもしくは複数のアクションをもたらすために使用されることが可能である。The examples of the present disclosure describe systems and methods for on-site sensing. In aspects, a mobile device that includes a set of sensors can collect and store sensor data in response to detected movement events or user interaction data. The sensor data can be used to generate a set of candidate sites corresponding to the location of the mobile device. Candidate sites can be provided to a site detection system. The site detection system can process the candidate sites to generate a set of features. The set of features can be applied to one or more probability models and / or used to generate those probability models. The probabilistic model can generate a reliability metric for each of the candidate sites. In some embodiments, the top "N" sites can be selected from the set. The top "N" locations can then be presented to a user and / or used to effect one or more actions.

Description

関連出願の相互参照
本出願は、2017年9月14日にPCT国際特許出願として出願されているものであり、2017年8月29日に出願された「VENUE DETECTION」と題されている米国特許出願第15/689,683号に対する優先権を主張するものであり、その出願は、2016年9月16日に出願された「SYSTEMS AND METHODS FOR PASSIVE VISIT DETECTION」と題されている米国特許仮出願第62/395,827号に対する優先権を主張するものであり、それらの開示は、それらの全体が参照によって本明細書に組み込まれている。
CROSS REFERENCE TO RELATED APPLICATIONSThis application was filed as a PCT international patent application on September 14, 2017, and was filed on August 29, 2017, entitled VENUE DETECTION. Claims priority to application No. 15 / 689,683, which is filed in US Provisional Application No. / 395,827, the disclosures of which are incorporated herein by reference in their entirety.

現場検知システムは、モバイルデバイス訪問パターンに関連した特定を可能にする。多くのケースにおいては、現場検知システムは、モバイルデバイスのロケーションを特定するために、ほとんどもっぱら周期的な地理座標系データ(たとえば、緯度、経度、および/または標高座標)に依存している。たとえば、地理座標系データは、モバイルデバイスによる検知された停止が特定の現場におけるモバイルデバイスユーザによるチェックインイベントに相関しているかどうかを特定するために使用されることが可能である。しかしながら、地理座標系データのほとんどもっぱらの使用は、不正確な現場検知という結果になる場合がある。   The on-site detection system enables identification related to mobile device visit patterns. In many cases, field sensing systems rely almost exclusively on periodic geographic coordinate system data (eg, latitude, longitude, and / or elevation coordinates) to determine the location of a mobile device. For example, geographic coordinate system data can be used to determine whether a detected outage by a mobile device is correlated with a check-in event by a mobile device user at a particular location. However, almost exclusively use of geographic coordinate system data can result in inaccurate field detection.

本明細書において開示されている態様が作成されたのは、これらおよびその他の一般的な考慮事項に関連してである。また、比較的特定の問題が論じられている可能性があるが、例は、本開示における背景技術またはその他の箇所において識別された特定の問題を解決することに限定されるべきではないということを理解されたい。   It is with respect to these and other general considerations that the embodiments disclosed herein have been made. Also, although relatively specific issues may be discussed, the example should not be limited to solving specific problems identified in the background or elsewhere in this disclosure. I want to be understood.

本開示の例は、現場検知のためのシステムおよび方法について記述している。複数の態様において、センサのセットを含むモバイルデバイスが、移動イベントまたはユーザ対話データを検知したことに応答してセンサのセットからのセンサデータを収集および格納することが可能である。センサデータは、モバイルデバイスのロケーションに対応する候補現場のセットを生成するために使用されることが可能である。候補現場は、現場検知システムに提供されることが可能である。現場検知システムは、候補現場を処理して特徴のセットを生成することが可能である。特徴のセットは、1つもしくは複数の確率モデルに適用されること、および/またはそれらの確率モデルを生成するために使用されることが可能である。確率モデルは、候補現場のそれぞれに関する信頼性メトリックを生成することが可能である。いくつかの態様においては、セットから上位「N」個の現場が選択されることが可能である。上位「N」個の現場は次いで、ユーザに提示されること、および/または1つもしくは複数のアクションをもたらすために使用されることが可能である。   The examples of the present disclosure describe systems and methods for on-site sensing. In aspects, a mobile device that includes a set of sensors may collect and store sensor data from the set of sensors in response to detecting a movement event or user interaction data. The sensor data can be used to generate a set of candidate sites corresponding to the location of the mobile device. Candidate sites can be provided to a site detection system. The site detection system can process the candidate sites to generate a set of features. The set of features may be applied to one or more probability models and / or used to generate those probability models. The probabilistic model can generate a reliability metric for each of the candidate sites. In some embodiments, the top "N" sites can be selected from the set. The top "N" sites can then be presented to a user and / or used to effect one or more actions.

この「発明の概要」は、コンセプトのうちの選択されたものを、簡略化された形式で紹介するために提供されており、それらのコンセプトは、以降で「発明を実施するための形態」においてさらに記述されている。この「発明の概要」は、特許請求される主題の鍵となる特徴または必要不可欠な特徴を識別することを意図されているものではなく、特許請求される主題の範囲を限定するために使用されることを意図されているものでもない。例のさらなる態様、特徴、および/または利点は、以降に続く説明において一部が示されることになり、その説明から一部が明らかになり、または本開示の実践によって理解されることが可能である。   This "Summary of the Invention" is provided to introduce selected ones of the concepts in a simplified form, which concepts are described below in the "Detailed Description of the Invention". It is further described. This Summary is not intended to identify key or essential features of the claimed subject matter and is used to limit the scope of the claimed subject matter. Nor is it intended to be. Additional aspects, features, and / or advantages of the examples will be set forth in part in the description that follows, and in part will be obvious from the description, or may be learned by practice of the present disclosure. is there.

下記の図を参照しながら、非限定的かつ非網羅的な例が記述されている。   Non-limiting and non-exhaustive examples are described with reference to the following figures.

本明細書において記述されている現場検知のための例示的なシステムの概観を示す図である。FIG. 1 illustrates an overview of an exemplary system for in-situ sensing described herein. 本明細書において記述されている現場検知を実施するための例示的な入力処理ユニットを示す図である。FIG. 3 illustrates an example input processing unit for performing the on-site sensing described herein. 本明細書において記述されている現場検知を実施するための例示的な方法を示す図である。FIG. 4 illustrates an exemplary method for performing on-site sensing as described herein. これらの実施形態の1つまたは複数が実施されることが可能である適切な動作環境の一例を示す図である。FIG. 3 illustrates an example of a suitable operating environment in which one or more of these embodiments may be implemented.

以降で添付の図面を参照しながら、本開示のさまざまな態様がさらに十分に記述されており、それらの図面は、本明細書の一部を形成しており、特定の例示的な態様を示している。しかしながら、本開示のさまざまな態様は、多くの異なる形態で実施されることが可能であり、本明細書において示されている態様に限定されるものとして解釈されるべきではなく、むしろ、これらの態様は、本開示が徹底的かつ完全になるように、およびこれらの態様の範囲を当業者に十分に伝達するように提供されている。態様は、方法、システム、またはデバイスとして実践されることが可能である。したがって、態様は、ハードウェアの実施態様、完全にソフトウェアの実施態様、または、ソフトウェアの態様とハードウェアの態様とを組み合わせている実施態様の形態を取ることが可能である。したがって、以降の詳細な説明は、限定的な意味に取られるべきではない。   Various aspects of the disclosure are more fully described hereinafter with reference to the accompanying drawings, which form a part hereof, and in which are shown certain illustrative aspects. ing. However, the various aspects of the disclosure may be embodied in many different forms and should not be construed as limited to the aspects set forth herein; The embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the scope of these embodiments to those skilled in the art. Aspects can be implemented as a method, system, or device. Thus, aspects may take the form of a hardware embodiment, an entirely software embodiment or an embodiment combining software and hardware aspects. Therefore, the following detailed description should not be taken in a limiting sense.

本開示は、現場検知のためのシステムおよび方法について記述している。複数の態様においては、現場検知は、受動的な訪問検知に関連して記述されている可能性がある。受動的な訪問検知は、モバイルデバイス(またはそのユーザ)が特定の現場または地理的ロケーションを訪問しているまたは訪問したかどうかを特定するための黙示的なしるしの使用を指す。(ユーザによって確認された現場チェックインデータなどの)明示的なユーザ信号を使用する能動的な訪問検知とは対照的に、受動的な訪問検知は、モバイルデバイスのさまざまなセンサからのデータの受動的な収集に依存する。さまざまなモバイルデバイスセンサからのデータの分析は、地理座標系データを使用するだけである従来のアプローチよりも訪問検知の精度および効率を高める。本明細書において記述されている現場検知技術は、受動的な訪問検知に関連して記述されているが、そのような技術は、その他のコンテキストにおいて適用されることも可能であるということを当業者なら認識するであろう。   This disclosure describes systems and methods for on-site sensing. In aspects, site detection may be described in connection with passive visit detection. Passive visit detection refers to the use of implicit indicia to identify whether or not a mobile device (or its user) is visiting or has visited a particular site or geographic location. Passive visit detection, in contrast to active visit detection using explicit user signals (such as on-site check-in data confirmed by the user), is a passive visit detection of data from various sensors on the mobile device. It depends on a collective. Analysis of data from various mobile device sensors increases the accuracy and efficiency of visit detection over traditional approaches that only use geographic coordinate system data. Although the on-site detection techniques described herein are described in the context of passive visit detection, it is noted that such techniques may be applied in other contexts. The trader will recognize.

複数の態様においては、モバイルデバイスは、1つまたは複数のセンサを含むことが可能である。例示的なセンサは、GPSセンサ、Wi-Fiセンサ、近接センサ、加速度計、周囲温度センサ、ジャイロスコープ、光センサ、磁力計、ホールセンサ、音響センサ、タッチスクリーンセンサなどを含むことが可能である。モバイルデバイスは、モバイルデバイスがユーザによって使用されているおよび/または運ばれているときにセンサによって検知されるデータをモニタすることが可能である。モバイルデバイスは、移動イベント、購入イベント、情報配信イベント、現場チェックインイベント等などのイベントを検知することも可能である。いくつかの態様においては、イベントの検知は、センサデータが収集および処理されるようにすることが可能である。センサデータを処理することは、センサデータを解析して1つもしくは複数の現場および/または関連付けられている現場データを識別することを含むことが可能である。識別された現場/現場データは、ジオフェンスを設定されているエリアにおけるイベントおよび/またはユーザアクティビティーに対応する候補現場のセットを識別するために分析されることが可能である。「ジオフェンスを設定する」は、本明細書において使用される際には、モバイルデバイスの地理的ロケーションの周囲に仮想の境界を動的に生成することを指すことが可能である。候補現場のセットは、特徴のセットを特定するために分析されることが可能である。特徴のセットは、それぞれの候補現場に関する1つまたは複数の特徴ベクトルを生成するために使用されることが可能である。特徴ベクトルは、本明細書において使用される際には、1つまたは複数のオブジェクトを表す数値特徴のn次元ベクトルを指すことが可能である。特徴ベクトルは、決定ロジック、1つもしくは複数のルールセット、またはマシン学習モデルなどの1つまたは複数のデータ評価ユーティリティーに適用されること、またはそれらのデータ評価ユーティリティーを生成するために使用されることが可能である。モデルは、本明細書において使用される際には、1つもしくは複数のキャラクターシーケンス、クラス、オブジェクト、結果セット、もしくはイベントにわたる確率分布を特定するために、および/または1つもしくは複数の予測子から応答値を予測するために使用されることが可能である予測または統計言語モデルを指すことが可能である。複数の例においては、モデルは、ルールベースのモデル、マシン学習リグレッサー、マシン学習分類子、ニューラルネットワークなどであることが可能である。   In aspects, the mobile device can include one or more sensors. Exemplary sensors can include GPS sensors, Wi-Fi sensors, proximity sensors, accelerometers, ambient temperature sensors, gyroscopes, optical sensors, magnetometers, hall sensors, acoustic sensors, touch screen sensors, and the like. . The mobile device can monitor data sensed by the sensor as the mobile device is being used and / or carried by the user. The mobile device can also detect events such as a mobile event, a purchase event, an information distribution event, a field check-in event, and the like. In some aspects, detection of the event can cause sensor data to be collected and processed. Processing the sensor data can include analyzing the sensor data to identify one or more sites and / or associated site data. The identified site / site data can be analyzed to identify a set of candidate sites corresponding to events and / or user activities in the geofenced area. "Setting a geofence" as used herein can refer to dynamically creating a virtual boundary around a geographic location of a mobile device. The set of candidate sites can be analyzed to identify a set of features. The set of features can be used to generate one or more feature vectors for each candidate site. A feature vector, as used herein, can refer to an n-dimensional vector of numerical features representing one or more objects. The feature vector is applied to or used to generate one or more data evaluation utilities, such as decision logic, one or more rule sets, or machine learning models Is possible. A model, as used herein, is used to identify a probability distribution over one or more character sequences, classes, objects, result sets, or events, and / or one or more predictors. Can refer to a predictive or statistical language model that can be used to predict response values from In some examples, the model can be a rule-based model, a machine learning regressor, a machine learning classifier, a neural network, and so on.

複数の態様においては、データ評価ユーティリティーは、特徴ベクトルを使用して候補現場のリストに関する信頼性メトリックを生成することが可能である。信頼性メトリックは、候補現場が座標の特定のセットまたはイベントに対応する可能性を示すことが可能である。複数の例においては、候補現場のリストは、1つまたは複数の基準(信頼性メトリックなど)に従ってランク付けされること、およびユーザインターフェースを介して提示されることが可能である。いくつかの態様においては、候補現場のリストは、候補現場選択の精度および/もしくは信頼性を高めるために、または候補現場選択の数を減らすために較正されることが可能である。較正は、ヒューリスティックおよび1つまたは複数のしきい値比較の使用を含むことが可能である。複数の例においては、較正は、候補現場のリストからの上位「N」個の現場の選択という結果になることが可能である。上位「N」個の現場のうちの1つまたは複数は、ディスプレイインターフェースを介してユーザに提示されることが可能である。ディスプレイインターフェースは、1つまたは複数のユーザ選択を受信することを提供することが可能である。ユーザ選択は、上位「N」個の現場のリストをさらに較正するために使用されることが可能である。   In aspects, the data evaluation utility may use the feature vector to generate a reliability metric for the list of candidate sites. The reliability metric may indicate the likelihood that the candidate site corresponds to a particular set of coordinates or event. In some examples, the list of candidate sites can be ranked according to one or more criteria (such as reliability metrics) and presented via a user interface. In some aspects, the list of candidate sites can be calibrated to increase the accuracy and / or reliability of the candidate site selection or to reduce the number of candidate site selections. Calibration may include the use of heuristics and one or more threshold comparisons. In some examples, the calibration may result in the selection of the top "N" sites from a list of candidate sites. One or more of the top "N" sites can be presented to the user via the display interface. The display interface can provide for receiving one or more user selections. User selection can be used to further calibrate the list of top "N" sites.

したがって、本開示は、数ある例の中でも、受動的な訪問イベントを検知すること、現場ベースのジオフェンス設定を可能にすること、さまざまなモバイルデバイスセンサを使用した現場/ロケーションデータの収集を可能にすること、1つまたは複数のデータストアからの現場データおよびユーザデータの収集を可能にすること、現場ベースの特徴ベクトルを生成すること、マシン学習技術を適用して現場のリストに関する確率を特定すること、ユーザベースの否定情報を使用して現場選択を精選すること、現場どうしの間における相対的な訪問総数の測定を改善すること、現場リストを較正して低い確率の現場を除去すること、目的関数を使用して確率モデルの精度を評価すること、ならびに本開示の例を利用するアプリケーション/サービスに関する改善された効率および品質を含むがそれらには限定されない:複数の技術的な利益を提供する。   Thus, the present disclosure enables, among other examples, to detect passive visit events, enable site-based geofencing, and collect site / location data using various mobile device sensors Enable the collection of site and user data from one or more data stores, generate site-based feature vectors, apply machine learning techniques to identify probabilities for lists of sites Using site-based negative information to refine site selection; improving the measurement of relative visits between sites; calibrating the site list to remove low-probability sites Assessing the accuracy of stochastic models using objective functions, and applications / services utilizing the examples of this disclosure Including improved efficiency and quality for but are not limited to: providing a plurality of technical benefits.

図1は、本明細書において記述されている現場検知のための例示的なシステムの概観を示している。提示されている例示的なシステム100は、現場検知システムに関する統合された全体を形成するために対話する相互に依存したコンポーネントどうしの組合せである。システムのコンポーネントは、ハードウェアコンポーネント、または、システムのハードウェアコンポーネント上で実施されるおよび/もしくはそれらのハードウェアコンポーネントによって実行されるソフトウェアであることが可能である。複数の例においては、システム100は、ハードウェアコンポーネント(たとえば、オペレーティングシステム(OS)を実行する/稼働させるために使用される)、およびハードウェア上で稼働するソフトウェアコンポーネント(たとえば、アプリケーション、アプリケーションプログラミングインターフェース(API)、モジュール、仮想マシン、ランタイムライブラリなど)のうちのいずれかを含むことが可能である。一例においては、例示的なシステム100は、ソフトウェアコンポーネントが稼働するための環境を提供すること、動作のための制約セットに従うこと、およびシステム100のリソースまたは設備を利用することが可能であり、その場合、コンポーネントは、1つまたは複数の処理デバイス上で稼働するソフトウェア(たとえば、アプリケーション、プログラム、モジュールなど)であることが可能である。たとえば、ソフトウェア(たとえば、アプリケーション、動作命令、モジュールなど)は、コンピュータ、モバイルデバイス(たとえば、スマートフォン/電話、タブレット、ラップトップ、携帯情報端末(PDA)など)、および/またはその他の任意の電子デバイスなどの処理デバイス上で実行されることが可能である。処理デバイス動作環境の一例としては、図4において示されている例示的な動作環境を参照されたい。その他の例においては、本明細書において開示されているシステムのコンポーネントどうしは、複数のデバイスにわたって分散されることが可能である。たとえば、入力は、クライアントデバイス上で入力されることが可能であり、情報は、1つまたは複数のサーバデバイスなど、ネットワーク内のその他のデバイスから処理またはアクセスされることが可能である。   FIG. 1 shows an overview of an exemplary system for in-situ sensing as described herein. The exemplary system 100 presented is a combination of interdependent components that interact to form an integrated whole for a field sensing system. The components of the system can be hardware components or software implemented on and / or executed by the hardware components of the system. In some examples, system 100 includes hardware components (e.g., used to run / run an operating system (OS)) and software components running on hardware (e.g., applications, application programming). Interfaces (APIs), modules, virtual machines, runtime libraries, etc.). In one example, the example system 100 can provide an environment for software components to operate, follow a set of constraints for operation, and utilize the resources or facilities of the system 100, In some cases, a component may be software (eg, an application, a program, a module, etc.) running on one or more processing devices. For example, software (e.g., applications, operating instructions, modules, etc.) may be a computer, mobile device (e.g., smartphone / phone, tablet, laptop, personal digital assistant (PDA), etc.), and / or any other electronic device And so on. For an example of a processing device operating environment, see the exemplary operating environment shown in FIG. In other examples, components of the systems disclosed herein may be distributed across multiple devices. For example, the input can be entered on a client device and the information can be processed or accessed from other devices in the network, such as one or more server devices.

一例として、システム100は、クライアントデバイス102、分散型ネットワーク104、現場分析システム106、およびストレージ108を含む。システム100などのシステムのスケールは変わることが可能であり、図1において記述されているよりも多くのまたは少ないコンポーネントを含むことが可能であるということを当業者なら理解するであろう。いくつかの例においては、たとえば、システム100のコンポーネントどうしが分散型ネットワークの1つまたは複数のデバイスにわたって分散されることが可能である場合には、システム100のコンポーネントどうしの間におけるインターフェーシングがリモートで生じることが可能である。   As an example, system 100 includes a client device 102, a distributed network 104, a site analysis system 106, and storage 108. One skilled in the art will appreciate that the scale of a system, such as system 100, can vary and can include more or fewer components than described in FIG. In some examples, interfacing between components of system 100 may be remote, for example, if components of system 100 can be distributed across one or more devices in a distributed network. Can occur.

クライアントデバイス102は、1つまたは複数の現場に関連したセンサデータを収集するように構成されることが可能である。複数の態様においては、クライアントデバイス102は、1つもしくは複数のセンサを含むこと、またはそれらのセンサにアクセスできることが可能である。それらのセンサは、クライアントデバイス102に関するセンサデータ、たとえば、GPS座標およびジオロケーションデータ、位置データ(水平精度および/または垂直精度など)、Wi-Fi情報、OS情報および設定、ハードウェア情報、信号強度、加速度計データ、時間情報などを検知および/または生成するように動作できることが可能である。クライアントデバイス102は、センサデータを収集および処理することが可能である。いくつかの態様においては、クライアントデバイス102は、イベントを検知したことまたは1つもしくは複数の基準の充足に応答してセンサデータを収集および/または処理することが可能である。たとえば、センサデータは、クライアントデバイス102による検知された停止に応答して収集されることが可能である。複数の例においては、停止を検知することは、1つまたは複数のマシン学習技術またはアルゴリズム、たとえば、期待値最大化(EM)アルゴリズム、隠れマルコフモデル(HMM)、ビタビアルゴリズム、フォワードバックワードアルゴリズム、固定ラグスムージングアルゴリズム、バウムウェルチアルゴリズムなどの使用を含むことが可能である。センサデータを収集することは、さまざまなセンサからのデータをアグリゲートすること、それらのデータを1つもしくは複数の基準によって編成すること、および/またはクライアントデバイス102にとってアクセス可能なデータストア(図示せず)にそれらのセンサデータを格納することを含むことが可能である。収集されたセンサデータは、分散型ネットワーク104を介して現場分析システム106などの分析ユーティリティーに提供されること(または分析ユーティリティーによってアクセスできること)が可能である。   Client device 102 can be configured to collect sensor data associated with one or more sites. In aspects, the client device 102 may include or have access to one or more sensors. These sensors provide sensor data about the client device 102, such as GPS coordinates and geolocation data, location data (such as horizontal and / or vertical accuracy), Wi-Fi information, OS information and settings, hardware information, signal strength , Can be operable to detect and / or generate accelerometer data, time information, and the like. Client device 102 is capable of collecting and processing sensor data. In some aspects, the client device 102 may collect and / or process sensor data in response to detecting an event or satisfying one or more criteria. For example, sensor data may be collected in response to a detected outage by client device 102. In some examples, detecting an outage may include one or more machine learning techniques or algorithms, such as an Expectation Maximization (EM) algorithm, a Hidden Markov Model (HMM), a Viterbi algorithm, a forward backward algorithm, It can include the use of a fixed lag smoothing algorithm, a Baum Welch algorithm, and the like. Collecting sensor data may include aggregating data from various sensors, organizing those data by one or more criteria, and / or a data store accessible to client device 102 (shown in FIG. And storing those sensor data. The collected sensor data can be provided (or accessible by) an analysis utility, such as a field analysis system 106, via the distributed network 104.

現場分析システム106は、1つまたは複数の現場リストを作成するように構成されることが可能である。複数の態様においては、現場分析システム106は、センサデータの1つまたは複数のセットにアクセスできることが可能である。現場分析システム106は、センサデータを処理して現場の候補セットを識別することが可能である。センサデータを処理することは、センサデータを解析してクライアントデバイス102の1つまたは複数のロケーションを識別することを含むことが可能である。クライアントデバイス102の1つまたは複数のロケーションは、現場の候補セットをフェッチするために、k最近傍アルゴリズムなどの分類アルゴリズムに適用されることが可能である。k最近傍アルゴリズムは、本明細書において使用される際には、オブジェクトが自分の近傍の多数決によって分類されて、そのオブジェクトが、自分のk個の最近傍の間で最も共通しているクラスに割り振られる分類(または回帰)技術を指すことが可能である。複数の例においては、分類アルゴリズムを使用して生成された現場の候補セットは、クライアントデバイス102に関して報告されたロケーションに近い、またはそのロケーションの特定の近接度内にある現場を含むことが可能である。   The site analysis system 106 can be configured to create one or more site lists. In embodiments, the site analysis system 106 may have access to one or more sets of sensor data. The site analysis system 106 can process the sensor data to identify a candidate set of sites. Processing the sensor data may include analyzing the sensor data to identify one or more locations of the client device 102. One or more locations of the client device 102 can be applied to a classification algorithm, such as a k-nearest neighbor algorithm, to fetch a candidate set of scenes. A k-nearest neighbor algorithm, as used herein, is where an object is classified by majority of its neighbors and the object is placed in the class that is the most common among its k nearest neighbors. It is possible to refer to the classification (or regression) technique that is assigned. In some examples, the candidate set of sites generated using the classification algorithm may include sites that are near or within a certain proximity of the location reported for the client device 102. is there.

現場分析システム106はさらに、1つまたは複数の特徴ベクトルを生成するように構成されることが可能である。複数の態様においては、現場分析システム106は、現場の候補セット内の1つまたは複数の現場に関する特徴ベクトルを生成することが可能である。特徴ベクトルを生成することは、現場に関連付けられているセンサデータを1つまたは複数の知識ソースからの情報と組み合わせることを含むことが可能である。複数の例においては、それらの情報は、これまでのおよび/または予測された現場およびユーザデータを含むことが可能である。現場分析システム106は、1つまたは複数の確率データモデルまたは予測アルゴリズム、たとえばデシジョンツリーを使用して特徴ベクトルを評価することが可能である。デシジョンツリー学習技術の非網羅的なリストは、分類ツリー、回帰ツリー、ブーステッドツリー、ブートストラップアグリゲーテッドツリー、ローテーションフォレストを含む。複数の例においては、特徴ベクトルを評価することは、1つまたは複数の勾配ブースティング技術の使用を含むことが可能である。勾配ブースティングは、本明細書において使用される際には、分類および回帰のための1つまたは複数のマシン学習技術を指すことが可能であり、これは、弱い予測モデルどうしの集合の形態の予測モデルを作成する。勾配ブースティングは、現場の年数、現場の人気、その他の現場への近接度、現場の選抜/選択のこれまでの精度、以前の現場訪問、黙示的/明示的なユーザフィードバック等などのファクタを組み込むことが可能である。特徴ベクトルの評価は、現場の候補セット内の現場に関するスコアまたは確率の計算につながることが可能である。それらのスコア/確率は、特徴ベクトル(もしくはその特徴)に割り振られること、または現場の候補セット内の対応する現場に割り振られることが可能である。そのようなスコア/確率は、現場が、クライアントデバイス102によって報告されたロケーションデータに対応する可能性を表すことが可能である。現場の候補セット、特徴ベクトルおよび関連付けられている特徴データ、ならびに/またはスコア/確率は、ストレージ108などのデータストア内に格納されることが可能である。   In-situ analysis system 106 can be further configured to generate one or more feature vectors. In aspects, the site analysis system 106 may generate a feature vector for one or more sites in a candidate set of sites. Generating the feature vector can include combining sensor data associated with the scene with information from one or more knowledge sources. In some examples, the information may include previous and / or predicted site and user data. In-situ analysis system 106 may evaluate the feature vectors using one or more probabilistic data models or prediction algorithms, for example, a decision tree. A non-exhaustive list of decision tree learning techniques includes classification trees, regression trees, boosted trees, bootstrap aggregated trees, and rotation forests. In some examples, evaluating the feature vector may include using one or more gradient boosting techniques. Gradient boosting, as used herein, can refer to one or more machine learning techniques for classification and regression, which are in the form of sets of weak predictive models. Create a predictive model. Gradient boosting involves factors such as site age, site popularity, proximity to other sites, historical accuracy of site selection / selection, previous site visits, implicit / explicit user feedback, etc. It is possible to incorporate. Evaluation of the feature vector can lead to the calculation of a score or probability for a site in the candidate set of sites. These scores / probabilities can be assigned to a feature vector (or its features) or to the corresponding sites in the candidate set of sites. Such a score / probability may indicate the likelihood that the scene corresponds to the location data reported by the client device 102. The candidate set of sites, feature vectors and associated feature data, and / or scores / probabilities may be stored in a data store, such as storage 108.

現場分析システム106はさらに、現場の候補セットを較正するように構成されることが可能である。複数の態様においては、現場の候補セットを較正することは、それぞれの候補現場に関するスコア/確率をしきい値に照らして評価することを含むことが可能である。しきい値を下回るスコア/確率を有している現場は、現場の候補セットから除去されること、または何らかの様式で減らされることが可能である。複数の例においては、しきい値を特定することは、ヒューリスティックの1つまたは複数のセットを現場の候補セットに照らして評価して現場訪問分布のセットを特定することを含むことが可能である。現場訪問分布は、現場の候補セット内の現場のうちの1つもしくは複数、および/またはクライアントデバイス102の報告されたロケーションに関連付けられている1つもしくは複数の現場を含むことが可能である。現場分析システム106は、現場訪問分布のセット(またはアグリゲートされた現場訪問分布)を、ラベル付けされているおよび/またはラベル付けされていないトレーニングデータのセットと比較することが可能である。その比較に基づいて、クライアントデバイス102によって報告されたロケーションデータに対応する可能性が低い現場を識別するしきい値が特定される。いくつかの態様においては、現場の候補セットを較正することはさらに、上位「N」個の現場のリストを特定することを含むことが可能である。上位「N」個の現場のリストは、モバイルデバイスのロケーションに対応する可能性が最も高い現場候補を表すことが可能である。複数の例においては、上位「N」個の現場のリストを特定することは、それぞれの候補現場に関するスコア/確率をしきい値に照らして評価することを含むことが可能である。たとえば、最も高いスコア/確率を有している上位3つ(たとえば、「N」=3)の現場が選択されることが可能である。少なくとも1つの例においては、上位「N」個の現場のリストを特定することはさらに、ユーザ選択データを受信することを含むことが可能である。たとえば、現場分析システム106にとってアクセス可能なインターフェースコンポーネントを介してユーザに現場のセットが提示されることが可能である。現場分析システム106は、現場のセット内の1つまたは複数の現場の選択を受信することが可能である。選択された現場は、上位「N」個の現場を表すことが可能である。代替として、選択された現場は、上位「N」個の現場のリストから除去されるべきである現場、または上位「N」個の現場のリストのランキングに対する調整を表すことが可能である。上位「N」個の現場のリストは、ストレージ108内に格納されること、および/またはディスプレイインターフェースを介して提示されることが可能である。   The site analysis system 106 can be further configured to calibrate a candidate set of sites. In aspects, calibrating the candidate set of sites may include evaluating a score / probability for each candidate site against a threshold. Sites that have a score / probability below the threshold can be removed from the candidate set of sites or reduced in some manner. In some examples, identifying the threshold may include evaluating one or more sets of heuristics against a candidate set of sites to identify a set of site visit distributions. . The site visit distribution may include one or more of the sites in the candidate set of sites and / or one or more sites associated with the reported location of the client device 102. The site analysis system 106 may compare the set of site visit distributions (or aggregated site visit distributions) to a set of labeled and / or unlabeled training data. Based on the comparison, a threshold is identified that identifies sites that are unlikely to correspond to the location data reported by the client device 102. In some aspects, calibrating the candidate set of sites may further include identifying a list of the top "N" sites. The list of top "N" sites may represent the site candidates most likely to correspond to the location of the mobile device. In some examples, identifying a list of the top "N" sites may include evaluating a score / probability for each candidate site against a threshold. For example, the top three sites (e.g., "N" = 3) with the highest score / probability may be selected. In at least one example, identifying the list of the top "N" locations can further include receiving user-selected data. For example, a set of sites can be presented to a user via an interface component accessible to the site analysis system 106. Site analysis system 106 may receive a selection of one or more sites in a set of sites. The selected sites may represent the top "N" sites. Alternatively, the selected site may represent a site that should be removed from the list of top "N" sites, or an adjustment to the ranking of the list of top "N" sites. A list of the top "N" sites can be stored in storage 108 and / or presented via a display interface.

現場分析システム106はさらに、1つまたは複数の確率モデルの精度を評価するように構成されることが可能である。複数の態様においては、現場分析システム106は、トレーニングデータのセットにアクセスできることが可能である。トレーニングデータは、たとえば、以前に受信された入力データ(たとえば、センサデータ、特徴ベクトル、対応する特徴データなど)および/または特定もしくは選択された現場出力を含むことが可能である。現場分析システム106は、入力データを1つまたは複数の確率モデルに適用することが可能である。それぞれの確率モデルの出力は、1つまたは複数の確率モデルの精度または有効性を特定するために使用される目的関数に提供されることが可能である。複数の例においては、目的関数は、さまざまなパラメータを使用して無数の方法で定義されることが可能である。目的関数は、確率モデルの出力がトレーニングデータ内の対応する出力にどれぐらいの近さでマッチしているかを表すスコアを計算することが可能である。計算されたスコアに基づいて、現場分析システム106は、1つまたは複数の確率モデルをランク付けすることが可能である。一例においては、最も高いランキングの確率モデルが、特徴ベクトルのセットが受信された場合に使用するために選択されることが可能である。   In-situ analysis system 106 can be further configured to evaluate the accuracy of one or more probabilistic models. In aspects, the site analysis system 106 may have access to a set of training data. Training data can include, for example, previously received input data (eg, sensor data, feature vectors, corresponding feature data, etc.) and / or specific or selected field outputs. The site analysis system 106 can apply the input data to one or more probabilistic models. The output of each probability model can be provided to an objective function that is used to identify the accuracy or validity of one or more probability models. In some examples, the objective function can be defined in a myriad of ways using various parameters. The objective function can calculate a score that represents how close the output of the probabilistic model matches the corresponding output in the training data. Based on the calculated scores, the site analysis system 106 can rank one or more probabilistic models. In one example, the highest ranking probability model can be selected for use when a set of feature vectors is received.

図2は、本明細書において記述されている、現場検知のための例示的な入力処理デバイス200の概観を示している。入力処理デバイス200によって実施される現場検知技術は、図1において記述されている現場検知技術およびコンテンツを含むことが可能である。代替例においては、単一のシステム(プロセッサおよび/またはメモリなどの1つまたは複数のコンポーネントを含む)が、システム100および200においてそれぞれ記述されている処理を実行することが可能である。   FIG. 2 shows an overview of an exemplary input processing device 200 for in-situ sensing as described herein. Site detection techniques implemented by the input processing device 200 may include the site detection techniques and content described in FIG. In the alternative, a single system (including one or more components such as a processor and / or memory) may perform the processes described in systems 100 and 200, respectively.

図2を参照すると、入力処理ユニット200は、取り出しエンジン202、特徴エンジン204、確率モデルエンジン206、ユーザインターフェース208、および較正エンジン210を含むことが可能である。取り出しエンジン202は、センサデータのセットに関する1つまたは複数の特徴セットを生成するように構成されることが可能である。複数の態様においては、取り出しエンジン202は、モバイルデバイスから収集されたセンサデータのセットにアクセスできることが可能である。センサデータは、モバイルデバイスに関連付けられているユーザまたは物理的な環境からの入力を表すことが可能である。センサデータは、モバイルデバイスの(またはモバイルデバイスにとってアクセス可能な)さまざまなセンサから収集された入力を含むことが可能である。いくつかの態様においては、取り出しエンジン202は、イベントを検知したことまたは1つもしくは複数の基準の充足に応答してセンサデータを処理することが可能である。たとえば、取り出しエンジン202は、モバイルデバイスが移動を停止したという表示を受信すること、またはその旨をその他の形で検知することが可能である。停止を検知することは、時間とともにセンサデータをサンプリングすること、それらのセンサデータを特徴付けること、およびそれらの特徴付けられたデータに停止検知モデルを適用して、モバイルデバイスが移動を停止したかどうかを特定することを含むことが可能である。センサデータを処理することは、1つまたは複数の個々のセンサまたはセンサタイプに関するセンサデータを解析して、現場および/または関連付けられている現場データを識別することを含むことが可能である。複数の態様においては、現場データは、候補現場のセットを取り出すために使用されることが可能である。たとえば、現場データは、k最近傍アルゴリズムなどの分類アルゴリズムに適用されることが可能である。分類アルゴリズムは、モバイルデバイスに関して報告されたロケーションの特定の近接度または密度分布内にある候補現場のリストを特定することが可能である。別の例においては、地理座標のセット(またはその他のジオロケーション識別子)が、地理マッピングサービスなどの現場特定ユーティリティーに提供されることが可能である。そのような例においては、現場の数は、それらの現場を提示するディスプレイエリアのサイズに依存することが可能である。   Referring to FIG. 2, the input processing unit 200 may include a retrieval engine 202, a feature engine 204, a stochastic model engine 206, a user interface 208, and a calibration engine 210. Retrieval engine 202 may be configured to generate one or more feature sets for the set of sensor data. In aspects, the retrieval engine 202 may be able to access a set of sensor data collected from a mobile device. The sensor data can represent input from a user or a physical environment associated with the mobile device. The sensor data can include inputs collected from various sensors of the mobile device (or accessible to the mobile device). In some aspects, the retrieval engine 202 can process the sensor data in response to detecting an event or satisfying one or more criteria. For example, the retrieval engine 202 may receive, or otherwise detect, an indication that the mobile device has stopped moving. Detecting outages involves sampling sensor data over time, characterizing those sensor data, and applying an outage detection model to those characterized data to determine if the mobile device has stopped moving Can be specified. Processing the sensor data can include analyzing the sensor data for one or more individual sensors or sensor types to identify the site and / or associated site data. In aspects, the site data can be used to retrieve a set of candidate sites. For example, the field data can be applied to a classification algorithm, such as a k-nearest neighbor algorithm. The classification algorithm can identify a list of candidate sites that are within a particular proximity or density distribution of the location reported for the mobile device. In another example, a set of geographic coordinates (or other geolocation identifier) can be provided to a site-specific utility, such as a geographic mapping service. In such an example, the number of sites may depend on the size of the display area presenting those sites.

特徴エンジン204は、候補現場のリストに関する特徴ベクトルを生成するように構成されることが可能である。複数の態様においては、特徴エンジン204は、候補現場のリストにアクセスできることが可能である。特徴エンジン204は、それぞれの候補現場を、その候補現場に関連付けられている情報に相関付けることが可能である。たとえば、候補現場は、人気のある付近の現場、同様の名前もしくはテーマが付けられている現場、またはその他の形で関連した現場に相関付けられることが可能である。候補現場に関する現場データおよび相関付けられている現場データが識別および使用されて、それぞれの識別された現場に関する特徴ベクトルを生成することが可能である。一例においては、特徴ベクトルを生成することは、同様の特徴どうしまたは特徴カテゴリーどうしを編成すること、対応する特徴値を正規化すること、および正規化された特徴値を特徴ベクトルに付加することを含むことが可能である。複数の態様においては、特徴ベクトルは、現場に関するセンサデータがその現場に関するこれまでのデータにどれぐらいよくマッチしているかを表すことが可能である。一例として、モバイルデバイスは、検知された停止中にWi-Fiスキャンを実行することが可能である。そのWi-Fiスキャンデータがそれぞれの候補現場のWi-Fiスキャンデータに比較されて、特徴スコアを生成することが可能である。特徴スコアは、Wi-Fiデータが候補現場のそれぞれにどれぐらいよくマッチしているかを表すことが可能である。   The feature engine 204 can be configured to generate a feature vector for the list of candidate sites. In aspects, the feature engine 204 may have access to a list of candidate sites. Feature engine 204 may correlate each candidate site with information associated with the candidate site. For example, the candidate sites may be correlated to popular nearby sites, sites with similar names or themes, or other related sites. Site data for the candidate site and the correlated site data can be identified and used to generate a feature vector for each identified site. In one example, generating a feature vector includes organizing similar features or feature categories, normalizing corresponding feature values, and adding the normalized feature values to the feature vector. Can be included. In aspects, the feature vector may indicate how well the sensor data for the site matches previous data for the site. As an example, the mobile device can perform a Wi-Fi scan during a detected outage. The Wi-Fi scan data can be compared to the Wi-Fi scan data of each candidate site to generate a feature score. The feature score can indicate how well the Wi-Fi data matches each of the candidate sites.

確率モデルエンジン206は、1つまたは複数のモデルを生成および/またはトレーニングするように構成されることが可能である。複数の態様においては、確率モデルエンジン206は、1つまたは複数の特徴ベクトルにアクセスできることが可能である。確率モデルエンジン206は、1つまたは複数の勾配ブースティング技術を適用して、デシジョンツリーの集合を含む確率モデルを生成することが可能である。勾配ブースティング技術は、現場の年数、現場の人気、その他の現場への近接度、現場の選抜/選択のこれまでの精度、以前の現場訪問等などのファクタを組み込むことが可能である。少なくとも1つの例においては、勾配ブースティング技術は、明示的なユーザフィードバックを組み込むことも可能である。たとえば、現場ロケーションの明示的なユーザ確認または否定を含む結果セットが使用されて、確率モデル206を生成することも可能である。いくつかの態様においては、確率モデルは、1つまたは複数の特徴ベクトルにアクセスできることが可能である。特徴ベクトルは、現場の候補セットに関する特徴データおよび/または特徴スコアを含むことが可能である。確率モデルは、入力として特徴ベクトルを受信することが可能であり、現場の候補セット内のそれぞれの現場に関する信頼性スコアまたは確率を出力することが可能である。信頼性スコア/確率は、現場が座標の特定のセットまたはイベントに対応する可能性を示すことが可能である。少なくとも1つの例においては、確率モデルは、現場の候補セット内の現場に関する確率分布を生成することが可能である。確率分布は、たとえば確率密度関数を使用して、確率または信頼性スコアを現場リスト内のそれぞれの現場に割り振ることが可能である。   The probabilistic model engine 206 can be configured to generate and / or train one or more models. In aspects, the probabilistic model engine 206 may have access to one or more feature vectors. The probabilistic model engine 206 can apply one or more gradient boosting techniques to generate a probabilistic model that includes a set of decision trees. Gradient boosting techniques can incorporate factors such as age of the site, site popularity, proximity to other sites, historical accuracy of site selection / selection, previous site visits, and the like. In at least one example, gradient boosting techniques can also incorporate explicit user feedback. For example, a result set that includes explicit user confirmation or negation of the site location may be used to generate the probability model 206. In some aspects, the probability model may have access to one or more feature vectors. The feature vector may include feature data and / or a feature score for a candidate set of sites. The probabilistic model can receive a feature vector as input and can output a confidence score or probability for each site in the candidate set of sites. The confidence score / probability can indicate the likelihood that the scene corresponds to a particular set of coordinates or event. In at least one example, the probabilistic model can generate a probability distribution for sites in a candidate set of sites. The probability distribution may assign a probability or reliability score to each site in the site list, for example, using a probability density function.

複数の態様においては、確率モデルエンジン206はさらに、1つまたは複数の確率モデルの精度を評価するように構成されることが可能である。確率モデルエンジン206は、たとえば、以前に受信された入力データ(たとえば、センサデータ、特徴ベクトル、特徴スコアなど)、明示的なユーザフィードバック、ラベル付けされている現場出力、現場特定分析などを含むトレーニングデータのセットにアクセスできることが可能である。確率モデルエンジン206は、入力データを1つまたは複数の確率モデルに適用することが可能である。確率モデルは、以前に生成されている場合や、最近生成された場合があり、または確率モデルエンジン206による評価の一環として生成される場合がある。それぞれの確率モデルの出力は、1つまたは複数の確率モデルの精度または有効性を特定するために使用される目的関数に提供されることが可能である。複数の例においては、目的関数は、評価される基準および/またはパラメータを定義することが可能である。目的関数は、評価される確率モデルの数およびタイプを定義することが可能である。複数の態様においては、目的関数は、それぞれの確率モデルの出力をトレーニングデータ内の出力と比較することが可能である。その比較に基づいて、目的関数は、確率モデル出力がトレーニングデータ出力にどれぐらいの近さでマッチしているかを表すスコアを計算することが可能である。最も高いランキングの確率モデルが記録されて、特徴ベクトルがその後に受信された場合に使用するために選択されることが可能である。   In aspects, the stochastic model engine 206 can be further configured to evaluate the accuracy of one or more stochastic models. The probabilistic model engine 206 may include, for example, training including previously received input data (eg, sensor data, feature vectors, feature scores, etc.), explicit user feedback, labeled field outputs, field-specific analysis, etc. It is possible to access a set of data. The probabilistic model engine 206 can apply the input data to one or more probabilistic models. The probabilistic model may have been previously generated, recently generated, or may be generated as part of evaluation by the probabilistic model engine 206. The output of each probability model can be provided to an objective function that is used to identify the accuracy or validity of one or more probability models. In some examples, the objective function can define criteria and / or parameters to be evaluated. The objective function can define the number and type of stochastic models evaluated. In some aspects, the objective function may compare the output of each probability model with the output in the training data. Based on the comparison, the objective function can calculate a score that indicates how close the probabilistic model output matches the training data output. The highest ranking probabilistic model can be recorded and selected for use if the feature vector is subsequently received.

ユーザインターフェース208は、現場リストを提示するように構成されることが可能である。複数の態様においては、ユーザインターフェース208は、現場リストおよび/またはそれに関連付けられているデータをユーザが見ること、ナビゲートすること、および操作することを可能にすることができる。複数の例においては、ユーザインターフェース208は、テキスト形式のリスト、グラフィカルオブジェクト(たとえば、地理的地図または同様の視覚化)、レポートなどとして現場リストを提示することが可能である。ユーザインターフェース208は、現場リストと対話するための設定または構成へのアクセスを提供することも可能である。ユーザインターフェース208はさらに、トレーニングデータを確率モデルエンジン206に提供するように構成されることが可能である。複数の態様においては、ユーザインターフェース208は、トレーニングデータの1つまたは複数のセットへのアクセスを提供する。トレーニングデータは、入力処理ユニット200上にローカルに、またはリモートデバイス上に配置されることが可能である。複数の例においては、トレーニングデータは、ラベル付けされているまたはラベル付けされていない入力信号であることが可能である。ラベル付けされているデータは、センサ値ならびに対応するラベル付けされているイベントおよび現場を含むことが可能である。トレーニングデータが確率モデルに適用されて、より正確なまたは関連している現場リストを作成するように確率モデルをトレーニングすることが可能である。複数の例においては、より正確なまたは関連している現場リストを作成することは、ラベル付けされているデータのセット内で最も関連しているまたは内容を示しているパラメータ/特徴を特定することを含むことが可能である。そのような特定は、パラメータ/特徴に重みを適用すること、および/または現場リスト分析からパラメータ/特徴を除去することを含むことが可能である。   The user interface 208 can be configured to present a venue list. In aspects, the user interface 208 may allow a user to view, navigate, and manipulate the site listing and / or data associated therewith. In some examples, the user interface 208 may present the site listing as a textual list, a graphical object (eg, a geographic map or similar visualization), a report, or the like. The user interface 208 may also provide access to settings or configurations for interacting with the site list. User interface 208 can be further configured to provide training data to stochastic model engine 206. In aspects, the user interface 208 provides access to one or more sets of training data. The training data can be located locally on the input processing unit 200 or on a remote device. In some examples, the training data may be a labeled or unlabeled input signal. The labeled data may include the sensor values as well as the corresponding labeled events and locations. Training data can be applied to the stochastic model to train the stochastic model to create a more accurate or relevant site list. In some examples, creating a more accurate or relevant site list is to identify the parameters / features that are most relevant or descriptive within the set of labeled data Can be included. Such identification may include applying weights to the parameters / features and / or removing the parameters / features from the site list analysis.

較正エンジン210は、現場リストを精選するように構成されることが可能である。複数の態様においては、較正エンジン210は、1つまたは複数の現場リストにアクセスできることが可能である。較正エンジン210は、1つまたは複数の処理技術を現場リストに適用して、現場選択の精度および/もしくは信頼性を高めること、または現場選択の数を減らすことが可能である。たとえば、較正エンジン210は、現場の候補セットに関連付けられている1つまたは複数の確率または信頼性スコアをしきい値と比較することが可能である。しきい値は、現場の候補セット内に含まれるべきである現場候補に関する最小の確率/信頼性スコアを表すことが可能である。特定の例として、1%を下回る確率/信頼性スコアを有している現場は、現場の候補セットから除去されることが可能である。複数の態様においては、しきい値は、たとえば、ルールセット、ヒューリスティックのセット、またはその他の分析技術を現場の候補セットに適用して現場訪問分布を生成することによって特定または選択されることが可能である。現場訪問分布は、1つまたは複数の現場がある期間の間に訪問を報告した頻度を識別することが可能である。いくつかの態様においては、較正エンジン210は、現場訪問分布をセットトレーニングデータと比較することが可能である。トレーニングデータは、ラベル付けされているまたはラベル付けされていない現場データ、たとえば、現場、チェックイン情報、ユーザデータおよび信号、確率/信頼性スコアなどを含むことが可能である。トレーニングデータは、現場の確率/信頼性スコアおよび/または訪問分布を評価するために使用されることが可能である。その評価に基づいて、しきい値が選択されることが可能である。しきい値は、ある確率/信頼性スコアを示すことが可能であり、その確率/信頼性スコアよりも下では、現場が、モバイルデバイスによって報告されたロケーションデータに対応する可能性は低い。しきい値は、上位「N」個の現場のリストを特定するために使用されることが可能である。上位「N」個の現場のリストは、モバイルデバイスのロケーションに対応する可能性が最も高い現場候補を表すことが可能である。複数の例においては、上位「N」個の現場は、特定の数の現場結果を選択すること、特定の確率しきい値を上回る現場結果を選択することなどによって特定されることが可能である。   Calibration engine 210 may be configured to filter the site list. In aspects, the calibration engine 210 may have access to one or more site listings. The calibration engine 210 can apply one or more processing techniques to the site list to increase the accuracy and / or reliability of the site selection or reduce the number of site selections. For example, the calibration engine 210 may compare one or more probabilities or confidence scores associated with a candidate set of sites to a threshold. The threshold value may represent a minimum probability / reliability score for a site candidate that should be included in the site candidate set. As a specific example, sites having a probability / reliability score of less than 1% can be removed from the candidate set of sites. In aspects, the threshold may be specified or selected, for example, by applying a rule set, a set of heuristics, or other analytical techniques to a candidate set of sites to generate a site visit distribution. It is. The site visit distribution can identify the frequency with which one or more sites reported visits during a period of time. In some aspects, the calibration engine 210 can compare the site visit distribution with the set training data. The training data can include labeled or unlabeled site data, such as site, check-in information, user data and signals, probability / reliability scores, and the like. The training data can be used to assess the probability / reliability score and / or visit distribution of the site. Based on the evaluation, a threshold can be selected. The threshold may indicate a certain probability / reliability score, below which the scene is unlikely to correspond to location data reported by the mobile device. The threshold can be used to identify a list of the top "N" sites. The list of top “N” sites may represent the site candidates most likely to correspond to the location of the mobile device. In some examples, the top "N" sites can be identified by selecting a specific number of site results, selecting site results above a certain probability threshold, and so on. .

本明細書において開示されている態様によって採用されることが可能であるさまざまなシステムについて記述してきたが、本開示は次いで、本開示のさまざまな態様によって実行されることが可能である1つまたは複数の方法について記述する。複数の態様においては、方法300が、図1のシステム100などの例示的なシステムによって実行されることが可能である。複数の例においては、方法300は、オペレーション、プログラム、または命令を格納および実行するように構成されている少なくとも1つのプロセッサを含む入力処理ユニット200などのデバイス上で実行されることが可能である。しかしながら、方法300は、そのような例には限定されない。その他の例においては、方法300は、現場検知を実行するためのアプリケーションまたはサービス上で実行されることが可能である。少なくとも1つの例においては、方法300は、ウェブサービス/分散型ネットワークサービス(たとえばクラウドサービス)などの分散型ネットワークの1つまたは複数のコンポーネントによって実行されることが可能である(たとえば、コンピュータによって実施されるオペレーション)。   Having described various systems that can be employed by aspects disclosed herein, the present disclosure can then be implemented by one or more aspects that can be implemented by various aspects of the present disclosure. Describe multiple methods. In aspects, the method 300 may be performed by an exemplary system, such as the system 100 of FIG. In some examples, method 300 can be performed on a device such as input processing unit 200 that includes at least one processor configured to store and execute operations, programs, or instructions. . However, the method 300 is not limited to such an example. In other examples, the method 300 can be performed on an application or service for performing site detection. In at least one example, method 300 can be performed by one or more components of a distributed network, such as a web service / distributed network service (e.g., a cloud service) (e.g., implemented by a computer). Operations).

図3は、本明細書において記述されている、現場検知のための例示的な方法300を示している。例示的な方法300は、オペレーション302において開始し、オペレーション302においては、センサデータが受信されることが可能である。複数の態様においては、クライアントデバイス102などのモバイルデバイスの(またはモバイルデバイスに関連付けられている)1つまたは複数のセンサからのセンサデータがモニタまたは収集されることが可能である。センサデータは、GPS座標およびジオロケーションデータ、位置データ(たとえば、水平精度データ、垂直精度データなど)、Wi-Fiデータ、オーバージエア(OTA)データ(たとえば、Bluetooth(登録商標)データ、近距離無線通信(NFC)データなど)、OS情報および設定、ハードウェア/ソフトウェア情報、信号強度データ、移動情報(たとえば、加速、時間および方向データ)などに関連付けられている情報を含むことが可能である。センサデータは、継続的に、断続的に、要求に応じて、または、検知された停止、移動速度および/もしくは方向における認識できる変化、チェックイン、購入イベント、モバイルデバイスによるメッセージの受信等など、1つもしくは複数の基準の充足に応じて収集されることが可能である。   FIG. 3 illustrates an exemplary method 300 for in-situ sensing as described herein. The example method 300 begins at operation 302, where sensor data may be received. In aspects, sensor data from one or more sensors on (or associated with) a mobile device, such as client device 102, can be monitored or collected. Sensor data includes GPS coordinates and geolocation data, location data (eg, horizontal accuracy data, vertical accuracy data, etc.), Wi-Fi data, over-the-air (OTA) data (eg, Bluetooth® data, Wireless communication (NFC) data, etc., OS information and settings, hardware / software information, signal strength data, movement information (e.g., acceleration, time and direction data), etc. . Sensor data can be continuously, intermittently, on demand, or detected stoppages, recognizable changes in travel speed and / or direction, check-ins, purchase events, messages received by mobile devices, etc. It can be collected depending on the fulfillment of one or more criteria.

複数の態様においては、センサデータは、関連しているデータポイント、タイムフレーム、移動イベント、および/または現場情報を識別するためにモニタされることが可能である。たとえば、センサデータは、モバイルデバイスが店頭に沿って移動している際にモニタされることが可能である。停止検知ユーティリティーが、モバイルデバイスによって受信されるセンサデータをモニタすることが可能である。第1の期間の間に、停止検知ユーティリティーは、10個のポーリングサイクルの連続した期間(たとえば、10分間のタイムピリオド)にわたって、Wi-Fi信号(たとえば、「店舗A」のWi-Fiネットワークの検知)を含むセンサデータを分析することが可能である。停止検知ユーティリティーは、10個のポーリングサイクルのそれぞれの間にWi-Fi信号が検知されたので、モバイルデバイスが継続的に店舗Aに近接していたと特定することが可能である。したがって、停止検知ユーティリティーは、店舗Aに関する「訪問している」という訪問状態を特定することが可能である。「訪問している」という訪問状態に応答して、停止検知ユーティリティーは、第1の期間の間にセンサデータを収集および格納することが可能である。第2の期間の間に、停止検知ユーティリティーは、複数のWi-Fi信号(たとえば、「店舗A」および「店舗B」のWi-Fiネットワークの検知)と、対応する信号強度とを含むセンサデータを分析することが可能である。そのセンサデータに基づいて、停止検知ユーティリティーは、モバイルデバイスが店舗Bに近接していたがモバイルデバイスは実際にはその店舗に入らなかったと特定することが可能である。たとえば、店舗Bに関するWi-Fiネットワークデバイスは、店頭のドアから55フィート内側にある可能性がある。デバイスは、「店舗B」のWi-Fiネットワークの信号強度を、Wi-Fiネットワークデバイスから55フィートの半径においては-80dBm、Wi-Fiネットワークデバイスから25フィートの半径においては-70dBm、およびWi-Fiネットワークデバイスから5フィートの半径においては-50dBmとして記録することが可能である。第2の期間の間に、モバイルデバイスは、-85と-80との間の信号強度を記録していた可能性があり、それは、モバイルデバイスが店舗Bに入らなかったことを示している。したがって、停止検知ユーティリティーは、店舗Bに関する「進行している」または「立ち止まった」という訪問状態を特定することが可能である。「進行している」という訪問状態に応答して、停止検知ユーティリティーは、第2の期間の間にセンサデータを収集および格納しないことが可能である。第3の期間の間に、停止検知ユーティリティーは、ポーリング期間にわたる加速度計データ、1つまたは複数の電子メッセージ(たとえば、テキストまたはEメールの広告、クーポン、イベントスケジュール、レシートなど)、およびGPS座標を使用して、モバイルデバイスが店舗Cに近接していたと特定することが可能である。たとえば、停止検知ユーティリティーは、モバイルデバイスが12:05pmに3.5mphで店舗Cから遠ざかって進行していたが、モバイルデバイスは12:06pmに店舗Cに関するEメール広告を受信し、モバイルデバイスは12:08pmに自らのコースを変更して店舗Cに向かって進行し、モバイルデバイスは12:08と12:15との間に3.5mphで店舗Cに向かって進行していたところ、12:15pmに店舗CのWi-Fi「店舗C」が検知され、モバイルデバイスは12:15pmと12:45pmとの間に0.1と1.8mphとの間(たとえば、ぶらつくスピード)で進行していたと識別することが可能である。このデータに基づいて、停止検知ユーティリティーは、店舗Cに関する「訪問している」という訪問状態を推測することが可能である。「訪問している」という訪問状態に応答して、停止検知ユーティリティーは、第3の期間の間にセンサデータを収集および格納することが可能である。   In aspects, sensor data can be monitored to identify relevant data points, time frames, travel events, and / or site information. For example, sensor data can be monitored as the mobile device is moving along a storefront. A stop detection utility can monitor sensor data received by the mobile device. During the first time period, the outage detection utility sends a Wi-Fi signal (e.g., `` Store A '' Wi-Fi network) for 10 consecutive polling cycles (e.g., a 10 minute time period). It is possible to analyze sensor data, including detection. The outage detection utility can determine that the mobile device was continuously in proximity to store A because the Wi-Fi signal was detected during each of the ten polling cycles. Therefore, the stop detection utility can specify the visit state of “visiting” for store A. In response to the visiting state of “visiting,” the outage detection utility may collect and store sensor data during the first time period. During the second time period, the outage detection utility provides a sensor data including multiple Wi-Fi signals (e.g., detection of the "Store A" and "Store B" Wi-Fi networks) and corresponding signal strengths. Can be analyzed. Based on the sensor data, the stop detection utility can specify that the mobile device was close to store B but the mobile device did not actually enter the store. For example, the Wi-Fi network device for Store B may be 55 feet inside the storefront door. The device measures the signal strength of the `` Store B '' Wi-Fi network at -80 dBm at a radius of 55 feet from the Wi-Fi network device, -70 dBm at a radius of 25 feet from the Wi-Fi network device, and Wi-Fi. At a radius of 5 feet from a Fi network device, it can be recorded as -50dBm. During the second period, the mobile device may have recorded signal strength between -85 and -80, indicating that the mobile device did not enter store B. Therefore, the stop detection utility can specify a visit state of “in progress” or “stopped” for the store B. In response to the “in progress” visit state, the outage detection utility may not collect and store sensor data during the second time period. During the third time period, the outage detection utility retrieves accelerometer data, one or more electronic messages (e.g., text or email advertisements, coupons, event schedules, receipts, etc.), and GPS coordinates over the polling period. It can be used to identify that the mobile device was in proximity to store C. For example, the stop detection utility reports that the mobile device was traveling away from Store C at 3.5 mph at 12:05 pm, but the mobile device received an email ad for Store C at 12:06 pm, and the mobile device At 08pm, he changed his course and proceeded toward Store C, and the mobile device was progressing toward Store C at 3.5 mph between 12:08 and 12:15. C's Wi-Fi `` Store C '' detected and mobile device can be identified as traveling between 0.1 and 1.8 mph (e.g. wandering speed) between 12:15 pm and 12:45 pm It is. Based on this data, the stop detection utility can estimate the visit state of “visiting” for store C. In response to the visiting state of “visiting,” the outage detection utility may collect and store sensor data during the third time period.

オペレーション304において、候補現場のセットが生成されることが可能である。複数の態様においては、モバイルデバイスのセンサデータは、取り出しエンジン202などの現場取り出しユーティリティーにとってアクセスできることが可能である。現場取り出しユーティリティーは、センサデータを解析して、現場および/または関連付けられている現場データを識別することが可能である。現場データは、現場識別に使用可能なモデルまたはアルゴリズムに適用されることが可能である。たとえば、現場データは、k最近傍アルゴリズムなどの分類アルゴリズムに適用されることが可能である。分類アルゴリズムは、現場データを使用して、モバイルデバイスに関して報告されたロケーションの特定の近接度または密度分布内にある候補現場を識別することが可能である。たとえば、分類アルゴリズムは、地理マッピングサービスを利用して、地理座標のセットから500フィート内にあるすべての現場を識別することが可能である。少なくとも1つの例においては、分類アルゴリズムはさらに、現場の人気、現場訪問がどれぐらい最近だったか、現場の格付け、販売データ(地域ごと、季節ごとなど)、ユーザの好みに関するデータ等などのファクタを組み込むことが可能である。たとえば、分類アルゴリズムは、知識ソースを使用して、1つまたは複数の識別された現場に関する人気情報を取り出すことが可能である。それらの現場は次いで、現場の人気に従ってソートされることが可能であり、最も関連している/人気のある現場(たとえば、100個の最も人気のある現場)が選択されることが可能である。   In operation 304, a set of candidate sites can be generated. In aspects, the mobile device sensor data may be accessible to a field retrieval utility, such as retrieval engine 202. The site retrieval utility can analyze the sensor data to identify the site and / or associated site data. Site data can be applied to models or algorithms that can be used for site identification. For example, the field data can be applied to a classification algorithm, such as a k-nearest neighbor algorithm. The classification algorithm may use the site data to identify candidate sites that are within a particular proximity or density distribution of the location reported for the mobile device. For example, a classification algorithm may utilize a geographic mapping service to identify all sites within 500 feet from a set of geographic coordinates. In at least one example, the classification algorithm may further include factors such as site popularity, how recent site visits were, site ratings, sales data (regional, seasonal, etc.), user preference data, etc. It is possible to incorporate. For example, a classification algorithm may use a knowledge source to retrieve popularity information about one or more identified venues. The sites can then be sorted according to site popularity, and the most relevant / popular sites (e.g., the 100 most popular sites) can be selected .

オペレーション306において、候補現場データが特徴付けられて、1つまたは複数の特徴セットを生成することが可能である。複数の態様においては、候補現場のデータセットが、特徴エンジン204などの特徴付けコンポーネントに提供されること、または特徴付けコンポーネントによってアクセスできることが可能である。特徴付けコンポーネントは、候補現場のうちの1つまたは複数に対応するセンサデータおよび/または現場データを識別することが可能である。センサ/現場データが評価されて、候補現場に関連付けられている特質(および対応する値)を示す特徴のセットを生成することが可能である。たとえば、特徴付けコンポーネントは、1つまたは複数の現場に関して下記のセンサデータを入力として受信することが可能である。
[{'frequency': 2412,
'macaddress': u'e2:55:7d:3f:4b:e3',
'signalstrength': -63,
'ssid': u'IIDI',
'timestamp': 1467215627},
{'frequency': 2412,
'macaddress': u'e2:55:7d:3f:4b:e2',
'signalstrength': -63,
'ssid': u'IDEAL-GUEST',
'timestamp': 1467215627},
{'frequency': 2462,
'macaddress': u'54:3d:37:3e:03:18',
'signalstrength': -78,
'ssid': u'Thrillist',
'timestamp': 1467215627}]
In operation 306, the candidate site data may be characterized to generate one or more feature sets. In aspects, a dataset of candidate sites may be provided to or accessible by a characterization component, such as feature engine 204. The characterization component can identify sensor data and / or site data corresponding to one or more of the candidate sites. The sensor / site data can be evaluated to generate a set of features indicative of the attributes (and corresponding values) associated with the candidate site. For example, the characterization component may receive as input the following sensor data for one or more sites.
[{'frequency': 2412,
'macaddress': u'e2: 55: 7d: 3f: 4b: e3',
'signalstrength': -63,
'ssid': u'IIDI ',
'timestamp': 1467215627},
{'frequency': 2412,
'macaddress': u'e2: 55: 7d: 3f: 4b: e2',
'signalstrength': -63,
'ssid': u'IDEAL-GUEST ',
'timestamp': 1467215627},
{'frequency': 2462,
'macaddress': u'54: 3d: 37: 3e: 03: 18',
'signalstrength': -78,
'ssid': u'Thrillist ',
'timestamp': 1467215627}]

特徴付けコンポーネントは、センサデータ内の1つまたは複数の要素または特徴に対応するスコアのセットを生成することが可能である。たとえば、特徴付けコンポーネントは、上述のセンサデータ、および/またはそれらのセンサデータによって表されている現場に関連したこれまでのデータを使用して、1つまたは複数のロケーションベースのスコアを生成することが可能である。特定の例においては、ロケーションベースのスコアは、さまざまなWi-Fiネットワークの評価を表すことが可能である。たとえば、上述のセンサデータに関して、下記のロケーションベースのスコアが生成されることが可能である。
[{Venue A:
wifi_match_score_1: 0.50,
wifi_match_score_2: 0.20},
{Venue B:
wifi_match_score_1: 0.90,
wifi_match_score_2: 0.95},
{Venue C:
wifi_match_score_1: 0.35,
wifi_match_score_2: 0.40}]
The characterization component can generate a set of scores corresponding to one or more elements or features in the sensor data. For example, the characterization component may generate one or more location-based scores using the sensor data described above and / or historical data related to the scene represented by those sensor data. Is possible. In certain examples, a location-based score may represent an evaluation of various Wi-Fi networks. For example, for the sensor data described above, the following location-based scores can be generated.
[{Venue A:
wifi_match_score_1: 0.50,
wifi_match_score_2: 0.20},
{Venue B:
wifi_match_score_1: 0.90,
wifi_match_score_2: 0.95},
{Venue C:
wifi_match_score_1: 0.35,
wifi_match_score_2: 0.40}]

センサデータおよびスコアのセットが使用されて、1つまたは複数の特徴ベクトルを生成および/または投入することが可能である。たとえば、特徴付けコンポーネントは、特徴および値のセットを、ロケーション、デバイス、時間、移動等など、1つまたは複数のタイプまたはカテゴリーへと編成することが可能である。編成された特徴および特徴値は、増減および/または正規化されることが可能である。正規化された特徴および/または特徴値は次いで、特徴ベクトルに付加されることが可能である。特徴ベクトルは、1つもしくは複数のデータ分析ユーティリティーおよび/もしくはデータストアに提供されること、または1つもしくは複数のデータ分析ユーティリティーおよび/もしくはデータストアにとってアクセス可能にされることが可能である。   The set of sensor data and scores can be used to generate and / or populate one or more feature vectors. For example, the characterization component can organize a set of features and values into one or more types or categories, such as location, device, time, movement, and so on. Organized features and feature values can be scaled and / or normalized. The normalized features and / or feature values can then be added to a feature vector. The feature vector can be provided to one or more data analysis utilities and / or data stores, or made accessible to one or more data analysis utilities and / or data stores.

オペレーション308において、候補現場のセットに関して1つまたは複数のメトリックが生成されることが可能である。複数の態様においては、特徴ベクトルは、確率モデルエンジン206などのデータ分析ユーティリティーによってアクセスできることが可能である。特徴ベクトルは、現場の候補セットに関する特徴データおよび/または特徴スコアを含むことが可能である。データ分析ユーティリティーは、1つまたは複数の勾配ブースティング技術を使用して、確率モデルを生成することが可能である。確率モデルは、特徴ベクトルを評価して、現場の候補セット内のそれぞれの現場に関する1つまたは複数の確率または信頼性スコアを生成することが可能である。確率/信頼性スコアは、現場が座標の特定のセットに対応する可能性、または現場が訪問されている可能性を示すことが可能である。複数の例においては、確率/信頼性スコアを生成することは、スコアリングアルゴリズムまたはマシン学習技術を、それぞれの候補現場に対応する特徴ベクトル内の特徴スコアに適用することを含むことが可能である。特定の例においては、スコアリングアルゴリズムは、それぞれの候補現場の特徴スコアを合計することを含むことが可能である。別の例においては、スコアリングアルゴリズムは、重みのセットまたは乗数を1つまたは複数の特徴スコアに適用することを含むことが可能である。複数の態様においては、候補現場は、たとえば、確率モデルによって生成された確率/信頼性スコアに従って編成またはランク付けされることが可能である。   At operation 308, one or more metrics may be generated for the set of candidate sites. In aspects, the feature vectors may be accessible by a data analysis utility, such as the stochastic model engine 206. The feature vector may include feature data and / or a feature score for a candidate set of sites. The data analysis utility can generate a stochastic model using one or more gradient boosting techniques. The probabilistic model may evaluate the feature vectors to generate one or more probability or confidence scores for each site in the candidate set of sites. The probability / confidence score may indicate the likelihood that the scene corresponds to a particular set of coordinates, or the probability that the scene is being visited. In some examples, generating a probability / reliability score can include applying a scoring algorithm or machine learning technique to the feature scores in the feature vector corresponding to each candidate site. . In a particular example, the scoring algorithm can include summing the feature scores of each candidate site. In another example, a scoring algorithm may include applying a set or multiplier of weights to one or more feature scores. In aspects, the candidate sites may be organized or ranked, for example, according to a probability / reliability score generated by the probability model.

オペレーション310において、現場リストが較正されて、現場リストの精度を高めることが可能である。複数の態様においては、較正エンジン210などの較正コンポーネントが、現場リストにアクセスすることが可能である。較正コンポーネントは、1つまたは複数の処理技術を現場リストに適用して、現場選択の精度および/または信頼性メトリックを高めること、または現場選択の数を減らすことが可能である。たとえば、較正コンポーネントは、候補現場に関連付けられている1つまたは複数の確率または信頼性スコアを信頼性しきい値と比較することが可能である。信頼性しきい値は、現場候補が現場リスト内に含まれるためには超えなければならない確率/信頼性スコアを表すことが可能である。複数の例においては、たとえば、ヒューリスティックの1つまたは複数のセットを候補現場に適用することによって、しきい値が特定または選択されることが可能である。ヒューリスティックが使用されて、候補現場に関する現場訪問分布を生成することが可能である。現場訪問分布は、ある期間の間に現場訪問が明示的にまたは黙示的に報告された頻度を識別することが可能である。いくつかの態様においては、現場候補に関する現場訪問分布が、トレーニングデータに関する現場訪問分布と比較されることが可能である。評価に基づいて、しきい値が選択されることが可能である。しきい値を下回る候補現場は、候補現場のリストから除去されること、または著しく減らされることが可能である。たとえば、1%を下回る信頼性スコアを有している候補現場は、候補現場のリストから除去されることが可能であり、50%を下回る信頼性スコアを有している候補現場は、それに従ってマークされることが可能である。マークすることは、候補現場の色、フォント、もしくは透明度を修正すること、または候補現場にインジケータを付加することを含むことが可能である。   In operation 310, the site list may be calibrated to increase the accuracy of the site list. In aspects, a calibration component, such as calibration engine 210, can access the site listing. The calibration component can apply one or more processing techniques to the site list to increase the accuracy and / or reliability metrics of the site selection or reduce the number of site selections. For example, the calibration component may compare one or more probabilities or confidence scores associated with the candidate site to a confidence threshold. The reliability threshold may represent a probability / reliability score that a site candidate must exceed in order to be included in the site list. In some examples, a threshold may be specified or selected, for example, by applying one or more sets of heuristics to the candidate site. Heuristics can be used to generate a site visit distribution for a candidate site. The site visit distribution can identify the frequency with which site visits were explicitly or implicitly reported during a period of time. In some aspects, a site visit distribution for a site candidate can be compared to a site visit distribution for training data. A threshold can be selected based on the evaluation. Candidate sites below the threshold can be removed from the list of candidate sites or significantly reduced. For example, a candidate site having a confidence score of less than 1% can be removed from the list of candidate sites, and a candidate site having a reliability score of less than 50% can be removed accordingly. It can be marked. Marking can include modifying the color, font, or transparency of the candidate site, or adding an indicator to the candidate site.

複数の態様においては、現場リストが較正された後に(または較正プロセスの一環として)、較正コンポーネントは、上位「N」個の現場のリストを生成することが可能である。上位「N」個の現場のリストは、現場リストからの1つまたは複数の候補現場を含むことが可能である。上位「N」個の現場のリストは、それらの現場候補が、モバイルデバイスのロケーションに、または訪問イベントに対応する可能性が最も高いということを表すことが可能である。複数の例においては、上位「N」個の現場は、特定の数の現場結果を選択すること、特定の確率しきい値を上回る現場結果を選択すること、ユーザ選択データを評価することなどによって特定されることが可能である。いくつかの態様においては、上位「N」個の現場のリストは、1つまたは複数の基準に従ってランク付けおよび/または編成されることが可能である。たとえば、現場リストは、55%の予備的な信頼性スコアを有している「店舗A」、40%の予備的な信頼性スコアを有している「店舗B」、および5%の予備的な信頼性スコアを有している「店舗C」を含むことが可能である。この現場リストが精選された後に、精選された現場リストは、25%の最終的な信頼性スコアを有している「店舗A」、75%の最終的な信頼性スコアを有している「店舗B」、および0%の最終的な信頼性スコアを有している「店舗C」を含むことが可能である。較正コンポーネントは、精選された現場リストを較正することが可能であり、それによって現場は、店舗A、店舗B、および店舗Cという順序でリストアップされる。少なくとも1つの例においては、精選された現場リストは、最終的な信頼性スコアに従ってランク付けされることが可能であり、それによって店舗Bは、最上位にランク付けされた現場であり、店舗Aは、第2位にランク付けされた現場である。上位2つの現場が、精選された現場リスト内にリストアップされることになると指定する設定によって、店舗Cの現場は、精選された現場リストから除去されることになることが可能である。いくつかの態様においては、精選された現場リストは、ユーザインターフェース208などのインターフェースを介してユーザに提示されることが可能である。   In embodiments, after the site list has been calibrated (or as part of the calibration process), the calibration component may generate a list of the top "N" sites. The list of top "N" sites may include one or more candidate sites from the site list. The list of top "N" sites may indicate that those site candidates are most likely to correspond to a mobile device location or visit event. In some examples, the top "N" sites are selected by selecting a specific number of site results, selecting site results that exceed a certain probability threshold, evaluating user-selected data, and so on. It can be specified. In some embodiments, the list of top "N" sites can be ranked and / or organized according to one or more criteria. For example, a site listing might include "Store A" with a 55% preliminary reliability score, "Store B" with a 40% preliminary reliability score, and 5% It is possible to include “Store C” having a high reliability score. After this site list has been curated, the curated site list has “Store A” with a final reliability score of 25%, and “Store A” with a final reliability score of 75%. It is possible to include "Store B" and "Store C" having a final reliability score of 0%. The calibration component is capable of calibrating a curated site list, whereby sites are listed in the order of store A, store B, and store C. In at least one example, the curated site list can be ranked according to the final confidence score, whereby store B is the highest ranked site and store A Is a site ranked second. A setting that specifies that the top two sites will be listed in the curated site list can cause the site of store C to be removed from the curated site list. In some aspects, the curated venue list may be presented to the user via an interface, such as user interface 208.

図4は、図1において記述されている現場検知システムに関する例示的な適切な動作環境を示している。動作環境400は典型的に、その最も基本的な構成において、少なくとも1つの処理ユニット402およびメモリ404を含む。コンピューティングデバイスの厳密な構成およびタイプに応じて、(本明細書において開示されている現場検知の実施形態を実行するための命令を格納している)メモリ404は、揮発性(RAMなど)、不揮発性(ROM、フラッシュメモリ等など)、またはそれら2つの何らかの組合せであることが可能である。この最も基本的な構成は、図4において破線406によって示されている。さらに、環境400は、磁気または光ディスクまたはテープを含むがそれらには限定されないストレージデバイス(取り外し可能な408、および/または取り外し不能な410)を含むことも可能である。同様に、環境400は、キーボード、マウス、ペン、音声入力等などの入力デバイス414、および/またはディスプレイ、スピーカー、プリンタ等などの出力デバイス416を有することも可能である。LAN、WAN、ポイントツーポイント等などの1つまたは複数の通信接続412が環境内に含まれることも可能である。複数の実施形態においては、それらの接続は、ポイントツーポイント通信、コネクション型通信、コネクションレス通信などを容易にするように動作できることが可能である。   FIG. 4 illustrates an exemplary suitable operating environment for the field sensing system described in FIG. Operating environment 400 typically includes at least one processing unit 402 and memory 404 in its most basic configuration. Depending on the exact configuration and type of computing device, memory 404 (containing instructions for performing the field sensing embodiments disclosed herein) may be volatile (e.g., RAM), It can be non-volatile (ROM, flash memory, etc.), or some combination of the two. This most basic configuration is shown in FIG. In addition, environment 400 can include storage devices (removable 408 and / or non-removable 410), including but not limited to magnetic or optical disks or tape. Similarly, environment 400 may have input devices 414, such as a keyboard, mouse, pen, voice input, etc., and / or output devices 416, such as displays, speakers, printers, etc. One or more communication connections 412, such as a LAN, WAN, point-to-point, etc., may also be included in the environment. In embodiments, the connections can be operable to facilitate point-to-point communication, connection-oriented communication, connectionless communication, and the like.

動作環境400は典型的に、少なくとも何らかの形態のコンピュータ可読メディアを含む。コンピュータ可読メディアは、処理ユニット402、または動作環境を構成するその他のデバイスによってアクセスされることが可能である任意の利用可能なメディアであることが可能である。限定ではなく、例として、コンピュータ可読メディアは、コンピュータストレージメディアおよび通信メディアを含むことが可能である。コンピュータストレージメディアは、コンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータなどの情報の格納のための任意の方法またはテクノロジーにおいて実装される揮発性のメディアおよび不揮発性のメディア、取り外し可能なメディアおよび取り外し不能なメディアを含む。コンピュータストレージメディアは、RAM、ROM、EEPROM、フラッシュメモリ、もしくはその他のメモリテクノロジー、CD-ROM、デジタル多用途ディスク(DVD)、もしくはその他の光ストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ、もしくはその他の磁気ストレージデバイス、または、所望の情報を格納するために使用されることが可能であるその他の任意の非一時的なメディアを含む。コンピュータストレージメディアは、通信メディアを含まない。   Operating environment 400 typically includes at least some form of computer readable media. Computer readable media can be any available media that can be accessed by processing unit 402 or other device that makes up the operating environment. By way of example, and not limitation, computer readable media may include computer storage media and communication media. Computer storage media includes volatile and non-volatile media, removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data. And non-removable media. Computer storage media can be RAM, ROM, EEPROM, flash memory, or other memory technology, CD-ROM, digital versatile disk (DVD), or other optical storage, magnetic cassette, magnetic tape, magnetic disk storage, or other Or any other non-transitory media that can be used to store desired information. Computer storage media does not include communication media.

通信メディアは、搬送波またはその他の伝送メカニズムなどの変調されたデータ信号においてコンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータを具体化し、任意の情報伝達メディアを含む。「変調されたデータ信号」という用語は、その信号の特性のうちの1つまたは複数が、その信号内で情報をエンコードするような様式で設定または変更されている信号を意味する。限定ではなく、例として、通信メディアは、有線ネットワークまたは直接有線接続などの有線メディア、ならびに、音響メディア、RFメディア、赤外線メディア、マイクロ波メディア、およびその他のワイヤレスメディアなどのワイヤレスメディアを含む。上記のうちのいずれの組合せもまた、コンピュータ可読メディアの範囲内に含まれるものである。   Communication media embodies computer readable instructions, data structures, program modules or other data in a modulated data signal such as a carrier wave or other transmission mechanism and includes any information delivery media. The term "modulated data signal" means a signal that has one or more of its characteristics set or changed in such a manner as to encode information in the signal. By way of example, and not limitation, communication media includes wired media such as a wired network or direct-wired connection, and wireless media such as acoustic, RF, infrared, microwave and other wireless media. Combinations of any of the above also are within the scope of computer readable media.

動作環境400は、1つまたは複数のリモートコンピュータへの論理接続を使用して、ネットワーク化された環境内で動作する単一のコンピュータであることが可能である。リモートコンピュータは、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイス、またはその他の一般的なネットワークノードであることが可能であり、典型的には、上述されている要素ならびにそのように言及されていないその他の要素のうちの多くまたはすべてを含む。論理接続は、利用可能な通信メディアによってサポートされる任意の方法を含むことが可能である。そのようなネットワーキング環境は、オフィス、企業規模のコンピュータネットワーク、イントラネット、およびインターネットにおいてよく見受けられる。   Operating environment 400 can be a single computer operating in a networked environment using logical connections to one or more remote computers. The remote computer can be a personal computer, server, router, network PC, peer device, or other common network node, and typically includes the elements described above as well as so-called. Not including many or all of the other elements. Logical connections can include any of the methods supported by available communication media. Such networking environments are common in offices, enterprise-wide computer networks, intranets, and the Internet.

本明細書において記述されている実施形態は、本明細書において開示されているシステムおよび方法を実施および実行するために、ソフトウェア、ハードウェア、または、ソフトウェアとハードウェアとの組合せを使用して採用されることが可能である。特定のデバイスが、特定の機能を実行するものとして本開示を通じて列挙されているが、これらのデバイスは、例示的な目的のために提供されており、本開示の範囲から逸脱することなく、本明細書において開示されている機能性を実行するために、その他のデバイスが採用されることが可能であるということを当業者なら理解するであろう。   The embodiments described herein may be employed using software, hardware, or a combination of software and hardware to implement and perform the systems and methods disclosed herein. It is possible to be. Although specific devices are listed throughout the disclosure as performing certain functions, these devices are provided for illustrative purposes and may be used without departing from the scope of the disclosure. One of ordinary skill in the art will appreciate that other devices can be employed to perform the functionality disclosed herein.

本開示は、添付の図面を参照しながら本発明のテクノロジーのいくつかの実施形態について記述しており、それらの図面においては、可能な実施形態のうちのいくつかが示されたにすぎない。しかしながら、その他の態様が、多くの異なる形態で具体化されることが可能であり、本明細書において示されている実施形態に限定されるものと解釈されるべきではない。むしろ、これらの実施形態は、本開示が徹底的かつ完全であるように、および可能な実施形態の範囲を当業者に十分に伝達するように提供されたものである。   The present disclosure describes some embodiments of the present technology with reference to the accompanying drawings, in which only some of the possible embodiments are shown. However, other aspects can be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. Rather, these embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the scope of possible embodiments to those skilled in the art.

特定の実施形態が本明細書において記述されているが、このテクノロジーの範囲は、それらの特定の実施形態には限定されない。当業者なら、本発明のテクノロジーの範囲および趣旨内にあるその他の実施形態または改良を認識するであろう。したがって、特定の構造、行為、またはメディアは、例示的な実施形態として開示されているにすぎない。このテクノロジーの範囲は、添付の特許請求の範囲およびそれらの中のあらゆる均等物によって定義される。   Although particular embodiments are described herein, the scope of the technology is not limited to those particular embodiments. One skilled in the art will recognize other embodiments or modifications that fall within the scope and spirit of the technology of the present invention. Thus, the specific structure, acts, or media are disclosed only as exemplary embodiments. The scope of this technology is defined by the appended claims and any equivalents therein.

100 システム
102 クライアントデバイス
104 分散型ネットワーク
106 現場分析システム
108 ストレージ
200 入力処理デバイス
202 取り出しエンジン
204 特徴エンジン
206 確率モデルエンジン
208 ユーザインターフェース
210 較正エンジン
300 方法
400 動作環境
402 処理ユニット
404 メモリ
408 取り外し可能なストレージデバイス
410 取り外し不能なストレージデバイス
412 通信接続
414 入力デバイス
416 出力デバイス
100 systems
102 Client device
104 Distributed Network
106 Field analysis system
108 Storage
200 input processing device
202 retrieval engine
204 Features Engine
206 Stochastic Model Engine
208 User Interface
210 Calibration Engine
300 methods
400 Operating environment
402 Processing Unit
404 memory
408 removable storage device
410 Non-removable storage device
412 Communication connection
414 Input Device
416 output device

Claims (20)

1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサのうちの少なくとも1つに結合されているメモリと
を含むシステムであって、前記メモリがコンピュータ実行可能命令を含み、前記コンピュータ実行可能命令が、前記少なくとも1つのプロセッサによって実行されたときに、現場検知のための方法を実行し、前記方法が、
モバイルデバイスからセンサデータを受信するステップであって、前記センサデータが、前記モバイルデバイスのロケーションに関連付けられている、ステップと、
前記センサデータを使用して現場リストを生成するステップであって、前記現場リストが、前記モバイルデバイスの前記ロケーションに対応する1つまたは複数の候補現場を含む、ステップと、
前記1つまたは複数の候補現場に関連付けられている現場データを特徴付けて、特徴セットを生成するステップと、
前記特徴セットを確率モデルに適用することによって、前記1つまたは複数の候補現場に関するメトリックを生成するステップと、
前記メトリックに部分的に基づいて前記現場リストを較正するステップとを含む、システム。
One or more processors,
A memory coupled to at least one of the one or more processors, the memory including computer-executable instructions, wherein the computer-executable instructions are executed by the at least one processor. Perform a method for on-site detection when performed, wherein the method comprises:
Receiving sensor data from a mobile device, wherein the sensor data is associated with a location of the mobile device;
Generating a site list using the sensor data, wherein the site list includes one or more candidate sites corresponding to the location of the mobile device;
Characterizing site data associated with the one or more candidate sites to generate a feature set;
Generating a metric for the one or more candidate sites by applying the feature set to a probability model;
Calibrating the site list based in part on the metric.
前記センサデータが、ジオロケーションデータ、位置データ、Wi-Fi情報、ソフトウェア情報、ハードウェア情報、加速度計データ、および時間情報のうちの少なくとも1つを含む、請求項1に記載のシステム。   The system of claim 1, wherein the sensor data comprises at least one of geolocation data, location data, Wi-Fi information, software information, hardware information, accelerometer data, and time information. 前記センサデータが、前記モバイルデバイスによる前記1つまたは複数の現場への訪問を示す、請求項1に記載のシステム。   The system of claim 1, wherein the sensor data indicates a visit by the mobile device to the one or more sites. 前記現場データを特徴付けるステップが、
前記現場データ内の1つまたは複数の特徴を識別するステップと、
前記1つまたは複数の特徴を使用して、前記特徴セットを生成するステップとを含む、請求項1に記載のシステム。
Characterizing the site data,
Identifying one or more features in the field data;
Generating said feature set using said one or more features.
1つまたは複数の特徴を識別するステップが、現場の年数、現場の人気、その他の現場への近接度、現場候補のこれまでの精度、および以前の現場訪問データのうちの少なくとも1つを評価するステップを含む、請求項4に記載のシステム。   Identifying one or more features assesses at least one of the age of the site, site popularity, proximity to other sites, historical accuracy of site candidates, and previous site visit data 5. The system of claim 4, comprising the step of: 前記確率モデルが、1つまたは複数の勾配ブースティング技術を使用して生成されたデシジョンツリーの集合である、請求項1に記載のシステム。   The system of claim 1, wherein the probabilistic model is a collection of decision trees generated using one or more gradient boosting techniques. 前記確率モデルが、現場の前記セット内の1つまたは複数の現場に関する信頼性スコアを特定し、前記信頼性スコアが、対応する現場が前記モバイルデバイスの前記ロケーションに対応する確率を示す、請求項6に記載のシステム。   The probability model identifies a reliability score for one or more sites in the set of sites, wherein the reliability score indicates a probability that a corresponding site corresponds to the location of the mobile device. 6. The system according to 6. 前記現場リストを生成するステップが、前記センサデータ内の現場情報を識別するステップ、および前記ロケーションを表す地理座標のセットを現場特定ユーティリティーに提供するステップのうちの少なくとも1つを含む、請求項1に記載のシステム。   The method of claim 1, wherein generating the site list includes identifying at least one site information within the sensor data and providing a set of geographic coordinates representing the location to a site identification utility. System. 前記方法が、
以前に受信された入力データと、対応する出力データとを含むトレーニングデータのセットにアクセスするステップと、
前記確率モデルによって生成された出力データを目的関数に提供するステップと、
前記目的関数を使用して、前記確率モデルによって生成された前記出力データを前記トレーニングデータ内の前記出力データと比較するステップとをさらに含む、請求項1に記載のシステム。
The method comprises
Accessing a set of training data including previously received input data and corresponding output data;
Providing output data generated by the probability model to an objective function;
Using the objective function to compare the output data generated by the stochastic model with the output data in the training data.
前記現場リストを較正するステップが、上位「N」個の現場を選択するステップを含み、前記上位「N」個の現場が、モバイルデバイスの前記ロケーションに対応する可能性が最も高い1つまたは複数の現場を表す、請求項1に記載のシステム。   Calibrating the site list includes selecting the top `` N '' sites, wherein the top `` N '' sites are most likely to correspond to the location of a mobile device. The system of claim 1, wherein the system represents a site. 前記方法が、
ユーザインターフェースを使用して前記現場リストを提示するステップと、
前記ユーザインターフェースを介して、前記提示された現場リストに関連付けられているユーザ入力を受信するステップと、
前記ユーザ入力を使用して、前記現場リストを修正するステップとをさらに含む、請求項1に記載のシステム。
The method comprises
Presenting the site list using a user interface;
Receiving, via the user interface, user input associated with the presented venue list;
Modifying the site list using the user input.
前記センサデータが、前記モバイルデバイスによる停止イベント、および前記モバイルデバイスによる訪問イベントのうちの少なくとも1つを検知したことに応答して受信される、請求項1に記載のシステム。   The system of claim 1, wherein the sensor data is received in response to detecting at least one of a stop event by the mobile device and a visit event by the mobile device. 現場検知のための方法であって、
モバイルデバイスからセンサデータを受信するステップであって、前記センサデータが、前記モバイルデバイスのロケーションに関連付けられている、ステップと、
前記センサデータを使用して現場リストを生成するステップであって、前記現場リストが、少なくとも第1の現場および第2の現場を含み、前記第1の現場および前記第2の現場が、前記モバイルデバイスの前記ロケーションに関連付けられている、ステップと、
前記第1の現場および前記第2の現場に関連付けられている現場データを特徴付けて、特徴セットを生成するステップと、
前記特徴セットを確率モデルに適用することによって、前記第1の現場および前記第2の現場に関する信頼性メトリックを生成するステップと、
前記メトリックに部分的に基づいて前記現場リストを較正するステップと、
ユーザインターフェースを介して、前記較正された現場リスト、および前記信頼性メトリックのうちの少なくとも一部分を提示するステップであって、前記第1の現場および前記第2の現場のうちの少なくとも1つが、前記モバイルデバイスの前記ロケーションに対応する、ステップとを含む方法。
A method for on-site detection,
Receiving sensor data from a mobile device, wherein the sensor data is associated with a location of the mobile device;
Generating a site list using the sensor data, wherein the site list includes at least a first site and a second site, wherein the first site and the second site are the mobile sites. Steps associated with said location of the device;
Characterizing site data associated with the first site and the second site to generate a feature set;
Generating a reliability metric for the first site and the second site by applying the feature set to a probability model;
Calibrating the site list based in part on the metric;
Presenting, via a user interface, the calibrated site list and at least a portion of the reliability metric, wherein at least one of the first site and the second site includes: Corresponding to the location of a mobile device.
前記確率モデルが、1つまたは複数の勾配ブースティング技術を使用して生成されたデシジョンツリーの集合である、請求項13に記載の方法。   14. The method of claim 13, wherein the probabilistic model is a set of decision trees generated using one or more gradient boosting techniques. 前記1つまたは複数の勾配ブースティング技術が、現場の年数、現場の人気、その他の現場への近接度、現場候補のこれまでの精度、以前の現場訪問データ、およびユーザフィードバックのうちの少なくとも1つを評価する、請求項14に記載の方法。   The one or more gradient boosting techniques may include at least one of site age, site popularity, proximity to other sites, historical accuracy of site candidates, previous site visit data, and user feedback. 15. The method of claim 14, wherein one is evaluated. 前記センサデータが、前記モバイルデバイスによる前記第1の現場および前記第2の現場のうちの少なくとも1つへの訪問を示す、請求項13に記載の方法。   14. The method of claim 13, wherein the sensor data indicates a visit by the mobile device to at least one of the first site and the second site. 以前に受信された入力データと、対応する出力データとを含むトレーニングデータのセットにアクセスするステップと、
前記確率モデルによって生成された出力データを目的関数に提供するステップと、
前記目的関数を使用して、前記確率モデルによって生成された前記出力データを前記トレーニングデータ内の前記出力データと比較するステップと、
前記比較に基づいて、前記確率モデルの有効性をスコア付けするステップと
をさらに含む、請求項13に記載の方法。
Accessing a set of training data including previously received input data and corresponding output data;
Providing output data generated by the probability model to an objective function;
Using the objective function to compare the output data generated by the probability model with the output data in the training data;
Scoring the validity of the probability model based on the comparison.
前記信頼性メトリックが、それぞれの現場が前記モバイルデバイスの前記ロケーションに対応する確率を示す、請求項16に記載の方法。   17. The method of claim 16, wherein the reliability metric indicates a probability that each site corresponds to the location of the mobile device. 前記現場リストを生成する前記ステップが、前記モバイルデバイスの前記ロケーションに対して第1の近接度内にある現場の第1のセットを特定するステップを含み、前記現場リストを較正するステップが、前記モバイルデバイスの前記ロケーションに対して第2の近接度内にある現場の第2のセットを特定するステップを含み、現場の前記第2のセットが、現場の前記第1のセットよりも少ない現場を含む、請求項13に記載の方法。   Generating the site list includes identifying a first set of sites that are within a first proximity to the location of the mobile device, wherein calibrating the site list comprises: Identifying a second set of sites that are within a second proximity to the location of the mobile device, wherein the second set of sites includes less sites than the first set of sites. 14. The method of claim 13, comprising. コンピュータ実行可能命令をエンコードしているコンピュータ可読ストレージメディアであって、前記コンピュータ実行可能命令が、少なくとも1つのプロセッサによって実行されたときに、現場検知のための方法を実行し、前記方法が、
モバイルデバイスからセンサデータを受信するステップであって、前記センサデータが、前記モバイルデバイスのロケーションに関連付けられている、ステップと、
前記センサデータを使用して現場リストを生成するステップであって、前記現場リストが、少なくとも第1の現場および第2の現場を含み、前記第1の現場および前記第2の現場が、前記モバイルデバイスの前記ロケーションに関連付けられている、ステップと、
前記第1の現場および前記第2の現場に関連付けられている現場データを特徴付けて、特徴セットを生成するステップと、
前記特徴セットを確率モデルに適用することによって、前記第1の現場および前記第2の現場に関する信頼性メトリックを生成するステップと、
前記メトリックに部分的に基づいて前記現場リストを較正するステップと、
ユーザインターフェースを介して、前記較正された現場リスト、および前記信頼性メトリックのうちの少なくとも一部分を提示するステップであって、前記第1の現場および前記第2の現場のうちの少なくとも1つが、前記モバイルデバイスの前記ロケーションに対応する、ステップとを含む、コンピュータ可読ストレージメディア。
A computer-readable storage medium encoding computer-executable instructions, wherein the computer-executable instructions, when executed by at least one processor, perform a method for field detection, the method comprising:
Receiving sensor data from a mobile device, wherein the sensor data is associated with a location of the mobile device;
Generating a site list using the sensor data, wherein the site list includes at least a first site and a second site, wherein the first site and the second site are the mobile sites. Steps associated with said location of the device;
Characterizing site data associated with the first site and the second site to generate a feature set;
Generating a reliability metric for the first site and the second site by applying the feature set to a probability model;
Calibrating the site list based in part on the metric;
Presenting, via a user interface, the calibrated site list and at least a portion of the reliability metric, wherein at least one of the first site and the second site includes: Corresponding to the location of a mobile device.
JP2019536471A 2016-09-16 2017-09-14 Site detection Active JP7032408B2 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662395827P 2016-09-16 2016-09-16
US62/395,827 2016-09-16
US15/689,683 US11481690B2 (en) 2016-09-16 2017-08-29 Venue detection
US15/689,683 2017-08-29
PCT/US2017/051568 WO2018053133A1 (en) 2016-09-16 2017-09-14 Venue detection

Publications (2)

Publication Number Publication Date
JP2019537394A true JP2019537394A (en) 2019-12-19
JP7032408B2 JP7032408B2 (en) 2022-03-08

Family

ID=61617466

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019536471A Active JP7032408B2 (en) 2016-09-16 2017-09-14 Site detection
JP2019536475A Active JP7101680B2 (en) 2016-09-16 2017-09-15 Passive visit detection

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2019536475A Active JP7101680B2 (en) 2016-09-16 2017-09-15 Passive visit detection

Country Status (5)

Country Link
US (4) US11481690B2 (en)
EP (2) EP3513579A4 (en)
JP (2) JP7032408B2 (en)
KR (2) KR102435712B1 (en)
WO (2) WO2018053133A1 (en)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11481690B2 (en) 2016-09-16 2022-10-25 Foursquare Labs, Inc. Venue detection
EP3305538A1 (en) * 2016-10-07 2018-04-11 Mitsubishi HiTec Paper Europe GmbH Heat sensitive recording material
US20190163664A1 (en) * 2017-11-27 2019-05-30 Salesforce.Com, Inc. Method and system for intelligent priming of an application with relevant priming data
JP7233868B2 (en) * 2018-08-08 2023-03-07 キヤノン株式会社 Learning system for information processing device, information processing device, control method for information processing device, and program
US11146911B2 (en) * 2018-08-17 2021-10-12 xAd, Inc. Systems and methods for pacing information campaigns based on predicted and observed location events
US11134359B2 (en) * 2018-08-17 2021-09-28 xAd, Inc. Systems and methods for calibrated location prediction
US11172324B2 (en) * 2018-08-17 2021-11-09 xAd, Inc. Systems and methods for predicting targeted location events
US10887727B2 (en) * 2018-12-07 2021-01-05 Microsoft Technology Licensing, Llc Computer-implemented detection of a work-related visit based on data from movement-sensing mechanism(s)
US20200252500A1 (en) * 2019-01-31 2020-08-06 Marcello Giordano Vibration probing system for providing context to context-aware mobile applications
US11080629B2 (en) 2019-03-22 2021-08-03 Microsoft Technology Licensing, Llc Automatically generating activity summaries based on signals obtained from plural devices and logic components
US11029984B2 (en) * 2019-04-27 2021-06-08 EMC IP Holding Company LLC Method and system for managing and using data confidence in a decentralized computing platform
US11062272B2 (en) 2019-07-15 2021-07-13 Microsoft Technology Licensing, Llc Recommending meeting spaces using automatically-generated visit data, with geo-tagging of the meeting spaces
DE102020120456A1 (en) * 2020-08-03 2022-02-03 Endress+Hauser Conducta Gmbh+Co. Kg Measured value processing system and measured value processing method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130226857A1 (en) * 2012-02-24 2013-08-29 Placed, Inc. Inference pipeline system and method
US20150032673A1 (en) * 2013-06-13 2015-01-29 Next Big Sound, Inc. Artist Predictive Success Algorithm

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2426312A1 (en) 1978-05-19 1979-12-14 Framatome Sa CROSS-HOLDING DEVICE FOR THE FUEL BARS OF AN ASSEMBLY FOR NUCLEAR REACTOR
US6714778B2 (en) 2001-05-15 2004-03-30 Nokia Corporation Context sensitive web services
JP3829784B2 (en) 2002-09-19 2006-10-04 日本電信電話株式会社 POSITION DETECTION METHOD AND SYSTEM AND RADIO COMMUNICATION DEVICE
JP4761548B2 (en) 2006-06-19 2011-08-31 株式会社Access Mobile terminal device, control program therefor, and server
JP2009159336A (en) 2007-12-26 2009-07-16 Panasonic Corp Behavior range grasping method and behavior grasping apparatus
US8828394B2 (en) 2009-04-01 2014-09-09 Cornell University Methods for treating IgE-mediated disorder
JP5495014B2 (en) 2009-09-09 2014-05-21 ソニー株式会社 Data processing apparatus, data processing method, and program
US10758630B2 (en) 2010-08-13 2020-09-01 The Johns Hopkins University Topical compositions and methods of detection and treatment
US8793204B2 (en) 2010-10-01 2014-07-29 Panasonic Corporation Classification device and classification method
EP2681666A4 (en) * 2011-03-04 2014-10-15 Foursquare Labs Inc System and method for managing and redeeming offers with a location-based service
US20120284212A1 (en) * 2011-05-04 2012-11-08 Google Inc. Predictive Analytical Modeling Accuracy Assessment
US9019984B2 (en) 2011-06-03 2015-04-28 Apple Inc. Selecting wireless access points for geofence monitoring
AU2012283826B8 (en) * 2011-07-20 2015-07-30 Ebay Inc. Real-time location-aware recommendations
WO2013067247A1 (en) * 2011-11-02 2013-05-10 ThinkVine Corporation Agent generation for agent-based modeling systems
US9047316B2 (en) * 2012-06-04 2015-06-02 Yellowpages.Com Llc Venue prediction based on ranking
US9785993B2 (en) * 2012-06-04 2017-10-10 Verge Wireless, Inc. Method for analyzing and ranking venues
US9113291B2 (en) 2012-06-18 2015-08-18 Qualcomm Incorporated Location detection within identifiable pre-defined geographic areas
KR101880480B1 (en) 2012-06-25 2018-08-17 엘지전자 주식회사 Operation method for mobile terminal
US9298358B1 (en) * 2012-08-21 2016-03-29 Google Inc. Scrollable notifications
US10235683B2 (en) 2014-07-18 2019-03-19 PlaceIQ, Inc. Analyzing mobile-device location histories to characterize consumer behavior
US8817652B1 (en) 2013-02-20 2014-08-26 46 Labs Ops Call routing and real-time monitoring
US9918199B2 (en) * 2013-03-01 2018-03-13 Harley E. ROUDA, JR. Subject matter based tour guide
JP2015002388A (en) 2013-06-13 2015-01-05 株式会社Nttドコモ Method and device for accessing multiple radio bearers
US9253596B2 (en) 2013-10-15 2016-02-02 Qualcomm Incorporated Method and apparatus for detecting location changes and monitoring assistance data via scanning
US9519869B2 (en) 2013-11-25 2016-12-13 International Business Machines Corporation Predictive computer system resource monitoring
US20150248436A1 (en) 2014-03-03 2015-09-03 Placer Labs Inc. Methods, Circuits, Devices, Systems and Associated Computer Executable Code for Assessing a Presence Likelihood of a Subject at One or More Venues
US9817907B1 (en) * 2014-06-18 2017-11-14 Google Inc. Using place of accommodation as a signal for ranking reviews and point of interest search results
US20160066150A1 (en) 2014-08-28 2016-03-03 Qualcomm Incorporated Dynamic Configuration of a Positioning System
US10078852B2 (en) * 2014-12-30 2018-09-18 Facebook, Inc. Predicting locations and movements of users based on historical locations for users of an online system
US9860704B2 (en) * 2015-03-31 2018-01-02 Foursquare Labs, Inc. Venue identification from wireless scan data
US10185973B2 (en) * 2015-04-07 2019-01-22 Microsoft Technology Licensing, Llc Inferring venue visits using semantic information
US9955359B2 (en) * 2015-05-19 2018-04-24 Cisco Technology, Inc. Location services with multiple devices
WO2016189606A1 (en) 2015-05-22 2016-12-01 株式会社Ubic Data analysis system, control method, control program, and recording medium
US11887164B2 (en) * 2015-05-26 2024-01-30 Microsoft Technology Licensing, Llc Personalized information from venues of interest
US20160358065A1 (en) * 2015-06-05 2016-12-08 Microsoft Technology Licensing, Llc Personally Impactful Changes To Events of Users
US9838848B2 (en) 2015-06-05 2017-12-05 Apple Inc. Venue data prefetch
US10516964B2 (en) * 2015-07-28 2019-12-24 Microsoft Technology Licensing, Llc Inferring user availability for a communication
US20170032248A1 (en) * 2015-07-28 2017-02-02 Microsoft Technology Licensing, Llc Activity Detection Based On Activity Models
US20170124465A1 (en) * 2015-10-29 2017-05-04 Foursquare Labs, Inc. Analysis and prediction from venue data
WO2017111856A1 (en) * 2015-12-24 2017-06-29 Intel Corporation Travel assistance
US9813402B1 (en) * 2016-01-08 2017-11-07 Allstate Insurance Company User authentication based on probabilistic inference of threat source
US10187394B2 (en) * 2016-03-31 2019-01-22 Microsoft Technology Licensing, Llc Personalized inferred authentication for virtual assistance
US9948733B2 (en) * 2016-05-09 2018-04-17 Dstillery, Inc. Evaluating authenticity of geographic data associated with media requests
US11138615B1 (en) * 2016-08-11 2021-10-05 Google Llc Location-based place attribute prediction
US11481690B2 (en) * 2016-09-16 2022-10-25 Foursquare Labs, Inc. Venue detection
WO2018160963A1 (en) * 2017-03-02 2018-09-07 Spectral Md, Inc. Machine learning systems and techniques for multispectral amputation site analysis
WO2019051615A1 (en) * 2017-09-18 2019-03-21 Rubikloud Technologies Inc. Method and system for hierarchical forecasting
US20190287121A1 (en) * 2018-03-19 2019-09-19 Foursquare Labs, Inc. Speculative check-ins and importance reweighting to improve venue coverage
US11630995B2 (en) * 2018-06-19 2023-04-18 Siemens Healthcare Gmbh Characterization of amount of training for an input to a machine-learned network
US11636393B2 (en) * 2019-05-07 2023-04-25 Cerebri AI Inc. Predictive, machine-learning, time-series computer models suitable for sparse training sets
US11085663B2 (en) * 2019-07-19 2021-08-10 Johnson Controls Tyco IP Holdings LLP Building management system with triggered feedback set-point signal for persistent excitation
RU2762779C2 (en) * 2019-11-06 2021-12-22 Общество С Ограниченной Ответственностью «Яндекс» Method and system for determining event of user's place visiting

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130226857A1 (en) * 2012-02-24 2013-08-29 Placed, Inc. Inference pipeline system and method
US20150032673A1 (en) * 2013-06-13 2015-01-29 Next Big Sound, Inc. Artist Predictive Success Algorithm

Also Published As

Publication number Publication date
US20180082206A1 (en) 2018-03-22
KR20190062443A (en) 2019-06-05
US20230135252A1 (en) 2023-05-04
WO2018053330A1 (en) 2018-03-22
JP7032408B2 (en) 2022-03-08
US11017325B2 (en) 2021-05-25
US11481690B2 (en) 2022-10-25
KR102435712B1 (en) 2022-08-25
EP3513579A4 (en) 2020-05-06
US20210350286A1 (en) 2021-11-11
EP3513579A1 (en) 2019-07-24
EP3513580A4 (en) 2020-05-06
KR20190064594A (en) 2019-06-10
JP2019530385A (en) 2019-10-17
WO2018053133A1 (en) 2018-03-22
KR102414936B1 (en) 2022-07-01
US20180080793A1 (en) 2018-03-22
EP3513580A1 (en) 2019-07-24
JP7101680B2 (en) 2022-07-15

Similar Documents

Publication Publication Date Title
JP7032408B2 (en) Site detection
US11870704B2 (en) Instant notification of load balance and resource scheduling based on resource capacities and event recognition
US20190370695A1 (en) Enhanced pipeline for the generation, validation, and deployment of machine-based predictive models
US11537941B2 (en) Remote validation of machine-learning models for data imbalance
US9047558B2 (en) Probabilistic event networks based on distributed time-stamped data
US11250340B2 (en) Feature contributors and influencers in machine learned predictive models
US20200380309A1 (en) Method and System of Correcting Data Imbalance in a Dataset Used in Machine-Learning
US11526701B2 (en) Method and system of performing data imbalance detection and correction in training a machine-learning model
JP2023514465A (en) machine learning platform
CN111611144B (en) Method, apparatus, computing device, and medium for processing performance test data
US20190287121A1 (en) Speculative check-ins and importance reweighting to improve venue coverage
US20170339021A1 (en) Model deployment based on benchmarked devices
CN105580043A (en) Strength based modeling for recommendation system
US11449773B2 (en) Enhanced similarity detection between data sets with unknown prior features using machine-learning
US20220172086A1 (en) System and method for providing unsupervised model health monitoring
KR20240052035A (en) Verification of crowdsourced field reports based on user trust
US20210201237A1 (en) Enhanced user selection for communication workflows using machine-learning techniques
JP2022531480A (en) Visit prediction
US11893401B1 (en) Real-time event status via an enhanced graphical user interface
US11995670B2 (en) User experience management system
CN112417252B (en) Crawler path determination method and device, storage medium and electronic equipment
US11397614B2 (en) Enhanced processing for communication workflows using machine-learning techniques
US20240086298A1 (en) Anomaly detection and subsegment analysis
CN117999552A (en) Loss model for estimating per-region survey integrity

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220224

R150 Certificate of patent or registration of utility model

Ref document number: 7032408

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150