JP7105176B2 - Machine learning device, judgment device, program and machine learning method - Google Patents

Machine learning device, judgment device, program and machine learning method Download PDF

Info

Publication number
JP7105176B2
JP7105176B2 JP2018209127A JP2018209127A JP7105176B2 JP 7105176 B2 JP7105176 B2 JP 7105176B2 JP 2018209127 A JP2018209127 A JP 2018209127A JP 2018209127 A JP2018209127 A JP 2018209127A JP 7105176 B2 JP7105176 B2 JP 7105176B2
Authority
JP
Japan
Prior art keywords
information
store
unit
data
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018209127A
Other languages
Japanese (ja)
Other versions
JP2020077118A (en
Inventor
啓司 土居
英樹 吉井
玲 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SoftBank Corp
Original Assignee
SoftBank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SoftBank Corp filed Critical SoftBank Corp
Priority to JP2018209127A priority Critical patent/JP7105176B2/en
Publication of JP2020077118A publication Critical patent/JP2020077118A/en
Application granted granted Critical
Publication of JP7105176B2 publication Critical patent/JP7105176B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、機械学習装置、判定装置、プログラム及び機械学習方法に関する。 The present invention relates to a machine learning device, a determination device, a program, and a machine learning method.

無線LANアクセスポイントで受信された無線信号に関するログを分析して、無線通信端末のユーザの来店を検出する技術が知られている(例えば、特許文献1~3参照)。
[先行技術文献]
[特許文献]
[特許文献1]特許第5859161号
[特許文献2]特許第5802716号
[特許文献3]特許第6169124号
Techniques for detecting the visit of a user of a wireless communication terminal by analyzing a log relating to wireless signals received by a wireless LAN access point are known (see Patent Documents 1 to 3, for example).
[Prior art documents]
[Patent Literature]
[Patent Document 1] Patent No. 5859161 [Patent Document 2] Patent No. 5802716 [Patent Document 3] Patent No. 6169124

従来技術によれば、無線信号の電波強度などを利用して、当該無線信号を発信した通信端末のユーザが来店したか否かを判定している。上記の判定手法によっても比較的精度よく来店を検出することはできるが、近年、来店検出精度のさらなる向上が求められるようになってきた。 According to the conventional technology, it is determined whether or not the user of the communication terminal that transmitted the wireless signal has visited the store by using the radio wave intensity of the wireless signal. Although it is possible to detect store visits with relatively high accuracy using the determination method described above, in recent years, there has been a demand for further improvement in store visit detection accuracy.

本発明の第1の態様においては、機械学習装置が提供される。上記の機械学習装置は、例えば、予め定められた地理的範囲を有するエリアの内部に配された無線受信装置により受信された無線信号に関する情報を含むデータポイントが入力され、無線信号を発信した無線端末のユーザがエリアの内部に存在していたか否かを判定するために用いられる学習モデルを生成するモデル生成部を備える。上記の機械学習装置は、例えば、モデル生成部により生成された学習モデルが、ユーザがエリアの内部に存在していたか否か判定するための基準値を調整する調整部を備える。上記の機械学習装置において、例えば、モデル生成部は、(a)基準値として、学習モデルに応じた初期値を利用し、(b)(i)1以上の無線受信装置が受信した複数の無線信号のそれぞれに関する情報、及び、(ii)複数の無線信号のそれぞれを発信した無線端末のユーザが、複数の無線信号のそれぞれを受信した無線受信装置の配されたエリアの内部に存在していたか否かを示すラベルを含む学習用データセットを利用して機械学習を実行することにより、学習モデルを生成する。上記の機械学習装置において、例えば、調整部は、基準値として初期値が利用された場合と比較して、モデル生成部により生成された学習モデルの判定結果の真陽性率が大きくなる第2の値を、調整後の基準値として決定する。 In a first aspect of the invention, a machine learning device is provided. The machine learning device receives, for example, a data point containing information about a radio signal received by a radio receiver disposed within an area having a predetermined geographical range, and the radio that emitted the radio signal. A model generation unit is provided for generating a learning model used to determine whether the user of the terminal was within the area. The machine learning device described above includes, for example, an adjustment unit that adjusts a reference value for determining whether or not the user exists inside the area in the learning model generated by the model generation unit. In the above machine learning device, for example, the model generation unit (a) uses an initial value according to the learning model as the reference value, and (b) (i) a plurality of radio signals received by one or more radio receiving devices. and (ii) whether the user of the wireless terminal that emitted each of the plurality of wireless signals was within the area in which the wireless receiving device that received each of the plurality of wireless signals was arranged. A learning model is generated by executing machine learning using a learning data set containing a label indicating whether or not. In the above-described machine learning device, for example, the adjustment unit increases the true positive rate of the determination result of the learning model generated by the model generation unit compared to the case where the initial value is used as the reference value. value is determined as the adjusted reference value.

上記の機械学習装置は、それぞれにおいて、(i)複数の無線信号のそれぞれを発信した無線端末を識別するための端末識別情報、(ii)複数の無線信号のそれぞれが受信された時刻を示す受信時刻情報、及び、(iii)複数の無線信号のそれぞれの電波に関する信号情報が対応付けられた、複数のレコードを取得するレコード取得部を備えてよい。上記の機械学習装置は、それぞれにおいて、(i)特定の行動に関与した1以上のユーザのそれぞれを識別するためのユーザ識別情報、及び、(ii)特定の行動がなされた時刻を示す行動時刻情報が対応付けられた、複数の行動履歴情報を取得する行動履歴取得部を備えてよい。上記の機械学習装置は、(i)レコード取得部が取得した複数のレコードのそれぞれに含まれる端末識別情報及び受信時刻情報、並びに、(ii)行動履歴取得部が取得した複数の行動履歴情報のそれぞれに含まれるユーザ識別情報及び行動時刻情報に基づいて、複数のレコード及び複数の行動履歴情報を照合し、複数のレコードのうち少なくとも一部のレコードのそれぞれに含まれる端末識別情報と、少なくとも一部のレコードのそれぞれに含まれる信号情報により示される電波に関する情報と、ユーザがエリアの内部に存在していたことを示すラベルとを対応付けることで、学習用データセットを生成するラベル付与部を備えてよい。上記の機械学習装置において、複数の行動履歴情報の少なくとも一部に含まれるユーザ識別情報は、当該ユーザ識別情報により識別されるユーザが利用する無線端末の端末識別情報であってよい。 In each of the above machine learning devices, (i) terminal identification information for identifying the wireless terminal that transmitted each of the plurality of wireless signals, (ii) reception indicating the time at which each of the plurality of wireless signals was received A record acquisition unit that acquires a plurality of records associated with time information and (iii) signal information about radio waves of each of the plurality of radio signals may be provided. Each of the above machine learning devices includes (i) user identification information for identifying each of the one or more users involved in a specific action, and (ii) action time indicating the time at which the specific action was performed. An action history acquisition unit that acquires a plurality of pieces of action history information associated with information may be provided. The above machine learning device includes (i) terminal identification information and reception time information included in each of the plurality of records acquired by the record acquisition unit, and (ii) a plurality of action history information acquired by the action history acquisition unit. A plurality of records and a plurality of action history information are collated based on the user identification information and the action time information included in each, and terminal identification information included in each of at least some of the plurality of records and at least one a labeling unit that generates a learning data set by associating information about radio waves indicated by signal information included in each of the records of the area with a label indicating that the user was present inside the area; you can In the machine learning device described above, the user identification information included in at least part of the plurality of action history information may be terminal identification information of a wireless terminal used by the user identified by the user identification information.

上記の機械学習装置は、1以上のユーザ識別情報のそれぞれと、当該ユーザ識別情報により識別されるユーザが利用する無線端末の端末識別情報との対応関係を示す対応関係情報を取得する対応関係取得部を備えてよい。上記の機械学習装置において、ラベル付与部は、対応関係取得部が取得した対応関係情報を参照して、(i)レコード取得部が取得した複数のレコードのそれぞれに含まれる端末識別情報及び受信時刻情報、並びに、(ii)行動履歴取得部が取得した複数の行動履歴情報のそれぞれに含まれるユーザ識別情報及び行動時刻情報に基づいて、複数のレコード及び複数の行動履歴情報を照合し、学習用データセットを生成してよい。 The machine learning device obtains correspondence information indicating a correspondence relationship between each of the one or more pieces of user identification information and terminal identification information of a wireless terminal used by a user identified by the user identification information. You may have a department. In the machine learning device described above, the labeling unit refers to the correspondence information acquired by the correspondence acquisition unit, and performs (i) terminal identification information and reception time included in each of the plurality of records acquired by the record acquisition unit. and (ii) the user identification information and the action time information included in each of the plurality of action history information acquired by the action history acquisition unit. You may generate a dataset.

上記の機械学習装置は、それぞれにおいて、(i)複数の無線信号のそれぞれを発信した無線端末を識別するための端末識別情報、(ii)複数の無線信号のそれぞれが受信された時刻を示す受信時刻情報、(iii)複数の無線信号のそれぞれが受信された位置を示す受信位置情報、及び、(iv)複数の無線信号のそれぞれの電波に関する信号情報が対応付けられた、複数のレコードを取得するレコード取得部を備えてよい。上記の機械学習装置は、それぞれにおいて、(i)1以上のエリアのそれぞれを識別するためのエリア識別情報、(ii)エリア識別情報により識別されるエリアへの進入が制限されている時間帯を示す、1以上の進入制限情報を取得する制限情報取得部を備えてよい。上記の機械学習装置は、(i)レコード取得部が取得した複数のレコードのそれぞれに含まれる受信位置情報、及び、(ii)制限情報取得部が取得した1以上の進入制限情報のそれぞれに含まれるエリア識別情報に基づいて、複数のレコード及び1以上の進入制限情報を照合し、複数のレコードのうち少なくとも一部のレコードのそれぞれに含まれる端末識別情報と、少なくとも一部のレコードのそれぞれに含まれる信号情報により示される電波に関する情報と、ユーザがエリアの内部に存在していなかったことを示すラベルとを対応付けることで、学習用データセットを生成するラベル付与部を備えてよい。 Each of the above machine learning devices includes (i) terminal identification information for identifying the wireless terminal that transmitted each of the plurality of wireless signals, (ii) reception indicating the time at which each of the plurality of wireless signals was received Acquiring a plurality of records associated with time information, (iii) reception position information indicating the position at which each of the plurality of wireless signals was received, and (iv) signal information regarding radio waves of each of the plurality of wireless signals. A record acquisition unit may be provided. In each of the above machine learning devices, (i) area identification information for identifying each of the one or more areas, (ii) time period during which entry to the area identified by the area identification information is restricted a restriction information acquisition unit that acquires one or more pieces of entry restriction information shown in FIG. The above machine learning device includes (i) receiving position information included in each of the plurality of records acquired by the record acquisition unit, and (ii) included in each of the one or more entry restriction information acquired by the restriction information acquisition unit. A plurality of records and one or more entry restriction information are collated based on the area identification information stored, and the terminal identification information contained in each of at least some of the plurality of records and each of at least some of the records A labeling unit may be provided that generates a learning data set by associating information about radio waves indicated by the included signal information with a label indicating that the user was not inside the area.

上記の機械学習装置は、レコード取得部が取得した複数のレコードを、複数のレコードのそれぞれに含まれる端末識別情報及び受信時刻情報に基づいて、端末識別情報ごと、且つ、予め定められた条件を満足する期間ごとに集約する集約部を備えてよい。上記の機械学習装置において、集約部は、それぞれにおいて、(i)複数の無線信号のそれぞれを発信した無線端末を識別するための端末識別情報、(ii)集約部による集約処理の対象となった期間を示す集約期間情報、(iii)複数の無線信号のうち、端末識別情報により識別される無線端末が、集約期間情報により示される期間の間に発信した1以上の無線信号に関する1以上の特徴量を示す特徴情報が対応付けられた、1以上の集約レコードを生成してよい。上記の機械学習装置において、ラベル付与部は、1以上の集約レコードの少なくとも一部にラベルを付与することで、学習用データセットを生成してよい。 The above-described machine learning device obtains a plurality of records acquired by the record acquisition unit, based on the terminal identification information and the reception time information included in each of the plurality of records, for each terminal identification information and a predetermined condition. An aggregator may be provided for aggregating for each satisfying period. In the machine learning device described above, each aggregating unit includes (i) terminal identification information for identifying a wireless terminal that has transmitted each of the plurality of wireless signals, and (ii) the target of aggregation processing by the aggregating unit. Aggregation period information indicating a period, (iii) One or more features related to one or more radio signals transmitted during the period indicated by the aggregation period information by a radio terminal identified by the terminal identification information among the plurality of radio signals One or more aggregated records may be generated to which feature information indicating quantity is associated. In the machine learning device described above, the labeling unit may generate the learning data set by labeling at least part of the one or more consolidated records.

上記の機械学習装置において、学習モデルは、当該学習モデルに入力されたデータポイントごとに、当該学習モデルの予測又は判定に対する不確実性を推定するために利用される関数の値を算出してよい。上記の機械学習装置において、学習モデルは、算出された関数の値と、基準値とに基づいて、ユーザがエリアの内部に存在していたか否かを判定してよい。 In the above machine learning device, the learning model may calculate the value of a function used for estimating the uncertainty of prediction or judgment of the learning model for each data point input to the learning model. . In the machine learning device described above, the learning model may determine whether or not the user is present inside the area based on the calculated function value and the reference value.

上記の機械学習装置において、調整部は、モデル生成部により生成された学習モデルの受信者動作特性カーブ(ROCカーブ)を示すデータを算出してよい。上記の機械学習装置において、調整部は、ROCカーブ上のポイントであって、基準値として初期値が利用された場合と比較して、モデル生成部により生成された学習モデルの判定結果の真陽性率が大きくなるポイントに対応する基準値を、第2の値として決定してよい。 In the machine learning device described above, the adjustment unit may calculate data representing a receiver operating characteristic curve (ROC curve) of the learning model generated by the model generation unit. In the machine learning device described above, the adjustment unit compares a point on the ROC curve and an initial value as a reference value to a true positive determination result of the learning model generated by the model generation unit. A reference value corresponding to the point at which the rate increases may be determined as the second value.

上記の機械学習装置において、モデル生成部は、無線受信装置ごと、又は、エリアごとに、学習モデルを生成してよい。上記の機械学習装置において、無線受信装置は、無線通信を中継する中継装置であってよい。 In the machine learning device described above, the model generator may generate a learning model for each wireless receiving device or for each area. In the machine learning device described above, the wireless receiving device may be a relay device that relays wireless communication.

本発明の第2の態様においては、判定装置が提供される。上記の判定装置は、例えば、上記の機械学習装置を備える。上記の判定装置は、例えば、1以上の無線受信装置の少なくとも1つにより受信された複数の無線信号のそれぞれに関する情報を含む判定対象データを取得する判定対象取得部を備える。上記の判定装置は、例えば、(i)判定対象取得部が取得した判定対象データを、モデル生成部が生成した学習モデルに入力し、(ii)基準値として、調整部が決定した第2の値を利用して、判定対象データに関する無線信号を発信した1以上の無線端末のそれぞれのユーザが、判定対象データに関する無線信号を受信した無線受信装置の配されたエリアの内部に存在していたか否かを示す判定する判定部を備える。 In a second aspect of the invention, a determination device is provided. The determination device described above includes, for example, the machine learning device described above. The determination device described above includes, for example, a determination target acquisition unit that acquires determination target data including information about each of the plurality of radio signals received by at least one of the one or more radio reception devices. For example, the determination device (i) inputs the determination target data acquired by the determination target acquisition unit into the learning model generated by the model generation unit, and (ii) uses the second value determined by the adjustment unit as the reference value. Using the value, whether each user of one or more wireless terminals that transmitted wireless signals related to the determination target data existed within an area in which the wireless receiving device that received the wireless signals related to the determination target data was arranged A judgment unit for judging whether or not is provided.

本発明の第3の態様においては、機械学習方法が提供される。上記の機械学習方法は、例えば、予め定められた地理的範囲を有するエリアの内部に配された無線受信装置により受信された無線信号に関する情報を含むデータポイントが入力され、無線信号を発信した無線端末のユーザがエリアの内部に存在していたか否かを判定するために用いられる学習モデルを生成するモデル生成段階を有する。上記の機械学習方法は、例えば、モデル生成段階において生成された学習モデルが、ユーザがエリアの内部に存在していたか否か判定するための基準値を調整する調整段階を有する。上記の機械学習方法において、例えば、モデル生成段階は、(a)基準値として、学習モデルに応じた初期値を利用し、(b)(i)1以上の無線受信装置が受信した複数の無線信号のそれぞれに関する情報、及び、(ii)複数の無線信号のそれぞれを発信した無線端末のユーザが、複数の無線信号のそれぞれを受信した無線受信装置の配されたエリアの内部に存在していたか否かを示すラベルを含む学習用データセットを利用して機械学習を実行することにより、学習モデルを生成する段階を含む。上記の機械学習方法において、例えば、調整段階は、基準値として初期値が利用された場合と比較して、モデル生成段階において生成された学習モデルの判定結果の真陽性率が大きくなる第2の値を、調整後の基準値として決定する段階を含む。 In a third aspect of the invention, a machine learning method is provided. The above machine learning method, for example, is input with data points containing information about radio signals received by radio receivers located within an area having a predetermined geographic range, and the radio that originated the radio signal. There is a model generation stage for generating a learning model that is used to determine if the user of the terminal was within the area. The above machine learning method, for example, has an adjustment stage in which the learning model generated in the model generation stage adjusts the reference value for determining whether or not the user was inside the area. In the above machine learning method, for example, the model generation step includes (a) using an initial value according to the learning model as a reference value, and (b) (i) a plurality of radio signals received by one or more radio receiving devices. and (ii) whether the user of the wireless terminal that emitted each of the plurality of wireless signals was within the area in which the wireless receiving device that received each of the plurality of wireless signals was arranged. generating a learning model by performing machine learning using a training data set that includes a label indicating whether or not; In the above-described machine learning method, for example, the adjustment stage increases the true positive rate of the judgment result of the learning model generated in the model generation stage compared to the case where the initial value is used as the reference value. determining the value as the adjusted reference value.

本発明の第4の態様においては、プログラムが提供される。上記のプログラムを格納する非一時的コンピュータ可読媒体が提供されてもよい。上記のプログラムは、例えば、コンピュータを、上記の第1の態様に係る機械学習装置として機能させるためのプログラムである。上記のプログラムは、例えば、コンピュータを、上記の第2の態様に係る判定装置として機能させるためのプログラムである。上記のプログラムは、コンピュータに、上記の第3の態様に係る機械学習方法を実行させるためのプログラムであってもよい。 In a fourth aspect of the invention, a program is provided. A non-transitory computer-readable medium storing the above program may be provided. The program is, for example, a program for causing a computer to function as the machine learning device according to the first aspect. The program is, for example, a program for causing a computer to function as the determination device according to the second aspect. The program may be a program for causing a computer to execute the machine learning method according to the third aspect.

なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。 It should be noted that the above summary of the invention does not list all the necessary features of the invention. Subcombinations of these feature groups can also be inventions.

データ解析システム100のシステム構成の一例を概略的に示す。An example of the system configuration of the data analysis system 100 is shown schematically. 管理サーバ160の内部構成の一例を概略的に示す。An example of the internal configuration of the management server 160 is shown schematically. 格納部242の内部構成の一例を概略的に示す。An example of the internal configuration of the storage unit 242 is shown schematically. 入力データ生成部244における情報処理の一例を概略的に示す。An example of information processing in the input data generator 244 is shown schematically. データセット生成部252の内部構成の一例を概略的に示す。An example of the internal configuration of the data set generator 252 is shown schematically. 学習部254の内部構成の一例を概略的に示す。An example of the internal configuration of the learning unit 254 is shown schematically. 閾値調整部256の内部構成の一例を概略的に示す。An example of the internal configuration of the threshold adjuster 256 is schematically shown. 閾値調整部256における情報処理の一例を概略的に示す。An example of information processing in the threshold adjustment unit 256 is schematically shown. データテーブル900の一例を概略的に示す。An example of a data table 900 is shown schematically. データテーブル1000の一例を概略的に示す。An example of a data table 1000 is shown schematically. データテーブル1100の一例を概略的に示す。An example of a data table 1100 is shown schematically. データテーブル1200の一例を概略的に示す。An example of a data table 1200 is shown schematically. データテーブル1300の一例を概略的に示す。An example of a data table 1300 is shown schematically. データテーブル1400の一例を概略的に示す。An example of a data table 1400 is shown schematically. データテーブル1500の一例を概略的に示す。An example of a data table 1500 is shown schematically. データテーブル1600の一例を概略的に示す。An example of a data table 1600 is shown schematically. データテーブル1700の一例を概略的に示す。An example of a data table 1700 is shown schematically. 解析部240における情報処理の一例を概略的に示す。An example of information processing in the analysis unit 240 is shown schematically. 解析部240における情報処理の一例を概略的に示す。An example of information processing in the analysis unit 240 is shown schematically. データテーブル1700の一例を概略的に示す。An example of a data table 1700 is shown schematically. コンピュータ3000のシステム構成の一例を概略的に示す。An example of the system configuration of the computer 3000 is shown schematically.

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。なお、図面において、同一または類似の部分には同一の参照番号を付して、重複する説明を省く場合がある。 Hereinafter, the present invention will be described through embodiments of the invention, but the following embodiments do not limit the invention according to the claims. Also, not all combinations of features described in the embodiments are essential for the solution of the invention. In addition, in the drawings, the same or similar parts may be denoted by the same reference numerals to omit redundant description.

各実施形態において、各ユーザは、個人情報を利用したサービスを享受することに同意していることが好ましい。 In each embodiment, each user preferably agrees to receive services using personal information.

[データ解析システム100の概要]
図1は、データ解析システム100のシステム構成の一例を概略的に示す。本実施形態において、データ解析システム100は、管理サーバ160を備える。本実施形態においては、データ解析システム100の理解を容易にすることを目的として、管理サーバ160が、通信端末108からの要求に応じて、店舗12又は店舗14に来店した顧客の人数(来店人数と称される場合がある。)を推定し、上記の要求に対する応答として、上記の推定結果を示す情報を送信する場合を例として、データ解析システム100の詳細が説明される。
[Overview of data analysis system 100]
FIG. 1 schematically shows an example of a system configuration of a data analysis system 100. As shown in FIG. In this embodiment, the data analysis system 100 has a management server 160 . In the present embodiment, for the purpose of facilitating understanding of the data analysis system 100, the management server 160 responds to a request from the communication terminal 108 by determining the number of customers who visited the store 12 or 14 (the number of customers who visited the store 14). The data analysis system 100 will be described in detail by taking as an example a case of estimating , and transmitting information indicating the above estimation result as a response to the above request.

本実施形態において、店舗12は、予め定められた地理的範囲を有する。店舗12の内部には、アクセスポイント122と、来店確認機器142とが配される。本実施形態において、店舗14は、予め定められた地理的範囲を有する。店舗14の内部には、アクセスポイント124と、来店確認機器144とが配される。アクセスポイント122、アクセスポイント124、来店確認機器142及び来店確認機器144の少なくとも1つは、データ解析システム100の一部を構成してもよい。 In this embodiment, store 12 has a predetermined geographical range. Inside the store 12, an access point 122 and a visit confirmation device 142 are arranged. In this embodiment, store 14 has a predetermined geographic area. Inside the store 14, an access point 124 and a visit confirmation device 144 are arranged. At least one of access point 122 , access point 124 , visit confirmation device 142 and visit confirmation device 144 may form part of data analysis system 100 .

図1において、無線通信機能を有する通信端末102のユーザ22が、店舗12の内部に存在する。本実施形態において、通信端末102は、無線信号を利用して、アクセスポイント122との間で情報を送受する。例えば、通信端末102は無線信号を発信し、アクセスポイント122は当該無線信号を受信する。また、本実施形態において、ユーザ22は、来店確認機器142により提供される各種のサービスを利用する。このとき、来店確認機器142は、上記のサービスの提供者又は運営者によりユーザ22に割り当てられた識別情報、通信端末102の識別情報などを取得する。これにより、ユーザ22の来店が、来店確認機器142により検出される。 In FIG. 1 , a user 22 of a communication terminal 102 having a wireless communication function exists inside a store 12 . In this embodiment, communication terminal 102 transmits and receives information to and from access point 122 using radio signals. For example, communication terminal 102 emits a radio signal and access point 122 receives the radio signal. Further, in this embodiment, the user 22 uses various services provided by the store visit confirmation device 142 . At this time, the store visit confirmation device 142 acquires the identification information assigned to the user 22 by the provider or operator of the above service, the identification information of the communication terminal 102, and the like. Thus, the visit confirmation device 142 detects the visit of the user 22 .

図1において、無線通信機能を有する通信端末104のユーザ24は、店舗14の内部に存在する。本実施形態において、通信端末104は、無線信号を利用して、アクセスポイント124との間で情報を送受する。例えば、通信端末104は無線信号を発信し、アクセスポイント124は当該無線信号を受信する。また、本実施形態において、ユーザ24は、来店確認機器144により提供される各種のサービスを利用する。これにより、来店確認機器142がユーザ22の来店を検出した場合と同様の手順により、ユーザ24の来店が、来店確認機器144により検出される。 In FIG. 1, a user 24 of a communication terminal 104 having a wireless communication function exists inside a store 14 . In this embodiment, communication terminal 104 uses radio signals to transmit and receive information to and from access point 124 . For example, communication terminal 104 emits a radio signal and access point 124 receives the radio signal. Further, in this embodiment, the user 24 uses various services provided by the store visit confirmation device 144 . As a result, the store visit confirmation device 144 detects the visit of the user 24 by the same procedure as when the store visit confirmation device 142 detects the visit of the user 22 .

なお、本実施形態においては、店舗12及び店舗14のそれぞれの内部に配されたアクセスポイントの個数が1である場合を例として、データ解析システム100の詳細が説明される。しかしながら、データ解析システム100は本実施形態に限定されない。他の実施形態において、店舗12及び店舗14の少なくとも一方の内部に、複数個のアクセスポイントが配されてよい。 In the present embodiment, details of the data analysis system 100 will be described by taking as an example a case where the number of access points arranged inside each of the stores 12 and 14 is one. However, the data analysis system 100 is not limited to this embodiment. In other embodiments, multiple access points may be located within at least one of store 12 and store 14 .

[ログ情報の収集]
本実施形態に係るデータ解析システム100によれば、管理サーバ160が、アクセスポイント122から、アクセスポイント122が通信端末から受信した1又は複数の無線信号に関する情報を収集する。また、管理サーバ160は、アクセスポイント124から、アクセスポイント124が受信した1又は複数の無線信号のそれぞれに関する情報を収集する。
[Collect log information]
According to the data analysis system 100 according to the present embodiment, the management server 160 collects, from the access point 122, information regarding one or more wireless signals received by the access point 122 from communication terminals. Management server 160 also collects information from access point 124 regarding each of the one or more wireless signals received by access point 124 .

無線信号に関する情報(ログ情報と称される場合がある。)は、当該無線信号を受信したアクセスポイントを識別するための情報、当該無線信号が受信された時刻(受信時刻と称される場合がある。)を示す情報(受信時刻情報と称される場合がある。)、当該無線信号を発信した通信端末を識別するための情報(端末識別情報と称される場合がある。)、当該無線信号の電波に関する情報(信号情報と称される場合がある。)などを含んでよい。信号情報は、例えば、無線信号の電波強度を示す情報、無線信号の周波数帯を示す情報、及び、通信の接続段階を示す情報の少なくとも1つを含む。 Information on wireless signals (sometimes referred to as log information) includes information for identifying the access point that received the wireless signal, and the time at which the wireless signal was received (sometimes referred to as reception time). (sometimes referred to as reception time information), information for identifying the communication terminal that transmitted the radio signal (sometimes referred to as terminal identification information), the radio It may include information on the radio wave of the signal (sometimes referred to as signal information). The signal information includes, for example, at least one of information indicating the radio wave intensity of the radio signal, information indicating the frequency band of the radio signal, and information indicating the connection stage of communication.

移動体通信方式における通信端末とアクセスポイントとの間の通信の接続段階としては、位置登録要求段階、認証段階、アソシエーション段階、接続完了段階などが例示される。移動体通信方式以外の無線通信方式における通信端末とアクセスポイントとの間の通信の接続段階としては、プローブ要求段階、認証段階、アソシエーション段階、接続完了段階ディアソシエーション段階、ディタッチ段階(切り離し段階と称される場合もある。)などが例示される。 A location registration request stage, an authentication stage, an association stage, a connection completion stage, and the like are exemplified as connection stages of communication between a communication terminal and an access point in a mobile communication system. The connection stages of communication between a communication terminal and an access point in a wireless communication system other than the mobile communication system include a probe request stage, an authentication stage, an association stage, a connection completion stage, a disassociation stage, and a detach stage (referred to as a detachment stage). may be used.) and the like are exemplified.

ログ情報の詳細は後述されるが、ログ情報の具体例は、例えば、図12に示される。図12において、データテーブル1200は、無線信号を受信したアクセスポイントのAPID1222と、当該無線信号の受信時刻を示す情報1224と、当該無線信号を発信した通信端末の端末ID1226と、当該無線信号の電波に関する情報1228とを対応付けて格納する。データテーブル1200の各行は、ログ情報の一例を表す。 Details of the log information will be described later, but a specific example of the log information is shown in FIG. 12, for example. In FIG. 12, data table 1200 includes APID 1222 of the access point that received the wireless signal, information 1224 indicating the reception time of the wireless signal, terminal ID 1226 of the communication terminal that transmitted the wireless signal, and radio wave of the wireless signal. information 1228 about is associated with and stored. Each row of the data table 1200 represents an example of log information.

APID1222は、管理サーバ160が各アクセスポイントに割り当てた識別情報であり、各アクセスポイントの識別情報の一例であってよい。無線信号の電波に関する情報1228としては、電波強度を示す情報、周波数帯を示す情報、接続段階を示す情報などが例示される。 The APID 1222 is identification information assigned to each access point by the management server 160, and may be an example of identification information of each access point. Examples of the information 1228 on the radio wave of the radio signal include information indicating radio wave intensity, information indicating the frequency band, information indicating the connection stage, and the like.

[来店確認情報の収集]
本実施形態において、管理サーバ160は、来店確認機器142から、店舗12において来店が確認された顧客に関する情報を収集する。管理サーバ160は、来店確認機器144から、店舗14において来店が確認された顧客に関する情報を収集する。来店が確認された顧客に関する情報(来店確認情報と称される場合がある。)は、当該顧客を識別するための情報(ユーザIDと称される場合がある。)、当該顧客の来店が確認された時刻(来店時刻と称される場合がある。)を示す情報、当該顧客が来店した店舗等を示す情報、当該顧客の来店を確認した手段を示す情報などを含んでよい。
[Collection of visit confirmation information]
In this embodiment, the management server 160 collects information about customers who have been confirmed to visit the store 12 from the store visit confirmation device 142 . The management server 160 collects information about customers who are confirmed to have visited the store 14 from the store visit confirmation device 144 . Information about a customer whose visit has been confirmed (sometimes referred to as visit confirmation information) includes information for identifying the customer (sometimes referred to as a user ID), It may include information indicating the time (sometimes referred to as visit time), information indicating the store visited by the customer, information indicating means for confirming the visit of the customer, and the like.

上記の顧客を識別するための情報は、任意のサービスの提供者又は運営者により各顧客に割り当てられた識別情報であってもよく、各顧客が利用する通信端末の端末IDであってもよい。来店時刻を示す情報は、顧客が来店した日付を示す情報であってもよく、顧客が来店した日付及び時刻を示す情報であってもよい。 The information for identifying the customer may be identification information assigned to each customer by any service provider or operator, or may be the terminal ID of the communication terminal used by each customer. . The information indicating the visit time may be information indicating the date when the customer visits the store, or may be information indicating the date and time when the customer visits the store.

来店確認情報の詳細は後述されるが、来店確認情報の具体例は、例えば、図13に示される。図13において、データテーブル1300は、ユーザのユーザID1322と、当該ユーザの行動が確認された場所の位置情報1324と、当該ユーザの行動が確認された時刻を示す情報1326とを対応付けて格納する。データテーブル1300の各行は、来店確認情報の一例を表す。 Although the details of the store-visit confirmation information will be described later, a specific example of the store-visit confirmation information is shown in FIG. 13, for example. In FIG. 13, the data table 1300 stores the user ID 1322 of the user, the position information 1324 of the location where the behavior of the user was confirmed, and the information 1326 indicating the time when the behavior of the user was confirmed. . Each row of the data table 1300 represents an example of store visit confirmation information.

ユーザIDとしては、例えば、(i)来店確認機器142又は来店確認機器144が取得したクレジットカードのカード番号、会員制サービスの会員番号又はアカウント、通信端末のMACアドレス、(ii)来店確認機器142又は来店確認機器144に入力された氏名、クレジットカードのカード番号、会員制サービスの会員番号又はアカウントなどが利用される。 As the user ID, for example, (i) the credit card number acquired by the store visit confirmation device 142 or the store visit confirmation device 144, the membership number or account of the membership service, the MAC address of the communication terminal, (ii) the store visit confirmation device 142 Alternatively, the name, credit card number, membership service member number or account entered in the store visit confirmation device 144 is used.

[学習用データセットの生成]
本実施形態によれば、管理サーバ160は、収集された来店確認情報及びログ情報を解析して、上記の判定処理に利用される学習モデルの教師データとして利用され得る学習用データセットを生成する。例えば、管理サーバ160は、まず、収集された来店確認情報及びログ情報を照合して、1以上の来店確認情報の少なくとも一部と、1以上のログ情報の少なくとも一部とを関連付ける。
[Generate training data set]
According to this embodiment, the management server 160 analyzes the collected store visit confirmation information and log information, and generates a learning data set that can be used as teacher data for the learning model used in the determination process described above. . For example, the management server 160 first collates the collected visit confirmation information and log information, and associates at least part of one or more pieces of visit confirmation information with at least part of one or more pieces of log information.

管理サーバ160は、例えば、(i)各来店確認情報に含まれる、顧客を識別するための情報、及び、当該顧客の来店時刻を示す情報と、(ii)各ログ情報に含まれる、端末識別情報及び受信時刻情報とをキーとして、来店確認情報及びログ情報を照合する。もしも、顧客を識別するための情報と、端末識別情報との対応関係を示す情報(対応関係情報と称される場合がある。)を入手できるのであれば、管理サーバ160はこのような情報を参照して来店確認情報及びログ情報を照合してもよい。 For example, the management server 160 includes (i) information for identifying a customer and information indicating the time when the customer comes to the store, which are included in each store visit confirmation information, and (ii) terminal identification information, which is included in each log information. The store visit confirmation information and the log information are collated using the information and the reception time information as keys. If it is possible to obtain information indicating the correspondence between the information for identifying the customer and the terminal identification information (sometimes referred to as correspondence information), the management server 160 can obtain such information. The visit confirmation information and the log information may be collated by referring to them.

対応関係情報の詳細は後述されるが、対応関係情報の具体例は、例えば、図11に示される。図11において、データテーブル1100は、各通信端末の端末ID1122と、各通信端末のユーザのユーザID1124とを対応付けて格納する。データテーブル1100の各行は、対応関係情報の一例を表す。 Although the details of the correspondence information will be described later, a specific example of the correspondence information is shown in FIG. 11, for example. In FIG. 11, data table 1100 stores terminal ID 1122 of each communication terminal and user ID 1124 of the user of each communication terminal in association with each other. Each row of the data table 1100 represents an example of correspondence information.

管理サーバ160が来店確認情報及びログ情報を照合する手順の詳細は後述されるが、管理サーバ160は、例えば、下記の手順に従って、来店確認情報及びログ情報を照合する。管理サーバ160は、まず、データテーブル1300から、特定の一行に記録されたログ情報を読み込む。次に、管理サーバ160は、(i)ログ情報に含まれる端末ID1226をキーとして、データテーブル1100を参照し、(ii)端末ID1226に合致する端末ID1122に対応付けられた、ユーザID1124を抽出する。次に、管理サーバ160は、(i)抽出されたユーザID1124と、ログ情報に含まれる無線信号の受信時刻を示す情報1224とをキーとして、データテーブル1300を参照し、(ii)ユーザID1322がユーザID1124に合致し、ユーザの行動が確認された時刻を示す情報1326が、上記の受信時刻を示す情報1224に合致する来店確認情報を抽出する。管理サーバ160は、抽出された来店確認情報と、読み込んだログ情報とを関連付けることができると判定する。 The details of the procedure for the management server 160 to collate the store visit confirmation information and the log information will be described later. The management server 160 first reads log information recorded in a specific line from the data table 1300 . Next, the management server 160 (i) refers to the data table 1100 using the terminal ID 1226 included in the log information as a key, and (ii) extracts the user ID 1124 associated with the terminal ID 1122 that matches the terminal ID 1226. . Next, the management server 160 refers to the data table 1300 using (i) the extracted user ID 1124 and the information 1224 indicating the reception time of the radio signal included in the log information as keys, and (ii) the user ID 1322 is Store-visit confirmation information that matches the user ID 1124 and whose information 1326 indicating the time when the user's behavior was confirmed matches the information 1224 indicating the reception time is extracted. The management server 160 determines that the extracted store visit confirmation information can be associated with the read log information.

次に、管理サーバ160は、来店確認情報と関連付けられたログ情報に、当該ログ情報により示される通信端末のユーザが、当該ログ情報に関連する無線信号を受信したアクセスポイントの配された店舗等の内部に存在していたことを示すラベル(陽性ラベルと称される場合がある。)を付与する。これにより、陽性ラベルの付与された学習用データセットが生成される。 Next, the management server 160 stores in the log information associated with the store visit confirmation information the store or the like where the access point where the user of the communication terminal indicated by the log information received the radio signal associated with the log information is located. A label (sometimes referred to as a positive label) indicating that it existed inside the As a result, a positive-labeled learning data set is generated.

管理サーバ160が学習用データセットを生成する手順の詳細は後述されるが、管理サーバ160は、例えば、下記の手順に従って、学習用データセットを生成する。管理サーバ160は、まず、各アクセスポイントのAPIDと、各アクセスポイントが配される店舗の店舗IDとが対応付けられたデータベースを参照して、上記のログ情報に関連する無線信号を受信したアクセスポイントの配された店舗等の識別情報を取得する。 The details of the procedure for the management server 160 to generate the learning data set will be described later, but the management server 160 generates the learning data set according to the following procedure, for example. Management server 160 first refers to a database in which the APID of each access point is associated with the store ID of the store where each access point is located, and accesses the access points that have received radio signals related to the above log information. Acquire the identification information of the store or the like where points are distributed.

上記のデータベースの具体例は、例えば、図9に示される。図9において、データテーブル900は、各アクセスポイントのAPID922と、各アクセスポイントのMACアドレスを示す情報924と、各アクセスポイントが配される店舗の店舗ID926とを対応付けて格納する。 A specific example of the above database is shown in FIG. 9, for example. In FIG. 9, data table 900 stores APID 922 of each access point, information 924 indicating the MAC address of each access point, and store ID 926 of the store where each access point is arranged, in association with each other.

管理サーバ160は、例えば、(i)ログ情報に含まれるAPID1222をキーとして、データテーブル900を参照し、(ii)APID1222に合致するAPID922に対応付けられた、店舗ID926を抽出する。管理サーバ160は、例えば、(i)ログ情報に含まれる端末ID1226、無線信号の受信時刻を示す情報1224、及び、無線信号の電波に関する情報1228と、(ii)抽出された店舗ID926と、(iii)陽性ラベルとを対応付けることで、学習用データセットの一部を構成するデータポイント(学習用データポイントと称される場合がある。)を生成する。管理サーバ160が、来店確認情報と関連付けられた複数のログ情報のそれぞれを同様に加工することで、複数の学習用のデータポイントを含む学習用データセットが生成される。 For example, the management server 160 (i) refers to the data table 900 using the APID 1222 included in the log information as a key, and (ii) extracts the shop ID 926 associated with the APID 922 matching the APID 1222 . The management server 160, for example, (i) the terminal ID 1226 included in the log information, the information 1224 indicating the reception time of the wireless signal, and the information 1228 regarding the radio wave of the wireless signal, (ii) the extracted shop ID 926, ( iii) generating data points (sometimes referred to as training data points) forming part of the training data set by associating them with positive labels; The management server 160 similarly processes each of the pieces of log information associated with the store visit confirmation information, thereby generating a learning data set including a plurality of learning data points.

学習用データセットの詳細は後述されるが、学習用データセットの具体例は、例えば、図15に示される。図15において、データテーブル1500の各行は、学習用データポイントの一例を表す。図15において、データテーブル1500は、無線信号を発信した通信端末の端末ID1422と、無線信号を受信したアクセスポイントが配された店舗の店舗ID1424と、無線信号の受信日を示す情報1426と、無線信号の特徴量を示す情報1428と、ラベルの種類を示す情報1532とを対応付けて格納する。 Details of the learning data set will be described later, and a specific example of the learning data set is shown in FIG. 15, for example. In FIG. 15, each row of data table 1500 represents an example of a training data point. 15, data table 1500 includes terminal ID 1422 of the communication terminal that transmitted the wireless signal, store ID 1424 of the store where the access point that received the wireless signal is located, information 1426 indicating the date of reception of the wireless signal, and wireless communication terminal ID 1424. Information 1428 indicating the feature amount of the signal and information 1532 indicating the type of label are associated and stored.

データテーブル1500において、端末ID1422には、例えば、ログ情報に含まれる端末ID1226が記録される。店舗ID1424には、例えば、上記の抽出された店舗ID926が記録される。無線信号の受信日を示す情報1426には、例えば、ログ情報に含まれる無線信号の受信時刻を示す情報1224により示される時刻、又は、年月日を示す情報が記録される。無線信号の特徴量を示す情報1428には、例えば、ログ情報に含まれる無線信号の電波に関する情報1228、若しくは、その一部が記録される。ラベルの種類を示す情報1532には、陽性であることを示す情報が記録される。なお、無線信号の特徴量を示す情報1428には、複数のログ情報に含まれる無線信号の電波に関する情報1228を統計処理して得られた統計量が記録されてもよい。 In the data table 1500, the terminal ID 1422 records, for example, the terminal ID 1226 included in the log information. For the store ID 1424, for example, the store ID 926 extracted above is recorded. The information 1426 indicating the reception date of the radio signal records, for example, the time indicated by the information 1224 indicating the reception time of the radio signal included in the log information, or information indicating the date. The information 1428 indicating the characteristic amount of the radio signal records, for example, the information 1228 on the radio wave of the radio signal included in the log information, or a part thereof. Information indicating positive is recorded in the information 1532 indicating the type of label. Note that the information 1428 indicating the characteristic amount of the radio signal may record a statistic obtained by statistically processing the information 1228 regarding radio waves of the radio signal included in the plurality of pieces of log information.

[学習モデルの構築]
本実施形態によれば、管理サーバ160は、上記の学習用データセットを利用して、学習モデルを生成する。管理サーバ160は、学習用データセットを構成する各データポイントに含まれる陽性ラベルにより示される事項を目的変数として、学習モデルを生成する。
[Building a learning model]
According to this embodiment, the management server 160 generates a learning model using the learning data set. The management server 160 generates a learning model using items indicated by positive labels included in each data point constituting the learning data set as objective variables.

管理サーバ160は、少なくとも、学習用データセットを構成する各データポイントに含まれる信号情報により示される無線信号の電波に関する各種の物理量又は当該物理量の統計値を特徴量として、学習モデルを生成してよい。管理サーバ160は、学習用データセットを構成する各データポイントに含まれる無線信号を受信したアクセスポイントの識別情報を特徴量として、学習モデルを生成してもよい。管理サーバ160は、学習用データセットを構成する各データポイントに含まれる受信時刻情報を特徴量として、学習モデルを生成してもよい。 The management server 160 generates a learning model using at least various physical quantities related to radio waves of radio signals indicated by signal information included in each data point constituting the learning data set or statistical values of the physical quantities as feature quantities. good. The management server 160 may generate a learning model using, as a feature quantity, the identification information of the access point that received the wireless signal included in each data point forming the learning data set. The management server 160 may generate a learning model using reception time information included in each data point constituting the learning data set as a feature amount.

上記の学習モデルは、例えば、店舗等の内部に配されたアクセスポイントにより受信された無線信号に関する情報を含むデータポイントが入力され、当該無線信号を発信した通信端末のユーザが当該店舗等の内部に存在していたか否かを判定するために用いられる。上記の学習モデルは、入力されたデータポイント(サンプルと称される場合もある。)を、適切なクラスに分類するクラス分類器であってよい。 In the above learning model, for example, a data point containing information about a radio signal received by an access point placed inside a store is input, and the user of the communication terminal that transmitted the radio signal is It is used to determine whether the The learning model described above may be a classifier that classifies input data points (sometimes referred to as samples) into appropriate classes.

例えば、学習モデルは、入力されたデータポイントを、店舗等の内部に存在する通信端末が発信した無線信号に関するクラスと、店舗等の内部に存在しない通信端末が発信した無線信号に関するクラスとに分類する。店舗等の内部に存在する通信端末が発信した無線信号に関するクラスは、当該無線信号を発信した通信端末のユーザが当該店舗等の内部に存在していたことを示すクラスの一例であってよい。店舗等の内部に存在しない通信端末が発信した無線信号に関するクラスは、当該無線信号を発信した通信端末のユーザが当該店舗等の内部に存在していなかったことを示すクラスの一例であってよい。 For example, the learning model classifies the input data points into a class related to wireless signals transmitted by communication terminals inside the store, etc., and a class related to wireless signals transmitted by communication terminals not located inside the store, etc. do. A class related to a radio signal transmitted by a communication terminal inside a store or the like may be an example of a class indicating that the user of the communication terminal that transmitted the radio signal was present inside the store or the like. A class related to a radio signal transmitted by a communication terminal that does not exist inside a store, etc. may be an example of a class indicating that the user of the communication terminal that transmitted the radio signal was not present inside the store, etc. .

上記の学習モデルは、当該学習モデルに入力されたデータポイントごとに、当該学習モデルの予測又は判定に対する不確実性を推定するために利用される関数の値を算出してよい。学習モデルの予測又は判定に対する不確実性を推定するために利用される関数としては、入力されたデータポイントが各クラスに属する確率(分類確率と称される場合がある)を算出するための関数、当該学習モデルの予測結果又は判定結果の不確実性を評価するための決定関数などが例示される。 The learning model may calculate, for each data point input to the learning model, the value of a function used to estimate the uncertainty of the prediction or decision of the learning model. A function used to estimate the uncertainty of prediction or judgment of a learning model is a function for calculating the probability that an input data point belongs to each class (sometimes referred to as classification probability). , a decision function for evaluating the uncertainty of the prediction result or determination result of the learning model, and the like.

上記の学習モデルにおいては、(i)算出された分類確率又は決定関数の値と、(ii)上記の学習モデルが、通信端末のユーザが店舗等の内部に存在していたか否かを判定するための閾値(分類用の閾値と称される場合がある。)とに基づいて、上記のユーザがエリアの内部に存在していたか否かが判定される。上述のとおり、学習モデルは、当該学習モデルの予測又は判定に対する不確実性を推定するために利用される関数の値を出力する機能を有する。そして、学習モデルにおいては、分類用の閾値として、上記の関数の種類に応じた初期値が設定されている。 In the above learning model, (i) the calculated classification probability or the value of the decision function, and (ii) the above learning model determines whether the user of the communication terminal was inside the store or the like. It is determined whether or not the user exists within the area based on a threshold for classification (sometimes referred to as a threshold for classification). As described above, the learning model has the function of outputting the value of the function used to estimate the uncertainty of the prediction or decision of the learning model. In the learning model, an initial value corresponding to the type of function is set as a threshold for classification.

本実施形態によれば、管理サーバ160は、まず、学習用データセットの一部を利用して機械学習処理を実行する。機械学習処理においては、モデルによる学習と、モデルの検証とが実施される。 According to this embodiment, the management server 160 first executes machine learning processing using part of the learning data set. In machine learning processing, model learning and model verification are performed.

上述のとおり、本実施形態によれば、学習用データセットは、例えば、来店確認情報に基づいて生成される。この場合、学習用データセットは、「店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用したユーザの通信端末が発信した無線信号に関するデータ」に陽性ラベルが付与されたデータセットとなる。 As described above, according to the present embodiment, the learning data set is generated based on store visit confirmation information, for example. In this case, the learning data set is data obtained by assigning a positive label to "data related to radio signals transmitted by the communication terminal of the user who entered the store 12 and used the service provided by the store visit confirmation device 142". becomes a set.

そのため、来店確認情報に基づいて生成された学習用データセットを利用して機械学習処理が実行された場合、入力されたデータポイントを、(i)「(a)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用したユーザの通信端末が発信した無線信号」が属するクラスと、(ii)「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」及び「(c)店舗12の内部に進入しなかったユーザの通信端末が発信した無線信号」が属するクラスとに、精度よく分類するための学習モデルが構築される。 Therefore, when machine learning processing is performed using a learning data set generated based on the store visit confirmation information, the input data points are (i) "(a) entered into the store 12, (ii) a class to which "(b) enters the store 12 and is provided by the store visit confirmation device 142; Radio signals transmitted by communication terminals of users who did not use the service" and "(c) Radio signals transmitted by communication terminals of users who did not enter the store 12" belong to this class with high accuracy. A learning model is constructed for

しかしながら、実際のビジネスにおいては多くの場合、学習済みの学習モデルは、入力されたデータポイントを、(i)店舗等の内部に存在する通信端末が発信した無線信号に関するクラスと、(ii)店舗等の内部に存在しない通信端末が発信した無線信号に関するクラスとに分類することが要求される。つまり、学習済みの学習モデルは、入力されたデータポイントを、(i)「(a)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用したユーザの通信端末が発信した無線信号」及び「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」が属するクラスと、(ii)「(c)店舗12の内部に進入しなかったユーザの通信端末が発信した無線信号」が属するクラスとに、精度よく分類することが要求される。 However, in many cases in actual business, a trained learning model classifies input data points into (i) classes related to radio signals emitted by communication terminals existing inside a store, etc., and (ii) stores It is required to classify into a class related to radio signals transmitted by a communication terminal that does not exist inside such as a class. In other words, the learned learning model is based on the following: (i) "(a) the communication terminal of the user who entered the store 12 and used the service provided by the store visit confirmation device 142 transmitted A class to which "(b) a radio signal transmitted by a communication terminal of a user who entered the store 12 and did not use the service provided by the store visit confirmation device 142" belongs; and (ii) "( c) It is required to classify with high accuracy into the class to which "radio signals transmitted by communication terminals of users who have not entered the shop 12" belongs.

来店確認情報に基づいて生成された学習用データセットを利用して機械学習処理が実行された場合、学習済みの学習モデルは、(a)及び(b)を陽性ラベルとして有するデータセットに基づいて学習された別の学習モデルを用いる場合と比較して、より多くの「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」を陰性と判定する可能性がある。そこで、学習モデルの評価を向上させるためには、学習モデルが「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」を陽性と判定する割合を増加させることが好ましい。 When the machine learning process is performed using the learning data set generated based on the store visit confirmation information, the learned learning model has (a) and (b) as positive labels Based on the data set Compared to the case of using another learned model, more "(b) the communication terminal of the user who entered the store 12 and did not use the service provided by the store visit confirmation device 142 "radio signal" may be determined as negative. Therefore, in order to improve the evaluation of the learning model, the learning model should be evaluated as follows: "(b) a wireless communication terminal of a user who entered the store 12 and did not use the service provided by the store visit confirmation device 142; It is preferable to increase the percentage of positives that "signal".

しかしながら、学習モデルが「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」を陽性と判定する割合を増加させると、学習モデルが「(c)店舗12の内部に進入しなかったユーザの通信端末が発信した無線信号」を陽性と判定する割合も増加する可能性がある。そこで、学習モデルが「(c)店舗12の内部に進入しなかったユーザの通信端末が発信した無線信号」を陽性と判定する割合の増加を抑制しつつ、学習モデルが「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」を陽性と判定する割合を増加させることが好ましい。 However, the learning model increases the percentage of positive determinations of "(b) a wireless signal transmitted by a communication terminal of a user who entered the store 12 and did not use the service provided by the store visit confirmation device 142". , there is a possibility that the learning model will determine positively "(c) the radio signal transmitted by the communication terminal of the user who did not enter the store 12". Therefore, while suppressing an increase in the percentage of positive determinations of "(c) the radio signal transmitted by the communication terminal of the user who did not enter the store 12", It is preferable to increase the percentage of positive determinations of "radio signals transmitted by communication terminals of users who have entered the store and have not used the service provided by the store visit confirmation device 142".

そこで、管理サーバ160は、次に、上記の機械学習処理において利用されなかった学習用データセットを利用して、分類用の閾値を調整する。例えば、管理サーバ160は、分類用の閾値として、学習モデルに応じた初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなるように、分類用の閾値を調整する。管理サーバ160は、分類用の閾値として初期値が利用された場合と比較して、学習モデルの判定結果の偽陽性率が小さくなるように、分類用の閾値を調整してもよい。 Therefore, the management server 160 next uses the learning data set that was not used in the machine learning process to adjust the classification threshold. For example, the management server 160 sets the threshold for classification so that the true positive rate of the determination result of the learning model is higher than when the initial value corresponding to the learning model is used as the threshold for classification. adjust. The management server 160 may adjust the threshold for classification so that the false positive rate of the determination result of the learning model is smaller than when the initial value is used as the threshold for classification.

本実施形態によれば、管理サーバ160は、実際の判定処理において、学習済みの学習モデル及び調整後の閾値を利用して、学習及び検証に利用されていない新たなデータポイント(判定対象データと称される場合がある。)を、(i)店舗等の内部に存在する通信端末が発信した無線信号に関するクラスと、(ii)店舗等の内部に存在しない通信端末が発信した無線信号に関するクラスとに分類する。一実施形態によれば、分類用の閾値として調整後の閾値が利用された場合、分類用の閾値として学習モデルに応じた初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなる。他の実施形態によれば、分類用の閾値として調整後の閾値が利用された場合、分類用の閾値として学習モデルに応じた初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなり、且つ、学習モデルの判定結果の偽陽性率が小さくなる。 According to this embodiment, in the actual determination process, the management server 160 uses the learned learning model and the adjusted threshold value to create new data points that are not used for learning and verification (determination target data and (i) a class related to wireless signals transmitted by communication terminals existing inside a store, etc., and (ii) a class related to wireless signals transmitted by communication terminals not located inside a store, etc. and According to one embodiment, when the adjusted threshold value is used as the threshold for classification, compared with the case where the initial value corresponding to the learning model is used as the threshold for classification, the judgment result of the learning model is higher. Higher true positive rate. According to another embodiment, when the adjusted threshold value is used as the classification threshold value, compared with the case where the initial value corresponding to the learning model is used as the classification threshold value, the determination result of the learning model is The true positive rate of is increased, and the false positive rate of the determination result of the learning model is decreased.

店舗12、店舗14などの店舗等は、エリアの一例であってよい。データ解析システム100は、機械学習装置及び判定装置の一例であってよい。通信端末102、通信端末104などの通信端末は、無線端末の一例であってよい。アクセスポイント122、アクセスポイント124などのアクセスポイントは、レコード取得部、無線受信装置及び中継装置の一例であってよい。管理サーバ160は、機械学習装置及び判定装置の一例であってよい。管理サーバ160は、レコード取得部、行動履歴取得部、及び、ラベル付与部の一例であってもよい。 Stores such as the store 12 and the store 14 may be an example of an area. Data analysis system 100 may be an example of a machine learning device and a determination device. Communication terminals, such as communication terminal 102 and communication terminal 104, may be examples of wireless terminals. Access points, such as access point 122 and access point 124, may be examples of record retrievers, wireless receivers, and relays. Management server 160 may be an example of a machine learning device and a determination device. The management server 160 may be an example of a record acquisition unit, an action history acquisition unit, and a label assignment unit.

1以上のログ情報のそれぞれは、レコードの一例であってよい。1以上の来店確認情報のそれぞれは、行動履歴情報の一例であってよい。1以上の入力データのそれぞれは、集約レコードの一例であってよい。分類用の閾値は、基準値の一例であってよい。調整後の閾値は、第2の値の一例であってよい。 Each of the one or more pieces of log information may be an example of a record. Each of the one or more store visit confirmation information may be an example of action history information. Each of the one or more pieces of input data may be an example of an aggregation record. A threshold for classification may be an example of a reference value. The adjusted threshold may be an example of the second value.

本実施形態によれば、管理サーバ160は、上記の手順に従って構築された学習済みの学習モデルを利用して、実際の判定処理を実行する。上述されたとおり、本実施形態によれば、学習モデルが、来店確認情報に基づいて生成された学習用データセットを利用して構築される。これにより、多くの場合において十分な判定精度が得られる。さらに、本実施形態によれば、判定処理に先だって、分類用の閾値が調整される。そして、学習モデルが、調整された分類用の閾値を利用して、入力されたデータポイントを分類する。これにより、判定精度がさらに向上する。 According to this embodiment, the management server 160 uses the learned learning model constructed according to the above procedure to perform the actual determination process. As described above, according to the present embodiment, a learning model is constructed using a learning data set generated based on store visit confirmation information. This provides sufficient determination accuracy in many cases. Furthermore, according to this embodiment, the threshold for classification is adjusted prior to the determination process. The learning model then classifies the input data points using the adjusted classification thresholds. This further improves the determination accuracy.

一般的に、教師あり機械学習においては、如何にして大量の教師データを収集するかが問題となる。特に、機械学習を利用して、通信端末の無線信号に関する情報に基づいて、当該通信端末が特定のエリア内に存在するか否かを判定する場合、そもそも、大量の教師データを収集することが難しい。そこで、発明者らは、例えば、アクセスポイント122及び来店確認機器142設置された店舗12に来店した顧客の通信端末が発信した無線信号に着目し、当該無線信号に関するログ情報を教師データとして利用することを想到した。しかしながら、この場合であっても、顧客が、店舗12の内部には進入したものの、来店確認機器142により提供されるサービスを利用しなかった場合には、当該顧客のデータを教師データとして利用することができない可能性もある。 Generally, in supervised machine learning, the problem is how to collect a large amount of teacher data. In particular, when machine learning is used to determine whether or not a communication terminal exists in a specific area based on information related to the radio signal of the communication terminal, it is necessary to collect a large amount of training data in the first place. difficult. Therefore, the inventors, for example, pay attention to the radio signal transmitted by the communication terminal of the customer visiting the store 12 where the access point 122 and the store visit confirmation device 142 are installed, and use the log information related to the radio signal as training data. I thought of it. However, even in this case, if the customer enters the store 12 but does not use the service provided by the store visit confirmation device 142, the customer's data is used as training data. It may not be possible.

この点に関し、本実施形態においては、例えば、「店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用した顧客の通信端末が発信した無線信号」を陽性ラベルとする学習用データセットを教師データとして学習モデルが構築された後、分類用の閾値が調整される。これにより、(i)「店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用した顧客の通信端末が発信した無線信号」を陽性ラベルとする学習用データセットを、(ii)「店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用した顧客の通信端末が発信した無線信号」及び「店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかった顧客の通信端末が発信した無線信号」を陽性ラベルとする学習用データセットの代わりに利用することができる。 In this regard, in the present embodiment, for example, a positive label is a "radio signal emitted by a communication terminal of a customer who enters the store 12 and uses the service provided by the store visit confirmation device 142". After a learning model is constructed using the data set as teacher data, the threshold for classification is adjusted. As a result, (i) a learning data set with a positive label of "a wireless signal transmitted by a communication terminal of a customer who entered the store 12 and used the service provided by the store visit confirmation device 142" is obtained as (ii ) "a wireless signal transmitted by a communication terminal of a customer who entered the store 12 and used the service provided by the store visit confirmation device 142" It can be used instead of a learning data set with a positive label of "radio signal emitted by a communication terminal of a customer who did not use the service."

[データ解析システム100の各部の概要]
本実施形態において、通信ネットワーク10は、通信端末108、アクセスポイント122、アクセスポイント124、来店確認機器142及び来店確認機器144の少なくとも1つと、管理サーバ160との間で、情報を伝達する。通信ネットワーク10は、有線通信の伝送路であってもよく、無線通信の伝送路であってもよく、無線通信の伝送路及び有線通信の伝送路の組み合わせであってもよい。
[Overview of Each Part of Data Analysis System 100]
In this embodiment, the communication network 10 transmits information between at least one of the communication terminal 108 , the access point 122 , the access point 124 , the store visit confirmation device 142 and the store visit confirmation device 144 and the management server 160 . The communication network 10 may be a wired communication transmission line, a wireless communication transmission line, or a combination of a wireless communication transmission line and a wired communication transmission line.

通信ネットワーク10は、無線通信網、インターネット、P2Pネットワーク、専用回線、VPN、電力線通信回線などを含んでもよい。無線通信網における通信方式は、(i)3G方式、LTE方式、4G方式などの移動体通信方式であってもよく、(ii)Bluetooth(登録商標)、Zigbee(登録商標)、NFC(Near Field Communication)のような近距離無線方式、WiFi(登録商標)のような無線LAN方式、WiMAX(登録商標)のような無線MAN方式、無線WAN方式などの無線データ通信方式であってもよい。 Communication network 10 may include wireless communication networks, the Internet, P2P networks, leased lines, VPNs, power line communication lines, and the like. The communication system in the wireless communication network may be (i) a mobile communication system such as a 3G system, an LTE system, or a 4G system; Communication), a wireless LAN system such as WiFi (registered trademark), a wireless MAN system such as WiMAX (registered trademark), a wireless data communication system such as a wireless WAN system.

本実施形態において、通信端末102及び通信端末104のそれぞれは、無線通信機能を有し、無線信号を発信する。無線通信の通信方式は、移動体通信方式であってもよく、無線データ通信方式であってもよい。通信端末102は、例えば、アクセスポイント122及び通信ネットワーク10を介して、他の通信機器との間で情報を送受する。通信端末104は、例えば、アクセスポイント124及び通信ネットワーク10を介して、他の通信機器との間で情報を送受する。 In this embodiment, each of communication terminal 102 and communication terminal 104 has a wireless communication function and transmits a wireless signal. The wireless communication method may be a mobile communication method or a wireless data communication method. Communication terminal 102 transmits and receives information to and from other communication devices via access point 122 and communication network 10, for example. Communication terminal 104 transmits and receives information to and from other communication devices via access point 124 and communication network 10, for example.

通信端末102及び通信端末104のそれぞれの詳細は、特に限定されない。通信端末102及び通信端末104のそれぞれとしては、パーソナルコンピュータ、携帯端末などが例示される。携帯端末としては、携帯電話、スマートフォン、PDA、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータなどが例示される。通信端末102及び通信端末104のそれぞれは、携帯端末であってよい。 Details of each of communication terminal 102 and communication terminal 104 are not particularly limited. Each of the communication terminal 102 and the communication terminal 104 is exemplified by a personal computer, a mobile terminal, and the like. Examples of mobile terminals include mobile phones, smart phones, PDAs, tablets, notebook or laptop computers, wearable computers, and the like. Each of communication terminal 102 and communication terminal 104 may be a mobile terminal.

本実施形態において、通信端末108は、通信ネットワーク10を介して、管理サーバ160との間で情報を送受する。通信端末108は、管理サーバ160に対して、各種の要求を送信してよい。通信端末108は、管理サーバ160から、上記の要求に対する応答を取得してよい。例えば、通信端末108は、店舗12又は店舗14に来店した顧客の人数を推定するための処理を実行することを要求する。 In this embodiment, the communication terminal 108 transmits and receives information to and from the management server 160 via the communication network 10 . Communication terminal 108 may transmit various requests to management server 160 . Communication terminal 108 may obtain a response to the above request from management server 160 . For example, communication terminal 108 requests to perform processing for estimating the number of customers who have visited store 12 or store 14 .

通信端末108の詳細は、特に限定されない。通信端末108としては、パーソナルコンピュータ、携帯端末などが例示される。携帯端末としては、携帯電話、スマートフォン、PDA、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータなどが例示される。 Details of the communication terminal 108 are not particularly limited. Examples of the communication terminal 108 include a personal computer and a mobile terminal. Examples of mobile terminals include mobile phones, smart phones, PDAs, tablets, notebook or laptop computers, wearable computers, and the like.

本実施形態において、アクセスポイント122は、無線LAN方式により、通信端末102の通信を中継する。例えば、アクセスポイント122は、通信端末102と、通信ネットワーク10との間で情報を伝達させる。アクセスポイント122及び通信端末102の間では、通信が確立する前の段階であっても、各種の信号がやり取りされる。例えば、アクセスポイント122及び通信端末102の接続が完了して、通信端末102が他の情報処理装置との間で通信を開始する前に、アクセスポイント122及び通信端末102の間では、プローブ要求に関連する処理、認証処理、アソシエーション処理などが実行される。 In this embodiment, the access point 122 relays communication of the communication terminal 102 using a wireless LAN system. For example, access point 122 allows information to be conveyed between communication terminal 102 and communication network 10 . Various signals are exchanged between the access point 122 and the communication terminal 102 even before communication is established. For example, after the connection between the access point 122 and the communication terminal 102 is completed, and before the communication terminal 102 starts communication with another information processing device, a probe request is issued between the access point 122 and the communication terminal 102. Related processing, authentication processing, association processing, etc. are executed.

本実施形態において、アクセスポイント122は、通信端末102が出力した無線信号を受信する。アクセスポイント122は、アクセスポイント122に到達した無線信号の電波強度が予め定められた値と等しい又は当該値よりも大きい場合に、当該無線信号が受信されたと判断してよい。アクセスポイント122は、受信された無線信号を解析して、通信端末102を識別するための識別情報(端末IDと称される場合がある。)を取得する。 In this embodiment, the access point 122 receives radio signals output by the communication terminal 102 . The access point 122 may determine that the wireless signal has been received when the radio field strength of the wireless signal that has reached the access point 122 is equal to or greater than a predetermined value. Access point 122 analyzes the received radio signal and acquires identification information (sometimes referred to as a terminal ID) for identifying communication terminal 102 .

上記の無線信号は、通信が確立した後で受信される信号であってもよく、通信が確立する前に受信される信号であってもよい。通信が確立する前に受信される信号としては、プローブ要求、認証要求、アソシエーション要求などが例示される。通信が確立した後で受信される信号は、ディアソシエーション要求、又は、ディタッチ要求(切り離し要求と称される場合もある。)であってもよい。これらの信号に含まれる通信端末102の識別情報としては、MACアドレスが例示される。 The radio signal may be a signal received after communication is established, or a signal received before communication is established. Examples of signals received before communication is established include probe requests, authentication requests, association requests, and the like. A signal received after communication is established may be a disassociation request or a detach request (sometimes referred to as a detach request). A MAC address is exemplified as the identification information of the communication terminal 102 included in these signals.

通信端末102の端末IDは、端末識別情報の一例であってよい。通信端末102のMACアドレスは、端末識別情報の一例であってよい。 The terminal ID of communication terminal 102 may be an example of terminal identification information. The MAC address of communication terminal 102 may be an example of terminal identification information.

アクセスポイント122は、例えば、無線信号を発信した通信端末102の端末IDと、当該無線信号が受信された時刻を示す時刻情報と、当該無線信号の電波に関する情報とが対応付けられたログ情報を、管理サーバ160に送信する。ログ情報は、アクセスポイント122の識別情報と、無線信号を発信した通信端末102の端末IDと、当該無線信号が受信された時刻を示す情報と、当該無線信号の電波に関する情報とが対応付けられた情報であってもよい。アクセスポイント122の識別情報としては、SSID、MACアドレス、IPアドレスなどが例示される。 The access point 122 stores, for example, log information in which the terminal ID of the communication terminal 102 that transmitted the wireless signal, time information indicating the time at which the wireless signal was received, and information on the radio wave of the wireless signal are associated with each other. , to the management server 160 . The log information includes identification information of the access point 122, the terminal ID of the communication terminal 102 that transmitted the radio signal, information indicating the time when the radio signal was received, and information about the radio wave of the radio signal. It may be information that has been Examples of the identification information of the access point 122 include SSID, MAC address, IP address, and the like.

本実施形態において、アクセスポイント124は、無線LAN方式により、通信端末104の通信を中継する。例えば、アクセスポイント124は、通信端末104と、通信ネットワーク10との間で情報を伝達させる。アクセスポイント124及び通信端末104の間では、通信が確立する前の段階であっても、各種の信号がやり取りされる。例えば、アクセスポイント124及び通信端末104の接続が完了して、通信端末104が他の情報処理装置との間で通信を開始する前に、アクセスポイント124及び通信端末104の間では、プローブ要求に関連する処理、認証処理、アソシエーション処理などが実行される。 In this embodiment, the access point 124 relays communication of the communication terminal 104 using a wireless LAN system. For example, access point 124 allows information to be conveyed between communication terminal 104 and communication network 10 . Various signals are exchanged between the access point 124 and the communication terminal 104 even before communication is established. For example, after the connection between the access point 124 and the communication terminal 104 is completed, and before the communication terminal 104 starts communication with another information processing device, a probe request is issued between the access point 124 and the communication terminal 104. Related processing, authentication processing, association processing, etc. are executed.

本実施形態において、アクセスポイント124は、通信端末104が出力した無線信号を受信する。アクセスポイント124は、アクセスポイント124に到達した無線信号の電波強度が予め定められた値と等しい又は当該値よりも大きい場合に、当該無線信号が受信されたと判断してよい。アクセスポイント124は、受信された無線信号を解析して、通信端末104を識別するための識別情報(端末IDと称される場合がある。)を取得する。 In this embodiment, the access point 124 receives radio signals output by the communication terminal 104 . The access point 124 may determine that the wireless signal has been received when the radio signal strength of the wireless signal that reaches the access point 124 is equal to or greater than a predetermined value. Access point 124 analyzes the received radio signal and acquires identification information (sometimes referred to as a terminal ID) for identifying communication terminal 104 .

上記の無線信号は、通信が確立した後で受信される信号であってもよく、通信が確立する前に受信される信号であってもよい。通信が確立する前に受信される信号としては、プローブ要求、認証要求、アソシエーション要求などが例示される。通信が確立した後で受信される信号は、ディアソシエーション要求、又は、ディタッチ要求(切り離し要求と称される場合もある。)であってもよい。これらの信号に含まれる通信端末104の識別情報としては、MACアドレスが例示される。 The radio signal may be a signal received after communication is established, or a signal received before communication is established. Examples of signals received before communication is established include probe requests, authentication requests, association requests, and the like. A signal received after communication is established may be a disassociation request or a detach request (sometimes referred to as a detach request). A MAC address is exemplified as the identification information of the communication terminal 104 included in these signals.

通信端末104の端末IDは、端末識別情報の一例であってよい。通信端末104のMACアドレスは、端末識別情報の一例であってよい。 The terminal ID of communication terminal 104 may be an example of terminal identification information. The MAC address of communication terminal 104 may be an example of terminal identification information.

アクセスポイント124は、例えば、無線信号を発信した通信端末104の端末IDと、当該無線信号が受信された時刻を示す情報と、当該無線信号の電波に関する情報とが対応付けられたログ情報を、管理サーバ160に送信する。ログ情報は、アクセスポイント124の識別情報と、無線信号を発信した通信端末104の端末IDと、当該無線信号が受信された時刻を示す情報と、当該無線信号の電波に関する情報とが対応付けられた情報であってもよい。アクセスポイント124の識別情報としては、SSID、MACアドレス、IPアドレスなどが例示される。 The access point 124 stores, for example, log information in which the terminal ID of the communication terminal 104 that transmitted the radio signal, information indicating the time at which the radio signal was received, and information on the radio wave of the radio signal are associated with each other. Send to the management server 160 . The log information includes identification information of the access point 124, the terminal ID of the communication terminal 104 that transmitted the radio signal, information indicating the time when the radio signal was received, and information about the radio wave of the radio signal. It may be information that has been Examples of the identification information of the access point 124 include SSID, MAC address, IP address, and the like.

本実施形態において、来店確認機器142は、店舗12の内部におけるユーザ22の行動を検出し、通信端末102のユーザ22が店舗12の内部に存在したことを示す来店確認情報を生成する。来店確認機器142は、生成された来店確認情報を管理サーバ160に送信する。来店確認情報は、上記の行動に関与したユーザ22を識別するための識別情報(ユーザIDと称される場合がある。)と、当該行動がなされた時刻を示す情報とが対応付けられた情報であってよい。来店確認情報は、上記の行動に関与したユーザ22のユーザIDと、当該行動がなされた時刻を示す情報と、当該行動がなされた場所の位置を示す情報とが対応付けられた情報であってもよい。ユーザIDは、個人の特定につながらないデータであることが好ましい。 In this embodiment, the store visit confirmation device 142 detects the behavior of the user 22 inside the store 12 and generates store visit confirmation information indicating that the user 22 of the communication terminal 102 was inside the store 12 . The store visit confirmation device 142 transmits the generated store visit confirmation information to the management server 160 . The store visit confirmation information is information in which identification information (sometimes referred to as a user ID) for identifying the user 22 involved in the above action is associated with information indicating the time at which the action was performed. can be The store visit confirmation information is information in which the user ID of the user 22 involved in the action, information indicating the time when the action was performed, and information indicating the position of the place where the action was performed are associated with each other. good too. The user ID is preferably data that does not lead to individual identification.

来店確認機器142は、近距離無線通信又は有線通信により、通信端末102との間で通信を確立し、通信端末102の端末IDを取得してもよい。この場合、来店確認情報は、通信端末102の端末IDと、当該端末IDが取得された時刻を示す情報と、店舗12の位置を示す情報とが対応付けられた情報であってよい。店舗12の位置を示す情報は、店舗12の名称、店舗12の住所、店舗12の位置座標などが例示される。来店確認情報は、通信端末102の端末IDと、当該端末IDが取得された時刻を示す情報とが対応付けられた情報であってよい。 The store visit confirmation device 142 may establish communication with the communication terminal 102 by short-range wireless communication or wired communication, and acquire the terminal ID of the communication terminal 102 . In this case, the store-visit confirmation information may be information in which the terminal ID of the communication terminal 102, information indicating the time when the terminal ID was acquired, and information indicating the location of the store 12 are associated with each other. The information indicating the location of the store 12 is exemplified by the name of the store 12, the address of the store 12, the location coordinates of the store 12, and the like. The visit confirmation information may be information in which the terminal ID of the communication terminal 102 and information indicating the time when the terminal ID was acquired are associated with each other.

店舗12の内部におけるユーザ22の行動としては、(i)店舗12の内部で商品を購入する行為、(ii)店舗12の内部で提供されるサービスを利用する行為、(iii)店舗12の内部で、生体認証システムを利用する行為、(iv)店舗12の内部で、近距離無線通信又は有線通信による通信端末102及び来店確認機器142の通信を確立する行為、(v)入退場管理システムを利用して店舗12の内部に進入する行為などが例示される。店舗12の内部で提供されるサービスは、会員制サービスであってもよい。会員制サービスとしては、クレジットカードサービス、ポイントカードサービス、ポイントサービス、ポイントプログラム、ロイヤリティプログラム、マイレージサービス、マイレージプログラムなどを例示することができる。入退場管理システムは、ユーザ22の生体情報、ユーザ22に貸与されたIDカードに格納されたユーザID、及び、通信端末102の端末IDの少なくとも1つを利用して、ユーザ22の進入及び退出の少なくとも一方を管理してよい。 The actions of the user 22 inside the store 12 include (i) an act of purchasing a product inside the store 12, (ii) an act of using a service provided inside the store 12, and (iii) an act inside the store 12. , the act of using the biometric authentication system, (iv) the act of establishing communication between the communication terminal 102 and the store visit confirmation device 142 by short-range wireless communication or wired communication inside the store 12, and (v) the entrance/exit management system. An act of entering the inside of the store 12 using it is exemplified. The service provided inside the store 12 may be a membership service. Examples of membership services include credit card services, point card services, point services, point programs, loyalty programs, mileage services, and mileage programs. The entrance/exit management system utilizes at least one of the biometric information of the user 22, the user ID stored in the ID card lent to the user 22, and the terminal ID of the communication terminal 102 to control the entry and exit of the user 22. You may manage at least one of

来店確認機器142は、ユーザ22のユーザID又は通信端末102の端末IDと、時刻を示す情報とが入力される機器であれば、その詳細は特に限定されない。また、ユーザIDの種類も、特に限定されない。来店確認機器142としては、店舗12の店頭で提供されるサービスを利用した顧客の氏名又は識別情報が入力されるシステム、POSシステム、会員制サービスの会員番号を取得するシステム、入退場管理システム、生体認証システムなどが例示される。店舗12の店頭で提供されるサービスを利用した顧客の氏名又は識別情報が入力されるシステムは、店舗12のスタッフが、上記の氏名又は識別情報を入力するシステムであってもよい。各システムに入力される情報又は各システムが取得する情報は、ユーザIDの一例であってよい。各システムに入力される情報又は各システムが取得する情報の種類は、ユーザIDの種類の一例であってよい。 The store visit confirmation device 142 is not particularly limited in detail as long as it is a device into which the user ID of the user 22 or the terminal ID of the communication terminal 102 and the information indicating the time are inputted. Also, the type of user ID is not particularly limited. The store visit confirmation device 142 includes a system for inputting the name or identification information of a customer who used the service provided at the store 12, a POS system, a system for acquiring a membership number for a membership service, an entrance/exit management system, A biometrics authentication system etc. are illustrated. The system in which the names or identification information of customers who use the services provided at the storefront of the store 12 are entered may be a system in which the staff of the store 12 enter the names or identification information. Information input to each system or information acquired by each system may be an example of a user ID. The type of information input to each system or the type of information acquired by each system may be an example of the type of user ID.

本実施形態において、来店確認機器144は、店舗14の内部におけるユーザ24の行動を検出し、通信端末104のユーザ24が店舗14の内部に存在したことを示す来店確認情報を生成する。来店確認機器144は、生成された来店確認情報を管理サーバ160に送信する。来店確認情報は、上記の行動に関与したユーザ24を識別するための識別情報(ユーザIDと称される場合がある。)と、当該行動がなされた時刻を示す情報とが対応付けられた情報であってよい。来店確認情報は、上記の行動に関与したユーザ24のユーザIDと、当該行動がなされた時刻を示す情報と、当該行動がなされた場所の位置を示す情報とが対応付けられた情報であってもよい。ユーザIDは、個人の特定につながらないデータ、又は、個人の特定が困難なデータであることが好ましい。 In this embodiment, the store visit confirmation device 144 detects the behavior of the user 24 inside the store 14 and generates store visit confirmation information indicating that the user 24 of the communication terminal 104 was inside the store 14 . The store visit confirmation device 144 transmits the generated store visit confirmation information to the management server 160 . The store visit confirmation information is information in which identification information (sometimes referred to as a user ID) for identifying the user 24 involved in the above action is associated with information indicating the time at which the action was performed. can be The store visit confirmation information is information in which the user ID of the user 24 involved in the action, information indicating the time when the action was performed, and information indicating the position of the place where the action was performed are associated with each other. good too. The user ID is preferably data that cannot be used to identify an individual, or data that makes it difficult to identify an individual.

来店確認機器144は、近距離無線通信又は有線通信により、通信端末104との間で通信を確立し、通信端末104の端末IDを取得してもよい。この場合、来店確認情報は、通信端末104の端末IDと、当該端末IDが取得された時刻を示す情報と、店舗14の位置を示す情報とが対応付けられた情報であってよい。店舗14の位置を示す情報は、店舗14の名称、店舗14の住所、店舗14の位置座標などが例示される。来店確認情報は、通信端末104の端末IDと、当該端末IDが取得された時刻を示す情報とが対応付けられた情報であってよい。 The store visit confirmation device 144 may establish communication with the communication terminal 104 by short-range wireless communication or wired communication, and acquire the terminal ID of the communication terminal 104 . In this case, the store-visit confirmation information may be information in which the terminal ID of the communication terminal 104, information indicating the time when the terminal ID was obtained, and information indicating the location of the store 14 are associated with each other. The information indicating the location of the store 14 is exemplified by the name of the store 14, the address of the store 14, the location coordinates of the store 14, and the like. The store visit confirmation information may be information in which the terminal ID of the communication terminal 104 and information indicating the time when the terminal ID was acquired are associated with each other.

店舗14の内部におけるユーザ24の行動としては、(i)店舗14の内部で商品を購入する行為、(ii)店舗14の内部で提供されるサービスを利用する行為、(iii)店舗14の内部で、生体認証システムを利用する行為、(iv)店舗14の内部で、近距離無線通信又は有線通信による通信端末104及び来店確認機器144の通信を確立する行為、(v)入退場管理システムを利用して店舗14の内部に進入する行為などが例示される。店舗14の内部で提供されるサービスは、会員制サービスであってもよい。会員制サービスとしては、クレジットカードサービス、ポイントカードサービス、ポイントサービス、ポイントプログラム、ロイヤリティプログラム、マイレージサービス、マイレージプログラムなどを例示することができる。入退場管理システムは、ユーザ24の生体情報、ユーザ24に貸与されたIDカードに格納されたユーザID、及び、通信端末104の端末IDの少なくとも1つを利用して、ユーザ24の進入及び退出の少なくとも一方を管理してよい。 The actions of the user 24 inside the store 14 include (i) the act of purchasing products inside the store 14, (ii) the act of using services provided inside the store 14, and (iii) the inside of the store 14. , the act of using the biometric authentication system, (iv) the act of establishing communication between the communication terminal 104 and the visit confirmation device 144 by short-range wireless communication or wired communication inside the store 14, and (v) the entrance/exit management system. An act of entering the inside of the store 14 using it is exemplified. The service provided inside the store 14 may be a membership service. Examples of membership services include credit card services, point card services, point services, point programs, loyalty programs, mileage services, and mileage programs. The entrance/exit management system utilizes at least one of the biometric information of the user 24, the user ID stored in the ID card lent to the user 24, and the terminal ID of the communication terminal 104 to control the entry and exit of the user 24. You may manage at least one of

来店確認機器144は、ユーザ24のユーザID又は通信端末104の端末IDと、時刻を示す情報とが入力される機器であれば、その詳細は特に限定されない。来店確認機器144としては、店舗14の店頭で提供されるサービスを利用した顧客の氏名又は識別情報が入力されるシステム、POSシステム、会員制サービスの会員番号を取得するシステム、入退場管理システム、生体認証システムなどが例示される。店舗14の店頭で提供されるサービスを利用した顧客の氏名又は識別情報が入力されるシステムは、店舗14のスタッフが、上記の氏名又は識別情報を入力するシステムであってもよい。 The store visit confirmation device 144 is not particularly limited in detail as long as it is a device to which the user ID of the user 24 or the terminal ID of the communication terminal 104 and the information indicating the time are inputted. The store visit confirmation device 144 includes a system for inputting the name or identification information of a customer who uses the service provided at the store 14, a POS system, a system for acquiring a membership number for a membership service, an entrance/exit management system, A biometrics authentication system etc. are illustrated. The system in which the names or identification information of customers who use the services provided at the shop 14 are input may be a system in which the staff of the shop 14 inputs the names or identification information.

本実施形態において、管理サーバ160は、データ解析システム100における情報処理を管理する。管理サーバ160は、ログ情報を管理してよい。管理サーバ160は、例えば、アクセスポイント122及びアクセスポイント124の少なくとも一方から、1以上のログ情報を取得する。管理サーバ160は、取得されたログ情報をデータベースに格納する。管理サーバ160は、来店確認情報を管理してよい。管理サーバ160は、例えば、来店確認機器142及び来店確認機器144の少なくとも一方から、1以上の来店確認情報を取得する。管理サーバ160は、取得された来店確認情報をデータベースに格納する。 In this embodiment, the management server 160 manages information processing in the data analysis system 100 . The management server 160 may manage log information. The management server 160 acquires one or more pieces of log information from at least one of the access points 122 and 124, for example. The management server 160 stores the acquired log information in the database. The management server 160 may manage store visit confirmation information. For example, the management server 160 acquires one or more items of store visit confirmation information from at least one of the store visit confirmation device 142 and the store visit confirmation device 144 . The management server 160 stores the acquired visit confirmation information in the database.

本実施形態において、管理サーバ160は、収集されたログ情報を解析して、各ログ情報に関連する無線信号を発信した通信端末のユーザが、当該無線信号を発信したアクセスポイントの配された店舗等の内部に存在した否かを判定する。より具体的には、管理サーバ160は、上記の判定処理に用いられる学習モデルを生成してよい。上記の学習モデルには、ログ情報、又は、ログ情報が予め定められたアルゴリズムに基づいて処理されて得られたデータが入力される。上記の学習モデルは、上記のログ情報に関連する無線信号を発信した通信端末のユーザが、当該無線信号を発信したアクセスポイントの配された店舗等の内部に存在した否かに関する判定結果を出力する。管理サーバ160は、分類用の閾値を調整してよい。管理サーバ160は、上記の学習モデルと、調整された閾値とを用いて、上記の判定処理を実行してよい。 In this embodiment, the management server 160 analyzes the collected log information, and the user of the communication terminal that has transmitted the radio signal related to each piece of log information It is determined whether or not it exists inside the More specifically, the management server 160 may generate a learning model used for the determination process described above. Log information or data obtained by processing log information based on a predetermined algorithm is input to the learning model. The above learning model outputs a determination result as to whether or not the user of the communication terminal that transmitted the radio signal related to the above log information was present inside the store or the like where the access point that transmitted the radio signal is located. do. Management server 160 may adjust the threshold for classification. The management server 160 may perform the determination process described above using the learning model described above and the adjusted threshold.

本実施形態において、管理サーバ160は、通信端末108から、各種の要求を取得する。管理サーバ160は、上記の要求に応じた処理を実行し、当該処理の実行結果を上記の要求に対する応答として通信端末108に送信する。例えば、管理サーバ160は、通信端末108からの要求に応じて、店舗12又は店舗14に来店した顧客の人数を推定するための処理を実行する。管理サーバ160は、通信端末108からの要求に応じて、店舗12又は店舗14の外を通行する通行人の人数を推定するための処理を実行してもよい。管理サーバ160の詳細は、後述される。 In this embodiment, the management server 160 acquires various requests from the communication terminal 108 . The management server 160 executes processing in response to the request, and transmits the execution result of the processing to the communication terminal 108 as a response to the request. For example, the management server 160 executes processing for estimating the number of customers who have visited the store 12 or 14 in response to a request from the communication terminal 108 . The management server 160 may execute processing for estimating the number of passers-by passing outside the store 12 or 14 in response to a request from the communication terminal 108 . Details of the management server 160 will be described later.

なお、本実施形態においては、管理サーバ160が、(i)特定の行動に関与した1以上のユーザのそれぞれを識別するためのユーザ識別情報、及び、(ii)特定の行動がなされた時刻を示す行動時刻情報が対応付けられた行動履歴情報として、来店確認情報を利用する場合を例として、管理サーバ160の詳細が説明される。しかしながら、行動履歴情報は本実施形態に限定されない。 In this embodiment, the management server 160 stores (i) user identification information for identifying each of the one or more users involved in a specific action, and (ii) the time at which the specific action was performed. The details of the management server 160 will be described by taking as an example a case where store visit confirmation information is used as action history information associated with indicated action time information. However, the action history information is not limited to this embodiment.

行動履歴情報としては、商品の購買履歴、サービスの利用履歴などが例示される。商品の購買履歴又はサービスの利用履歴としては、クレジットカードの利用履歴、POS情報に基づく購買履歴、特定の施設の入退場履歴、会員登録したユーザに特典を付与するサービスの利用履歴などが例示される。会員登録したユーザに特典を付与するサービスとしては、ポイントカードサービス、ポイントサービス、ポイントプログラム、ロイヤリティプログラム、マイレージサービス、マイレージプログラムなどが例示される。会員登録したユーザに特典を付与するサービスは、鉄道会社、航空会社、高速道路運営会社、企業、企業グループなどにより提供されてよい。 Examples of the action history information include product purchase history and service usage history. Examples of product purchase history or service usage history include credit card usage history, purchase history based on POS information, entry/exit history of specific facilities, and usage history of services that provide privileges to users who have registered as members. be. A point card service, a point service, a point program, a loyalty program, a mileage service, a mileage program, and the like are examples of services that give benefits to users who have registered as members. Services that give benefits to users who have registered as members may be provided by railway companies, airlines, expressway operating companies, companies, corporate groups, and the like.

クレジットカードの利用履歴は、例えば、クレジットカード番号と、クレジットカードを利用した店舗と、クレジットカードを利用した時間とが対応付けられた情報を含む。会員登録したユーザに特典を付与するサービスの利用履歴は、例えば、会員IDと、商品を購入又はサービスを利用した店舗と、サービスを利用した時間とが対応付けられた情報を含む。クレジットカード番号、会員IDなどは、更に匿名化された識別記号に置換されていてもよい。 The credit card usage history includes, for example, information in which the credit card number, the store where the credit card was used, and the time when the credit card was used are associated with each other. The usage history of the service that gives privileges to users who have registered as members includes, for example, information in which the member ID, the store where the product was purchased or the service was used, and the time when the service was used are associated with each other. Credit card numbers, member IDs, etc. may be replaced with further anonymized identification symbols.

行動履歴情報の他の例としては、RTB(Real Time Bidding)サービスのような広告入札サービスにおける、ビッドリクエスト(入札リクエストと称される場合がある。)が例示される。例えば、ユーザが広告枠を有するWebページにアクセスすると、AdExchangeを介して、SSP(Supply Side Platform)からDSP(Demand Side Platform)にビッドリクエストが発行される。 Another example of action history information is a bid request (sometimes referred to as a bid request) in an advertisement bidding service such as an RTB (Real Time Bidding) service. For example, when a user accesses a web page having an ad space, a bid request is issued from a SSP (Supply Side Platform) to a DSP (Demand Side Platform) via AdExchange.

ビッドリクエストには、広告枠を有するWebページを閲覧しているユーザを識別するユーザIDが含まれる。ユーザIDは、例えば、クッキー(Cookie)である。ユーザが、携帯端末上で動作するウェブブラウザを介して、上記Webページを閲覧している場合のように、ビッドリクエストに、緯度、経度などの位置情報が含まれる場合がある。また、AdExchangeからDSPに送信されたビッドリクエストには、100msec程度の入札期限が設定されており、ほぼリアルタイムに広告枠が売買される。したがって、ビッドリクエストと、ビッドリクエストが発行若しくは受信された時間又はビッドリクエストの入札期限とを対応づけて格納することで、1以上のビッドリクエストを行動履歴情報として利用することができる。 The bid request includes a user ID that identifies the user browsing the web page having the ad space. A user ID is, for example, a cookie. A bid request may include location information such as latitude and longitude, as in the case where the user is browsing the web page via a web browser running on a mobile terminal. In addition, a bid deadline of about 100 msec is set in the bid request sent from AdExchange to the DSP, and the advertising space is bought and sold almost in real time. Therefore, one or more bid requests can be used as action history information by correlating and storing the bid request with the time when the bid request was issued or received or the bid deadline of the bid request.

行動履歴情報の他の例としては、画像又は映像が撮影された位置及び時間に関する情報が付与された画像データ又は映像データであってよい。本実施形態において、まず、被写体認識アルゴリズムを用いて、画像データ又は映像データから被写体の特徴を抽出する。抽出された被写体の特徴により、被写体を識別することができる。次に、被写体の特徴と、画像又は映像が撮影された位置及び時間に関する情報とを対応付けることで、画像データ又は映像データを行動履歴情報として利用することができる。 Another example of action history information may be image data or video data to which information about the position and time at which an image or video was shot is added. In this embodiment, first, features of a subject are extracted from image data or video data using a subject recognition algorithm. The subject can be identified by the extracted features of the subject. Next, by associating the feature of the subject with the information about the position and time when the image or video was taken, the image data or video data can be used as action history information.

行動履歴情報の他の例としては、位置情報を含むSNS(Social Networking Service)上の情報であってもよい。行動履歴情報は、上記の位置情報を含む情報と、当該情報がSNS上にアップロードされた時刻を示す情報とが対応付けられた情報であってもよい。位置情報を含むSNS上の情報としては、Geoタグが付与されたTweet、Facebook(登録商標)のチェックイン情報、画像又は映像が撮影された位置及び時間に関する情報が付与された画像データ又は映像データなどが例示される。例えば、Goeタグが付与されたTweetは、Twitter(登録商標)のアカウントと、当該Tweetが発信された位置情報と、当該Tweetが発信された時間とが対応付けられた情報を含む。 Another example of action history information may be information on SNS (Social Networking Service) including location information. The action history information may be information in which information including the location information is associated with information indicating the time when the information was uploaded on the SNS. Information on SNS including location information includes tweets with Geo tags, Facebook (registered trademark) check-in information, and image data or video data with information about the location and time when an image or video was taken. etc. are exemplified. For example, a Tweet with a Goe tag includes information in which a Twitter (registered trademark) account, location information at which the Tweet was sent, and time at which the Tweet was sent are associated with each other.

なお、本実施形態においては、無線受信装置がアクセスポイントであり、予め定められた地理的範囲を有するエリアが、当該アクセスポイントの設置された店舗である場合を例として、管理サーバ160の詳細が説明された。しかしながら、管理サーバ160は本実施形態に限定されない。他の実施形態において、無線受信装置は、移動体通信網の一部を構成する基地局であってもよい。この場合、予め定められた地理的範囲を有するエリアは、各基地局のセルであってよい。 In this embodiment, the wireless receiving device is an access point, and an area having a predetermined geographical range is a store where the access point is installed. explained. However, the management server 160 is not limited to this embodiment. In another embodiment, the radio receiver may be a base station forming part of a mobile communication network. In this case, the area with the predetermined geographical range may be the cell of each base station.

また、本実施形態においては、通信端末108が、店舗12又は店舗14に来店した顧客の人数を推定するための処理を実行することを要求する場合を例として、データ解析システム100の詳細が説明された。しかしながら、データ解析システム100は本実施形態に限定されない。他の実施形態において、通信端末108は、店舗12又は店舗14の外を通行する通行人の人数を推定するための処理を実行することを要求してもよい。 Further, in the present embodiment, the details of the data analysis system 100 will be described by taking as an example a case where the communication terminal 108 requests execution of processing for estimating the number of customers who have visited the store 12 or 14. was done. However, the data analysis system 100 is not limited to this embodiment. In another embodiment, communication terminal 108 may request that a process be performed to estimate the number of passersby passing outside store 12 or store 14 .

[データ解析システム100の各部の具体的な構成]
データ解析システム100の各部は、ハードウエアにより実現されてもよく、ソフトウエアにより実現されてもよく、ハードウエアとソフトウエアとの組み合わせにより実現されてもよい。データ解析システム100の構成要素の少なくとも一部がソフトウエアにより実現される場合、当該ソフトウエアにより実現される構成要素は、一般的な構成の情報処理装置において、当該構成要素に関する動作を規定したプログラムを起動することにより実現されてよい。
[Specific configuration of each part of data analysis system 100]
Each part of the data analysis system 100 may be implemented by hardware, software, or a combination of hardware and software. When at least part of the components of the data analysis system 100 are implemented by software, the components implemented by the software are programs that define the operations of the components in an information processing device with a general configuration. may be implemented by invoking the

プログラムは、CD-ROM、DVD-ROM、メモリ、ハードディスクなどのコンピュータ読み取り可能な媒体に記憶されていてもよく、ネットワークに接続された記憶装置に記憶されていてもよい。プログラムは、コンピュータ読み取り可能な媒体又はネットワークに接続された記憶装置から、データ解析システム100の少なくとも一部を構成するコンピュータにインストールされてよい。プログラムが実行されることにより、コンピュータが、データ解析システム100の各部の少なくとも一部として機能してもよい。 The program may be stored in a computer-readable medium such as a CD-ROM, DVD-ROM, memory, hard disk, etc., or may be stored in a storage device connected to a network. The program may be installed on a computer forming at least part of the data analysis system 100 from a computer-readable medium or network-connected storage device. By executing the program, the computer may function as at least part of each part of the data analysis system 100 .

コンピュータをデータ解析システム100の各部の少なくとも一部として機能させるプログラムは、データ解析システム100の各部の動作を規定したモジュールを備えてよい。これらのプログラム又はモジュールは、データ処理装置、入力装置、出力装置、記憶装置等に働きかけて、コンピュータをデータ解析システム100の各部として機能させたり、コンピュータにデータ解析システム100の各部における情報処理方法を実行させたりする。 A program that causes a computer to function as at least part of each unit of data analysis system 100 may include a module that defines the operation of each unit of data analysis system 100 . These programs or modules act on a data processing device, an input device, an output device, a storage device, etc. to cause the computer to function as each part of the data analysis system 100, or instruct the computer to perform information processing methods in each part of the data analysis system 100. or let it run.

プログラムに記述された情報処理は、当該プログラムがコンピュータに読込まれることにより、当該プログラムに関連するソフトウエアと、データ解析システム100の各種のハードウエア資源とが協働した具体的手段として機能する。そして、上記の具体的手段が、本実施形態におけるコンピュータの使用目的に応じた情報の演算又は加工を実現することにより、当該使用目的に応じたデータ解析システム100が構築される。 The information processing described in the program functions as concrete means in which the software related to the program and various hardware resources of the data analysis system 100 cooperate when the program is read into the computer. . The data analysis system 100 corresponding to the purpose of use of the computer in this embodiment is constructed by the specific means described above realizing the calculation or processing of information according to the purpose of use of the computer.

図2は、管理サーバ160の内部構成の一例を概略的に示す。本実施形態において、管理サーバ160は、入出力制御部220と、情報収集部230と、解析部240と、来店人数推定部270とを備える。本実施形態において、解析部240は、格納部242と、入力データ生成部244と、モデル構築部250と、判定部260とを有する。本実施形態において、モデル構築部250は、データセット生成部252と、学習部254と、閾値調整部256とを含む。本実施形態において、管理サーバ160の各部は、互いに情報を送受してよい。 FIG. 2 schematically shows an example of the internal configuration of the management server 160. As shown in FIG. In this embodiment, the management server 160 includes an input/output control unit 220 , an information collection unit 230 , an analysis unit 240 , and a visitor number estimation unit 270 . In this embodiment, the analysis unit 240 has a storage unit 242 , an input data generation unit 244 , a model construction unit 250 and a determination unit 260 . In this embodiment, the model builder 250 includes a dataset generator 252 , a learner 254 and a threshold adjuster 256 . In this embodiment, each unit of the management server 160 may send and receive information to and from each other.

情報収集部230は、レコード取得部、行動履歴取得部及び対応関係取得部の一例であってよい。入力データ生成部244は、レコード取得部、判定対象取得部及び集約部の一例であってよい。データセット生成部252は、レコード取得部、行動履歴取得部、対応関係取得部、ラベル付与部及び判定対象取得部の一例であってよい。学習部254は、モデル生成部の一例であってよい。閾値調整部256は、調整部の一例であってよい。判定部260は、判定部の一例であってよい。 The information collection unit 230 may be an example of a record acquisition unit, an action history acquisition unit, and a correspondence relationship acquisition unit. The input data generation unit 244 may be an example of a record acquisition unit, a determination target acquisition unit, and an aggregating unit. The data set generation unit 252 may be an example of a record acquisition unit, an action history acquisition unit, a correspondence acquisition unit, a label assignment unit, and a determination target acquisition unit. The learning unit 254 may be an example of a model generation unit. The threshold adjuster 256 may be an example of an adjuster. The determination unit 260 may be an example of a determination unit.

本実施形態において、入出力制御部220は、管理サーバ160における情報の入出力を制御する。例えば、入出力制御部220は、管理サーバ160の入力機器、出力機器及び通信機器(図示されていない。)の少なくとも1つを制御する。 In this embodiment, the input/output control unit 220 controls input/output of information in the management server 160 . For example, the input/output control unit 220 controls at least one of an input device, an output device, and a communication device (not shown) of the management server 160 .

本実施形態において、情報収集部230は、各種の情報を収集し、収集された情報を格納部242に格納する。一実施形態において、情報収集部230は、アクセスポイント122及びアクセスポイント124の少なくとも一方から、1以上のログ情報を取得する。他の実施形態において、情報収集部230は、来店確認機器142及び来店確認機器144の少なくとも一方から、1以上の来店確認情報を取得する。 In this embodiment, the information collection unit 230 collects various types of information and stores the collected information in the storage unit 242 . In one embodiment, information collector 230 acquires one or more pieces of log information from at least one of access point 122 and access point 124 . In another embodiment, the information collection unit 230 acquires one or more items of store visit confirmation information from at least one of the store visit confirmation device 142 and the store visit confirmation device 144 .

さらに他の実施形態において、情報収集部230は、1以上のユーザIDのそれぞれと、当該ユーザIDにより識別されるユーザが利用する通信端末の端末IDとの対応関係を示す対応関係情報を取得する。一実施形態において、情報収集部230は、外部の情報処理装置から、対応関係情報を取得する。他の実施形態において、情報収集部230は、1以上のログ情報と、1以上の来店確認情報とに基づいて、対応関係情報を生成する。 In yet another embodiment, the information collecting unit 230 acquires correspondence information indicating the correspondence between each of one or more user IDs and the terminal ID of the communication terminal used by the user identified by the user ID. . In one embodiment, the information collection unit 230 acquires correspondence information from an external information processing device. In another embodiment, the information collection unit 230 generates correspondence information based on one or more pieces of log information and one or more pieces of visit confirmation information.

本実施形態において、解析部240は、情報収集部230が収集した1以上のログ情報及び1以上の来客確認情報の少なくとも一部を解析する。解析部240は、各ログ情報に関連する無線信号を発信した通信端末のユーザが、当該無線信号を発信したアクセスポイントの配された店舗等の内部に存在した否かを判定する。解析部240は、は、ログ情報又は予め定められたアルゴリズムに基づいてログ情報が処理されて得られたデータが入力され、当該ログ情報に関連する無線信号を発信した通信端末のユーザが、当該無線信号を発信したアクセスポイントの配された店舗等の内部に存在した否かを判定するための学習モデルを生成してよい。解析部240は、上記の学習モデルが、上記のユーザが店舗等の内部に存在したか否かを判定するための基準値を調整してよい。 In this embodiment, the analysis unit 240 analyzes at least part of the one or more log information and the one or more visitor confirmation information collected by the information collection unit 230 . The analysis unit 240 determines whether or not the user of the communication terminal that transmitted the radio signal related to each piece of log information was present inside the store or the like where the access point that transmitted the radio signal is located. The analysis unit 240 receives log information or data obtained by processing the log information based on a predetermined algorithm, and the user of the communication terminal that transmits the radio signal related to the log information A learning model may be generated for determining whether or not the user is inside a store or the like where the access point that transmitted the wireless signal is located. The analysis unit 240 may adjust the reference value for the learning model to determine whether the user was present inside the store or the like.

本実施形態において、格納部242は、管理サーバ160における情報処理において使用される各種の情報を格納する。格納部242は、管理サーバ160における情報処理において生成された各種の情報を格納する。格納部242の詳細は後述される。 In this embodiment, the storage unit 242 stores various information used in information processing in the management server 160 . The storage unit 242 stores various types of information generated during information processing in the management server 160 . Details of the storage unit 242 will be described later.

本実施形態において、入力データ生成部244は、学習部254における学習モデルの学習処理、又は、判定部260における判定処理において、学習モデルに入力される入力データを生成する。本実施形態において、入力データ生成部244は、情報収集部230が取得した複数のログ情報を、当該複数のログ情報のそれぞれに含まれる端末ID及び時刻情報に基づいて、端末識IDごと、且つ、予め定められた条件を満足する期間ごとに集約することで、1以上の入力データを生成する。 In the present embodiment, the input data generation unit 244 generates input data to be input to the learning model in the learning process of the learning model in the learning unit 254 or the determination process in the determination unit 260 . In this embodiment, the input data generation unit 244 collects a plurality of pieces of log information acquired by the information collection unit 230 based on the terminal ID and time information included in each of the pieces of log information, for each terminal identification ID, and , to generate one or more pieces of input data by aggregating for each period that satisfies a predetermined condition.

1以上の入力データのそれぞれは、(i)複数の無線信号のそれぞれを発信した通信端末を識別するための端末ID、(ii)入力データ生成部244による集約処理の対象となった期間を示す集約期間情報、(iii)複数の無線信号のうち、端末IDにより識別される通信端末が、集約期間情報により示される期間の間に発信した1以上の無線信号に関する1以上の特徴量を示す特徴情報が対応付けられた情報であってよい。1以上の入力データのそれぞれは、集約レコードの一例であってよい。 Each of the one or more pieces of input data indicates (i) a terminal ID for identifying the communication terminal that transmitted each of the plurality of radio signals, and (ii) a period subject to aggregation processing by the input data generation unit 244. Aggregation period information, (iii) a feature indicating one or more feature amounts relating to one or more radio signals transmitted during a period indicated by the aggregation period information by a communication terminal identified by a terminal ID among a plurality of radio signals; It may be information associated with information. Each of the one or more pieces of input data may be an example of an aggregation record.

1以上の特徴量の種類としては、単位期間中の電波強度、単位期間中の滞在期間の長さ、滞在期間中の訪問回数、滞在期間中における電波強度、店舗の属性などが例示される。1以上の特徴量の種類の他の例としては、周波数帯ごとの単位期間中の電波強度、周波数帯ごとの単位期間中の滞在期間の長さ、周波数帯ごとの滞在期間中の訪問回数、周波数帯ごとの滞在期間中における電波強度などが例示される。1以上の特徴量の種類の他の例としては、接続段階ごとの単位期間中の電波強度、接続段階ごとの単位期間中の滞在期間、接続段階ごとの滞在期間内の訪問回数、接続段階ごとの滞在期間中における電波強度などが例示される。 Examples of one or more types of feature values include radio wave intensity during the unit period, length of stay during the unit period, number of visits during the stay period, radio wave intensity during the stay period, store attributes, and the like. Other examples of the types of one or more feature values include radio wave intensity per unit period for each frequency band, length of stay per unit period for each frequency band, number of visits per frequency band during stay period, For example, the radio wave intensity during the stay period for each frequency band is exemplified. Other examples of the types of one or more feature values include the radio field strength during the unit period for each connection stage, the length of stay during the unit period for each connection stage, the number of visits during the stay period for each connection stage, and each connection stage. radio wave intensity during the period of stay in the

滞在期間は、特定の店舗等に配されたアクセスポイントにおいて、予め定められた長さを有する単位期間中に、特定の通信端末からの無線信号であって、電波強度が予め定められた強度よりも大きな無線信号が、最初に検出された時刻と最後に検出された時刻との間の期間であってよい。滞在期間中の訪問回数は、特定の滞在期間中において、上記の特定の通信端末からの無線信号であって、電波強度が予め定められた強度よりも大きな無線信号の検出が継続している期間(継続期間と称される場合がある。)が出現した回数であってよい。 The period of stay shall be defined as a wireless signal from a specific communication terminal, whose radio wave intensity is higher than the predetermined strength, during a unit period having a predetermined length at an access point located at a specific store, etc. may be the period between the time the radio signal is first detected and the time it was last detected. The number of visits during the period of stay is the period during which the radio signal from the above-mentioned specific communication terminal continues to be detected and the radio signal strength is greater than a predetermined strength during the specific period of stay. (sometimes referred to as duration) may be the number of times that appears.

店舗の属性としては、店舗の出店地区、店舗の出店形態、店舗の立地条件、店舗の構造、及び、これらの組み合わせなどが例示される。店舗の出店地区としては、都心、郊外、駅前、ロードサイド、観光地などが例示される。店舗の出店形態としては、商店街、店舗内店舗、単独店舗などが例示される。店舗の立地条件としては、路面店、空中店舗、地下店舗などが例示される。 The attributes of the store are exemplified by the area where the store is opened, the type of store opened, the location conditions of the store, the structure of the store, and combinations thereof. Examples of store opening districts include city centers, suburbs, in front of stations, roadsides, tourist spots, and the like. Examples of the form of opening a store include a shopping street, a store within a store, and a single store. Examples of store location conditions include a street store, an aerial store, and an underground store.

少なくとも1つの特徴量の値は、単一の入力データに集約された複数のログ情報のそれぞれに含まれる信号情報により示される量の統計値であってもよい。統計値としては、最大値、最小値、平均値、中央値などが例示される。上記の統計値は、単位期間における統計値であってもよく、滞在期間における統計値であってもよい。上記の統計値は、継続期間における統計値であってもよい。 At least one feature amount value may be a statistical value of an amount indicated by signal information included in each of a plurality of pieces of log information aggregated into single input data. Examples of statistical values include maximum values, minimum values, average values, and median values. The above statistic value may be a statistic value for a unit period or a statistic value for a length of stay. The above statistic may be a statistic over a period of time.

本実施形態において、入力データ生成部244が生成した入力データの一部は、学習部254における機械学習の訓練データ、検証データ及びテストデータの少なくとも1つとして利用される学習用データセットとなり、入力データ生成部244が生成した入力データのうち、学習用データセットとして利用されなかったデータは、判定部260における判定処理の対象となる判定対象データとなる。より具体的には、データセット生成部252における情報処理によりラベルが付与された入力データは、学習用データセットとなり、データセット生成部252における情報処理によりラベルが付与されなかった入力データは、判定対象データとなる。 In this embodiment, part of the input data generated by the input data generation unit 244 becomes a learning data set used as at least one of training data, verification data, and test data for machine learning in the learning unit 254. Of the input data generated by the data generation unit 244 , data that is not used as the learning data set becomes determination target data that is subjected to determination processing in the determination unit 260 . More specifically, the input data labeled by the information processing in the data set generation unit 252 becomes the learning data set, and the input data not labeled by the information processing in the data set generation unit 252 is used for the determination. It becomes the target data.

本実施形態において、モデル構築部250は、学習モデルを生成する。上記の学習モデルは、予め定められた地理的範囲を有するエリアの内部に配された無線受信装置により受信された無線信号に関する情報を含むデータポイントが入力され、無線信号を発信した無線端末のユーザがエリアの内部に存在していたか否かを判定する。上記の学習モデルは、当該学習モデルに入力されたデータポイントごとに、当該学習モデルの予測又は判定に対する不確実性を推定するために利用される関数の値を算出してよい。上記の学習モデルは、算出された関数の値と、分類用の閾値とに基づいて、ユーザがエリアの内部に存在していたか否かを判定してよい。 In this embodiment, the model construction unit 250 generates a learning model. The learning model described above is input with data points containing information about radio signals received by radio receivers located within an area having a predetermined geographic range, and the user of the radio terminal that originated the radio signal. existed inside the area. The learning model may calculate, for each data point input to the learning model, the value of a function used to estimate the uncertainty of the prediction or decision of the learning model. The above learning model may determine whether or not the user was present inside the area based on the calculated function value and the threshold for classification.

本実施形態において、モデル構築部250は、上記の学習モデルの機械学習に用いられる学習用データセットを生成する。本実施形態において、モデル構築部250は、分類用の閾値を調整する。モデル構築部250は、上記の調整の結果、学習済みの学習モデルが、判定部260における判定処理において利用する新たな分類用の閾値を決定する。 In this embodiment, the model construction unit 250 generates a learning data set used for machine learning of the learning model described above. In this embodiment, the model builder 250 adjusts the threshold for classification. As a result of the adjustment described above, the model construction unit 250 determines a new threshold for classification that the learned model uses in the determination processing in the determination unit 260 .

本実施形態において、データセット生成部252は、学習部254における機械学習に用いられる学習用データセットを生成する。データセット生成部252は、例えば、情報収集部230が取得したログ情報、及び、入力データ生成部244が生成した入力データの少なくとも一方を利用して、学習用データセットを生成する。 In this embodiment, the data set generation unit 252 generates a learning data set used for machine learning in the learning unit 254 . The dataset generator 252 generates a learning dataset using at least one of the log information acquired by the information collector 230 and the input data generated by the input data generator 244, for example.

一実施形態において、データセット生成部252は、情報収集部230が取得したログ情報の一部に、陽性又は陰性を示すラベルを付与することで、学習用データセットを生成する。データセット生成部252は、生成された学習用データセットを、格納部242に格納してよい。 In one embodiment, the dataset generation unit 252 generates a learning dataset by assigning a positive or negative label to part of the log information acquired by the information collection unit 230 . The dataset generation unit 252 may store the generated learning dataset in the storage unit 242 .

例えば、データセット生成部252は、収集された1以上の来店確認情報と、収集された1以上のログ情報とを照合して、(i)特定のユーザに関する来店確認情報と、(ii)当該ユーザが利用する通信端末に関するログ情報であって、当該ログ情報により示される受信時刻、及び、上記の来店確認情報により示される来店時刻の差が、予め定められた値と等しい又は当該値よりも小さいログ情報と、を関連付ける。データ解析システム100は、例えば、来店確認情報に関連付けられたログ情報に陽性ラベルを付与することで、学習用データセットを生成する。 For example, the data set generation unit 252 compares one or more collected store visit confirmation information with one or more collected log information to obtain (i) store visit confirmation information related to a specific user, and (ii) the relevant Log information related to the communication terminal used by the user, wherein the difference between the reception time indicated by the log information and the arrival time indicated by the store visit confirmation information is equal to or greater than a predetermined value Associate small log information with . The data analysis system 100 generates a learning data set, for example, by assigning a positive label to log information associated with store visit confirmation information.

他の実施形態において、データセット生成部252は、入力データ生成部244が生成した入力データの一部に、陽性又は陰性を示すラベルを付与することで、学習用データセットを生成する。データセット生成部252は、生成された学習用データセットを、格納部242に格納してよい。 In another embodiment, the dataset generator 252 generates a learning dataset by adding a positive or negative label to part of the input data generated by the input data generator 244 . The dataset generation unit 252 may store the generated learning dataset in the storage unit 242 .

例えば、データセット生成部252は、収集された1以上の来店確認情報と、1以上の入力データとを照合して、(i)特定のユーザに関する来店確認情報と、(ii)当該ユーザが利用する通信端末に関する入力データであって、当該入力データにより示される受信時刻、及び、上記の来店確認情報により示される来店時刻の差が、予め定められた値と等しい又は当該値よりも小さい入力データと、を関連付ける。データセット生成部252は、例えば、来店確認情報に関連付けられた入力データに陽性ラベルを付与することで、学習用データセットを生成する。 For example, the data set generation unit 252 compares one or more pieces of collected store visit confirmation information with one or more pieces of input data to obtain (i) store visit confirmation information about a specific user and (ii) store visit confirmation information used by the user. input data relating to a communication terminal, wherein the difference between the reception time indicated by the input data and the visit time indicated by the store visit confirmation information is equal to or smaller than a predetermined value and associate. The data set generation unit 252 generates a learning data set, for example, by assigning a positive label to the input data associated with the store visit confirmation information.

データセット生成部252は、判定部260における判定処理の対象となる判定対象データを生成してもよい。判定対象データは、1以上のアクセスポイントの少なくとも1つにより受信された複数の無線信号に関する情報を含んでいればよい。 The data set generation unit 252 may generate determination target data to be subjected to determination processing in the determination unit 260 . The determination target data may include information regarding multiple wireless signals received by at least one of the one or more access points.

一実施形態において、データセット生成部252は、情報収集部230が取得したログ情報のうち、ラベルが付与されなかったログ情報を、判定対象データとして出力する。他の実施形態において、データセット生成部252は、入力データ生成部244が生成した入力データのうち、ラベルが付与されなかった入力データを、判定対象データとして出力する。データセット生成部252は、生成された判定対象データを、格納部242に格納してよい。 In one embodiment, the data set generation unit 252 outputs, among the log information acquired by the information collection unit 230, log information that has not been labeled as data to be determined. In another embodiment, the data set generation unit 252 outputs, among the input data generated by the input data generation unit 244, unlabeled input data as determination target data. The data set generation unit 252 may store the generated determination target data in the storage unit 242 .

[学習用データセットの生成方法の具体例1-1]
本実施形態において、データセット生成部252は、格納部242にアクセスして、複数のログ情報を取得する。複数のログ情報のそれぞれにおいて、(i)複数の無線信号のそれぞれを発信した通信端末を識別するための端末識別情報と、(ii)複数の無線信号のそれぞれが受信された時刻を示す受信時刻情報と、(iii)複数の無線信号のそれぞれの電波に関する信号情報とが対応付けられていてよい。
[Specific example 1-1 of method for generating learning data set]
In this embodiment, the data set generation unit 252 accesses the storage unit 242 and acquires multiple pieces of log information. In each of the plurality of pieces of log information, (i) terminal identification information for identifying the communication terminal that transmitted each of the plurality of radio signals, and (ii) reception time indicating the time when each of the plurality of radio signals was received The information may be associated with (iii) signal information about radio waves of each of the plurality of wireless signals.

データセット生成部252は、格納部242にアクセスして、複数の来店確認情報を取得する。複数の来店確認情報のそれぞれにおいて、(i)特定の行動に関与した1以上のユーザのそれぞれを識別するためのユーザ識別情報と、(ii)特定の行動がなされた時刻を示す行動時刻情報とが対応付けられていてよい。より具体的には、複数の来店確認情報のそれぞれは、ユーザのユーザ識別情報と、ユーザの来店時刻を示す情報(来店時刻情報と称される場合がある。)とが対応付けられた情報であってよい。来店時刻情報は、行動時刻情報の一例であってよい。 The data set generation unit 252 accesses the storage unit 242 and acquires a plurality of store visit confirmation information. In each of the plurality of store visit confirmation information, (i) user identification information for identifying each of the one or more users involved in a specific action, and (ii) action time information indicating the time when the specific action was performed. may be associated. More specifically, each of the plurality of store visit confirmation information is information in which user identification information of the user and information indicating the user's store visit time (sometimes referred to as store visit time information) are associated with each other. It's okay. The visit time information may be an example of action time information.

データセット生成部252は、(i)複数のログ情報のそれぞれに含まれる端末識別情報及び受信時刻情報、並びに、(ii)複数の来店確認情報のそれぞれに含まれるユーザ識別情報及び来店時刻情報に基づいて、複数のログ情報及び複数の来店確認情報を照合し、複数のログ情報のうち少なくとも一部のログ情報のそれぞれに含まれる端末識別情報と、当該少なくとも一部のログ情報のそれぞれに含まれる信号情報により示される電波に関する情報と、陽性ラベルとを対応付けることで、学習用データセットを生成する。これにより、複数のログ情報の少なくとも一部に陽性ラベルの付与された学習用データセットが生成される。 The data set generation unit 252 generates (i) terminal identification information and reception time information included in each of the plurality of pieces of log information, and (ii) user identification information and visit time information included in each of the plurality of pieces of store visit confirmation information. Based on this, multiple pieces of log information and multiple pieces of store visit confirmation information are collated, and the terminal identification information included in each of at least a portion of the log information among the plurality of pieces of log information, and the terminal identification information included in each of the at least a portion of the log information. A learning data set is generated by associating the information about radio waves indicated by the signal information received with the positive label. As a result, a learning data set is generated in which at least some of the pieces of log information are positively labeled.

より具体的には、データセット生成部252は、まず、特定のログ情報に含まれる端末識別情報及び受信時刻情報を照合用のキーとして用いて、複数の来店確認情報の中から、(i)当該来店確認情報に含まれるユーザ識別情報により示されるユーザが、当該特定のログ情報に含まれる端末識別情報により示される通信端末のユーザに合致し、且つ、(ii)当該来店確認情報に含まれる来店時刻情報により示される時刻が、当該特定のログ情報に含まれる受信時刻情報により示される時刻に合致する来店確認情報を抽出する。 More specifically, the data set generation unit 252 first uses the terminal identification information and the reception time information included in the specific log information as keys for verification to select (i) (ii) the user indicated by the user identification information included in the visit confirmation information matches the user of the communication terminal indicated by the terminal identification information included in the specific log information; and The store visit confirmation information whose time indicated by the store visit time information matches the time indicated by the reception time information included in the specific log information is extracted.

次に、データセット生成部252は、抽出された来店確認情報と、上記の特定のログ情報とを関連付ける。次に、データセット生成部252は、例えば、来店確認情報に関連付けられたログ情報に陽性ラベルを付与することで、学習用データセットを生成する。データセット生成部252は、複数のログ情報のそれぞれについて、上記の処理を実行してよい。特定のログ情報は、少なくとも一部のレコードの一例であってよい。 Next, the data set generator 252 associates the extracted store visit confirmation information with the specific log information. Next, the data set generation unit 252 generates a learning data set, for example, by assigning a positive label to the log information associated with the store visit confirmation information. The data set generation unit 252 may perform the above processing for each of the plurality of pieces of log information. A particular log information may be an example of at least some records.

一実施形態において、複数の来店確認情報の少なくとも一部に含まれるユーザ識別情報が、当該ユーザ識別情報により識別されるユーザが利用する通信端末の端末識別情報である場合、データセット生成部252は、特定の端末識別情報を含む来店確認情報と、(ii)当該特定の端末識別情報を含むログ情報であって、当該ログ情報に含まれる受信時刻情報により示される受信時刻と、上記の来店確認情報に含まれる来店時刻情報により示される来店時刻の差が予め定められた値と等しい又は当該値よりも小さいログ情報とを関連付ける。データセット生成部252は、例えば、来店確認情報に関連付けられたログ情報に、陽性ラベルを付与することで、学習用データセットを生成する。 In one embodiment, when the user identification information included in at least a part of the plurality of store visit confirmation information is the terminal identification information of the communication terminal used by the user identified by the user identification information, the data set generation unit 252 , store visit confirmation information including specific terminal identification information, (ii) log information including the specific terminal identification information, the reception time indicated by the reception time information included in the log information, and the store visit confirmation The difference between the store visit time indicated by the store visit time information included in the information is associated with log information that is equal to or smaller than a predetermined value. The data set generation unit 252 generates the learning data set, for example, by assigning a positive label to the log information associated with the store visit confirmation information.

他の実施形態において、複数の来店確認情報の少なくとも一部に含まれるユーザ識別情報が、当該ユーザ識別情報により識別されるユーザが利用する通信端末の端末識別情報でない場合、データセット生成部252は、格納部242にアクセスして、当該ユーザ識別情報に関する対応関係情報を取得する。対応関係情報は、ユーザ識別情報と、当該ユーザ識別情報により識別されるユーザが利用する通信端末の端末識別情報との対応関係を示す情報であってよい。 In another embodiment, when the user identification information included in at least a part of the plurality of store visit confirmation information is not the terminal identification information of the communication terminal used by the user identified by the user identification information, the data set generation unit 252 , accesses the storage unit 242 and acquires the correspondence information related to the user identification information. Correspondence information may be information indicating a correspondence relationship between user identification information and terminal identification information of a communication terminal used by a user identified by the user identification information.

データセット生成部252は、対応関係情報を参照して、(i)複数のログ情報のそれぞれに含まれる端末識別情報及び受信時刻情報、並びに、(ii)複数の来店確認情報のそれぞれに含まれるユーザ識別情報及び来店時刻情報に基づいて、複数のログ情報及び複数の来店確認情報を照合し、複数のログ情報の少なくとも一部と、複数の来店確認情報の少なくとも一部とを関連付ける。データセット生成部252は、例えば、来店確認情報に関連付けられたログ情報に、陽性ラベルを付与することで、学習用データセットを生成する。 The data set generation unit 252 refers to the correspondence information, and (i) the terminal identification information and reception time information included in each of the plurality of log information, and (ii) the information included in each of the plurality of store visit confirmation information. A plurality of pieces of log information and a plurality of pieces of store visit confirmation information are collated based on the user identification information and the store visit time information, and at least a portion of the plurality of pieces of log information and at least a portion of the plurality of store visit confirmation information are associated. The data set generation unit 252 generates the learning data set, for example, by assigning a positive label to the log information associated with the store visit confirmation information.

より具体的には、複数のログ情報の少なくとも一部と、複数の来店確認情報の少なくとも一部とを関連付ける手順において、データセット生成部252は、上述のとおり、まず、特定のログ情報に含まれる端末識別情報及び受信時刻情報を照合用のキーとして用いて、複数の来店確認情報の中から、上述された条件に合致する来店確認情報を抽出する。次に、データセット生成部252は、抽出された来店確認情報と、上記の特定のログ情報とを関連付ける。 More specifically, in the procedure for associating at least a portion of a plurality of pieces of log information with at least a portion of a plurality of pieces of store-visit confirmation information, the data set generation unit 252 first generates the Using the terminal identification information and the reception time information received as a key for verification, store visit confirmation information that matches the above-described conditions is extracted from a plurality of store visit confirmation information. Next, the data set generator 252 associates the extracted store visit confirmation information with the specific log information.

本実施形態によれば、複数の来店確認情報の中から、上述された条件に合致する来店確認情報が抽出される手順において、データセット生成部252は、対応関係情報を利用して、特定の来店確認情報に含まれるユーザ識別情報により示されるユーザが、特定のログ情報に含まれる端末識別情報により示される通信端末のユーザに合致するか否かを判定する。一実施形態において、データセット生成部252は、対応関係情報を利用して、ログ情報に含まれる端末識別情報を、対応するユーザ識別情報に変換する。これにより、データセット生成部252は、ユーザ識別情報をキーとして、ログ情報及び来店確認情報が、同一のユーザ又は通信端末に関する情報であるか否かを判定することができる。他の実施形態において、データセット生成部252は、対応関係情報を利用して、来店確認情報に含まれるユーザ識別情報を、対応する端末識別情報に変換する。これにより、データセット生成部252は、端末識別情報をキーとして、ログ情報及び来店確認情報が、同一のユーザ又は通信端末に関する情報であるか否かを判定することができる。 According to the present embodiment, in the procedure for extracting store-visit confirmation information that matches the above-described conditions from among a plurality of store-visit confirmation information, the data set generation unit 252 uses the correspondence information to generate a specific It is determined whether or not the user indicated by the user identification information included in the visit confirmation information matches the user of the communication terminal indicated by the terminal identification information included in the specific log information. In one embodiment, the data set generator 252 uses the correspondence information to convert the terminal identification information included in the log information into corresponding user identification information. Thereby, the data set generation unit 252 can determine whether or not the log information and the visit confirmation information are information related to the same user or communication terminal, using the user identification information as a key. In another embodiment, the data set generation unit 252 converts the user identification information included in the visit confirmation information into corresponding terminal identification information using the correspondence information. Thereby, the data set generation unit 252 can determine whether or not the log information and the visit confirmation information are information related to the same user or communication terminal, using the terminal identification information as a key.

なお、上記の各実施形態において、来店時刻情報により示される来店時刻と、受信時刻情報により示される受信時刻との差が、予め定められた値に等しい又は当該値よりも小さい場合、来店時刻情報により示される来店時刻が、受信時刻情報により示される受信時刻に合致すると判定されてよい。また、上記の来店時刻及び受信時刻の差に関する予め定められた値は、特定の種類の無線信号の送信間隔のn倍であってもよい。nは、1以上の整数であってよく、2以上の整数であってもよく、3以上の整数であってもよく、4以上の整数であってもよく、5以上の整数であってもよく、10以上の整数であってもよい。nは、50以下の整数であってよく、30以下の整数であってもよく、20以下の整数であってもよく、10以下の整数であってもよく、5以下の整数であってもよく、3以下の整数であってもよい。特定の種類の無線信号としては、プローブ要求、位置登録要求などの各種の通信制御信号が例示される。 In each of the above embodiments, when the difference between the arrival time indicated by the arrival time information and the reception time indicated by the reception time information is equal to or smaller than a predetermined value, the arrival time information may be determined to match the reception time indicated by the reception time information. Also, the predetermined value regarding the difference between the visit time and the reception time may be n times the transmission interval of the specific type of radio signal. n may be an integer of 1 or more, an integer of 2 or more, an integer of 3 or more, an integer of 4 or more, or an integer of 5 or more It may be an integer of 10 or more. n may be an integer of 50 or less, an integer of 30 or less, an integer of 20 or less, an integer of 10 or less, or an integer of 5 or less. It may be an integer of 3 or less. Specific types of radio signals are exemplified by various communication control signals such as probe requests and location registration requests.

[学習用データセットの生成方法の具体例1-2]
本実施形態において、データセット生成部252は、格納部242にアクセスして、1以上の入力データを取得する。1以上の入力データのそれぞれにおいて、(i)集約処理の対象となる無線信号を発信した通信端末の端末識別情報、(ii)集約処理の対象となった期間を示す集約期間情報、(iii)集約処理の対象となる無線信号に関する1以上の特徴量を示す特徴情報が対応付けられていてよい。
[Specific example 1-2 of method for generating learning data set]
In this embodiment, the dataset generation unit 252 accesses the storage unit 242 to obtain one or more pieces of input data. In each of the one or more pieces of input data, (i) terminal identification information of the communication terminal that transmitted the wireless signal to be aggregated, (ii) aggregation period information indicating the period of time to be aggregated, (iii) Feature information indicating one or more feature amounts related to wireless signals to be aggregated may be associated.

入力データに含まれる端末識別情報は、レコードに含まれる端末識別情報の一例であってよい。入力データに含まれる集約期間情報は、受信時刻情報に基づく情報の一例であってよい。入力データに含まれる特徴情報は、信号情報により示される電波に関する情報の一例であってよい。 The terminal identification information included in the input data may be an example of the terminal identification information included in the record. Aggregation period information included in the input data may be an example of information based on reception time information. The feature information included in the input data may be an example of information about radio waves indicated by the signal information.

データセット生成部252は、格納部242にアクセスして、1以上の来店確認情報を取得する。1以上の来店確認情報のそれぞれにおいて、(i)特定の行動に関与した1以上のユーザのそれぞれを識別するためのユーザ識別情報と、(ii)特定の行動がなされた時刻を示す行動時刻情報とが対応付けられていてよい。より具体的には、1以上の来店確認情報のそれぞれは、ユーザのユーザ識別情報と、ユーザの来店時刻を示す来店時刻情報とが対応付けられた情報であってよい。 The data set generation unit 252 accesses the storage unit 242 and acquires one or more store visit confirmation information. In each of the one or more store visit confirmation information, (i) user identification information for identifying each of the one or more users involved in a specific action, and (ii) action time information indicating the time when the specific action was performed may be associated with. More specifically, each of the one or more pieces of visit confirmation information may be information in which user identification information of a user and visit time information indicating the visit time of the user are associated with each other.

データセット生成部252は、上述された具体例と同様の手順により、(i)1以上の入力データのそれぞれに含まれる端末識別情報及び集約期間情報、並びに、(ii)複数の来店確認情報のそれぞれに含まれるユーザ識別情報及び来店時刻情報に基づいて、1以上の入力データ及び複数の来店確認情報を照合し、1以上の入力データのうち少なくとも一部の入力データのそれぞれに含まれる端末識別情報と、当該少なくとも一部の入力データのそれぞれに含まれる特徴情報により示される特徴量に関する情報と、陽性ラベルとを対応付けることで、学習用データセットを生成する。これにより、1以上の入力データの少なくとも一部に陽性ラベルの付与された学習用データセットが生成される。 The data set generation unit 252 generates (i) terminal identification information and aggregation period information contained in each of the one or more pieces of input data, and (ii) a plurality of store visit confirmation information Based on user identification information and store visit time information included in each, one or more input data and a plurality of store visit confirmation information are collated, and terminal identification included in each of at least part of the one or more input data A learning data set is generated by associating the information, the information about the feature quantity indicated by the feature information included in each of the at least part of the input data, and the positive label. As a result, a learning data set is generated in which at least a portion of one or more pieces of input data are positively labeled.

より具体的には、データセット生成部252は、まず、特定の入力データに含まれる端末識別情報及び集約期間情報を照合用のキーとして用いて、複数の来店確認情報の中から、(i)当該来店確認情報に含まれるユーザ識別情報により示されるユーザが、当該特定の入力データに含まれる端末識別情報により示される通信端末のユーザに合致し、且つ、(ii)当該来店確認情報に含まれる来店時刻情報により示される時刻が、当該特定の入力データに含まれる集約期間情報により示される期間に含まれる来店確認情報を抽出する。 More specifically, the data set generation unit 252 first uses the terminal identification information and aggregation period information included in the specific input data as keys for verification to select (i) (ii) the user indicated by the user identification information included in the visit confirmation information matches the user of the communication terminal indicated by the terminal identification information included in the specific input data; and The time indicated by the store visit time information is extracted as store visit confirmation information included in the period indicated by the aggregation period information included in the specific input data.

次に、データセット生成部252は、抽出された来店確認情報と、上記の特定の入力データとを関連付ける。次に、データセット生成部252は、例えば、来店確認情報に関連付けられた入力データに陽性ラベルを付与することで、学習用データセットを生成する。データセット生成部252は、1以上の入力データのそれぞれについて、上記の処理を実行してよい。 Next, the data set generator 252 associates the extracted store visit confirmation information with the specific input data. Next, the data set generation unit 252 generates a learning data set, for example, by assigning a positive label to the input data associated with the store visit confirmation information. The dataset generator 252 may perform the above process for each of the one or more pieces of input data.

[学習用データセットの生成方法の具体例2-1]
本実施形態において、データセット生成部252は、格納部242にアクセスして、複数のログ情報を取得する。複数のログ情報のそれぞれにおいて、(i)複数の無線信号のそれぞれを発信した通信端末を識別するための端末識別情報と、(ii)複数の無線信号のそれぞれが受信された時刻を示す受信時刻情報と、(iii)複数の無線信号のそれぞれが受信された位置を示す受信位置情報と、(iv)複数の無線信号のそれぞれの電波に関する信号情報とが対応付けられていてよい。
[Specific example 2-1 of method for generating learning data set]
In this embodiment, the data set generation unit 252 accesses the storage unit 242 and acquires multiple pieces of log information. In each of the plurality of pieces of log information, (i) terminal identification information for identifying the communication terminal that transmitted each of the plurality of radio signals, and (ii) reception time indicating the time when each of the plurality of radio signals was received information, (iii) reception position information indicating a position where each of the plurality of radio signals is received, and (iv) signal information regarding radio waves of each of the plurality of radio signals may be associated.

データセット生成部252は、格納部242にアクセスして、複数のログ情報のそれぞれに含まれる受信位置情報により示される位置に配された店舗の進入制限情報を取得する。1以上の進入制限情報のそれぞれにおいて、(i)1以上の店舗のそれぞれを識別するための店舗IDと、(ii)店舗IDにより識別される店舗への進入が制限されている時間帯を示す情報とが対応付けられていてよい。店舗IDは、エリア識別情報の一例であってよい。 The data set generation unit 252 accesses the storage unit 242 and acquires the entry restriction information of the store arranged at the position indicated by the reception position information included in each of the plurality of pieces of log information. Each of the one or more pieces of entry restriction information indicates (i) a store ID for identifying each of the one or more stores, and (ii) a time period during which access to the store identified by the store ID is restricted. information may be associated with each other. The store ID may be an example of area identification information.

データセット生成部252は、複数のログ情報のそれぞれに含まれる受信位置情報と、取得された進入制限情報に含まれる店舗IDとに基づいて、複数のログ情報及び1以上の進入制限情報を照合し、複数のログ情報のそれぞれに含まれる受信位置情報により示される位置に対応する進入制限情報を抽出する。データセット生成部252は、例えば、対応する進入制限情報が抽出されたログ情報に、陰性ラベルを付与する。陰性ラベルは、無線信号を発信した通信端末のユーザが、当該無線信号を受信したアクセスポイントの配された店舗等の内部に存在していなかったことを示す。これにより、複数のログ情報のうち少なくとも一部のログ情報のそれぞれに含まれる端末識別情報と、少なくとも一部のログ情報のそれぞれに含まれる信号情報により示される電波に関する情報と、陰性ラベルとが対応付けられた学習用データセットが生成される。
[学習用データセットの生成方法の具体例2-2]
本実施形態において、データセット生成部252は、格納部242にアクセスして、1以上の入力データを取得する。1以上の入力データのそれぞれにおいて、(i)集約処理の対象となる1以上の無線信号を発信した通信端末の端末ID、(ii)集約処理の対象となる無線信号を受信したアクセスポイントが配された店舗の店舗ID、(iii)集約処理の対象となった期間を示す集約期間情報、(iv)集約処理の対象となる無線信号に関する1以上の特徴量を示す特徴情報が対応付けられていてよい。
The data set generation unit 252 collates a plurality of pieces of log information and one or more access restriction information based on the reception position information included in each of the plurality of log information and the store ID included in the acquired access restriction information. and extracts access restriction information corresponding to the position indicated by the reception position information included in each of the plurality of log information. The data set generator 252, for example, assigns a negative label to the log information from which the corresponding entry restriction information has been extracted. A negative label indicates that the user of the communication terminal that transmitted the wireless signal was not inside the store or the like where the access point that received the wireless signal is located. As a result, the terminal identification information included in each of at least some of the log information among the plurality of log information, the information on radio waves indicated by the signal information included in each of at least some of the log information, and the negative label. An associated training data set is generated.
[Specific example 2-2 of method for generating learning data set]
In this embodiment, the dataset generation unit 252 accesses the storage unit 242 to obtain one or more pieces of input data. In each of the one or more pieces of input data, (i) the terminal ID of the communication terminal that transmitted the one or more wireless signals to be aggregated, (ii) the access point that received the wireless signal to be aggregated. (iii) aggregation period information indicating a period for which aggregation processing is performed; you can

データセット生成部252は、格納部242にアクセスして、1以上の入力データのそれぞれに含まれる店舗IDにより示される店舗の進入制限情報を取得する。1以上の進入制限情報のそれぞれにおいて、(i)店舗IDと、(ii)店舗IDにより識別される店舗への進入が制限されている時間帯を示す情報とが対応付けられていてよい。 The data set generation unit 252 accesses the storage unit 242 and acquires entry restriction information of the store indicated by the store ID included in each of the one or more pieces of input data. In each of the one or more items of access restriction information, (i) a store ID and (ii) information indicating a time zone during which access to the store identified by the store ID is restricted may be associated.

データセット生成部252は、1以上の入力データのそれぞれに含まれる店舗IDと、格納部242に格納された進入制限情報に含まれる店舗IDとに基づいて、複数のログ情報及び1以上の進入制限情報を照合し、1以上の入力データのそれぞれに対応する進入制限情報を抽出する。データセット生成部252は、例えば、対応する進入制限情報が抽出された入力データに、陰性ラベルを付与する。これにより、複数のログ情報のうち少なくとも一部のログ情報のそれぞれに含まれる端末識別情報と、少なくとも一部のログ情報のそれぞれに含まれる信号情報により示される電波に関する情報と、陰性ラベルとが対応付けられた学習用データセットが生成される。 The data set generation unit 252 generates a plurality of pieces of log information and one or more entry data based on the store ID included in each of the one or more pieces of input data and the store ID included in the entry restriction information stored in the storage unit 242 . The restriction information is collated to extract entry restriction information corresponding to each of the one or more pieces of input data. The data set generator 252, for example, assigns a negative label to the input data from which the corresponding entry restriction information has been extracted. As a result, the terminal identification information included in each of at least a portion of the log information among the plurality of log information, the information on the radio waves indicated by the signal information included in each of the at least a portion of the log information, and the negative label. An associated training data set is generated.

本実施形態において、学習部254は、機械学習により、学習モデルを生成する。上記の学習モデルは、例えば、特定の店舗の内部に配されたアクセスポイントにより受信された無線信号に関する情報を含むデータポイントが入力され、当該無線信号を発信した通信端末のユーザが当該特定の店舗の内部に存在していたか否かを判定するために用いられる。学習部254は、店舗ごとに異なる学習モデルを生成してもよく、複数の店舗に共通の学習モデルを生成してもよい。学習部254は、アクセスポイントごとに異なる学習モデルを生成してもよく、複数のアクセスポイントに共通の学習モデルを生成してもよい。 In this embodiment, the learning unit 254 generates a learning model by machine learning. In the above learning model, for example, a data point containing information about a radio signal received by an access point placed inside a specific store is input, and the user of the communication terminal that transmitted the radio signal It is used to determine whether it existed inside the The learning unit 254 may generate a different learning model for each store, or may generate a common learning model for a plurality of stores. Learning unit 254 may generate a different learning model for each access point, or may generate a common learning model for a plurality of access points.

例えば、学習部254は、格納部242にアクセスして、データセット生成部252が生成した学習用データセットを取得する。上述のとおり、各学習モデルにおいては、分類用の閾値として、当該学習モデルに応じた適切な初期値が設定されている。そこで、学習部254は、まず、上記の初期値を分類用の閾値として利用し、且つ、上記の学習用データセットを利用して機械学習を実行することにより、学習済みの学習モデルを生成する。 For example, the learning unit 254 accesses the storage unit 242 and acquires the learning data set generated by the data set generation unit 252 . As described above, in each learning model, an appropriate initial value corresponding to the learning model is set as a threshold for classification. Therefore, the learning unit 254 first uses the initial value as a threshold for classification and performs machine learning using the learning data set to generate a learned learning model. .

学習部254は、交差検証を実行して、生成された学習モデルの汎化性能を評価してよい。学習部254は、交差検証用いたグリッドサーチを実行して、学習モデルのハイパーパラメータを決定してよい。 The learning unit 254 may perform cross-validation to evaluate the generalization performance of the generated learning model. The learning unit 254 may perform a grid search with cross-validation to determine the hyperparameters of the learning model.

学習部254は、データセット生成部252が生成した学習用データセットを、訓練データと、テストデータとに分割してよい。学習部254は、データセット生成部252が生成した学習用データセットを、訓練データと、検証データと、テストデータとに分割してよい。学習部254は、検証データを、学習モデルに含まれるパラメータを決定するための検証に用いられる検証データと、分類用の閾値を調整するための検証に用いられる検証データとに分割してもよい。分類用の閾値を調整するための検証に用いられる検証データは、例えば、閾値調整部256により利用される。 The learning unit 254 may divide the learning data set generated by the data set generation unit 252 into training data and test data. The learning unit 254 may divide the learning data set generated by the data set generation unit 252 into training data, verification data, and test data. The learning unit 254 may divide the verification data into verification data used for verification for determining parameters included in the learning model and verification data used for verification for adjusting the threshold for classification. . Verification data used for verification for adjusting the threshold for classification is used by the threshold adjuster 256, for example.

本実施形態において、閾値調整部256は、学習部254により生成された学習モデルのための分類用の閾値を調整する。例えば、閾値調整部256は、分類用の閾値として初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなる値を、調整後の閾値として決定する。 In this embodiment, the threshold adjuster 256 adjusts the classification threshold for the learning model generated by the learner 254 . For example, the threshold adjusting unit 256 determines, as the adjusted threshold, a value that increases the true positive rate of the determination result of the learning model compared to when the initial value is used as the threshold for classification.

例えば、閾値調整部256は、まず、学習部254により生成された学習モデルの受信者動作特性カーブ(ROCカーブ)を示すデータを算出する。閾値調整部256は、例えば、データセット生成部252が生成した学習用データセットのうち、学習部254における機械学習に利用されなかったデータセットを利用して、分類用の閾値を少しずつ変化させながら、学習モデルの真陽性率及び偽陽性率を算出する。これにより、ROCカーブを示すデータが算出される。次に、閾値調整部256は、ROCカーブ上のポイントであって、分類用の閾値として初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなるポイントに対応する閾値を、調整後の閾値として決定する。 For example, the threshold adjustment unit 256 first calculates data indicating a receiver operating characteristic curve (ROC curve) of the learning model generated by the learning unit 254 . For example, the threshold adjustment unit 256 gradually changes the classification threshold by using a data set that is not used for machine learning in the learning unit 254 among the learning data sets generated by the data set generation unit 252. while calculating the true positive rate and false positive rate of the learning model. Thereby, data representing the ROC curve is calculated. Next, the threshold adjustment unit 256 corresponds to a point on the ROC curve at which the true positive rate of the determination result of the learning model increases compared to when the initial value is used as the threshold for classification. is determined as the adjusted threshold.

本実施形態において、判定部260は、学習部254が生成した学習モデルと、閾値調整部256が決定した調整後の閾値とを用いて、判定対象データを判定する。例えば、判定部260は、格納部242にアクセスして、データセット生成部252が生成した判定対象データを取得する。判定部260は、判定対象データを、学習部254が生成した学習モデルに入力する。学習部学習部254は、閾値調整部256が決定した調整後の閾値を利用して、判定対象データに含まれる端末IDにより示される通信端末のユーザが、判定対象データに含まれる店舗IDにより示される店舗の内部に存在していたか否かを判定する。判定部260は、判定結果を示す出力データを格納部242に格納してよい。 In the present embodiment, the determination unit 260 determines determination target data using the learning model generated by the learning unit 254 and the adjusted threshold determined by the threshold adjustment unit 256 . For example, the determination unit 260 accesses the storage unit 242 and acquires determination target data generated by the data set generation unit 252 . The determination unit 260 inputs the determination target data to the learning model generated by the learning unit 254 . The learning unit learning unit 254 uses the adjusted threshold value determined by the threshold adjustment unit 256 to determine whether the user of the communication terminal indicated by the terminal ID included in the determination target data is identified by the store ID included in the determination target data. It is determined whether or not it existed inside the store where the The determination unit 260 may store output data indicating the determination result in the storage unit 242 .

本実施形態において、来店人数推定部270は、例えば、通信端末108からの要求に応じて、特定の期間に特定の店舗に来店した顧客の人数を推定する。来店人数推定部270は、例えば、格納部242に格納された出力データに基づいて、特定の期間に特定の店舗に存在した通信端末のユーザの人数を算出する。来店人数推定部270は、例えば、算出された通信端末のユーザの人数に、適切な係数を乗ずることで、特定の期間に特定の店舗に来店した顧客の人数を推定する。上述のとおり、管理サーバ160は、来店人数推定部270に代えて、又は、来店人数推定部270とともに、通信端末108からの要求に応じて、特定の期間に特定の店舗の外を通行する通行人の人数を推定する通行人数推定部(図示されていない。)を備えてもよい。 In this embodiment, the visitor number estimation unit 270 estimates, for example, the number of customers who visited a specific store during a specific period in response to a request from the communication terminal 108 . The visitor number estimation unit 270 calculates the number of communication terminal users who were present at a specific store during a specific period based on the output data stored in the storage unit 242, for example. The number-of-stores estimating unit 270 estimates the number of customers who visited a particular store during a particular period, for example, by multiplying the calculated number of communication terminal users by an appropriate coefficient. As described above, the management server 160, instead of the number-of-stores estimating unit 270, or together with the number-of-stores estimating unit 270, responds to requests from the communication terminal 108 by A passerby number estimation unit (not shown) for estimating the number of people may be provided.

図3は、格納部242の内部構成の一例を概略的に示す。AP情報格納部322と、店舗情報格納部324と、対応情報格納部326と、ログ情報格納部332と、来店情報格納部334と、入力データ格納部342と、データセット格納部352と、対象データ格納部354と、出力データ格納部362と、モデル情報格納部372とを備える。 FIG. 3 schematically shows an example of the internal configuration of the storage unit 242. As shown in FIG. AP information storage unit 322, store information storage unit 324, correspondence information storage unit 326, log information storage unit 332, store visit information storage unit 334, input data storage unit 342, data set storage unit 352, target A data storage unit 354 , an output data storage unit 362 and a model information storage unit 372 are provided.

本実施形態において、AP情報格納部322は、1以上のアクセスポイントのそれぞれに関する情報を格納する。AP情報格納部322は、例えば、各アクセスポイントの識別情報と、各アクセスポイントが配された店舗の識別情報とを対応づけて格納する。各アクセスポイントの識別情報としては、管理サーバ160が各アクセスポイントに割り当てた識別情報(APIDと称される場合がある)、各アクセスポイントのMACアドレスなどが例示される。 In this embodiment, the AP information storage unit 322 stores information regarding each of one or more access points. The AP information storage unit 322 stores, for example, the identification information of each access point and the identification information of the store where each access point is arranged in association with each other. Examples of the identification information of each access point include identification information (sometimes referred to as APID) assigned to each access point by the management server 160, MAC address of each access point, and the like.

本実施形態において、店舗情報格納部324は、1以上の店舗のそれぞれに関する情報を格納する。店舗情報格納部324は、例えば、各店舗の識別情報と、各店舗の位置情報と、各店舗の属性を示す情報と、各店舗の進入制限情報とを対応づけて格納する。各店舗の識別情報としては、管理サーバ160が各店舗に割り当てた識別情報(店舗IDと称される場合がある)、各店舗の名称、各店舗の住所などが例示される。 In this embodiment, the shop information storage unit 324 stores information about each of one or more shops. The store information storage unit 324 stores identification information of each store, location information of each store, information indicating attributes of each store, and entry restriction information of each store, for example, in association with each other. Examples of the identification information of each store include identification information (sometimes referred to as a store ID) assigned to each store by the management server 160, the name of each store, the address of each store, and the like.

本実施形態において、対応情報格納部326は、1以上の対応関係情報を格納する。本実施形態において、ログ情報格納部332は、1以上のログ情報を格納する。本実施形態において、来店情報格納部334は、1以上の来店確認情報を格納する。本実施形態において、入力データ格納部342は、1以上の入力データを格納する。本実施形態において、データセット格納部352は、1以上の学習用データセットを格納する。データセット格納部352は、店舗ごとの学習用データセットを格納してもよい。データセット格納部352は、アクセスポイントごとの学習用データセットを格納してもよい。 In this embodiment, the correspondence information storage unit 326 stores one or more pieces of correspondence information. In this embodiment, the log information storage unit 332 stores one or more pieces of log information. In this embodiment, the store visit information storage unit 334 stores one or more pieces of store visit confirmation information. In this embodiment, the input data storage unit 342 stores one or more pieces of input data. In this embodiment, the dataset storage unit 352 stores one or more learning datasets. The data set storage unit 352 may store learning data sets for each store. The dataset storage unit 352 may store a learning dataset for each access point.

本実施形態において、対象データ格納部354は、1以上の判定対象データを格納する。本実施形態において、出力データ格納部362は、1以上の出力データを格納する。本実施形態において、モデル情報格納部372は、1以上の学習モデルのそれぞれに関する情報を格納する。モデル情報格納部372は、店舗ごとの学習モデルに関する情報を格納してよい。モデル情報格納部372は、アクセスポイントごとの学習モデルに関する情報を格納してもよい。学習モデルに関する情報は、例えば、推論モデルのプログラムと、推論モデルのパラメータの値を示す情報と、閾値調整部256により決定された調整後の閾値を示す情報とを含む。 In this embodiment, the target data storage unit 354 stores one or more determination target data. In this embodiment, the output data storage unit 362 stores one or more output data. In this embodiment, the model information storage unit 372 stores information about each of one or more learning models. The model information storage unit 372 may store information on learning models for each store. The model information storage unit 372 may store information regarding learning models for each access point. The information about the learning model includes, for example, an inference model program, information indicating parameter values of the inference model, and information indicating the adjusted threshold value determined by the threshold adjustment unit 256 .

図4は、入力データ生成部244における情報処理の一例を概略的に示す。図4を用いて、特定の単位期間においてアクセスポイント122が受信した無線信号のうち、通信端末102が発信した無線信号に関する複数のログ情報を、単一の入力データに集約する場合を例として、入力データ生成部244における集約処理の一例が説明される。図4において、三角形のマークは、アクセスポイント122において、通信端末102が発信した無線信号であって、電波強度が予め定められた強度よりも大きな無線信号が受信されたタイミングを示す。 FIG. 4 schematically shows an example of information processing in the input data generator 244. As shown in FIG. Using FIG. 4, as an example, a case where a plurality of pieces of log information related to radio signals transmitted by the communication terminal 102 among the radio signals received by the access point 122 in a specific unit period are aggregated into a single input data. An example of aggregation processing in the input data generator 244 will be described. In FIG. 4 , triangular marks indicate timings at which access point 122 receives a wireless signal transmitted by communication terminal 102 and having a radio signal strength greater than a predetermined strength.

図4に示されるとおり、特定の単位期間において通信端末102が発信した無線信号のうち、アクセスポイント122において検出された無線信号に関するn個のログ情報は、グループ422と、グループ424とに分類され得る。nは、2以上の整数であってよい。例えば、グループ422には、ma個のログ情報が含まれる。また、グループ424には、mb個のログ情報が含まれる。maは、1以上の整数であってもよく、2以上の整数であってもよい。mbは、1以上の整数であってよく、2以上の整数であってもよい。なお、単位期間に含まれるグループの数は、滞在期間内の訪問回数を示す。 As shown in FIG. 4, among the radio signals transmitted by communication terminal 102 in a specific unit period, n pieces of log information related to radio signals detected by access point 122 are classified into groups 422 and 424. obtain. n may be an integer of 2 or greater. For example, group 422 includes ma pieces of log information. Also, the group 424 includes mb pieces of log information. ma may be an integer of 1 or more, or an integer of 2 or more. mb may be an integer of 1 or more, or an integer of 2 or more. The number of groups included in the unit period indicates the number of visits during the period of stay.

例えば、入力データ生成部244は、特定の単位期間に、アクセスポイント122において検出された無線信号に関する複数のログ情報を、各ログ情報により示される受信時刻をキーとしてソートする。時間的に隣接する2つのログ情報の受信時刻の差が予め定められた値と等しい又は当該値よりも小さい場合、入力データ生成部244は、当該2つのログ情報は同一のグループに属すると判断する。一方、時間的に隣接する2つのログ情報の受信時刻の差が予め定められた値よりも大きい又は当該値と等しい場合、入力データ生成部244は、当該2つのログ情報は異なるグループに属すると判断する。 For example, the input data generation unit 244 sorts a plurality of pieces of log information related to wireless signals detected at the access point 122 in a specific unit period, using reception time indicated by each piece of log information as a key. If the difference between the reception times of two temporally adjacent pieces of log information is equal to or smaller than a predetermined value, the input data generator 244 determines that the two pieces of log information belong to the same group. do. On the other hand, if the difference between the reception times of two temporally adjacent pieces of log information is greater than or equal to a predetermined value, the input data generation unit 244 determines that the two pieces of log information belong to different groups. to decide.

グループ422に含まれるma個のログ情報を、各ログ情報により示される受信時刻に従って並べた場合に、時間的に隣接する2つのログ情報の受信時刻の差ΔTaは、上記の予め定められた値と等しい又は当該値よりも小さい。同様に、グループ424に含まれるmb個のログ情報を、各ログ情報により示される受信時刻に従って並べた場合に、時間的に隣接する2つのログ情報の受信時刻の差ΔTbは、上記の予め定められた値と等しい又は当該値よりも小さい。一方、グループ422に含まれるログ情報のうち最後に検出されたログ情報により示される受信時刻と、グループ424に含まれるログ情報のうち最初に検出されたログ情報により示される受信時刻との差ΔTabは、上記の予め定められた値より大きい又は当該値に等しい。 When the ma pieces of log information included in the group 422 are arranged according to the reception time indicated by each piece of log information, the difference ΔTa between the reception times of two pieces of log information temporally adjacent to each other is the above predetermined value. equal to or less than that value. Similarly, when mb pieces of log information included in group 424 are arranged according to the reception time indicated by each piece of log information, the difference ΔTb between the reception times of two temporally adjacent pieces of log information is the above predetermined is equal to or less than the specified value. On the other hand, the difference ΔTab between the reception time indicated by the last log information detected among the log information included in the group 422 and the reception time indicated by the first detected log information among the log information included in the group 424 is greater than or equal to the above predetermined value.

例えば、入力データ生成部244は、n個のログ情報の一部を集約して、1個以上n-1個以下の入力データを生成する。入力データ生成部244は、生成された1以上の入力データを、格納部242に格納してよい。一実施形態において、入力データ生成部244は、単位期間ごとに、複数のログ情報を単一の入力データに集約する。他の実施形態において、入力データ生成部244は、継続期間ごとに(即ち、グループごとに)、複数のログ情報を単一の入力データに集約する。 For example, the input data generation unit 244 aggregates a part of n pieces of log information to generate 1 to n−1 pieces of input data. The input data generation unit 244 may store the generated one or more input data in the storage unit 242 . In one embodiment, the input data generator 244 aggregates multiple pieces of log information into single input data for each unit period. In another embodiment, the input data generator 244 aggregates multiple pieces of log information into single input data for each duration (ie, for each group).

より具体的には、入力データ生成部244は、まず、収集された複数のログ情報を、各ログ情報により示される通信端末ごとに分類する。これにより、例えば、特定の単位期間内に通信端末102が発信した無線信号に関する、n個のログ情報が得られる。 More specifically, the input data generator 244 first classifies a plurality of pieces of collected log information for each communication terminal indicated by each piece of log information. As a result, for example, n pieces of log information regarding radio signals transmitted by the communication terminal 102 within a specific unit period can be obtained.

次に、入力データ生成部244は、通信端末ごとに分類されたログ情報を、各ログ情報の受信時刻情報により示される受信時刻に基づいて、任意の期間ごとに集約する。任意の期間としては、単位期間、継続期間などが例示される。 Next, the input data generation unit 244 aggregates the log information classified for each communication terminal for each arbitrary period based on the reception time indicated by the reception time information of each log information. A unit period, a duration period, and the like are exemplified as the arbitrary period.

例えば、入力データ生成部244は、各期間中に検出された1以上のログ情報に含まれる信号情報により示される無線信号の電波に関する各種の物理量に対して、任意の統計処理を実施することにより、各期間中に検出された1以上のログ情報の特徴量を算出する。入力データ生成部244は、各期間中に検出された1以上のログ情報に含まれる信号情報により示される無線信号の電波に関する各種の物理量の代表値を、各期間中に検出された1以上のログ情報の特徴量としてもよい。 For example, the input data generation unit 244 performs arbitrary statistical processing on various physical quantities related to radio waves of radio signals indicated by signal information included in one or more pieces of log information detected during each period. , the feature amount of one or more pieces of log information detected during each period is calculated. The input data generation unit 244 converts representative values of various physical quantities related to radio waves of radio signals indicated by signal information included in one or more pieces of log information detected during each period to one or more pieces of log information detected during each period. It may be a feature amount of log information.

入力データ生成部244は、例えば、各期間中に検出された1以上のログ情報に関する通信端末の端末識別情報と、集約処理の対象となる期間を示す情報と、上記の特徴量とを対応付けて、入力データを生成する。これにより、各期間中に検出された1以上のログ情報が、単一の入力データに集約される。 The input data generation unit 244 associates, for example, the terminal identification information of the communication terminal related to one or more pieces of log information detected during each period, the information indicating the period to be aggregated, and the feature amount. to generate the input data. Thereby, one or more pieces of log information detected during each period are aggregated into single input data.

図5は、データセット生成部252の内部構成の一例を概略的に示す。本実施形態において、データセット生成部252は、ラベル付与部552と、データセット出力部554と、対象データ出力部556とを備える。 FIG. 5 schematically shows an example of the internal configuration of the dataset generator 252. As shown in FIG. In this embodiment, the dataset generation unit 252 includes a label assignment unit 552 , a dataset output unit 554 and a target data output unit 556 .

本実施形態において、ラベル付与部552は、情報収集部230が取得したログ情報の一部に、陽性又は陰性を示すラベルを付与する。ラベル付与部552は、入力データ生成部244が生成した入力データの一部に、陽性又は陰性を示すラベルを付与してもよい。ログ情報又は入力データの一部にラベルが付与される手順の詳細は、上述のとおりであってよい。 In this embodiment, the label assigning unit 552 assigns a positive or negative label to part of the log information acquired by the information collecting unit 230 . The label assigning unit 552 may assign a positive or negative label to part of the input data generated by the input data generating unit 244 . The details of the procedure for labeling a portion of log information or input data may be as described above.

本実施形態において、データセット出力部554は、ラベル付与部552によりラベルが付与されたログ情報又は入力データを、学習用データセットとして出力する。データセット出力部554は、学習用データセットを、データセット格納部352に格納してよい。 In this embodiment, the dataset output unit 554 outputs log information or input data labeled by the labeling unit 552 as a learning dataset. The dataset output unit 554 may store the learning dataset in the dataset storage unit 352 .

本実施形態において、対象データ出力部556は、ラベル付与部552によりラベルが付与されなかったログ情報又は入力データを、判定対象データとして出力する。対象データ出力部556は、判定対象データを、対象データ格納部354に格納してよい。 In this embodiment, the target data output unit 556 outputs log information or input data to which no label has been assigned by the label assigning unit 552 as determination target data. The target data output unit 556 may store the determination target data in the target data storage unit 354 .

図6は、学習部254の内部構成の一例を概略的に示す。本実施形態において、学習部254は、クラス分類器652と、クラス分類器654と、初期設定格納部656とを備える。 FIG. 6 schematically shows an example of the internal configuration of the learning section 254. As shown in FIG. In this embodiment, the learning unit 254 comprises a class classifier 652 , a class classifier 654 and a default setting storage unit 656 .

本実施形態において、クラス分類器652は店舗12用の学習モデルであり、クラス分類器654は店舗14用の学習モデルである。本実施形態において、初期設定格納部656は、クラス分類器652及びクラス分類器654の機械学習における初期設定を格納する。初期設定格納部656は、初期設定として、各クラス分類器の分類用の閾値の初期値に関する情報を格納してよい。学習部254は、初期設定格納部656に格納された初期設定と、データセット格納部352に格納された学習用データセットとを利用して、クラス分類器652及びクラス分類器654の機械学習を実行する。 In this embodiment, classifier 652 is the learning model for store 12 and classifier 654 is the learning model for store 14 . In this embodiment, the initial setting storage unit 656 stores initial settings for machine learning of the classifiers 652 and 654 . The initial setting storage unit 656 may store information regarding the initial value of the threshold for classification of each classifier as the initial setting. The learning unit 254 uses the initial settings stored in the initial setting storage unit 656 and the learning data set stored in the data set storage unit 352 to perform machine learning of the class classifiers 652 and 654. Run.

クラス分類器652及びクラス分類器654が、判定結果に関する分類確率を算出し、当該分類確率及び分類用の閾値を比較して、ユーザが店舗等の内部に存在していたか否かを判定する場合、分類用の閾値の初期値は0.5である。クラス分類器652及びクラス分類器654が、判定結果に関する決定関数を算出し、当該決定関数及び分類用の閾値を比較して、ユーザが店舗等の内部に存在していたか否かを判定する場合、分類用の閾値の初期値は0である。 When the classifier 652 and the classifier 654 calculate the classification probability regarding the determination result, compare the classification probability and the threshold for classification, and determine whether or not the user exists inside the store or the like. , the initial value of the threshold for classification is 0.5. When the classifier 652 and the classifier 654 calculate a decision function regarding the determination result, compare the decision function and the threshold for classification, and determine whether or not the user was present inside a store or the like , the initial value of the threshold for classification is zero.

図7は、閾値調整部256の内部構成の一例を概略的に示す。本実施形態において、閾値調整部256は、ROCカーブ算出部752と、AUCスコア算出部754と、作動ポイント決定部756と、調整値決定部758とを備える。 FIG. 7 schematically shows an example of the internal configuration of the threshold adjuster 256. As shown in FIG. In this embodiment, the threshold adjuster 256 includes an ROC curve calculator 752 , an AUC score calculator 754 , an actuation point determiner 756 and an adjustment value determiner 758 .

本実施形態において、ROCカーブ算出部752は、学習部254により生成された学習モデルの受信者動作特性カーブ(ROCカーブ)を示すデータを算出する。ROCカーブを示すデータを算出する手順は上述のとおりであってよい。本実施形態において、AUCスコア算出部754は、ROCカーブの下の領域(AUC)の面積を示すAUCスコアを算出する。 In this embodiment, the ROC curve calculator 752 calculates data indicating the receiver operating characteristic curve (ROC curve) of the learning model generated by the learning unit 254 . The procedure for calculating the data representing the ROC curve may be as described above. In this embodiment, the AUC score calculator 754 calculates an AUC score indicating the area of the area under the ROC curve (AUC).

本実施形態において、作動ポイント決定部756と、ROCカーブ上のポイントであって、分類用の閾値として初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなるポイントを、学習モデルの作動ポイントとして決定する。作動ポイントを決定する手順の詳細は後述される。 In this embodiment, the true positive rate of the determination result of the learning model increases compared to the case where the operating point determination unit 756 and the initial value are used as the threshold for classification, which is the point on the ROC curve. A point is determined as the actuation point of the learning model. Details of the procedure for determining the actuation point will be described later.

本実施形態において、調整値決定部758は、調整後の閾値として利用される値を決定する。調整値決定部758は、作動ポイント決定部756が決定した作動ポイントに対応する閾値を、調整後の閾値として決定してよい。 In this embodiment, the adjustment value determination unit 758 determines a value used as the threshold after adjustment. The adjustment value determiner 758 may determine the threshold corresponding to the actuation point determined by the actuation point determiner 756 as the adjusted threshold.

図8は、閾値調整部256における情報処理の一例を概略的に示す。図8は、作動ポイント決定部756が作動ポイントを決定する処理の一例を概略的に示す。図8において、ROCカーブ820は、来店確認情報に基づいて生成された学習用データセットを利用して学習した学習モデルのROCカーブを示す。ポイント832は、分類用の閾値として初期値が利用された場合における、真陽性率及び偽陽性率を示す。ポイント834は、(i)ROCカーブ820と、(ii)真陽性率が1であり偽陽性率が0であるポイント(ベストポイントと称される場合がある。)、及び、真陽性率が0であり偽陽性率が1であるポイントを結ぶ直線840との交点を示す。 FIG. 8 schematically shows an example of information processing in the threshold adjuster 256. As shown in FIG. FIG. 8 schematically shows an example of a process in which the actuation point determination section 756 determines an actuation point. In FIG. 8, the ROC curve 820 indicates the ROC curve of the learning model learned using the learning data set generated based on the store visit confirmation information. Point 832 shows the true positive rate and false positive rate when the initial value is used as the threshold for classification. Points 834 are (i) the ROC curve 820, (ii) a point with a true positive rate of 1 and a false positive rate of 0 (sometimes referred to as the best point), and a true positive rate of 0. and a straight line 840 connecting points with a false positive rate of 1.

本実施形態において、作動ポイント決定部756は、ポイント834を作動ポイントとして決定する。ここで、来店確認情報に基づいて生成された学習用データセットを利用して学習処理が実行された場合、学習済みの学習モデルは、例えば、「店舗12に来店し、来店確認機器142により来店が確認されたユーザに関するデータポイント」を陽性に分類し、「店舗12に来店したものの、来店確認機器142により来店が確認されていないユーザに関するデータポイント」及び「店舗12に来店していないユーザに関するデータポイント」を陰性に分類するように調整される。 In this embodiment, actuation point determiner 756 determines point 834 as the actuation point. Here, when the learning process is executed using the learning data set generated based on the store visit confirmation information, the learned learning model may be, for example, "visit the store 12 and use the store visit confirmation device 142 to visit the store. are positive, and "data points related to users who have visited the store 12 but have not been confirmed by the store visit confirmation device 142" and "data points related to users who have not visited the store 12" are classified as positive. data points” to be classified as negative.

そのため、作動ポイントにおいては、分類用の閾値として初期値が利用された場合と比較して、「店舗12に来店し、来店確認機器142により来店が確認されたユーザに関するデータポイント」を陽性とし、「店舗12に来店したものの、来店確認機器142により来店が確認されていないユーザに関するデータポイント」及び「店舗12に来店していないユーザに関するデータポイント」を陰性とした場合の真陽性率が大きくなる。また、分類用の閾値として初期値が利用された場合と比較して、「店舗12に来店し、来店確認機器142により来店が確認されたユーザに関するデータポイント」を陽性とし、「店舗12に来店したものの、来店確認機器142により来店が確認されていないユーザに関するデータポイント」及び「店舗12に来店していないユーザに関するデータポイント」を陰性とした場合の偽陽性率が大きくなる。 Therefore, in the operation points, compared with the case where the initial value is used as the threshold for classification, "the data point related to the user who visited the store 12 and was confirmed by the store visit confirmation device 142" is positive, The true positive rate increases when "data points related to users who have visited the store 12 but are not confirmed to have visited the store by the store visit confirmation device 142" and "data points related to users who have not visited the store 12" are negative. . In addition, compared with the case where the initial value is used as the threshold for classification, "the data point regarding the user who visited the store 12 and was confirmed by the store visit confirmation device 142" is positive, and "the store 12 is visited. However, the false-positive rate increases when "data points regarding users whose visits have not been confirmed by the visit confirmation device 142" and "data points regarding users who have not visited the store 12" are negative.

しかしながら、判定部260においては、例えば、「店舗12の内部に存在するユーザに関するデータポイント」を陽性とし、「店舗12の内部に存在しないユーザに関するデータポイント」を陰性として、学習モデルを利用した判定処理が実行される。つまり、判定部260においては、例えば、「店舗12に来店し、来店確認機器142により来店が確認されたユーザに関するデータポイント」及び「店舗12に来店したものの、来店確認機器142により来店が確認されていないユーザに関するデータポイント」を陽性とし、「店舗12に来店していないユーザに関するデータポイント」を陰性として、学習モデルを利用した判定処理が実行される。 However, in the determination unit 260, for example, "data points related to users who exist inside the store 12" are positive, and "data points related to users who do not exist inside the store 12" are negative. Processing is performed. In other words, the determination unit 260 determines, for example, “data points regarding a user who visited the store 12 and was confirmed by the store visit confirmation device 142” and “a user who visited the store 12 but was confirmed by the store visit confirmation device 142. Determination processing using a learning model is performed by setting a positive data point for a user who has not visited the store 12 and a negative data point for a user who has not visited the store 12 .

ここで、「店舗12に来店したものの、来店確認機器142により来店が確認されていないユーザ」の挙動は、「店舗12に来店していないユーザ」の挙動よりも、「店舗12に来店し、来店確認機器142により来店が確認されたユーザ」の挙動に類似する可能性が高い。そのため、作動ポイント決定部756が決定した作動ポイントに対応する閾値が、判定部260における分類用の閾値として利用されることで、分類用の閾値として初期値が利用された場合と比較して、「店舗12の内部に存在するユーザに関するデータポイント」を陽性とし、「店舗12の内部に存在しないユーザに関するデータポイント」を陰性とした場合の真陽性率が大きくなることが期待される。また、分類用の閾値として初期値が利用された場合と比較して、「店舗12の内部に存在するユーザに関するデータポイント」を陽性とし、「店舗12の内部に存在しないユーザに関するデータポイント」を陰性とした場合の偽陽性率が小さくなることが期待される。 Here, the behavior of "a user who has visited the store 12 but whose visit has not been confirmed by the store visit confirmation device 142" is more likely than that of a "user who has not visited the store 12". There is a high possibility that the behavior is similar to that of "a user whose visit has been confirmed by the visit confirmation device 142". Therefore, by using the threshold value corresponding to the actuation point determined by the actuation point determination unit 756 as the threshold value for classification in the determination unit 260, compared to the case where the initial value is used as the threshold value for classification, It is expected that the true positive rate will increase when "data points related to users existing inside the store 12" are positive and "data points related to users not present inside the store 12" are negative. In addition, compared to the case where the initial value is used as the threshold for classification, "data points related to users existing inside the store 12" are positive, and "data points related to users not existing inside the store 12" are positive. It is expected that the false-positive rate in the case of negative results will be reduced.

なお、作動ポイントを決定する方法は本実施形態に限定されない。他の実施形態において、作動ポイント決定部756は、ベストポイントと、ROCカーブ820上の各ポイントとの距離を算出する。作動ポイント決定部756は、上記の距離が最短となるポイントを、作動ポイントとして決定する。 Note that the method of determining the actuation point is not limited to this embodiment. In another embodiment, operating point determiner 756 calculates the distance between the best point and each point on ROC curve 820 . The actuation point determination unit 756 determines the point with the shortest distance as the actuation point.

図9~図20を用いて、管理サーバ160における情報処理の具体例が説明される。図9~図17は、格納部242に格納される各種のデータテーブルの一例を概略的に示す。図18は、解析部240における情報処理の一例を概略的に示す。具体的には、図9は、解析部240における学習用データセットの生成処理、学習モデルの生成処理、及び、分類用の閾値の調整処理の一例を概略的に示す。図19は、解析部240における情報処理の一例を概略的に示す。図19は、解析部240における判定処理の一例を概略的に示す。図20は、判定結果が記録されたデータテーブル1800の一例を概略的に示す。 A specific example of information processing in the management server 160 will be described with reference to FIGS. 9 to 20. FIG. 9 to 17 schematically show examples of various data tables stored in the storage unit 242. FIG. FIG. 18 schematically shows an example of information processing in the analysis unit 240. As shown in FIG. Specifically, FIG. 9 schematically shows an example of a learning data set generation process, a learning model generation process, and a classification threshold adjustment process in the analysis unit 240 . FIG. 19 schematically shows an example of information processing in the analysis unit 240. As shown in FIG. FIG. 19 schematically shows an example of determination processing in the analysis unit 240. As shown in FIG. FIG. 20 schematically shows an example of a data table 1800 in which judgment results are recorded.

図9は、データテーブル900の一例を概略的に示す。データテーブル900は、AP情報格納部322に格納されるデータベースの一例であってよい。データテーブル900の各行は、各アクセスポイントに関する情報の一例であってよい。本実施形態において、データテーブル900は、各アクセスポイントのAPID922と、各アクセスポイントのMACアドレスを示す情報924と、各アクセスポイントが配される店舗の店舗ID926とを対応付けて格納する。APID922と、MACアドレスを示す情報924及び店舗ID926は、アクセスポイントの識別情報の一例であってよい。 FIG. 9 schematically shows an example of a data table 900. As shown in FIG. The data table 900 may be an example of a database stored in the AP information storage unit 322. FIG. Each row of data table 900 may be an example of information about each access point. In this embodiment, the data table 900 stores APID 922 of each access point, information 924 indicating the MAC address of each access point, and store ID 926 of the store where each access point is arranged, in association with each other. The APID 922, the information 924 indicating the MAC address, and the shop ID 926 may be examples of access point identification information.

図10は、データテーブル1000の一例を概略的に示す。データテーブル1000は、店舗情報格納部324に格納されるデータベースの一例であってよい。データテーブル1000の各行は、各店舗に関する情報の一例であってよい。本実施形態において、データテーブル1000は、各店舗の店舗ID1022と、各店舗の店舗名称1024と、各店舗の店舗タイプ1026と、各店舗の位置情報1028と、各店舗の営業時間を示す情報1030とを対応付けて格納する。店舗タイプ1026に記録される項目としては、例えば、店舗内店舗、市街地の単独店舗又は商店街中の店舗、ロードサイドの単独店舗などが例示される。店舗タイプ1026は、店舗の属性の一例であってよい。営業時間を示す情報1030は、進入制限情報の一例であってよい。 FIG. 10 schematically shows an example of the data table 1000. As shown in FIG. Data table 1000 may be an example of a database stored in store information storage unit 324 . Each row of the data table 1000 may be an example of information about each store. In this embodiment, the data table 1000 includes store ID 1022 of each store, store name 1024 of each store, store type 1026 of each store, location information 1028 of each store, and information 1030 indicating business hours of each store. and are stored in association with each other. Items recorded in the store type 1026 include, for example, a store within a store, a single store in an urban area or a store in a shopping district, and a single roadside store. Store type 1026 may be an example of a store attribute. The information 1030 indicating business hours may be an example of entry restriction information.

図11は、データテーブル1100の一例を概略的に示す。データテーブル1100は、対応情報格納部326に格納されるデータベースの一例であってよい。データテーブル1100の各行は、対応関係情報の一例であってよい。本実施形態において、データテーブル1100は、各通信端末の端末ID1122と、各通信端末のユーザのユーザID1124とを対応付けて格納する。ユーザID1124としては、クレジットカードのカード番号、ポイント付与サービスの会員番号、SNSのアカウントなどが例示される。 FIG. 11 schematically shows an example of a data table 1100. As shown in FIG. The data table 1100 may be an example of a database stored in the correspondence information storage unit 326. FIG. Each row of the data table 1100 may be an example of correspondence information. In this embodiment, the data table 1100 stores the terminal ID 1122 of each communication terminal and the user ID 1124 of the user of each communication terminal in association with each other. Examples of the user ID 1124 include a credit card number, a membership number for a point-giving service, an SNS account, and the like.

図12は、データテーブル1200の一例を概略的に示す。データテーブル1200は、ログ情報格納部332に格納されるデータベースの一例であってよい。データテーブル1200の各行は、ログ情報の一例であってよい。本実施形態において、データテーブル1200は、無線信号を受信したアクセスポイントのAPID1222と、無線信号の受信時刻を示す情報1224と、無線信号を発信した通信端末の端末ID1226と、無線信号の電波に関する情報1228とを対応付けて格納する。無線信号の電波に関する情報1228としては、電波強度を示す情報、周波数帯を示す情報、接続段階を示す情報などが例示される。電波強度は、例えば、RSSIにより表される。 FIG. 12 schematically shows an example of a data table 1200. As shown in FIG. The data table 1200 may be an example of a database stored in the log information storage unit 332. FIG. Each row of data table 1200 may be an example of log information. In this embodiment, the data table 1200 includes the APID 1222 of the access point that received the wireless signal, information 1224 indicating the reception time of the wireless signal, the terminal ID 1226 of the communication terminal that transmitted the wireless signal, and information about the radio wave of the wireless signal. 1228 are stored in association with each other. Examples of the information 1228 on the radio wave of the radio signal include information indicating radio wave intensity, information indicating the frequency band, information indicating the connection stage, and the like. The radio wave intensity is represented by RSSI, for example.

図13は、データテーブル1300の一例を概略的に示す。データテーブル1300は、例えば、来店情報格納部334に格納されるデータベースの一例であってよい。データテーブル1300の各行は、来店確認情報の一例であってよい。本実施形態において、データテーブル1300は、ユーザのユーザID1322と、ユーザの行動が確認された場所の位置情報1324と、ユーザの行動が確認された時刻を示す情報1326とを対応付けて格納する。ユーザID1322は、ユーザIDの種類を示す情報と、ユーザIDの詳細を示す情報とを含んでよい。ユーザIDの詳細は、クレジットカードのカード番号、ポイント付与サービスの会員番号、ユーザの氏名、ユーザが利用する通信端末のMACアドレスなどの具体的な数列又は文字列であってよい。ユーザの行動が確認された場所の位置情報1324としては、ユーザの行動が確認された場所の名称、当該場所の住所、当該場所の位置座標などが例示される。 FIG. 13 schematically shows an example of a data table 1300. As shown in FIG. The data table 1300 may be an example of a database stored in the visit information storage unit 334, for example. Each row of the data table 1300 may be an example of store visit confirmation information. In this embodiment, the data table 1300 stores the user ID 1322 of the user, the position information 1324 of the location where the user's behavior was confirmed, and the information 1326 indicating the time when the user's behavior was confirmed in association with each other. The user ID 1322 may include information indicating the type of user ID and information indicating details of the user ID. The details of the user ID may be a specific number string or character string such as a credit card number, a membership number for a point-giving service, the name of the user, or the MAC address of the communication terminal used by the user. Examples of the location information 1324 of the location where the user's behavior was confirmed include the name of the location where the user's behavior was confirmed, the address of the location, the location coordinates of the location, and the like.

図14は、データテーブル1400の一例を概略的に示す。データテーブル1400は、例えば、入力データ格納部342に格納されるデータベースの一例であってよい。データテーブル1400の各行は、入力データの一例であってよい。本実施形態において、データテーブル1400は、無線信号を発信した通信端末の端末ID1422と、無線信号を受信したアクセスポイントが配された店舗の店舗ID1424と、無線信号の受信日を示す情報1426と、無線信号の特徴量を示す情報1428とを対応付けて格納する。無線信号の特徴量は、複数の項目を含んでよい。店舗ID1424は、店舗の識別情報の一例であるとともに、アクセスポイントの識別情報の一例であってもよい。受信日は、無線信号が受信された単位期間の一例であってよい。 FIG. 14 schematically shows an example of a data table 1400. As shown in FIG. The data table 1400 may be an example of a database stored in the input data storage unit 342, for example. Each row of data table 1400 may be an example of input data. In this embodiment, the data table 1400 includes a terminal ID 1422 of the communication terminal that transmitted the wireless signal, a store ID 1424 of the store where the access point that received the wireless signal is arranged, information 1426 indicating the reception date of the wireless signal, Information 1428 indicating the feature quantity of the radio signal is stored in association with the information 1428 . The radio signal feature amount may include a plurality of items. The store ID 1424 is an example of identification information of a store and may be an example of identification information of an access point. The date of reception may be an example of a unit period in which the radio signal was received.

図15は、データテーブル1500の一例を概略的に示す。データテーブル1500は、データセット格納部352に格納されるデータベースの一例であってよい。データテーブル1500は、学習用データセットの一例であってよい。データテーブル1500の各行は、学習用のデータポイントの一例であってよい。なお、図15において、データテーブル1400と同様の項目には、データテーブル1400と同一の符号が付され、説明が省略される場合がある。 FIG. 15 schematically shows an example of a data table 1500. As shown in FIG. Data table 1500 may be an example of a database stored in dataset storage unit 352 . Data table 1500 may be an example of a training data set. Each row of data table 1500 may be an example data point for training. In FIG. 15, items similar to those in the data table 1400 are denoted by the same reference numerals as those in the data table 1400, and description thereof may be omitted.

本実施形態において、データテーブル1500は、無線信号を発信した通信端末の端末ID1422と、無線信号を受信したアクセスポイントが配された店舗の店舗ID1424と、無線信号の受信日を示す情報1426と、無線信号の特徴量を示す情報1428と、ラベルの種類を示す情報1532とを対応付けて格納する。ラベルの種類としては、ユーザが店舗のエリア内に存在することを示す「来店」と、ユーザが店舗のエリア外に存在することを示す「非来店」とが例示される。 In this embodiment, the data table 1500 includes a terminal ID 1422 of the communication terminal that transmitted the wireless signal, a store ID 1424 of the store where the access point that received the wireless signal is arranged, information 1426 indicating the reception date of the wireless signal, Information 1428 indicating the feature quantity of the radio signal and information 1532 indicating the type of label are associated and stored. Examples of label types include "Visit" indicating that the user exists within the area of the store, and "Non-visit" indicating that the user exists outside the area of the store.

図16は、データテーブル1600の一例を概略的に示す。データテーブル1600は、対象データ格納部354に格納されるデータベースの一例であってよい。データテーブル1600の各行は、判定対象データの一例であってよい。なお、図16において、データテーブル1400と同様の項目には、データテーブル1400と同一の符号が付され、説明が省略される場合がある。 FIG. 16 schematically shows an example of a data table 1600. As shown in FIG. The data table 1600 may be an example of a database stored in the target data storage unit 354. FIG. Each row of the data table 1600 may be an example of determination target data. In FIG. 16, items similar to those in the data table 1400 are denoted by the same reference numerals as those in the data table 1400, and description thereof may be omitted.

本実施形態において、データテーブル1600は、無線信号を発信した通信端末の端末ID1422と、無線信号を受信したアクセスポイントが配された店舗の店舗ID1424と、無線信号の受信日を示す情報1426と、無線信号の特徴量を示す情報1428と、判定結果を示す情報1632と、分類確率又は決定関数の値を示す情報1634とを対応付けて格納する。判定対象データは、判定部260における判定処理において使用されるデータであるので、本実施形態において、判定結果を示す情報1632及び分類確率又は決定関数の値を示す情報1634の列は、空欄となっている。 In this embodiment, the data table 1600 includes a terminal ID 1422 of the communication terminal that transmitted the wireless signal, a store ID 1424 of the store where the access point that received the wireless signal is arranged, information 1426 indicating the reception date of the wireless signal, Information 1428 indicating the feature quantity of the radio signal, information 1632 indicating the determination result, and information 1634 indicating the classification probability or the value of the decision function are stored in association with each other. Since the determination target data is data used in determination processing in the determination unit 260, in this embodiment, the columns of the information 1632 indicating the determination result and the information 1634 indicating the classification probability or the value of the decision function are blank. ing.

図17は、データテーブル1700の一例を概略的に示す。データテーブル1700は、例えば、出力データ格納部362に格納されるデータベースの一例であってよい。データテーブル1700の各行は、出力データの一例であってよい。なお、図17において、データテーブル1400、データテーブル1500又はデータテーブル1600と同様の項目には、データテーブル1400、データテーブル1500又はデータテーブル1600と同一の符号が付され、説明が省略される場合がある。 FIG. 17 schematically shows an example of a data table 1700. As shown in FIG. The data table 1700 may be an example of a database stored in the output data storage unit 362, for example. Each row of data table 1700 may be an example of output data. In FIG. 17, items similar to data table 1400, data table 1500, or data table 1600 are denoted by the same reference numerals as data table 1400, data table 1500, or data table 1600, and description thereof may be omitted. be.

本実施形態において、データテーブル1700は、無線信号を発信した通信端末の端末ID1422と、無線信号を受信したアクセスポイントが配された店舗の店舗ID1424と、無線信号の受信日を示す情報1426と、ラベルの種類を示す情報1532と、判定結果を示す情報1632とを対応付けて格納する。本実施形態において、データテーブル1700には、データセット生成部252が生成した学習用データセットに対応する情報のみが格納されており、判定対象データの判定結果に関する情報は、まだ格納されていない。 In this embodiment, the data table 1700 includes a terminal ID 1422 of the communication terminal that transmitted the wireless signal, a store ID 1424 of the store where the access point that received the wireless signal is arranged, information 1426 indicating the reception date of the wireless signal, Information 1532 indicating the label type and information 1632 indicating the determination result are stored in association with each other. In this embodiment, the data table 1700 stores only information corresponding to the learning data set generated by the data set generation unit 252, and does not yet store information about the determination result of the determination target data.

図18は、解析部240における学習用データセットの生成処理、学習モデルの生成処理、及び、分類用の閾値の調整処理の一例を概略的に示す。本実施形態によれば、まず、入力データ生成部244が、ログ情報格納部332に格納された複数のログ情報の少なくとも一部を集約して、1以上の入力データを生成する。 FIG. 18 schematically shows an example of a learning data set generation process, a learning model generation process, and a classification threshold adjustment process in the analysis unit 240 . According to the present embodiment, first, the input data generation unit 244 aggregates at least part of the plurality of pieces of log information stored in the log information storage unit 332 to generate one or more pieces of input data.

入力データ生成部244は、AP情報格納部322に格納された各アクセスポイントに関する情報、及び、店舗情報格納部324に格納された各店舗に関する情報の少なくとも一方を参照して、1以上の入力データを生成してもよい。入力データ生成部244は、生成された入力データを、入力データ格納部342に格納する。 The input data generation unit 244 refers to at least one of information about each access point stored in the AP information storage unit 322 and information about each store stored in the store information storage unit 324, and generates one or more input data may be generated. The input data generator 244 stores the generated input data in the input data storage 342 .

具体的には、入力データ生成部244は、まず、ログ情報格納部332に格納されたデータテーブル1200に含まれる複数のログ情報を、無線信号を発信した通信端末の端末ID1226を第1キーとし、無線信号の受信時刻を示す情報1224を第2キーとして、ソートする。次に、入力データ生成部244は、各通信端末に関する複数のログ情報を、単位期間ごとに分類する。入力データ生成部244は、単位期間ごとに分類された1以上のログ情報を、単一の入力データに集約する。これにより、入力データが生成される。 Specifically, input data generator 244 first stores a plurality of pieces of log information contained in data table 1200 stored in log information storage 332, using terminal ID 1226 of the communication terminal that transmitted the radio signal as a first key. , using information 1224 indicating the reception time of the radio signal as the second key. Next, the input data generation unit 244 classifies the plurality of pieces of log information regarding each communication terminal for each unit period. The input data generator 244 aggregates one or more pieces of log information classified by unit period into single input data. This generates input data.

例えば、入力データ生成部244は、各期間中に検出された1以上のログ情報の特徴量を算出する。図4に関連して説明されたとおり、入力データ生成部244は、各期間中に検出された1以上のログ情報に含まれる信号情報により示される無線信号の電波に関する各種の物理量に対して、任意の統計処理を実施することで、上記の特徴量を算出してよい。入力データ生成部244は、複数のログ情報により示される物理量の代表値を、上記の特徴量として決定してもよい。 For example, the input data generator 244 calculates a feature amount of one or more pieces of log information detected during each period. As described with reference to FIG. 4, the input data generation unit 244, for various physical quantities related to radio waves of radio signals indicated by signal information included in one or more pieces of log information detected during each period, You may calculate said feature-value by implementing arbitrary statistical processing. The input data generator 244 may determine a representative value of physical quantities indicated by a plurality of pieces of log information as the feature quantity.

入力データ生成部244は、生成された入力データをデータテーブル1400に格納する。例えば、入力データ生成部244は、入力データの端末ID1422として、当該入力データに集約された1以上のログ情報の端末ID1226を記入する。入力データ生成部244は、データテーブル900を参照して、入力データに集約された1以上のログ情報のAPID1222に対応する店舗ID926を取得する。入力データ生成部244は、入力データの店舗ID1424として、上記の店舗ID926を記入する。入力データ生成部244は、入力データの受信日を示す情報1426として、当該入力データの集約期間となった単位期間を示す情報を記入する。入力データ生成部244は、入力データの特徴量を示す情報1428として、入力データに集約された1以上のログ情報により示される物理量の統計値又は代表値を記入する。 The input data generator 244 stores the generated input data in the data table 1400. FIG. For example, the input data generation unit 244 enters the terminal ID 1226 of one or more pieces of log information aggregated into the input data as the terminal ID 1422 of the input data. The input data generation unit 244 refers to the data table 900 and acquires the store ID 926 corresponding to the APID 1222 of one or more pieces of log information aggregated in the input data. The input data generation unit 244 enters the store ID 926 as the store ID 1424 of the input data. The input data generation unit 244 enters information indicating the unit period that is the aggregation period of the input data as the information 1426 indicating the reception date of the input data. The input data generation unit 244 enters, as the information 1428 indicating the feature amount of the input data, the statistical value or representative value of the physical quantity indicated by one or more pieces of log information aggregated in the input data.

次に、データセット生成部252が、入力データ格納部342に格納された入力データの少なくとも一部に、陽性又は陰性のラベルを付与して、学習用データセットを生成する。データセット生成部252は、来店情報格納部334に格納された来店確認情報を参照して、入力データの少なくとも一部に、陽性又は陰性のラベルを付与してよい。データセット生成部252は、来店情報格納部334に格納された来店確認情報、及び、対応情報格納部326に格納された対応関係情報を参照して、入力データの少なくとも一部に、陽性又は陰性のラベルを付与してもよい。 Next, the data set generation unit 252 generates a learning data set by giving a positive or negative label to at least part of the input data stored in the input data storage unit 342 . The data set generation unit 252 may refer to the store visit confirmation information stored in the store visit information storage unit 334 and assign a positive or negative label to at least part of the input data. The data set generation unit 252 refers to the store visit confirmation information stored in the store visit information storage unit 334 and the correspondence information stored in the correspondence information storage unit 326, and determines whether at least a part of the input data is positive or negative. may be labeled.

データセット生成部252は、陽性のラベルのみを付与する処理を実行して、学習用データセットを生成してよい。データセット生成部252は、陰性のラベルのみを付与する処理を実行して、学習用データセットを生成してよい。データセット生成部252は、陽性又は陰性のラベルを付与する処理を実行して、学習用データセットを生成してよい。データセット生成部252は、生成された学習用データセットを、データセット格納部352に格納する。 The data set generation unit 252 may generate a learning data set by performing a process of assigning only positive labels. The data set generation unit 252 may generate a learning data set by executing a process of assigning only negative labels. The data set generation unit 252 may generate a learning data set by performing a process of assigning positive or negative labels. The data set generation unit 252 stores the generated learning data set in the data set storage unit 352 .

データセット生成部252は、入力データ格納部342に格納された入力データのうち、陽性又は陰性のラベルが付与されなかった入力データを、判定対象データとして出力してよい。データセット生成部252は、判定対象データを、対象データ格納部354に格納してよい。 The data set generation unit 252 may output, among the input data stored in the input data storage unit 342, the input data to which the positive or negative label has not been assigned as the determination target data. The data set generation section 252 may store the determination target data in the target data storage section 354 .

データセット生成部252は、学習用データセットを、出力データの一部として出力してよい。データセット生成部252は、上記の出力データを、出力データ格納部362に格納してよい。 The dataset generator 252 may output the learning dataset as part of the output data. The dataset generator 252 may store the above output data in the output data storage 362 .

具体的には、データセット生成部252は、例えば、データテーブル1400に含まれる1以上の入力データと、データテーブル1300に含まれる1以上の来店確認情報とを照合して、1以上の入力データの少なくとも一部に陽性ラベルを付与することにより、データテーブル1500に格納された学習用データセットを生成する。本実施形態においては、来店確認情報のユーザID1322が、店舗12の店頭に設置された来店確認機器142と、ユーザ22の通信端末102との通信により取得された通信端末102のMACアドレスであり、来店確認情報のユーザの行動が確認された場所の位置情報1324が、店舗12の店舗名称であり、来店確認情報のユーザの行動が確認された時刻を示す情報1326が、当該MACアドレスが取得された時刻である場合を例として、データセット生成部252が学習用データセットを構成するデータポイントを生成する処理の詳細が説明される。 Specifically, the data set generation unit 252 compares, for example, one or more input data included in the data table 1400 with one or more store visit confirmation information included in the data table 1300 to obtain one or more input data. is given a positive label to at least part of the data set for learning stored in the data table 1500 . In the present embodiment, the user ID 1322 of the store visit confirmation information is the MAC address of the communication terminal 102 obtained by communication between the store visit confirmation device 142 installed at the shop front of the store 12 and the communication terminal 102 of the user 22, The location information 1324 of the place where the behavior of the user in the store visit confirmation information was confirmed is the store name of the store 12, and the information 1326 indicating the time when the user behavior in the store visit confirmation information was confirmed is the MAC address obtained. The details of the process by which the data set generation unit 252 generates the data points forming the learning data set will be described with reference to the case where the time is the time of the day.

データセット生成部252は、まず、入力データ格納部342に格納されたデータテーブル1400を構成する一の入力データを読み込む。次に、データセット生成部252は、読み込まれた入力データに含まれる端末ID1422をキーとして、来店情報格納部334に格納されたデータテーブル1300を構成する1以上の来店確認情報の中から、ユーザID1322が当該キーに合致する来店確認情報を抽出する。データセット生成部252は、読み込まれた入力データに含まれる受信日を示す情報1426をキーとして、抽出された来店確認情報の中から、当該キーにより示される単位期間中に取得された来店確認情報を抽出する。これにより、入力データと、来店確認情報とが関連付けられる。 The data set generation unit 252 first reads one piece of input data that constitutes the data table 1400 stored in the input data storage unit 342 . Next, using the terminal ID 1422 included in the read input data as a key, the data set generation unit 252 selects one or more items of store visit confirmation information from the data table 1300 stored in the store visit information storage unit 334. Store visit confirmation information whose ID 1322 matches the key is extracted. Using the information 1426 indicating the reception date included in the read input data as a key, the data set generation unit 252 extracts the store visit confirmation information acquired during the unit period indicated by the key from among the extracted store visit confirmation information. to extract This associates the input data with the visit confirmation information.

上記の来店確認情報が抽出された場合、データセット生成部252は、上記の入力データに陽性ラベルを付与して、学習用データセットを構成するデータポイントを生成する。具体的には、データセット生成部252は、読み込まれた入力データに含まれる端末ID1422、店舗ID1424、受信日を示す情報1426、及び、特徴量を示す情報1428と、ラベルの種類を示す情報1532とを対応付けて、データテーブル1500に格納する。なお、ラベルの種類を示す情報1532には、陽性を示すラベルが記入される。 When the store-visit confirmation information is extracted, the data set generation unit 252 assigns a positive label to the input data to generate data points forming a learning data set. Specifically, the data set generation unit 252 extracts the terminal ID 1422, the store ID 1424, the information 1426 indicating the reception date, the information 1428 indicating the characteristic amount, and the information 1532 indicating the label type included in the read input data. are associated with each other and stored in the data table 1500 . A label indicating positive is entered in the information 1532 indicating the type of label.

この場合において、データセット生成部252は、読み込まれた入力データに含まれる端末ID1422、店舗ID1424、及び、受信日を示す情報1426と、ラベルの種類を示す情報1532とを対応付けて、出力データの一部として、データテーブル1700に格納してもよい。なお、ラベルの種類を示す情報1532には、陽性を示すラベルが記入される。また、判定部260は、ラベルが付与されたデータポイントを判定する必要がないので、判定結果を示す情報1732には、判定処理が不要であることを示す情報が記入されてよい。 In this case, the data set generation unit 252 associates the information 1426 indicating the terminal ID 1422, the store ID 1424, and the reception date included in the read input data with the information 1532 indicating the label type, and outputs the output data. may be stored in the data table 1700 as part of the A label indicating positive is entered in the information 1532 indicating the type of label. In addition, since the determination unit 260 does not need to determine the labeled data points, the information 1732 indicating the determination result may include information indicating that determination processing is unnecessary.

一方、上記の来店確認情報が抽出されなかった場合、データセット生成部252は、上記の入力データに、判定部260の判定処理により利用される列を付与して、判定対象データを生成する。具体的には、データセット生成部252は、読み込まれた入力データに含まれる端末ID1422、店舗ID1424、受信日を示す情報1426、及び、特徴量を示す情報1428と、判定部260の判定結果を示す情報1732が入力される列と、判定部260の判定処理においてモデルが算出する分類確率又は決定関数の値を示す情報1734が入力される列とを対応付けて、データテーブル1600に格納する。 On the other hand, if the store-visit confirmation information is not extracted, the data set generation unit 252 adds columns used in the determination processing of the determination unit 260 to the input data to generate determination target data. Specifically, the data set generation unit 252 converts the terminal ID 1422, the store ID 1424, the information 1426 indicating the reception date, and the information 1428 indicating the feature amount included in the read input data, and the determination result of the determination unit 260. A column into which information 1732 indicating is input is associated with a column in which information 1734 indicating the classification probability or the value of the decision function calculated by the model in the determination processing of the determination unit 260 is input, and stored in the data table 1600 .

次に、学習部254が、データセット格納部352に格納された学習用データセットと、初期設定格納部656に格納された、分類用の閾値の初期値とを利用して、学習済みの学習モデルを生成する。学習部254は、学習済みの学習モデルに関する情報を、モデル情報格納部372に格納する。 Next, the learning unit 254 uses the learning data set stored in the data set storage unit 352 and the initial value of the threshold for classification stored in the initial setting storage unit 656 to perform the learned learning. Generate a model. The learning unit 254 stores information about the learned learning model in the model information storage unit 372 .

次に、閾値調整部256が、分類用の閾値を調整する。閾値調整部256は、調整後の閾値を決定する。閾値調整部256は、調整後の閾値を示す情報を、モデル情報格納部372に格納する。 Next, the threshold adjuster 256 adjusts the threshold for classification. The threshold adjuster 256 determines the adjusted threshold. The threshold adjuster 256 stores information indicating the adjusted threshold in the model information storage 372 .

本実施形態によれば、無線信号に関するログ情報と、来店確認情報とが関連付けられて、ラベルの付与された学習用データセットが生成される。これにより、無線信号を発信する無線端末を携帯するユーザが、特定の店舗等の内部に存在するか否かを判定するために用いられる学習モデルを、比較的容易に構築することができる。 According to the present embodiment, the log information about the radio signal and the store visit confirmation information are associated to generate a labeled learning data set. As a result, it is possible to relatively easily build a learning model used for determining whether or not a user carrying a wireless terminal that transmits a wireless signal exists inside a specific store or the like.

この点に関し、無線信号に関するログ情報を利用して店舗等への進入又は退出を判定することで、無線信号を発信する無線端末を携帯するユーザが、特定の店舗等の内部に存在するか否かを判定する場合、ルールベースのアプローチと、機械学習を利用したアプローチとが考えられる。店舗等の内部に配されたアクセスポイントにおける電波の受信状況は、(i)店舗等の立地条件、(ii)店舗等の構造、(iii)店舗等の内部におけるアクセスポイントの配置、(iv)アクセスポイントの周囲に配された構造物若しくは障害物又は人の位置、大きさ及び材質などの影響を受ける。 Regarding this point, it is possible to determine whether a user carrying a wireless terminal that transmits a wireless signal exists inside a specific store, etc. by determining whether the user enters or leaves the store, etc., using log information related to wireless signals. When determining whether the The reception status of radio waves at the access points placed inside the store, etc. depends on (i) the location conditions of the store, etc., (ii) the structure of the store, etc., (iii) the arrangement of the access points inside the store, etc., and (iv) It is affected by the position, size and material of structures or obstacles or people placed around the access point.

そのため、店舗等の状況によっては、ルールベースのアプローチを採用して、店舗等への進入又は退出を判定することが難しくなる場合がある。一方、機械学習を利用したアプローチを採用する場合、機械学習の訓練データ、検証データ及びテストデータの少なくとも1つとして利用される学習用データセットが大量に必要となる。上述のとおり、本実施形態によれば、大量の学習用データセットを準備することができるので、機械学習を利用して、上記の判定処理を実行することが可能になる。 Therefore, depending on the situation of the store or the like, it may be difficult to adopt a rule-based approach to determine entry or exit into the store or the like. On the other hand, when adopting an approach using machine learning, a large amount of learning data sets are required to be used as at least one of machine learning training data, verification data, and test data. As described above, according to the present embodiment, a large amount of learning data sets can be prepared, so it is possible to execute the determination process using machine learning.

図19は、解析部240における情報処理の一例を概略的に示す。図19は、解析部240における判定処理の一例を概略的に示す。本実施形態によれば、まず、判定部260が、モデル情報格納部372に格納された学習済の学習モデルのプログラムと、調整後の閾値を示す情報とを取得する。 FIG. 19 schematically shows an example of information processing in the analysis unit 240. As shown in FIG. FIG. 19 schematically shows an example of determination processing in the analysis unit 240. As shown in FIG. According to the present embodiment, first, the determination unit 260 acquires the learned learning model program stored in the model information storage unit 372 and the information indicating the adjusted threshold.

次に、判定部260は、対象データ格納部354に格納されたデータテーブル1600から、一の判定対象データを読み込む。判定部260は、読み込まれた判定対象データを学習モデルに入力する。学習モデルは、調整後の閾値を利用して、判定対象データに対応するユーザが店舗の内部に存在したか否かを示す判定結果を出力する。 Next, the determination unit 260 reads one determination target data from the data table 1600 stored in the target data storage unit 354 . The determination unit 260 inputs the read determination target data to the learning model. The learning model uses the adjusted threshold value to output a determination result indicating whether or not the user corresponding to the determination target data exists inside the store.

例えば、学習モデルは、読み込まれた判定対象データに対する分類確率の値を算出する。例えば、分類確率の値が調整後の閾値よりも大きい場合、学習モデルは、陽性を示す判定結果を出力する。一方、分類確率の値が調整後の閾値以下である場合、学習モデルは、陰性を示す判定結果を出力する。具体的には、判定部260は、判定対象データに含まれる端末ID1422、店舗ID1424、及び、受信日を示す情報1426と、判定部260の判定結果を示す情報1632とを対応付けて、データテーブル1700に格納する。 For example, the learning model calculates a classification probability value for the read determination target data. For example, if the value of the classification probability is greater than the adjusted threshold, the learning model outputs a positive determination result. On the other hand, when the value of the classification probability is equal to or less than the adjusted threshold value, the learning model outputs a negative judgment result. Specifically, the determination unit 260 associates the terminal ID 1422, the store ID 1424, and the information 1426 indicating the reception date included in the determination target data with the information 1632 indicating the determination result of the determination unit 260, and stores the information in the data table. 1700.

本実施形態によれば、学習モデルにより利用される分類用の閾値として、学習モデルに応じて定められた初期値ではなく、ROCカーブを利用して決定された調整後の値が用いられる。これにより、分類用の閾値として初期値が利用された場合と比較して、「店舗12の内部に存在するユーザに関するデータポイント」を陽性とし、「店舗12の内部に存在しないユーザに関するデータポイント」を陰性とした場合の真陽性率が大きくなることが期待される。また、分類用の閾値として初期値が利用された場合と比較して、「店舗12の内部に存在するユーザに関するデータポイント」を陽性とし、「店舗12の内部に存在しないユーザに関するデータポイント」を陰性とした場合の偽陽性率が小さくなることが期待される。 According to this embodiment, as the classification threshold used by the learning model, the adjusted value determined using the ROC curve is used instead of the initial value determined according to the learning model. As a result, compared to the case where the initial value is used as the threshold for classification, "data points related to users existing inside the store 12" are positive, and "data points related to users not present inside the store 12" are positive. is expected to increase the true positive rate when In addition, compared to the case where the initial value is used as the threshold for classification, "data points related to users existing inside the store 12" are positive, and "data points related to users not existing inside the store 12" are positive. It is expected that the false-positive rate in the case of negative results will be reduced.

図20は、判定結果が記録されたデータテーブル1700の一例を概略的に示す。図20に示されるデータテーブル1700は、判定対象データに関する行が追加されている点で、図18に示されるデータテーブル1700と相違する。判定対象データに関する行においては、判定結果を示す情報1632の列に、判定部260が出力した判定結果が記入されている。一方、ラベルの種類を示す情報1532には、ラベルが付与されていないことを示す情報が記入されている。 FIG. 20 schematically shows an example of a data table 1700 in which judgment results are recorded. A data table 1700 shown in FIG. 20 differs from the data table 1700 shown in FIG. 18 in that a row regarding determination target data is added. In the row related to the determination target data, the determination result output by the determination unit 260 is entered in the column of information 1632 indicating the determination result. On the other hand, in the information 1532 indicating the type of label, information indicating that no label is attached is entered.

図21は、本発明の複数の態様が全体的又は部分的に具現化されてよいコンピュータ3000の一例を示す。例えば、管理サーバ160は、コンピュータ3000により実現される。 FIG. 21 illustrates an example computer 3000 upon which aspects of the present invention may be embodied, in whole or in part. For example, management server 160 is realized by computer 3000 .

コンピュータ3000にインストールされたプログラムは、コンピュータ3000に、本発明の実施形態に係る装置に関連付けられるオペレーション又は当該装置の1又は複数の「部」として機能させ、又は当該オペレーション又は当該1又は複数の「部」を実行させることができ、及び/又はコンピュータ3000に、本発明の実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ3000に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、CPU3012によって実行されてよい。 Programs installed on the computer 3000 cause the computer 3000 to function as one or more "parts" of an operation or one or more "parts" of an apparatus according to embodiments of the invention, or to and/or cause the computer 3000 to perform processes or steps of processes according to embodiments of the present invention. Such programs may be executed by CPU 3012 to cause computer 3000 to perform certain operations associated with some or all of the blocks in the flowcharts and block diagrams described herein.

本実施形態によるコンピュータ3000は、CPU3012、RAM3014、グラフィックコントローラ3016、及びディスプレイデバイス3018を含み、それらはホストコントローラ3010によって相互に接続されている。コンピュータ3000はまた、通信インターフェース3022、ハードディスクドライブ3024、DVD-ROMドライブ3026、及びICカードドライブのような入出力ユニットを含み、それらは入出力コントローラ3020を介してホストコントローラ3010に接続されている。コンピュータはまた、ROM3030及びキーボード3042のようなレガシの入出力ユニットを含み、それらは入出力チップ3040を介して入出力コントローラ3020に接続されている。 Computer 3000 according to this embodiment includes CPU 3012 , RAM 3014 , graphics controller 3016 , and display device 3018 , which are interconnected by host controller 3010 . Computer 3000 also includes input/output units such as communication interface 3022 , hard disk drive 3024 , DVD-ROM drive 3026 and IC card drive, which are connected to host controller 3010 via input/output controller 3020 . The computer also includes legacy input/output units such as ROM 3030 and keyboard 3042 , which are connected to input/output controller 3020 via input/output chip 3040 .

CPU3012は、ROM3030及びRAM3014内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ3016は、RAM3014内に提供されるフレームバッファ等又はそれ自体の中に、CPU3012によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス3018上に表示されるようにする。 The CPU 3012 operates according to programs stored in the ROM 3030 and RAM 3014, thereby controlling each unit. Graphics controller 3016 retrieves image data generated by CPU 3012 into a frame buffer or the like provided in RAM 3014 or itself, and causes the image data to be displayed on display device 3018 .

通信インターフェース3022は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ3024は、コンピュータ3000内のCPU3012によって使用されるプログラム及びデータを格納する。DVD-ROMドライブ3026は、プログラム又はデータをDVD-ROM3001から読み取り、ハードディスクドライブ3024にRAM3014を介してプログラム又はデータを提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。 Communication interface 3022 communicates with other electronic devices over a network. Hard disk drive 3024 stores programs and data used by CPU 3012 within computer 3000 . DVD-ROM drive 3026 reads programs or data from DVD-ROM 3001 and provides programs or data to hard disk drive 3024 via RAM 3014 . The IC card drive reads programs and data from IC cards and/or writes programs and data to IC cards.

ROM3030はその中に、アクティブ化時にコンピュータ3000によって実行されるブートプログラム等、及び/又はコンピュータ3000のハードウエアに依存するプログラムを格納する。入出力チップ3040はまた、様々な入出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ3020に接続してよい。 ROM 3030 stores therein programs that are dependent on the hardware of computer 3000, such as a boot program that is executed by computer 3000 upon activation. Input/output chip 3040 may also connect various input/output units to input/output controller 3020 via parallel ports, serial ports, keyboard ports, mouse ports, and the like.

プログラムが、DVD-ROM3001又はICカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもあるハードディスクドライブ3024、RAM3014、又はROM3030にインストールされ、CPU3012によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ3000に読み取られ、プログラムと、上記様々なタイプのハードウエアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ3000の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。 A program is provided by a computer-readable storage medium such as a DVD-ROM 3001 or an IC card. The program is read from a computer-readable storage medium, installed in hard disk drive 3024 , RAM 3014 , or ROM 3030 , which are also examples of computer-readable storage media, and executed by CPU 3012 . The information processing described within these programs is read by computer 3000 to provide coordination between the programs and the various types of hardware resources described above. An apparatus or method may be configured by implementing information operations or processing according to the use of computer 3000 .

例えば、通信がコンピュータ3000及び外部デバイス間で実行される場合、CPU3012は、RAM3014にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インターフェース3022に対し、通信処理を命令してよい。通信インターフェース3022は、CPU3012の制御の下、RAM3014、ハードディスクドライブ3024、DVD-ROM3001、又はICカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。 For example, when communication is performed between the computer 3000 and an external device, the CPU 3012 executes a communication program loaded into the RAM 3014 and sends communication processing to the communication interface 3022 based on the processing described in the communication program. you can command. Under the control of the CPU 3012, the communication interface 3022 reads transmission data stored in a transmission buffer area provided in a recording medium such as the RAM 3014, the hard disk drive 3024, the DVD-ROM 3001, or an IC card, and transmits the read transmission data. Data is transmitted to the network, or received data received from the network is written in a receive buffer area or the like provided on the recording medium.

また、CPU3012は、ハードディスクドライブ3024、DVD-ROMドライブ3026(DVD-ROM3001)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM3014に読み取られるようにし、RAM3014上のデータに対し様々なタイプの処理を実行してよい。CPU3012は次に、処理されたデータを外部記録媒体にライトバックしてよい。 In addition, the CPU 3012 causes the RAM 3014 to read all or necessary portions of files or databases stored in external recording media such as the hard disk drive 3024, DVD-ROM drive 3026 (DVD-ROM 3001), IC card, etc. Various types of processing may be performed on the data in RAM 3014 . CPU 3012 may then write back the processed data to an external recording medium.

様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU3012は、RAM3014から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM3014に対しライトバックする。また、CPU3012は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU3012は、当該複数のエントリの中から、第1の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。 Various types of information, such as various types of programs, data, tables, and databases, may be stored on recording media and subjected to information processing. CPU 3012 performs various types of operations on data read from RAM 3014, information processing, conditional decisions, conditional branching, unconditional branching, and information retrieval as specified throughout this disclosure and by instruction sequences of programs. Various types of processing may be performed, including /replace, etc., and the results written back to RAM 3014 . Also, the CPU 3012 may search for information in a file in a recording medium, a database, or the like. For example, when a plurality of entries each having an attribute value of a first attribute associated with an attribute value of a second attribute are stored in the recording medium, the CPU 3012 selects the first attribute from among the plurality of entries. search for an entry that matches the specified condition of the attribute value of the attribute, read the attribute value of the second attribute stored in the entry, and thereby determine the first attribute that satisfies the predetermined condition An attribute value of the associated second attribute may be obtained.

上で説明したプログラム又はソフトウエアモジュールは、コンピュータ3000上又はコンピュータ3000近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それにより、上記のプログラムを、ネットワークを介してコンピュータ3000に提供する。 The programs or software modules described above may be stored in a computer readable storage medium on or near computer 3000 . In addition, a recording medium such as a hard disk or RAM provided in a server system connected to a dedicated communication network or the Internet can be used as a computer-readable storage medium, whereby the above program can be transferred via a network. provided to the computer 3000;

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments. It is obvious to those skilled in the art that various modifications and improvements can be made to the above embodiments. It is clear from the description of the scope of claims that forms with such modifications or improvements can also be included in the technical scope of the present invention.

特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。 The execution order of each process such as actions, procedures, steps, and stages in the devices, systems, programs, and methods shown in the claims, the specification, and the drawings is particularly "before", "before" etc., and it should be noted that it can be implemented in any order unless the output of the previous process is used in the subsequent process. Regarding the operation flow in the claims, the specification, and the drawings, even if the description is made using "first," "next," etc. for convenience, it means that it is essential to carry out in this order. not a thing

10 通信ネットワーク
12 店舗
14 店舗
22 ユーザ
24 ユーザ
100 データ解析システム
102 通信端末
104 通信端末
108 通信端末
122 アクセスポイント
124 アクセスポイント
142 来店確認機器
144 来店確認機器
160 管理サーバ
220 入出力制御部
230 情報収集部
240 解析部
242 格納部
244 入力データ生成部
250 モデル構築部
252 データセット生成部
254 学習部
256 閾値調整部
260 判定部
270 来店人数推定部
322 AP情報格納部
324 店舗情報格納部
326 対応情報格納部
332 ログ情報格納部
334 来店情報格納部
342 入力データ格納部
352 データセット格納部
354 対象データ格納部
362 出力データ格納部
372 モデル情報格納部
422 グループ
424 グループ
552 ラベル付与部
554 データセット出力部
556 対象データ出力部
652 クラス分類器
654 クラス分類器
656 初期設定格納部
752 ROCカーブ算出部
754 AUCスコア算出部
756 作動ポイント決定部
758 調整値決定部
820 ROCカーブ
832 ポイント
834 ポイント
840 直線
900 データテーブル
922 APID
924 情報
926 店舗ID
1000 データテーブル
1022 店舗ID
1024 店舗名称
1026 店舗タイプ
1028 位置情報
1030 情報
1100 データテーブル
1122 端末ID
1124 ユーザID
1200 データテーブル
1222 APID
1224 情報
1226 端末ID
1228 情報
1300 データテーブル
1322 ユーザID
1324 位置情報
1326 情報
1400 データテーブル
1422 端末ID
1424 店舗ID
1426 情報
1428 情報
1500 データテーブル
1532 情報
1600 データテーブル
1632 情報
1634 情報
1700 データテーブル
1732 情報
1734 情報
1800 データテーブル
3000 コンピュータ
3001 DVD-ROM
3010 ホストコントローラ
3012 CPU
3014 RAM
3016 グラフィックコントローラ
3018 ディスプレイデバイス
3020 入出力コントローラ
3022 通信インターフェース
3024 ハードディスクドライブ
3026 DVD-ROMドライブ
3030 ROM
3040 入出力チップ
3042 キーボード
10 communication network 12 store 14 store 22 user 24 user 100 data analysis system 102 communication terminal 104 communication terminal 108 communication terminal 122 access point 124 access point 142 visit confirmation device 144 visit confirmation device 160 management server 220 input/output control unit 230 information collection unit 240 analysis unit 242 storage unit 244 input data generation unit 250 model construction unit 252 data set generation unit 254 learning unit 256 threshold adjustment unit 260 determination unit 270 number of visitors estimation unit 322 AP information storage unit 324 store information storage unit 326 corresponding information storage unit 332 Log information storage unit 334 Store visit information storage unit 342 Input data storage unit 352 Data set storage unit 354 Target data storage unit 362 Output data storage unit 372 Model information storage unit 422 Group 424 Group 552 Labeling unit 554 Data set output unit 556 Target Data output unit 652 Class classifier 654 Class classifier 656 Initial setting storage unit 752 ROC curve calculation unit 754 AUC score calculation unit 756 Operating point determination unit 758 Adjustment value determination unit 820 ROC curve 832 Point 834 Point 840 Straight line 900 Data table 922 APID
924 Information 926 Store ID
1000 Data table 1022 Store ID
1024 Store name 1026 Store type 1028 Location information 1030 Information 1100 Data table 1122 Terminal ID
1124 User ID
1200 data table 1222 APID
1224 Information 1226 Terminal ID
1228 information 1300 data table 1322 user ID
1324 Location information 1326 Information 1400 Data table 1422 Terminal ID
1424 Store ID
1426 information 1428 information 1500 data table 1532 information 1600 data table 1632 information 1634 information 1700 data table 1732 information 1734 information 1800 data table 3000 computer 3001 DVD-ROM
3010 host controller 3012 CPU
3014 RAM
3016 graphic controller 3018 display device 3020 input/output controller 3022 communication interface 3024 hard disk drive 3026 DVD-ROM drive 3030 ROM
3040 input/output chip 3042 keyboard

Claims (15)

予め定められた地理的範囲を有するエリアの内部に配された無線受信装置により受信された無線信号に関する情報を含むデータポイントが入力され、前記無線信号を発信した無線端末のユーザが前記エリアの内部に存在していたか否かを判定するために用いられる学習モデルを生成するモデル生成部と、
前記モデル生成部により生成された前記学習モデルが、前記ユーザが前記エリアの内部に存在していたか否か判定するための基準値を調整する調整部と、
を備え、
前記モデル生成部は、
(a)前記基準値として、前記学習モデルに応じた初期値を利用し、(b)(i)1以上の前記無線受信装置が受信した複数の前記無線信号のそれぞれに関する情報、及び、(ii)前記複数の無線信号のそれぞれを発信した前記無線端末のユーザが、前記複数の無線信号のそれぞれを受信した前記無線受信装置の配された前記エリアの内部に存在していたか否かを示すラベルを含む学習用データセットを利用して機械学習を実行することにより、前記学習モデルを生成し、
前記調整部は、
前記基準値として前記初期値が利用された場合と比較して、前記モデル生成部により生成された前記学習モデルの判定結果の真陽性率が大きくなる第2の値を、調整後の前記基準値として決定する、
機械学習装置。
A data point containing information relating to a radio signal received by a radio receiver located within an area having a predetermined geographic extent is entered such that a user of a radio terminal that originated the radio signal is located within the area. a model generation unit that generates a learning model used to determine whether or not there was a
an adjustment unit that adjusts a reference value for determining whether the learning model generated by the model generation unit determines whether the user exists inside the area;
with
The model generation unit
(a) using an initial value according to the learning model as the reference value, (b) (i) information about each of the plurality of radio signals received by one or more of the radio receiving devices, and ) a label indicating whether or not the user of the wireless terminal that transmitted each of the plurality of wireless signals was present within the area in which the wireless receiving device that received each of the plurality of wireless signals was arranged; Generate the learning model by performing machine learning using a learning data set containing
The adjustment unit
A second value that increases the true positive rate of the determination result of the learning model generated by the model generating unit as compared to the case where the initial value is used as the reference value is the adjusted reference value determine as
Machine learning device.
それぞれにおいて、(i)前記複数の無線信号のそれぞれを発信した前記無線端末を識別するための端末識別情報、(ii)前記複数の無線信号のそれぞれが受信された時刻を示す受信時刻情報、及び、(iii)前記複数の無線信号のそれぞれの電波に関する信号情報が対応付けられた、複数のレコードを取得するレコード取得部と、
それぞれにおいて、(i)特定の行動に関与した1以上の前記ユーザのそれぞれを識別するためのユーザ識別情報、及び、(ii)前記特定の行動がなされた時刻を示す行動時刻情報が対応付けられた、複数の行動履歴情報を取得する行動履歴取得部と、
(i)前記レコード取得部が取得した前記複数のレコードのそれぞれに含まれる前記端末識別情報及び前記受信時刻情報、並びに、(ii)前記行動履歴取得部が取得した前記複数の行動履歴情報のそれぞれに含まれる前記ユーザ識別情報及び前記行動時刻情報に基づいて、前記複数のレコード及び前記複数の行動履歴情報を照合し、前記複数のレコードのうち少なくとも一部のレコードのそれぞれに含まれる前記端末識別情報と、前記少なくとも一部のレコードのそれぞれに含まれる前記信号情報により示される電波に関する情報と、前記ユーザが前記エリアの内部に存在していたことを示す前記ラベルとを対応付けることで、前記学習用データセットを生成するラベル付与部と、
をさらに備える、
請求項1に記載の機械学習装置。
(i) terminal identification information for identifying the wireless terminal that transmitted each of the plurality of wireless signals; (ii) reception time information indicating the time at which each of the plurality of wireless signals was received; , (iii) a record acquisition unit that acquires a plurality of records associated with signal information about radio waves of each of the plurality of radio signals;
Each of them is associated with (i) user identification information for identifying each of the one or more users involved in a specific action, and (ii) action time information indicating the time when the specific action was performed. an action history acquisition unit that acquires a plurality of action history information;
(i) the terminal identification information and the reception time information included in each of the plurality of records acquired by the record acquisition unit; and (ii) each of the plurality of action history information acquired by the action history acquisition unit. The plurality of records and the plurality of action history information are collated based on the user identification information and the action time information included in the terminal identification included in each of at least some of the plurality of records information, information about radio waves indicated by the signal information included in each of the at least some records, and the label indicating that the user was present in the area, thereby performing the learning. a labeling unit that generates a dataset for
further comprising
The machine learning device according to claim 1.
前記複数の行動履歴情報の少なくとも一部に含まれる前記ユーザ識別情報は、当該ユーザ識別情報により識別されるユーザが利用する無線端末の前記端末識別情報である、
請求項2に記載の機械学習装置。
The user identification information included in at least part of the plurality of action history information is the terminal identification information of a wireless terminal used by the user identified by the user identification information.
The machine learning device according to claim 2.
1以上の前記ユーザ識別情報のそれぞれと、当該ユーザ識別情報により識別されるユーザが利用する無線端末の前記端末識別情報との対応関係を示す対応関係情報を取得する対応関係取得部をさらに備え、
前記ラベル付与部は、
前記対応関係取得部が取得した前記対応関係情報を参照して、(i)前記レコード取得部が取得した前記複数のレコードのそれぞれに含まれる前記端末識別情報及び前記受信時刻情報、並びに、(ii)前記行動履歴取得部が取得した前記複数の行動履歴情報のそれぞれに含まれる前記ユーザ識別情報及び前記行動時刻情報に基づいて、前記複数のレコード及び前記複数の行動履歴情報を照合し、前記学習用データセットを生成する、
請求項2に記載の機械学習装置。
further comprising a correspondence acquisition unit that acquires correspondence relationship information indicating a correspondence relationship between each of the one or more pieces of user identification information and the terminal identification information of a wireless terminal used by a user identified by the user identification information,
The labeling unit is
With reference to the correspondence information acquired by the correspondence acquisition unit, (i) the terminal identification information and the reception time information included in each of the plurality of records acquired by the record acquisition unit, and (ii) ) based on the user identification information and the action time information included in each of the plurality of action history information acquired by the action history acquiring unit, the plurality of records and the plurality of action history information are collated, and the learning generate a dataset for
The machine learning device according to claim 2.
それぞれにおいて、(i)前記複数の無線信号のそれぞれを発信した前記無線端末を識別するための端末識別情報、(ii)前記複数の無線信号のそれぞれが受信された時刻を示す受信時刻情報、(iii)前記複数の無線信号のそれぞれが受信された位置を示す受信位置情報、及び、(iv)前記複数の無線信号のそれぞれの電波に関する信号情報が対応付けられた、複数のレコードを取得するレコード取得部と、
それぞれにおいて、(i)1以上の前記エリアのそれぞれを識別するためのエリア識別情報、(ii)前記エリア識別情報により識別されるエリアへの進入が制限されている時間帯を示す、1以上の進入制限情報を取得する制限情報取得部と、
(i)前記レコード取得部が取得した前記複数のレコードのそれぞれに含まれる前記受信位置情報、及び、(ii)前記制限情報取得部が取得した前記1以上の進入制限情報のそれぞれに含まれる前記エリア識別情報に基づいて、前記複数のレコード及び前記1以上の進入制限情報を照合し、前記複数のレコードのうち少なくとも一部のレコードのそれぞれに含まれる前記端末識別情報と、前記少なくとも一部のレコードのそれぞれに含まれる前記信号情報により示される電波に関する情報と、前記ユーザが前記エリアの内部に存在していなかったことを示す前記ラベルとを対応付けることで、前記学習用データセットを生成するラベル付与部と、
をさらに備える、
請求項1に記載の機械学習装置。
In each, (i) terminal identification information for identifying the wireless terminal that transmitted each of the plurality of wireless signals, (ii) reception time information indicating the time each of the plurality of wireless signals was received, ( iii) receiving position information indicating the position at which each of the plurality of radio signals was received; and (iv) a record for acquiring a plurality of records associated with signal information regarding radio waves of each of the plurality of radio signals. an acquisition unit;
(i) area identification information for identifying each of the one or more areas; a restriction information acquisition unit that acquires access restriction information;
(i) the reception position information included in each of the plurality of records acquired by the record acquisition unit; and (ii) the information included in each of the one or more entry restriction information acquired by the restriction information acquisition unit. Based on the area identification information, the plurality of records and the one or more pieces of entry restriction information are collated, and the terminal identification information included in each of at least a portion of the plurality of records and the at least a portion of the A label for generating the learning data set by associating information on radio waves indicated by the signal information included in each record with the label indicating that the user was not inside the area. a granting unit;
further comprising
The machine learning device according to claim 1.
前記レコード取得部が取得した前記複数のレコードを、前記複数のレコードのそれぞれに含まれる前記端末識別情報及び前記受信時刻情報に基づいて、前記端末識別情報ごと、且つ、予め定められた条件を満足する期間ごとに集約する集約部をさらに備え、
前記集約部は、
それぞれにおいて、(i)前記複数の無線信号のそれぞれを発信した前記無線端末を識別するための端末識別情報、(ii)前記集約部による集約処理の対象となった期間を示す集約期間情報、(iii)前記複数の無線信号のうち、前記端末識別情報により識別される無線端末が、前記集約期間情報により示される期間の間に発信した1以上の無線信号に関する1以上の特徴量を示す特徴情報が対応付けられた、1以上の集約レコードを生成する、
請求項2から請求項5までの何れか一項に記載の機械学習装置。
The plurality of records acquired by the record acquisition unit is based on the terminal identification information and the reception time information included in each of the plurality of records, and each of the terminal identification information satisfies a predetermined condition. further comprising an aggregating unit that aggregates for each period,
The aggregating unit is
In each, (i) terminal identification information for identifying the wireless terminal that transmitted each of the plurality of wireless signals, (ii) aggregation period information indicating a period subject to aggregation processing by the aggregation unit, ( iii) feature information indicating one or more feature amounts relating to one or more radio signals transmitted during the period indicated by the aggregation period information by the radio terminal identified by the terminal identification information among the plurality of radio signals; generate one or more aggregated records associated with
The machine learning device according to any one of claims 2 to 5.
前記ラベル付与部は、前記1以上の集約レコードの少なくとも一部に前記ラベルを付与することで、前記学習用データセットを生成する、
請求項6に記載の機械学習装置。
The labeling unit generates the learning data set by giving the label to at least part of the one or more aggregated records.
The machine learning device according to claim 6.
前記学習モデルは、当該学習モデルに入力されたデータポイントごとに、当該学習モデルの予測又は判定に対する不確実性を推定するために利用される関数の値を算出し、
算出された前記関数の値と、前記基準値とに基づいて、前記ユーザが前記エリアの内部に存在していたか否かを判定する、
請求項1から請求項7までの何れか一項に記載の機械学習装置。
The learning model calculates, for each data point input to the learning model, the value of a function used to estimate the uncertainty of the prediction or decision of the learning model;
Determining whether the user exists within the area based on the calculated value of the function and the reference value;
The machine learning device according to any one of claims 1 to 7.
前記調整部は、
前記モデル生成部により生成された前記学習モデルの受信者動作特性カーブ(ROCカーブ)を示すデータを算出し、
前記ROCカーブ上のポイントであって、前記基準値として前記初期値が利用された場合と比較して、前記モデル生成部により生成された前記学習モデルの判定結果の真陽性率が大きくなるポイントに対応する基準値を、前記第2の値として決定する、
請求項1から請求項8までの何れか一項に記載の機械学習装置。
The adjustment unit
calculating data indicating a receiver operating characteristic curve (ROC curve) of the learning model generated by the model generating unit;
A point on the ROC curve at which the true positive rate of the determination result of the learning model generated by the model generation unit is greater than when the initial value is used as the reference value determining a corresponding reference value as the second value;
The machine learning device according to any one of claims 1 to 8.
前記モデル生成部は、前記無線受信装置ごと、又は、前記エリアごとに、前記学習モデルを生成する、
請求項1から請求項9までの何れか一項に記載の機械学習装置。
The model generation unit generates the learning model for each wireless receiving device or each area.
The machine learning device according to any one of claims 1 to 9.
無線受信装置は、無線通信を中継する中継装置である、
請求項1から請求項10までの何れか一項に記載の機械学習装置。
The wireless receiving device is a relay device that relays wireless communication,
The machine learning device according to any one of claims 1 to 10.
請求項1から請求項11までの何れか一項に記載の機械学習装置と、
前記1以上の無線受信装置の少なくとも1つにより受信された前記複数の無線信号のそれぞれに関する情報を含む判定対象データを取得する判定対象取得部と、
(i)前記判定対象取得部が取得した前記判定対象データを、前記モデル生成部が生成した前記学習モデルに入力し、(ii)前記基準値として、前記調整部が決定した前記第2の値を利用して、前記判定対象データに関する無線信号を発信した1以上の無線端末のそれぞれのユーザが、前記判定対象データに関する無線信号を受信した無線受信装置の配された前記エリアの内部に存在していたか否かを示す判定する判定部と、
を備える、情報処理装置。
a machine learning device according to any one of claims 1 to 11;
a determination target acquiring unit that acquires determination target data including information about each of the plurality of radio signals received by at least one of the one or more wireless receiving devices;
(i) inputting the determination target data acquired by the determination target acquisition unit into the learning model generated by the model generation unit; and (ii) using the second value determined by the adjustment unit as the reference value. , the users of the one or more wireless terminals that have transmitted the radio signal related to the determination target data exist within the area in which the wireless receiving device that received the wireless signal related to the determination target data is arranged a determination unit that determines whether or not
An information processing device.
コンピュータを、請求項1から請求項11までの何れか一項に記載の機械学習装置として機能させるための、プログラム。 A program for causing a computer to function as the machine learning device according to any one of claims 1 to 11. コンピュータを、請求項12に記載の情報処理装置として機能させるための、プログラム。 A program for causing a computer to function as the information processing apparatus according to claim 12. 予め定められた地理的範囲を有するエリアの内部に配された無線受信装置により受信された無線信号に関する情報を含むデータポイントが入力され、前記無線信号を発信した無線端末のユーザが前記エリアの内部に存在していたか否かを判定するために用いられる学習モデルを生成するモデル生成段階と、
前記モデル生成段階において生成された前記学習モデルが、前記ユーザが前記エリアの内部に存在していたか否か判定するための基準値を調整する調整段階と、
を有し、
前記モデル生成段階は、
(a)前記基準値として、前記学習モデルに応じた初期値を利用し、(b)(i)1以上の前記無線受信装置が受信した複数の前記無線信号のそれぞれに関する情報、及び、(ii)前記複数の無線信号のそれぞれを発信した前記無線端末のユーザが、前記複数の無線信号のそれぞれを受信した前記無線受信装置の配された前記エリアの内部に存在していたか否かを示すラベルを含む学習用データセットを利用して機械学習を実行することにより、前記学習モデルを生成する段階を含み、
前記調整段階は、
前記基準値として前記初期値が利用された場合と比較して、前記モデル生成段階において生成された前記学習モデルの判定結果の真陽性率が大きくなる第2の値を、調整後の前記基準値として決定する段階を含む、
機械学習方法。
A data point containing information relating to a radio signal received by a radio receiver located within an area having a predetermined geographic extent is entered such that a user of a radio terminal that originated the radio signal is located within the area. a model generation stage that generates a learning model that is used to determine whether the
an adjustment step of adjusting a reference value for determining whether or not the user was present in the area in the learning model generated in the model generation step;
has
The model generation step includes:
(a) using an initial value according to the learning model as the reference value, (b) (i) information about each of the plurality of radio signals received by one or more of the radio receiving devices, and ) a label indicating whether or not the user of the wireless terminal that transmitted each of the plurality of wireless signals was present within the area in which the wireless receiving device that received each of the plurality of wireless signals was arranged; generating the learning model by performing machine learning using a training data set comprising
The adjustment step includes:
A second value that increases the true positive rate of the determination result of the learning model generated in the model generation stage compared to the case where the initial value is used as the reference value is the adjusted reference value including determining as
machine learning method.
JP2018209127A 2018-11-06 2018-11-06 Machine learning device, judgment device, program and machine learning method Active JP7105176B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018209127A JP7105176B2 (en) 2018-11-06 2018-11-06 Machine learning device, judgment device, program and machine learning method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018209127A JP7105176B2 (en) 2018-11-06 2018-11-06 Machine learning device, judgment device, program and machine learning method

Publications (2)

Publication Number Publication Date
JP2020077118A JP2020077118A (en) 2020-05-21
JP7105176B2 true JP7105176B2 (en) 2022-07-22

Family

ID=70724060

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018209127A Active JP7105176B2 (en) 2018-11-06 2018-11-06 Machine learning device, judgment device, program and machine learning method

Country Status (1)

Country Link
JP (1) JP7105176B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240242273A1 (en) * 2021-07-02 2024-07-18 Nec Corporation Model generation device, financial institution server, information processing system, model generation method, and storage medium
JP7542780B2 (en) 2022-08-31 2024-08-30 三菱電機株式会社 Information processing device, output method, and output program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015040749A (en) 2013-08-21 2015-03-02 日本電信電話株式会社 Position estimation device and position estimation program
US20160139239A1 (en) 2012-06-01 2016-05-19 Amazon Technologies, Inc. Determining device locations using movement, signal strength
JP2018055638A (en) 2016-09-30 2018-04-05 株式会社Nttドコモ Determination device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3165391B2 (en) * 1996-03-22 2001-05-14 松下電器産業株式会社 Mobile radio communication system and method for detecting position of mobile station

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160139239A1 (en) 2012-06-01 2016-05-19 Amazon Technologies, Inc. Determining device locations using movement, signal strength
JP2015040749A (en) 2013-08-21 2015-03-02 日本電信電話株式会社 Position estimation device and position estimation program
JP2018055638A (en) 2016-09-30 2018-04-05 株式会社Nttドコモ Determination device

Also Published As

Publication number Publication date
JP2020077118A (en) 2020-05-21

Similar Documents

Publication Publication Date Title
JP7170160B2 (en) Systems and methods for providing targeted advertisements to charging stations for electric vehicles
US11625755B1 (en) Determining targeting information based on a predictive targeting model
EP3320512B1 (en) Mobile attribute time-series profiling analytics
US8996033B1 (en) Systems and methods for statistically associating mobile devices to households
JP5802716B2 (en) Information processing system, program, and verification method
US11810147B2 (en) Automated attribution modeling and measurement
KR102324439B1 (en) System, server and method for providing intelligent medium and micro enterprise owners support service
US20150248436A1 (en) Methods, Circuits, Devices, Systems and Associated Computer Executable Code for Assessing a Presence Likelihood of a Subject at One or More Venues
Bi et al. How built environment impacts online car-hailing ridership
CN103177129A (en) Internet real-time information recommendation and prediction system
US20140129334A1 (en) Method and system for modeling consumer activity areas based on social media and mobile data
KR20190116830A (en) Method for providing commercial cost calculating service based on bigdata of commercial viewer and number of viewer object
Rahaman et al. Wait time prediction for airport taxis using weighted nearest neighbor regression
KR20180128147A (en) Method and Apparatus for Recommending Restaurant Based on Mobile Context Information
JP7105176B2 (en) Machine learning device, judgment device, program and machine learning method
CN105956694A (en) Heterogeneous data source integrated modeling and optimizing method for interior space value of commercial real estate
CN107220856B (en) System and method for identifying mobile consumption group
JP6742360B2 (en) Information generating device, program, and information generating method
Zhang et al. An automatic approach for transit advertising in public transportation systems
JP6693993B2 (en) Information generating device, program, and information generating method
CN111861139A (en) Merchant recommendation method and device and computer equipment
JP6616860B2 (en) Information generating apparatus, program, and information generating method
RU2658876C1 (en) Wireless device sensor data processing method and server for the object vector creating connected with the physical position
JP5919358B1 (en) Information processing system and program
Kim et al. Agatha: Predicting daily activities from place visit history for activity-aware mobile services in smart cities

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220614

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220711

R150 Certificate of patent or registration of utility model

Ref document number: 7105176

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150