JP7105176B2 - Machine learning device, judgment device, program and machine learning method - Google Patents
Machine learning device, judgment device, program and machine learning method Download PDFInfo
- Publication number
- JP7105176B2 JP7105176B2 JP2018209127A JP2018209127A JP7105176B2 JP 7105176 B2 JP7105176 B2 JP 7105176B2 JP 2018209127 A JP2018209127 A JP 2018209127A JP 2018209127 A JP2018209127 A JP 2018209127A JP 7105176 B2 JP7105176 B2 JP 7105176B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- store
- unit
- data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title claims description 73
- 238000004891 communication Methods 0.000 claims description 242
- 230000009471 action Effects 0.000 claims description 63
- 238000012545 processing Methods 0.000 claims description 44
- 230000006870 function Effects 0.000 claims description 31
- 230000010365 information processing Effects 0.000 claims description 26
- 230000002776 aggregation Effects 0.000 claims description 21
- 238000004220 aggregation Methods 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 17
- 238000002372 labelling Methods 0.000 claims description 11
- 230000004931 aggregating effect Effects 0.000 claims description 7
- 238000012790 confirmation Methods 0.000 description 164
- 238000007726 management method Methods 0.000 description 83
- 238000000034 method Methods 0.000 description 54
- 230000008569 process Effects 0.000 description 31
- 238000007405 data analysis Methods 0.000 description 28
- 238000013500 data storage Methods 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 16
- 238000012795 verification Methods 0.000 description 15
- 230000006399 behavior Effects 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 7
- 239000000523 sample Substances 0.000 description 6
- 238000010276 construction Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000010295 mobile communication Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 229920001690 polydopamine Polymers 0.000 description 2
- 238000000060 site-specific infrared dichroism spectroscopy Methods 0.000 description 2
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 1
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 1
- AFCARXCZXQIEQB-UHFFFAOYSA-N N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(CCNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 AFCARXCZXQIEQB-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、機械学習装置、判定装置、プログラム及び機械学習方法に関する。 The present invention relates to a machine learning device, a determination device, a program, and a machine learning method.
無線LANアクセスポイントで受信された無線信号に関するログを分析して、無線通信端末のユーザの来店を検出する技術が知られている(例えば、特許文献1~3参照)。
[先行技術文献]
[特許文献]
[特許文献1]特許第5859161号
[特許文献2]特許第5802716号
[特許文献3]特許第6169124号
Techniques for detecting the visit of a user of a wireless communication terminal by analyzing a log relating to wireless signals received by a wireless LAN access point are known (see Patent Documents 1 to 3, for example).
[Prior art documents]
[Patent Literature]
[Patent Document 1] Patent No. 5859161 [Patent Document 2] Patent No. 5802716 [Patent Document 3] Patent No. 6169124
従来技術によれば、無線信号の電波強度などを利用して、当該無線信号を発信した通信端末のユーザが来店したか否かを判定している。上記の判定手法によっても比較的精度よく来店を検出することはできるが、近年、来店検出精度のさらなる向上が求められるようになってきた。 According to the conventional technology, it is determined whether or not the user of the communication terminal that transmitted the wireless signal has visited the store by using the radio wave intensity of the wireless signal. Although it is possible to detect store visits with relatively high accuracy using the determination method described above, in recent years, there has been a demand for further improvement in store visit detection accuracy.
本発明の第1の態様においては、機械学習装置が提供される。上記の機械学習装置は、例えば、予め定められた地理的範囲を有するエリアの内部に配された無線受信装置により受信された無線信号に関する情報を含むデータポイントが入力され、無線信号を発信した無線端末のユーザがエリアの内部に存在していたか否かを判定するために用いられる学習モデルを生成するモデル生成部を備える。上記の機械学習装置は、例えば、モデル生成部により生成された学習モデルが、ユーザがエリアの内部に存在していたか否か判定するための基準値を調整する調整部を備える。上記の機械学習装置において、例えば、モデル生成部は、(a)基準値として、学習モデルに応じた初期値を利用し、(b)(i)1以上の無線受信装置が受信した複数の無線信号のそれぞれに関する情報、及び、(ii)複数の無線信号のそれぞれを発信した無線端末のユーザが、複数の無線信号のそれぞれを受信した無線受信装置の配されたエリアの内部に存在していたか否かを示すラベルを含む学習用データセットを利用して機械学習を実行することにより、学習モデルを生成する。上記の機械学習装置において、例えば、調整部は、基準値として初期値が利用された場合と比較して、モデル生成部により生成された学習モデルの判定結果の真陽性率が大きくなる第2の値を、調整後の基準値として決定する。 In a first aspect of the invention, a machine learning device is provided. The machine learning device receives, for example, a data point containing information about a radio signal received by a radio receiver disposed within an area having a predetermined geographical range, and the radio that emitted the radio signal. A model generation unit is provided for generating a learning model used to determine whether the user of the terminal was within the area. The machine learning device described above includes, for example, an adjustment unit that adjusts a reference value for determining whether or not the user exists inside the area in the learning model generated by the model generation unit. In the above machine learning device, for example, the model generation unit (a) uses an initial value according to the learning model as the reference value, and (b) (i) a plurality of radio signals received by one or more radio receiving devices. and (ii) whether the user of the wireless terminal that emitted each of the plurality of wireless signals was within the area in which the wireless receiving device that received each of the plurality of wireless signals was arranged. A learning model is generated by executing machine learning using a learning data set containing a label indicating whether or not. In the above-described machine learning device, for example, the adjustment unit increases the true positive rate of the determination result of the learning model generated by the model generation unit compared to the case where the initial value is used as the reference value. value is determined as the adjusted reference value.
上記の機械学習装置は、それぞれにおいて、(i)複数の無線信号のそれぞれを発信した無線端末を識別するための端末識別情報、(ii)複数の無線信号のそれぞれが受信された時刻を示す受信時刻情報、及び、(iii)複数の無線信号のそれぞれの電波に関する信号情報が対応付けられた、複数のレコードを取得するレコード取得部を備えてよい。上記の機械学習装置は、それぞれにおいて、(i)特定の行動に関与した1以上のユーザのそれぞれを識別するためのユーザ識別情報、及び、(ii)特定の行動がなされた時刻を示す行動時刻情報が対応付けられた、複数の行動履歴情報を取得する行動履歴取得部を備えてよい。上記の機械学習装置は、(i)レコード取得部が取得した複数のレコードのそれぞれに含まれる端末識別情報及び受信時刻情報、並びに、(ii)行動履歴取得部が取得した複数の行動履歴情報のそれぞれに含まれるユーザ識別情報及び行動時刻情報に基づいて、複数のレコード及び複数の行動履歴情報を照合し、複数のレコードのうち少なくとも一部のレコードのそれぞれに含まれる端末識別情報と、少なくとも一部のレコードのそれぞれに含まれる信号情報により示される電波に関する情報と、ユーザがエリアの内部に存在していたことを示すラベルとを対応付けることで、学習用データセットを生成するラベル付与部を備えてよい。上記の機械学習装置において、複数の行動履歴情報の少なくとも一部に含まれるユーザ識別情報は、当該ユーザ識別情報により識別されるユーザが利用する無線端末の端末識別情報であってよい。 In each of the above machine learning devices, (i) terminal identification information for identifying the wireless terminal that transmitted each of the plurality of wireless signals, (ii) reception indicating the time at which each of the plurality of wireless signals was received A record acquisition unit that acquires a plurality of records associated with time information and (iii) signal information about radio waves of each of the plurality of radio signals may be provided. Each of the above machine learning devices includes (i) user identification information for identifying each of the one or more users involved in a specific action, and (ii) action time indicating the time at which the specific action was performed. An action history acquisition unit that acquires a plurality of pieces of action history information associated with information may be provided. The above machine learning device includes (i) terminal identification information and reception time information included in each of the plurality of records acquired by the record acquisition unit, and (ii) a plurality of action history information acquired by the action history acquisition unit. A plurality of records and a plurality of action history information are collated based on the user identification information and the action time information included in each, and terminal identification information included in each of at least some of the plurality of records and at least one a labeling unit that generates a learning data set by associating information about radio waves indicated by signal information included in each of the records of the area with a label indicating that the user was present inside the area; you can In the machine learning device described above, the user identification information included in at least part of the plurality of action history information may be terminal identification information of a wireless terminal used by the user identified by the user identification information.
上記の機械学習装置は、1以上のユーザ識別情報のそれぞれと、当該ユーザ識別情報により識別されるユーザが利用する無線端末の端末識別情報との対応関係を示す対応関係情報を取得する対応関係取得部を備えてよい。上記の機械学習装置において、ラベル付与部は、対応関係取得部が取得した対応関係情報を参照して、(i)レコード取得部が取得した複数のレコードのそれぞれに含まれる端末識別情報及び受信時刻情報、並びに、(ii)行動履歴取得部が取得した複数の行動履歴情報のそれぞれに含まれるユーザ識別情報及び行動時刻情報に基づいて、複数のレコード及び複数の行動履歴情報を照合し、学習用データセットを生成してよい。 The machine learning device obtains correspondence information indicating a correspondence relationship between each of the one or more pieces of user identification information and terminal identification information of a wireless terminal used by a user identified by the user identification information. You may have a department. In the machine learning device described above, the labeling unit refers to the correspondence information acquired by the correspondence acquisition unit, and performs (i) terminal identification information and reception time included in each of the plurality of records acquired by the record acquisition unit. and (ii) the user identification information and the action time information included in each of the plurality of action history information acquired by the action history acquisition unit. You may generate a dataset.
上記の機械学習装置は、それぞれにおいて、(i)複数の無線信号のそれぞれを発信した無線端末を識別するための端末識別情報、(ii)複数の無線信号のそれぞれが受信された時刻を示す受信時刻情報、(iii)複数の無線信号のそれぞれが受信された位置を示す受信位置情報、及び、(iv)複数の無線信号のそれぞれの電波に関する信号情報が対応付けられた、複数のレコードを取得するレコード取得部を備えてよい。上記の機械学習装置は、それぞれにおいて、(i)1以上のエリアのそれぞれを識別するためのエリア識別情報、(ii)エリア識別情報により識別されるエリアへの進入が制限されている時間帯を示す、1以上の進入制限情報を取得する制限情報取得部を備えてよい。上記の機械学習装置は、(i)レコード取得部が取得した複数のレコードのそれぞれに含まれる受信位置情報、及び、(ii)制限情報取得部が取得した1以上の進入制限情報のそれぞれに含まれるエリア識別情報に基づいて、複数のレコード及び1以上の進入制限情報を照合し、複数のレコードのうち少なくとも一部のレコードのそれぞれに含まれる端末識別情報と、少なくとも一部のレコードのそれぞれに含まれる信号情報により示される電波に関する情報と、ユーザがエリアの内部に存在していなかったことを示すラベルとを対応付けることで、学習用データセットを生成するラベル付与部を備えてよい。 Each of the above machine learning devices includes (i) terminal identification information for identifying the wireless terminal that transmitted each of the plurality of wireless signals, (ii) reception indicating the time at which each of the plurality of wireless signals was received Acquiring a plurality of records associated with time information, (iii) reception position information indicating the position at which each of the plurality of wireless signals was received, and (iv) signal information regarding radio waves of each of the plurality of wireless signals. A record acquisition unit may be provided. In each of the above machine learning devices, (i) area identification information for identifying each of the one or more areas, (ii) time period during which entry to the area identified by the area identification information is restricted a restriction information acquisition unit that acquires one or more pieces of entry restriction information shown in FIG. The above machine learning device includes (i) receiving position information included in each of the plurality of records acquired by the record acquisition unit, and (ii) included in each of the one or more entry restriction information acquired by the restriction information acquisition unit. A plurality of records and one or more entry restriction information are collated based on the area identification information stored, and the terminal identification information contained in each of at least some of the plurality of records and each of at least some of the records A labeling unit may be provided that generates a learning data set by associating information about radio waves indicated by the included signal information with a label indicating that the user was not inside the area.
上記の機械学習装置は、レコード取得部が取得した複数のレコードを、複数のレコードのそれぞれに含まれる端末識別情報及び受信時刻情報に基づいて、端末識別情報ごと、且つ、予め定められた条件を満足する期間ごとに集約する集約部を備えてよい。上記の機械学習装置において、集約部は、それぞれにおいて、(i)複数の無線信号のそれぞれを発信した無線端末を識別するための端末識別情報、(ii)集約部による集約処理の対象となった期間を示す集約期間情報、(iii)複数の無線信号のうち、端末識別情報により識別される無線端末が、集約期間情報により示される期間の間に発信した1以上の無線信号に関する1以上の特徴量を示す特徴情報が対応付けられた、1以上の集約レコードを生成してよい。上記の機械学習装置において、ラベル付与部は、1以上の集約レコードの少なくとも一部にラベルを付与することで、学習用データセットを生成してよい。 The above-described machine learning device obtains a plurality of records acquired by the record acquisition unit, based on the terminal identification information and the reception time information included in each of the plurality of records, for each terminal identification information and a predetermined condition. An aggregator may be provided for aggregating for each satisfying period. In the machine learning device described above, each aggregating unit includes (i) terminal identification information for identifying a wireless terminal that has transmitted each of the plurality of wireless signals, and (ii) the target of aggregation processing by the aggregating unit. Aggregation period information indicating a period, (iii) One or more features related to one or more radio signals transmitted during the period indicated by the aggregation period information by a radio terminal identified by the terminal identification information among the plurality of radio signals One or more aggregated records may be generated to which feature information indicating quantity is associated. In the machine learning device described above, the labeling unit may generate the learning data set by labeling at least part of the one or more consolidated records.
上記の機械学習装置において、学習モデルは、当該学習モデルに入力されたデータポイントごとに、当該学習モデルの予測又は判定に対する不確実性を推定するために利用される関数の値を算出してよい。上記の機械学習装置において、学習モデルは、算出された関数の値と、基準値とに基づいて、ユーザがエリアの内部に存在していたか否かを判定してよい。 In the above machine learning device, the learning model may calculate the value of a function used for estimating the uncertainty of prediction or judgment of the learning model for each data point input to the learning model. . In the machine learning device described above, the learning model may determine whether or not the user is present inside the area based on the calculated function value and the reference value.
上記の機械学習装置において、調整部は、モデル生成部により生成された学習モデルの受信者動作特性カーブ(ROCカーブ)を示すデータを算出してよい。上記の機械学習装置において、調整部は、ROCカーブ上のポイントであって、基準値として初期値が利用された場合と比較して、モデル生成部により生成された学習モデルの判定結果の真陽性率が大きくなるポイントに対応する基準値を、第2の値として決定してよい。 In the machine learning device described above, the adjustment unit may calculate data representing a receiver operating characteristic curve (ROC curve) of the learning model generated by the model generation unit. In the machine learning device described above, the adjustment unit compares a point on the ROC curve and an initial value as a reference value to a true positive determination result of the learning model generated by the model generation unit. A reference value corresponding to the point at which the rate increases may be determined as the second value.
上記の機械学習装置において、モデル生成部は、無線受信装置ごと、又は、エリアごとに、学習モデルを生成してよい。上記の機械学習装置において、無線受信装置は、無線通信を中継する中継装置であってよい。 In the machine learning device described above, the model generator may generate a learning model for each wireless receiving device or for each area. In the machine learning device described above, the wireless receiving device may be a relay device that relays wireless communication.
本発明の第2の態様においては、判定装置が提供される。上記の判定装置は、例えば、上記の機械学習装置を備える。上記の判定装置は、例えば、1以上の無線受信装置の少なくとも1つにより受信された複数の無線信号のそれぞれに関する情報を含む判定対象データを取得する判定対象取得部を備える。上記の判定装置は、例えば、(i)判定対象取得部が取得した判定対象データを、モデル生成部が生成した学習モデルに入力し、(ii)基準値として、調整部が決定した第2の値を利用して、判定対象データに関する無線信号を発信した1以上の無線端末のそれぞれのユーザが、判定対象データに関する無線信号を受信した無線受信装置の配されたエリアの内部に存在していたか否かを示す判定する判定部を備える。 In a second aspect of the invention, a determination device is provided. The determination device described above includes, for example, the machine learning device described above. The determination device described above includes, for example, a determination target acquisition unit that acquires determination target data including information about each of the plurality of radio signals received by at least one of the one or more radio reception devices. For example, the determination device (i) inputs the determination target data acquired by the determination target acquisition unit into the learning model generated by the model generation unit, and (ii) uses the second value determined by the adjustment unit as the reference value. Using the value, whether each user of one or more wireless terminals that transmitted wireless signals related to the determination target data existed within an area in which the wireless receiving device that received the wireless signals related to the determination target data was arranged A judgment unit for judging whether or not is provided.
本発明の第3の態様においては、機械学習方法が提供される。上記の機械学習方法は、例えば、予め定められた地理的範囲を有するエリアの内部に配された無線受信装置により受信された無線信号に関する情報を含むデータポイントが入力され、無線信号を発信した無線端末のユーザがエリアの内部に存在していたか否かを判定するために用いられる学習モデルを生成するモデル生成段階を有する。上記の機械学習方法は、例えば、モデル生成段階において生成された学習モデルが、ユーザがエリアの内部に存在していたか否か判定するための基準値を調整する調整段階を有する。上記の機械学習方法において、例えば、モデル生成段階は、(a)基準値として、学習モデルに応じた初期値を利用し、(b)(i)1以上の無線受信装置が受信した複数の無線信号のそれぞれに関する情報、及び、(ii)複数の無線信号のそれぞれを発信した無線端末のユーザが、複数の無線信号のそれぞれを受信した無線受信装置の配されたエリアの内部に存在していたか否かを示すラベルを含む学習用データセットを利用して機械学習を実行することにより、学習モデルを生成する段階を含む。上記の機械学習方法において、例えば、調整段階は、基準値として初期値が利用された場合と比較して、モデル生成段階において生成された学習モデルの判定結果の真陽性率が大きくなる第2の値を、調整後の基準値として決定する段階を含む。 In a third aspect of the invention, a machine learning method is provided. The above machine learning method, for example, is input with data points containing information about radio signals received by radio receivers located within an area having a predetermined geographic range, and the radio that originated the radio signal. There is a model generation stage for generating a learning model that is used to determine if the user of the terminal was within the area. The above machine learning method, for example, has an adjustment stage in which the learning model generated in the model generation stage adjusts the reference value for determining whether or not the user was inside the area. In the above machine learning method, for example, the model generation step includes (a) using an initial value according to the learning model as a reference value, and (b) (i) a plurality of radio signals received by one or more radio receiving devices. and (ii) whether the user of the wireless terminal that emitted each of the plurality of wireless signals was within the area in which the wireless receiving device that received each of the plurality of wireless signals was arranged. generating a learning model by performing machine learning using a training data set that includes a label indicating whether or not; In the above-described machine learning method, for example, the adjustment stage increases the true positive rate of the judgment result of the learning model generated in the model generation stage compared to the case where the initial value is used as the reference value. determining the value as the adjusted reference value.
本発明の第4の態様においては、プログラムが提供される。上記のプログラムを格納する非一時的コンピュータ可読媒体が提供されてもよい。上記のプログラムは、例えば、コンピュータを、上記の第1の態様に係る機械学習装置として機能させるためのプログラムである。上記のプログラムは、例えば、コンピュータを、上記の第2の態様に係る判定装置として機能させるためのプログラムである。上記のプログラムは、コンピュータに、上記の第3の態様に係る機械学習方法を実行させるためのプログラムであってもよい。 In a fourth aspect of the invention, a program is provided. A non-transitory computer-readable medium storing the above program may be provided. The program is, for example, a program for causing a computer to function as the machine learning device according to the first aspect. The program is, for example, a program for causing a computer to function as the determination device according to the second aspect. The program may be a program for causing a computer to execute the machine learning method according to the third aspect.
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。 It should be noted that the above summary of the invention does not list all the necessary features of the invention. Subcombinations of these feature groups can also be inventions.
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。なお、図面において、同一または類似の部分には同一の参照番号を付して、重複する説明を省く場合がある。 Hereinafter, the present invention will be described through embodiments of the invention, but the following embodiments do not limit the invention according to the claims. Also, not all combinations of features described in the embodiments are essential for the solution of the invention. In addition, in the drawings, the same or similar parts may be denoted by the same reference numerals to omit redundant description.
各実施形態において、各ユーザは、個人情報を利用したサービスを享受することに同意していることが好ましい。 In each embodiment, each user preferably agrees to receive services using personal information.
[データ解析システム100の概要]
図1は、データ解析システム100のシステム構成の一例を概略的に示す。本実施形態において、データ解析システム100は、管理サーバ160を備える。本実施形態においては、データ解析システム100の理解を容易にすることを目的として、管理サーバ160が、通信端末108からの要求に応じて、店舗12又は店舗14に来店した顧客の人数(来店人数と称される場合がある。)を推定し、上記の要求に対する応答として、上記の推定結果を示す情報を送信する場合を例として、データ解析システム100の詳細が説明される。
[Overview of data analysis system 100]
FIG. 1 schematically shows an example of a system configuration of a
本実施形態において、店舗12は、予め定められた地理的範囲を有する。店舗12の内部には、アクセスポイント122と、来店確認機器142とが配される。本実施形態において、店舗14は、予め定められた地理的範囲を有する。店舗14の内部には、アクセスポイント124と、来店確認機器144とが配される。アクセスポイント122、アクセスポイント124、来店確認機器142及び来店確認機器144の少なくとも1つは、データ解析システム100の一部を構成してもよい。
In this embodiment, store 12 has a predetermined geographical range. Inside the store 12, an
図1において、無線通信機能を有する通信端末102のユーザ22が、店舗12の内部に存在する。本実施形態において、通信端末102は、無線信号を利用して、アクセスポイント122との間で情報を送受する。例えば、通信端末102は無線信号を発信し、アクセスポイント122は当該無線信号を受信する。また、本実施形態において、ユーザ22は、来店確認機器142により提供される各種のサービスを利用する。このとき、来店確認機器142は、上記のサービスの提供者又は運営者によりユーザ22に割り当てられた識別情報、通信端末102の識別情報などを取得する。これにより、ユーザ22の来店が、来店確認機器142により検出される。
In FIG. 1 , a
図1において、無線通信機能を有する通信端末104のユーザ24は、店舗14の内部に存在する。本実施形態において、通信端末104は、無線信号を利用して、アクセスポイント124との間で情報を送受する。例えば、通信端末104は無線信号を発信し、アクセスポイント124は当該無線信号を受信する。また、本実施形態において、ユーザ24は、来店確認機器144により提供される各種のサービスを利用する。これにより、来店確認機器142がユーザ22の来店を検出した場合と同様の手順により、ユーザ24の来店が、来店確認機器144により検出される。
In FIG. 1, a
なお、本実施形態においては、店舗12及び店舗14のそれぞれの内部に配されたアクセスポイントの個数が1である場合を例として、データ解析システム100の詳細が説明される。しかしながら、データ解析システム100は本実施形態に限定されない。他の実施形態において、店舗12及び店舗14の少なくとも一方の内部に、複数個のアクセスポイントが配されてよい。
In the present embodiment, details of the
[ログ情報の収集]
本実施形態に係るデータ解析システム100によれば、管理サーバ160が、アクセスポイント122から、アクセスポイント122が通信端末から受信した1又は複数の無線信号に関する情報を収集する。また、管理サーバ160は、アクセスポイント124から、アクセスポイント124が受信した1又は複数の無線信号のそれぞれに関する情報を収集する。
[Collect log information]
According to the
無線信号に関する情報(ログ情報と称される場合がある。)は、当該無線信号を受信したアクセスポイントを識別するための情報、当該無線信号が受信された時刻(受信時刻と称される場合がある。)を示す情報(受信時刻情報と称される場合がある。)、当該無線信号を発信した通信端末を識別するための情報(端末識別情報と称される場合がある。)、当該無線信号の電波に関する情報(信号情報と称される場合がある。)などを含んでよい。信号情報は、例えば、無線信号の電波強度を示す情報、無線信号の周波数帯を示す情報、及び、通信の接続段階を示す情報の少なくとも1つを含む。 Information on wireless signals (sometimes referred to as log information) includes information for identifying the access point that received the wireless signal, and the time at which the wireless signal was received (sometimes referred to as reception time). (sometimes referred to as reception time information), information for identifying the communication terminal that transmitted the radio signal (sometimes referred to as terminal identification information), the radio It may include information on the radio wave of the signal (sometimes referred to as signal information). The signal information includes, for example, at least one of information indicating the radio wave intensity of the radio signal, information indicating the frequency band of the radio signal, and information indicating the connection stage of communication.
移動体通信方式における通信端末とアクセスポイントとの間の通信の接続段階としては、位置登録要求段階、認証段階、アソシエーション段階、接続完了段階などが例示される。移動体通信方式以外の無線通信方式における通信端末とアクセスポイントとの間の通信の接続段階としては、プローブ要求段階、認証段階、アソシエーション段階、接続完了段階ディアソシエーション段階、ディタッチ段階(切り離し段階と称される場合もある。)などが例示される。 A location registration request stage, an authentication stage, an association stage, a connection completion stage, and the like are exemplified as connection stages of communication between a communication terminal and an access point in a mobile communication system. The connection stages of communication between a communication terminal and an access point in a wireless communication system other than the mobile communication system include a probe request stage, an authentication stage, an association stage, a connection completion stage, a disassociation stage, and a detach stage (referred to as a detachment stage). may be used.) and the like are exemplified.
ログ情報の詳細は後述されるが、ログ情報の具体例は、例えば、図12に示される。図12において、データテーブル1200は、無線信号を受信したアクセスポイントのAPID1222と、当該無線信号の受信時刻を示す情報1224と、当該無線信号を発信した通信端末の端末ID1226と、当該無線信号の電波に関する情報1228とを対応付けて格納する。データテーブル1200の各行は、ログ情報の一例を表す。
Details of the log information will be described later, but a specific example of the log information is shown in FIG. 12, for example. In FIG. 12, data table 1200 includes
APID1222は、管理サーバ160が各アクセスポイントに割り当てた識別情報であり、各アクセスポイントの識別情報の一例であってよい。無線信号の電波に関する情報1228としては、電波強度を示す情報、周波数帯を示す情報、接続段階を示す情報などが例示される。
The
[来店確認情報の収集]
本実施形態において、管理サーバ160は、来店確認機器142から、店舗12において来店が確認された顧客に関する情報を収集する。管理サーバ160は、来店確認機器144から、店舗14において来店が確認された顧客に関する情報を収集する。来店が確認された顧客に関する情報(来店確認情報と称される場合がある。)は、当該顧客を識別するための情報(ユーザIDと称される場合がある。)、当該顧客の来店が確認された時刻(来店時刻と称される場合がある。)を示す情報、当該顧客が来店した店舗等を示す情報、当該顧客の来店を確認した手段を示す情報などを含んでよい。
[Collection of visit confirmation information]
In this embodiment, the
上記の顧客を識別するための情報は、任意のサービスの提供者又は運営者により各顧客に割り当てられた識別情報であってもよく、各顧客が利用する通信端末の端末IDであってもよい。来店時刻を示す情報は、顧客が来店した日付を示す情報であってもよく、顧客が来店した日付及び時刻を示す情報であってもよい。 The information for identifying the customer may be identification information assigned to each customer by any service provider or operator, or may be the terminal ID of the communication terminal used by each customer. . The information indicating the visit time may be information indicating the date when the customer visits the store, or may be information indicating the date and time when the customer visits the store.
来店確認情報の詳細は後述されるが、来店確認情報の具体例は、例えば、図13に示される。図13において、データテーブル1300は、ユーザのユーザID1322と、当該ユーザの行動が確認された場所の位置情報1324と、当該ユーザの行動が確認された時刻を示す情報1326とを対応付けて格納する。データテーブル1300の各行は、来店確認情報の一例を表す。
Although the details of the store-visit confirmation information will be described later, a specific example of the store-visit confirmation information is shown in FIG. 13, for example. In FIG. 13, the data table 1300 stores the
ユーザIDとしては、例えば、(i)来店確認機器142又は来店確認機器144が取得したクレジットカードのカード番号、会員制サービスの会員番号又はアカウント、通信端末のMACアドレス、(ii)来店確認機器142又は来店確認機器144に入力された氏名、クレジットカードのカード番号、会員制サービスの会員番号又はアカウントなどが利用される。
As the user ID, for example, (i) the credit card number acquired by the store
[学習用データセットの生成]
本実施形態によれば、管理サーバ160は、収集された来店確認情報及びログ情報を解析して、上記の判定処理に利用される学習モデルの教師データとして利用され得る学習用データセットを生成する。例えば、管理サーバ160は、まず、収集された来店確認情報及びログ情報を照合して、1以上の来店確認情報の少なくとも一部と、1以上のログ情報の少なくとも一部とを関連付ける。
[Generate training data set]
According to this embodiment, the
管理サーバ160は、例えば、(i)各来店確認情報に含まれる、顧客を識別するための情報、及び、当該顧客の来店時刻を示す情報と、(ii)各ログ情報に含まれる、端末識別情報及び受信時刻情報とをキーとして、来店確認情報及びログ情報を照合する。もしも、顧客を識別するための情報と、端末識別情報との対応関係を示す情報(対応関係情報と称される場合がある。)を入手できるのであれば、管理サーバ160はこのような情報を参照して来店確認情報及びログ情報を照合してもよい。
For example, the
対応関係情報の詳細は後述されるが、対応関係情報の具体例は、例えば、図11に示される。図11において、データテーブル1100は、各通信端末の端末ID1122と、各通信端末のユーザのユーザID1124とを対応付けて格納する。データテーブル1100の各行は、対応関係情報の一例を表す。
Although the details of the correspondence information will be described later, a specific example of the correspondence information is shown in FIG. 11, for example. In FIG. 11, data table 1100 stores
管理サーバ160が来店確認情報及びログ情報を照合する手順の詳細は後述されるが、管理サーバ160は、例えば、下記の手順に従って、来店確認情報及びログ情報を照合する。管理サーバ160は、まず、データテーブル1300から、特定の一行に記録されたログ情報を読み込む。次に、管理サーバ160は、(i)ログ情報に含まれる端末ID1226をキーとして、データテーブル1100を参照し、(ii)端末ID1226に合致する端末ID1122に対応付けられた、ユーザID1124を抽出する。次に、管理サーバ160は、(i)抽出されたユーザID1124と、ログ情報に含まれる無線信号の受信時刻を示す情報1224とをキーとして、データテーブル1300を参照し、(ii)ユーザID1322がユーザID1124に合致し、ユーザの行動が確認された時刻を示す情報1326が、上記の受信時刻を示す情報1224に合致する来店確認情報を抽出する。管理サーバ160は、抽出された来店確認情報と、読み込んだログ情報とを関連付けることができると判定する。
The details of the procedure for the
次に、管理サーバ160は、来店確認情報と関連付けられたログ情報に、当該ログ情報により示される通信端末のユーザが、当該ログ情報に関連する無線信号を受信したアクセスポイントの配された店舗等の内部に存在していたことを示すラベル(陽性ラベルと称される場合がある。)を付与する。これにより、陽性ラベルの付与された学習用データセットが生成される。
Next, the
管理サーバ160が学習用データセットを生成する手順の詳細は後述されるが、管理サーバ160は、例えば、下記の手順に従って、学習用データセットを生成する。管理サーバ160は、まず、各アクセスポイントのAPIDと、各アクセスポイントが配される店舗の店舗IDとが対応付けられたデータベースを参照して、上記のログ情報に関連する無線信号を受信したアクセスポイントの配された店舗等の識別情報を取得する。
The details of the procedure for the
上記のデータベースの具体例は、例えば、図9に示される。図9において、データテーブル900は、各アクセスポイントのAPID922と、各アクセスポイントのMACアドレスを示す情報924と、各アクセスポイントが配される店舗の店舗ID926とを対応付けて格納する。
A specific example of the above database is shown in FIG. 9, for example. In FIG. 9, data table 900
管理サーバ160は、例えば、(i)ログ情報に含まれるAPID1222をキーとして、データテーブル900を参照し、(ii)APID1222に合致するAPID922に対応付けられた、店舗ID926を抽出する。管理サーバ160は、例えば、(i)ログ情報に含まれる端末ID1226、無線信号の受信時刻を示す情報1224、及び、無線信号の電波に関する情報1228と、(ii)抽出された店舗ID926と、(iii)陽性ラベルとを対応付けることで、学習用データセットの一部を構成するデータポイント(学習用データポイントと称される場合がある。)を生成する。管理サーバ160が、来店確認情報と関連付けられた複数のログ情報のそれぞれを同様に加工することで、複数の学習用のデータポイントを含む学習用データセットが生成される。
For example, the management server 160 (i) refers to the data table 900 using the
学習用データセットの詳細は後述されるが、学習用データセットの具体例は、例えば、図15に示される。図15において、データテーブル1500の各行は、学習用データポイントの一例を表す。図15において、データテーブル1500は、無線信号を発信した通信端末の端末ID1422と、無線信号を受信したアクセスポイントが配された店舗の店舗ID1424と、無線信号の受信日を示す情報1426と、無線信号の特徴量を示す情報1428と、ラベルの種類を示す情報1532とを対応付けて格納する。
Details of the learning data set will be described later, and a specific example of the learning data set is shown in FIG. 15, for example. In FIG. 15, each row of data table 1500 represents an example of a training data point. 15, data table 1500 includes
データテーブル1500において、端末ID1422には、例えば、ログ情報に含まれる端末ID1226が記録される。店舗ID1424には、例えば、上記の抽出された店舗ID926が記録される。無線信号の受信日を示す情報1426には、例えば、ログ情報に含まれる無線信号の受信時刻を示す情報1224により示される時刻、又は、年月日を示す情報が記録される。無線信号の特徴量を示す情報1428には、例えば、ログ情報に含まれる無線信号の電波に関する情報1228、若しくは、その一部が記録される。ラベルの種類を示す情報1532には、陽性であることを示す情報が記録される。なお、無線信号の特徴量を示す情報1428には、複数のログ情報に含まれる無線信号の電波に関する情報1228を統計処理して得られた統計量が記録されてもよい。
In the data table 1500, the
[学習モデルの構築]
本実施形態によれば、管理サーバ160は、上記の学習用データセットを利用して、学習モデルを生成する。管理サーバ160は、学習用データセットを構成する各データポイントに含まれる陽性ラベルにより示される事項を目的変数として、学習モデルを生成する。
[Building a learning model]
According to this embodiment, the
管理サーバ160は、少なくとも、学習用データセットを構成する各データポイントに含まれる信号情報により示される無線信号の電波に関する各種の物理量又は当該物理量の統計値を特徴量として、学習モデルを生成してよい。管理サーバ160は、学習用データセットを構成する各データポイントに含まれる無線信号を受信したアクセスポイントの識別情報を特徴量として、学習モデルを生成してもよい。管理サーバ160は、学習用データセットを構成する各データポイントに含まれる受信時刻情報を特徴量として、学習モデルを生成してもよい。
The
上記の学習モデルは、例えば、店舗等の内部に配されたアクセスポイントにより受信された無線信号に関する情報を含むデータポイントが入力され、当該無線信号を発信した通信端末のユーザが当該店舗等の内部に存在していたか否かを判定するために用いられる。上記の学習モデルは、入力されたデータポイント(サンプルと称される場合もある。)を、適切なクラスに分類するクラス分類器であってよい。 In the above learning model, for example, a data point containing information about a radio signal received by an access point placed inside a store is input, and the user of the communication terminal that transmitted the radio signal is It is used to determine whether the The learning model described above may be a classifier that classifies input data points (sometimes referred to as samples) into appropriate classes.
例えば、学習モデルは、入力されたデータポイントを、店舗等の内部に存在する通信端末が発信した無線信号に関するクラスと、店舗等の内部に存在しない通信端末が発信した無線信号に関するクラスとに分類する。店舗等の内部に存在する通信端末が発信した無線信号に関するクラスは、当該無線信号を発信した通信端末のユーザが当該店舗等の内部に存在していたことを示すクラスの一例であってよい。店舗等の内部に存在しない通信端末が発信した無線信号に関するクラスは、当該無線信号を発信した通信端末のユーザが当該店舗等の内部に存在していなかったことを示すクラスの一例であってよい。 For example, the learning model classifies the input data points into a class related to wireless signals transmitted by communication terminals inside the store, etc., and a class related to wireless signals transmitted by communication terminals not located inside the store, etc. do. A class related to a radio signal transmitted by a communication terminal inside a store or the like may be an example of a class indicating that the user of the communication terminal that transmitted the radio signal was present inside the store or the like. A class related to a radio signal transmitted by a communication terminal that does not exist inside a store, etc. may be an example of a class indicating that the user of the communication terminal that transmitted the radio signal was not present inside the store, etc. .
上記の学習モデルは、当該学習モデルに入力されたデータポイントごとに、当該学習モデルの予測又は判定に対する不確実性を推定するために利用される関数の値を算出してよい。学習モデルの予測又は判定に対する不確実性を推定するために利用される関数としては、入力されたデータポイントが各クラスに属する確率(分類確率と称される場合がある)を算出するための関数、当該学習モデルの予測結果又は判定結果の不確実性を評価するための決定関数などが例示される。 The learning model may calculate, for each data point input to the learning model, the value of a function used to estimate the uncertainty of the prediction or decision of the learning model. A function used to estimate the uncertainty of prediction or judgment of a learning model is a function for calculating the probability that an input data point belongs to each class (sometimes referred to as classification probability). , a decision function for evaluating the uncertainty of the prediction result or determination result of the learning model, and the like.
上記の学習モデルにおいては、(i)算出された分類確率又は決定関数の値と、(ii)上記の学習モデルが、通信端末のユーザが店舗等の内部に存在していたか否かを判定するための閾値(分類用の閾値と称される場合がある。)とに基づいて、上記のユーザがエリアの内部に存在していたか否かが判定される。上述のとおり、学習モデルは、当該学習モデルの予測又は判定に対する不確実性を推定するために利用される関数の値を出力する機能を有する。そして、学習モデルにおいては、分類用の閾値として、上記の関数の種類に応じた初期値が設定されている。 In the above learning model, (i) the calculated classification probability or the value of the decision function, and (ii) the above learning model determines whether the user of the communication terminal was inside the store or the like. It is determined whether or not the user exists within the area based on a threshold for classification (sometimes referred to as a threshold for classification). As described above, the learning model has the function of outputting the value of the function used to estimate the uncertainty of the prediction or decision of the learning model. In the learning model, an initial value corresponding to the type of function is set as a threshold for classification.
本実施形態によれば、管理サーバ160は、まず、学習用データセットの一部を利用して機械学習処理を実行する。機械学習処理においては、モデルによる学習と、モデルの検証とが実施される。
According to this embodiment, the
上述のとおり、本実施形態によれば、学習用データセットは、例えば、来店確認情報に基づいて生成される。この場合、学習用データセットは、「店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用したユーザの通信端末が発信した無線信号に関するデータ」に陽性ラベルが付与されたデータセットとなる。
As described above, according to the present embodiment, the learning data set is generated based on store visit confirmation information, for example. In this case, the learning data set is data obtained by assigning a positive label to "data related to radio signals transmitted by the communication terminal of the user who entered the store 12 and used the service provided by the store
そのため、来店確認情報に基づいて生成された学習用データセットを利用して機械学習処理が実行された場合、入力されたデータポイントを、(i)「(a)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用したユーザの通信端末が発信した無線信号」が属するクラスと、(ii)「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」及び「(c)店舗12の内部に進入しなかったユーザの通信端末が発信した無線信号」が属するクラスとに、精度よく分類するための学習モデルが構築される。
Therefore, when machine learning processing is performed using a learning data set generated based on the store visit confirmation information, the input data points are (i) "(a) entered into the store 12, (ii) a class to which "(b) enters the store 12 and is provided by the store
しかしながら、実際のビジネスにおいては多くの場合、学習済みの学習モデルは、入力されたデータポイントを、(i)店舗等の内部に存在する通信端末が発信した無線信号に関するクラスと、(ii)店舗等の内部に存在しない通信端末が発信した無線信号に関するクラスとに分類することが要求される。つまり、学習済みの学習モデルは、入力されたデータポイントを、(i)「(a)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用したユーザの通信端末が発信した無線信号」及び「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」が属するクラスと、(ii)「(c)店舗12の内部に進入しなかったユーザの通信端末が発信した無線信号」が属するクラスとに、精度よく分類することが要求される。
However, in many cases in actual business, a trained learning model classifies input data points into (i) classes related to radio signals emitted by communication terminals existing inside a store, etc., and (ii) stores It is required to classify into a class related to radio signals transmitted by a communication terminal that does not exist inside such as a class. In other words, the learned learning model is based on the following: (i) "(a) the communication terminal of the user who entered the store 12 and used the service provided by the store
来店確認情報に基づいて生成された学習用データセットを利用して機械学習処理が実行された場合、学習済みの学習モデルは、(a)及び(b)を陽性ラベルとして有するデータセットに基づいて学習された別の学習モデルを用いる場合と比較して、より多くの「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」を陰性と判定する可能性がある。そこで、学習モデルの評価を向上させるためには、学習モデルが「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」を陽性と判定する割合を増加させることが好ましい。
When the machine learning process is performed using the learning data set generated based on the store visit confirmation information, the learned learning model has (a) and (b) as positive labels Based on the data set Compared to the case of using another learned model, more "(b) the communication terminal of the user who entered the store 12 and did not use the service provided by the store
しかしながら、学習モデルが「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」を陽性と判定する割合を増加させると、学習モデルが「(c)店舗12の内部に進入しなかったユーザの通信端末が発信した無線信号」を陽性と判定する割合も増加する可能性がある。そこで、学習モデルが「(c)店舗12の内部に進入しなかったユーザの通信端末が発信した無線信号」を陽性と判定する割合の増加を抑制しつつ、学習モデルが「(b)店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかったユーザの通信端末が発信した無線信号」を陽性と判定する割合を増加させることが好ましい。
However, the learning model increases the percentage of positive determinations of "(b) a wireless signal transmitted by a communication terminal of a user who entered the store 12 and did not use the service provided by the store
そこで、管理サーバ160は、次に、上記の機械学習処理において利用されなかった学習用データセットを利用して、分類用の閾値を調整する。例えば、管理サーバ160は、分類用の閾値として、学習モデルに応じた初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなるように、分類用の閾値を調整する。管理サーバ160は、分類用の閾値として初期値が利用された場合と比較して、学習モデルの判定結果の偽陽性率が小さくなるように、分類用の閾値を調整してもよい。
Therefore, the
本実施形態によれば、管理サーバ160は、実際の判定処理において、学習済みの学習モデル及び調整後の閾値を利用して、学習及び検証に利用されていない新たなデータポイント(判定対象データと称される場合がある。)を、(i)店舗等の内部に存在する通信端末が発信した無線信号に関するクラスと、(ii)店舗等の内部に存在しない通信端末が発信した無線信号に関するクラスとに分類する。一実施形態によれば、分類用の閾値として調整後の閾値が利用された場合、分類用の閾値として学習モデルに応じた初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなる。他の実施形態によれば、分類用の閾値として調整後の閾値が利用された場合、分類用の閾値として学習モデルに応じた初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなり、且つ、学習モデルの判定結果の偽陽性率が小さくなる。
According to this embodiment, in the actual determination process, the
店舗12、店舗14などの店舗等は、エリアの一例であってよい。データ解析システム100は、機械学習装置及び判定装置の一例であってよい。通信端末102、通信端末104などの通信端末は、無線端末の一例であってよい。アクセスポイント122、アクセスポイント124などのアクセスポイントは、レコード取得部、無線受信装置及び中継装置の一例であってよい。管理サーバ160は、機械学習装置及び判定装置の一例であってよい。管理サーバ160は、レコード取得部、行動履歴取得部、及び、ラベル付与部の一例であってもよい。
Stores such as the store 12 and the store 14 may be an example of an area.
1以上のログ情報のそれぞれは、レコードの一例であってよい。1以上の来店確認情報のそれぞれは、行動履歴情報の一例であってよい。1以上の入力データのそれぞれは、集約レコードの一例であってよい。分類用の閾値は、基準値の一例であってよい。調整後の閾値は、第2の値の一例であってよい。 Each of the one or more pieces of log information may be an example of a record. Each of the one or more store visit confirmation information may be an example of action history information. Each of the one or more pieces of input data may be an example of an aggregation record. A threshold for classification may be an example of a reference value. The adjusted threshold may be an example of the second value.
本実施形態によれば、管理サーバ160は、上記の手順に従って構築された学習済みの学習モデルを利用して、実際の判定処理を実行する。上述されたとおり、本実施形態によれば、学習モデルが、来店確認情報に基づいて生成された学習用データセットを利用して構築される。これにより、多くの場合において十分な判定精度が得られる。さらに、本実施形態によれば、判定処理に先だって、分類用の閾値が調整される。そして、学習モデルが、調整された分類用の閾値を利用して、入力されたデータポイントを分類する。これにより、判定精度がさらに向上する。
According to this embodiment, the
一般的に、教師あり機械学習においては、如何にして大量の教師データを収集するかが問題となる。特に、機械学習を利用して、通信端末の無線信号に関する情報に基づいて、当該通信端末が特定のエリア内に存在するか否かを判定する場合、そもそも、大量の教師データを収集することが難しい。そこで、発明者らは、例えば、アクセスポイント122及び来店確認機器142設置された店舗12に来店した顧客の通信端末が発信した無線信号に着目し、当該無線信号に関するログ情報を教師データとして利用することを想到した。しかしながら、この場合であっても、顧客が、店舗12の内部には進入したものの、来店確認機器142により提供されるサービスを利用しなかった場合には、当該顧客のデータを教師データとして利用することができない可能性もある。
Generally, in supervised machine learning, the problem is how to collect a large amount of teacher data. In particular, when machine learning is used to determine whether or not a communication terminal exists in a specific area based on information related to the radio signal of the communication terminal, it is necessary to collect a large amount of training data in the first place. difficult. Therefore, the inventors, for example, pay attention to the radio signal transmitted by the communication terminal of the customer visiting the store 12 where the
この点に関し、本実施形態においては、例えば、「店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用した顧客の通信端末が発信した無線信号」を陽性ラベルとする学習用データセットを教師データとして学習モデルが構築された後、分類用の閾値が調整される。これにより、(i)「店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用した顧客の通信端末が発信した無線信号」を陽性ラベルとする学習用データセットを、(ii)「店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用した顧客の通信端末が発信した無線信号」及び「店舗12の内部に進入し、来店確認機器142により提供されるサービスを利用しなかった顧客の通信端末が発信した無線信号」を陽性ラベルとする学習用データセットの代わりに利用することができる。
In this regard, in the present embodiment, for example, a positive label is a "radio signal emitted by a communication terminal of a customer who enters the store 12 and uses the service provided by the store
[データ解析システム100の各部の概要]
本実施形態において、通信ネットワーク10は、通信端末108、アクセスポイント122、アクセスポイント124、来店確認機器142及び来店確認機器144の少なくとも1つと、管理サーバ160との間で、情報を伝達する。通信ネットワーク10は、有線通信の伝送路であってもよく、無線通信の伝送路であってもよく、無線通信の伝送路及び有線通信の伝送路の組み合わせであってもよい。
[Overview of Each Part of Data Analysis System 100]
In this embodiment, the
通信ネットワーク10は、無線通信網、インターネット、P2Pネットワーク、専用回線、VPN、電力線通信回線などを含んでもよい。無線通信網における通信方式は、(i)3G方式、LTE方式、4G方式などの移動体通信方式であってもよく、(ii)Bluetooth(登録商標)、Zigbee(登録商標)、NFC(Near Field Communication)のような近距離無線方式、WiFi(登録商標)のような無線LAN方式、WiMAX(登録商標)のような無線MAN方式、無線WAN方式などの無線データ通信方式であってもよい。
本実施形態において、通信端末102及び通信端末104のそれぞれは、無線通信機能を有し、無線信号を発信する。無線通信の通信方式は、移動体通信方式であってもよく、無線データ通信方式であってもよい。通信端末102は、例えば、アクセスポイント122及び通信ネットワーク10を介して、他の通信機器との間で情報を送受する。通信端末104は、例えば、アクセスポイント124及び通信ネットワーク10を介して、他の通信機器との間で情報を送受する。
In this embodiment, each of
通信端末102及び通信端末104のそれぞれの詳細は、特に限定されない。通信端末102及び通信端末104のそれぞれとしては、パーソナルコンピュータ、携帯端末などが例示される。携帯端末としては、携帯電話、スマートフォン、PDA、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータなどが例示される。通信端末102及び通信端末104のそれぞれは、携帯端末であってよい。
Details of each of
本実施形態において、通信端末108は、通信ネットワーク10を介して、管理サーバ160との間で情報を送受する。通信端末108は、管理サーバ160に対して、各種の要求を送信してよい。通信端末108は、管理サーバ160から、上記の要求に対する応答を取得してよい。例えば、通信端末108は、店舗12又は店舗14に来店した顧客の人数を推定するための処理を実行することを要求する。
In this embodiment, the
通信端末108の詳細は、特に限定されない。通信端末108としては、パーソナルコンピュータ、携帯端末などが例示される。携帯端末としては、携帯電話、スマートフォン、PDA、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータなどが例示される。
Details of the
本実施形態において、アクセスポイント122は、無線LAN方式により、通信端末102の通信を中継する。例えば、アクセスポイント122は、通信端末102と、通信ネットワーク10との間で情報を伝達させる。アクセスポイント122及び通信端末102の間では、通信が確立する前の段階であっても、各種の信号がやり取りされる。例えば、アクセスポイント122及び通信端末102の接続が完了して、通信端末102が他の情報処理装置との間で通信を開始する前に、アクセスポイント122及び通信端末102の間では、プローブ要求に関連する処理、認証処理、アソシエーション処理などが実行される。
In this embodiment, the
本実施形態において、アクセスポイント122は、通信端末102が出力した無線信号を受信する。アクセスポイント122は、アクセスポイント122に到達した無線信号の電波強度が予め定められた値と等しい又は当該値よりも大きい場合に、当該無線信号が受信されたと判断してよい。アクセスポイント122は、受信された無線信号を解析して、通信端末102を識別するための識別情報(端末IDと称される場合がある。)を取得する。
In this embodiment, the
上記の無線信号は、通信が確立した後で受信される信号であってもよく、通信が確立する前に受信される信号であってもよい。通信が確立する前に受信される信号としては、プローブ要求、認証要求、アソシエーション要求などが例示される。通信が確立した後で受信される信号は、ディアソシエーション要求、又は、ディタッチ要求(切り離し要求と称される場合もある。)であってもよい。これらの信号に含まれる通信端末102の識別情報としては、MACアドレスが例示される。
The radio signal may be a signal received after communication is established, or a signal received before communication is established. Examples of signals received before communication is established include probe requests, authentication requests, association requests, and the like. A signal received after communication is established may be a disassociation request or a detach request (sometimes referred to as a detach request). A MAC address is exemplified as the identification information of the
通信端末102の端末IDは、端末識別情報の一例であってよい。通信端末102のMACアドレスは、端末識別情報の一例であってよい。
The terminal ID of
アクセスポイント122は、例えば、無線信号を発信した通信端末102の端末IDと、当該無線信号が受信された時刻を示す時刻情報と、当該無線信号の電波に関する情報とが対応付けられたログ情報を、管理サーバ160に送信する。ログ情報は、アクセスポイント122の識別情報と、無線信号を発信した通信端末102の端末IDと、当該無線信号が受信された時刻を示す情報と、当該無線信号の電波に関する情報とが対応付けられた情報であってもよい。アクセスポイント122の識別情報としては、SSID、MACアドレス、IPアドレスなどが例示される。
The
本実施形態において、アクセスポイント124は、無線LAN方式により、通信端末104の通信を中継する。例えば、アクセスポイント124は、通信端末104と、通信ネットワーク10との間で情報を伝達させる。アクセスポイント124及び通信端末104の間では、通信が確立する前の段階であっても、各種の信号がやり取りされる。例えば、アクセスポイント124及び通信端末104の接続が完了して、通信端末104が他の情報処理装置との間で通信を開始する前に、アクセスポイント124及び通信端末104の間では、プローブ要求に関連する処理、認証処理、アソシエーション処理などが実行される。
In this embodiment, the
本実施形態において、アクセスポイント124は、通信端末104が出力した無線信号を受信する。アクセスポイント124は、アクセスポイント124に到達した無線信号の電波強度が予め定められた値と等しい又は当該値よりも大きい場合に、当該無線信号が受信されたと判断してよい。アクセスポイント124は、受信された無線信号を解析して、通信端末104を識別するための識別情報(端末IDと称される場合がある。)を取得する。
In this embodiment, the
上記の無線信号は、通信が確立した後で受信される信号であってもよく、通信が確立する前に受信される信号であってもよい。通信が確立する前に受信される信号としては、プローブ要求、認証要求、アソシエーション要求などが例示される。通信が確立した後で受信される信号は、ディアソシエーション要求、又は、ディタッチ要求(切り離し要求と称される場合もある。)であってもよい。これらの信号に含まれる通信端末104の識別情報としては、MACアドレスが例示される。
The radio signal may be a signal received after communication is established, or a signal received before communication is established. Examples of signals received before communication is established include probe requests, authentication requests, association requests, and the like. A signal received after communication is established may be a disassociation request or a detach request (sometimes referred to as a detach request). A MAC address is exemplified as the identification information of the
通信端末104の端末IDは、端末識別情報の一例であってよい。通信端末104のMACアドレスは、端末識別情報の一例であってよい。
The terminal ID of
アクセスポイント124は、例えば、無線信号を発信した通信端末104の端末IDと、当該無線信号が受信された時刻を示す情報と、当該無線信号の電波に関する情報とが対応付けられたログ情報を、管理サーバ160に送信する。ログ情報は、アクセスポイント124の識別情報と、無線信号を発信した通信端末104の端末IDと、当該無線信号が受信された時刻を示す情報と、当該無線信号の電波に関する情報とが対応付けられた情報であってもよい。アクセスポイント124の識別情報としては、SSID、MACアドレス、IPアドレスなどが例示される。
The
本実施形態において、来店確認機器142は、店舗12の内部におけるユーザ22の行動を検出し、通信端末102のユーザ22が店舗12の内部に存在したことを示す来店確認情報を生成する。来店確認機器142は、生成された来店確認情報を管理サーバ160に送信する。来店確認情報は、上記の行動に関与したユーザ22を識別するための識別情報(ユーザIDと称される場合がある。)と、当該行動がなされた時刻を示す情報とが対応付けられた情報であってよい。来店確認情報は、上記の行動に関与したユーザ22のユーザIDと、当該行動がなされた時刻を示す情報と、当該行動がなされた場所の位置を示す情報とが対応付けられた情報であってもよい。ユーザIDは、個人の特定につながらないデータであることが好ましい。
In this embodiment, the store
来店確認機器142は、近距離無線通信又は有線通信により、通信端末102との間で通信を確立し、通信端末102の端末IDを取得してもよい。この場合、来店確認情報は、通信端末102の端末IDと、当該端末IDが取得された時刻を示す情報と、店舗12の位置を示す情報とが対応付けられた情報であってよい。店舗12の位置を示す情報は、店舗12の名称、店舗12の住所、店舗12の位置座標などが例示される。来店確認情報は、通信端末102の端末IDと、当該端末IDが取得された時刻を示す情報とが対応付けられた情報であってよい。
The store
店舗12の内部におけるユーザ22の行動としては、(i)店舗12の内部で商品を購入する行為、(ii)店舗12の内部で提供されるサービスを利用する行為、(iii)店舗12の内部で、生体認証システムを利用する行為、(iv)店舗12の内部で、近距離無線通信又は有線通信による通信端末102及び来店確認機器142の通信を確立する行為、(v)入退場管理システムを利用して店舗12の内部に進入する行為などが例示される。店舗12の内部で提供されるサービスは、会員制サービスであってもよい。会員制サービスとしては、クレジットカードサービス、ポイントカードサービス、ポイントサービス、ポイントプログラム、ロイヤリティプログラム、マイレージサービス、マイレージプログラムなどを例示することができる。入退場管理システムは、ユーザ22の生体情報、ユーザ22に貸与されたIDカードに格納されたユーザID、及び、通信端末102の端末IDの少なくとも1つを利用して、ユーザ22の進入及び退出の少なくとも一方を管理してよい。
The actions of the
来店確認機器142は、ユーザ22のユーザID又は通信端末102の端末IDと、時刻を示す情報とが入力される機器であれば、その詳細は特に限定されない。また、ユーザIDの種類も、特に限定されない。来店確認機器142としては、店舗12の店頭で提供されるサービスを利用した顧客の氏名又は識別情報が入力されるシステム、POSシステム、会員制サービスの会員番号を取得するシステム、入退場管理システム、生体認証システムなどが例示される。店舗12の店頭で提供されるサービスを利用した顧客の氏名又は識別情報が入力されるシステムは、店舗12のスタッフが、上記の氏名又は識別情報を入力するシステムであってもよい。各システムに入力される情報又は各システムが取得する情報は、ユーザIDの一例であってよい。各システムに入力される情報又は各システムが取得する情報の種類は、ユーザIDの種類の一例であってよい。
The store
本実施形態において、来店確認機器144は、店舗14の内部におけるユーザ24の行動を検出し、通信端末104のユーザ24が店舗14の内部に存在したことを示す来店確認情報を生成する。来店確認機器144は、生成された来店確認情報を管理サーバ160に送信する。来店確認情報は、上記の行動に関与したユーザ24を識別するための識別情報(ユーザIDと称される場合がある。)と、当該行動がなされた時刻を示す情報とが対応付けられた情報であってよい。来店確認情報は、上記の行動に関与したユーザ24のユーザIDと、当該行動がなされた時刻を示す情報と、当該行動がなされた場所の位置を示す情報とが対応付けられた情報であってもよい。ユーザIDは、個人の特定につながらないデータ、又は、個人の特定が困難なデータであることが好ましい。
In this embodiment, the store
来店確認機器144は、近距離無線通信又は有線通信により、通信端末104との間で通信を確立し、通信端末104の端末IDを取得してもよい。この場合、来店確認情報は、通信端末104の端末IDと、当該端末IDが取得された時刻を示す情報と、店舗14の位置を示す情報とが対応付けられた情報であってよい。店舗14の位置を示す情報は、店舗14の名称、店舗14の住所、店舗14の位置座標などが例示される。来店確認情報は、通信端末104の端末IDと、当該端末IDが取得された時刻を示す情報とが対応付けられた情報であってよい。
The store
店舗14の内部におけるユーザ24の行動としては、(i)店舗14の内部で商品を購入する行為、(ii)店舗14の内部で提供されるサービスを利用する行為、(iii)店舗14の内部で、生体認証システムを利用する行為、(iv)店舗14の内部で、近距離無線通信又は有線通信による通信端末104及び来店確認機器144の通信を確立する行為、(v)入退場管理システムを利用して店舗14の内部に進入する行為などが例示される。店舗14の内部で提供されるサービスは、会員制サービスであってもよい。会員制サービスとしては、クレジットカードサービス、ポイントカードサービス、ポイントサービス、ポイントプログラム、ロイヤリティプログラム、マイレージサービス、マイレージプログラムなどを例示することができる。入退場管理システムは、ユーザ24の生体情報、ユーザ24に貸与されたIDカードに格納されたユーザID、及び、通信端末104の端末IDの少なくとも1つを利用して、ユーザ24の進入及び退出の少なくとも一方を管理してよい。
The actions of the
来店確認機器144は、ユーザ24のユーザID又は通信端末104の端末IDと、時刻を示す情報とが入力される機器であれば、その詳細は特に限定されない。来店確認機器144としては、店舗14の店頭で提供されるサービスを利用した顧客の氏名又は識別情報が入力されるシステム、POSシステム、会員制サービスの会員番号を取得するシステム、入退場管理システム、生体認証システムなどが例示される。店舗14の店頭で提供されるサービスを利用した顧客の氏名又は識別情報が入力されるシステムは、店舗14のスタッフが、上記の氏名又は識別情報を入力するシステムであってもよい。
The store
本実施形態において、管理サーバ160は、データ解析システム100における情報処理を管理する。管理サーバ160は、ログ情報を管理してよい。管理サーバ160は、例えば、アクセスポイント122及びアクセスポイント124の少なくとも一方から、1以上のログ情報を取得する。管理サーバ160は、取得されたログ情報をデータベースに格納する。管理サーバ160は、来店確認情報を管理してよい。管理サーバ160は、例えば、来店確認機器142及び来店確認機器144の少なくとも一方から、1以上の来店確認情報を取得する。管理サーバ160は、取得された来店確認情報をデータベースに格納する。
In this embodiment, the
本実施形態において、管理サーバ160は、収集されたログ情報を解析して、各ログ情報に関連する無線信号を発信した通信端末のユーザが、当該無線信号を発信したアクセスポイントの配された店舗等の内部に存在した否かを判定する。より具体的には、管理サーバ160は、上記の判定処理に用いられる学習モデルを生成してよい。上記の学習モデルには、ログ情報、又は、ログ情報が予め定められたアルゴリズムに基づいて処理されて得られたデータが入力される。上記の学習モデルは、上記のログ情報に関連する無線信号を発信した通信端末のユーザが、当該無線信号を発信したアクセスポイントの配された店舗等の内部に存在した否かに関する判定結果を出力する。管理サーバ160は、分類用の閾値を調整してよい。管理サーバ160は、上記の学習モデルと、調整された閾値とを用いて、上記の判定処理を実行してよい。
In this embodiment, the
本実施形態において、管理サーバ160は、通信端末108から、各種の要求を取得する。管理サーバ160は、上記の要求に応じた処理を実行し、当該処理の実行結果を上記の要求に対する応答として通信端末108に送信する。例えば、管理サーバ160は、通信端末108からの要求に応じて、店舗12又は店舗14に来店した顧客の人数を推定するための処理を実行する。管理サーバ160は、通信端末108からの要求に応じて、店舗12又は店舗14の外を通行する通行人の人数を推定するための処理を実行してもよい。管理サーバ160の詳細は、後述される。
In this embodiment, the
なお、本実施形態においては、管理サーバ160が、(i)特定の行動に関与した1以上のユーザのそれぞれを識別するためのユーザ識別情報、及び、(ii)特定の行動がなされた時刻を示す行動時刻情報が対応付けられた行動履歴情報として、来店確認情報を利用する場合を例として、管理サーバ160の詳細が説明される。しかしながら、行動履歴情報は本実施形態に限定されない。
In this embodiment, the
行動履歴情報としては、商品の購買履歴、サービスの利用履歴などが例示される。商品の購買履歴又はサービスの利用履歴としては、クレジットカードの利用履歴、POS情報に基づく購買履歴、特定の施設の入退場履歴、会員登録したユーザに特典を付与するサービスの利用履歴などが例示される。会員登録したユーザに特典を付与するサービスとしては、ポイントカードサービス、ポイントサービス、ポイントプログラム、ロイヤリティプログラム、マイレージサービス、マイレージプログラムなどが例示される。会員登録したユーザに特典を付与するサービスは、鉄道会社、航空会社、高速道路運営会社、企業、企業グループなどにより提供されてよい。 Examples of the action history information include product purchase history and service usage history. Examples of product purchase history or service usage history include credit card usage history, purchase history based on POS information, entry/exit history of specific facilities, and usage history of services that provide privileges to users who have registered as members. be. A point card service, a point service, a point program, a loyalty program, a mileage service, a mileage program, and the like are examples of services that give benefits to users who have registered as members. Services that give benefits to users who have registered as members may be provided by railway companies, airlines, expressway operating companies, companies, corporate groups, and the like.
クレジットカードの利用履歴は、例えば、クレジットカード番号と、クレジットカードを利用した店舗と、クレジットカードを利用した時間とが対応付けられた情報を含む。会員登録したユーザに特典を付与するサービスの利用履歴は、例えば、会員IDと、商品を購入又はサービスを利用した店舗と、サービスを利用した時間とが対応付けられた情報を含む。クレジットカード番号、会員IDなどは、更に匿名化された識別記号に置換されていてもよい。 The credit card usage history includes, for example, information in which the credit card number, the store where the credit card was used, and the time when the credit card was used are associated with each other. The usage history of the service that gives privileges to users who have registered as members includes, for example, information in which the member ID, the store where the product was purchased or the service was used, and the time when the service was used are associated with each other. Credit card numbers, member IDs, etc. may be replaced with further anonymized identification symbols.
行動履歴情報の他の例としては、RTB(Real Time Bidding)サービスのような広告入札サービスにおける、ビッドリクエスト(入札リクエストと称される場合がある。)が例示される。例えば、ユーザが広告枠を有するWebページにアクセスすると、AdExchangeを介して、SSP(Supply Side Platform)からDSP(Demand Side Platform)にビッドリクエストが発行される。 Another example of action history information is a bid request (sometimes referred to as a bid request) in an advertisement bidding service such as an RTB (Real Time Bidding) service. For example, when a user accesses a web page having an ad space, a bid request is issued from a SSP (Supply Side Platform) to a DSP (Demand Side Platform) via AdExchange.
ビッドリクエストには、広告枠を有するWebページを閲覧しているユーザを識別するユーザIDが含まれる。ユーザIDは、例えば、クッキー(Cookie)である。ユーザが、携帯端末上で動作するウェブブラウザを介して、上記Webページを閲覧している場合のように、ビッドリクエストに、緯度、経度などの位置情報が含まれる場合がある。また、AdExchangeからDSPに送信されたビッドリクエストには、100msec程度の入札期限が設定されており、ほぼリアルタイムに広告枠が売買される。したがって、ビッドリクエストと、ビッドリクエストが発行若しくは受信された時間又はビッドリクエストの入札期限とを対応づけて格納することで、1以上のビッドリクエストを行動履歴情報として利用することができる。 The bid request includes a user ID that identifies the user browsing the web page having the ad space. A user ID is, for example, a cookie. A bid request may include location information such as latitude and longitude, as in the case where the user is browsing the web page via a web browser running on a mobile terminal. In addition, a bid deadline of about 100 msec is set in the bid request sent from AdExchange to the DSP, and the advertising space is bought and sold almost in real time. Therefore, one or more bid requests can be used as action history information by correlating and storing the bid request with the time when the bid request was issued or received or the bid deadline of the bid request.
行動履歴情報の他の例としては、画像又は映像が撮影された位置及び時間に関する情報が付与された画像データ又は映像データであってよい。本実施形態において、まず、被写体認識アルゴリズムを用いて、画像データ又は映像データから被写体の特徴を抽出する。抽出された被写体の特徴により、被写体を識別することができる。次に、被写体の特徴と、画像又は映像が撮影された位置及び時間に関する情報とを対応付けることで、画像データ又は映像データを行動履歴情報として利用することができる。 Another example of action history information may be image data or video data to which information about the position and time at which an image or video was shot is added. In this embodiment, first, features of a subject are extracted from image data or video data using a subject recognition algorithm. The subject can be identified by the extracted features of the subject. Next, by associating the feature of the subject with the information about the position and time when the image or video was taken, the image data or video data can be used as action history information.
行動履歴情報の他の例としては、位置情報を含むSNS(Social Networking Service)上の情報であってもよい。行動履歴情報は、上記の位置情報を含む情報と、当該情報がSNS上にアップロードされた時刻を示す情報とが対応付けられた情報であってもよい。位置情報を含むSNS上の情報としては、Geoタグが付与されたTweet、Facebook(登録商標)のチェックイン情報、画像又は映像が撮影された位置及び時間に関する情報が付与された画像データ又は映像データなどが例示される。例えば、Goeタグが付与されたTweetは、Twitter(登録商標)のアカウントと、当該Tweetが発信された位置情報と、当該Tweetが発信された時間とが対応付けられた情報を含む。 Another example of action history information may be information on SNS (Social Networking Service) including location information. The action history information may be information in which information including the location information is associated with information indicating the time when the information was uploaded on the SNS. Information on SNS including location information includes tweets with Geo tags, Facebook (registered trademark) check-in information, and image data or video data with information about the location and time when an image or video was taken. etc. are exemplified. For example, a Tweet with a Goe tag includes information in which a Twitter (registered trademark) account, location information at which the Tweet was sent, and time at which the Tweet was sent are associated with each other.
なお、本実施形態においては、無線受信装置がアクセスポイントであり、予め定められた地理的範囲を有するエリアが、当該アクセスポイントの設置された店舗である場合を例として、管理サーバ160の詳細が説明された。しかしながら、管理サーバ160は本実施形態に限定されない。他の実施形態において、無線受信装置は、移動体通信網の一部を構成する基地局であってもよい。この場合、予め定められた地理的範囲を有するエリアは、各基地局のセルであってよい。
In this embodiment, the wireless receiving device is an access point, and an area having a predetermined geographical range is a store where the access point is installed. explained. However, the
また、本実施形態においては、通信端末108が、店舗12又は店舗14に来店した顧客の人数を推定するための処理を実行することを要求する場合を例として、データ解析システム100の詳細が説明された。しかしながら、データ解析システム100は本実施形態に限定されない。他の実施形態において、通信端末108は、店舗12又は店舗14の外を通行する通行人の人数を推定するための処理を実行することを要求してもよい。
Further, in the present embodiment, the details of the
[データ解析システム100の各部の具体的な構成]
データ解析システム100の各部は、ハードウエアにより実現されてもよく、ソフトウエアにより実現されてもよく、ハードウエアとソフトウエアとの組み合わせにより実現されてもよい。データ解析システム100の構成要素の少なくとも一部がソフトウエアにより実現される場合、当該ソフトウエアにより実現される構成要素は、一般的な構成の情報処理装置において、当該構成要素に関する動作を規定したプログラムを起動することにより実現されてよい。
[Specific configuration of each part of data analysis system 100]
Each part of the
プログラムは、CD-ROM、DVD-ROM、メモリ、ハードディスクなどのコンピュータ読み取り可能な媒体に記憶されていてもよく、ネットワークに接続された記憶装置に記憶されていてもよい。プログラムは、コンピュータ読み取り可能な媒体又はネットワークに接続された記憶装置から、データ解析システム100の少なくとも一部を構成するコンピュータにインストールされてよい。プログラムが実行されることにより、コンピュータが、データ解析システム100の各部の少なくとも一部として機能してもよい。
The program may be stored in a computer-readable medium such as a CD-ROM, DVD-ROM, memory, hard disk, etc., or may be stored in a storage device connected to a network. The program may be installed on a computer forming at least part of the
コンピュータをデータ解析システム100の各部の少なくとも一部として機能させるプログラムは、データ解析システム100の各部の動作を規定したモジュールを備えてよい。これらのプログラム又はモジュールは、データ処理装置、入力装置、出力装置、記憶装置等に働きかけて、コンピュータをデータ解析システム100の各部として機能させたり、コンピュータにデータ解析システム100の各部における情報処理方法を実行させたりする。
A program that causes a computer to function as at least part of each unit of
プログラムに記述された情報処理は、当該プログラムがコンピュータに読込まれることにより、当該プログラムに関連するソフトウエアと、データ解析システム100の各種のハードウエア資源とが協働した具体的手段として機能する。そして、上記の具体的手段が、本実施形態におけるコンピュータの使用目的に応じた情報の演算又は加工を実現することにより、当該使用目的に応じたデータ解析システム100が構築される。
The information processing described in the program functions as concrete means in which the software related to the program and various hardware resources of the
図2は、管理サーバ160の内部構成の一例を概略的に示す。本実施形態において、管理サーバ160は、入出力制御部220と、情報収集部230と、解析部240と、来店人数推定部270とを備える。本実施形態において、解析部240は、格納部242と、入力データ生成部244と、モデル構築部250と、判定部260とを有する。本実施形態において、モデル構築部250は、データセット生成部252と、学習部254と、閾値調整部256とを含む。本実施形態において、管理サーバ160の各部は、互いに情報を送受してよい。
FIG. 2 schematically shows an example of the internal configuration of the
情報収集部230は、レコード取得部、行動履歴取得部及び対応関係取得部の一例であってよい。入力データ生成部244は、レコード取得部、判定対象取得部及び集約部の一例であってよい。データセット生成部252は、レコード取得部、行動履歴取得部、対応関係取得部、ラベル付与部及び判定対象取得部の一例であってよい。学習部254は、モデル生成部の一例であってよい。閾値調整部256は、調整部の一例であってよい。判定部260は、判定部の一例であってよい。
The
本実施形態において、入出力制御部220は、管理サーバ160における情報の入出力を制御する。例えば、入出力制御部220は、管理サーバ160の入力機器、出力機器及び通信機器(図示されていない。)の少なくとも1つを制御する。
In this embodiment, the input/
本実施形態において、情報収集部230は、各種の情報を収集し、収集された情報を格納部242に格納する。一実施形態において、情報収集部230は、アクセスポイント122及びアクセスポイント124の少なくとも一方から、1以上のログ情報を取得する。他の実施形態において、情報収集部230は、来店確認機器142及び来店確認機器144の少なくとも一方から、1以上の来店確認情報を取得する。
In this embodiment, the
さらに他の実施形態において、情報収集部230は、1以上のユーザIDのそれぞれと、当該ユーザIDにより識別されるユーザが利用する通信端末の端末IDとの対応関係を示す対応関係情報を取得する。一実施形態において、情報収集部230は、外部の情報処理装置から、対応関係情報を取得する。他の実施形態において、情報収集部230は、1以上のログ情報と、1以上の来店確認情報とに基づいて、対応関係情報を生成する。
In yet another embodiment, the
本実施形態において、解析部240は、情報収集部230が収集した1以上のログ情報及び1以上の来客確認情報の少なくとも一部を解析する。解析部240は、各ログ情報に関連する無線信号を発信した通信端末のユーザが、当該無線信号を発信したアクセスポイントの配された店舗等の内部に存在した否かを判定する。解析部240は、は、ログ情報又は予め定められたアルゴリズムに基づいてログ情報が処理されて得られたデータが入力され、当該ログ情報に関連する無線信号を発信した通信端末のユーザが、当該無線信号を発信したアクセスポイントの配された店舗等の内部に存在した否かを判定するための学習モデルを生成してよい。解析部240は、上記の学習モデルが、上記のユーザが店舗等の内部に存在したか否かを判定するための基準値を調整してよい。
In this embodiment, the
本実施形態において、格納部242は、管理サーバ160における情報処理において使用される各種の情報を格納する。格納部242は、管理サーバ160における情報処理において生成された各種の情報を格納する。格納部242の詳細は後述される。
In this embodiment, the
本実施形態において、入力データ生成部244は、学習部254における学習モデルの学習処理、又は、判定部260における判定処理において、学習モデルに入力される入力データを生成する。本実施形態において、入力データ生成部244は、情報収集部230が取得した複数のログ情報を、当該複数のログ情報のそれぞれに含まれる端末ID及び時刻情報に基づいて、端末識IDごと、且つ、予め定められた条件を満足する期間ごとに集約することで、1以上の入力データを生成する。
In the present embodiment, the input
1以上の入力データのそれぞれは、(i)複数の無線信号のそれぞれを発信した通信端末を識別するための端末ID、(ii)入力データ生成部244による集約処理の対象となった期間を示す集約期間情報、(iii)複数の無線信号のうち、端末IDにより識別される通信端末が、集約期間情報により示される期間の間に発信した1以上の無線信号に関する1以上の特徴量を示す特徴情報が対応付けられた情報であってよい。1以上の入力データのそれぞれは、集約レコードの一例であってよい。
Each of the one or more pieces of input data indicates (i) a terminal ID for identifying the communication terminal that transmitted each of the plurality of radio signals, and (ii) a period subject to aggregation processing by the input
1以上の特徴量の種類としては、単位期間中の電波強度、単位期間中の滞在期間の長さ、滞在期間中の訪問回数、滞在期間中における電波強度、店舗の属性などが例示される。1以上の特徴量の種類の他の例としては、周波数帯ごとの単位期間中の電波強度、周波数帯ごとの単位期間中の滞在期間の長さ、周波数帯ごとの滞在期間中の訪問回数、周波数帯ごとの滞在期間中における電波強度などが例示される。1以上の特徴量の種類の他の例としては、接続段階ごとの単位期間中の電波強度、接続段階ごとの単位期間中の滞在期間、接続段階ごとの滞在期間内の訪問回数、接続段階ごとの滞在期間中における電波強度などが例示される。 Examples of one or more types of feature values include radio wave intensity during the unit period, length of stay during the unit period, number of visits during the stay period, radio wave intensity during the stay period, store attributes, and the like. Other examples of the types of one or more feature values include radio wave intensity per unit period for each frequency band, length of stay per unit period for each frequency band, number of visits per frequency band during stay period, For example, the radio wave intensity during the stay period for each frequency band is exemplified. Other examples of the types of one or more feature values include the radio field strength during the unit period for each connection stage, the length of stay during the unit period for each connection stage, the number of visits during the stay period for each connection stage, and each connection stage. radio wave intensity during the period of stay in the
滞在期間は、特定の店舗等に配されたアクセスポイントにおいて、予め定められた長さを有する単位期間中に、特定の通信端末からの無線信号であって、電波強度が予め定められた強度よりも大きな無線信号が、最初に検出された時刻と最後に検出された時刻との間の期間であってよい。滞在期間中の訪問回数は、特定の滞在期間中において、上記の特定の通信端末からの無線信号であって、電波強度が予め定められた強度よりも大きな無線信号の検出が継続している期間(継続期間と称される場合がある。)が出現した回数であってよい。 The period of stay shall be defined as a wireless signal from a specific communication terminal, whose radio wave intensity is higher than the predetermined strength, during a unit period having a predetermined length at an access point located at a specific store, etc. may be the period between the time the radio signal is first detected and the time it was last detected. The number of visits during the period of stay is the period during which the radio signal from the above-mentioned specific communication terminal continues to be detected and the radio signal strength is greater than a predetermined strength during the specific period of stay. (sometimes referred to as duration) may be the number of times that appears.
店舗の属性としては、店舗の出店地区、店舗の出店形態、店舗の立地条件、店舗の構造、及び、これらの組み合わせなどが例示される。店舗の出店地区としては、都心、郊外、駅前、ロードサイド、観光地などが例示される。店舗の出店形態としては、商店街、店舗内店舗、単独店舗などが例示される。店舗の立地条件としては、路面店、空中店舗、地下店舗などが例示される。 The attributes of the store are exemplified by the area where the store is opened, the type of store opened, the location conditions of the store, the structure of the store, and combinations thereof. Examples of store opening districts include city centers, suburbs, in front of stations, roadsides, tourist spots, and the like. Examples of the form of opening a store include a shopping street, a store within a store, and a single store. Examples of store location conditions include a street store, an aerial store, and an underground store.
少なくとも1つの特徴量の値は、単一の入力データに集約された複数のログ情報のそれぞれに含まれる信号情報により示される量の統計値であってもよい。統計値としては、最大値、最小値、平均値、中央値などが例示される。上記の統計値は、単位期間における統計値であってもよく、滞在期間における統計値であってもよい。上記の統計値は、継続期間における統計値であってもよい。 At least one feature amount value may be a statistical value of an amount indicated by signal information included in each of a plurality of pieces of log information aggregated into single input data. Examples of statistical values include maximum values, minimum values, average values, and median values. The above statistic value may be a statistic value for a unit period or a statistic value for a length of stay. The above statistic may be a statistic over a period of time.
本実施形態において、入力データ生成部244が生成した入力データの一部は、学習部254における機械学習の訓練データ、検証データ及びテストデータの少なくとも1つとして利用される学習用データセットとなり、入力データ生成部244が生成した入力データのうち、学習用データセットとして利用されなかったデータは、判定部260における判定処理の対象となる判定対象データとなる。より具体的には、データセット生成部252における情報処理によりラベルが付与された入力データは、学習用データセットとなり、データセット生成部252における情報処理によりラベルが付与されなかった入力データは、判定対象データとなる。
In this embodiment, part of the input data generated by the input
本実施形態において、モデル構築部250は、学習モデルを生成する。上記の学習モデルは、予め定められた地理的範囲を有するエリアの内部に配された無線受信装置により受信された無線信号に関する情報を含むデータポイントが入力され、無線信号を発信した無線端末のユーザがエリアの内部に存在していたか否かを判定する。上記の学習モデルは、当該学習モデルに入力されたデータポイントごとに、当該学習モデルの予測又は判定に対する不確実性を推定するために利用される関数の値を算出してよい。上記の学習モデルは、算出された関数の値と、分類用の閾値とに基づいて、ユーザがエリアの内部に存在していたか否かを判定してよい。
In this embodiment, the
本実施形態において、モデル構築部250は、上記の学習モデルの機械学習に用いられる学習用データセットを生成する。本実施形態において、モデル構築部250は、分類用の閾値を調整する。モデル構築部250は、上記の調整の結果、学習済みの学習モデルが、判定部260における判定処理において利用する新たな分類用の閾値を決定する。
In this embodiment, the
本実施形態において、データセット生成部252は、学習部254における機械学習に用いられる学習用データセットを生成する。データセット生成部252は、例えば、情報収集部230が取得したログ情報、及び、入力データ生成部244が生成した入力データの少なくとも一方を利用して、学習用データセットを生成する。
In this embodiment, the data set
一実施形態において、データセット生成部252は、情報収集部230が取得したログ情報の一部に、陽性又は陰性を示すラベルを付与することで、学習用データセットを生成する。データセット生成部252は、生成された学習用データセットを、格納部242に格納してよい。
In one embodiment, the
例えば、データセット生成部252は、収集された1以上の来店確認情報と、収集された1以上のログ情報とを照合して、(i)特定のユーザに関する来店確認情報と、(ii)当該ユーザが利用する通信端末に関するログ情報であって、当該ログ情報により示される受信時刻、及び、上記の来店確認情報により示される来店時刻の差が、予め定められた値と等しい又は当該値よりも小さいログ情報と、を関連付ける。データ解析システム100は、例えば、来店確認情報に関連付けられたログ情報に陽性ラベルを付与することで、学習用データセットを生成する。
For example, the data set
他の実施形態において、データセット生成部252は、入力データ生成部244が生成した入力データの一部に、陽性又は陰性を示すラベルを付与することで、学習用データセットを生成する。データセット生成部252は、生成された学習用データセットを、格納部242に格納してよい。
In another embodiment, the
例えば、データセット生成部252は、収集された1以上の来店確認情報と、1以上の入力データとを照合して、(i)特定のユーザに関する来店確認情報と、(ii)当該ユーザが利用する通信端末に関する入力データであって、当該入力データにより示される受信時刻、及び、上記の来店確認情報により示される来店時刻の差が、予め定められた値と等しい又は当該値よりも小さい入力データと、を関連付ける。データセット生成部252は、例えば、来店確認情報に関連付けられた入力データに陽性ラベルを付与することで、学習用データセットを生成する。
For example, the data set
データセット生成部252は、判定部260における判定処理の対象となる判定対象データを生成してもよい。判定対象データは、1以上のアクセスポイントの少なくとも1つにより受信された複数の無線信号に関する情報を含んでいればよい。
The data
一実施形態において、データセット生成部252は、情報収集部230が取得したログ情報のうち、ラベルが付与されなかったログ情報を、判定対象データとして出力する。他の実施形態において、データセット生成部252は、入力データ生成部244が生成した入力データのうち、ラベルが付与されなかった入力データを、判定対象データとして出力する。データセット生成部252は、生成された判定対象データを、格納部242に格納してよい。
In one embodiment, the data set
[学習用データセットの生成方法の具体例1-1]
本実施形態において、データセット生成部252は、格納部242にアクセスして、複数のログ情報を取得する。複数のログ情報のそれぞれにおいて、(i)複数の無線信号のそれぞれを発信した通信端末を識別するための端末識別情報と、(ii)複数の無線信号のそれぞれが受信された時刻を示す受信時刻情報と、(iii)複数の無線信号のそれぞれの電波に関する信号情報とが対応付けられていてよい。
[Specific example 1-1 of method for generating learning data set]
In this embodiment, the data set
データセット生成部252は、格納部242にアクセスして、複数の来店確認情報を取得する。複数の来店確認情報のそれぞれにおいて、(i)特定の行動に関与した1以上のユーザのそれぞれを識別するためのユーザ識別情報と、(ii)特定の行動がなされた時刻を示す行動時刻情報とが対応付けられていてよい。より具体的には、複数の来店確認情報のそれぞれは、ユーザのユーザ識別情報と、ユーザの来店時刻を示す情報(来店時刻情報と称される場合がある。)とが対応付けられた情報であってよい。来店時刻情報は、行動時刻情報の一例であってよい。
The data
データセット生成部252は、(i)複数のログ情報のそれぞれに含まれる端末識別情報及び受信時刻情報、並びに、(ii)複数の来店確認情報のそれぞれに含まれるユーザ識別情報及び来店時刻情報に基づいて、複数のログ情報及び複数の来店確認情報を照合し、複数のログ情報のうち少なくとも一部のログ情報のそれぞれに含まれる端末識別情報と、当該少なくとも一部のログ情報のそれぞれに含まれる信号情報により示される電波に関する情報と、陽性ラベルとを対応付けることで、学習用データセットを生成する。これにより、複数のログ情報の少なくとも一部に陽性ラベルの付与された学習用データセットが生成される。
The data
より具体的には、データセット生成部252は、まず、特定のログ情報に含まれる端末識別情報及び受信時刻情報を照合用のキーとして用いて、複数の来店確認情報の中から、(i)当該来店確認情報に含まれるユーザ識別情報により示されるユーザが、当該特定のログ情報に含まれる端末識別情報により示される通信端末のユーザに合致し、且つ、(ii)当該来店確認情報に含まれる来店時刻情報により示される時刻が、当該特定のログ情報に含まれる受信時刻情報により示される時刻に合致する来店確認情報を抽出する。
More specifically, the data set
次に、データセット生成部252は、抽出された来店確認情報と、上記の特定のログ情報とを関連付ける。次に、データセット生成部252は、例えば、来店確認情報に関連付けられたログ情報に陽性ラベルを付与することで、学習用データセットを生成する。データセット生成部252は、複数のログ情報のそれぞれについて、上記の処理を実行してよい。特定のログ情報は、少なくとも一部のレコードの一例であってよい。
Next, the
一実施形態において、複数の来店確認情報の少なくとも一部に含まれるユーザ識別情報が、当該ユーザ識別情報により識別されるユーザが利用する通信端末の端末識別情報である場合、データセット生成部252は、特定の端末識別情報を含む来店確認情報と、(ii)当該特定の端末識別情報を含むログ情報であって、当該ログ情報に含まれる受信時刻情報により示される受信時刻と、上記の来店確認情報に含まれる来店時刻情報により示される来店時刻の差が予め定められた値と等しい又は当該値よりも小さいログ情報とを関連付ける。データセット生成部252は、例えば、来店確認情報に関連付けられたログ情報に、陽性ラベルを付与することで、学習用データセットを生成する。
In one embodiment, when the user identification information included in at least a part of the plurality of store visit confirmation information is the terminal identification information of the communication terminal used by the user identified by the user identification information, the data set
他の実施形態において、複数の来店確認情報の少なくとも一部に含まれるユーザ識別情報が、当該ユーザ識別情報により識別されるユーザが利用する通信端末の端末識別情報でない場合、データセット生成部252は、格納部242にアクセスして、当該ユーザ識別情報に関する対応関係情報を取得する。対応関係情報は、ユーザ識別情報と、当該ユーザ識別情報により識別されるユーザが利用する通信端末の端末識別情報との対応関係を示す情報であってよい。
In another embodiment, when the user identification information included in at least a part of the plurality of store visit confirmation information is not the terminal identification information of the communication terminal used by the user identified by the user identification information, the data set
データセット生成部252は、対応関係情報を参照して、(i)複数のログ情報のそれぞれに含まれる端末識別情報及び受信時刻情報、並びに、(ii)複数の来店確認情報のそれぞれに含まれるユーザ識別情報及び来店時刻情報に基づいて、複数のログ情報及び複数の来店確認情報を照合し、複数のログ情報の少なくとも一部と、複数の来店確認情報の少なくとも一部とを関連付ける。データセット生成部252は、例えば、来店確認情報に関連付けられたログ情報に、陽性ラベルを付与することで、学習用データセットを生成する。
The data
より具体的には、複数のログ情報の少なくとも一部と、複数の来店確認情報の少なくとも一部とを関連付ける手順において、データセット生成部252は、上述のとおり、まず、特定のログ情報に含まれる端末識別情報及び受信時刻情報を照合用のキーとして用いて、複数の来店確認情報の中から、上述された条件に合致する来店確認情報を抽出する。次に、データセット生成部252は、抽出された来店確認情報と、上記の特定のログ情報とを関連付ける。
More specifically, in the procedure for associating at least a portion of a plurality of pieces of log information with at least a portion of a plurality of pieces of store-visit confirmation information, the data set
本実施形態によれば、複数の来店確認情報の中から、上述された条件に合致する来店確認情報が抽出される手順において、データセット生成部252は、対応関係情報を利用して、特定の来店確認情報に含まれるユーザ識別情報により示されるユーザが、特定のログ情報に含まれる端末識別情報により示される通信端末のユーザに合致するか否かを判定する。一実施形態において、データセット生成部252は、対応関係情報を利用して、ログ情報に含まれる端末識別情報を、対応するユーザ識別情報に変換する。これにより、データセット生成部252は、ユーザ識別情報をキーとして、ログ情報及び来店確認情報が、同一のユーザ又は通信端末に関する情報であるか否かを判定することができる。他の実施形態において、データセット生成部252は、対応関係情報を利用して、来店確認情報に含まれるユーザ識別情報を、対応する端末識別情報に変換する。これにより、データセット生成部252は、端末識別情報をキーとして、ログ情報及び来店確認情報が、同一のユーザ又は通信端末に関する情報であるか否かを判定することができる。
According to the present embodiment, in the procedure for extracting store-visit confirmation information that matches the above-described conditions from among a plurality of store-visit confirmation information, the data set
なお、上記の各実施形態において、来店時刻情報により示される来店時刻と、受信時刻情報により示される受信時刻との差が、予め定められた値に等しい又は当該値よりも小さい場合、来店時刻情報により示される来店時刻が、受信時刻情報により示される受信時刻に合致すると判定されてよい。また、上記の来店時刻及び受信時刻の差に関する予め定められた値は、特定の種類の無線信号の送信間隔のn倍であってもよい。nは、1以上の整数であってよく、2以上の整数であってもよく、3以上の整数であってもよく、4以上の整数であってもよく、5以上の整数であってもよく、10以上の整数であってもよい。nは、50以下の整数であってよく、30以下の整数であってもよく、20以下の整数であってもよく、10以下の整数であってもよく、5以下の整数であってもよく、3以下の整数であってもよい。特定の種類の無線信号としては、プローブ要求、位置登録要求などの各種の通信制御信号が例示される。 In each of the above embodiments, when the difference between the arrival time indicated by the arrival time information and the reception time indicated by the reception time information is equal to or smaller than a predetermined value, the arrival time information may be determined to match the reception time indicated by the reception time information. Also, the predetermined value regarding the difference between the visit time and the reception time may be n times the transmission interval of the specific type of radio signal. n may be an integer of 1 or more, an integer of 2 or more, an integer of 3 or more, an integer of 4 or more, or an integer of 5 or more It may be an integer of 10 or more. n may be an integer of 50 or less, an integer of 30 or less, an integer of 20 or less, an integer of 10 or less, or an integer of 5 or less. It may be an integer of 3 or less. Specific types of radio signals are exemplified by various communication control signals such as probe requests and location registration requests.
[学習用データセットの生成方法の具体例1-2]
本実施形態において、データセット生成部252は、格納部242にアクセスして、1以上の入力データを取得する。1以上の入力データのそれぞれにおいて、(i)集約処理の対象となる無線信号を発信した通信端末の端末識別情報、(ii)集約処理の対象となった期間を示す集約期間情報、(iii)集約処理の対象となる無線信号に関する1以上の特徴量を示す特徴情報が対応付けられていてよい。
[Specific example 1-2 of method for generating learning data set]
In this embodiment, the
入力データに含まれる端末識別情報は、レコードに含まれる端末識別情報の一例であってよい。入力データに含まれる集約期間情報は、受信時刻情報に基づく情報の一例であってよい。入力データに含まれる特徴情報は、信号情報により示される電波に関する情報の一例であってよい。 The terminal identification information included in the input data may be an example of the terminal identification information included in the record. Aggregation period information included in the input data may be an example of information based on reception time information. The feature information included in the input data may be an example of information about radio waves indicated by the signal information.
データセット生成部252は、格納部242にアクセスして、1以上の来店確認情報を取得する。1以上の来店確認情報のそれぞれにおいて、(i)特定の行動に関与した1以上のユーザのそれぞれを識別するためのユーザ識別情報と、(ii)特定の行動がなされた時刻を示す行動時刻情報とが対応付けられていてよい。より具体的には、1以上の来店確認情報のそれぞれは、ユーザのユーザ識別情報と、ユーザの来店時刻を示す来店時刻情報とが対応付けられた情報であってよい。
The data
データセット生成部252は、上述された具体例と同様の手順により、(i)1以上の入力データのそれぞれに含まれる端末識別情報及び集約期間情報、並びに、(ii)複数の来店確認情報のそれぞれに含まれるユーザ識別情報及び来店時刻情報に基づいて、1以上の入力データ及び複数の来店確認情報を照合し、1以上の入力データのうち少なくとも一部の入力データのそれぞれに含まれる端末識別情報と、当該少なくとも一部の入力データのそれぞれに含まれる特徴情報により示される特徴量に関する情報と、陽性ラベルとを対応付けることで、学習用データセットを生成する。これにより、1以上の入力データの少なくとも一部に陽性ラベルの付与された学習用データセットが生成される。
The data
より具体的には、データセット生成部252は、まず、特定の入力データに含まれる端末識別情報及び集約期間情報を照合用のキーとして用いて、複数の来店確認情報の中から、(i)当該来店確認情報に含まれるユーザ識別情報により示されるユーザが、当該特定の入力データに含まれる端末識別情報により示される通信端末のユーザに合致し、且つ、(ii)当該来店確認情報に含まれる来店時刻情報により示される時刻が、当該特定の入力データに含まれる集約期間情報により示される期間に含まれる来店確認情報を抽出する。
More specifically, the data set
次に、データセット生成部252は、抽出された来店確認情報と、上記の特定の入力データとを関連付ける。次に、データセット生成部252は、例えば、来店確認情報に関連付けられた入力データに陽性ラベルを付与することで、学習用データセットを生成する。データセット生成部252は、1以上の入力データのそれぞれについて、上記の処理を実行してよい。
Next, the
[学習用データセットの生成方法の具体例2-1]
本実施形態において、データセット生成部252は、格納部242にアクセスして、複数のログ情報を取得する。複数のログ情報のそれぞれにおいて、(i)複数の無線信号のそれぞれを発信した通信端末を識別するための端末識別情報と、(ii)複数の無線信号のそれぞれが受信された時刻を示す受信時刻情報と、(iii)複数の無線信号のそれぞれが受信された位置を示す受信位置情報と、(iv)複数の無線信号のそれぞれの電波に関する信号情報とが対応付けられていてよい。
[Specific example 2-1 of method for generating learning data set]
In this embodiment, the data set
データセット生成部252は、格納部242にアクセスして、複数のログ情報のそれぞれに含まれる受信位置情報により示される位置に配された店舗の進入制限情報を取得する。1以上の進入制限情報のそれぞれにおいて、(i)1以上の店舗のそれぞれを識別するための店舗IDと、(ii)店舗IDにより識別される店舗への進入が制限されている時間帯を示す情報とが対応付けられていてよい。店舗IDは、エリア識別情報の一例であってよい。
The data
データセット生成部252は、複数のログ情報のそれぞれに含まれる受信位置情報と、取得された進入制限情報に含まれる店舗IDとに基づいて、複数のログ情報及び1以上の進入制限情報を照合し、複数のログ情報のそれぞれに含まれる受信位置情報により示される位置に対応する進入制限情報を抽出する。データセット生成部252は、例えば、対応する進入制限情報が抽出されたログ情報に、陰性ラベルを付与する。陰性ラベルは、無線信号を発信した通信端末のユーザが、当該無線信号を受信したアクセスポイントの配された店舗等の内部に存在していなかったことを示す。これにより、複数のログ情報のうち少なくとも一部のログ情報のそれぞれに含まれる端末識別情報と、少なくとも一部のログ情報のそれぞれに含まれる信号情報により示される電波に関する情報と、陰性ラベルとが対応付けられた学習用データセットが生成される。
[学習用データセットの生成方法の具体例2-2]
本実施形態において、データセット生成部252は、格納部242にアクセスして、1以上の入力データを取得する。1以上の入力データのそれぞれにおいて、(i)集約処理の対象となる1以上の無線信号を発信した通信端末の端末ID、(ii)集約処理の対象となる無線信号を受信したアクセスポイントが配された店舗の店舗ID、(iii)集約処理の対象となった期間を示す集約期間情報、(iv)集約処理の対象となる無線信号に関する1以上の特徴量を示す特徴情報が対応付けられていてよい。
The data
[Specific example 2-2 of method for generating learning data set]
In this embodiment, the
データセット生成部252は、格納部242にアクセスして、1以上の入力データのそれぞれに含まれる店舗IDにより示される店舗の進入制限情報を取得する。1以上の進入制限情報のそれぞれにおいて、(i)店舗IDと、(ii)店舗IDにより識別される店舗への進入が制限されている時間帯を示す情報とが対応付けられていてよい。
The data
データセット生成部252は、1以上の入力データのそれぞれに含まれる店舗IDと、格納部242に格納された進入制限情報に含まれる店舗IDとに基づいて、複数のログ情報及び1以上の進入制限情報を照合し、1以上の入力データのそれぞれに対応する進入制限情報を抽出する。データセット生成部252は、例えば、対応する進入制限情報が抽出された入力データに、陰性ラベルを付与する。これにより、複数のログ情報のうち少なくとも一部のログ情報のそれぞれに含まれる端末識別情報と、少なくとも一部のログ情報のそれぞれに含まれる信号情報により示される電波に関する情報と、陰性ラベルとが対応付けられた学習用データセットが生成される。
The data
本実施形態において、学習部254は、機械学習により、学習モデルを生成する。上記の学習モデルは、例えば、特定の店舗の内部に配されたアクセスポイントにより受信された無線信号に関する情報を含むデータポイントが入力され、当該無線信号を発信した通信端末のユーザが当該特定の店舗の内部に存在していたか否かを判定するために用いられる。学習部254は、店舗ごとに異なる学習モデルを生成してもよく、複数の店舗に共通の学習モデルを生成してもよい。学習部254は、アクセスポイントごとに異なる学習モデルを生成してもよく、複数のアクセスポイントに共通の学習モデルを生成してもよい。
In this embodiment, the
例えば、学習部254は、格納部242にアクセスして、データセット生成部252が生成した学習用データセットを取得する。上述のとおり、各学習モデルにおいては、分類用の閾値として、当該学習モデルに応じた適切な初期値が設定されている。そこで、学習部254は、まず、上記の初期値を分類用の閾値として利用し、且つ、上記の学習用データセットを利用して機械学習を実行することにより、学習済みの学習モデルを生成する。
For example, the
学習部254は、交差検証を実行して、生成された学習モデルの汎化性能を評価してよい。学習部254は、交差検証用いたグリッドサーチを実行して、学習モデルのハイパーパラメータを決定してよい。
The
学習部254は、データセット生成部252が生成した学習用データセットを、訓練データと、テストデータとに分割してよい。学習部254は、データセット生成部252が生成した学習用データセットを、訓練データと、検証データと、テストデータとに分割してよい。学習部254は、検証データを、学習モデルに含まれるパラメータを決定するための検証に用いられる検証データと、分類用の閾値を調整するための検証に用いられる検証データとに分割してもよい。分類用の閾値を調整するための検証に用いられる検証データは、例えば、閾値調整部256により利用される。
The
本実施形態において、閾値調整部256は、学習部254により生成された学習モデルのための分類用の閾値を調整する。例えば、閾値調整部256は、分類用の閾値として初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなる値を、調整後の閾値として決定する。
In this embodiment, the
例えば、閾値調整部256は、まず、学習部254により生成された学習モデルの受信者動作特性カーブ(ROCカーブ)を示すデータを算出する。閾値調整部256は、例えば、データセット生成部252が生成した学習用データセットのうち、学習部254における機械学習に利用されなかったデータセットを利用して、分類用の閾値を少しずつ変化させながら、学習モデルの真陽性率及び偽陽性率を算出する。これにより、ROCカーブを示すデータが算出される。次に、閾値調整部256は、ROCカーブ上のポイントであって、分類用の閾値として初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなるポイントに対応する閾値を、調整後の閾値として決定する。
For example, the
本実施形態において、判定部260は、学習部254が生成した学習モデルと、閾値調整部256が決定した調整後の閾値とを用いて、判定対象データを判定する。例えば、判定部260は、格納部242にアクセスして、データセット生成部252が生成した判定対象データを取得する。判定部260は、判定対象データを、学習部254が生成した学習モデルに入力する。学習部学習部254は、閾値調整部256が決定した調整後の閾値を利用して、判定対象データに含まれる端末IDにより示される通信端末のユーザが、判定対象データに含まれる店舗IDにより示される店舗の内部に存在していたか否かを判定する。判定部260は、判定結果を示す出力データを格納部242に格納してよい。
In the present embodiment, the
本実施形態において、来店人数推定部270は、例えば、通信端末108からの要求に応じて、特定の期間に特定の店舗に来店した顧客の人数を推定する。来店人数推定部270は、例えば、格納部242に格納された出力データに基づいて、特定の期間に特定の店舗に存在した通信端末のユーザの人数を算出する。来店人数推定部270は、例えば、算出された通信端末のユーザの人数に、適切な係数を乗ずることで、特定の期間に特定の店舗に来店した顧客の人数を推定する。上述のとおり、管理サーバ160は、来店人数推定部270に代えて、又は、来店人数推定部270とともに、通信端末108からの要求に応じて、特定の期間に特定の店舗の外を通行する通行人の人数を推定する通行人数推定部(図示されていない。)を備えてもよい。
In this embodiment, the visitor
図3は、格納部242の内部構成の一例を概略的に示す。AP情報格納部322と、店舗情報格納部324と、対応情報格納部326と、ログ情報格納部332と、来店情報格納部334と、入力データ格納部342と、データセット格納部352と、対象データ格納部354と、出力データ格納部362と、モデル情報格納部372とを備える。
FIG. 3 schematically shows an example of the internal configuration of the
本実施形態において、AP情報格納部322は、1以上のアクセスポイントのそれぞれに関する情報を格納する。AP情報格納部322は、例えば、各アクセスポイントの識別情報と、各アクセスポイントが配された店舗の識別情報とを対応づけて格納する。各アクセスポイントの識別情報としては、管理サーバ160が各アクセスポイントに割り当てた識別情報(APIDと称される場合がある)、各アクセスポイントのMACアドレスなどが例示される。
In this embodiment, the AP
本実施形態において、店舗情報格納部324は、1以上の店舗のそれぞれに関する情報を格納する。店舗情報格納部324は、例えば、各店舗の識別情報と、各店舗の位置情報と、各店舗の属性を示す情報と、各店舗の進入制限情報とを対応づけて格納する。各店舗の識別情報としては、管理サーバ160が各店舗に割り当てた識別情報(店舗IDと称される場合がある)、各店舗の名称、各店舗の住所などが例示される。
In this embodiment, the shop
本実施形態において、対応情報格納部326は、1以上の対応関係情報を格納する。本実施形態において、ログ情報格納部332は、1以上のログ情報を格納する。本実施形態において、来店情報格納部334は、1以上の来店確認情報を格納する。本実施形態において、入力データ格納部342は、1以上の入力データを格納する。本実施形態において、データセット格納部352は、1以上の学習用データセットを格納する。データセット格納部352は、店舗ごとの学習用データセットを格納してもよい。データセット格納部352は、アクセスポイントごとの学習用データセットを格納してもよい。
In this embodiment, the correspondence
本実施形態において、対象データ格納部354は、1以上の判定対象データを格納する。本実施形態において、出力データ格納部362は、1以上の出力データを格納する。本実施形態において、モデル情報格納部372は、1以上の学習モデルのそれぞれに関する情報を格納する。モデル情報格納部372は、店舗ごとの学習モデルに関する情報を格納してよい。モデル情報格納部372は、アクセスポイントごとの学習モデルに関する情報を格納してもよい。学習モデルに関する情報は、例えば、推論モデルのプログラムと、推論モデルのパラメータの値を示す情報と、閾値調整部256により決定された調整後の閾値を示す情報とを含む。
In this embodiment, the target
図4は、入力データ生成部244における情報処理の一例を概略的に示す。図4を用いて、特定の単位期間においてアクセスポイント122が受信した無線信号のうち、通信端末102が発信した無線信号に関する複数のログ情報を、単一の入力データに集約する場合を例として、入力データ生成部244における集約処理の一例が説明される。図4において、三角形のマークは、アクセスポイント122において、通信端末102が発信した無線信号であって、電波強度が予め定められた強度よりも大きな無線信号が受信されたタイミングを示す。
FIG. 4 schematically shows an example of information processing in the
図4に示されるとおり、特定の単位期間において通信端末102が発信した無線信号のうち、アクセスポイント122において検出された無線信号に関するn個のログ情報は、グループ422と、グループ424とに分類され得る。nは、2以上の整数であってよい。例えば、グループ422には、ma個のログ情報が含まれる。また、グループ424には、mb個のログ情報が含まれる。maは、1以上の整数であってもよく、2以上の整数であってもよい。mbは、1以上の整数であってよく、2以上の整数であってもよい。なお、単位期間に含まれるグループの数は、滞在期間内の訪問回数を示す。
As shown in FIG. 4, among the radio signals transmitted by
例えば、入力データ生成部244は、特定の単位期間に、アクセスポイント122において検出された無線信号に関する複数のログ情報を、各ログ情報により示される受信時刻をキーとしてソートする。時間的に隣接する2つのログ情報の受信時刻の差が予め定められた値と等しい又は当該値よりも小さい場合、入力データ生成部244は、当該2つのログ情報は同一のグループに属すると判断する。一方、時間的に隣接する2つのログ情報の受信時刻の差が予め定められた値よりも大きい又は当該値と等しい場合、入力データ生成部244は、当該2つのログ情報は異なるグループに属すると判断する。
For example, the input
グループ422に含まれるma個のログ情報を、各ログ情報により示される受信時刻に従って並べた場合に、時間的に隣接する2つのログ情報の受信時刻の差ΔTaは、上記の予め定められた値と等しい又は当該値よりも小さい。同様に、グループ424に含まれるmb個のログ情報を、各ログ情報により示される受信時刻に従って並べた場合に、時間的に隣接する2つのログ情報の受信時刻の差ΔTbは、上記の予め定められた値と等しい又は当該値よりも小さい。一方、グループ422に含まれるログ情報のうち最後に検出されたログ情報により示される受信時刻と、グループ424に含まれるログ情報のうち最初に検出されたログ情報により示される受信時刻との差ΔTabは、上記の予め定められた値より大きい又は当該値に等しい。 When the ma pieces of log information included in the group 422 are arranged according to the reception time indicated by each piece of log information, the difference ΔTa between the reception times of two pieces of log information temporally adjacent to each other is the above predetermined value. equal to or less than that value. Similarly, when mb pieces of log information included in group 424 are arranged according to the reception time indicated by each piece of log information, the difference ΔTb between the reception times of two temporally adjacent pieces of log information is the above predetermined is equal to or less than the specified value. On the other hand, the difference ΔTab between the reception time indicated by the last log information detected among the log information included in the group 422 and the reception time indicated by the first detected log information among the log information included in the group 424 is greater than or equal to the above predetermined value.
例えば、入力データ生成部244は、n個のログ情報の一部を集約して、1個以上n-1個以下の入力データを生成する。入力データ生成部244は、生成された1以上の入力データを、格納部242に格納してよい。一実施形態において、入力データ生成部244は、単位期間ごとに、複数のログ情報を単一の入力データに集約する。他の実施形態において、入力データ生成部244は、継続期間ごとに(即ち、グループごとに)、複数のログ情報を単一の入力データに集約する。
For example, the input
より具体的には、入力データ生成部244は、まず、収集された複数のログ情報を、各ログ情報により示される通信端末ごとに分類する。これにより、例えば、特定の単位期間内に通信端末102が発信した無線信号に関する、n個のログ情報が得られる。
More specifically, the
次に、入力データ生成部244は、通信端末ごとに分類されたログ情報を、各ログ情報の受信時刻情報により示される受信時刻に基づいて、任意の期間ごとに集約する。任意の期間としては、単位期間、継続期間などが例示される。
Next, the input
例えば、入力データ生成部244は、各期間中に検出された1以上のログ情報に含まれる信号情報により示される無線信号の電波に関する各種の物理量に対して、任意の統計処理を実施することにより、各期間中に検出された1以上のログ情報の特徴量を算出する。入力データ生成部244は、各期間中に検出された1以上のログ情報に含まれる信号情報により示される無線信号の電波に関する各種の物理量の代表値を、各期間中に検出された1以上のログ情報の特徴量としてもよい。
For example, the input
入力データ生成部244は、例えば、各期間中に検出された1以上のログ情報に関する通信端末の端末識別情報と、集約処理の対象となる期間を示す情報と、上記の特徴量とを対応付けて、入力データを生成する。これにより、各期間中に検出された1以上のログ情報が、単一の入力データに集約される。
The input
図5は、データセット生成部252の内部構成の一例を概略的に示す。本実施形態において、データセット生成部252は、ラベル付与部552と、データセット出力部554と、対象データ出力部556とを備える。
FIG. 5 schematically shows an example of the internal configuration of the
本実施形態において、ラベル付与部552は、情報収集部230が取得したログ情報の一部に、陽性又は陰性を示すラベルを付与する。ラベル付与部552は、入力データ生成部244が生成した入力データの一部に、陽性又は陰性を示すラベルを付与してもよい。ログ情報又は入力データの一部にラベルが付与される手順の詳細は、上述のとおりであってよい。
In this embodiment, the
本実施形態において、データセット出力部554は、ラベル付与部552によりラベルが付与されたログ情報又は入力データを、学習用データセットとして出力する。データセット出力部554は、学習用データセットを、データセット格納部352に格納してよい。
In this embodiment, the
本実施形態において、対象データ出力部556は、ラベル付与部552によりラベルが付与されなかったログ情報又は入力データを、判定対象データとして出力する。対象データ出力部556は、判定対象データを、対象データ格納部354に格納してよい。
In this embodiment, the target
図6は、学習部254の内部構成の一例を概略的に示す。本実施形態において、学習部254は、クラス分類器652と、クラス分類器654と、初期設定格納部656とを備える。
FIG. 6 schematically shows an example of the internal configuration of the
本実施形態において、クラス分類器652は店舗12用の学習モデルであり、クラス分類器654は店舗14用の学習モデルである。本実施形態において、初期設定格納部656は、クラス分類器652及びクラス分類器654の機械学習における初期設定を格納する。初期設定格納部656は、初期設定として、各クラス分類器の分類用の閾値の初期値に関する情報を格納してよい。学習部254は、初期設定格納部656に格納された初期設定と、データセット格納部352に格納された学習用データセットとを利用して、クラス分類器652及びクラス分類器654の機械学習を実行する。
In this embodiment,
クラス分類器652及びクラス分類器654が、判定結果に関する分類確率を算出し、当該分類確率及び分類用の閾値を比較して、ユーザが店舗等の内部に存在していたか否かを判定する場合、分類用の閾値の初期値は0.5である。クラス分類器652及びクラス分類器654が、判定結果に関する決定関数を算出し、当該決定関数及び分類用の閾値を比較して、ユーザが店舗等の内部に存在していたか否かを判定する場合、分類用の閾値の初期値は0である。
When the
図7は、閾値調整部256の内部構成の一例を概略的に示す。本実施形態において、閾値調整部256は、ROCカーブ算出部752と、AUCスコア算出部754と、作動ポイント決定部756と、調整値決定部758とを備える。
FIG. 7 schematically shows an example of the internal configuration of the
本実施形態において、ROCカーブ算出部752は、学習部254により生成された学習モデルの受信者動作特性カーブ(ROCカーブ)を示すデータを算出する。ROCカーブを示すデータを算出する手順は上述のとおりであってよい。本実施形態において、AUCスコア算出部754は、ROCカーブの下の領域(AUC)の面積を示すAUCスコアを算出する。
In this embodiment, the
本実施形態において、作動ポイント決定部756と、ROCカーブ上のポイントであって、分類用の閾値として初期値が利用された場合と比較して、学習モデルの判定結果の真陽性率が大きくなるポイントを、学習モデルの作動ポイントとして決定する。作動ポイントを決定する手順の詳細は後述される。
In this embodiment, the true positive rate of the determination result of the learning model increases compared to the case where the operating
本実施形態において、調整値決定部758は、調整後の閾値として利用される値を決定する。調整値決定部758は、作動ポイント決定部756が決定した作動ポイントに対応する閾値を、調整後の閾値として決定してよい。
In this embodiment, the adjustment
図8は、閾値調整部256における情報処理の一例を概略的に示す。図8は、作動ポイント決定部756が作動ポイントを決定する処理の一例を概略的に示す。図8において、ROCカーブ820は、来店確認情報に基づいて生成された学習用データセットを利用して学習した学習モデルのROCカーブを示す。ポイント832は、分類用の閾値として初期値が利用された場合における、真陽性率及び偽陽性率を示す。ポイント834は、(i)ROCカーブ820と、(ii)真陽性率が1であり偽陽性率が0であるポイント(ベストポイントと称される場合がある。)、及び、真陽性率が0であり偽陽性率が1であるポイントを結ぶ直線840との交点を示す。
FIG. 8 schematically shows an example of information processing in the
本実施形態において、作動ポイント決定部756は、ポイント834を作動ポイントとして決定する。ここで、来店確認情報に基づいて生成された学習用データセットを利用して学習処理が実行された場合、学習済みの学習モデルは、例えば、「店舗12に来店し、来店確認機器142により来店が確認されたユーザに関するデータポイント」を陽性に分類し、「店舗12に来店したものの、来店確認機器142により来店が確認されていないユーザに関するデータポイント」及び「店舗12に来店していないユーザに関するデータポイント」を陰性に分類するように調整される。
In this embodiment,
そのため、作動ポイントにおいては、分類用の閾値として初期値が利用された場合と比較して、「店舗12に来店し、来店確認機器142により来店が確認されたユーザに関するデータポイント」を陽性とし、「店舗12に来店したものの、来店確認機器142により来店が確認されていないユーザに関するデータポイント」及び「店舗12に来店していないユーザに関するデータポイント」を陰性とした場合の真陽性率が大きくなる。また、分類用の閾値として初期値が利用された場合と比較して、「店舗12に来店し、来店確認機器142により来店が確認されたユーザに関するデータポイント」を陽性とし、「店舗12に来店したものの、来店確認機器142により来店が確認されていないユーザに関するデータポイント」及び「店舗12に来店していないユーザに関するデータポイント」を陰性とした場合の偽陽性率が大きくなる。
Therefore, in the operation points, compared with the case where the initial value is used as the threshold for classification, "the data point related to the user who visited the store 12 and was confirmed by the store
しかしながら、判定部260においては、例えば、「店舗12の内部に存在するユーザに関するデータポイント」を陽性とし、「店舗12の内部に存在しないユーザに関するデータポイント」を陰性として、学習モデルを利用した判定処理が実行される。つまり、判定部260においては、例えば、「店舗12に来店し、来店確認機器142により来店が確認されたユーザに関するデータポイント」及び「店舗12に来店したものの、来店確認機器142により来店が確認されていないユーザに関するデータポイント」を陽性とし、「店舗12に来店していないユーザに関するデータポイント」を陰性として、学習モデルを利用した判定処理が実行される。
However, in the
ここで、「店舗12に来店したものの、来店確認機器142により来店が確認されていないユーザ」の挙動は、「店舗12に来店していないユーザ」の挙動よりも、「店舗12に来店し、来店確認機器142により来店が確認されたユーザ」の挙動に類似する可能性が高い。そのため、作動ポイント決定部756が決定した作動ポイントに対応する閾値が、判定部260における分類用の閾値として利用されることで、分類用の閾値として初期値が利用された場合と比較して、「店舗12の内部に存在するユーザに関するデータポイント」を陽性とし、「店舗12の内部に存在しないユーザに関するデータポイント」を陰性とした場合の真陽性率が大きくなることが期待される。また、分類用の閾値として初期値が利用された場合と比較して、「店舗12の内部に存在するユーザに関するデータポイント」を陽性とし、「店舗12の内部に存在しないユーザに関するデータポイント」を陰性とした場合の偽陽性率が小さくなることが期待される。
Here, the behavior of "a user who has visited the store 12 but whose visit has not been confirmed by the store
なお、作動ポイントを決定する方法は本実施形態に限定されない。他の実施形態において、作動ポイント決定部756は、ベストポイントと、ROCカーブ820上の各ポイントとの距離を算出する。作動ポイント決定部756は、上記の距離が最短となるポイントを、作動ポイントとして決定する。
Note that the method of determining the actuation point is not limited to this embodiment. In another embodiment,
図9~図20を用いて、管理サーバ160における情報処理の具体例が説明される。図9~図17は、格納部242に格納される各種のデータテーブルの一例を概略的に示す。図18は、解析部240における情報処理の一例を概略的に示す。具体的には、図9は、解析部240における学習用データセットの生成処理、学習モデルの生成処理、及び、分類用の閾値の調整処理の一例を概略的に示す。図19は、解析部240における情報処理の一例を概略的に示す。図19は、解析部240における判定処理の一例を概略的に示す。図20は、判定結果が記録されたデータテーブル1800の一例を概略的に示す。
A specific example of information processing in the
図9は、データテーブル900の一例を概略的に示す。データテーブル900は、AP情報格納部322に格納されるデータベースの一例であってよい。データテーブル900の各行は、各アクセスポイントに関する情報の一例であってよい。本実施形態において、データテーブル900は、各アクセスポイントのAPID922と、各アクセスポイントのMACアドレスを示す情報924と、各アクセスポイントが配される店舗の店舗ID926とを対応付けて格納する。APID922と、MACアドレスを示す情報924及び店舗ID926は、アクセスポイントの識別情報の一例であってよい。
FIG. 9 schematically shows an example of a data table 900. As shown in FIG. The data table 900 may be an example of a database stored in the AP
図10は、データテーブル1000の一例を概略的に示す。データテーブル1000は、店舗情報格納部324に格納されるデータベースの一例であってよい。データテーブル1000の各行は、各店舗に関する情報の一例であってよい。本実施形態において、データテーブル1000は、各店舗の店舗ID1022と、各店舗の店舗名称1024と、各店舗の店舗タイプ1026と、各店舗の位置情報1028と、各店舗の営業時間を示す情報1030とを対応付けて格納する。店舗タイプ1026に記録される項目としては、例えば、店舗内店舗、市街地の単独店舗又は商店街中の店舗、ロードサイドの単独店舗などが例示される。店舗タイプ1026は、店舗の属性の一例であってよい。営業時間を示す情報1030は、進入制限情報の一例であってよい。
FIG. 10 schematically shows an example of the data table 1000. As shown in FIG. Data table 1000 may be an example of a database stored in store
図11は、データテーブル1100の一例を概略的に示す。データテーブル1100は、対応情報格納部326に格納されるデータベースの一例であってよい。データテーブル1100の各行は、対応関係情報の一例であってよい。本実施形態において、データテーブル1100は、各通信端末の端末ID1122と、各通信端末のユーザのユーザID1124とを対応付けて格納する。ユーザID1124としては、クレジットカードのカード番号、ポイント付与サービスの会員番号、SNSのアカウントなどが例示される。
FIG. 11 schematically shows an example of a data table 1100. As shown in FIG. The data table 1100 may be an example of a database stored in the correspondence
図12は、データテーブル1200の一例を概略的に示す。データテーブル1200は、ログ情報格納部332に格納されるデータベースの一例であってよい。データテーブル1200の各行は、ログ情報の一例であってよい。本実施形態において、データテーブル1200は、無線信号を受信したアクセスポイントのAPID1222と、無線信号の受信時刻を示す情報1224と、無線信号を発信した通信端末の端末ID1226と、無線信号の電波に関する情報1228とを対応付けて格納する。無線信号の電波に関する情報1228としては、電波強度を示す情報、周波数帯を示す情報、接続段階を示す情報などが例示される。電波強度は、例えば、RSSIにより表される。
FIG. 12 schematically shows an example of a data table 1200. As shown in FIG. The data table 1200 may be an example of a database stored in the log
図13は、データテーブル1300の一例を概略的に示す。データテーブル1300は、例えば、来店情報格納部334に格納されるデータベースの一例であってよい。データテーブル1300の各行は、来店確認情報の一例であってよい。本実施形態において、データテーブル1300は、ユーザのユーザID1322と、ユーザの行動が確認された場所の位置情報1324と、ユーザの行動が確認された時刻を示す情報1326とを対応付けて格納する。ユーザID1322は、ユーザIDの種類を示す情報と、ユーザIDの詳細を示す情報とを含んでよい。ユーザIDの詳細は、クレジットカードのカード番号、ポイント付与サービスの会員番号、ユーザの氏名、ユーザが利用する通信端末のMACアドレスなどの具体的な数列又は文字列であってよい。ユーザの行動が確認された場所の位置情報1324としては、ユーザの行動が確認された場所の名称、当該場所の住所、当該場所の位置座標などが例示される。
FIG. 13 schematically shows an example of a data table 1300. As shown in FIG. The data table 1300 may be an example of a database stored in the visit
図14は、データテーブル1400の一例を概略的に示す。データテーブル1400は、例えば、入力データ格納部342に格納されるデータベースの一例であってよい。データテーブル1400の各行は、入力データの一例であってよい。本実施形態において、データテーブル1400は、無線信号を発信した通信端末の端末ID1422と、無線信号を受信したアクセスポイントが配された店舗の店舗ID1424と、無線信号の受信日を示す情報1426と、無線信号の特徴量を示す情報1428とを対応付けて格納する。無線信号の特徴量は、複数の項目を含んでよい。店舗ID1424は、店舗の識別情報の一例であるとともに、アクセスポイントの識別情報の一例であってもよい。受信日は、無線信号が受信された単位期間の一例であってよい。
FIG. 14 schematically shows an example of a data table 1400. As shown in FIG. The data table 1400 may be an example of a database stored in the input
図15は、データテーブル1500の一例を概略的に示す。データテーブル1500は、データセット格納部352に格納されるデータベースの一例であってよい。データテーブル1500は、学習用データセットの一例であってよい。データテーブル1500の各行は、学習用のデータポイントの一例であってよい。なお、図15において、データテーブル1400と同様の項目には、データテーブル1400と同一の符号が付され、説明が省略される場合がある。
FIG. 15 schematically shows an example of a data table 1500. As shown in FIG. Data table 1500 may be an example of a database stored in
本実施形態において、データテーブル1500は、無線信号を発信した通信端末の端末ID1422と、無線信号を受信したアクセスポイントが配された店舗の店舗ID1424と、無線信号の受信日を示す情報1426と、無線信号の特徴量を示す情報1428と、ラベルの種類を示す情報1532とを対応付けて格納する。ラベルの種類としては、ユーザが店舗のエリア内に存在することを示す「来店」と、ユーザが店舗のエリア外に存在することを示す「非来店」とが例示される。
In this embodiment, the data table 1500 includes a
図16は、データテーブル1600の一例を概略的に示す。データテーブル1600は、対象データ格納部354に格納されるデータベースの一例であってよい。データテーブル1600の各行は、判定対象データの一例であってよい。なお、図16において、データテーブル1400と同様の項目には、データテーブル1400と同一の符号が付され、説明が省略される場合がある。
FIG. 16 schematically shows an example of a data table 1600. As shown in FIG. The data table 1600 may be an example of a database stored in the target
本実施形態において、データテーブル1600は、無線信号を発信した通信端末の端末ID1422と、無線信号を受信したアクセスポイントが配された店舗の店舗ID1424と、無線信号の受信日を示す情報1426と、無線信号の特徴量を示す情報1428と、判定結果を示す情報1632と、分類確率又は決定関数の値を示す情報1634とを対応付けて格納する。判定対象データは、判定部260における判定処理において使用されるデータであるので、本実施形態において、判定結果を示す情報1632及び分類確率又は決定関数の値を示す情報1634の列は、空欄となっている。
In this embodiment, the data table 1600 includes a
図17は、データテーブル1700の一例を概略的に示す。データテーブル1700は、例えば、出力データ格納部362に格納されるデータベースの一例であってよい。データテーブル1700の各行は、出力データの一例であってよい。なお、図17において、データテーブル1400、データテーブル1500又はデータテーブル1600と同様の項目には、データテーブル1400、データテーブル1500又はデータテーブル1600と同一の符号が付され、説明が省略される場合がある。
FIG. 17 schematically shows an example of a data table 1700. As shown in FIG. The data table 1700 may be an example of a database stored in the output
本実施形態において、データテーブル1700は、無線信号を発信した通信端末の端末ID1422と、無線信号を受信したアクセスポイントが配された店舗の店舗ID1424と、無線信号の受信日を示す情報1426と、ラベルの種類を示す情報1532と、判定結果を示す情報1632とを対応付けて格納する。本実施形態において、データテーブル1700には、データセット生成部252が生成した学習用データセットに対応する情報のみが格納されており、判定対象データの判定結果に関する情報は、まだ格納されていない。
In this embodiment, the data table 1700 includes a
図18は、解析部240における学習用データセットの生成処理、学習モデルの生成処理、及び、分類用の閾値の調整処理の一例を概略的に示す。本実施形態によれば、まず、入力データ生成部244が、ログ情報格納部332に格納された複数のログ情報の少なくとも一部を集約して、1以上の入力データを生成する。
FIG. 18 schematically shows an example of a learning data set generation process, a learning model generation process, and a classification threshold adjustment process in the
入力データ生成部244は、AP情報格納部322に格納された各アクセスポイントに関する情報、及び、店舗情報格納部324に格納された各店舗に関する情報の少なくとも一方を参照して、1以上の入力データを生成してもよい。入力データ生成部244は、生成された入力データを、入力データ格納部342に格納する。
The input
具体的には、入力データ生成部244は、まず、ログ情報格納部332に格納されたデータテーブル1200に含まれる複数のログ情報を、無線信号を発信した通信端末の端末ID1226を第1キーとし、無線信号の受信時刻を示す情報1224を第2キーとして、ソートする。次に、入力データ生成部244は、各通信端末に関する複数のログ情報を、単位期間ごとに分類する。入力データ生成部244は、単位期間ごとに分類された1以上のログ情報を、単一の入力データに集約する。これにより、入力データが生成される。
Specifically,
例えば、入力データ生成部244は、各期間中に検出された1以上のログ情報の特徴量を算出する。図4に関連して説明されたとおり、入力データ生成部244は、各期間中に検出された1以上のログ情報に含まれる信号情報により示される無線信号の電波に関する各種の物理量に対して、任意の統計処理を実施することで、上記の特徴量を算出してよい。入力データ生成部244は、複数のログ情報により示される物理量の代表値を、上記の特徴量として決定してもよい。
For example, the
入力データ生成部244は、生成された入力データをデータテーブル1400に格納する。例えば、入力データ生成部244は、入力データの端末ID1422として、当該入力データに集約された1以上のログ情報の端末ID1226を記入する。入力データ生成部244は、データテーブル900を参照して、入力データに集約された1以上のログ情報のAPID1222に対応する店舗ID926を取得する。入力データ生成部244は、入力データの店舗ID1424として、上記の店舗ID926を記入する。入力データ生成部244は、入力データの受信日を示す情報1426として、当該入力データの集約期間となった単位期間を示す情報を記入する。入力データ生成部244は、入力データの特徴量を示す情報1428として、入力データに集約された1以上のログ情報により示される物理量の統計値又は代表値を記入する。
The
次に、データセット生成部252が、入力データ格納部342に格納された入力データの少なくとも一部に、陽性又は陰性のラベルを付与して、学習用データセットを生成する。データセット生成部252は、来店情報格納部334に格納された来店確認情報を参照して、入力データの少なくとも一部に、陽性又は陰性のラベルを付与してよい。データセット生成部252は、来店情報格納部334に格納された来店確認情報、及び、対応情報格納部326に格納された対応関係情報を参照して、入力データの少なくとも一部に、陽性又は陰性のラベルを付与してもよい。
Next, the data set
データセット生成部252は、陽性のラベルのみを付与する処理を実行して、学習用データセットを生成してよい。データセット生成部252は、陰性のラベルのみを付与する処理を実行して、学習用データセットを生成してよい。データセット生成部252は、陽性又は陰性のラベルを付与する処理を実行して、学習用データセットを生成してよい。データセット生成部252は、生成された学習用データセットを、データセット格納部352に格納する。
The data
データセット生成部252は、入力データ格納部342に格納された入力データのうち、陽性又は陰性のラベルが付与されなかった入力データを、判定対象データとして出力してよい。データセット生成部252は、判定対象データを、対象データ格納部354に格納してよい。
The data
データセット生成部252は、学習用データセットを、出力データの一部として出力してよい。データセット生成部252は、上記の出力データを、出力データ格納部362に格納してよい。
The
具体的には、データセット生成部252は、例えば、データテーブル1400に含まれる1以上の入力データと、データテーブル1300に含まれる1以上の来店確認情報とを照合して、1以上の入力データの少なくとも一部に陽性ラベルを付与することにより、データテーブル1500に格納された学習用データセットを生成する。本実施形態においては、来店確認情報のユーザID1322が、店舗12の店頭に設置された来店確認機器142と、ユーザ22の通信端末102との通信により取得された通信端末102のMACアドレスであり、来店確認情報のユーザの行動が確認された場所の位置情報1324が、店舗12の店舗名称であり、来店確認情報のユーザの行動が確認された時刻を示す情報1326が、当該MACアドレスが取得された時刻である場合を例として、データセット生成部252が学習用データセットを構成するデータポイントを生成する処理の詳細が説明される。
Specifically, the data set
データセット生成部252は、まず、入力データ格納部342に格納されたデータテーブル1400を構成する一の入力データを読み込む。次に、データセット生成部252は、読み込まれた入力データに含まれる端末ID1422をキーとして、来店情報格納部334に格納されたデータテーブル1300を構成する1以上の来店確認情報の中から、ユーザID1322が当該キーに合致する来店確認情報を抽出する。データセット生成部252は、読み込まれた入力データに含まれる受信日を示す情報1426をキーとして、抽出された来店確認情報の中から、当該キーにより示される単位期間中に取得された来店確認情報を抽出する。これにより、入力データと、来店確認情報とが関連付けられる。
The data
上記の来店確認情報が抽出された場合、データセット生成部252は、上記の入力データに陽性ラベルを付与して、学習用データセットを構成するデータポイントを生成する。具体的には、データセット生成部252は、読み込まれた入力データに含まれる端末ID1422、店舗ID1424、受信日を示す情報1426、及び、特徴量を示す情報1428と、ラベルの種類を示す情報1532とを対応付けて、データテーブル1500に格納する。なお、ラベルの種類を示す情報1532には、陽性を示すラベルが記入される。
When the store-visit confirmation information is extracted, the data set
この場合において、データセット生成部252は、読み込まれた入力データに含まれる端末ID1422、店舗ID1424、及び、受信日を示す情報1426と、ラベルの種類を示す情報1532とを対応付けて、出力データの一部として、データテーブル1700に格納してもよい。なお、ラベルの種類を示す情報1532には、陽性を示すラベルが記入される。また、判定部260は、ラベルが付与されたデータポイントを判定する必要がないので、判定結果を示す情報1732には、判定処理が不要であることを示す情報が記入されてよい。
In this case, the data set
一方、上記の来店確認情報が抽出されなかった場合、データセット生成部252は、上記の入力データに、判定部260の判定処理により利用される列を付与して、判定対象データを生成する。具体的には、データセット生成部252は、読み込まれた入力データに含まれる端末ID1422、店舗ID1424、受信日を示す情報1426、及び、特徴量を示す情報1428と、判定部260の判定結果を示す情報1732が入力される列と、判定部260の判定処理においてモデルが算出する分類確率又は決定関数の値を示す情報1734が入力される列とを対応付けて、データテーブル1600に格納する。
On the other hand, if the store-visit confirmation information is not extracted, the data set
次に、学習部254が、データセット格納部352に格納された学習用データセットと、初期設定格納部656に格納された、分類用の閾値の初期値とを利用して、学習済みの学習モデルを生成する。学習部254は、学習済みの学習モデルに関する情報を、モデル情報格納部372に格納する。
Next, the
次に、閾値調整部256が、分類用の閾値を調整する。閾値調整部256は、調整後の閾値を決定する。閾値調整部256は、調整後の閾値を示す情報を、モデル情報格納部372に格納する。
Next, the
本実施形態によれば、無線信号に関するログ情報と、来店確認情報とが関連付けられて、ラベルの付与された学習用データセットが生成される。これにより、無線信号を発信する無線端末を携帯するユーザが、特定の店舗等の内部に存在するか否かを判定するために用いられる学習モデルを、比較的容易に構築することができる。 According to the present embodiment, the log information about the radio signal and the store visit confirmation information are associated to generate a labeled learning data set. As a result, it is possible to relatively easily build a learning model used for determining whether or not a user carrying a wireless terminal that transmits a wireless signal exists inside a specific store or the like.
この点に関し、無線信号に関するログ情報を利用して店舗等への進入又は退出を判定することで、無線信号を発信する無線端末を携帯するユーザが、特定の店舗等の内部に存在するか否かを判定する場合、ルールベースのアプローチと、機械学習を利用したアプローチとが考えられる。店舗等の内部に配されたアクセスポイントにおける電波の受信状況は、(i)店舗等の立地条件、(ii)店舗等の構造、(iii)店舗等の内部におけるアクセスポイントの配置、(iv)アクセスポイントの周囲に配された構造物若しくは障害物又は人の位置、大きさ及び材質などの影響を受ける。 Regarding this point, it is possible to determine whether a user carrying a wireless terminal that transmits a wireless signal exists inside a specific store, etc. by determining whether the user enters or leaves the store, etc., using log information related to wireless signals. When determining whether the The reception status of radio waves at the access points placed inside the store, etc. depends on (i) the location conditions of the store, etc., (ii) the structure of the store, etc., (iii) the arrangement of the access points inside the store, etc., and (iv) It is affected by the position, size and material of structures or obstacles or people placed around the access point.
そのため、店舗等の状況によっては、ルールベースのアプローチを採用して、店舗等への進入又は退出を判定することが難しくなる場合がある。一方、機械学習を利用したアプローチを採用する場合、機械学習の訓練データ、検証データ及びテストデータの少なくとも1つとして利用される学習用データセットが大量に必要となる。上述のとおり、本実施形態によれば、大量の学習用データセットを準備することができるので、機械学習を利用して、上記の判定処理を実行することが可能になる。 Therefore, depending on the situation of the store or the like, it may be difficult to adopt a rule-based approach to determine entry or exit into the store or the like. On the other hand, when adopting an approach using machine learning, a large amount of learning data sets are required to be used as at least one of machine learning training data, verification data, and test data. As described above, according to the present embodiment, a large amount of learning data sets can be prepared, so it is possible to execute the determination process using machine learning.
図19は、解析部240における情報処理の一例を概略的に示す。図19は、解析部240における判定処理の一例を概略的に示す。本実施形態によれば、まず、判定部260が、モデル情報格納部372に格納された学習済の学習モデルのプログラムと、調整後の閾値を示す情報とを取得する。
FIG. 19 schematically shows an example of information processing in the
次に、判定部260は、対象データ格納部354に格納されたデータテーブル1600から、一の判定対象データを読み込む。判定部260は、読み込まれた判定対象データを学習モデルに入力する。学習モデルは、調整後の閾値を利用して、判定対象データに対応するユーザが店舗の内部に存在したか否かを示す判定結果を出力する。
Next, the
例えば、学習モデルは、読み込まれた判定対象データに対する分類確率の値を算出する。例えば、分類確率の値が調整後の閾値よりも大きい場合、学習モデルは、陽性を示す判定結果を出力する。一方、分類確率の値が調整後の閾値以下である場合、学習モデルは、陰性を示す判定結果を出力する。具体的には、判定部260は、判定対象データに含まれる端末ID1422、店舗ID1424、及び、受信日を示す情報1426と、判定部260の判定結果を示す情報1632とを対応付けて、データテーブル1700に格納する。
For example, the learning model calculates a classification probability value for the read determination target data. For example, if the value of the classification probability is greater than the adjusted threshold, the learning model outputs a positive determination result. On the other hand, when the value of the classification probability is equal to or less than the adjusted threshold value, the learning model outputs a negative judgment result. Specifically, the
本実施形態によれば、学習モデルにより利用される分類用の閾値として、学習モデルに応じて定められた初期値ではなく、ROCカーブを利用して決定された調整後の値が用いられる。これにより、分類用の閾値として初期値が利用された場合と比較して、「店舗12の内部に存在するユーザに関するデータポイント」を陽性とし、「店舗12の内部に存在しないユーザに関するデータポイント」を陰性とした場合の真陽性率が大きくなることが期待される。また、分類用の閾値として初期値が利用された場合と比較して、「店舗12の内部に存在するユーザに関するデータポイント」を陽性とし、「店舗12の内部に存在しないユーザに関するデータポイント」を陰性とした場合の偽陽性率が小さくなることが期待される。 According to this embodiment, as the classification threshold used by the learning model, the adjusted value determined using the ROC curve is used instead of the initial value determined according to the learning model. As a result, compared to the case where the initial value is used as the threshold for classification, "data points related to users existing inside the store 12" are positive, and "data points related to users not present inside the store 12" are positive. is expected to increase the true positive rate when In addition, compared to the case where the initial value is used as the threshold for classification, "data points related to users existing inside the store 12" are positive, and "data points related to users not existing inside the store 12" are positive. It is expected that the false-positive rate in the case of negative results will be reduced.
図20は、判定結果が記録されたデータテーブル1700の一例を概略的に示す。図20に示されるデータテーブル1700は、判定対象データに関する行が追加されている点で、図18に示されるデータテーブル1700と相違する。判定対象データに関する行においては、判定結果を示す情報1632の列に、判定部260が出力した判定結果が記入されている。一方、ラベルの種類を示す情報1532には、ラベルが付与されていないことを示す情報が記入されている。
FIG. 20 schematically shows an example of a data table 1700 in which judgment results are recorded. A data table 1700 shown in FIG. 20 differs from the data table 1700 shown in FIG. 18 in that a row regarding determination target data is added. In the row related to the determination target data, the determination result output by the
図21は、本発明の複数の態様が全体的又は部分的に具現化されてよいコンピュータ3000の一例を示す。例えば、管理サーバ160は、コンピュータ3000により実現される。
FIG. 21 illustrates an
コンピュータ3000にインストールされたプログラムは、コンピュータ3000に、本発明の実施形態に係る装置に関連付けられるオペレーション又は当該装置の1又は複数の「部」として機能させ、又は当該オペレーション又は当該1又は複数の「部」を実行させることができ、及び/又はコンピュータ3000に、本発明の実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ3000に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、CPU3012によって実行されてよい。
Programs installed on the
本実施形態によるコンピュータ3000は、CPU3012、RAM3014、グラフィックコントローラ3016、及びディスプレイデバイス3018を含み、それらはホストコントローラ3010によって相互に接続されている。コンピュータ3000はまた、通信インターフェース3022、ハードディスクドライブ3024、DVD-ROMドライブ3026、及びICカードドライブのような入出力ユニットを含み、それらは入出力コントローラ3020を介してホストコントローラ3010に接続されている。コンピュータはまた、ROM3030及びキーボード3042のようなレガシの入出力ユニットを含み、それらは入出力チップ3040を介して入出力コントローラ3020に接続されている。
CPU3012は、ROM3030及びRAM3014内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ3016は、RAM3014内に提供されるフレームバッファ等又はそれ自体の中に、CPU3012によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス3018上に表示されるようにする。
The
通信インターフェース3022は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ3024は、コンピュータ3000内のCPU3012によって使用されるプログラム及びデータを格納する。DVD-ROMドライブ3026は、プログラム又はデータをDVD-ROM3001から読み取り、ハードディスクドライブ3024にRAM3014を介してプログラム又はデータを提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。
ROM3030はその中に、アクティブ化時にコンピュータ3000によって実行されるブートプログラム等、及び/又はコンピュータ3000のハードウエアに依存するプログラムを格納する。入出力チップ3040はまた、様々な入出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ3020に接続してよい。
プログラムが、DVD-ROM3001又はICカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもあるハードディスクドライブ3024、RAM3014、又はROM3030にインストールされ、CPU3012によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ3000に読み取られ、プログラムと、上記様々なタイプのハードウエアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ3000の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。
A program is provided by a computer-readable storage medium such as a DVD-
例えば、通信がコンピュータ3000及び外部デバイス間で実行される場合、CPU3012は、RAM3014にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インターフェース3022に対し、通信処理を命令してよい。通信インターフェース3022は、CPU3012の制御の下、RAM3014、ハードディスクドライブ3024、DVD-ROM3001、又はICカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。
For example, when communication is performed between the
また、CPU3012は、ハードディスクドライブ3024、DVD-ROMドライブ3026(DVD-ROM3001)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM3014に読み取られるようにし、RAM3014上のデータに対し様々なタイプの処理を実行してよい。CPU3012は次に、処理されたデータを外部記録媒体にライトバックしてよい。
In addition, the
様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU3012は、RAM3014から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM3014に対しライトバックする。また、CPU3012は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU3012は、当該複数のエントリの中から、第1の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
Various types of information, such as various types of programs, data, tables, and databases, may be stored on recording media and subjected to information processing.
上で説明したプログラム又はソフトウエアモジュールは、コンピュータ3000上又はコンピュータ3000近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それにより、上記のプログラムを、ネットワークを介してコンピュータ3000に提供する。
The programs or software modules described above may be stored in a computer readable storage medium on or near
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments. It is obvious to those skilled in the art that various modifications and improvements can be made to the above embodiments. It is clear from the description of the scope of claims that forms with such modifications or improvements can also be included in the technical scope of the present invention.
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。 The execution order of each process such as actions, procedures, steps, and stages in the devices, systems, programs, and methods shown in the claims, the specification, and the drawings is particularly "before", "before" etc., and it should be noted that it can be implemented in any order unless the output of the previous process is used in the subsequent process. Regarding the operation flow in the claims, the specification, and the drawings, even if the description is made using "first," "next," etc. for convenience, it means that it is essential to carry out in this order. not a thing
10 通信ネットワーク
12 店舗
14 店舗
22 ユーザ
24 ユーザ
100 データ解析システム
102 通信端末
104 通信端末
108 通信端末
122 アクセスポイント
124 アクセスポイント
142 来店確認機器
144 来店確認機器
160 管理サーバ
220 入出力制御部
230 情報収集部
240 解析部
242 格納部
244 入力データ生成部
250 モデル構築部
252 データセット生成部
254 学習部
256 閾値調整部
260 判定部
270 来店人数推定部
322 AP情報格納部
324 店舗情報格納部
326 対応情報格納部
332 ログ情報格納部
334 来店情報格納部
342 入力データ格納部
352 データセット格納部
354 対象データ格納部
362 出力データ格納部
372 モデル情報格納部
422 グループ
424 グループ
552 ラベル付与部
554 データセット出力部
556 対象データ出力部
652 クラス分類器
654 クラス分類器
656 初期設定格納部
752 ROCカーブ算出部
754 AUCスコア算出部
756 作動ポイント決定部
758 調整値決定部
820 ROCカーブ
832 ポイント
834 ポイント
840 直線
900 データテーブル
922 APID
924 情報
926 店舗ID
1000 データテーブル
1022 店舗ID
1024 店舗名称
1026 店舗タイプ
1028 位置情報
1030 情報
1100 データテーブル
1122 端末ID
1124 ユーザID
1200 データテーブル
1222 APID
1224 情報
1226 端末ID
1228 情報
1300 データテーブル
1322 ユーザID
1324 位置情報
1326 情報
1400 データテーブル
1422 端末ID
1424 店舗ID
1426 情報
1428 情報
1500 データテーブル
1532 情報
1600 データテーブル
1632 情報
1634 情報
1700 データテーブル
1732 情報
1734 情報
1800 データテーブル
3000 コンピュータ
3001 DVD-ROM
3010 ホストコントローラ
3012 CPU
3014 RAM
3016 グラフィックコントローラ
3018 ディスプレイデバイス
3020 入出力コントローラ
3022 通信インターフェース
3024 ハードディスクドライブ
3026 DVD-ROMドライブ
3030 ROM
3040 入出力チップ
3042 キーボード
10 communication network 12 store 14
924
1000 Data table 1022 Store ID
1024
1124 User ID
1200 data table 1222 APID
1224
1228
1324
1424 Store ID
1426
3010
3014 RAM
3016
3040 input/
Claims (15)
前記モデル生成部により生成された前記学習モデルが、前記ユーザが前記エリアの内部に存在していたか否か判定するための基準値を調整する調整部と、
を備え、
前記モデル生成部は、
(a)前記基準値として、前記学習モデルに応じた初期値を利用し、(b)(i)1以上の前記無線受信装置が受信した複数の前記無線信号のそれぞれに関する情報、及び、(ii)前記複数の無線信号のそれぞれを発信した前記無線端末のユーザが、前記複数の無線信号のそれぞれを受信した前記無線受信装置の配された前記エリアの内部に存在していたか否かを示すラベルを含む学習用データセットを利用して機械学習を実行することにより、前記学習モデルを生成し、
前記調整部は、
前記基準値として前記初期値が利用された場合と比較して、前記モデル生成部により生成された前記学習モデルの判定結果の真陽性率が大きくなる第2の値を、調整後の前記基準値として決定する、
機械学習装置。 A data point containing information relating to a radio signal received by a radio receiver located within an area having a predetermined geographic extent is entered such that a user of a radio terminal that originated the radio signal is located within the area. a model generation unit that generates a learning model used to determine whether or not there was a
an adjustment unit that adjusts a reference value for determining whether the learning model generated by the model generation unit determines whether the user exists inside the area;
with
The model generation unit
(a) using an initial value according to the learning model as the reference value, (b) (i) information about each of the plurality of radio signals received by one or more of the radio receiving devices, and ) a label indicating whether or not the user of the wireless terminal that transmitted each of the plurality of wireless signals was present within the area in which the wireless receiving device that received each of the plurality of wireless signals was arranged; Generate the learning model by performing machine learning using a learning data set containing
The adjustment unit
A second value that increases the true positive rate of the determination result of the learning model generated by the model generating unit as compared to the case where the initial value is used as the reference value is the adjusted reference value determine as
Machine learning device.
それぞれにおいて、(i)特定の行動に関与した1以上の前記ユーザのそれぞれを識別するためのユーザ識別情報、及び、(ii)前記特定の行動がなされた時刻を示す行動時刻情報が対応付けられた、複数の行動履歴情報を取得する行動履歴取得部と、
(i)前記レコード取得部が取得した前記複数のレコードのそれぞれに含まれる前記端末識別情報及び前記受信時刻情報、並びに、(ii)前記行動履歴取得部が取得した前記複数の行動履歴情報のそれぞれに含まれる前記ユーザ識別情報及び前記行動時刻情報に基づいて、前記複数のレコード及び前記複数の行動履歴情報を照合し、前記複数のレコードのうち少なくとも一部のレコードのそれぞれに含まれる前記端末識別情報と、前記少なくとも一部のレコードのそれぞれに含まれる前記信号情報により示される電波に関する情報と、前記ユーザが前記エリアの内部に存在していたことを示す前記ラベルとを対応付けることで、前記学習用データセットを生成するラベル付与部と、
をさらに備える、
請求項1に記載の機械学習装置。 (i) terminal identification information for identifying the wireless terminal that transmitted each of the plurality of wireless signals; (ii) reception time information indicating the time at which each of the plurality of wireless signals was received; , (iii) a record acquisition unit that acquires a plurality of records associated with signal information about radio waves of each of the plurality of radio signals;
Each of them is associated with (i) user identification information for identifying each of the one or more users involved in a specific action, and (ii) action time information indicating the time when the specific action was performed. an action history acquisition unit that acquires a plurality of action history information;
(i) the terminal identification information and the reception time information included in each of the plurality of records acquired by the record acquisition unit; and (ii) each of the plurality of action history information acquired by the action history acquisition unit. The plurality of records and the plurality of action history information are collated based on the user identification information and the action time information included in the terminal identification included in each of at least some of the plurality of records information, information about radio waves indicated by the signal information included in each of the at least some records, and the label indicating that the user was present in the area, thereby performing the learning. a labeling unit that generates a dataset for
further comprising
The machine learning device according to claim 1.
請求項2に記載の機械学習装置。 The user identification information included in at least part of the plurality of action history information is the terminal identification information of a wireless terminal used by the user identified by the user identification information.
The machine learning device according to claim 2.
前記ラベル付与部は、
前記対応関係取得部が取得した前記対応関係情報を参照して、(i)前記レコード取得部が取得した前記複数のレコードのそれぞれに含まれる前記端末識別情報及び前記受信時刻情報、並びに、(ii)前記行動履歴取得部が取得した前記複数の行動履歴情報のそれぞれに含まれる前記ユーザ識別情報及び前記行動時刻情報に基づいて、前記複数のレコード及び前記複数の行動履歴情報を照合し、前記学習用データセットを生成する、
請求項2に記載の機械学習装置。 further comprising a correspondence acquisition unit that acquires correspondence relationship information indicating a correspondence relationship between each of the one or more pieces of user identification information and the terminal identification information of a wireless terminal used by a user identified by the user identification information,
The labeling unit is
With reference to the correspondence information acquired by the correspondence acquisition unit, (i) the terminal identification information and the reception time information included in each of the plurality of records acquired by the record acquisition unit, and (ii) ) based on the user identification information and the action time information included in each of the plurality of action history information acquired by the action history acquiring unit, the plurality of records and the plurality of action history information are collated, and the learning generate a dataset for
The machine learning device according to claim 2.
それぞれにおいて、(i)1以上の前記エリアのそれぞれを識別するためのエリア識別情報、(ii)前記エリア識別情報により識別されるエリアへの進入が制限されている時間帯を示す、1以上の進入制限情報を取得する制限情報取得部と、
(i)前記レコード取得部が取得した前記複数のレコードのそれぞれに含まれる前記受信位置情報、及び、(ii)前記制限情報取得部が取得した前記1以上の進入制限情報のそれぞれに含まれる前記エリア識別情報に基づいて、前記複数のレコード及び前記1以上の進入制限情報を照合し、前記複数のレコードのうち少なくとも一部のレコードのそれぞれに含まれる前記端末識別情報と、前記少なくとも一部のレコードのそれぞれに含まれる前記信号情報により示される電波に関する情報と、前記ユーザが前記エリアの内部に存在していなかったことを示す前記ラベルとを対応付けることで、前記学習用データセットを生成するラベル付与部と、
をさらに備える、
請求項1に記載の機械学習装置。 In each, (i) terminal identification information for identifying the wireless terminal that transmitted each of the plurality of wireless signals, (ii) reception time information indicating the time each of the plurality of wireless signals was received, ( iii) receiving position information indicating the position at which each of the plurality of radio signals was received; and (iv) a record for acquiring a plurality of records associated with signal information regarding radio waves of each of the plurality of radio signals. an acquisition unit;
(i) area identification information for identifying each of the one or more areas; a restriction information acquisition unit that acquires access restriction information;
(i) the reception position information included in each of the plurality of records acquired by the record acquisition unit; and (ii) the information included in each of the one or more entry restriction information acquired by the restriction information acquisition unit. Based on the area identification information, the plurality of records and the one or more pieces of entry restriction information are collated, and the terminal identification information included in each of at least a portion of the plurality of records and the at least a portion of the A label for generating the learning data set by associating information on radio waves indicated by the signal information included in each record with the label indicating that the user was not inside the area. a granting unit;
further comprising
The machine learning device according to claim 1.
前記集約部は、
それぞれにおいて、(i)前記複数の無線信号のそれぞれを発信した前記無線端末を識別するための端末識別情報、(ii)前記集約部による集約処理の対象となった期間を示す集約期間情報、(iii)前記複数の無線信号のうち、前記端末識別情報により識別される無線端末が、前記集約期間情報により示される期間の間に発信した1以上の無線信号に関する1以上の特徴量を示す特徴情報が対応付けられた、1以上の集約レコードを生成する、
請求項2から請求項5までの何れか一項に記載の機械学習装置。 The plurality of records acquired by the record acquisition unit is based on the terminal identification information and the reception time information included in each of the plurality of records, and each of the terminal identification information satisfies a predetermined condition. further comprising an aggregating unit that aggregates for each period,
The aggregating unit is
In each, (i) terminal identification information for identifying the wireless terminal that transmitted each of the plurality of wireless signals, (ii) aggregation period information indicating a period subject to aggregation processing by the aggregation unit, ( iii) feature information indicating one or more feature amounts relating to one or more radio signals transmitted during the period indicated by the aggregation period information by the radio terminal identified by the terminal identification information among the plurality of radio signals; generate one or more aggregated records associated with
The machine learning device according to any one of claims 2 to 5.
請求項6に記載の機械学習装置。 The labeling unit generates the learning data set by giving the label to at least part of the one or more aggregated records.
The machine learning device according to claim 6.
算出された前記関数の値と、前記基準値とに基づいて、前記ユーザが前記エリアの内部に存在していたか否かを判定する、
請求項1から請求項7までの何れか一項に記載の機械学習装置。 The learning model calculates, for each data point input to the learning model, the value of a function used to estimate the uncertainty of the prediction or decision of the learning model;
Determining whether the user exists within the area based on the calculated value of the function and the reference value;
The machine learning device according to any one of claims 1 to 7.
前記モデル生成部により生成された前記学習モデルの受信者動作特性カーブ(ROCカーブ)を示すデータを算出し、
前記ROCカーブ上のポイントであって、前記基準値として前記初期値が利用された場合と比較して、前記モデル生成部により生成された前記学習モデルの判定結果の真陽性率が大きくなるポイントに対応する基準値を、前記第2の値として決定する、
請求項1から請求項8までの何れか一項に記載の機械学習装置。 The adjustment unit
calculating data indicating a receiver operating characteristic curve (ROC curve) of the learning model generated by the model generating unit;
A point on the ROC curve at which the true positive rate of the determination result of the learning model generated by the model generation unit is greater than when the initial value is used as the reference value determining a corresponding reference value as the second value;
The machine learning device according to any one of claims 1 to 8.
請求項1から請求項9までの何れか一項に記載の機械学習装置。 The model generation unit generates the learning model for each wireless receiving device or each area.
The machine learning device according to any one of claims 1 to 9.
請求項1から請求項10までの何れか一項に記載の機械学習装置。 The wireless receiving device is a relay device that relays wireless communication,
The machine learning device according to any one of claims 1 to 10.
前記1以上の無線受信装置の少なくとも1つにより受信された前記複数の無線信号のそれぞれに関する情報を含む判定対象データを取得する判定対象取得部と、
(i)前記判定対象取得部が取得した前記判定対象データを、前記モデル生成部が生成した前記学習モデルに入力し、(ii)前記基準値として、前記調整部が決定した前記第2の値を利用して、前記判定対象データに関する無線信号を発信した1以上の無線端末のそれぞれのユーザが、前記判定対象データに関する無線信号を受信した無線受信装置の配された前記エリアの内部に存在していたか否かを示す判定する判定部と、
を備える、情報処理装置。 a machine learning device according to any one of claims 1 to 11;
a determination target acquiring unit that acquires determination target data including information about each of the plurality of radio signals received by at least one of the one or more wireless receiving devices;
(i) inputting the determination target data acquired by the determination target acquisition unit into the learning model generated by the model generation unit; and (ii) using the second value determined by the adjustment unit as the reference value. , the users of the one or more wireless terminals that have transmitted the radio signal related to the determination target data exist within the area in which the wireless receiving device that received the wireless signal related to the determination target data is arranged a determination unit that determines whether or not
An information processing device.
前記モデル生成段階において生成された前記学習モデルが、前記ユーザが前記エリアの内部に存在していたか否か判定するための基準値を調整する調整段階と、
を有し、
前記モデル生成段階は、
(a)前記基準値として、前記学習モデルに応じた初期値を利用し、(b)(i)1以上の前記無線受信装置が受信した複数の前記無線信号のそれぞれに関する情報、及び、(ii)前記複数の無線信号のそれぞれを発信した前記無線端末のユーザが、前記複数の無線信号のそれぞれを受信した前記無線受信装置の配された前記エリアの内部に存在していたか否かを示すラベルを含む学習用データセットを利用して機械学習を実行することにより、前記学習モデルを生成する段階を含み、
前記調整段階は、
前記基準値として前記初期値が利用された場合と比較して、前記モデル生成段階において生成された前記学習モデルの判定結果の真陽性率が大きくなる第2の値を、調整後の前記基準値として決定する段階を含む、
機械学習方法。 A data point containing information relating to a radio signal received by a radio receiver located within an area having a predetermined geographic extent is entered such that a user of a radio terminal that originated the radio signal is located within the area. a model generation stage that generates a learning model that is used to determine whether the
an adjustment step of adjusting a reference value for determining whether or not the user was present in the area in the learning model generated in the model generation step;
has
The model generation step includes:
(a) using an initial value according to the learning model as the reference value, (b) (i) information about each of the plurality of radio signals received by one or more of the radio receiving devices, and ) a label indicating whether or not the user of the wireless terminal that transmitted each of the plurality of wireless signals was present within the area in which the wireless receiving device that received each of the plurality of wireless signals was arranged; generating the learning model by performing machine learning using a training data set comprising
The adjustment step includes:
A second value that increases the true positive rate of the determination result of the learning model generated in the model generation stage compared to the case where the initial value is used as the reference value is the adjusted reference value including determining as
machine learning method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018209127A JP7105176B2 (en) | 2018-11-06 | 2018-11-06 | Machine learning device, judgment device, program and machine learning method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018209127A JP7105176B2 (en) | 2018-11-06 | 2018-11-06 | Machine learning device, judgment device, program and machine learning method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020077118A JP2020077118A (en) | 2020-05-21 |
JP7105176B2 true JP7105176B2 (en) | 2022-07-22 |
Family
ID=70724060
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018209127A Active JP7105176B2 (en) | 2018-11-06 | 2018-11-06 | Machine learning device, judgment device, program and machine learning method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7105176B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240242273A1 (en) * | 2021-07-02 | 2024-07-18 | Nec Corporation | Model generation device, financial institution server, information processing system, model generation method, and storage medium |
JP7542780B2 (en) | 2022-08-31 | 2024-08-30 | 三菱電機株式会社 | Information processing device, output method, and output program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015040749A (en) | 2013-08-21 | 2015-03-02 | 日本電信電話株式会社 | Position estimation device and position estimation program |
US20160139239A1 (en) | 2012-06-01 | 2016-05-19 | Amazon Technologies, Inc. | Determining device locations using movement, signal strength |
JP2018055638A (en) | 2016-09-30 | 2018-04-05 | 株式会社Nttドコモ | Determination device |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3165391B2 (en) * | 1996-03-22 | 2001-05-14 | 松下電器産業株式会社 | Mobile radio communication system and method for detecting position of mobile station |
-
2018
- 2018-11-06 JP JP2018209127A patent/JP7105176B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160139239A1 (en) | 2012-06-01 | 2016-05-19 | Amazon Technologies, Inc. | Determining device locations using movement, signal strength |
JP2015040749A (en) | 2013-08-21 | 2015-03-02 | 日本電信電話株式会社 | Position estimation device and position estimation program |
JP2018055638A (en) | 2016-09-30 | 2018-04-05 | 株式会社Nttドコモ | Determination device |
Also Published As
Publication number | Publication date |
---|---|
JP2020077118A (en) | 2020-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7170160B2 (en) | Systems and methods for providing targeted advertisements to charging stations for electric vehicles | |
US11625755B1 (en) | Determining targeting information based on a predictive targeting model | |
EP3320512B1 (en) | Mobile attribute time-series profiling analytics | |
US8996033B1 (en) | Systems and methods for statistically associating mobile devices to households | |
JP5802716B2 (en) | Information processing system, program, and verification method | |
US11810147B2 (en) | Automated attribution modeling and measurement | |
KR102324439B1 (en) | System, server and method for providing intelligent medium and micro enterprise owners support service | |
US20150248436A1 (en) | Methods, Circuits, Devices, Systems and Associated Computer Executable Code for Assessing a Presence Likelihood of a Subject at One or More Venues | |
Bi et al. | How built environment impacts online car-hailing ridership | |
CN103177129A (en) | Internet real-time information recommendation and prediction system | |
US20140129334A1 (en) | Method and system for modeling consumer activity areas based on social media and mobile data | |
KR20190116830A (en) | Method for providing commercial cost calculating service based on bigdata of commercial viewer and number of viewer object | |
Rahaman et al. | Wait time prediction for airport taxis using weighted nearest neighbor regression | |
KR20180128147A (en) | Method and Apparatus for Recommending Restaurant Based on Mobile Context Information | |
JP7105176B2 (en) | Machine learning device, judgment device, program and machine learning method | |
CN105956694A (en) | Heterogeneous data source integrated modeling and optimizing method for interior space value of commercial real estate | |
CN107220856B (en) | System and method for identifying mobile consumption group | |
JP6742360B2 (en) | Information generating device, program, and information generating method | |
Zhang et al. | An automatic approach for transit advertising in public transportation systems | |
JP6693993B2 (en) | Information generating device, program, and information generating method | |
CN111861139A (en) | Merchant recommendation method and device and computer equipment | |
JP6616860B2 (en) | Information generating apparatus, program, and information generating method | |
RU2658876C1 (en) | Wireless device sensor data processing method and server for the object vector creating connected with the physical position | |
JP5919358B1 (en) | Information processing system and program | |
Kim et al. | Agatha: Predicting daily activities from place visit history for activity-aware mobile services in smart cities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220527 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220711 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7105176 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |