WO2020045459A1 - データ分析装置、データ分析システム、データ分析方法およびプログラム - Google Patents

データ分析装置、データ分析システム、データ分析方法およびプログラム Download PDF

Info

Publication number
WO2020045459A1
WO2020045459A1 PCT/JP2019/033588 JP2019033588W WO2020045459A1 WO 2020045459 A1 WO2020045459 A1 WO 2020045459A1 JP 2019033588 W JP2019033588 W JP 2019033588W WO 2020045459 A1 WO2020045459 A1 WO 2020045459A1
Authority
WO
WIPO (PCT)
Prior art keywords
visit rate
area
customer
unit
map
Prior art date
Application number
PCT/JP2019/033588
Other languages
English (en)
French (fr)
Inventor
智文 中野
健一 若狭
久 猪谷
Original Assignee
クロスロケーションズ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by クロスロケーションズ株式会社 filed Critical クロスロケーションズ株式会社
Publication of WO2020045459A1 publication Critical patent/WO2020045459A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Definitions

  • the present disclosure relates to a data analysis device, a data analysis system, a data analysis method, and a program.
  • Patent Literature 1 discloses a system that enables a trade area analysis that is easier for a user to understand by using a map application provided through the Internet.
  • Patent Literature 1 a target area is selected on map data, and only the status of sales at a store is indicated for each of the selected target areas, which affects sales. It is difficult to conduct a trade area analysis that focuses on characteristic regions.
  • the present disclosure has been made in order to solve the above-described problems, and has as its object to provide a data analysis device and a data analysis device capable of specifying an area having a characteristic visit rate to a point set on a map. It is to provide a system, a data analysis method and a program.
  • a data analysis device is a device that analyzes a business area of a point set on a map.
  • a visit rate calculation unit that calculates a visit rate to an active customer point, an average calculation unit that calculates, for each distance from the point, an average visit rate to an active customer point at the distance, and a visit rate calculation unit
  • An evaluation unit that evaluates a visit rate for a point estimated for each predetermined region on the map, based on the visit rate for each predetermined region on the map and the average visit ratio calculated by the average calculation unit.
  • An output unit for outputting a result.
  • a data analysis system is a system for analyzing a business area of a point set on a map.
  • a visit rate calculation unit that calculates a visit rate of a customer who is active in the area, an average calculation unit that calculates, for each distance from the point, an average visit rate of a customer who is active at the distance, and a visit rate calculation unit
  • An evaluation unit that evaluates a visit rate for a point estimated for each predetermined region on the map, based on the visit rate for each predetermined region on the map calculated by the average calculation unit and the average visit ratio calculated by the average calculation unit.
  • an output unit that outputs an evaluation result.
  • a data analysis method is a method for analyzing a business area of a point set on a map. Calculating a visit rate to a customer point active in the area; calculating, for each distance from the point, an average visit rate to the customer point active in the distance; Evaluating the visit rate for a point estimated for each predetermined area on the map, based on the visit rate for each of the predetermined areas and the average visit rate calculated by the average calculation unit, and outputting the evaluation result. And step.
  • a program according to a fourth aspect of the present disclosure causes a computer to execute the above data analysis method.
  • FIG. 1 is a configuration diagram of a data analysis system 1 according to the present embodiment.
  • FIG. 3 is a functional block diagram illustrating an example of a functional configuration of a customer terminal 100.
  • FIG. 3 is a block diagram illustrating an example of a functional configuration of a server device 300. It is a figure showing an example of customer information 323.
  • FIG. 7 is a diagram illustrating an example of position information 324. It is a figure showing an example of estimation of an address. It is a figure showing a map in which a place of visit is set. It is a figure showing an example of a visit rate of field A1 and A2. It is a figure showing an example of the visit rate of field A3 and A4.
  • FIG. 9 is a diagram illustrating an example of an output result.
  • FIG. 9 is a flowchart illustrating a flow of a process of the server device 300. It is a specific example of the graph which showed the distance from the visiting place and the visit rate. It is a specific example of the graph which showed the distance from the visit place and the visit rate about a characteristic area.
  • FIG. 3 is a block diagram illustrating a hardware configuration of a server device 300.
  • the data analysis system 1 is a system for analyzing a business area of a visiting place set on a map.
  • Trade area analysis is to analyze, for example, from which region customers come to a certain store and what products and services can be sold in a certain region.When examining store opening strategies and sales strategies, Done in
  • an area having a characteristic visit rate to a certain point is specified.
  • a characteristic visit rate to a certain point
  • the visit rate decreases as residents in areas farther from the store.
  • a characteristic area indicating such a visit rate is specified based on the relationship with the average visit rate.
  • the area can be presented to the data analyst as an area particularly requiring analysis, and can be used as a strategy map for a store opening strategy or a sales strategy.
  • FIG. 1 is a configuration diagram of a data analysis system 1 according to the present embodiment. The configuration of the data analysis system 1 and its outline will be described with reference to FIG.
  • the data analysis system 1 is a system for analyzing a business area of a point set on a map, and includes a plurality of customer terminals 100, an information processing terminal 200, and a server device 300.
  • Server device 300 is communicably connected to a plurality of customer terminals 100 and information processing terminals 200 via a network NW.
  • the network NW is, for example, a WAN (World ⁇ Area ⁇ Network).
  • the point set on the map is, for example, a shopping center, a supermarket, a store such as a department store, or the like, but is not limited thereto, and is a sightseeing spot, a public facility such as a library or a hospital, or a station. May be transportation.
  • a point to be subjected to a trade area analysis may be described in other words as a visited place.
  • the customer terminal 100 is an information processing terminal used by the customer, and the customer terminal 100 is realized by, for example, a smartphone, a tablet terminal, or the like.
  • the customer refers to a person who has an information processing terminal installed with a program (for example, an application dedicated to a smartphone) that causes the server device 300 to acquire position information used in the data analysis system 1.
  • a program for example, an application dedicated to a smartphone
  • the present invention is not limited to this, and any form may be used as long as the server device 300 can acquire the position information of the terminal itself.
  • Members and regular customers such as the stores described above have only visited once. It may include customers, customers who simply stop by without performing services or commerce.
  • the customer terminal 100 continuously acquires location information via a program (for example, an application dedicated to a smartphone) installed in the customer terminal 100. For example, using GPS (Global Positioning System), position information that is information indicating the position where the own device is located is detected. Then, the customer terminal 100 continuously transmits the detected position information to the server device 300, for example, in response to a request from the server device 300.
  • a program for example, an application dedicated to a smartphone
  • GPS Global Positioning System
  • the information processing terminal 200 is an information processing terminal used by a user who performs a trade area analysis, and is realized by, for example, a smartphone, a tablet terminal, a PC (Personal Computer), or the like.
  • the information processing terminal 200 receives the operation of the user who performs the trade area analysis, starts up, for example, an application program of a browser, and stores information indicating a visit place (point to be subjected to trade area analysis) set by the user in the server. Transmit to the device 300.
  • the number of information processing terminals 200 is not limited to the number shown in FIG. 1 and may be plural.
  • the server device 300 is a server device corresponding to a data analysis device that specifies an area having a characteristic visit rate to a point set on a map.
  • the server device 300 acquires the information indicating the visiting place from the information processing terminal 200, the server device 300 calculates the visit rate based on the position information received from the customer terminal 100. Then, an area (characteristic region) having a characteristic visit rate is specified, the characteristic region is superimposed on the map, output, and transmitted to the information processing terminal 200. At this time, the degree to which the visit rate is out of the average visit rate may be evaluated by a score or the like, and the score may be output. The method for specifying the characteristic region will be described later.
  • FIG. 2 is a functional block diagram showing an example of a functional configuration of the customer terminal 100.
  • the functional configuration of the customer terminal 100 will be described with reference to FIG. Note that the customer terminal 100 of the present embodiment may have a configuration in which some of the components (each unit) in FIG. 2 are omitted. Further, the information processing terminal 200 of the present embodiment may have the same functional configuration as the customer terminal 100, and the description of the functional configuration of the information processing terminal 200 will be omitted.
  • the customer terminal 100 is, for example, a mobile phone including a smartphone, a tablet terminal, a notebook PC, or a mobile terminal such as a PDA (Personal Digital Assistant). Further, the customer terminal 100 also includes a wearable device (wearable device) that is an eyeglass-type or watch-type information processing terminal. Further, the customer terminal 100 may include various smart devices having an information processing function for acquiring position information. For example, the customer terminal 100 may include a smart vehicle such as an automobile.
  • the customer terminal 100 includes a communication unit 110, an input unit 120, a display unit 130, a detection unit 140, and a control unit 150.
  • the communication unit 110 performs various controls for performing communication with the server device 300 via the network NW, and its functions can be realized by hardware such as various processors or communication ASICs, programs, and the like.
  • the input unit 120 is an input interface for receiving various operations from the user.
  • the input unit 120 is realized by operation keys and buttons provided on the customer terminal 100, a touch panel, a microphone for voice input, and the like.
  • the display unit 130 is a display device for displaying various information, and is realized by, for example, a liquid crystal display or the like.
  • a touch panel is used for the customer terminal 100, a part of the input unit 120 and the display unit 130 are integrated.
  • the detection unit 140 detects various information related to the customer terminal 100. Specifically, the detection unit 140 detects a physical state of the customer terminal 100. In the example illustrated in FIG. 2, the detection unit 140 includes a position detection unit 141.
  • the position detection unit 141 detects the current position of the customer terminal 100. Specifically, the position detection unit 141 receives a radio wave transmitted from the satellite positioning system, and detects position information (for example, latitude and longitude) indicating the current position of the customer terminal 100 based on the received radio wave. Note that the position detection unit 141 may acquire the position information by a different method. For example, when the customer terminal 100 has a function equivalent to a contactless IC card used in a station ticket gate or a store (or the customer terminal 100 has a function of reading the history of the contactless IC card). In the case), the used position is recorded together with the information on the settlement of the fare at the station by the customer terminal 100 and the like.
  • position information for example, latitude and longitude
  • the position detector 141 detects this information and acquires it as position information. Further, when the customer terminal 100 communicates with a specific access point, the position detecting unit 141 may detect position information that can be obtained from the access point. Further, the position detection unit 141 may detect a position where the customer terminal 100 is estimated to be located, based on identification information (IP address or the like) when the customer terminal 100 is connected to the Internet.
  • identification information IP address or the like
  • the detection unit 140 is not limited to the position detection unit 141, and may include various devices that detect various states of the customer terminal 100.
  • the detection unit 140 includes a microphone that collects sound around the customer terminal 100, an illuminance sensor that detects illuminance around the customer terminal 100, and an acceleration sensor that detects physical movement of the customer terminal 100 (or A gyro sensor, a humidity sensor that detects the humidity around the customer terminal 100, a geomagnetic sensor that detects a magnetic field at the position where the customer terminal 100 is located, and the like.
  • the detection unit 140 may detect various types of information using the function of the sensor. For example, the detection unit 140 may detect the number of walks of the customer who uses the customer terminal 100 using the function of the acceleration sensor. In addition, the detection unit 140 detects operation information indicating whether the customer terminal 100 is operating or is stationary at predetermined time intervals or at each timing when the customer terminal 100 operates using the function of the acceleration sensor. May be.
  • the control unit 150 is, for example, a controller, and various programs stored in a storage device inside the customer terminal 100 are stored in a RAM (Random Access Memory) by a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like. ) As a work area.
  • the control unit 150 is a controller, and is realized by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).
  • the control unit 150 controls the process of providing the server device 300 with the position information of the customer terminal 100.
  • the control unit 150 executes and controls a program (for example, a smartphone-dedicated application) for implementing a process of providing position information of the customer terminal 100.
  • the program may be installed in the customer terminal 100 in advance, or may be downloaded from the server device 300 (or an external server providing various programs) in accordance with an operation by the customer who owns the customer terminal 100, and installed in the customer terminal 100. You may.
  • the control unit 150 realizes or executes the functions and operations of the information processing described below by executing the above-described program using the RAM as a work area.
  • the control unit 150 controls the detection unit 140 to acquire various types of information detected by the detection unit 140 as position information.
  • the control unit 150 controls the position detection unit 141 to acquire, as the position information, the position information of the customer terminal 100 and the time information corresponding to the time at which the position information was detected.
  • the control unit 150 may also acquire, as position information, information on the status of communication performed by the communication unit 110. For example, the control unit 150 may acquire a mutual communication status between the customer terminal 100 and a predetermined access point. Further, when the customer terminal 100 has a call function, the control unit 150 may obtain information such as a time at which the call was made, a call destination, and a call time. Further, when the customer terminal 100 has a photographing function, the control unit 150 may acquire information such as a photographing time, position information at which the photographing was performed, and a photographing time. Then, the control unit 150 may acquire the position information of the customer terminal 100 based on the information.
  • the control unit 150 may acquire the position information periodically (every minute, every three minutes, every five minutes, every hour, etc.), for example.
  • the timing at which the control unit 150 acquires the position information may be set by the server device 300. Further, the control unit 150 may acquire the position information at a timing when a predetermined event occurs. For example, the control unit 150 acquires the position information as a predetermined event when the above-described non-contact IC card function is used or when a camera image is taken.
  • the control unit 150 controls the communication unit 110 to transmit the acquired position information to the server device 300.
  • the communication unit 110 transmits the identification information for identifying the customer terminal 100, the position information detected by the detection unit 140, and the date and time when the position information is detected by the server device 300.
  • the control unit 150 may transmit the position information or the like to the server device 300 every time the position information is acquired, or may transmit the position information or the like to the server device 300 at predetermined intervals.
  • the control unit 150 controls the communication unit 110 to transmit the position information to the server device 100 periodically (every minute, every three minutes, every five minutes, every hour, etc.).
  • FIG. 3 is a block diagram illustrating an example of a functional configuration of the server device 300. With reference to FIG. 3, a functional configuration of server device 300 will be described.
  • the server device 300 includes a communication unit 310, a storage unit 320, and a control unit 330.
  • the server device 300 includes an input unit (for example, a keyboard and a mouse) for receiving various operations from an administrator or the like who uses the server device 300, and a display unit (for example, a liquid crystal display or the like) for displaying various information. May have.
  • the communication unit 310 performs various controls for performing communication with the customer terminal 100 and the information processing terminal 200 via the network NW.
  • the function of the communication unit 310 is hardware such as various processors or communication ASICs, and a program. It can be realized by such as.
  • the storage unit 320 is realized by, for example, a semiconductor memory device such as a RAM or a flash memory, or a storage device such as a hard disk or an optical disk.
  • the storage unit 320 has map information 321, visit place information 322, customer information 323, and position information 324.
  • the map information 321 stores map data.
  • a position can be specified by latitude and longitude.
  • the map data may be divided into meshes, and the position may be specified by identification information for identifying each divided region.
  • the visit place information 322 stores the information of the visit place transmitted from the information processing terminal 200.
  • the information of the visited place is, for example, an address, an ID for identifying the visited place, and position information indicating the position of the visited place such as latitude and longitude. Further, in the map data stored in the map information 321, identification information for identifying each area divided into a mesh may be stored as position information.
  • the customer information 323 stores information on the customer.
  • the position information 324 stores the position information of the customer.
  • an example of the customer information 323 and the position information 324 will be described with reference to FIGS. 4 and 5.
  • FIG. 4 is a diagram showing an example of the customer information 323. As shown in FIG. 4, the customer information 323 has items such as “customer ID” and “address”.
  • Customer ID indicates identification information for identifying a customer. In this embodiment, it is assumed that the identification information matches the reference numerals used for the description. For example, the customer identified by the customer ID “C1” indicates the customer C1.
  • “Address” is the address of the customer's home, which is estimated by the estimating unit 332 described later.
  • information input by the user may be used based on store member information or the like.
  • the customer information is not limited to the address, but may include information about the customer, such as age, work location, and occupation. That is, the information on the customer is information indicating an area in which the customer is active, and for example, a place where the customer appearance rate is high, such as a customer's address (residence area), a place of work, a place frequently visited on a holiday, or a customer. May be a place that represents the lifestyle of In this embodiment, the area where the customer lives will be described as the area where the customer is active.
  • the address of the customer information is represented by a concept such as “A01”, but is actually represented by specific information.
  • the address item is indicated by identification information indicating an area divided into meshes in a map data, a prefecture name, a municipal name, and the like.
  • FIG. 4 shows that the address of the customer C1 indicated by the customer ID “C1” is “A01”.
  • FIG. 5 is a diagram showing an example of the position information 324. As shown in FIG. 5, the position information 324 has items such as “terminal ID”, “customer ID”, “acquisition date”, “position information”, and the like.
  • Terminal ID indicates identification information for identifying a customer terminal. For example, the terminal identified by the terminal ID “100-1” indicates the customer terminal 100-1.
  • “Acquisition date and time” indicates the date and time when the location information was acquired by the customer terminal 100 or the server device 300.
  • FIG. 5 shows an example in which the position information is stored every two hours or every day, actually, the position information is acquired at more detailed intervals (for example, every five minutes). Is also good.
  • “Position information” indicates position information of the customer terminal 100.
  • “position information” is indicated by a concept such as “AA01”, but is actually indicated by actual measurement values such as longitude and latitude, access point position information, and the position of a station ticket gate. May be done.
  • identification information indicating a divided area may be used.
  • FIG. 5 shows that the customer terminal 100-1 identified by the terminal ID “100-1” is a terminal used by the customer C1 identified by the customer ID “C1”.
  • the location information acquired at “August 1, 2018 @ 8:00” indicates that the customer terminal 100-1 is located at the location indicated by the location information “AA01”.
  • the location information acquired on “August 1, 2018 @ 10:00” indicates that the customer terminal 100-1 is located at the location indicated by the location information “AA02”. I have.
  • the control unit 330 is, for example, a controller, and various programs (corresponding to an example of a determination program) stored in a storage device inside the server device 300 are executed by a CPU or an MPU using a RAM as a work area. Is achieved.
  • the control unit 330 is a controller, and is realized by, for example, an integrated circuit such as an ASIC or an FPGA.
  • the control unit 330 includes an acquisition unit 331, an estimation unit 332, a visit rate calculation unit 333, an average calculation unit 334, a specification unit 335, and an output unit 336, and functions for information processing described below. Or effect.
  • the internal configuration of the control unit 330 is not limited to the configuration illustrated in FIG. 3, and may be another configuration as long as the configuration performs information processing described later.
  • the acquisition unit 331 acquires various information. For example, the obtaining unit 331 obtains information on a visited place from the information processing terminal 200 and stores the information in the visited place information 322. In addition, for example, the acquisition unit 331 specifies the customer terminal 100 based on information when the customer terminal 100 uses a dedicated application or a website, and continuously obtains position information of the customer terminal 100 from the specified customer terminal 100. To get. Specifically, the acquisition unit 331 acquires various pieces of information detected or acquired by the customer terminal 100 as position information. The acquisition unit 331 acquires position information from the customer terminal 100 at predetermined time intervals, and stores the acquired position information in the position information 324 of the storage unit 320.
  • the acquisition unit 331 does not need to acquire the position information itself used by each processing unit described below.
  • the acquisition unit 331 may acquire the position information of the customer terminal 100 based on the information detected from the customer terminal 100. Specifically, even when the visit rate calculation unit 333, which will be described later, uses the information indicating the area where the customer resides when calculating the visit rate, the acquisition unit 331 obtains the customer residence from the customer terminal 100. It is not necessary to acquire the region itself. That is, the acquisition unit 331 acquires the position information indicated by the longitude and the latitude from the customer terminal 100, and converts the information detected from the acquired longitude and the latitude into identification information for identifying the divided area on the map. Then, the converted information may be stored in the position information 324.
  • the acquisition unit 331 may acquire the position information together with the date and time information including the day of the week information.
  • the relationship between the date and time and the day of the week such as the position where the customer is located in the early morning of a weekday, the position where the customer is located during the daytime on weekdays, and the location where the customer is located on a holiday, is useful. Conceivable. For this reason, the acquisition unit 331 may increase the information amount of the position information to be acquired by acquiring the position information together with the date and time information including the day of the week information, so that more accurate estimation is performed.
  • the acquisition unit 331 does not necessarily need to acquire the position information at the same time as the time when the customer terminal 100 acquired the position information. That is, the acquisition unit 331 may acquire the position information stored in the storage unit of the customer terminal 100 when using it for processing instead of acquiring the position information in real time. Thereby, the server device 300 can reduce the processing amount for communication.
  • the acquisition unit 331 may acquire the communication status between the customer terminal 100 and another device as the position information. Specifically, the acquiring unit 331 acquires a communication state in which the customer terminal 100 is accessing the Internet or the like via an access point. In this case, the obtaining unit 331 obtains information detected from the communication status with the access point as position information. Specifically, the acquisition unit 331 may determine the installation position of the access point that is communicating with the customer terminal 100, and may acquire the determined installation position of the access point as the position information of the customer terminal 100. Further, the acquisition unit 331 acquires the position information of the customer terminal 100 by detecting the communication between the station ticket gate device and the customer terminal 100 as described above, or acquires the position information based on the IP address of the customer terminal 100. Or may be obtained. Further, the acquisition unit 331 may acquire the position information by using a customer's SNS (Social Networking Service) or the like.
  • SNS Social Networking Service
  • the estimating unit 332 estimates an area where the customer lives. For example, the estimating unit 332 estimates an area where the home of the customer holding the customer terminal 100 is estimated to be based on the position information of the customer terminal 100 in the early morning or evening of a weekday.
  • an example of estimating the address of the customer C1 holding the customer terminal 100-1 will be described with reference to FIG.
  • FIG. 6 is a diagram showing an example of estimating an address.
  • the map 60 is divided into a mesh. With the origin at the upper left of the map 60, a range indicated by coordinates of 1 vertically and 1 horizontally is defined as an area A11. Similarly, the range indicated by the coordinates of 2 vertically and 1 horizontally from the origin of the map 60 is the area A12, and the range indicated by 3 coordinates vertically and 1 horizontal is counted from the origin of the map 60 as the area A13. And
  • the estimation unit 332 maps a predetermined range in which the customer terminal 100-1 exists to coordinates, for example, as shown in FIG.
  • a range in which the customer terminal 100-1 is located at a high probability is indicated by hatching.
  • the probability distribution may indicate the probability of all the pieces of position information acquired for the customer, or may indicate the probability that the customer is located in a predetermined range when narrowed down to a specific time zone or day of the week. It may be something.
  • the area A55 is indicated by hatching. This indicates that the customer terminal 100-1 has been located within the range indicated by the area A55 for a relatively long time.
  • the region A55 indicates that in the probability distribution indicating the probability that the customer terminal 100-1 is located in the range indicated by the map 60, the location information corresponds to a range indicating a distribution value exceeding a predetermined threshold.
  • the estimating unit 332 determines that the customer terminal 100-1 is relatively frequently located in the range indicated by the area A55 in the early morning, night, or holiday on weekdays. I judge it. In this case, the estimation unit 332 estimates that the area indicated by the area A55 is an area where the home address of the customer C1 holding the customer terminal 100-1 exists, that is, the area where the customer resides.
  • the estimating unit 332 receives the setting for performing such estimation in advance, and executes the above-described estimation processing by comparing the received setting with the position information. Specifically, when the probability distribution in a predetermined range exceeds a predetermined threshold, the estimating unit 332 estimates that the address of the customer C1 exists in the range. As an example, the estimating unit 332 obtains the acquired location information of the customer terminal 100-1 (for example, the location information of the customer C1 acquired during a period of one week from 6:00 am to 8:00 am ), If the probability distribution indicating the probability that the customer C1 is located in a predetermined range exceeds “0.5 (50%)”, it is estimated that the address of the customer C1 exists in the range.
  • the probability distribution indicating the probability that the customer C1 is located in a predetermined range exceeds “0.5 (50%)”, it is estimated that the address of the customer C1 exists in the range.
  • the estimation unit 332 causes the customer information 323 of the storage unit 320 to store the area where the customer lives as estimated above as the customer's address.
  • the customer's address is given as an example of the region where the customer is active, which is estimated by the estimating unit 332, but the customer's work place and the like can be similarly estimated. That is, the estimating unit 332 can calculate a frequent appearance pattern of the customer based on the probability that the customer is located in the predetermined range, and can estimate a location representing the customer's lifestyle.
  • the area where the customer lives is described as the area where the customer is active.
  • the visit rate calculation unit 333 calculates the visit rate of the customer to the point (visit place) transmitted from the information processing terminal 200 for each predetermined area on the map.
  • the visit rate calculation unit 333 extracts a customer resident in a predetermined area of the map data based on the customer address stored in the customer information 323, and among the customers resident in the area, Calculate the percentage of customers who have visited the destination.
  • the predetermined area may be an area divided into meshes or administrative divisions, and can be freely set by a user who conducts business area analysis.
  • the visit rate calculation unit 333 determines, based on the position information 324, whether or not the position indicated by the position information of the customer is included in the area where the visited place exists. At this time, based on the date and time when the location information is detected, if the customer's location is included in the area where the visit location exists for a predetermined time or more (for example, 30 minutes or more), the customer visits the visit location. You may judge that you have.
  • the average calculation unit 334 calculates the average visit rate of the customer for each distance from the visited place. Specifically, the average calculation unit 334 extracts a customer who lives at a predetermined distance from the visited place based on the customer's address stored in the customer information 323, and extracts a customer who has visited the visited place among the customers. The ratio is calculated as an average visit rate at the distance.
  • FIG. 7 is a diagram showing a map on which visit locations are set. Since the map 60 shown in FIG. 7 is the same as the map 60 described in FIG. 6, repeated description will be omitted.
  • the visit rate calculation unit 333 When the visit place P is set on the map 60 as shown in FIG. 7, the visit rate calculation unit 333 outputs the visit place P among the customers who live in each of the areas A11, A12,..., A31,. Is calculated as a visit rate. That is, the visit rate calculation unit 333 extracts the customers who live in each area based on the customer addresses stored in the customer information 323, and calculates the ratio of the customers who have visited the visit place P from the position information of the customers. calculate.
  • the average calculation unit 334 calculates the ratio of the customers who have visited the visited place P among the customers living on the concentric circles R1, R2, R3, ... located at the distances r1, r2, r3, ... from the visited place P. , The average visit rate at that distance.
  • the specifying unit 335 specifies a characteristic region based on the visit rate calculated as described above. Specifically, the visit rate in a certain area is compared with the visit rate (average visit rate) at the distance from the visited place to the area, and if there is a significant difference, the area is specified as a characteristic area.
  • the visit rate of the area A31 (the distance from the visited point P is r3) and the visit rate on the concentric circle R3 (the distance from the visited point P is r3) (average visit rate) are compared.
  • FIG. 7 the visit rate of the area A31 (the distance from the visited point P is r3) and the visit rate on the concentric circle R3 (the distance from the visited point P is r3) (average visit rate) are compared.
  • the visit rate of the area A65 (the distance from the visit point P is r2) and the visit rate (the average visit rate) on the concentric circle R2 (the distance from the visit point P is r2) are calculated. Compare. That is, the visit rate of a certain area is compared with the average visit rate on concentric circles included in the area.
  • the specifying unit 335 corresponds to one function of an evaluation unit (not shown) that evaluates the visit rate. Specifically, based on the visit rate calculated as described above, the specifying unit 335 estimates the visit rate in a confidence section having a prescribed reliability (for example, 95%) for each prescribed area on the map. . Then, the characteristic region is specified based on the confidence interval of the estimated visit rate. Specifically, a characteristic area in which the confidence interval of the visit rate estimated in each area is out of the average visit rate in the distance from the visited place to the area is specified.
  • the characteristic region is specified based on the confidence interval for the following reason. That is, in the trade area analysis, it is not realistic to conduct a survey on the visit rate for all the residents in a certain area, and thus a sample survey is generally performed. However, since the visit rate differs depending on which inhabitants are extracted as a sample, the visit rate of all the inhabitants in a certain area is calculated based on only the visit rate of the customer in a certain area calculated by the visit rate calculating unit 333 as described above. Determining that is not accurate. Therefore, in the present embodiment, a visit rate having a certain width (confidence interval) is calculated. That is, the visit rate is estimated as "the visit rate exists in the section with a certain degree of reliability (for example, 95%)". (The smaller end point of the section is referred to as “lower confidence” and the larger end point is referred to as “upper confidence”.) By thus giving accuracy to the calculated visit rate, it is possible to accurately evaluate the calculation result. become able to.
  • the Wilson score method is used as a method for obtaining a confidence interval.
  • the Wald method normal distribution
  • the Clopper-Pearson exact method F distribution
  • the Agresti-Coull method Adjusted Wald method
  • FIG. 8 is a diagram showing an example of the visit rates of the areas A1 and A2.
  • regions A1 and A2 are regions located at the same distance r from the visited place, and the confidence intervals 81 and 82 (for example, 95% reliability) of the visit rates of the regions A1 and A2 and the average at the distance r. The visit rate is shown.
  • the average visit rate is included in the confidence interval 81 of the visit rate of the area A1.
  • the result matches the estimation result, in the present embodiment, it is determined that the visit rate of the area A1 does not have a significant difference.
  • the average visit rate is included in the confidence interval 82 of the visit rate of the area A2, it is determined that the visit rate of the area A2 has no significant difference.
  • the regions A1 and A2 do not have a significant difference in visit rate and are not characteristic regions.
  • FIG. 9 is a diagram illustrating an example of the visit rates of the areas A3 and A4.
  • regions A3 and A4 are regions located at the same distance r from the visited place, and the confidence intervals 91 and 92 (for example, 95% reliability) of the visit rates of the regions A3 and A4 and the average in the distance r. The visit rate is shown.
  • the confidence interval 91 of the visit rate in the area A3 and the confidence interval 92 of the visit rate in the area A4 are both out of the average visit rate. That is, for the confidence interval 91, the lower confidence limit exceeds the average visit rate, and for the confidence interval 92, the upper confidence limit does not exceed the average visit rate. In this case, since the estimation results do not match, in the present embodiment, it is determined that there is a significant difference between the visit rates of the regions A3 and A4, and the regions A3 and A4 are set as the characteristic regions.
  • the lower confidence limit exceeds the average visit rate it means that more people visit the visit place from the area than the average.
  • the upper confidence limit does not exceed the average visit rate it means that the number of visitors to the place of visit from that area is lower than the average.
  • the specifying unit 335 specifies the characteristic region based on whether or not the confidence interval of the visit rate estimated for each predetermined region is out of the average visit ratio in the distance from the visited place to the region.
  • the specifying unit 335 may include a calculation unit (not shown) that calculates a feature score indicating the degree of the average visit rate being out of the confidence interval. Then, a characteristic region is specified based on the characteristic score.
  • the visit rate of the area A located at the distance R from the visited place and the feature score about the average visit rate of the distance R can be expressed by the following formula.
  • (Feature score) (Lower confidence of area A visit rate) / (average visit rate of customers at distance R) ... (Upper confidence of visit rate in area A) / (average visit rate of customers at distance R) ... (in case of upper confidence ⁇ average visit rate) 1 ... (if none of the above)
  • the feature score is not limited to the above calculation method, and may be calculated as follows.
  • (Feature score) Logarithm of (lower confidence of visit rate in region A) / (average visit rate of customer at distance R) ... (in case of lower confidence> average visit rate) The logarithm of (the upper limit of the confidence of the visit rate in the area A) / (the average visit rate of the customer of the distance R) ... (in the case of the upper confidence limit ⁇ the average visit rate) 0 ... (if none of the above)
  • the identifying unit 335 may determine a significant difference based on the feature score calculated as described above, and identify the feature area based on the value of the feature score.
  • the output unit 336 outputs the characteristic region and / or characteristic score specified as described above.
  • the output unit 336 superimposes the characteristic region on the map data of the map information 321 stored in the storage unit 320 and transmits the map data to the information processing terminal 200 via the communication unit 310.
  • the user of the information processing terminal 200 can easily grasp where an area that particularly requires analysis is based on the feature region and the feature score superimposed on the transmitted map data.
  • FIG. 10 is a diagram showing an example of the output result.
  • the map 60 in FIG. 10 is the same as the diagram described in FIG. 7, and the characteristic region is hatched.
  • the regions A41, 51, 26, and 36 are lightly hatched, and the regions A13 and A74 are darkly hatched.
  • the light hatching means that the lower confidence limit exceeds the average visit rate, that is, more people than the average visit the visit place P.
  • Dark hatching means that the upper confidence limit does not exceed the average visit rate, that is, that fewer people than the average visit the visit place P. From the presentation of such characteristic regions, the data analyst may consider that the factors A26 and A36 and the regions A41 and 51 are close to the station when considering the sales strategy. It is easier to make a hypothesis such as whether to do it.
  • FIG. 11 is a flowchart showing the flow of the process of the server device 300. With reference to FIG. 11, the flow of processing in server device 300 will be described. Note that the process illustrated in FIG. 11 is an example of the process of the server device 300. The processing of the server device 300 may be combined with the processing of each functional configuration of the server device 300 described above.
  • step S101 the acquisition unit 331 determines whether the communication unit 310 has received position information from the customer terminal 100. If it is determined that the position information has not been received (N in step S101), the process returns to step S101.
  • step S102 the acquisition unit 331 acquires the position information from the communication unit 310 and stores the position information in the position information 324 of the storage unit 320.
  • step S ⁇ b> 103 the acquisition unit 331 determines whether the communication unit 310 has received, from the information processing terminal 200, information on a visited place that is a target of a trade area analysis. If it is determined that the information of the visited place has not been received (N in step S103), the process returns to step S101.
  • the visit rate calculation unit 333 resides in the predetermined place on the map with respect to the visited place. Calculate the customer visit rate.
  • the estimating unit 332 may estimate the area where the customer resides when calculating the visit rate, or may estimate the area where the customer resides in advance based on the position information acquired during a predetermined period. May be stored.
  • the customer information 323, such as a customer who works in the area or a customer who frequently stays on a holiday instead of a customer resident in the area, the customer's
  • the visit rate can also be calculated by the attribute.
  • step S105 the average calculation unit 334 calculates, for each distance from the visited place, an average visit rate to the visited place of the customer at the distance.
  • step S106 the specifying unit 335 specifies a characteristic region. That is, based on the visit rate of the customer calculated for each predetermined area, the visit rate is estimated with a predetermined reliability in the area. When the confidence interval of the estimated visit rate is out of the average visit rate at the distance from the visited place to the area, the visit area is identified as a characteristic area.
  • step S107 the output unit 336 outputs the characteristic region specified in step S106.
  • the output unit 336 superimposes a specific area on the map data stored in the map information 321 and transmits the map data to the information processing terminal 200 via the communication unit 310.
  • FIG. 12 is a specific example of a graph showing the distance from the place of visit and the visit rate.
  • the vertical axis indicates the visit rate
  • the horizontal axis indicates the distance from the visited place
  • reference numeral 10 indicates the average visit rate at each distance.
  • “ ⁇ ” indicated by the reference numeral 11 indicates the upper limit of the reliability of the visit rate in a certain region
  • “ ⁇ ” indicated by the reference numeral 12 indicates the lower limit of the reliability of the visit ratio in a certain region.
  • the upper confidence limit “ ⁇ ” and the lower confidence limit “ ⁇ ” are displayed as a pair for each region. It can be seen that the average visit rate is included in the confidence interval in some cases, and the average visit rate is out of the confidence interval in some cases.
  • FIG. 13 is a specific example of a graph showing the distance from the place of visit and the visit rate for the characteristic region.
  • the vertical axis indicates the visit rate
  • the horizontal axis indicates the distance from the visited place
  • reference numeral 20 indicates the average visit rate at each distance.
  • “ ⁇ ” indicated by the reference numeral 21 indicates the upper limit of the visit rate in a certain characteristic region
  • “ ⁇ ” indicated by the reference numeral 22 indicates the lower limit of the visit ratio in a certain characteristic region.
  • the upper confidence limit “ ⁇ ” does not exceed the average visit rate, or the lower confidence limit “ ⁇ ” indicates the average visit rate. Are shown.
  • FIG. 13 shows the average visit rate estimated with a predetermined reliability. That is, reference numeral 30 indicates the upper limit of the confidence of the average visit rate, and reference numeral 40 indicates the lower confidence of the average visit rate. For example, when the confidence upper limit of the visit rate does not exceed the confidence lower limit of the average visit rate, it may be determined that there is a significant difference. By giving accuracy to the average visit rate, a more accurate estimation result can be presented.
  • FIG. 14 is a block diagram illustrating a hardware configuration of the server device 300.
  • the server device 300 is mounted on a computer 401.
  • the computer 401 includes a CPU 402, a main storage device 403, an auxiliary storage device 404, and an interface 405.
  • each component of the server device 300 is stored in the auxiliary storage device 404 in the form of a program.
  • the CPU 402 reads the program from the auxiliary storage device 404, expands the program in the main storage device 403, and executes the above-described processing according to the program. Further, the CPU 402 secures a storage area in the main storage device 403 according to a program.
  • the program is a data analysis program that causes the computer 401 to analyze a business area of a point set on a map.
  • the auxiliary storage device 404 is an example of a non-transitory tangible medium.
  • Other examples of the non-transitory tangible medium include a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD-ROM, and a semiconductor memory connected via the interface 405.
  • the computer 401 that has received the program may load the program into the main storage device 403 and execute the processing.
  • the program may be for realizing a part of the functions described above. Further, the program may be a so-called difference file (difference program) that realizes the above-described functions in combination with another program already stored in the auxiliary storage device 404.
  • difference file difference program
  • the customer terminal 100 and the information processing terminal 200 may have the same configuration. The operation of each component in these devices is also realized by the CPU according to the program stored in the auxiliary storage device, similarly to the server device 300 described above.
  • the data analysis system evaluates a visit rate to a visit place set on a map, and specifies an area where the visit rate is characteristic.
  • the visit rate is characteristic.
  • a characteristic area indicating such a visit rate is specified based on the relationship with the average visit rate.
  • the characteristic region is specified based on the confidence interval. That is, in the trade area analysis, it is not realistic to conduct a survey on the visit rate for all the residents in a certain area, and thus a sample survey is generally performed. However, since the visit rate differs depending on which inhabitants are extracted as a sample, it is inaccurate to determine that the visit rate of all the inhabitants in a certain area is the visit rate of all the inhabitants only from the value of the visit rate of the customer in a certain area. Therefore, in the present embodiment, the visit rate is calculated with a predetermined reliability, and the calculated visit rate is given accuracy, whereby the calculation result can be accurately evaluated. Therefore, the user can make a more useful store opening strategy and sales strategy by the trade area analysis with the guaranteed accuracy.
  • the characteristic region is specified based on the characteristic score. Based on the feature score, it is possible to judge how significant the difference is, and it is possible to execute a more accurate trade area analysis.
  • 1 Data analysis system 100 customer terminal, 200 information processing terminal, 110 communication unit, 120 input unit, 130 display unit, 140 detection unit, 141 position detection unit, 150 control unit, 300 server device, 310 communication unit, 320 storage unit 321 map information, 322 visit place information, 323 customer information, 324 position information, 330 control section, 331 acquisition section, 332 estimation section, 333 visit rate calculation section, 334 average calculation section, 335 identification section, 336 output section, 401 Computer, 402 CPU, 403 main memory, 404 auxiliary memory, 405 interface

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

地図上に設定された地点に対する訪問率が特徴的なエリアを特定することができるデータ分析装置、データ分析システム、データ分析方法およびプログラムを提供する。 地図上に設定された地点の商圏を分析するデータ分析装置は、地図上の所定の領域ごとに、当該領域において活動する顧客の地点に対する訪問率を算出する訪問率算出部と、地点からの距離ごとに、当該距離において活動する顧客の地点に対する平均訪問率を算出する平均算出部と、訪問率算出部が算出した地図上の所定の領域ごとの訪問率、および平均算出部が算出した平均訪問率に基づいて、地図上の所定の領域ごとに推定される地点に対する訪問率を評価する評価部と、評価した結果を出力する出力部と、を備える。

Description

データ分析装置、データ分析システム、データ分析方法およびプログラム
 本開示は、データ分析装置、データ分析システム、データ分析方法およびプログラムに関する。
 近年、通信ネットワークを介して得られる多量の商品やサービスの売上、顧客の訪問率に関する情報などを利用して、販売戦略や出店戦略を立てるための商圏分析が行われている。例えば、特許文献1には、インターネットを通じて提供される地図アプリケーションを利用して、ユーザにとってより分かりやすい商圏分析を可能にするシステムが開示されている。
特開平10-307868号公報
 しかしながら、特許文献1に記載されたシステムでは、地図データ上で対象地域を選択し、選択した対象地域ごとに、店舗における売り上げの状況を示しているだけであって、売り上げに影響を与えている特徴的な地域に焦点を当てるような商圏分析を行うことは困難である。
 そこで、本開示は、上記課題を解決すべくなされたものであって、その目的は、地図上に設定された地点に対する訪問率が特徴的なエリアを特定することができるデータ分析装置、データ分析システム、データ分析方法およびプログラムを提供することである。
 上記目的を達成するため、本開示の第1の観点に係るデータ分析装置は、地図上に設定された地点の商圏を分析する装置であって、地図上の所定の領域ごとに、当該領域において活動する顧客の地点に対する訪問率を算出する訪問率算出部と、地点からの距離ごとに、当該距離において活動する顧客の地点に対する平均訪問率を算出する平均算出部と、訪問率算出部が算出した地図上の所定の領域ごとの訪問率、および平均算出部が算出した平均訪問率に基づいて、地図上の所定の領域ごとに推定される地点に対する訪問率を評価する評価部と、評価した結果を出力する出力部と、を備える。
 また、上記目的を達成するため、本開示の第2の観点に係るデータ分析システムは、地図上に設定された地点の商圏を分析するシステムであって、地図上の所定の領域ごとに、当該領域において活動する顧客の地点に対する訪問率を算出する訪問率算出部と、地点からの距離ごとに、当該距離において活動する顧客の地点に対する平均訪問率を算出する平均算出部と、訪問率算出部が算出した地図上の所定の領域ごとの訪問率、および平均算出部が算出した平均訪問率に基づいて、地図上の所定の領域ごとに推定される地点に対する訪問率を評価する評価部と、評価した結果を出力する出力部と、を備える。
 また、上記目的を達成するため、本開示の第3の観点に係るデータ分析方法は、地図上に設定された地点の商圏を分析する方法であって、地図上の所定の領域ごとに、当該領域において活動する顧客の地点に対する訪問率を算出するステップと、地点からの距離ごとに、当該距離において活動する顧客の地点に対する平均訪問率を算出するステップと、訪問率算出部が算出した地図上の所定の領域ごとの訪問率、および平均算出部が算出した平均訪問率に基づいて、地図上の所定の領域ごとに推定される地点に対する訪問率を評価するステップと、評価した結果を出力するステップと、を備える。
 また、上記目的を達成するため、本開示の第4の観点に係るプログラムは、上述のデータ分析方法をコンピュータに実行させる。
 本開示によれば、地図上に設定された訪問地に対する特徴的な地域を分析することができる。
本実施形態に係るデータ分析システム1の構成図である。 顧客端末100の機能構成の一例を示す機能ブロック図である。 サーバ装置300の機能構成の一例を示すブロック図である。 顧客情報323の一例を示す図である。 位置情報324の一例を示す図である。 住所の推定の一例を示す図である。 訪問地が設定された地図を示す図である。 領域A1及びA2の訪問率の一例を示す図である。 領域A3及びA4の訪問率の一例を示す図である。 出力結果の一例を示す図である。 サーバ装置300の処理の流れを示すフローチャートである。 訪問地からの距離と訪問率とを示したグラフの具体例である。 特徴領域について、訪問地からの距離と訪問率とを示したグラフの具体例である。 サーバ装置300のハードウェア構成を示すブロック図である。
 以下、本開示の実施形態について図面を参照して説明する。実施形態を説明する全図において、共通の構成要素には同一の符号を付し、繰り返しの説明を省略する。なお、以下に説明する実施形態は、特許請求の範囲に記載された本開示の内容を不当に限定するものではない。また、実施形態に示される構成要素のすべてが、本開示の必須の構成要素であるとは限らない。
 <実施の形態>
 本実施形態に係るデータ分析システム1は、地図上に設定された訪問地の商圏を分析するためのシステムである。商圏分析とは、例えば、ある店舗にどの地域から顧客が来ているのか、ある地域でどのような商品やサービスが売れるのかといったことを分析することであり、出店戦略や販売戦略を検討する際に行われる。
 本実施形態では、ある地点(例えば、店舗)に対する訪問率が特徴的なエリアを特定する。一般的に、店舗からの距離と訪問率とは相関があり、店舗から離れたエリアの住民ほど訪問率が下がることが知られている。しかしながら、実際には、地域の交通事情(例えば、高速道路へのアクセスの良さ)や、周辺施設等の状況(例えば、競合店舗の存在)により、このような相関関係にない訪問率を示すエリアがある。そこで、本実施形態では、このような訪問率を示す特徴的なエリアを、平均訪問率との関係に基づいて特定する。これにより、データ分析者に当該エリアを特に分析が必要なエリアとして提示し、出店戦略や販売戦略のための戦略マップとして利用させることができる。
 図1は、本実施形態に係るデータ分析システム1の構成図である。図1を参照して、データ分析システム1の構成およびその概要について説明する。
 図1において、データ分析システム1は、地図上に設定された地点の商圏を分析するためのシステムであって、複数の顧客端末100と、情報処理端末200と、サーバ装置300と、を備える。サーバ装置300は、ネットワークNWを介して、複数の顧客端末100及び情報処理端末200と通信可能に接続される。ネットワークNWは、例えばWAN(World Area Network)である。ここで、地図上に設定される地点とは、例えば、ショッピングセンターや、スーパーマーケット、百貨店等の店舗などであるが、これに限られず、観光地や、図書館や病院などの公共施設、または駅などの交通機関であってもよい。なお、以下の説明では、商圏分析の対象となる地点を、訪問地と言い換えて記載する場合がある。
 顧客端末100は、顧客によって利用される情報処理端末であって、顧客端末100は、例えば、スマートフォンやタブレット端末等によって実現される。なお、本実施形態では、顧客とは、データ分析システム1において利用する位置情報をサーバ装置300に取得させるプログラム(例えば、スマートフォン専用のアプリ)をインストールした情報処理端末を保有する者のことをいうが、これに限られず、サーバ装置300が端末自体の位置情報を取得できるのであれば、どのような形態であってもよく、上述のような店舗等の会員や常連客、一度しか訪れていない客、サービスや商取引は行わず立ち寄っただけの客なども含めて良い。
 顧客端末100は、顧客端末100にインストールされたプログラム(例えば、スマートフォン専用のアプリ)を介して、位置情報を継続的に取得する。例えば、GPS(Global Positioning System)を利用して、自装置が存在する位置を示す情報である位置情報を検知する。そして、顧客端末100は、例えば、サーバ装置300の要求に従い、検知した位置情報をサーバ装置300に継続的に送信する。
 情報処理端末200は、商圏分析を行うユーザによって利用される情報処理端末であって、例えば、スマートフォンやタブレット端末、PC(Personal Computer)等によって実現される。情報処理端末200は、商圏分析を行うユーザの操作を受けて、例えば、ブラウザのアプリケーションプログラムを起動し、当該ユーザにより設定される訪問地(商圏分析の対象となる地点)を示す情報を、サーバ装置300に送信する。なお、情報処理端末200は、図1に図示した数に限られず、複数台であってもよい。
 サーバ装置300は、地図上に設定された地点に対する訪問率が特徴的なエリアを特定するデータ分析装置に相当するサーバ装置である。サーバ装置300は、情報処理端末200から、訪問地を示す情報を取得すると、顧客端末100から受信した位置情報に基づいて訪問率を算出する。そして、訪問率が特徴的なエリア(特徴領域)を特定し、地図上に特徴領域を重ねて出力して情報処理端末200へ送信する。この際、訪問率が平均訪問率を外れている度合いをスコアなどで評価し、当該スコアを出力してもよい。特徴領域の特定方法については後述する。
 以上のように、訪問率が特徴的なエリアを地図上に重ねて表示することで、商圏分析を行うユーザは、当該エリアを、特に分析が必要なエリアとして容易に把握することができる。
 図2は、顧客端末100の機能構成の一例を示す機能ブロック図である。図2を参照して、顧客端末100の機能構成について説明する。なお、本実施形態の顧客端末100は、図2の構成要素(各部)の一部を省略した構成としてもよい。また、本実施形態の情報処理端末200を、顧客端末100と同様の機能構成としてもよく、情報処理端末200の機能構成については説明を省略する。
 顧客端末100は、例えば、スマートフォンを含む携帯電話機や、タブレット端末や、ノート型PCや、PDA(Personal Digital Assistant)等の携帯端末である。また、顧客端末100には、眼鏡型や時計型の情報処理端末であるウェアラブルデバイス(wearable device)も含まれる。さらに、顧客端末100には、位置情報を取得するための情報処理機能を有する種々のスマート機器が含まれてもよい。例えば、顧客端末100には、自動車などのスマートビークル(Smart vehicle)などが含まれてもよい。
 図2において、顧客端末100は、通信部110と、入力部120と、表示部130と、検知部140と、制御部150とを有する。
 通信部110は、サーバ装置300と、ネットワークNWを介した通信を行うための各種制御を行うものであり、その機能は、各種プロセッサ又は通信用ASICなどのハードウェアや、プログラムなどにより実現できる。
 入力部120は、ユーザから各種操作を受け付ける入力インターフェイスである。例えば、入力部120は、顧客端末100に備えられた操作キーやボタン、タッチパネル、音声入力のためのマイク等によって実現される。
 表示部130は、各種情報を表示するための表示装置であって、例えば、液晶ディスプレイ等によって実現される。なお、顧客端末100にタッチパネルが採用される場合には、入力部120の一部と表示部130とは一体化される。
 検知部140は、顧客端末100に関する各種情報を検知する。具体的には、検知部140は、顧客端末100の物理的な状態を検知する。図2に示した例では、検知部140は、位置検知部141を有する。
 位置検知部141は、顧客端末100の現在位置を検知する。具体的には、位置検知部141は、衛星測位システムから送出される電波を受信し、受信した電波に基づいて顧客端末100の現在位置を示す位置情報(例えば、緯度及び経度)を検知する。なお、位置検知部141は、異なる手法により位置情報を取得してもよい。例えば、顧客端末100が駅改札や商店等で使用される非接触型ICカードと同等の機能を備えている場合(もしくは、顧客端末100が非接触型ICカードの履歴を読み取る機能を備えている場合)、顧客端末100によって駅での乗車料金の決済等が行われた情報とともに、使用された位置が記録される。位置検知部141は、この情報を検知し、位置情報として取得する。また、位置検知部141は、顧客端末100が特定のアクセスポイントと通信を行う際に、アクセスポイントから取得可能な位置情報を検知してもよい。また、位置検知部141は、顧客端末100がインターネットに接続された際の識別情報(IPアドレス等)に基づいて、顧客端末100が所在すると推定される位置を検知してもよい。
 なお、検知部140は、位置検知部141に限られず、顧客端末100の種々の状態を検知する各種機器を有してもよい。例えば、検知部140は、顧客端末100の周囲の音を収集するマイクロフォンや、顧客端末100の周囲の照度を検知する照度センサや、顧客端末100の物理的な動きを検知する加速度センサ(又は、ジャイロセンサなど)や、顧客端末100の周囲の湿度を検知する湿度センサや、顧客端末100の所在位置における磁場を検知する地磁気センサ等を有してもよい。また、検知部140は、センサの機能を用いて、種々の情報を検知するようにしてもよい。例えば、検知部140は、加速度センサの機能を用いて、顧客端末100を利用する顧客の歩行数を検知してもよい。また、検知部140は、加速度センサの機能を用いて、顧客端末100が動作しているか、静止しているか、などを示す動作情報を一定時間ごとや、顧客端末100が動作したタイミングごとに検知してもよい。
 制御部150は、例えば、コントローラ(controller)であり、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、顧客端末100内部の記憶装置に記憶されている各種プログラムがRAM(Random Access Memory)を作業領域として実行されることにより実現される。また、制御部150は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
 制御部150は、サーバ装置300に顧客端末100の位置情報を提供する処理を制御する。例えば、制御部150は、顧客端末100の位置情報の提供処理を実現するためのプログラム(例えば、スマートフォン専用アプリ)を実行制御する。プログラムは、予め顧客端末100にインストールされていてもよいし、顧客端末100を保有する顧客による操作に従ってサーバ装置300(または、各種プログラムを提供する外部サーバ)からダウンロードされ、顧客端末100にインストールされてもよい。
 制御部150は、以下に説明する情報処理の機能や作用を、RAMを作業領域として上述したプログラムを実行することにより、実現または実行する。
 制御部150は、検知部140を制御することにより、検知部140によって検知される各種情報を位置情報として取得する。例えば、制御部150は、位置検知部141を制御することにより、位置情報として、顧客端末100の位置情報と、位置情報が検知された時間に対応する時間情報を取得する。
 また、制御部150は、位置情報として、通信部110が行う通信の状況に関する情報を取得してもよい。例えば、制御部150は、顧客端末100と所定のアクセスポイントにおける相互の通信状況を取得してもよい。また、制御部150は、顧客端末100が通話機能を有する場合には、通話が行われた時間や、通話先や、通話時間などの情報を取得してもよい。また、制御部150は、顧客端末100が撮影機能を有する場合には、撮影が行われた時間や、撮影が行われた位置情報や、撮影時間などの情報を取得してもよい。そして、制御部150は、これらの情報に基づいて、顧客端末100の位置情報を取得してもよい。
 また、制御部150は、例えば、定期的(1分毎、3分毎、5分毎、1時間毎など)に位置情報を取得するようにしてもよい。また、制御部150が位置情報を取得するタイミングは、サーバ装置300によって設定されてもよい。また、制御部150は、所定のイベントが発生するタイミングで位置情報を取得するようにしてもよい。例えば、制御部150は、所定のイベントとして、上述した非接触型ICカード機能が利用されたときや、カメラ撮影が行われたときなどに応じて、位置情報を取得する。
 また、制御部150は、通信部110に対し、取得した位置情報をサーバ装置300に送信するよう制御する。例えば、通信部110は、制御部150の制御により、顧客端末100を識別するための識別情報と、検知部140によって検知された位置情報と、かかる位置情報が検知された日時とをサーバ装置300に送信する。このとき、制御部150は、位置情報を取得するたびに位置情報等をサーバ装置300に送信してもよいし、所定の期間毎に位置情報等をサーバ装置300に送信してもよい。例えば、制御部150は、通信部110に対し、定期的(1分毎、3分毎、5分毎、1時間毎など)に、位置情報をサーバ装置100に送信するよう制御する。
 図3は、サーバ装置300の機能構成の一例を示すブロック図である。図3を参照して、サーバ装置300の機能構成について説明する。
 サーバ装置300は、通信部310と、記憶部320と、制御部330とを有する。なお、サーバ装置300は、サーバ装置300を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
 通信部310は、顧客端末100や情報処理端末200と、ネットワークNWを介した通信を行うための各種制御を行うものであり、その機能は、各種プロセッサ又は通信用ASICなどのハードウェアや、プログラムなどにより実現できる。
 記憶部320は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部320は、地図情報321と、訪問地情報322と、顧客情報323と、位置情報324と、を有する。
 地図情報321は、地図データを記憶する。地図データは、例えば、緯度と経度によって位置を特定することができる。また、地図データをメッシュ状に分割し、分割された各領域を識別する識別情報によって位置を特定してもよい。
 訪問地情報322は、情報処理端末200から送信された訪問地の情報を記憶する。訪問地の情報は、例えば、住所、訪問地を識別するID、緯度や経度などの訪問地の位置を示す位置情報である。また、地図情報321が記憶する地図データにおいて、メッシュ状に分割された各領域を識別する識別情報を位置情報として記憶してもよい。
 顧客情報323は、顧客に関する情報を記憶する。位置情報324は、顧客の位置情報を記憶する。ここで、図4および図5を用いて、顧客情報323および位置情報324の一例について説明する。
 図4は、顧客情報323の一例を示す図である。図4に示すように、顧客情報323は、「顧客ID」、「住所」等の項目を有する。
 「顧客ID」は、顧客を識別する識別情報を示す。なお、本実施形態において、識別情報は、説明に用いる参照符号と一致するものとする。例えば、顧客ID「C1」で識別される顧客は、顧客C1を示す。
 「住所」は顧客の自宅の住所であり、後述する推定部332によって推定される。なお、店舗の会員情報などにより、ユーザから入力された情報を用いてもよい。また、顧客情報は、住所に限らず、この他にも、年齢や勤務地、職業など、顧客に関する情報を含ませてもよい。すなわち、顧客に関する情報は、顧客が活動する領域を示す情報であって、例えば、顧客の住所(居住する領域)や、勤務先、休日によく行く場所など、顧客の出現率が高い場所、顧客のライフスタイルを表す場所であってもよい。なお、本実施形態では、顧客が居住する領域を、顧客が活動する領域として説明する。
 図4において、顧客情報の住所は、「A01」のような概念で示しているが、実際には、具体的な情報によって示される。例えば、住所の項目は、地図データにおいて、メッシュ状に分割された領域を示す識別情報や、都道府県名や区市町村名等によって示される。
 すなわち、図4では、顧客ID「C1」によって示される顧客C1の住所は「A01」であることを示している。
 図5は、位置情報324の一例を示す図である。図5に示すように、位置情報324は、「端末ID」、「顧客ID」、「取得日時」、「位置情報」等の項目を有する。
 「端末ID」は、顧客端末を識別する識別情報を示す。例えば、端末ID「100-1」で識別される端末は、顧客端末100-1を示す。
 「取得日時」は、位置情報が顧客端末100又はサーバ装置300によって取得された日時を示す。なお、図5では、位置情報を2時間ごとや一日ごとに記憶している例を示しているが、実際には、より詳細な間隔(例えば、5分間隔)で位置情報が取得されてもよい。「位置情報」は、顧客端末100の位置情報を示す。図5では、「位置情報」は、「AA01」のような概念で示しているが、実際には、経度及び緯度などの実測値や、アクセスポイントの位置情報や、駅改札の位置などによって示されてもよい。また、地図データにおいて、分割された領域を示す識別情報でもよい。
 すなわち、図5では、端末ID「100-1」で識別される顧客端末100-1は、顧客ID「C1」で識別される顧客C1に利用される端末であることを示している。また、位置情報の一例として、「2018年8月1日 8:00」に取得された位置情報は、位置情報「AA01」が示す位置に顧客端末100-1が所在することを示している。また、位置情報の他の一例として、「2018年8月1日 10:00」に取得された位置情報は、位置情報「AA02」が示す位置に顧客端末100-1が所在することを示している。
 図3に戻って、制御部330について説明する。制御部330は、例えば、コントローラであり、CPUやMPU等によって、サーバ装置300内部の記憶装置に記憶されている各種プログラム(判定プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部330は、コントローラであり、例えば、ASICやFPGA等の集積回路により実現される。
 制御部330は、取得部331と、推定部332と、訪問率算出部333と、平均算出部334と、特定部335と、出力部336と、を有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部330の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
 取得部331は、各種情報を取得する。例えば、取得部331は、情報処理端末200から訪問地の情報を取得し、訪問地情報322へ記憶させる。また、例えば、取得部331は、顧客端末100が専用のアプリケーションやウェブサイトを利用した際の情報等によって顧客端末100を特定し、特定した顧客端末100から、顧客端末100の位置情報を継続的に取得する。具体的には、取得部331は、位置情報として、顧客端末100によって検知されたり、取得されたりした各種情報を取得する。取得部331は、所定の時間間隔で顧客端末100から位置情報を取得し、取得した位置情報を記憶部320の位置情報324に記憶させる。
 なお、取得部331は、後述する各処理部が利用する位置情報そのものを取得することを要しない。例えば、取得部331は、顧客端末100から検出される情報に基づいて、顧客端末100の位置情報を取得するようにしてもよい。具体的には、後述する訪問率算出部333が訪問率を算出する際に、顧客の居住する領域を示す情報を利用する場合であっても、取得部331は、顧客端末100から顧客の居住する領域そのものを取得することを要しない。すなわち、取得部331は、顧客端末100からは経度及び緯度によって示される位置情報を取得し、取得した経度及び緯度から検出される情報を、地図上の分割された領域を識別する識別情報に変換し、変換した情報を位置情報324に格納するようにしてもよい。
 また、取得部331は、曜日情報を含めた日時情報とともに位置情報を取得するようにしてもよい。顧客の自宅を推定するには、例えば、顧客が平日の早朝に所在する位置や、平日の昼間に所在する位置や、休日に所在する位置など、日時や曜日との関係性が有用であると考えられる。このため、取得部331は、曜日情報を含めた日時情報とともに位置情報を取得することで取得する位置情報の情報量を高め、より精度の高い推定が行われるようにしてもよい。
 また、取得部331は、必ずしも顧客端末100が位置情報を取得した時間と同じ時間に位置情報を取得しなくてもよい。すなわち、取得部331は、リアルタイムに位置情報を取得するのではなく、処理に利用する際に、顧客端末100の記憶部に記憶されている位置情報を取得するようにしてもよい。これにより、サーバ装置300は、通信のための処理量を削減することができる。
 また、取得部331は、位置情報として、顧客端末100と他の装置における通信の状況を取得してもよい。具体的には、取得部331は、顧客端末100がアクセスポイントを介してインターネットなどにアクセスしている通信状況を取得する。この場合、取得部331は、アクセスポイントとの通信状況から検出される情報を位置情報として取得する。具体的には、取得部331は、顧客端末100と通信中のアクセスポイントの設置位置を割り出し、割り出したアクセスポイントの設置位置を、顧客端末100の位置情報として取得するようにしてもよい。また、取得部331は、上述のように、駅改札の装置と顧客端末100との通信を検出することで顧客端末100の位置情報を取得したり、顧客端末100のIPアドレスに基づいて位置情報を取得したりしてもよい。また、取得部331は、顧客のSNS(Social Networking Service)等により、位置情報を取得してもよい。
 推定部332は、顧客の居住する領域を推定する。例えば、推定部332は、平日の早朝や夜における顧客端末100の位置情報に基づいて、顧客端末100を保有する顧客の自宅があると推定される地域を推定する。ここで、図6を用いて、顧客端末100-1を保有する顧客C1の住所の推定の例について説明する。
 図6は、住所の推定の一例を示す図である。図6において、地図60は、メッシュ状に分割されている。地図60の左上を原点として、縦に1、横に1の座標によって示される範囲を領域A11とする。同様に、地図60の原点から数えて縦に2、横に1の座標によって示される範囲を領域A12、地図60の原点から数えて縦に3、横に1の座標によって示される範囲を領域A13とする。
 推定部332は、例えば図6に示すように、位置情報と照らして、顧客端末100-1が存在する所定範囲を座標にマッピングする。地図60では、顧客端末100-1から取得される位置情報において、顧客端末100-1が所在する確率の高い(すなわち、確率分布の高い)範囲をハッチングで示すものとする。なお、確率分布は、顧客に関して取得された位置情報の全情報における確率を示すものであってもよいし、特定の時間帯や曜日に絞った場合に、顧客が所定範囲に所在する確率を示すものであってもよい。
 図6に示す例では、領域A55が、ハッチングで示される。これは、顧客端末100-1が、領域A55が示す範囲内に比較的長い時間所在していることを示す。例えば、領域A55は、地図60に示される範囲における顧客端末100-1が所在する確率を示す確率分布において、所定の閾値を超える分布の値を示す範囲に対応する位置情報であることを示す。
 さらに、推定部332は、位置情報324に格納された顧客端末100-1の位置情報から、顧客端末100-1が平日の早朝や夜、休日等に、領域A55が示す範囲に比較的多く所在すると判断する。この場合、推定部332は、領域A55が示す範囲が、顧客端末100-1を保有する顧客C1の自宅住所が存在する範囲、すなわち、顧客が居住する領域であると推定する。
 例えば、推定部332は、このような推定を行うための設定を予め受け付けておき、受け付けた設定と位置情報とを照合することにより、上記の推定処理を実行する。具体的には、推定部332は、所定範囲の確率分布が所定の閾値を超える場合に、当該範囲に顧客C1の住所が存在すると推定する。一例としては、推定部332は、取得した顧客端末100-1の位置情報(例えば、期間を1週間として、朝6時から朝8時までの時間帯に絞って取得された顧客C1の位置情報)のうち、所定範囲に顧客C1が所在する確率を示す確率分布が「0.5(50%)」を超える場合に、当該範囲に顧客C1の住所が存在すると推定する。
 推定部332は、以上のようにして推定した顧客が居住する領域を顧客の住所として記憶部320の顧客情報323に記憶させる。上記では、推定部332によって推定される顧客が活動する領域の例として、顧客の住所を挙げたが、同様にして、顧客の勤務先等も推定することができる。すなわち、推定部332は、顧客が所定範囲に所在する確率に基づいて、顧客の頻出出現パターンを算出し、顧客のライフスタイルを表す場所を推定することができる。
 なお、上述したように、本実施形態では、顧客が居住する領域を、顧客が活動する領域として記載する。
 図3に戻って、訪問率算出部333は、地図上の所定の領域ごとに、情報処理端末200から送信された地点(訪問地)に対する顧客の訪問率を算出する。
 具体的には、訪問率算出部333は、顧客情報323に記憶された顧客の住所に基づいて、地図データの所定の領域に居住する顧客を抽出し、当該領域内に居住する顧客のうち、訪問地を訪れた顧客の割合を算出する。なお、所定の領域は、メッシュ状に分割した領域や、行政区画であってもよく、商圏分析を行うユーザが自由に設定することができる。
 すなわち、商圏分析の対象地域を所定の領域で分割した領域Ai(i=1~n:nは自然数)の顧客の訪問率は、次の式(1)で表すことができる。
 (領域Aiの顧客の訪問率)=(訪問地を訪れた、領域Aiに居住する顧客の数)/(領域Aiに居住する顧客の数) … 式(1)
 ここで、ある顧客が訪問地を訪れたか否かは、取得した当該顧客の位置情報から判断する。例えば、訪問率算出部333は、位置情報324に基づいて、当該顧客の位置情報が示す位置が、訪問地の存在する領域に含まれているかを判断する。この際、位置情報が検知された日時に基づいて、所定時間以上(例えば、30分以上など)、顧客の位置が訪問地の存在する領域に含まれている場合を、顧客が訪問地を訪れたと判断してもよい。また、ある顧客について取得した位置情報の全データに対する、訪問地の存在する領域に含まれている位置情報のデータ数の割合が所定の閾値以上である場合を、顧客が訪問地を訪れたと判断してもよい。
 平均算出部334は、訪問地からの距離ごとの顧客の平均訪問率を算出する。具体的には、平均算出部334は、顧客情報323に記憶された顧客の住所に基づいて、訪問地から所定の距離に居住する顧客を抽出し、当該顧客のうち訪問地を訪れた顧客の割合を、当該距離における平均訪問率として算出する。
 すなわち、商圏分析の対象地域において、訪問地からの距離Ri(i=1~m:mは自然数)の平均訪問率は、次の式(2)で表すことができる。
 (距離Riの顧客の平均訪問率)=(訪問地を訪れた、訪問地から距離Riに居住する顧客の数)/(距離Riに居住する顧客の数) … 式(2)
 ここで、図7を用いて、訪問率算出部333が算出する領域ごとの顧客の訪問率および平均算出部334が算出する距離ごとの顧客の平均訪問率について具体的に説明する。
 図7は、訪問地が設定された地図を示す図である。図7において示される地図60は、図6で説明した地図60と同じであるため、繰り返しの説明は省略する。
 図7に示すように地図60において訪問地Pが設定されると、訪問率算出部333は、各領域A11,A12,…,A31,…,A65,…に居住する顧客のうち、訪問地Pを訪れた顧客の割合を訪問率として算出する。すなわち、訪問率算出部333は、顧客情報323に記憶された顧客の住所に基づいて、各領域に居住する顧客を抽出し、当該顧客の位置情報から、訪問地Pを訪れた顧客の割合を算出する。
 また、平均算出部334は、訪問地Pから距離r1,r2,r3,…の位置にある同心円R1,R2,R3,…上に居住する顧客のうち、訪問地Pを訪れた顧客の割合を、その距離における平均訪問率として算出する。
 本実施形態では、以上のようにして算出された訪問率に基づいて、後述する特定部335が、特徴領域を特定する。具体的には、ある領域における訪問率が、訪問地からその領域までの距離における訪問率(平均訪問率)と比較し、有意な差があれば、その領域を特徴領域として特定する。図7の例では、領域A31(訪問地Pからの距離がr3)の訪問率と、同心円R3(訪問地Pから距離がr3)上の訪問率(平均訪問率)とを比較する。また、図7の他の例では、領域A65(訪問地Pからの距離がr2)の訪問率と、同心円R2(訪問地Pからの距離がr2)上の訪問率(平均訪問率)とを比較する。すなわち、ある領域の訪問率は、当該領域に含まれる同心円上の平均訪問率と比較される。
 図3に戻って、特定部335は、訪問率を評価する評価部(不図示)の一機能に相当する。具体的には、特定部335は、上述したように算出された訪問率に基づいて、地図上の所定の領域ごとに所定の信頼度(例えば、95%)の信頼区間で訪問率を推定する。そして、推定された訪問率の信頼区間に基づいて、特徴領域を特定する。具体的には、各領域において推定される訪問率の信頼区間が、訪問地から当該領域までの距離における平均訪問率を外れている特徴領域を特定する。
 信頼区間に基づいた特徴領域の特定を行うのは、以下の理由による。すなわち、商圏分析において、ある領域の全住民を対象として訪問率の調査を行うことは現実的ではないため、一般的には標本調査が行われる。しかしながら、標本としてどの住民を抽出したかによって訪問率は異なるため、上述のように訪問率算出部333が算出した、ある領域における顧客の訪問率の値のみから、ある領域における全住民の訪問率であると断定することは、正確さに欠ける。そこで、本実施形態では、ある幅(信頼区間)をもった訪問率を算出する。すなわち、「ある信頼度(例えば、95%)で訪問率がその区間に存在する」として訪問率を推定する。(区間の小さい方の端点を「信頼下限」、大きい方の端点を「信頼上限」と呼ぶ。)このように、算出した訪問率に精度を与えることで、算出結果を的確に評価することができるようになる。
 なお、本実施形態では、信頼区間を求める手法として、Wilsonのスコア法を用いるが、この他にも、Wald法(正規分布)、Clopper-Pearsonの正確法(F分布)、Agresti-Coull法(調整Wald法)、Jeffeys法などを用いることができる。なお、これらは公知の手法であるから、詳細な説明は省略する。
 図8および図9を用いて、特徴領域の特定についてさらに説明する。
 図8は、領域A1及びA2の訪問率の一例を示す図である。図8において、領域A1およびA2は、訪問地から同じ距離rにある領域であり、領域A1,A2の訪問率の信頼区間81,82(例えば、信頼度95%)、および、距離rにおける平均訪問率が示されている。
 ここで、平均訪問率は、領域A1の訪問率の信頼区間81に含まれている。この場合、推定結果と一致しているため、本実施形態では、領域A1の訪問率は、有意な差がないと判断することとする。同様に、平均訪問率は、領域A2の訪問率の信頼区間82に含まれているため、領域A2の訪問率は、有意な差がないと判断する。
 すなわち、領域A1およびA2は、訪問率に有意な差がなく、特徴領域ではないと判断する。
 図9は、領域A3及びA4の訪問率の一例を示す図である。図9において、領域A3およびA4は、訪問地から同じ距離rにある領域であり、領域A3,A4の訪問率の信頼区間91,92(例えば、信頼度95%)、および、距離rにおける平均訪問率が示されている。
 ここで、領域A3の訪問率の信頼区間91および領域A4の訪問率の信頼区間92は、ともに平均訪問率から外れている。すなわち、信頼区間91については、信頼下限が平均訪問率を超えており、信頼区間92については、信頼上限が平均訪問率を超えていない。この場合、推定結果と一致していないため、本実施形態では、領域A3およびA4の訪問率は、有意な差があると判断し、領域A3およびA4を、特徴領域とする。なお、信頼下限が平均訪問率を超えている場合は、その領域から訪問地を訪れる人が平均よりも多いことを意味している。また、信頼上限が平均訪問率を超えていない場合は、その領域から訪問地を訪れる人が平均よりも少ないことを意味している。
 上述のように、特定部335は、所定の領域ごとに推定される訪問率の信頼区間が、訪問地から当該領域までの距離における平均訪問率を外れているか否かで特徴領域を特定する。
 また、特定部335は、平均訪問率が信頼区間から外れている度合いを示す特徴スコアを計算する計算部(不図示)を含んでもよい。そして、特徴スコアに基づいて、特徴領域を特定する。
 例えば、訪問地から距離Rにある領域Aの訪問率と、距離Rの平均訪問率についての特徴スコアは、次の式で表すことができる。
 (特徴スコア)=
  (領域Aの訪問率の信頼下限)/(距離Rの顧客の平均訪問率)…(信頼下限>平均訪問率の場合)
  (領域Aの訪問率の信頼上限)/(距離Rの顧客の平均訪問率)…(信頼上限<平均訪問率の場合)
  1…(上記いずれでもない場合)
 例えば、平均訪問率が0.50、信頼度95%で推定された訪問率が0.35(信頼下限)<(訪問率)<0.42(信頼上限)の場合、信頼上限は平均訪問率未満であるから、特徴スコアは、0.84(=0.42/0.50)である。また、平均訪問率が0.28、0.24(信頼下限)<(訪問率)<0.32(信頼上限)の場合は、特徴スコアは1である。
 なお、特徴スコアは、上記の算出方法に限られず、次のように算出してもよい。
 (特徴スコア)=
  (領域Aの訪問率の信頼下限)/(距離Rの顧客の平均訪問率)の対数…(信頼下限>平均訪問率の場合)
  (領域Aの訪問率の信頼上限)/(距離Rの顧客の平均訪問率)の対数…(信頼上限<平均訪問率の場合)
  0…(上記いずれでもない場合)
 特定部335は、上述のように算出された特徴スコアにより有意差を判定し、特徴スコアの値に基づいて、特徴領域を特定してもよい。
 図3に戻って、出力部336は、以上のように特定された特徴領域および/または特徴スコアを出力する。例えば、出力部336は、記憶部320に記憶された地図情報321の地図データに特徴領域を重ね合わせ、通信部310を介して、情報処理端末200に送信する。情報処理端末200のユーザは、送信された地図データに重ね合わされた特徴領域や特徴スコアにより、特に分析が必要なエリアがどこかを容易に把握することができる。
 図10は、出力結果の一例を示す図である。図10の地図60は、図7で説明した図と同じものであり、特徴領域には、ハッチングがされている。例えば、領域A41,51,26,36には、薄いハッチング、領域A13,A74には濃いハッチングがされている。薄いハッチングは、信頼下限が平均訪問率を超えている、すなわち、平均よりも多い人数が訪問地Pを訪れていることを意味している。濃いハッチングは、信頼上限が平均訪問率を超えていない、すなわち、平均よりも少ない人数しか訪問地Pを訪れていないことを意味している。このような特徴領域の提示から、データ分析者は、販売戦略を考える際に、領域A26,A36や領域A41,51は駅に近いのが要因ではないか、領域A13やA74は競合店が存在するのではないか、などの仮説を立てやすくなる。
 このように、特徴領域を提示することにより、訪問率に影響を与える何らかの要因が存在するとの仮説を立てやすくなる。例えば、そのような特徴領域には、競合する店舗が存在するため、訪問率が低かったり、高速道路へのアクセスがよいため、遠方の店舗であっても訪問率が高かったり、などの要因が存在すると考えられる。商圏分析の際、ユーザは特徴領域が提示されることにより、その領域特有の事情についてより注意深く分析するきっかけを得ることができる。
 図11は、サーバ装置300の処理の流れを示すフローチャートである。図11を参照して、サーバ装置300における処理の流れを説明する。なお、図11で示す処理は、サーバ装置300の処理の一例である。サーバ装置300の処理として、この他にも、上述したサーバ装置300の各機能構成の処理を組み合わせてもよい。
 ステップS101において、取得部331は、通信部310が、顧客端末100から位置情報を受信したかを判断する。位置情報を受信していないと判断した場合(ステップS101において、N)、処理はステップS101に戻る。
 一方、位置情報を受信したと判断した場合(ステップS101において、Y)、ステップS102において、取得部331は、通信部310から位置情報を取得し、記憶部320の位置情報324に記憶させる。
 ステップS103において、取得部331は、通信部310が、情報処理端末200から商圏分析の対象である訪問地の情報を受信したかを判断する。訪問地の情報を受信していないと判断した場合(ステップS103において、N)、処理はステップS101に戻る。
 一方、訪問地の情報を受信したと判断した場合(ステップS103において、N)、ステップS104において、訪問率算出部333は、地図上の所定の領域ごとに、訪問地に対する、当該領域に居住する顧客の訪問率を算出する。なお、推定部332は、訪問率を算出する際に顧客の居住する領域を推定してもよいし、所定期間において取得した位置情報に基づいて予め顧客の居住する領域を推定し、顧客情報323に記憶させておいてもよい。また、当該領域に居住する顧客ではなく、当該領域に勤務する顧客や、休日によく滞在する顧客など、顧客情報323に記憶された顧客に関する情報(顧客の活動する領域)に基づいて、顧客の属性によって訪問率を算出することもできる。
 ステップS105において、平均算出部334は、訪問地からの距離ごとに、当該距離における顧客の訪問地に対する平均訪問率を算出する。
 ステップS106において、特定部335は、特徴領域を特定する。すなわち、所定の領域ごとに算出した顧客の訪問率に基づいて、当該領域において所定の信頼度で訪問率を推定する。そして、推定した訪問率の信頼区間が、訪問地から当該領域までの距離における平均訪問率を外れている場合、特徴領域として特定する。
 ステップS107において、出力部336は、ステップS106において特定された特徴領域を出力する。例えば、出力部336は、地図情報321に記憶された地図データに特定領域を重ね合わせ、通信部310を介して、情報処理端末200に送信する。
 図12は、訪問地からの距離と訪問率とを示したグラフの具体例である。図12において、縦軸は訪問率、横軸は訪問地からの距離を示し、符号10は、各距離における平均訪問率を示している。また、符号11が示す「▲」は、ある領域における訪問率の信頼上限、符号12が示す「▼」は、ある領域における訪問率の信頼下限を示している。
 すなわち、図12に示すグラフにおいて、信頼上限「▲」および信頼下限「▼」は、領域ごとにペアとなって表示される。平均訪問率が信頼区間に含まれているものもあれば、平均訪問率が信頼区間から外れているものもあることが分かる。
 図13は、特徴領域について、訪問地からの距離と訪問率とを示したグラフの具体例である。図13において、縦軸は訪問率、横軸は訪問地からの距離を示し、符号20は、各距離における平均訪問率を示している。また、符号21が示す「▲」は、ある特徴領域における訪問率の信頼上限、符号22が示す「▼」は、ある特徴領域における訪問率の信頼下限を示している。
 図13に示すグラフは、特徴領域について示したものであるから、図12に示したグラフと異なり、信頼上限「▲」が平均訪問率を超えない、または、信頼下限「▼」が平均訪問率を超えているものが示されている。
 なお、図13では、所定の信頼度で推定した平均訪問率を示している。すなわち、符号30は平均訪問率の信頼上限、符号40は平均訪問率の信頼下限を示している。例えば、訪問率の信頼上限が、平均訪問率の信頼下限を超えない場合に有意な差が存在する、と判断するようにしてもよい。平均訪問率にも精度を与えることで、より正確な推定結果を提示することができる。
 (ハードウェア構成図)
 図14は、サーバ装置300のハードウェア構成を示すブロック図である。サーバ装置300は、コンピュータ401に実装される。コンピュータ401は、CPU402と、主記憶装置403と、補助記憶装置404と、インターフェイス405と、を備える。
 サーバ装置300の各構成要素の動作は、プログラムの形式で補助記憶装置404に記憶されている。CPU402は、プログラムを補助記憶装置404から読み出して主記憶装置403に展開し、当該プログラムに従って上記処理を実行する。また、CPU402は、プログラムに従って、記憶領域を主記憶装置403に確保する。当該プログラムは、具体的には、コンピュータ401に、地図上に設定された地点の商圏を分析させるデータ分析プログラムである。
 なお、補助記憶装置404は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インターフェイス405を介して接続される磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等が挙げられる。また、このプログラムがネットワークを介してコンピュータ401に配信される場合、配信を受けたコンピュータ401が当該プログラムを主記憶装置403に展開し、処理を実行しても良い。
 また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置404に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であっても良い。なお、図14に示したハードウェア構成は、顧客端末100、および情報処理端末200も同様の構成としてもよい。これらの装置における各構成要素の動作も、上述のサーバ装置300と同様に、補助記憶装置に記憶されたプログラムに従ったCPUにより実現する。
 (効果の説明)
 上述したように、本実施形態に係るデータ分析システムは、地図上に設定された訪問地に対する訪問率を評価し、訪問率が特徴的なエリアを特定する。一般的に、店舗からの距離と訪問率とは相関があり、店舗から離れたエリアの住民ほど訪問率が下がることが知られている。しかしながら、実際には、地域の交通事情や、周辺施設等の状況により、このような相関関係にない訪問率を示すエリアがある。そこで、本実施形態では、このような訪問率を示す特徴的なエリアを、平均訪問率との関係に基づいて特定する。
 これにより、データ分析者に当該エリアを特に分析が必要なエリアとして提示し、出店戦略や販売戦略のための戦略マップとして利用させることができる。また、データ分析者は、特に分析が必要なエリアを容易に把握することができるため、単に訪問率の状況が提示されるよりも、出店戦略などを立てやすくなる。
 本実施形態では、信頼区間に基づいた特徴領域の特定を行う。すなわち、商圏分析において、ある領域の全住民を対象として訪問率の調査を行うことは現実的ではないため、一般的には標本調査が行われる。しかしながら、標本としてどの住民を抽出したかによって訪問率は異なるため、ある領域における顧客の訪問率の値のみから、ある領域における全住民の訪問率であると断定することは、正確さに欠ける。そこで、本実施形態では、所定の信頼度で訪問率を算出し、算出した訪問率に精度を与えることで、算出結果を的確に評価することができるようになる。したがって、精度保証された商圏分析によって、ユーザはより有用な出店戦略、販売戦略を立てることができる。
 また、本実施形態では、特徴スコアに基づいて特徴領域の特定を行う。特徴スコアにより、どの程度有意差があるのか判断することができ、より精度の高い商圏分析を実行することが可能である。
 本実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものとする。
 1 データ分析システム、100 顧客端末、200 情報処理端末、110 通信部、120 入力部、130 表示部、140 検知部、141 位置検知部、150 制御部、300 サーバ装置、310 通信部、320 記憶部、321 地図情報、322 訪問地情報、323 顧客情報、324 位置情報、330 制御部、331 取得部、332 推定部、333 訪問率算出部、334 平均算出部、335 特定部、336 出力部、401 コンピュータ、402 CPU、403 主記憶装置、404 補助記憶装置、405 インターフェイス

Claims (13)

  1.  地図上に設定された地点の商圏を分析するデータ分析装置であって、
     前記地図上の所定の領域ごとに、当該領域において活動する顧客の前記地点に対する訪問率を算出する訪問率算出部と、
     前記地点からの距離ごとに、当該距離において前記活動する顧客の前記地点に対する平均訪問率を算出する平均算出部と、
     前記訪問率算出部が算出した前記地図上の所定の領域ごとの前記訪問率、および前記平均算出部が算出した前記平均訪問率に基づいて、前記地図上の前記所定の領域ごとに推定される前記地点に対する訪問率を評価する評価部と、
     前記評価した結果を出力する出力部と、
     を備えるデータ分析装置。
  2.  前記評価部は、前記地図上の前記所定の領域において推定される訪問率が、前記地点から当該領域までの距離における前記平均訪問率を外れている度合いを評価する、請求項1に記載のデータ分析装置。
  3.  前記評価部は、前記度合いに基づいて、前記地図上の前記所定の領域において推定される訪問率が特徴的な特徴領域を特定する特定部を含む、請求項2に記載のデータ分析装置。
  4.  前記特定部は、前記地図上の前記所定の領域において推定される訪問率の所定の信頼度の信頼区間が、前記地点から当該領域までの距離における前記平均訪問率を外れている領域を前記特徴領域として特定する、請求項3に記載のデータ分析装置。
  5.  前記特定部は、前記地図上の前記所定の領域において前記推定される訪問率の信頼区間の上限が前記平均訪問率を超えていない、もしくは、当該訪問率の信頼区間の下限が前記平均訪問率を超えている場合に、当該領域を前記特徴領域として特定する、請求項4に記載のデータ分析装置。
  6.  前記評価部は、前記平均訪問率が前記信頼区間から外れている前記度合いを示す特徴スコアを計算する計算部を含み、
     前記特定部は、前記特徴スコアに基づいて前記特徴領域を特定する、請求項4に記載のデータ分析装置。
  7.  前記出力部は、前記特徴スコアおよび/または前記特徴領域を、前記評価した結果として出力する、請求項6に記載のデータ分析装置。
  8.  地図情報を記憶する記憶部をさらに備え、
     前記出力部は、前記特徴領域を前記記憶部が記憶する地図情報に重ねて出力する、請求項3から請求項7のいずれか一項に記載のデータ分析装置。
  9.  前記地点を訪問した顧客の前記活動する領域を推定する推定部をさらに備え、
     前記訪問率算出部は、前記推定部が推定した前記顧客の活動する領域に基づいて、前記訪問率を算出する、請求項1から請求項8のいずれか一項に記載のデータ分析装置。
  10.  前記顧客の位置情報を取得する取得部をさらに備え、
     前記推定部は、前記顧客の位置情報に基づいて、前記顧客の前記活動する領域を推定する、請求項9に記載のデータ分析装置。
  11.  地図上に設定された地点の商圏を分析するデータ分析システムであって、
     前記地図上の所定の領域ごとに、当該領域において活動する顧客の前記地点に対する訪問率を算出する訪問率算出部と、
     前記地点からの距離ごとに、当該距離において前記活動する顧客の前記地点に対する平均訪問率を算出する平均算出部と、
     前記訪問率算出部が算出した前記地図上の所定の領域ごとの前記訪問率、および前記平均算出部が算出した前記平均訪問率に基づいて、前記地図上の前記所定の領域ごとに推定される前記地点に対する訪問率を評価する評価部と、
     前記評価した結果を出力する出力部と、
     を備えるデータ分析システム。
  12.  地図上に設定された地点の商圏を分析するデータ分析方法であって、
     前記地図上の所定の領域ごとに、当該領域において活動する顧客の前記地点に対する訪問率を算出する訪問率算出部と、
     前記地点からの距離ごとに、当該距離において前記活動する顧客の前記地点に対する平均訪問率を算出する平均算出部と、
     前記訪問率算出部が算出した前記地図上の所定の領域ごとの前記訪問率、および前記平均算出部が算出した前記平均訪問率に基づいて、前記地図上の前記所定の領域ごとに推定される前記地点に対する訪問率を評価する評価部と、
     前記評価した結果を出力する出力部と、
     を備えるデータ分析方法。
  13.  請求項12に記載のデータ分析方法をコンピュータに実行させるためのプログラム。
PCT/JP2019/033588 2018-08-28 2019-08-27 データ分析装置、データ分析システム、データ分析方法およびプログラム WO2020045459A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018158950A JP7246037B2 (ja) 2018-08-28 2018-08-28 データ分析装置、データ分析システム、データ分析方法およびプログラム
JP2018-158950 2018-08-28

Publications (1)

Publication Number Publication Date
WO2020045459A1 true WO2020045459A1 (ja) 2020-03-05

Family

ID=69645196

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/033588 WO2020045459A1 (ja) 2018-08-28 2019-08-27 データ分析装置、データ分析システム、データ分析方法およびプログラム

Country Status (2)

Country Link
JP (1) JP7246037B2 (ja)
WO (1) WO2020045459A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7037223B1 (ja) 2021-06-28 2022-03-16 ジオリーテイル株式会社 情報処理装置、情報処理方法、及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004185539A (ja) * 2002-12-06 2004-07-02 Yunitekku:Kk 商圏分析システム、方法、プログラム、及び記録媒体
JP2014203191A (ja) * 2013-04-03 2014-10-27 パイオニア株式会社 情報提供システム、情報要求端末、情報処理システム、制御方法及びプログラム
JP2018063628A (ja) * 2016-10-14 2018-04-19 株式会社ゼンリンデータコム 情報処理装置、情報処理方法、及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004185539A (ja) * 2002-12-06 2004-07-02 Yunitekku:Kk 商圏分析システム、方法、プログラム、及び記録媒体
JP2014203191A (ja) * 2013-04-03 2014-10-27 パイオニア株式会社 情報提供システム、情報要求端末、情報処理システム、制御方法及びプログラム
JP2018063628A (ja) * 2016-10-14 2018-04-19 株式会社ゼンリンデータコム 情報処理装置、情報処理方法、及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NAKAMURA,: "3C analysis' for acquiring the power to overcome the competition"", REVOLUTION IN RETAILING, vol. 4, 1 April 2014 (2014-04-01), pages 4 - 5 1 *

Also Published As

Publication number Publication date
JP7246037B2 (ja) 2023-03-27
JP2020035035A (ja) 2020-03-05

Similar Documents

Publication Publication Date Title
Chen et al. Measuring place-based accessibility under travel time uncertainty
US9541404B2 (en) System for determining the location of entrances and areas of interest
US9874454B2 (en) Community-based data for mapping systems
US8676623B2 (en) Building directory aided navigation
US10158979B2 (en) Method and system for wireless location and movement mapping, tracking and analytics
US10412559B2 (en) Tracking building locations of fixed wireless devices
US20110022443A1 (en) Employment inference from mobile device data
KR20110017343A (ko) 모바일 디바이스들에 의해 감지된 데이터를 이용한 베뉴 추론
CN105190345A (zh) 用于使用三维位置信息改进定位服务的系统和方法
JP7272522B2 (ja) データ分析装置、データ分析システム、データ分析方法およびデータ分析プログラム
US9898539B2 (en) Device management apparatus and device search method
KR101573190B1 (ko) 실시간 유동 인구 측정 시스템 및 방법
US10542105B2 (en) Geo-locating individuals based on a derived social network
JPWO2012018131A1 (ja) 行動特徴抽出装置、行動特徴抽出システム、行動特徴抽出方法、及び行動特徴抽出プログラム
EP3352126A1 (en) Information processing device, information processing method, and computer program
US20210342601A1 (en) Information processing system, method of information processing, and program
WO2020045459A1 (ja) データ分析装置、データ分析システム、データ分析方法およびプログラム
JP2012107977A (ja) 位置推定装置、システム、位置推定方法および位置推定用プログラム
JP7144788B2 (ja) データ分析装置、データ分析システム、データ分析方法およびプログラム
JP6664583B2 (ja) 情報制御装置、情報制御方法及び情報制御プログラム
JP2018045599A (ja) 判定装置、判定方法、及び判定プログラム
US10006985B2 (en) Mobile device and method for determining a place according to geolocation information
JP6494577B2 (ja) 判定装置、判定方法、及び判定プログラム
US11388555B1 (en) Method, apparatus, and computer program product for quantifying human mobility
US20190392420A1 (en) Location-aware event monitoring

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19854123

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19854123

Country of ref document: EP

Kind code of ref document: A1