WO2012105377A1 - 端末数推計装置および端末数推計方法 - Google Patents

端末数推計装置および端末数推計方法 Download PDF

Info

Publication number
WO2012105377A1
WO2012105377A1 PCT/JP2012/051455 JP2012051455W WO2012105377A1 WO 2012105377 A1 WO2012105377 A1 WO 2012105377A1 JP 2012051455 W JP2012051455 W JP 2012051455W WO 2012105377 A1 WO2012105377 A1 WO 2012105377A1
Authority
WO
WIPO (PCT)
Prior art keywords
position data
observation
information
unit
terminal
Prior art date
Application number
PCT/JP2012/051455
Other languages
English (en)
French (fr)
Inventor
寺田 雅之
基成 小林
亨 小田原
岡島 一郎
Original Assignee
株式会社エヌ・ティ・ティ・ドコモ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社エヌ・ティ・ティ・ドコモ filed Critical 株式会社エヌ・ティ・ティ・ドコモ
Priority to US13/819,009 priority Critical patent/US20130157689A1/en
Priority to EP12741963.8A priority patent/EP2672433A1/en
Priority to CN2012800029672A priority patent/CN103120001A/zh
Priority to JP2012555813A priority patent/JP5543619B2/ja
Priority to KR1020137002545A priority patent/KR101441996B1/ko
Publication of WO2012105377A1 publication Critical patent/WO2012105377A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W64/00Locating users or terminals or network equipment for network management purposes, e.g. mobility management
    • H04W64/006Locating users or terminals or network equipment for network management purposes, e.g. mobility management with additional information processing, e.g. for direction or speed determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/02Processing of mobility data, e.g. registration information at HLR [Home Location Register] or VLR [Visitor Location Register]; Transfer of mobility data, e.g. between HLR, VLR or external networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W64/00Locating users or terminals or network equipment for network management purposes, e.g. mobility management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W60/00Affiliation to network, e.g. registration; Terminating affiliation with the network, e.g. de-registration

Definitions

  • the present invention relates to a terminal number estimation device and a terminal number estimation method for estimating the number of terminals located in a certain area using position data relating to a portable terminal obtained from network equipment of a portable terminal (for example, a cellular phone).
  • the “position data” in this specification is a set of a plurality of pieces of position information including position registration information, and may further include position information other than the position registration information (for example, GPS positioning information).
  • a technique for estimating the number of terminals located in a certain area (for example, sector) (so-called number of areas) based on the number of location registration information generated is known.
  • the location registration information is generated at a predetermined location registration cycle, and the terminal user moves to another location registration area across the boundary of the location registration area (hereinafter referred to as “LA boundary”). Also generated.
  • LA boundary the boundary of the location registration area
  • the location registration information generation probability is relatively higher than in other sectors, and the number of sectors in the sector facing the LA boundary may be overestimated.
  • FIG. 12 is a conceptual diagram showing the correlation between the estimated number of locations around the LA boundary (vertical axis) and the distance from the LA boundary (horizontal axis), of which estimation based on the conventional method plotted with square points
  • the thick solid line graph for the number of locations and the thin solid line graph for the true value (true estimated number of locations) plotted with diamond-shaped points in the vicinity of the horizontal axis (LA boundary) in FIG.
  • the number of estimated locations based on the conventional method is relatively larger than the true value.
  • Patent Document 1 proposes that the number of sectors in the sector facing the LA boundary is corrected in consideration of the excessive estimation of the number of sectors in the sector facing the LA boundary.
  • the location registration cycle is reset to zero.
  • the location registration information generation probability is relatively low, and the sector is slightly separated from the LA boundary.
  • the number of sectors in the sector may be underestimated.
  • the estimated number of locations based on the conventional method is relatively small with respect to the true value.
  • Patent Document 1 a specific method for solving such a problem is not clearly described in Patent Document 1, and there is room for improvement in estimating the number of locations with higher accuracy.
  • the present invention has been made to solve the above-described problems, and an object of the present invention is to estimate the number of existing areas more accurately.
  • a terminal number estimation device is based on a position data acquisition unit that acquires position data that is a set of a plurality of position information including position registration information, and position data acquired by the position data acquisition unit. Then, from the position data acquired by the position data acquisition unit, a first area number estimation unit that estimates the number of terminals located in the observation area during the observation period as the first area number, An extraction unit that extracts position data according to the type, and a second presence that estimates the number of terminals that have been in the observation area during the observation period as the second number of areas based on the extracted position data.
  • a terminal number estimation device based on the first location number based on location data that is a set of a plurality of location information including location registration information, and location data extracted according to the type of location data Within the numerical range between the first and second area numbers by estimating the number of terminals as the third area number based on one or both of the second area numbers The number of terminals corresponding to somewhere (including numerical values at both ends) can be estimated more accurately as the third serving number.
  • the third number-of-zones estimation unit generates an error in the number of terminals caused by the terminal straddling the location registration area boundary based on the first number of visited areas and the second number of visited areas. May be estimated.
  • the terminal number estimation device includes a position data acquisition unit that acquires position data that is a set of a plurality of pieces of position information including position registration information, and position data acquired by the position data acquisition unit. Based on the first location number estimation unit for estimating the number of terminals located in the observation area during the observation period as the first location number, and the location data acquired by the location data acquisition unit, the terminal Is based on the position removal information obtained by removing the position registration information generated due to straddling the position registration area boundary and obtaining the removed position data, and the position data after removal obtained by the signal removal section
  • the second number-of-services estimation unit that estimates the number of terminals located in the observation area during the observation period as the second number of serviced regions, and the first number-of-services estimation unit The number of areas in 1 and the number of areas in the second area Based on one or both of the second number of areas obtained by the measuring unit, a third area where the number of terminals located in the observation area during the observation period is estimated as the third area
  • the third number-of-zones estimation unit calculates the number of terminals generated due to the terminal straddling the location registration area boundary based on the first number of visited areas and the second number of visited areas. An error may be estimated.
  • the third number-of-zones estimation unit determines the number of areas serving as the basis of the estimation, the first number of areas, the number of second areas, and the first and second Of the two serving areas, the third serving number may be estimated by switching for each observation area.
  • a terminal number estimation device due to the first location number based on location data that is a set of a plurality of location information including location registration information and the fact that the terminal has crossed the location registration area boundary
  • the number of terminals as the third serving number based on one or both of the second serving numbers based on the position data after removing the generated location registration information
  • the number of terminals corresponding to somewhere within the numerical range between the number of service areas and the second service area number (including numerical values at both ends) can be estimated as the third service area number. This solves the problem of overestimating the number of areas in the vicinity of the location registration area boundary, and the number of areas in the vicinity of the location registration area boundary being slightly underestimated. Can be estimated well.
  • the third in-zone number estimation unit may estimate the number of terminals corresponding to a predetermined distribution point between the first in-zone number and the second in-zone number as the third in-zone number.
  • the apportioning point here may be, for example, a point in the middle of the first and second serving numbers, or between the first and second serving numbers. May be a point that is closer to the second number of areas in the case of being divided into three equal parts, or may be a distribution point other than these.
  • the third number of located area estimation unit determines a predetermined proration point between the first number of visited areas and the second number of visited areas.
  • the number of terminals corresponding to is estimated as the third area number, and when the first area number is less than the second area number, the second area number is estimated as the third area number. Also good.
  • the location data includes identification information for identifying a terminal associated with each location information and location acquisition time information at which the location information was acquired, and the first location number estimation unit and the second location number Both or one of the estimation units, with respect to position data of a target, position data acquisition time information of position data immediately before the position data of the target, among position data including the same identification information as the position data of the target,
  • the position data acquisition unit for acquiring the position acquisition time information of the position data immediately after the target position data, the position acquisition time information of the previous position data, the position acquisition time information of the target position data, and the position data immediately after Based on two or more pieces of position acquisition time information, a feature amount calculation unit that calculates a feature amount for the target position data, and an observation start time after the observation period to be observed Observation target that acquires one or more position data including position information associated with observation area information related to the observation area to be observed as observation target position data.
  • the feature amount calculation unit determines whether or not the target position data includes position registration information generated due to straddling the position registration area boundary, and whether the immediately following position data is due to straddling the position registration area boundary. Whether the target location data includes location registration information generated due to straddling the location registration area boundary and the immediately following location data. According to the determination result of whether or not includes location registration information generated due to straddling the location registration area boundary, location acquisition time information of the target location data, location acquisition time information of the previous location data, and The feature amount of the target position data may be calculated using two or more pieces of position acquisition time information of the position data immediately after.
  • location registration information generated due to straddling the location registration area boundary means location registration information generated due to the mobile terminal straddling the location registration area boundary.
  • the feature amount calculation unit determines the position acquisition time of the target position data as the first variable when the target position data includes position registration information generated due to straddling the position registration area boundary. If the target position data does not include the position registration information generated due to straddling the position registration area boundary, the position acquisition time of the target position data and the position acquisition time of the previous position data are When the point time is set as the first variable and the immediately following position data includes the position registration information generated due to straddling the position registration area boundary, the position acquisition time of the immediately following position data is set as the second variable.
  • the midpoint between the position acquisition time of the target position data and the position acquisition time of the position data immediately after Second time may calculate the feature value of the position data of the object.
  • the feature amount calculation unit goes back to the past by a predetermined time from the position acquisition time of the target position data. You may calculate the feature-value about target position data using time as a 1st variable. Similarly, if the difference between the position acquisition time of the target position data and the second variable is greater than a predetermined value, the feature amount calculation unit advances to the future by a predetermined time from the position acquisition time of the target position data. The feature amount for the target position data may be calculated using the determined time as the second variable.
  • the terminal number estimation device is based on the third coverage number obtained by the third coverage number estimation unit and the ratio between the number of coverage areas and the population in a predetermined area.
  • the population may be estimated by obtaining the ratio between the number of areas in the country and the population during the observation period or a certain number. Moreover, you may use the ratio calculated
  • this ratio is also called an “expansion coefficient”.
  • the terminal number estimation device includes an observation period acquisition unit that acquires observation period information including a set of observation start time and observation end time, and an observation area that acquires observation area information associated with one or more pieces of position information And an acquisition unit.
  • the invention relating to the terminal number estimating device described above can be regarded as an invention relating to a terminal number estimating method executed by the terminal number estimating device, and has the same operations and effects.
  • a terminal number estimation method is a terminal number estimation method executed by a terminal number estimation device, and is a position for acquiring position data that is a set of a plurality of position information including position registration information.
  • a data acquisition step, and a first number-of-areas estimation step for estimating the number of terminals located in the observation area during the observation period as the first number of areas based on the position data acquired in the position data acquisition step
  • An extraction step for extracting position data from the position data acquired in the position data acquisition step according to the type of position data, and the presence of the observation data in the observation area during the observation period based on the extracted position data.
  • a second number-of-services estimation step for estimating the number of terminals serving as the second number of serviced regions, the first number of serviced regions obtained by the first number-of-services-area estimation step, and the second A third number that estimates the number of terminals that have been in the observation area during the observation period as the third number of areas based on one or both of the second number of areas obtained by the number of areas estimation step. And a step of estimating the number of in-zones.
  • a terminal number estimation method is a terminal number estimation method executed by a terminal number estimation device, and is a position for acquiring position data that is a set of a plurality of position information including position registration information.
  • a data acquisition step, and a first number-of-areas estimation step for estimating the number of terminals located in the observation area during the observation period as the first number of areas based on the position data acquired in the position data acquisition step
  • a signal removal step of removing position registration information generated due to the terminal straddling the position registration area boundary and obtaining position data after removal; Based on the position data after removal obtained in the signal removal step, the number of terminals located in the observation area during the observation period is estimated as the second number of visited areas.
  • the first location number based on location data that is a set of location information including location registration information and the second location based on location data extracted according to the type of location data.
  • the number of terminals By estimating the number of terminals as the third number of areas based on one or both of the numbers, within the numerical range between the first and second numbers (however, the numbers at both ends)
  • the number of terminals corresponding to somewhere can be estimated more accurately as the third serving number.
  • the second serving number based on the position data after removing the position registration information generated due to the terminal straddling the position registration area boundary is used as the second serving number.
  • the problem is that the number of locations in the vicinity of the location registration area boundary is overestimated and the number of locations in the location a little away from the location registration area boundary is overestimated. Can be estimated.
  • FIG. 1 shows the system configuration
  • Position data in this case refers to a terminal identifier for identifying a mobile terminal, a sector identifier for identifying a sector in which the mobile terminal is located, position information (for example, latitude / longitude information) about the position of the mobile terminal, and position information And the position acquisition time information acquired by the mobile terminal.
  • position registration information information included in a position registration signal generated by a mobile terminal
  • position registration information is added. GPS position information and the like are included.
  • the GPS position information does not include the sector identifier at the time of generation, but the sector identifier is added by the base station that has received the GPS position information from the mobile terminal, and the terminal number estimation device 10 (FIG. 2) described later GPS position information with an identifier can be acquired. Further, it is assumed that the GPS position information includes the above sector identifier at the time of generation. In this case, when the mobile terminal generates the GPS position information, the sector identifier is added, and the terminal number estimation device 10 (FIG. 2) described later can acquire the GPS position information with the sector identifier.
  • the location registration information includes the factors that generated the location registration signal (for example, periodic location registration, the mobile terminal straddling the location registration area boundary (so-called LA straddling), the power-on of the mobile terminal, etc. Generation factor information indicating that the mobile terminal is powered off, etc.), and based on the generation factor information, for example, of the location registration information, the mobile terminal straddles the location registration area boundary. Excluding location registration information generated due to the fact (hereinafter referred to as “LA straddling location registration information”), extracting only location registration information generated due to periodic location registration, etc. Is possible.
  • FIG. 1 is a system configuration diagram of a communication system 1 according to the present embodiment.
  • the communication system 1 includes a mobile terminal 100, a BTS (base station) 200, an RNC (radio control device) 300, an exchange 400, various processing nodes 700, and a management center 500.
  • the management center 500 includes a social sensor unit 501, a petamining unit 502, a mobile demography unit 503, and a visualization solution unit 504.
  • the exchange 400 collects position information, which will be described later, about the mobile terminal 100 via the BTS 200 and the RNC 300.
  • the RNC 300 can measure the position of the mobile terminal 100 using the delay value in the RRC connection request signal when communication connection is performed with the mobile terminal 100.
  • the exchange 400 can receive the position information of the mobile terminal 100 measured in this way when the mobile terminal 100 executes communication connection.
  • the exchange 400 stores the received position information, and outputs the collected position information to the management center 500 in response to a predetermined timing or a request from the management center 500.
  • the various processing nodes 700 acquire the location information of the portable terminal 100 through the RNC 300 and the exchange 400, and perform recalculation of the location in some cases, and are collected at a predetermined timing or in response to a request from the management center 500 The position information is output to the management center 500.
  • the position information of the mobile terminal 100 in the present embodiment the sector number indicating the in-service sector obtained from the position registration information, the position positioning information obtained by the GPS positioning system or the position information acquisition system by PRACH PD, and the like are adopted. be able to.
  • the position data of the portable terminal 100 includes the position information as described above, identification information for identifying the portable terminal (for example, information associated with the portable terminal such as a line number), and position acquisition time information at which the position information is acquired. including.
  • identification information for identifying the portable terminal for example, information associated with the portable terminal such as a line number
  • position acquisition time information at which the position information is acquired including.
  • a line number is used as identification information, it is preferable to use a value associated with the line number (for example, a hash value of the line number) instead of using the line number as it is.
  • the management center 500 includes the social sensor unit 501, the petamining unit 502, the mobile demography unit 503, and the visualization solution unit 504. In each unit, the position data of the mobile terminal 100 is used. Perform statistical processing.
  • the terminal number estimation apparatus 10 (FIG. 2) mentioned later can be comprised by the management center 500, for example.
  • the social sensor unit 501 is a server device that collects data including the position data of the mobile terminal 100 from each exchange 400 and various processing nodes 700 or offline.
  • the social sensor unit 501 receives data periodically output from the exchange 400 and the various processing nodes 700, or acquires data from the exchange 400 and the various processing nodes 700 according to a predetermined timing in the social sensor unit 501. It is configured to be able to do.
  • the petamining unit 502 is a server device that converts data received from the social sensor unit 501 into a predetermined data format. For example, the petamining unit 502 performs a sorting process using a user ID as a key, or performs a sorting process for each area.
  • the mobile demography unit 503 is a server device that performs aggregation processing on the data processed in the petamining unit 502, that is, count processing for each item. For example, the mobile demography unit 503 can count the number of users located in a certain area, and can total the distribution of the located areas.
  • the visualization solution unit 504 is a server device that processes the data aggregated in the mobile demography unit 503 so as to be visible. For example, the visualization solution unit 504 can map the aggregated data on a map. Data processed by the visualization solution unit 504 is provided to companies, government offices or individuals, and is used for store development, road traffic surveys, disaster countermeasures, environmental countermeasures, and the like. It should be noted that the information statistically processed in this way is processed so that individuals are not specified so as not to infringe privacy.
  • the social sensor unit 501, the petamining unit 502, the mobile demography unit 503, and the visualization solution unit 504 are all configured by the server device as described above, and although not shown, the basic configuration of a normal information processing device Needless to say, it includes a CPU, a RAM, a ROM, an input device such as a keyboard and a mouse, a communication device that communicates with the outside, a storage device that stores information, and an output device such as a display and a printer.
  • FIG. 2 shows a functional block configuration of the terminal number estimation apparatus 10.
  • the terminal number estimation device 10 includes a position data acquisition unit 11, a storage unit 12, an observation period acquisition unit 13, an observation area acquisition unit 14, a first in-zone number estimation unit 15, and a signal removal unit. 16, a second in-zone number estimation unit 17, a third in-zone number estimation unit 18, and an output unit 19.
  • the position data acquisition unit 11 acquires position data from the outside (for example, the exchange 400 or various processing nodes 700) and stores it in the storage unit 12. In addition, it is not essential to provide the position data acquisition unit 11 in the terminal number estimation device 10, and the position data acquired by the position data acquisition unit outside the terminal number estimation device 10 is transmitted to the terminal via, for example, a storage medium. You may input into the number estimation apparatus 10.
  • storage part 12 preserve
  • the observation period acquisition unit 13 acquires observation period information including a set of observation start time and observation end time.
  • the observation area acquisition unit 14 acquires observation area information associated with one or more pieces of position information.
  • the observation area information here is given as, for example, a sector number, a latitude / longitude, a geographical range (for example, a municipality), etc., and the observation area acquisition unit 14 displays the expression format and position information of the acquired observation area information. It is desirable to provide a database that manages information that associates the expression format (for example, correspondence information between sector numbers and latitude and longitude).
  • the first in-zone number estimation unit 15 reads the position data from the storage unit 12, and estimates the number of terminals in the observation area during the observation period as the first in-zone number based on the position data.
  • the number-of-terminals estimation method by the first serving number estimation unit 15 is not limited to a specific method, and various methods can be adopted. An example of the terminal number estimation method and the configuration of the first in-zone number estimation unit 15 for executing the estimation method will be described later. In addition to the examples described later, for example, the method described in Japanese Patent Application No. 2010-212456 filed earlier by the applicant of the present application can be used as the terminal number estimation method.
  • the information analysis device receives position data indicating the position of the user, positioning time information from which the position information is obtained, and point data including the user ID from the outside, and determines the positioning time from the point data for each user. Extracts point data immediately before the target time and point data whose positioning time is immediately after the target time, and for each user, the position indicated by the point data immediately before the target time and the position indicated by the point data immediately after the target time Is a series of methods for estimating the user's position at the target time by calculating the population distribution of a predetermined calculation target area unit at the target time based on the estimated position of each user. Yes, this method can be applied to terminal number estimation.
  • the signal removal unit 16 reads position data from the storage unit 12, and generates position registration information (hereinafter referred to as “position registration information by LA straddling”) generated from the position data resulting from the terminal straddling the position registration area boundary. To obtain position data after removal.
  • the “position data after removal” obtained here includes the position registration information excluding the position registration information across the LA in the position registration information. Of course, position information other than the position registration information (for example, GPS positioning) Information) and the like.
  • the signal removing unit 16 corresponds to an “extracting unit” and a “signal removing unit” in the claims, and in the present embodiment, the position data according to the type of position data (for example, the generation factor of the position data).
  • the signal removal unit 16 that removes position registration information across the LA from the position data and obtains position data after removal will be described.
  • the type of position data for example, by referring to the generation factor information described above included in the position registration information, only the LA straddling position registration information is excluded from the position data (that is, LA straddling)
  • a method of extracting position data other than position registration information a method of extracting only position registration information generated due to periodic position registration from position data, and the like.
  • the “position data type” in addition to the above generation factors, for example, the generation time of position data can also be applied.
  • the second number-of-zones estimation unit 17 estimates the number of terminals located in the observation area during the observation period as the second number of regions.
  • the method for estimating the number of terminals by the second serving number estimation unit 17 is not limited to a specific method, and various methods can be adopted including the method described in Japanese Patent Application No. 2010-212456 described above. However, it is desirable that the method is the same as the terminal number estimation method by the first serving number estimation unit 15. In the present embodiment, an example in which the second number-of-services estimation unit 17 employs the same terminal number estimation method as that of the first region-of-services estimation unit 15 will be described. An example of a specific terminal number estimation method and the configuration of the second in-zone number estimation unit 17 for executing the estimation method will be described later.
  • the third in-zone number estimating unit 18 includes the first in-zone number obtained by the first in-zone number estimating unit 15 and the second in-zone number obtained by the second in-zone number estimating unit 17. Based on one or both of the numbers, the number of terminals located in the observation area during the observation period is estimated as the third number.
  • the first in-zone number estimated based on the position data before removing the position registration information across the LA corresponds to a thick solid line graph relating to the estimated in-zone number plotted with square points.
  • the second in-zone number estimated based on the position data after the removal of the position registration information by straddling LA corresponds to a broken line graph regarding the estimated in-zone number plotted with triangular points.
  • the third in-zone number estimating unit 18 estimates the third in-zone number based on one or both of the first in-zone number and the second in-zone number.
  • the number of terminals corresponding to somewhere within the numerical range (including the numbers at both ends) between the first serving number and the second serving number can be estimated as the third serving number, It approaches the true value in FIG. This solves the problem of overestimating the number of areas in the vicinity of the location registration area boundary, and the number of areas in the vicinity of the location registration area boundary being slightly underestimated. Can be estimated well.
  • the terminal number estimation method by the third serving number estimation unit 18 is not limited to a specific method, and various methods as described below can be adopted.
  • the third in-zone number estimation unit 18 estimates the number of terminals corresponding to a predetermined distribution point between the first in-zone number and the second in-zone number as the third in-zone number. Also good.
  • the apportioning point here may be a point in the middle of the first and second serving numbers, or 3 between the first and second serving numbers. It may be a point closer to the second number in the case of equal division, or a distribution point other than these.
  • the third number of visited area estimating unit 18 calculates the first number of visited areas and the second number of visited areas as described above. Estimate the number of terminals corresponding to the apportionment point as the number of third area, and if the first number is less than the second area, It may be estimated as a number.
  • the third number-of-zones estimation unit 18 calculates the number of locations serving as the basis of the estimation from the number of first locations, the number of second locations, and the number of first and second locations.
  • the third area number may be estimated by switching for each observation area.
  • the third number-of-zones estimation unit 18 calculates the number of terminals generated due to the terminal straddling the location registration area boundary based on the first number of areas and the number of second areas. An error may be estimated.
  • the third in-zone number estimating unit 18 calculates the difference between the first in-zone number and the second in-zone number by the number of terminals generated due to the terminal straddling the location registration area boundary. An error may be estimated. The error in the number of terminals estimated in this way can be used to evaluate the accuracy related to the estimation of the number of terminals.
  • the estimation of the error in the number of terminals as described above is not limited to the embodiment in which the position removal information obtained by removing the LA straddle from the position data by the signal removal unit 16 to obtain the removed position data as in the present embodiment.
  • the present invention can be executed in all embodiments in which position data is extracted according to the type of position data.
  • the output unit 19 outputs the number of terminals obtained by the estimation.
  • the output here includes various output modes such as display output, audio output, and print output.
  • the 1st in-zone number estimation part 15, the signal removal part 16, the 2nd in-zone number estimation part 17, and the 3rd in-zone number estimation part 18 are essential requirements. It is not essential to provide other configuration requirements in the terminal number estimation device 10.
  • FIG. 3 the structure of the 1st in-zone number estimation part 15 is shown.
  • the configuration of the second number-of-zones estimation unit 17 is as follows. It is the same as that of the structure of the 1st in-zone number estimation part 15 to describe.
  • the first in-zone number estimation unit 15 includes an observation target acquisition unit 31, a front / rear position data acquisition unit 32, a feature amount calculation unit 33, and a terminal number estimation unit 34.
  • the observation target acquisition unit 31 acquires the observation start time information and the observation end time information regarding the observation period to be observed from the observation period acquisition unit 13 and the observation area information regarding the observation area to be observed from the observation area acquisition unit 14, respectively.
  • One or more pieces of position data including position acquisition time information after the observation start time and before the observation end time and including position information associated with the observation area information are stored as observation target position data from the storage unit 12. get.
  • the observation target position data may be further narrowed down according to separately given conditions (for example, the age group of the user of the mobile terminal).
  • the front-rear position data acquisition unit 32 is the same as the first position data for position data (hereinafter referred to as “first position data”) for which a feature amount, which will be described later, calculated in the process of estimating the number of locations is obtained.
  • first position data position data for position data
  • second position data position acquisition time information of position data immediately before the first position data
  • third position data position acquisition time information of position data immediately after the first position data
  • the position acquisition time information (hereinafter referred to as “third position data”) is acquired. It is not essential for the front / rear position data acquisition unit 32 to acquire the entire second or third position data, and at least the position acquisition time information included in the position data may be acquired.
  • the front / rear position data acquisition unit 32 may read the position acquisition time information of the second and third position data from the storage unit 12 or may pass it from the position data acquisition unit 11. Logically, either method can be used.
  • the feature amount calculation unit 33 calculates a feature amount for each of the first position data. For example, the feature amount calculation unit 33 calculates the difference between the position acquisition time of the second position data and the position acquisition time of the third position data as the feature amount for the first position data. In addition, when the position acquisition time of the second position data is an abnormal value, the feature amount calculation unit 33 calculates the position acquisition time of the first position data and the position acquisition time of the second position data as an example here. When the difference is larger than a predetermined reference value (for example, 1 hour), the time of the second position data is set to a time that is retroactive from the position acquisition time of the first position data by a predetermined time (for example, 1 hour). The feature amount for the first position data is calculated as the acquisition time.
  • a predetermined reference value for example, 1 hour
  • the feature amount calculation unit 33 uses the position acquisition time of the first position data and the position acquisition time of the third position data as an example here. Is greater than a predetermined reference value (for example, 1 hour), the time advanced from the position acquisition time of the first position data to the future by a predetermined time (for example, 1 hour) is set in the third position data. The feature amount for the first position data is calculated using the position acquisition time.
  • the process when the position acquisition times of the second and third position data are abnormal values is not an essential process, but the portable terminal 100 is located outside the service area by performing the above process.
  • the position data acquisition time interval becomes abnormally long due to the power of the mobile terminal 100 being turned off or the like, the influence of the abnormally long acquisition time interval is prevented from being excessively increased. be able to.
  • the number-of-terminals estimation unit 34 estimates the number of terminals located in the observation area during the observation period based on the feature amount of the observation target position data and the observation period length that is the difference between the observation start time and the observation end time. . Although details will be described later, the terminal number estimation unit 34 estimates a numerical value obtained by dividing the total sum of the feature amounts of the observation target position data by twice the observation period length as the number of terminals.
  • each terminal a i transmits a signal (for example, a position registration signal including position registration information). These signals are observable.
  • the signals transmitted by the terminal a i from the sector S during the observation period If x i is the total number of signals transmitted by the terminal a i in the sector S during the observation period, the estimation of the number of terminals is based on the observed signal q ij (j is an integer from 1 to x i ). It is none other than estimating the value of m.
  • p i be the density at which the signal q ij is transmitted from the terminal a i (ie, the number of signals per unit time).
  • the probability that the signal is transmitted is independent of the sector
  • the expected value E (t i) the following expression for the residence time t i of the sector S in the observation period of the terminal a i (2) is satisfied.
  • the estimated value E (m) of the number m of terminals can be calculated by the following equation (6). As shown in the example of FIG.
  • the terminal a i transmits the signals q i1 , q i2 , and q i3 within the observation period and the period in which the terminal a i stays in the sector S, and the signal q i1 ,
  • the signal q i0 is transmitted immediately before the signal q i3
  • the signal q i4 is transmitted immediately after the signal q i3
  • the transmission times of the signals q i0 , q i1 , q i2 , q i3 , q i4 are set to u i0 , u i1 , u, respectively.
  • the stay time t i of the sector S in the observation period of the terminal a i is determined from (the midpoint of u i0 and u i1 ) (from u i3 and u i4 This is equivalent to estimating the period until the midpoint.
  • the terminal a i transmits the signal q i4 while staying in the sector S, although it is not within the observation period. Just because, is not carried out to estimate the end time of the residence time t i as the same as the end time of the observation period T. In this way, to maintain the impartiality of the estimated amount of time spent t i.
  • the terminal number estimation process according to the terminal number estimation method of the present invention will be described.
  • the position information included in the position data of the mobile terminal is given the sector number of the sector where the mobile terminal is located.
  • the observation period information a set of the observation start time T1 and the observation end time T2 is acquired in advance by the observation period acquisition unit 13, and as the observation area information, the sector number S is acquired in advance by the observation area acquisition unit 14. Shall be.
  • step S1 the position data acquisition unit 11 acquires position data from the outside and stores it in the storage unit 12 (step S1 in FIG. 6).
  • storage part 12 will preserve
  • step S2 you may perform the process after step S2 after time. That is, step S1 may be executed as a preliminary preparation for the processing after step S2.
  • the first location number estimation unit 15 reads the position data from the storage unit 12, and based on the position data, the number of terminals located in the observation area during the observation period is set as the first location number. Estimation is performed (step S2 in FIG. 6). Specific processing contents will be described later with reference to FIG.
  • the signal removal unit 16 reads the position data from the storage unit 12, removes the position registration information over the LA from the position data, and obtains position data after removal (step S3 in FIG. 6). Note that it is not essential for the signal removal unit 16 to read the position data from the storage unit 12, and the signal removal unit 16 obtains the position data read in step S ⁇ b> 2 of FIG. You may be handed over. In this way, the signal removal unit 16 may receive either the position data from the first serving number estimation unit 15 or read it from the storage unit 12, and logically either.
  • the second number-of-zones estimation unit 17 determines the number of terminals located in the observation area during the observation period as the second number of visited areas. (Step S4 in FIG. 6). Specific processing contents will be described later with reference to FIG.
  • the third in-zone number estimating unit 18 uses the first in-zone number obtained by the first in-zone number estimating unit 15 and the second in-zone number estimating unit 17. Based on one or both of the number of located areas, the number of terminals located in the observation area during the observation period is estimated as the third number of located areas (step S5 in FIG. 6). For example, the third in-zone number estimating unit 18 estimates the number of terminals corresponding to a predetermined distribution point between the first in-zone number and the second in-zone number as the third in-zone number.
  • the apportioning point here may be a point in the middle of the first and second serving numbers, or 3 between the first and second serving numbers.
  • the third number of visited area estimating unit 18 performs the first and the second number of visited areas as described above.
  • the number of terminals corresponding to the distribution point with the number of areas is estimated as the third area number.
  • the second area number is It may be estimated as the number of areas of 3.
  • the third number-of-zones estimation unit 18 calculates the number of locations serving as the basis of the estimation from the number of first locations, the number of second locations, and the number of first and second locations. Among them, the third area number may be estimated by switching for each observation area.
  • the output unit 19 outputs the number of terminals obtained by the estimation (step S5 in FIG. 6).
  • the output here includes various output modes such as display output, audio output, and print output.
  • the first location number based on location data that is a set of a plurality of location information including location registration information and the second location based on location data after removing location registration information by straddling LA.
  • the number of terminals is estimated as the third service area within the numerical range between the first service area and the second service area (but at both ends)
  • the number of terminals corresponding to somewhere can be estimated as the third serving number, and the estimated serving number can be brought close to a true value as illustrated in FIG. This eliminates the problem that the number of areas in the vicinity of the LA boundary is overestimated and the number of areas in the area slightly away from the LA boundary is eliminated, and the number of areas in the area is estimated more accurately. Can do.
  • step S2 first area number estimation process
  • step S4 second area number estimation process
  • the observation target acquisition unit 31 of FIG. 3 uses the observation start time T1 and the observation end time T2 as the observation period information from the observation period acquisition unit 13 as the observation area information.
  • the storage unit 12 adds the position acquisition time information after the observation start time T1 and before the observation end time T2 to the sector number S that is the observation area information.
  • One or a plurality of position data including position information to be associated (for example, position information is sector number S) is acquired as observation target position data (step S11 in FIG. 7). That is, the observation target acquisition unit 31 acquires position data that satisfies the following conditions as observation target position data.
  • Condition 1 The position acquisition time is after the observation start time T1 and before the observation end time T2. That is, it is included in the observation period.
  • Condition 2 The position information is sector S.
  • the front / rear position data acquisition unit 32 includes the same identification information as the first position data for the position data (first position data) for which the feature amount is to be obtained among the observation target position data.
  • the position acquisition time information of the position data immediately before the first position data (second position data) and the position data immediately after the first position data (first 3 position data) is acquired.
  • the front / rear position data acquisition unit 32 may read the position acquisition time information of the second and third position data from the storage unit 12 or may pass it from the position data acquisition unit 11. Logically, either method can be used.
  • the feature-value calculation part 33 calculates the feature-value about 1st position data.
  • the position acquisition times of the first, second, and third position data are t1, t2, and t3, respectively.
  • a predetermined reference value reference value relating to the difference between the position acquisition times of the first and second position data
  • a value A for example, 1 hour
  • a predetermined reference value a position acquisition time of the first and third position data
  • a reference value regarding the difference is set as a reference value B (for example, 1 hour).
  • the feature amount calculation unit 33 calculates the difference between the position acquisition times of the first and second position data (ie, the difference between the times t1 and t2) Da and the difference between the position acquisition times of the first and third position data (ie, The difference between the times t1 and t3) Db is calculated (step S31 in FIG. 8). Then, the feature amount calculation unit 33 determines whether the difference Da between the position acquisition times of the first and second position data is larger than a predetermined reference value A (for example, 1 hour) (step S32), If the difference Da is larger than the reference value A, the time acquired from the position acquisition time t1 of the first position data in the past by a predetermined time (for example, one hour) is set as the position acquisition time t2 of the second position data.
  • a predetermined reference value A for example, 1 hour
  • Step S33 the feature amount calculation unit 33 determines whether or not the difference Db between the position acquisition times of the first and third position data is larger than a predetermined reference value B (for example, 1 hour) (step S34). If the difference Db is larger than the reference value B, the time that has been advanced in the future by a predetermined time (for example, 1 hour) from the position acquisition time t1 of the first position data is set to the position acquisition time t3 of the third position data. (Step S35). Then, the feature quantity calculation unit 33 calculates and stores the difference between the position acquisition time t2 of the second position data and the position acquisition time t3 of the third position data as the feature quantity for the first position data. (Step S36).
  • a predetermined reference value B for example, 1 hour
  • step S15 the processing in steps S12 and S13 described above is executed for each of the observation target position data, and when the execution is completed for all the observation target position data (positive determination in step S14), the process proceeds to step S15.
  • step S15 the number-of-terminals estimation unit 34 calculates the sum of the feature values w ij for the observation target position data as shown in the above-described equation (6), and calculates the sum of the obtained feature values w ij for the observation period.
  • the numerical value obtained by dividing by the length T is estimated as the number of terminals. In this way, the first or second number in the area can be estimated.
  • the effect of fluctuations in the reception interval is calibrated by performing correction using the acquisition time information of previous and subsequent position data.
  • the number of terminals can be estimated with high accuracy.
  • the mobile terminal 100 is located outside the service area.
  • the position data acquisition time interval becomes abnormally long due to the power of the mobile terminal 100 being turned off or the like, the influence of the abnormally long acquisition time interval is prevented from being excessively increased. Can do.
  • the terminal number estimation unit 34 divides each feature quantity w ij for the observation target position data by 2 to obtain a sum of (feature quantity w ij / 2), A numerical value obtained by dividing the obtained sum by the observation period length T may be estimated as the number of terminals.
  • the number of divisions can be overwhelmingly smaller. There is an advantage that the load can be reduced.
  • FIG. 9 shows a configuration example of the first and second in-zone number estimation units 15 and 17 according to this modification
  • FIG. 10 shows the contents of the estimation process.
  • the first and second in-zone number estimation units 15 and 17 according to the modification include the same components as those in the above-described embodiment (FIG. 3), and the functions of the respective components. Since these are substantially the same, here, the description will focus on differences from the above-described embodiment (FIG. 3).
  • the observation target acquisition unit 31 in the modification includes position acquisition time information that is after the observation start time related to the observation period to be observed and before the observation end time, and is associated with the observation area information related to the observation area to be observed
  • One or more pieces of position data including information are acquired as observation target position data, and then the observation target position data is output to the terminal number estimation unit 34.
  • the front-rear position data acquisition unit 32 sets all the position data acquired by the position data acquisition unit 11 as first position data, and uses the second position data (previous position data) and the first position data related to the first position data.
  • the position acquisition time information of each of the three position data (position data immediately after) is acquired.
  • the position data acquired by the position data acquisition unit 11 may be acquired by the position data acquisition unit 11 and then stored in the storage unit 12 or stored in the storage unit 12. It may be sent from the position data acquisition unit 11 to the front / rear position data acquisition unit 32 without any change. That is, the front / rear position data acquisition unit 32 may read the position acquisition time information of the second and third position data from the storage unit 12 or may receive the position acquisition time information from the position data acquisition unit 11. Logically, either method can be used.
  • the feature amount calculation unit 33 calculates the feature amount for the first position data by using all the position data acquired by the position data acquisition unit 11 as the first position data. Since this calculation result is an enormous amount, as shown in FIG. 9, the feature amount calculation unit 33 includes a feature amount storage unit 33A for storing the feature amount of the calculation result, and the feature amount storage unit 33A calculates the calculation result. It is desirable to store the feature amount. Note that the feature amount calculation unit 33 calculates the difference between the position acquisition times of the second and third position data as the feature amount for the first position data, and the second or third position data shown in FIG. The point of performing processing when the position acquisition time is an abnormal value is the same as in the above-described embodiment.
  • the number-of-terminals estimation unit 34 extracts the feature amount for the observation target position data received from the observation target acquisition unit 31 from the feature amounts for all the position data calculated in advance and stored in the feature amount storage unit 33A. Based on the feature amount of the observation target position data and the difference (observation period length) between the observation start time and the observation end time, the number of terminals located in the observation area during the observation period is estimated. Specifically, as in the above-described embodiment, the terminal number estimation unit 34 estimates the numerical value obtained by dividing the sum of the feature values of the observation target position data by twice the observation period length as the number of terminals. To do.
  • the terminal number estimation process in the modification will be described.
  • the sector number of the sector where the mobile terminal is located is given as the position information included in the position data of the mobile terminal.
  • step S21 for one position data (first position data) for which the front and rear position data acquisition unit 32 obtains a feature amount, among the position data including the same identification information as the first position data, The position acquisition time information of the position data immediately before the first position data (second position data) and the position data immediately after the first position data (third position data) when viewed from the position acquisition time.
  • the position acquisition time information of is acquired.
  • step S22 the feature amount calculation unit 33 calculates the feature amount for the first position data in the same procedure as shown in FIG.
  • the process of step S22 is the same as the process of step S13 of FIG. Thereafter, the feature quantity obtained in step S22 is stored in the feature quantity storage unit 33A (step S23).
  • steps S21 to S23 for one observation target position data (first position data) is completed.
  • steps S21 to S23 are executed for each of all the position data.
  • the feature amounts for all the position data are calculated and stored in the feature amount storage unit 33A. In this way, it is possible to calculate and store the feature amounts for all the position data in advance before performing the terminal number estimation.
  • the observation period acquisition unit 13 acquires observation period information including a set of observation start time and observation end time, and the observation area acquisition unit 14 is associated with one or more pieces of position information. Obtain observation area information.
  • a set of the observation start time T1 and the observation end time T2 is acquired as the observation period information, and the sector number S is acquired as the observation area information.
  • the observation target acquisition unit 31 includes, from the storage unit 12, position acquisition time information that is after the observation start time T1 and before the observation end time T2, and is associated with the sector number S that is observation area information
  • One or more pieces of position data including information are acquired as observation target position data (step S26). That is, the observation target acquisition unit 31 acquires position data that satisfies the following conditions as observation target position data.
  • Condition 1 The position acquisition time is after the observation start time T1 and before the observation end time T2. That is, it is included in the observation period.
  • Condition 2 The position information is sector S.
  • the terminal number estimation unit 34 divides the sum of the feature values w ij for the observation target position data by twice the observation period length T, The number of terminals is estimated (step S27). In this way, the first or second number in the area can be estimated.
  • the terminal number estimation device 10 acquires the observation period information and the observation area information and obtains the terminal It is possible to shorten the time from the start of the number estimation process until the terminal number of the estimation result is obtained.
  • steps S25 to S26 it is not essential to execute the processes of steps S25 to S26 after step S24.
  • the processes of steps S21 to S24 and the processes of steps S25 to S26 may be executed simultaneously in parallel. Good.
  • the terminal number estimation apparatus 10 may further include a population estimation unit 20 that estimates the population in the observation area during the observation period.
  • the population estimation unit 20 includes a ratio between the number of areas in the predetermined area and the population (for example, a ratio between the number of areas in the observation area and the population during the observation period) and the third area number estimation unit 18.
  • the population is estimated based on the third number of areas obtained by the above. For example, if the above ratio is (the number of areas / population), the population estimation unit 20 estimates the population of the observation area during the observation period by dividing the third area by the ratio. And the obtained population can be output from the output unit 19.
  • a “terminal contract rate” which is a ratio of “the number of contracted terminals of a specific communication carrier from which position data is obtained” in the “population in a predetermined area” May be used.
  • the terminal contract ratio it is desirable to obtain a ratio for each region, a ratio for each gender, a ratio for each age group, and the like to estimate the population.
  • the population may be estimated by obtaining the ratio between the number of areas in the country and the population during the observation period or a certain number. Moreover, you may use the ratio calculated
  • the population in the observation area during the observation period is estimated and output. be able to.
  • this ratio is also referred to as an “expansion factor”.
  • an enlargement factor may be derived as follows.
  • the reciprocal of “the product of the location ratio and the terminal penetration rate (that is, the ratio of the number of locations to the population)” can be used.
  • the “area ratio” means the ratio of the area number to the contracted number
  • the “popularity ratio” means the ratio of the contracted number to the population.
  • Such an enlargement factor is desirably derived for each enlargement factor calculation unit described above, but is not essential.
  • the expansion coefficient may be derived using, for example, the number of terminals (the number of existing areas) estimated based on the feature amount and the observation period length as follows.
  • the feature amount is obtained from the position data by the method described in the first embodiment, and based on the feature amount and the observation period length, the number of terminals for each expansion coefficient calculation unit is totaled to obtain the user number pyramid data, and the statistical data Population pyramid data in the same enlargement factor calculation unit obtained in advance as (for example, Basic Resident Register) is acquired.
  • the acquisition rate (namely, the number of area / population) of the position data for every expansion coefficient calculation unit is calculated in the user number pyramid data and the population pyramid data.
  • the “location data acquisition rate (that is, the number of locations / population)” obtained here corresponds to the “product of the location rate and the terminal penetration rate” described above.
  • the reciprocal of the “position data acquisition rate” obtained in this way can be derived as an expansion coefficient.
  • an enlargement factor calculation unit for calculating an enlargement factor for example, every address prefecture, every 5 or 10 years of age, every gender, every hour, etc. may be adopted. A combination of two or more of these may be employed. For example, if the enlargement coefficient calculation unit is “male in the 20s in Tokyo”, the males in the 20s in Japan who live in Tokyo (that is, the address information in the user attribute is Tokyo).
  • the corresponding position data is extracted and the number of terminals is totaled to obtain user number pyramid data, and population pyramid data relating to a 20-year-old man living in Tokyo is obtained from statistical data.
  • the address information in the user attribute is Tokyo instead of extracting only the location data of users residing in Tokyo. Extract location data.
  • the location data acquisition rate that is, the number of people in the area / population
  • the expansion coefficient calculation unit here, a man in the 20s in Tokyo
  • the reciprocal of the “position data acquisition rate” can be derived as an expansion factor.
  • the enlargement coefficient calculation unit and the population estimation unit are described as being equal. However, this is merely an example, and the present invention is not limited to this.
  • q ij indicates position data generated at the terminal a i
  • q i1 , q i2 , and q i3 are generated at the terminal a i while being in the sector S within the observation period.
  • Position data is shown.
  • q i1 is assumed to include location registration information (hereinafter referred to as “LA straddling location registration information”) generated due to the terminal a i straddling a location registration area (Location Area) boundary, Hereinafter, it is referred to as “LA straddling position registration information q i1 ”.
  • the feature quantity w i1 for the LA straddling position registration information q i1 is determined as the first implementation described above. Not the difference between the generation time of the immediately preceding position data q i0 and the generation time of the immediately following position data q i2 as in the form, but the generation time of the LA straddling position registration information q i1 and the generation time of the immediately following position data q i2 The idea of making the difference between is also valid.
  • the location period t i in which the terminal a i was located in the sector S within the observation period is a period indicated by a bold line in FIG. 13, and is the coverage period (FIG. 13) of the first embodiment.
  • a period indicated by a broken line at is shorter by (difference / 2 between the generation time of the LA straddling position registration information q i1 and the generation time of the immediately preceding position data q i0 ).
  • the position data q i4 includes LA straddling position registration information, and hereinafter referred to as “LA straddling position registration information q i4 ”.
  • LA straddling position registration information q i4 it can be determined that the terminal a i has left the sector S at the timing at which the LA straddling position registration information q i4 is generated. Therefore, when calculating the feature quantity w i3 of the position data q i3 immediately before the LA spans location registration information q i4, feature amount w i3 of the position data q i3 the generated time and immediately after the (position data q i3 The difference is 2/2 ) the difference from the generation time of the LA straddling position registration information q i4 .
  • the location period t i in which the terminal a i is located in the sector S within the observation period is a period indicated by a thick line in FIG. 14, and is the coverage period of the first embodiment (indicated by a broken line in FIG. 14). (The difference between the generation time of the position data q i3 and the generation time of the LA straddle position registration information q i4 immediately after that).
  • calculation target position data The feature amount calculation processing based on the second concept of terminal number estimation as described above will be described with reference to FIG.
  • the target position data for calculating the feature value is referred to as “calculation target position data”.
  • the feature amount calculation unit 17 first determines whether or not the calculation target position data includes LA straddling position registration information based on, for example, call type information included in the calculation target position data (step S41). ).
  • the position acquisition time of the calculation target position data is set to the first variable s (hereinafter referred to as “variable s”) for calculating the feature amount (step S42)
  • variable s the first variable s
  • the feature amount calculation unit 17 determines whether or not the immediately following position data includes the LA straddling position registration information based on, for example, call type information included in the immediately following position data (step S44).
  • the position acquisition time of the immediately following position data is set in a second variable e (hereinafter referred to as “variable e”) for feature amount calculation (step S45)
  • variable e the position acquisition time of the immediately following position data is set in the variable e (step S46).
  • the feature quantity calculation unit 17 performs optimization processing for the variables s and e shown in FIG. 16 (step S47).
  • the position acquisition time of the calculation target position data is t1
  • the predetermined reference value used as a reference for determining that the variable s is an abnormal value is the reference value C (for example, 0.5 hour)
  • the variable e is the abnormal value.
  • a predetermined reference value serving as a reference for determining that the reference value is determined as a reference value D (for example, 0.5 hours).
  • the feature amount calculation unit 17 calculates the difference Dc between the variable s and time t1, and the difference Dd between the variable e and time t1 (step S51 in FIG. 16). Then, the feature amount calculation unit 17 determines whether or not the difference Dc between the variable s and the time t1 is larger than a predetermined reference value C (for example, 0.5 hours) (step S52). If it is larger, a time traced back in the past by a predetermined time (for example, 0.5 hour) from the time t1 is set in the variable s (step S53).
  • a predetermined reference value C for example, 0.5 hours
  • the feature amount calculation unit 17 determines whether or not the difference Dd between the variable e and the time t1 is greater than a predetermined reference value D (for example, 0.5 hour) (step S54). If the difference Dd is the reference value D If it is larger, the time set in the future by a predetermined time (for example, 0.5 hour) from the time t1 is set in the variable e (step S55).
  • a predetermined reference value D for example, 0.5 hour
  • the feature amount calculation unit 17 calculates a value obtained by doubling (variable e ⁇ variable s) as a feature amount for the calculation target position data (step S48). As described above, the feature amount for the calculation target position data is obtained.
  • the sector S is generated at the timing when the LA straddling position registration information is generated. In consideration of the fact that inflow into or outflow from the sector S occurs, a highly accurate feature quantity can be obtained.
  • the feature amount calculation method described in the second embodiment is not limited to “a feature amount for all position data in advance” even in “a case where the number of terminals is estimated by calculating feature amounts by focusing on observation target position data”. It can also be applied to the case of “calculating and estimating the number of terminals using the feature amount of the observation target position data”.
  • the time difference between the position data before and after the position data (first position data) whose feature value is to be obtained that is, the second position data (previous position data) and the first position data.
  • 3 shows an example in which the position data of 3 (time difference from the position data immediately after) is calculated as the feature amount of the first position data.
  • the feature amount can be expressed by the following equation (7).
  • the following formula (7) is only a modification of the above-described formula (4) and is equivalent to the formula (4) (that is, the idea of the formula (4) is not changed).
  • w ij u i (j + 1) ⁇ u i (j ⁇ 1) (7)
  • This modification shows another variation of the feature amount calculation method calculated by the feature amount calculation unit 17.
  • the feature quantity calculation unit 17 determines the type information (for example, position data generation factors described later) for the second position data and the third position data when obtaining the feature quantity of the first position data. (Generation timing)). Specifically, the feature quantity calculation unit 17 calculates a correction coefficient ⁇ corresponding to the type information (generation factor here) of the third position data with respect to the time difference between the third position data and the first position data. A value obtained by multiplying the time difference between the first position data and the second position data by a correction coefficient ⁇ corresponding to the type information (generation factor in this case) of the second position data is calculated. calculate.
  • the feature amount calculation unit 17 may determine the correction coefficient ⁇ or ⁇ in accordance with the type information of the first position data, and the type information of the first and second position data. Accordingly, the correction coefficient ⁇ may be determined or the correction coefficient ⁇ may be determined according to the type information of the first and third position data. And the feature-value calculation part 17 makes the value which added the value obtained by these multiplications the feature-value of 1st position data.
  • the feature amount calculation processing in the feature amount calculation unit 17 is expressed by an equation, it is expressed by the following equation (8).
  • w ij ⁇ (u i (j + 1) ⁇ u ij ) + ⁇ (u ij ⁇ u i (j ⁇ 1) ) (8)
  • the position data is position registration information
  • information on the generation factor of the position registration information can be cited. It is included in the generated location registration information.
  • Factors for generating location registration information include that the terminal has crossed a location registration area (Location Area) boundary, that it has been generated based on location registration that is performed periodically, that the attachment process is performed by turning on the terminal, etc. For example, the detachment process is executed when the power is turned off.
  • the set values of the correction coefficients ⁇ and ⁇ are determined in advance corresponding to these generation factors. Then, the feature amount calculation unit 17 sets the correction coefficient ⁇ for the third position data according to the information regarding the generation factor of the third position data, and sets the correction coefficient ⁇ for the third position data according to the information regarding the generation factor of the second position data.
  • the correction coefficient ⁇ for the position data 2 may be set. Both the correction coefficients ⁇ and ⁇ may be set in advance to a value of 0 or more and 2 or less. However, this numerical range is not essential.
  • the expectation of the time spent in the current sector The value is considered to be the same before and after the location registration information is generated.
  • location registration information generated by a terminal straddling a location registration area boundary it can be determined that the terminal has not stayed in the current sector at least before the location registration information is generated.
  • the time that the terminal stayed in the current sector before the location registration information is generated is considered as 0, and the type information (generation factor) of the first location data is “location registration area boundary straddle”
  • the correction coefficient ⁇ in the above equation (8) that is, the correction coefficient ⁇ related to the time difference from the immediately preceding position data
  • the feature amount is calculated with the correction coefficient ⁇ set to 0, as in the second embodiment described above. The effect of can be obtained.
  • the feature amount calculation unit 17 calculates the feature amount for the target position data (first position data), the second and third positions which are position data before and after the first position data.
  • the time difference between the second position data and the third position data is corrected according to the type information about the data (for example, the generation factor of the position data), and the feature amount is calculated using the corrected time difference.
  • the feature amount can be calculated with higher accuracy based on the type information of the position data.
  • non-identification processing for removing information having personal identification from the position data may be performed, and the position data after the non-identification processing may be used.
  • Deidentification processing including conversion to an irreversible code by a one-way function may be performed on the included identification information (for example, a telephone number).
  • the one-way function is used in order to prevent restoration from the converted information, and the one-way function is based on, for example, a hash function recommended by domestic and foreign evaluation projects and evaluation institutions.
  • a keyed hash function can be used.
  • the non-identifying means for the number (for example, telephone number) that can identify the individual in the attribute information before the processing, De-identification processing including conversion to an irreversible code by a one-way function may be performed. Further, the non-identifying means may delete the name information in the attribute information, replace the date of birth information with age information, and replace the address information with address information at the street level where the address information is deleted.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Navigation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

 端末数推計装置(10)は、位置登録情報を含む複数の位置情報の集合である位置データを取得する位置データ取得部(11)と、位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第1の在圏数として推計する第1の在圏数推計部(15)と、位置データから、位置データの種別に応じて位置データを抽出する(例えば、端末が位置登録エリア境界を跨いだことに起因して生成された位置登録情報を除去し、除去後の位置データを得る)信号除去部(16)と、抽出された位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第2の在圏数として推計する第2の在圏数推計部(17)と、第1の在圏数と第2の在圏数のうち一方又は両方に基づいて、観測期間中に観測エリアに在圏した端末数を第3の在圏数として推計する第3の在圏数推計部(18)と、を備える。

Description

端末数推計装置および端末数推計方法
 本発明は、携帯端末(例えば携帯電話)のネットワーク設備から得られる、携帯端末に関する位置データを用いて、ある領域内に在圏する端末数を推計する端末数推計装置および端末数推計方法に関する。なお、本明細書における「位置データ」は、位置登録情報を含む複数の位置情報の集合であり、位置登録情報以外の位置情報(例えばGPS測位情報など)をさらに含んでも構わない。
 従来、生成される位置登録情報の数に基づいて、ある領域(例えばセクタ)内に在圏する端末数(いわゆる在圏数)を推計する技術が知られている。しかし、位置登録情報は、所定の位置登録周期で生成される以外に、端末ユーザが位置登録エリア(location area)の境界(以下「LA境界」と称する)を跨いで別の位置登録エリアへ移る際にも生成される。そのため、LA境界に面したセクタでは、他のセクタと比べて、位置登録情報の生成確率が相対的に高くなり、LA境界に面したセクタの在圏数が過大に推計されるおそれがある。図12は、LA境界周辺の推計在圏数(縦軸)とLA境界からの距離(横軸)との相関を示す概念図であるが、このうち四角の点でプロットした従来手法に基づく推計在圏数に関する太い実線のグラフおよびダイヤ状の点でプロットした真の値(真の推計在圏数)に関する細い実線のグラフより明らかなように、図12の横軸中央(LA境界)付近では、従来手法に基づく推計在圏数が真の値に対し相対的に多くなっている。
 下記の特許文献1には、LA境界に面したセクタの在圏数が過大に推計されることを考慮して、LA境界に面したセクタの在圏数を修正する点が提案されている。
国際公開公報2010/116903A1
 ところで、端末ユーザが位置登録エリア境界を跨ぐ際には、位置登録周期がゼロにリセットされる。このため、LA境界から少し離れたセクタ(例えば、LA境界に面したセクタに対しセクタ内側に隣接するセクタ等)では、位置登録情報の生成確率が相対的に低くなり、LA境界から少し離れたセクタの在圏数が過少に推計されるおそれがある。前述した図12の横軸中央(LA境界)付近から少し離れた位置では、従来手法に基づく推計在圏数が真の値に対し相対的に小さくなっている。
 しかしながら、このような課題を解決するための具体的な手法は、特許文献1には明示しておらず、在圏数をより精度良く推計する上で改良の余地があった。
 本発明は、上記課題を解決するために成されたものであり、在圏数をより精度良く推計することを目的とする。
 本発明の一側面に係る端末数推計装置は、位置登録情報を含む複数の位置情報の集合である位置データを取得する位置データ取得部と、前記位置データ取得部により取得された位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第1の在圏数として推計する第1の在圏数推計部と、前記位置データ取得部により取得された位置データから、位置データの種別に応じて位置データを抽出する抽出部と、抽出された位置データに基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第2の在圏数として推計する第2の在圏数推計部と、前記第1の在圏数推計部により得られた第1の在圏数と、前記第2の在圏数推計部により得られた第2の在圏数、のうち一方又は両方に基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第3の在圏数として推計する第3の在圏数推計部と、を備えることを特徴とする。このような端末数推計装置によれば、位置登録情報を含む複数の位置情報の集合である位置データに基づく第1の在圏数と、位置データの種別に応じて抽出された位置データに基づく第2の在圏数、のうち一方又は両方に基づいて、端末数を第3の在圏数として推計することで、第1の在圏数と第2の在圏数の間の数値範囲内(ただし両端の数値も含む)のどこかに相当する端末数を第3の在圏数として、より精度良く推計することができる。なお、第3の在圏数推計部は、第1の在圏数と第2の在圏数とに基づいて、端末が位置登録エリア境界を跨いだことに起因して生じた端末数の誤差を推計してもよい。
 また、本発明の一側面に係る端末数推計装置は、位置登録情報を含む複数の位置情報の集合である位置データを取得する位置データ取得部と、前記位置データ取得部により取得された位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第1の在圏数として推計する第1の在圏数推計部と、前記位置データ取得部により取得された位置データから、端末が位置登録エリア境界を跨いだことに起因して生成された位置登録情報を除去し、除去後の位置データを得る信号除去部と、前記信号除去部により得られた除去後の位置データに基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第2の在圏数として推計する第2の在圏数推計部と、前記第1の在圏数推計部により得られた第1の在圏数と、前記第2の在圏数推計部により得られた第2の在圏数、のうち一方又は両方に基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第3の在圏数として推計する第3の在圏数推計部と、を備えてもよい。このとき、第3の在圏数推計部は、第1の在圏数と第2の在圏数とに基づいて、端末が位置登録エリア境界を跨いだことに起因して生じた端末数の誤差を推計してもよい。
 また、上述した端末数推計装置において、第3の在圏数推計部は、推計の基礎となる在圏数を、第1の在圏数、第2の在圏数、並びに、第1および第2の在圏数、の中で、観測エリアごとに切り替えて、第3の在圏数の推計を行ってもよい。
 このような端末数推計装置によれば、位置登録情報を含む複数の位置情報の集合である位置データに基づく第1の在圏数と、端末が位置登録エリア境界を跨いだことに起因して生成された位置登録情報を除去した後の位置データに基づく第2の在圏数、のうち一方又は両方に基づいて、端末数を第3の在圏数として推計することで、第1の在圏数と第2の在圏数の間の数値範囲内(ただし両端の数値も含む)のどこかに相当する端末数を第3の在圏数として推計することができる。これにより、位置登録エリア境界付近では在圏数が過大に推計され、位置登録エリア境界から少し離れた位置では在圏数が過小に推計されるといった問題点を解消し、在圏数をより精度良く推計することができる。
 上記第3の在圏数の推計手法としては、さまざまな態様を採用しうる。例えば、第3の在圏数推計部は、第1の在圏数と第2の在圏数との予め定められた按分点に相当する端末数を第3の在圏数として推計してもよい。ここでの按分点としては、例えば、第1の在圏数と第2の在圏数のちょうど真ん中の点であってもよいし、第1の在圏数と第2の在圏数の間を3等分した場合の第2の在圏数に近い方の点であってもよいし、これら以外の按分点であってもよい。また、第3の在圏数推計部は、第1の在圏数が第2の在圏数以上の場合、第1の在圏数と第2の在圏数との予め定められた按分点に相当する端末数を第3の在圏数として推計し、第1の在圏数が第2の在圏数未満の場合、第2の在圏数を第3の在圏数として推計してもよい。
 また、第1、第2の在圏数の推計手法についても、さまざまな態様を採用しうる。例えば、位置データが、各位置情報に関連付けられた、端末を識別する識別情報および当該位置情報が取得された位置取得時刻情報を含み、第1の在圏数推計部と第2の在圏数推計部の両方又は一方が、ある対象の位置データについて、当該対象の位置データと同一の識別情報を含む位置データのうち、当該対象の位置データの直前の位置データの位置取得時刻情報、および当該対象の位置データの直後の位置データの位置取得時刻情報を取得する前後位置データ取得部と、直前の位置データの位置取得時刻情報、対象の位置データの位置取得時刻情報、および直後の位置データの位置取得時刻情報のうち2つ以上に基づいて、対象の位置データについての特徴量を計算する特徴量計算部と、観測すべき観測期間に関する観測開始時刻以降であり且つ観測終了時刻以前である位置取得時刻情報を含み、且つ観測すべき観測エリアに関する観測エリア情報に対応づけられる位置情報を含む1乃至複数の位置データを、観測対象位置データとして取得する観測対象取得部と、観測対象位置データについての特徴量、および観測開始時刻と観測終了時刻との差である観測期間長に基づいて、観測期間中に観測エリアに在圏した端末数を推計する端末数推計部と、を含む構成としてもよい。
 ところで、特徴量計算部は、対象の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含むか否か、および直後の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含むか否かを判別し、対象の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含むか否かの判別結果と直後の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含むか否かの判別結果とに応じて、対象の位置データの位置取得時刻情報、直前の位置データの位置取得時刻情報および直後の位置データの位置取得時刻情報のうち2つ以上を用いて、対象の位置データについての特徴量を計算してもよい。この場合、詳細な原理は後述するが、位置登録エリア境界の跨りに起因して生成された位置登録情報に関する生成タイミングの特性を考慮した上で、精度の高い特徴量を得ることができる。なお、「位置登録エリア境界の跨りに起因して生成された位置登録情報」とは、携帯端末が位置登録エリア境界を跨ったことに起因して生成された位置登録情報を意味する。
 より具体的には、特徴量計算部は、対象の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含む場合、対象の位置データの位置取得時刻を第1の変数に設定し、対象の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含まない場合、対象の位置データの位置取得時刻と直前の位置データの位置取得時刻との中点時刻を第1の変数に設定し、直後の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含む場合、直後の位置データの位置取得時刻を第2の変数に設定し、直後の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含まない場合、対象の位置データの位置取得時刻と直後の位置データの位置取得時刻との中点時刻を第2の変数に設定し、設定された第1の変数と第2の変数との差分に基づいて、対象の位置データについての特徴量を計算してもよい。
 なお、特徴量計算部は、対象の位置データの位置取得時刻と第1の変数との差が所定値より大きい場合、対象の位置データの位置取得時刻から予め定められた時間だけ過去に遡った時刻を、第1の変数として用いて、対象の位置データについての特徴量を計算してもよい。同様に、特徴量計算部は、対象の位置データの位置取得時刻と第2の変数との差が所定値より大きい場合、対象の位置データの位置取得時刻から予め定められた時間だけ未来に進めた時刻を、第2の変数として用いて、対象の位置データについての特徴量を計算してもよい。上記のように特徴量計算部を動作させることにより、携帯端末が圏外に位置していることや携帯端末の電源がオフされていること等に起因して位置データの取得時間間隔が異常に長くなった際に、当該異常に長くなった取得時間間隔による影響が過大に出ることを防ぐことができる。
 なお、端末数推計装置は、第3の在圏数推計部により得られた第3の在圏数と、予め定められたエリアにおける在圏数と人口との比率と、に基づいて、観測期間中の観測エリアにおける人口を推計する人口推計部、をさらに備えてもよい。この場合、観測期間中の観測エリアにおける人口をより精度良く推計することができる。なお、観測期間中の全国の在圏数と人口との比率やある一定数を求めて人口を推計してもよい。また、観測期間ではなく、予め求めた比率を用いてもよい。なお、上述した在圏数と人口との比率として(人口/在圏数)を採用する場合、この比率は「拡大係数」とも呼ばれる。このような拡大係数は、特徴量および観測期間長に基づいて推計された端末数(在圏数)を用いて導出してもよく、その導出方法については後述する。また、端末数推計装置は、観測開始時刻と観測終了時刻との組を含む観測期間情報を取得する観測期間取得部と、1乃至複数の位置情報と対応づけられる観測エリア情報を取得する観測エリア取得部と、をさらに備えてもよい。
 上述した端末数推計装置に係る発明は、端末数推計装置により実行される端末数推計方法に係る発明として捉えることができ、同様の作用・効果を奏する。
 即ち、本発明の一側面に係る端末数推計方法は、端末数推計装置により実行される端末数推計方法であって、位置登録情報を含む複数の位置情報の集合である位置データを取得する位置データ取得ステップと、前記位置データ取得ステップにより取得された位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第1の在圏数として推計する第1の在圏数推計ステップと、前記位置データ取得ステップにより取得された位置データから、位置データの種別に応じて位置データを抽出する抽出ステップと、抽出後の位置データに基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第2の在圏数として推計する第2の在圏数推計ステップと、前記第1の在圏数推計ステップにより得られた第1の在圏数と、前記第2の在圏数推計ステップにより得られた第2の在圏数、のうち一方又は両方に基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第3の在圏数として推計する第3の在圏数推計ステップと、を備えることを特徴とする。
 また、本発明の一側面に係る端末数推計方法は、端末数推計装置により実行される端末数推計方法であって、位置登録情報を含む複数の位置情報の集合である位置データを取得する位置データ取得ステップと、前記位置データ取得ステップにより取得された位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第1の在圏数として推計する第1の在圏数推計ステップと、前記位置データ取得ステップにより取得された位置データから、端末が位置登録エリア境界を跨いだことに起因して生成された位置登録情報を除去し、除去後の位置データを得る信号除去ステップと、前記信号除去ステップにより得られた除去後の位置データに基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第2の在圏数として推計する第2の在圏数推計ステップと、前記第1の在圏数推計ステップにより得られた第1の在圏数と、前記第2の在圏数推計ステップにより得られた第2の在圏数、のうち一方又は両方に基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第3の在圏数として推計する第3の在圏数推計ステップと、を備えてもよい。
 本発明によれば、位置登録情報を含む複数の位置情報の集合である位置データに基づく第1の在圏数と、位置データの種別に応じて抽出された位置データに基づく第2の在圏数、のうち一方又は両方に基づいて、端末数を第3の在圏数として推計することで、第1の在圏数と第2の在圏数の間の数値範囲内(ただし両端の数値も含む)のどこかに相当する端末数を第3の在圏数として、より精度良く推計することができる。このとき第2の在圏数として、例えば、端末が位置登録エリア境界を跨いだことに起因して生成された位置登録情報を除去した後の位置データに基づく第2の在圏数を用いることで、位置登録エリア境界付近では在圏数が過大に推計され、位置登録エリア境界から少し離れた位置では在圏数が過小に推計されるといった問題点を解消し、在圏数をより精度良く推計することができる。
発明の実施形態の通信システムのシステム構成を示す図である。 端末数推計装置の構成を示す図である。 第1、第2の在圏数推計部の構成を示す図である。 端末数推計の考え方を説明するための図である。 端末数推計に係る計算方法を説明するための図である。 端末数推計処理を示すフローチャートである。 第1、第2の在圏数の推計処理を示すフローチャートである。 特徴量の計算処理を示すフローチャートである。 第1、第2の在圏数推計部の変形例の構成を示す図である。 第1、第2の在圏数の推計処理の変形例を示すフローチャートである。 端末数推計装置の変形例の構成を示す図である。 LA境界周辺の推計在圏数とLA境界からの距離との相関を示す概念図である。 端末数推計の第2の考え方を説明するための図である。 端末数推計の第2の考え方を説明するための図である。 第2実施形態の特徴量の計算処理を示すフローチャートである。 変数s、eの適正化処理を示すフローチャートである。
 添付図面を参照しながら本発明のさまざまな実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。本件における「位置データ」とは、携帯端末を識別する端末識別子と、携帯端末が在圏するセクタを識別するセクタ識別子と、携帯端末の位置に関する位置情報(例えば緯度・経度情報)と、位置情報が取得された位置取得時刻情報と、を含むデータを広く意味し、例えば、携帯端末にて生成された位置登録信号に含まれる情報(以下「位置登録情報」という)、上記セクタ識別子が付加されたGPS位置情報などが含まれる。GPS位置情報は、その生成時には上記のセクタ識別子を含まないが、携帯端末からのGPS位置情報を受信した基地局によって上記セクタ識別子が付加され、後述の端末数推計装置10(図2)はセクタ識別子付きのGPS位置情報を取得可能とされている。また、GPS位置情報は、その生成時に上記のセクタ識別子を含む場合も想定される。この場合、携帯端末がGPS位置情報を生成した際に上記セクタ識別子が付加され、後述の端末数推計装置10(図2)はセクタ識別子付きのGPS位置情報を取得可能とされている。位置登録情報には、位置登録信号が生成された要因(例えば、周期的位置登録、携帯端末が位置登録エリア境界を跨いだこと(いわゆるLA跨り)、携帯端末の電源オン等によるアタッチ処理の実行、携帯端末の電源オフ等によるデタッチ処理の実行など)を示す生成要因情報が含まれており、この生成要因情報に基づいて、位置登録情報のうち、例えば、携帯端末が位置登録エリア境界を跨いだことに起因して生成された位置登録情報(以下「LA跨り位置登録情報」と称する)を除外することや、周期的位置登録に起因して生成された位置登録情報のみを抽出すること等が可能とされている。
 [第1実施形態]
 [通信システムの構成]
 図1は、本実施形態の通信システム1のシステム構成図である。図1に示すように、この通信システム1は、携帯端末100、BTS(基地局)200、RNC(無線制御装置)300、交換機400、各種処理ノード700、および管理センタ500を含んで構成されている。また、この管理センタ500は、社会センサユニット501、ペタマイニングユニット502、モバイルデモグラフィユニット503、および可視化ソリューションユニット504から構成されている。
 交換機400は、BTS200、RNC300を介して、携帯端末100についての後述する位置情報を収集する。RNC300は、携帯端末100との間で通信接続が行われる際に、RRCコネクション要求信号における遅延値を用いて携帯端末100の位置を測定することができる。交換機400は、このように測定された携帯端末100の位置情報を、携帯端末100が通信接続を実行する際に受け取ることができる。交換機400は受け取った位置情報を記憶しておき、所定のタイミング又は管理センタ500からの要求に応じて、収集された位置情報を管理センタ500に出力する。
 各種処理ノード700は、RNC300および交換機400を通じて携帯端末100の位置情報を取得し、場合によっては位置の再計算等を行い、所定のタイミングで又は管理センタ500からの要求に応じて、収集された位置情報を管理センタ500に出力する。
 本実施形態における携帯端末100の位置情報としては、位置登録情報により求められた在圏セクタを示すセクタ番号、GPS測位システムやPRACH PDによる位置情報取得システムで得られた位置測位情報等を採用することができる。携帯端末100の位置データは、上記のような位置情報とともに、当該携帯端末を識別する識別情報(例えば回線番号等の携帯端末と対応付けられる情報)、および位置情報が取得された位置取得時刻情報を含む。なお、識別情報として回線番号を用いる場合は、回線番号をそのまま用いるのではなく、回線番号と対応付けられる値(例えば回線番号のハッシュ値等)を用いることが好適である。
 管理センタ500は、上述したとおり、社会センサユニット501、ペタマイニングユニット502、モバイルデモグラフィユニット503、および可視化ソリューションユニット504を含んで構成されており、各ユニットでは、携帯端末100の位置データを用いた統計処理を行う。なお、後述する端末数推計装置10(図2)は、例えば管理センタ500により構成することができる。
 社会センサユニット501は、各交換機400および各種処理ノード700から、又は、オフラインで、携帯端末100の位置データ等を含んだデータを収集するサーバ装置である。この社会センサユニット501は、交換機400および各種処理ノード700から定期的に出力されたデータを受信したり、又は社会センサユニット501において予め定められたタイミングに従って交換機400および各種処理ノード700からデータを取得したりできるように構成されている。
 ペタマイニングユニット502は、社会センサユニット501から受信したデータを所定のデータ形式に変換するサーバ装置である。例えば、ペタマイニングユニット502は、ユーザIDをキーにソーティング処理を行ったり、エリアごとにソーティング処理を行ったりする。
 モバイルデモグラフィユニット503は、ペタマイニングユニット502において処理されたデータに対する集計処理、すなわち各項目のカウンティング処理を行うサーバ装置である。例えば、モバイルデモグラフィユニット503は、あるエリアに在圏するユーザ数をカウントしたり、また在圏分布を集計したりすることができる。
 可視化ソリューションユニット504は、モバイルデモグラフィユニット503において集計処理されたデータを可視可能に処理するサーバ装置である。例えば、可視化ソリューションユニット504は、集計されたデータを地図上にマッピング処理することができる。この可視化ソリューションユニット504にて処理されたデータは、企業、官公庁又は個人等に提供され、店舗開発、道路交通調査、災害対策、環境対策等に利用される。なお、このように統計処理された情報は、当然にプライバシーを侵害しないように個人等は特定されないように加工されている。
 なお、社会センサユニット501、ペタマイニングユニット502、モバイルデモグラフィユニット503および可視化ソリューションユニット504はいずれも、前述したようにサーバ装置により構成され、図示は省略するが、通常の情報処理装置の基本構成(即ち、CPU、RAM、ROM、キーボードやマウス等の入力デバイス、外部との通信を行う通信デバイス、情報を記憶する記憶デバイス、および、ディスプレイやプリンタ等の出力デバイス)を備えることは言うまでもない。
 [端末数推計装置の構成]
 次に、本実施形態に係る端末数推計装置について説明する。図2には端末数推計装置10の機能ブロック構成を示す。この図2に示すように、端末数推計装置10は、位置データ取得部11、蓄積部12、観測期間取得部13、観測エリア取得部14、第1の在圏数推計部15、信号除去部16、第2の在圏数推計部17、第3の在圏数推計部18、および出力部19を備えている。
 以下、図2の端末数推計装置10の各部の機能を説明する。位置データ取得部11は、外部(例えば交換機400や各種処理ノード700等)から位置データを取得し蓄積部12に保存する。なお、位置データ取得部11を端末数推計装置10内に設けることは必須ではなく、端末数推計装置10の外部の位置データ取得部により取得された位置データを、例えば記憶媒体を介して、端末数推計装置10に入力してもよい。蓄積部12は、多数のユーザ(携帯端末)についての複数の時刻にわたる位置データを保存する。観測期間取得部13は、観測開始時刻と観測終了時刻との組を含む観測期間情報を取得する。観測エリア取得部14は、1乃至複数の位置情報と対応づけられる観測エリア情報を取得する。ここでの観測エリア情報は、例えばセクタ番号、緯度経度、地理的な範囲(例えば市区町村)等として与えられ、観測エリア取得部14は、取得される観測エリア情報の表現形式と位置情報の表現形式とを対応づける情報(例えばセクタ番号と緯度経度との対応関係情報等)を管理するデータベースを備えることが望ましい。
 第1の在圏数推計部15は、蓄積部12から位置データを読み出し、当該位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第1の在圏数として推計する。第1の在圏数推計部15による端末数推計方法は、特定の方法に限定されるものではなく、さまざまな方法を採用しうる。後に、端末数推計方法の一例および当該推計方法を実行するための第1の在圏数推計部15の構成を説明する。なお、端末数推計方法としては、後述する例以外に、例えば、本件出願人が先に出願した特願2010-221456号に記載された方法等を用いることができる。同方法は、情報分析装置が、ユーザの位置を示す位置情報、当該位置情報が得られた測位時刻情報およびユーザIDを含むポイントデータを外部から受信し、各ユーザについてのポイントデータから、測位時刻が対象時刻の直前のポイントデータと、測位時刻が対象時刻の直後のポイントデータとを抽出し、各ユーザについて、対象時刻の直前のポイントデータの示す位置と対象時刻の直後のポイントデータの示す位置との間を補完することにより、対象時刻におけるユーザの位置を推定し、そして、推定された各ユーザの位置に基づいて対象時刻における所定の算出対象エリア単位の人口分布を算出する一連の方法であり、この方法を端末数推計に適用すればよい。
 信号除去部16は、蓄積部12から位置データを読み出し、当該位置データから、端末が位置登録エリア境界を跨いだことに起因して生成された位置登録情報(以下「LA跨りによる位置登録情報」という)を除去し、除去後の位置データを得る。ここで得られた「除去後の位置データ」は、位置登録情報のうち、LA跨りによる位置登録情報を除いた位置登録情報を含んでおり、もちろん、位置登録情報以外の位置情報(例えばGPS測位情報など)をさらに含んでも構わない。上記の信号除去部16は、特許請求の範囲における「抽出部」および「信号除去部」に相当し、本実施形態では、位置データの種別(例えば位置データの生成要因等)に応じて位置データを抽出する抽出部の一例として、位置データからLA跨りによる位置登録情報を除去し、除去後の位置データを得る信号除去部16を説明する。なお、位置データの種別に応じた抽出方法として、例えば、位置登録情報に含まれる前述した生成要因情報を参照することで、位置データのうちLA跨り位置登録情報のみを除外する(即ち、LA跨り位置登録情報以外の位置データを抽出する)方法、位置データのうち周期的位置登録に起因して生成された位置登録情報のみを抽出する方法、などを実行できる。また、「位置データの種別」としては、上記の生成要因以外に、例えば位置データの生成時刻なども適用可能である。
 第2の在圏数推計部17は、信号除去部16により得られた除去後の位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第2の在圏数として推計する。第2の在圏数推計部17による端末数推計方法も、特定の方法に限定されるものではなく、前述した特願2010-221456号に記載された方法も含め、さまざまな方法を採用しうるが、第1の在圏数推計部15による端末数推計方法と同じ方法であることが望ましい。本実施形態では、第2の在圏数推計部17が第1の在圏数推計部15と同じ端末数推計方法を採用する例を説明する。具体的な端末数推計方法の一例および当該推計方法を実行するための第2の在圏数推計部17の構成は、後述する。
 第3の在圏数推計部18は、第1の在圏数推計部15により得られた第1の在圏数と、第2の在圏数推計部17により得られた第2の在圏数、のうち一方又は両方に基づいて、観測期間中に観測エリアに在圏した端末数を第3の在圏数として推計する。前述した図12では、LA跨りによる位置登録情報を除去する前の位置データに基づき推計された第1の在圏数が、四角の点でプロットした推計在圏数に関する太い実線のグラフに相当し、LA跨りによる位置登録情報の除去後の位置データに基づき推計された第2の在圏数が、三角の点でプロットした推計在圏数に関する破線のグラフに相当する。本実施形態のように、第3の在圏数推計部18が、第1の在圏数と第2の在圏数のうち一方又は両方に基づいて第3の在圏数を推計することにより、第1の在圏数と第2の在圏数の間の数値範囲内(ただし両端の数値も含む)のどこかに相当する端末数を第3の在圏数として推計することができ、図12における真の値に近づく。これにより、位置登録エリア境界付近では在圏数が過大に推計され、位置登録エリア境界から少し離れた位置では在圏数が過小に推計されるといった問題点を解消し、在圏数をより精度良く推計することができる。
 ところで、第3の在圏数推計部18による端末数推計方法は、特定の方法に限定されるものではなく、以下のようなさまざまな方法を採用しうる。例えば、第3の在圏数推計部18は、第1の在圏数と第2の在圏数との予め定められた按分点に相当する端末数を第3の在圏数として推計してもよい。ここでの按分点としては、第1の在圏数と第2の在圏数のちょうど真ん中の点であってもよいし、第1の在圏数と第2の在圏数の間を3等分した場合の第2の在圏数に近い方の点であってもよいし、これら以外の按分点であってもよい。
 また、第3の在圏数推計部18は、第1の在圏数が第2の在圏数以上の場合に、上述したような第1の在圏数と第2の在圏数との按分点に相当する端末数を第3の在圏数として推計し、一方、第1の在圏数が第2の在圏数未満の場合に、第2の在圏数を第3の在圏数として推計してもよい。
 また、第3の在圏数推計部18は、推計の基礎となる在圏数を、第1の在圏数、第2の在圏数、並びに、第1および第2の在圏数、の中で、観測エリアごとに切り替えて、第3の在圏数の推計を行ってもよい。
 また、第3の在圏数推計部18は、第1の在圏数と第2の在圏数とに基づいて、端末が位置登録エリア境界を跨いだことに起因して生じた端末数の誤差を推計してもよい。例えば、第3の在圏数推計部18は、第1の在圏数と第2の在圏数との差分を、端末が位置登録エリア境界を跨いだことに起因して生じた端末数の誤差として、推計してもよい。このように推計された端末数の誤差は、端末数の推計に関する精度の評価に用いることができる。なお、上記のような端末数の誤差の推計は、本実施形態のように信号除去部16によって位置データからLA跨りによる位置登録情報を除去して除去後の位置データを得る実施形態のみならず、位置データの種別に応じて位置データを抽出する実施形態全般において実行可能である。
 図2へ戻り、出力部19は、推計により得られた端末数を出力する。ここでの出力には、表示出力、音声出力、印刷出力等さまざまな出力態様が含まれる。なお、端末数推計装置10では、第1の在圏数推計部15、信号除去部16、第2の在圏数推計部17、および第3の在圏数推計部18が必須要件であり、その他の構成要件については端末数推計装置10内に設けることは必須ではない。
 [第1、第2の在圏数推計部の構成]
 図3には、第1の在圏数推計部15の構成を示す。本実施形態では、第2の在圏数推計部17は第1の在圏数推計部15と同じ端末数推計方法を採用するため、第2の在圏数推計部17の構成は、以下に述べる第1の在圏数推計部15の構成と同様である。
 図3に示すように、第1の在圏数推計部15は、観測対象取得部31、前後位置データ取得部32、特徴量計算部33、および端末数推計部34を備える。
 観測対象取得部31は、観測すべき観測期間に関する観測開始時刻情報および観測終了時刻情報を観測期間取得部13から、観測すべき観測エリアに関する観測エリア情報を観測エリア取得部14から、それぞれ取得し、観測開始時刻以降であり且つ観測終了時刻以前である位置取得時刻情報を含み、且つ観測エリア情報に対応づけられる位置情報を含む1乃至複数の位置データを、観測対象位置データとして蓄積部12から取得する。なお、観測対象位置データは、別途与えられた条件(例えば携帯端末のユーザの年齢層等)によって、さらに絞り込みをかけてもよい。
 前後位置データ取得部32は、在圏数推計処理の過程で計算される後述の特徴量を求める対象の位置データ(以下「第1の位置データ」という)について、当該第1の位置データと同一の識別情報を含む位置データのうち、当該第1の位置データの直前の位置データ(以下「第2の位置データ」という)の位置取得時刻情報、および当該第1の位置データの直後の位置データ(以下「第3の位置データ」という)の位置取得時刻情報を取得する。なお、前後位置データ取得部32は、第2又は第3の位置データの全体を取得することは必須ではなく、少なくとも、位置データに含まれる位置取得時刻情報を取得すればよい。なお、前後位置データ取得部32は、第2、第3の位置データの位置取得時刻情報を蓄積部12から読み出してもよいし、位置データ取得部11から渡してもらってもよい。論理的にはどちらの方法でも構わない。
 特徴量計算部33は、第1の位置データそれぞれについての特徴量を計算する。例えば、特徴量計算部33は、第2の位置データの位置取得時刻と第3の位置データの位置取得時刻との差を、当該第1の位置データについての特徴量として計算する。また、特徴量計算部33は、第2の位置データの位置取得時刻が異常値である場合、ここでは一例として第1の位置データの位置取得時刻と第2の位置データの位置取得時刻との差が所定の基準値(例えば1時間)より大きい場合に、第1の位置データの位置取得時刻から予め定められた時間(例えば1時間)だけ過去に遡った時刻を第2の位置データの位置取得時刻として用いて、第1の位置データについての特徴量を計算する。同様に、特徴量計算部33は、第3の位置データの位置取得時刻が異常値である場合、ここでは一例として第1の位置データの位置取得時刻と第3の位置データの位置取得時刻との差が所定の基準値(例えば1時間)より大きい場合に、第1の位置データの位置取得時刻から予め定められた時間(例えば1時間)だけ未来に進めた時刻を第3の位置データの位置取得時刻として用いて、第1の位置データについての特徴量を計算する。このような第2、第3の位置データの位置取得時刻が異常値である場合の処理は、必須の処理ではないが、上記処理を行うことで、携帯端末100が圏外に位置していることや携帯端末100の電源がオフされていること等に起因して位置データの取得時間間隔が異常に長くなった際に、当該異常に長くなった取得時間間隔による影響が過大に出ることを防ぐことができる。
 端末数推計部34は、観測対象位置データについての特徴量および観測開始時刻と観測終了時刻との差である観測期間長に基づいて、観測期間中に観測エリアに在圏した端末数を推計する。詳細は後述するが、端末数推計部34は、観測対象位置データについての特徴量の総和を観測期間長の2倍によって除して得られた数値を端末数として推計する。
 [端末数推計の考え方および計算方法]
 次に、端末数推計の考え方および計算方法を説明する。図4に示すモデルのように、ある観測期間(長さT)の間に、n個の端末a,a,…,aがセクタSを通過し、各端末aの観測期間内のセクタSの滞在時間がt(0<t≦T)であったとする。このとき、セクタSに存在する端末数m(実際にはセクタSに存在する端末数mの観測期間内における平均値)は、以下の式(1)で表わされる。
Figure JPOXMLDOC01-appb-M000001
即ち、各端末aの観測期間内のセクタSの滞在時間tの総和を観測期間の長さTで除した結果を、端末数mとして推計する。ただし、端末aの観測期間内のセクタSの滞在時間tの真の値は観測不能であるが、各端末aは信号(例えば位置登録情報を含む位置登録信号)を発信し、それらの信号は観測可能である。
 端末aが観測期間内にセクタSで発信した信号を、時刻順に
Figure JPOXMLDOC01-appb-M000002
(xは、端末aが観測期間内にセクタSで発信した信号の総数)とすると、端末数の推計とは、観測された信号qij(jは1以上x以下の整数)からmの値を推計することに他ならない。
 さて、図5に基づき端末数推計の計算方法を説明する。端末aから信号qijが送信される密度(即ち、単位時間あたりの信号数)をpとする。このとき、信号が送信される確率がセクタに対して独立であれば、端末aが観測期間内にセクタSで発信した信号の総数xの期待値E(x)は、E(x)=t×pであるため、端末aの観測期間内のセクタSの滞在時間tの期待値E(t)について以下の式(2)が成立する。
E(t)=x/p (2)
ここで、信号qijの送信時刻をuijとしたとき、信号qijの密度pijは、以下の式(3)で与えられる。
ij=2/(ui(j+1)-ui(j-1)) (3)
ここで、信号qijを第1の位置データに係る信号とすると、信号qi(j-1)は第2の位置データに係る信号、信号qi(j+1)は第3の位置データに係る信号に相当する。本実施形態では、第2の位置データに係る信号qi(j-1)の送信時刻ui(j-1)と第3の位置データに係る信号qi(j+1)の送信時刻ui(j+1)の差、即ち、上記式(3)の(ui(j+1)-ui(j-1))を、第1の位置データについての特徴量wijとする(特徴量wij=ui(j+1)-ui(j-1))。そのため、上記式(3)は、以下となる。
ij=2/(ui(j+1)-ui(j-1))=2/wij (4)
 このとき密度pは、
Figure JPOXMLDOC01-appb-M000003
で与えられるため、端末数mの推計値E(m)は以下の式(6)で計算することができる。
Figure JPOXMLDOC01-appb-M000004
 図5の例に示すように、観測期間内であり且つ端末aがセクタSに滞在していた期間内に、端末aは信号qi1、qi2、qi3を送信し、信号qi1の直前に信号qi0を、信号qi3の直後に信号qi4を送信したものとし、信号qi0、qi1、qi2、qi3、qi4の送信時刻をそれぞれui0、ui1、ui2、ui3、ui4とすると、上記の考え方は、端末aの観測期間内のセクタSの滞在時間tを、(ui0とui1の中点)から(ui3とui4の中点)までの期間と推計することに相当する。なお、端末aは、観測期間内ではないものの、セクタSへの滞在中に信号qi4を送信している。だからといって、滞在時間tの終了時刻を観測期間Tの終了時刻と同じとして推計することは行わない。このようにして滞在時間tの推計量の不偏性を維持する。
 [端末数推計処理]
 以下、本発明の端末数推計方法に係る端末数推計処理を説明する。ここでは、携帯端末の位置データに含まれる位置情報には、一例として、当該携帯端末が在圏するセクタのセクタ番号が与えられているものとする。また、ここでは、観測期間情報として、観測開始時刻T1と観測終了時刻T2の組が観測期間取得部13により予め取得され、観測エリア情報として、セクタ番号Sが観測エリア取得部14により予め取得されたものとする。
 図6に示すように、まず、位置データ取得部11が位置データを外部から取得し蓄積部12に保存する(図6のステップS1)。これにより、蓄積部12は、多数のユーザ(携帯端末)についての複数の時刻にわたる位置データを保存することとなる。なお、ステップS1の処理実行後、ステップS2以降の処理は、時間をおいて実行してもよい。即ち、ステップS2以降の処理の事前準備として、ステップS1を実行してもよい。
 次に、第1の在圏数推計部15が、蓄積部12から位置データを読み出し、当該位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第1の在圏数として推計する(図6のステップS2)。具体的な処理内容は、図7を用いて後述する。
 次に、信号除去部16が、蓄積部12から位置データを読み出し、当該位置データから、LA跨りによる位置登録情報を除去し、除去後の位置データを得る(図6のステップS3)。なお、信号除去部16が蓄積部12から位置データを読み出す処理は必須ではなく、信号除去部16は、図6のステップS2で読み出された位置データを第1の在圏数推計部15から渡してもらってもよい。このように信号除去部16が位置データを、第1の在圏数推計部15から渡してもらっても、蓄積部12から読み出しても、論理的にはどちらでも構わない。
 次に、第2の在圏数推計部17が、信号除去部16により得られた除去後の位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第2の在圏数として推計する(図6のステップS4)。具体的な処理内容は、図7を用いて後述する。
 そして、第3の在圏数推計部18が、第1の在圏数推計部15により得られた第1の在圏数と、第2の在圏数推計部17により得られた第2の在圏数、のうち一方又は両方に基づいて、観測期間中に観測エリアに在圏した端末数を第3の在圏数として推計する(図6のステップS5)。例えば、第3の在圏数推計部18は、第1の在圏数と第2の在圏数との予め定められた按分点に相当する端末数を第3の在圏数として推計する。ここでの按分点としては、第1の在圏数と第2の在圏数のちょうど真ん中の点であってもよいし、第1の在圏数と第2の在圏数の間を3等分した場合の第2の在圏数に近い方の点であってもよいし、これら以外の按分点であってもよい。また別の例として、第3の在圏数推計部18は、第1の在圏数が第2の在圏数以上の場合に、上述したような第1の在圏数と第2の在圏数との按分点に相当する端末数を第3の在圏数として推計し、一方、第1の在圏数が第2の在圏数未満の場合に、第2の在圏数を第3の在圏数として推計してもよい。また、第3の在圏数推計部18は、推計の基礎となる在圏数を、第1の在圏数、第2の在圏数、並びに、第1および第2の在圏数、の中で、観測エリアごとに切り替えて、第3の在圏数の推計を行ってもよい。
 最後に、出力部19が、推計により得られた端末数を出力する(図6のステップS5)。ここでの出力には、表示出力、音声出力、印刷出力等さまざまな出力態様が含まれる。
 以上説明したように、位置登録情報を含む複数の位置情報の集合である位置データに基づく第1の在圏数と、LA跨りによる位置登録情報を除去した後の位置データに基づく第2の在圏数、のうち一方又は両方に基づいて、端末数を第3の在圏数として推計することで、第1の在圏数と第2の在圏数の間の数値範囲内(ただし両端の数値も含む)のどこかに相当する端末数を第3の在圏数として推計することができ、図12で例示したように推計在圏数を真の値に近づけることができる。これにより、LA境界付近では在圏数が過大に推計され、LA境界から少し離れた位置では在圏数が過小に推計されるといった問題点を解消し、在圏数をより精度良く推計することができる。
 [第1、第2の在圏数の推計処理の一例]
 以下、図6のステップS2(第1の在圏数の推計処理)および図6のステップS4(第2の在圏数の推計処理)の一例について、図7および図8を用いて説明する。なお、第1、第2の在圏数の推計処理は、以下に述べる処理内容に限定されるものでないことは言うまでもない。
 図7に示すように、まず、図3の観測対象取得部31が、観測期間情報として、観測開始時刻T1と観測終了時刻T2の組を観測期間取得部13から、観測エリア情報として、セクタ番号Sを観測エリア取得部14から、それぞれ取得した後、蓄積部12から、観測開始時刻T1以降であり且つ観測終了時刻T2以前である位置取得時刻情報を含み且つ観測エリア情報であるセクタ番号Sに対応づけられる位置情報を含む(例えば位置情報がセクタ番号Sである)1乃至複数の位置データを、観測対象位置データとして取得する(図7のステップS11)。つまり、観測対象取得部31は、以下の条件に合致する位置データを観測対象位置データとして取得する。
条件1:位置取得時刻が、観測開始時刻T1以降であり且つ観測終了時刻T2以前である。即ち、観測期間内に含まれる。
条件2:位置情報がセクタSである。
 次に、取得された観測対象位置データのそれぞれについて、以下のステップS12、S13の処理が実行される。ステップS12では、前後位置データ取得部32が、観測対象位置データのうち、特徴量を求める対象とする位置データ(第1の位置データ)について、当該第1の位置データと同一の識別情報を含む位置データのうち、位置取得時刻から見て、当該第1の位置データの直前の位置データ(第2の位置データ)の位置取得時刻情報、および当該第1の位置データの直後の位置データ(第3の位置データ)の位置取得時刻情報を取得する。なお、前後位置データ取得部32は、第2、第3の位置データの全体を取得することは必須ではなく、第2、第3の位置データに含まれる位置取得時刻情報を取得すればよい。なお、前後位置データ取得部32は、第2、第3の位置データの位置取得時刻情報を蓄積部12から読み出してもよいし、位置データ取得部11から渡してもらってもよい。論理的にはどちらの方法でも構わない。
 そして、ステップS13では、特徴量計算部33が、第1の位置データについての特徴量を計算する。その処理内容について、図8を用いて説明する。ここでは、第1、第2、第3の位置データの位置取得時刻を、それぞれt1、t2、t3とする。また、第2の位置データの位置取得時刻t2が異常値であると判断するための基準となる所定の基準値(第1、第2の位置データの位置取得時刻の差に関する基準値)を基準値A(例えば1時間)とし、第3の位置データの位置取得時刻t3が異常値であると判断するための基準となる所定の基準値(第1、第3の位置データの位置取得時刻の差に関する基準値)を基準値B(例えば1時間)とする。
 特徴量計算部33は、第1、第2の位置データの位置取得時刻の差(即ち、時刻t1とt2の差)Da、および第1、第3の位置データの位置取得時刻の差(即ち、時刻t1とt3の差)Dbを算出する(図8のステップS31)。そして、特徴量計算部33は、第1、第2の位置データの位置取得時刻の差Daが所定の基準値A(例えば1時間)より大きいか否かを判断し(ステップS32)、もし、差Daが基準値Aより大きければ、第1の位置データの位置取得時刻t1から予め定められた時間(例えば1時間)だけ過去に遡った時刻を、第2の位置データの位置取得時刻t2とする(ステップS33)。次に、特徴量計算部33は、第1、第3の位置データの位置取得時刻の差Dbが所定の基準値B(例えば1時間)より大きいか否かを判断し(ステップS34)、もし、差Dbが基準値Bより大きければ、第1の位置データの位置取得時刻t1から予め定められた時間(例えば1時間)だけ未来に進めた時刻を、第3の位置データの位置取得時刻t3とする(ステップS35)。そして、特徴量計算部33は、第2の位置データの位置取得時刻t2と第3の位置データの位置取得時刻t3との差を、第1の位置データについての特徴量として計算し記憶しておく(ステップS36)。
 以上により、ある1つの観測対象位置データ(第1の位置データ)についての図7のステップS12、S13の処理が完了する。
 以後、上述したステップS12、S13の処理が、観測対象位置データのそれぞれについて実行され、全ての観測対象位置データについて実行が完了すると(ステップS14で肯定判断)、ステップS15へ進む。
 ステップS15では、端末数推計部34が、前述した式(6)に示すように、観測対象位置データについての特徴量wijの総和を算出し、得られた特徴量wijの総和を観測期間長Tの2倍によって除して得られた数値を端末数として推計する。このようにして、第1又は第2の在圏数を推計することができる。
 上述した推計処理の一例によれば、位置データを用いて端末数を推計する際に、前後の位置データの取得時刻情報を用いた補正を実施することにより、受信間隔の変動が与える影響を校正しつつ端末数を精度良く推計することができる。また、特徴量の計算処理の中で、前述した第2、第3の位置データの位置取得時刻が異常値である場合の処理を行うことで、携帯端末100が圏外に位置していることや携帯端末100の電源がオフされていること等に起因して位置データの取得時間間隔が異常に長くなった際に、当該異常に長くなった取得時間間隔による影響が過大に出ることを防ぐことができる。
 なお、式(6)より明らかなように、端末数推計部34は、観測対象位置データについての特徴量wijそれぞれを2で除して、(特徴量wij/2)の総和を求め、求めた総和を観測期間長Tによって除して得られた数値を、端末数として推計してもよい。ただし、本実施形態のように観測対象位置データについての特徴量wijの総和を観測期間長Tの2倍によって除算する計算方法の方が、除算の回数が圧倒的に少なくて済むため、処理負荷を軽減できるという利点がある。
 [第1、第2の在圏数の推計処理の変形例]
 上述した第1、第2の在圏数の推計処理では、特徴量を計算する対象の位置データを観測対象位置データに絞ったが、この変形例として、取得された全ての位置データを対象として特徴量を計算した後、推計で利用する特徴量を絞ってもよい。かかる変形例に係る第1、第2の在圏数推計部15、17の構成例を図9に、推計処理内容を図10に、それぞれ示す。
 即ち、図9に示すように、変形例に係る第1、第2の在圏数推計部15、17は、前述した実施形態(図3)と同様の構成要素を備え、各構成要素の機能はほぼ同様であるため、ここでは、前述した実施形態(図3)との相違点を中心に説明する。
 変形例における観測対象取得部31は、観測すべき観測期間に関する観測開始時刻以降であり且つ観測終了時刻以前である位置取得時刻情報を含み且つ観測すべき観測エリアに関する観測エリア情報に対応づけられる位置情報を含む1乃至複数の位置データを、観測対象位置データとして取得し、その後、観測対象位置データを端末数推計部34へ出力する。
 前後位置データ取得部32は、位置データ取得部11により取得された全ての位置データそれぞれを第1の位置データとして、当該第1の位置データに関する第2の位置データ(直前の位置データ)および第3の位置データ(直後の位置データ)それぞれの位置取得時刻情報を取得する。なお、上記の位置データ取得部11により取得された位置データは、位置データ取得部11により取得されたのち蓄積部12に蓄積されているものであってもよいし、蓄積部12に蓄積されることなく位置データ取得部11から前後位置データ取得部32へ送られたものであってもよい。即ち、前後位置データ取得部32は、第2、第3の位置データの位置取得時刻情報を蓄積部12から読み出してもよいし、位置データ取得部11から渡してもらってもよい。論理的にはどちらの方法でも構わない。
 特徴量計算部33は、位置データ取得部11により取得された全ての位置データそれぞれを第1の位置データとして、当該第1の位置データについての特徴量を計算する。この計算結果は膨大な量となるため、図9に示すように特徴量計算部33は、計算結果の特徴量を保管するための特徴量保管部33Aを備え、特徴量保管部33Aによって計算結果の特徴量を保管することが望ましい。なお、特徴量計算部33が第2、第3の位置データの位置取得時刻の差を第1の位置データについての特徴量として計算する点、および図8に示す第2又は第3の位置データの位置取得時刻が異常値である場合の処理を行う点は、前述した実施形態と同様である。
 端末数推計部34は、予め計算され特徴量保管部33Aに保管された全ての位置データについての特徴量のうち、観測対象取得部31から受信した観測対象位置データについての特徴量を抽出し、当該観測対象位置データについての特徴量および観測開始時刻と観測終了時刻との差(観測期間長)に基づいて、観測期間中に観測エリアに在圏した端末数を推計する。具体的には、前述した実施形態と同様に、端末数推計部34は、観測対象位置データについての特徴量の総和を観測期間長の2倍によって除して得られた数値を端末数として推計する。
 以下、変形例における端末数推計処理を説明する。ここでは、携帯端末の位置データに含まれる位置情報として、当該携帯端末が在圏するセクタのセクタ番号が与えられているものとする。
 図10に示すように、全ての位置データそれぞれについて、以下のステップS21~S23の処理が実行される。ステップS21では、前後位置データ取得部32が、特徴量を求める対象とする1つの位置データ(第1の位置データ)について、当該第1の位置データと同一の識別情報を含む位置データのうち、位置取得時刻から見て、当該第1の位置データの直前の位置データ(第2の位置データ)の位置取得時刻情報、および当該第1の位置データの直後の位置データ(第3の位置データ)の位置取得時刻情報を取得する。なお、前後位置データ取得部32は、第2、第3の位置データの全体を取得することは必須ではなく、第2、第3の位置データに含まれる位置取得時刻情報を取得すればよい。そして、ステップS22では、特徴量計算部33が、前述した実施形態と同様の図8に示す手順で、第1の位置データについての特徴量を計算する。ステップS22の処理は、前述した実施形態の図7のステップS13の処理と同様なので、説明を省略する。その後、ステップS22で得られた特徴量は、特徴量保管部33Aに保管される(ステップS23)。
 以上により、ある1つの観測対象位置データ(第1の位置データ)についてのステップS21~S23の処理が完了する。
 以後、ステップS21~S23の処理が、全ての位置データそれぞれについて実行される。そして、全ての位置データについてステップS21~S23の処理が完了すると(ステップS24で肯定判断)、全ての位置データについての特徴量が計算され特徴量保管部33Aに保管されることとなる。このようにして、端末数推計を実施する前に予め全ての位置データについての特徴量を計算し保管しておくことができる。
 次のステップS25では、観測期間取得部13が、観測開始時刻と観測終了時刻との組を含む観測期間情報を取得するとともに、観測エリア取得部14が、1乃至複数の位置情報と対応づけられる観測エリア情報を取得する。ここでは、観測期間情報として、観測開始時刻T1と観測終了時刻T2の組が取得され、観測エリア情報として、セクタ番号Sが取得されたとする。
 次に、観測対象取得部31が、蓄積部12から、観測開始時刻T1以降であり且つ観測終了時刻T2以前である位置取得時刻情報を含み且つ観測エリア情報であるセクタ番号Sに対応づけられる位置情報を含む(例えば位置情報がセクタ番号Sである)1乃至複数の位置データを、観測対象位置データとして取得する(ステップS26)。つまり、観測対象取得部31は、以下の条件に合致する位置データを観測対象位置データとして取得する。
条件1:位置取得時刻が、観測開始時刻T1以降であり且つ観測終了時刻T2以前である。即ち、観測期間内に含まれる。
条件2:位置情報がセクタSである。
 そして、端末数推計部34が、前述した式(6)に示すように、観測対象位置データについての特徴量wijの総和を観測期間長Tの2倍によって除して得られた数値を、端末数として推計する(ステップS27)。このようにして、第1又は第2の在圏数を推計することができる。
 上述した変形例では、端末数推計を実施する前に予め全ての位置データについての特徴量を計算し保管しておくため、端末数推計装置10は、観測期間情報および観測エリア情報を取得し端末数の推計処理を開始してから、推計結果の端末数を得るまでの時間を短縮することができる。
 なお、図10の処理において、ステップS25~S26の処理を、ステップS24の後に実行することは必須ではなく、ステップS21~S24の処理とステップS25~S26の処理とを同時並行で実行してもよい。
 [端末数推計装置の変形例]
 前述した実施形態の端末数推計装置10は、図11に示すように、観測期間中の観測エリアにおける人口を推計する人口推計部20をさらに備えてもよい。この人口推計部20は、予め定められたエリアにおける在圏数と人口との比率(例えば観測期間中の観測エリアにおける在圏数と人口との比率)と、第3の在圏数推計部18により得られた第3の在圏数と、に基づいて人口を推計する。例えば、上記の比率が(在圏数/人口)であれば、人口推計部20は、第3の在圏数を当該比率により割り算することで、観測期間中の観測エリアの人口を推計することができ、得られた人口を出力部19から出力することができる。
 なお、在圏数と人口との比率としては、例えば「所定範囲の地域における人口」に占める「位置データを得られた特定の通信事業者の契約端末数」の割合である「端末契約率」を用いてもよい。このとき、上記の比率(端末契約率も含む)については、地域ごとの比率、性別ごとの比率、年齢層ごとの比率などを求めて、人口の推計に利用することが望ましい。また、観測期間中の全国の在圏数と人口との比率やある一定数を求めて人口を推計してもよい。また、観測期間ではなく、予め求めた比率を用いてもよい。
 以上のようにして、位置データが得られない端末(例えば、電源オフ状態の端末や圏外に位置する端末等)の数を考慮した上で、観測期間中の観測エリアの人口を推計し出力することができる。
 なお、上述した在圏数と人口との比率として(人口/在圏数)を採用する場合、この比率は「拡大係数」とも呼ばれる。このような拡大係数は、以下のようにして導出してもよい。拡大係数は、一例として、「在圏率と端末の普及率との積(即ち、人口に対する在圏数の比率)」の逆数を用いることができる。ここで「在圏率」とは、契約台数に対する在圏数の比率を意味し、「普及率」とは人口に対する契約台数の比率を意味する。このような拡大係数は、前述した拡大係数算出単位ごとに導出することが望ましいが、必須ではない。また、拡大係数は、例えば以下のように特徴量および観測期間長に基づいて推計された端末数(在圏数)を用いて導出してもよい。第1実施形態で述べた手法により位置データから特徴量を求め、特徴量および観測期間長に基づいて、拡大係数算出単位ごとの端末数を集計することでユーザ数ピラミッドデータを得るともに、統計データ(例えば住民基本台帳など)として予め求められた同じ拡大係数算出単位における人口ピラミッドデータを取得する。そして、ユーザ数ピラミッドデータ及び人口ピラミッドデータにおいて拡大係数算出単位ごとの位置データの取得率(即ち、在圏数/人口)を算出する。ここで得られた「位置データの取得率(即ち、在圏数/人口)」が、前述した「在圏率と端末の普及率との積」に相当する。このようにして得られた「位置データの取得率」の逆数を拡大係数として導出することができる。なお、拡大係数を算出する拡大係数算出単位としては、一例として、住所の都道府県ごと、5才又は10才刻み年齢層ごと、男女ごと、時間帯として1時間ごとなどを採用してもよいし、これらの2つ以上を組み合わせたものを採用してもよい。例えば、拡大係数算出単位を「東京都在住の20才台の男性」とした場合、日本全国における、東京都在住の(即ち、ユーザ属性における住所情報が東京都である)20才台の男性に該当する位置データを抽出して端末数を集計することでユーザ数ピラミッドデータを得るとともに、統計データから東京都在住の20才台の男性に関する人口ピラミッドデータを取得する。なお、上記ユーザ数ピラミッドデータを得る際に、「東京都在住」という条件については、東京都に在圏するユーザの位置データだけを抽出するのではなく、ユーザ属性における住所情報が東京都である位置データを抽出する。そして、ユーザ数ピラミッドデータ及び人口ピラミッドデータから拡大係数算出単位(ここでは東京都在住の20才台の男性)の位置データの取得率(即ち、在圏数/人口)を算出し、得られた「位置データの取得率」の逆数を拡大係数として導出することができる。なお、本願では、拡大係数算出単位と人口推計単位とが等しいものとして説明しているが、これはあくまでも一例であり、これに限られるものではない。
 [第2実施形態]
 第2実施形態では、端末数推計に関する第2の手法および同手法に基づく特徴量の計算処理について説明する。第2実施形態における通信システムおよび端末数推計装置の構成は、第1実施形態と同様であるので、説明を省略する。
 図13には、端末数推計の第2の考え方に関する図を示す。この図13において、qijは端末aにて生成された位置データを示し、このうちqi1、qi2、qi3は観測期間内にセクタSに在圏中に端末aにて生成された位置データを示す。ここで、qi1は、端末aが位置登録エリア(Location Area)境界を跨ったことに起因して生成された位置登録情報(以下「LA跨り位置登録情報」という)を含むと想定し、以下「LA跨り位置登録情報qi1」という。この場合、LA跨り位置登録情報qi1が生成されたタイミングで端末aはセクタSに進入したと判断できるため、LA跨り位置登録情報qi1についての特徴量wi1を、前述した第1実施形態のように直前の位置データqi0の生成時刻と直後の位置データqi2の生成時刻との差分ではなく、LA跨り位置登録情報qi1の生成時刻と直後の位置データqi2の生成時刻との差分とする考え方も成立する。
 かかる考え方に基づけば、端末aが観測期間内にセクタSに在圏していた在圏期間tは、図13にて太線で示す期間となり、第1実施形態の在圏期間(図13にて破線で示す期間)よりも、(LA跨り位置登録情報qi1の生成時刻と直前の位置データqi0の生成時刻との差分/2)だけ短くなる。
 また、図14に示すように、位置データqi4がLA跨り位置登録情報を含むと想定し、以下「LA跨り位置登録情報qi4」という。この場合、LA跨り位置登録情報qi4が生成されたタイミングで端末aはセクタSから退出したと判断できる。そのため、LA跨り位置登録情報qi4の直前の位置データqi3についての特徴量wi3を計算する場合、位置データqi3についての特徴量wi3は、(位置データqi3の生成時刻と直後のLA跨り位置登録情報qi4の生成時刻との差分/2)だけ長くなる。即ち、端末aが観測期間内にセクタSに在圏していた在圏期間tは、図14にて太線で示す期間となり、第1実施形態の在圏期間(図14にて破線で示す期間)よりも、(位置データqi3の生成時刻と直後のLA跨り位置登録情報qi4の生成時刻との差分/2)だけ長くなる。
 以上のような端末数推計の第2の考え方に基づく特徴量の計算処理について、図15を用いて説明する。以下では、特徴量を計算する対象の位置データを「計算対象位置データ」という。
 図15に示すように、特徴量計算部17は、まず、計算対象位置データがLA跨り位置登録情報を含むか否かを、例えば計算対象位置データに含まれる呼種情報により判別する(ステップS41)。ここで、計算対象位置データがLA跨り位置登録情報を含む場合、特徴量計算のための第1の変数s(以下「変数s」という)に計算対象位置データの位置取得時刻をセットし(ステップS42)、計算対象位置データがLA跨り位置登録情報を含まない場合、変数sに計算対象位置データの位置取得時刻と直前の位置データの位置取得時刻との中点時刻をセットする(ステップS43)。
 次に、特徴量計算部17は、直後の位置データがLA跨り位置登録情報を含むか否かを、例えば直後の位置データに含まれる呼種情報により判別する(ステップS44)。ここで、直後の位置データがLA跨り位置登録情報を含む場合、特徴量計算のための第2の変数e(以下「変数e」という)に直後の位置データの位置取得時刻をセットし(ステップS45)、直後の位置データがLA跨り位置登録情報を含まない場合、変数eに計算対象位置データの位置取得時刻と直後の位置データの位置取得時刻との中点時刻をセットする(ステップS46)。なお、上記のステップS41、S44の判別処理を呼種情報に基づいて行うことは必須ではなく、他の情報に基づいて行ってもよい。例えば、位置登録エリアの範囲を示すエリア情報を予め保持し、計算対象位置データ及び直後の位置データの位置情報とエリア情報とを基に、判別処理を行うことも可能である。
 次に、特徴量計算部17は、図16に示す変数s、eの適正化処理を行う(ステップS47)。ここでは、計算対象位置データの位置取得時刻をt1とし、変数sが異常値であると判断するための基準となる所定の基準値を基準値C(例えば0.5時間)とし、変数eが異常値であると判断するための基準となる所定の基準値を基準値D(例えば0.5時間)とする。
 特徴量計算部17は、変数sと時刻t1の差Dc、および、変数eと時刻t1の差Ddを算出する(図16のステップS51)。そして、特徴量計算部17は、変数sと時刻t1の差Dcが所定の基準値C(例えば0.5時間)より大きいか否かを判断し(ステップS52)、もし、差Dcが基準値Cより大きければ、時刻t1から予め定められた時間(例えば0.5時間)だけ過去に遡った時刻を変数sにセットする(ステップS53)。次に、特徴量計算部17は、変数eと時刻t1の差Ddが所定の基準値D(例えば0.5時間)より大きいか否かを判断し(ステップS54)、もし、差Ddが基準値Dより大きければ、時刻t1から予め定められた時間(例えば0.5時間)だけ未来に進めた時刻を変数eにセットする(ステップS55)。このような変数s、eの適正化処理を行うことで、携帯端末100が圏外に位置していることや携帯端末100の電源がオフされていること等に起因して位置データの取得時間間隔が異常に長くなった際に、当該異常に長くなった取得時間間隔による影響が過大に出ることを防ぐことができる。
 次に図15へ戻り、特徴量計算部17は、(変数e-変数s)を2倍した値を、計算対象位置データについての特徴量として計算する(ステップS48)。以上により、計算対象位置データについての特徴量が得られる。
 以上の第2実施形態によれば、計算対象位置データおよびその直後の位置データのうち少なくとも一方がLA跨り位置登録情報であった場合に、当該LA跨り位置登録情報が生成されたタイミングでセクタSへの流入又はセクタSからの流出が発生したという点を考慮した上で、精度の高い特徴量を得ることができる。
 なお、第2実施形態で説明した特徴量の計算手法は、「観測対象位置データに絞って特徴量を計算して端末数を推計するケース」でも、「予め全ての位置データについての特徴量を計算しておき、そのうち観測対象位置データについての特徴量を用いて端末数を推計するケース」でも適用することができる。
 次に、特徴量に関する変形例を述べる。前述した第1、第2実施形態においては、特徴量を求める対象の位置データ(第1の位置データ)の前後の位置データの時間差(即ち、第2の位置データ(直前の位置データ)と第3の位置データ(直後の位置データ)との時間差)を、第1の位置データの特徴量として算出する例を示した。これを式で表すと、特徴量は、以下の式(7)で表すことができる。なお、以下の式(7)は、前述した式(4)を変形しただけであり、式(4)と等価である(即ち、式(4)の考え方を変更したものではない)。
ij=ui(j+1)-ui(j-1) (7)
本変形例は、特徴量計算部17において算出される特徴量の算出方法の別のバリエーションを示すものである。
 本変形例では、特徴量計算部17は、上記の第1の位置データの特徴量を求める場合、第2の位置データ及び第3の位置データについての種別情報(例えば後述する位置データの生成要因(生成タイミング))を考慮する。具体的には、特徴量計算部17は、第3の位置データと第1の位置データとの時間差に対し、第3の位置データの種別情報(ここでは生成要因)に対応する補正係数αを乗算した値を算出するとともに、第1の位置データと第2の位置データとの時間差に対し、第2の位置データの種別情報(ここでは生成要因)に対応する補正係数βを乗算した値を算出する。ただし、上記以外に、特徴量計算部17は、第1の位置データの種別情報に応じて補正係数α又はβを定めても良いし、また、第1および第2の位置データの種別情報に応じて補正係数βを定めても、第1および第3の位置データの種別情報に応じて補正係数αを定めてもよい。そして、特徴量計算部17は、これらの乗算で得られた値を合算した値を第1の位置データの特徴量とする。特徴量計算部17における特徴量の算出処理を式で表すと、以下の式(8)で表される。
ij=α(ui(j+1)-uij)+β(uij-ui(j-1)) (8)
 第2の位置データ及び第3の位置データについての種別情報としては、例えば、位置データが位置登録情報である場合、当該位置登録情報の生成要因に関する情報が挙げられ、この生成要因に関する情報は、生成された位置登録情報に含まれている。位置登録情報の生成要因としては、端末が位置登録エリア(Location Area)境界を跨いだこと、周期的に行われる位置登録に基づき生成されたこと、端末の電源オン等によるアタッチ処理の実行、端末の電源オフ等によるデタッチ処理の実行などが挙げられ、これらの生成要因に対応して、補正係数αおよびβの設定値を予め定めておく。そして、特徴量計算部17は、第3の位置データの生成要因に関する情報に応じて第3の位置データについての補正係数αを設定し、第2の位置データの生成要因に関する情報に応じて第2の位置データについての補正係数βを設定すればよい。なお、補正係数α、βはともに、0以上2以下の値に予め定めておいてもよい。但し、この数値範囲は必須ではない。
 例えば、周期的に行われる位置登録に基づく位置登録情報のように端末の位置と位置登録情報の生成契機とが無関係である位置登録情報の場合は、現在のセクタに滞在していた時間の期待値は、当該位置登録情報の生成の前後で同じと考えられる。一方、位置登録エリア境界を端末が跨いだことで生成された位置登録情報の場合、少なくとも当該位置登録情報が生成される前は、端末は現在のセクタに滞在していなかったと判断できる。そのため、当該位置登録情報が生成される前に端末が現在のセクタに滞在していた時間を0と考え、第1の位置データの種別情報(生成要因)が「位置登録エリア境界跨り」であれば、上記式(8)における補正係数β(即ち、直前の位置データとの時間差に関する補正係数β)を0に設定することができる。これにより、より実態に即した特徴量を算出できる。なお、このように第1の位置データの種別情報(生成要因)が「位置登録エリア境界跨り」である場合に、補正係数βを0として特徴量を算出すると、前述した第2実施形態と同様の効果を得ることができる。
 このように、特徴量計算部17は、対象の位置データ(第1の位置データ)についての特徴量を算出する場合、第1の位置データの前後の位置データである第2及び第3の位置データについての種別情報(一例として位置データの生成要因)に応じて、第2の位置データと第3の位置データとの時間差を補正し、補正した時間差を用いて特徴量を算出する。これにより、位置データの種別情報に基づいて特徴量をより精度よく算出することができる。
 前述した全ての実施形態では、個人識別性を持つ情報を位置データから除去するための非識別化処理を行い、非識別化処理後の位置データを用いてもよい。例えば、図2および図11の構成において、位置データ取得部11と蓄積部12の間に、非識別化処理を行う非識別化手段を加えた構成とし、この非識別化手段が、位置データに含まれる識別情報(例えば電話番号)に対し、一方向性関数による不可逆符号への変換を含む非識別化処理を行ってもよい。ここで一方向性関数を用いるのは、変換後の情報からの復元を防止するためであり、一方向性関数としては、例えば国内外の評価プロジェクトや評価機関により推奨されているハッシュ関数に基づく鍵付ハッシュ関数を用いることができる。また、携帯端末のユーザの属性情報を用いた処理が行われる場合には、非識別化手段は、当該処理の前に、属性情報中の個人を特定可能な番号(例えば電話番号)に対し、一方向性関数による不可逆符号への変換を含む非識別化処理を行ってもよい。さらに、非識別化手段は、属性情報中の氏名情報を削除し、生年月日情報を年齢情報に置き換え、住所情報を、番地情報が削除された町丁目レベルの住所情報に置き換えてもよい。以上のような非識別化手段による非識別化処理により、位置データや属性情報から個人識別性を持つ情報を除去することができるため、位置データや属性情報から個人が識別されてしまうといった不都合を未然に防止することができる。
 1…通信システム、10…端末数推計装置、11…位置データ取得部、12…蓄積部、13…観測期間取得部、14…観測エリア取得部、15…第1の在圏数推計部、16…信号除去部、17…第2の在圏数推計部、18…第3の在圏数推計部、19…出力部、20…人口推計部、31…観測対象取得部、32…前後位置データ取得部、33…特徴量計算部、33A…特徴量保管部、34…端末数推計部、100…携帯端末、200…BTS、300…RNC、400…交換機、500…管理センタ、501…社会センサユニット、502…ペタマイニングユニット、503…モバイルデモグラフィユニット、504…可視化ソリューションユニット、700…各種処理ノード。

Claims (14)

  1.  位置登録情報を含む複数の位置情報の集合である位置データを取得する位置データ取得部と、
     前記位置データ取得部により取得された位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第1の在圏数として推計する第1の在圏数推計部と、
     前記位置データ取得部により取得された位置データから、位置データの種別に応じて位置データを抽出する抽出部と、
     抽出された位置データに基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第2の在圏数として推計する第2の在圏数推計部と、
     前記第1の在圏数推計部により得られた第1の在圏数と、前記第2の在圏数推計部により得られた第2の在圏数、のうち一方又は両方に基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第3の在圏数として推計する第3の在圏数推計部と、
     を備える端末数推計装置。
  2.  位置登録情報を含む複数の位置情報の集合である位置データを取得する位置データ取得部と、
     前記位置データ取得部により取得された位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第1の在圏数として推計する第1の在圏数推計部と、
     前記位置データ取得部により取得された位置データから、端末が位置登録エリア境界を跨いだことに起因して生成された位置登録情報を除去し、除去後の位置データを得る信号除去部と、
     前記信号除去部により得られた除去後の位置データに基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第2の在圏数として推計する第2の在圏数推計部と、
     前記第1の在圏数推計部により得られた第1の在圏数と、前記第2の在圏数推計部により得られた第2の在圏数、のうち一方又は両方に基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第3の在圏数として推計する第3の在圏数推計部と、
     を備える端末数推計装置。
  3.  前記第3の在圏数推計部は、前記第1の在圏数と前記第2の在圏数とに基づいて、端末が位置登録エリア境界を跨いだことに起因して生じた端末数の誤差を推計することを特徴とする請求項1又は2に記載の端末数推計装置。
  4.  前記第3の在圏数推計部は、
     推計の基礎となる在圏数を、第1の在圏数、第2の在圏数、並びに、第1および第2の在圏数、の中で、観測エリアごとに切り替えて、前記第3の在圏数の推計を行う、
     ことを特徴とする請求項1~3の何れか一項に記載の端末数推計装置。
  5.  前記第3の在圏数推計部は、
     第1の在圏数と第2の在圏数との予め定められた按分点に相当する端末数を第3の在圏数として推計する、
     ことを特徴とする請求項1~3の何れか一項に記載の端末数推計装置。
  6.  前記第3の在圏数推計部は、
     第1の在圏数が第2の在圏数以上の場合、第1の在圏数と第2の在圏数との予め定められた按分点に相当する端末数を第3の在圏数として推計し、
     第1の在圏数が第2の在圏数未満の場合、第2の在圏数を第3の在圏数として推計する、
     ことを特徴とする請求項1~3の何れか一項に記載の端末数推計装置。
  7.  前記位置データは、各位置情報に関連付けられた、端末を識別する識別情報および当該位置情報が取得された位置取得時刻情報を含み、
     前記第1の在圏数推計部と前記第2の在圏数推計部の両方又は一方は、
     ある対象の位置データについて、当該対象の位置データと同一の識別情報を含む位置データのうち、当該対象の位置データの直前の位置データの位置取得時刻情報、および当該対象の位置データの直後の位置データの位置取得時刻情報を取得する前後位置データ取得部と、
     前記直前の位置データの位置取得時刻情報、前記対象の位置データの位置取得時刻情報、および前記直後の位置データの位置取得時刻情報のうち2つ以上に基づいて、前記対象の位置データについての特徴量を計算する特徴量計算部と、
     観測すべき観測期間に関する観測開始時刻以降であり且つ観測終了時刻以前である位置取得時刻情報を含み、且つ観測すべき観測エリアに関する観測エリア情報に対応づけられる位置情報を含む1乃至複数の位置データを、観測対象位置データとして取得する観測対象取得部と、
     前記観測対象位置データについての特徴量、および前記観測開始時刻と前記観測終了時刻との差である観測期間長に基づいて、観測期間中に観測エリアに在圏した端末数を推計する端末数推計部と、
     を含む請求項1~6の何れか一項に記載の端末数推計装置。
  8.  前記特徴量計算部は、
     前記対象の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含むか否か、および前記直後の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含むか否かを判別し、
     前記対象の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含むか否かの判別結果と前記直後の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含むか否かの判別結果とに応じて、前記対象の位置データの位置取得時刻情報、前記直前の位置データの位置取得時刻情報および前記直後の位置データの位置取得時刻情報のうち2つ以上を用いて、前記対象の位置データについての特徴量を計算する、
     ことを特徴とする請求項7に記載の端末数推計装置。
  9.  前記特徴量計算部は、
     前記対象の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含む場合、前記対象の位置データの位置取得時刻を第1の変数に設定し、
     前記対象の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含まない場合、前記対象の位置データの位置取得時刻と前記直前の位置データの位置取得時刻との中点時刻を第1の変数に設定し、
     前記直後の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含む場合、前記直後の位置データの位置取得時刻を第2の変数に設定し、
     前記直後の位置データが位置登録エリア境界の跨りに起因して生成された位置登録情報を含まない場合、前記対象の位置データの位置取得時刻と前記直後の位置データの位置取得時刻との中点時刻を第2の変数に設定し、
     設定された第1の変数と第2の変数との差分に基づいて、前記対象の位置データについての特徴量を計算する、
     ことを特徴とする請求項8に記載の端末数推計装置。
  10.  前記特徴量計算部は、
     前記対象の位置データの位置取得時刻と第1の変数との差が所定値より大きい場合、前記対象の位置データの位置取得時刻から予め定められた時間だけ過去に遡った時刻を、第1の変数として用いて、前記対象の位置データについての特徴量を計算し、
     前記対象の位置データの位置取得時刻と第2の変数との差が所定値より大きい場合、前記対象の位置データの位置取得時刻から予め定められた時間だけ未来に進めた時刻を、第2の変数として用いて、前記対象の位置データについての特徴量を計算する、
     ことを特徴とする請求項8又は9に記載の端末数推計装置。
  11.  前記第3の在圏数推計部により得られた第3の在圏数と、予め定められたエリアにおける在圏数と人口との比率と、に基づいて、前記観測期間中の観測エリアにおける人口を推計する人口推計部、
     をさらに備える請求項1~10の何れか一項に記載の端末数推計装置。
  12.  観測開始時刻と観測終了時刻との組を含む観測期間情報を取得する観測期間取得部と、
     1乃至複数の位置情報と対応づけられる観測エリア情報を取得する観測エリア取得部と、
     をさらに備えることを特徴とする請求項1~11の何れか一項に記載の端末数推計装置。
  13.  端末数推計装置により実行される端末数推計方法であって、
     位置登録情報を含む複数の位置情報の集合である位置データを取得する位置データ取得ステップと、
     前記位置データ取得ステップにより取得された位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第1の在圏数として推計する第1の在圏数推計ステップと、
     前記位置データ取得ステップにより取得された位置データから、位置データの種別に応じて位置データを抽出する抽出ステップと、
     抽出された位置データに基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第2の在圏数として推計する第2の在圏数推計ステップと、
     前記第1の在圏数推計ステップにより得られた第1の在圏数と、前記第2の在圏数推計ステップにより得られた第2の在圏数、のうち一方又は両方に基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第3の在圏数として推計する第3の在圏数推計ステップと、
     を備える端末数推計方法。
  14.  端末数推計装置により実行される端末数推計方法であって、
     位置登録情報を含む複数の位置情報の集合である位置データを取得する位置データ取得ステップと、
     前記位置データ取得ステップにより取得された位置データに基づいて、観測期間中に観測エリアに在圏した端末数を第1の在圏数として推計する第1の在圏数推計ステップと、
     前記位置データ取得ステップにより取得された位置データから、端末が位置登録エリア境界を跨いだことに起因して生成された位置登録情報を除去し、除去後の位置データを得る信号除去ステップと、
     前記信号除去ステップにより得られた除去後の位置データに基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第2の在圏数として推計する第2の在圏数推計ステップと、
     前記第1の在圏数推計ステップにより得られた第1の在圏数と、前記第2の在圏数推計ステップにより得られた第2の在圏数、のうち一方又は両方に基づいて、前記観測期間中に前記観測エリアに在圏した端末数を第3の在圏数として推計する第3の在圏数推計ステップと、
     を備える端末数推計方法。
PCT/JP2012/051455 2011-01-31 2012-01-24 端末数推計装置および端末数推計方法 WO2012105377A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
US13/819,009 US20130157689A1 (en) 2011-01-31 2012-01-24 Terminal-count estimation device and terminal-count estimation method
EP12741963.8A EP2672433A1 (en) 2011-01-31 2012-01-24 Terminal-count estimation device and terminal-count estimation method
CN2012800029672A CN103120001A (zh) 2011-01-31 2012-01-24 终端数量估计装置及终端数量估计方法
JP2012555813A JP5543619B2 (ja) 2011-01-31 2012-01-24 端末数推計装置および端末数推計方法
KR1020137002545A KR101441996B1 (ko) 2011-01-31 2012-01-24 단말기수 추계 장치 및 단말기수 추계 방법

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011018860 2011-01-31
JP2011-018860 2011-01-31

Publications (1)

Publication Number Publication Date
WO2012105377A1 true WO2012105377A1 (ja) 2012-08-09

Family

ID=46602596

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/051455 WO2012105377A1 (ja) 2011-01-31 2012-01-24 端末数推計装置および端末数推計方法

Country Status (6)

Country Link
US (1) US20130157689A1 (ja)
EP (1) EP2672433A1 (ja)
JP (1) JP5543619B2 (ja)
KR (1) KR101441996B1 (ja)
CN (1) CN103120001A (ja)
WO (1) WO2012105377A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220007143A1 (en) * 2018-11-06 2022-01-06 Ntt Docomo, Inc. Population distribution aggregation calculation device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536082B (zh) * 2020-04-14 2023-06-09 哈尔滨海能达科技有限公司 一种终端数量查询处理方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002259581A (ja) * 2001-02-27 2002-09-13 Nec Custommax Ltd 情報提供方法及びシステム
JP2003122877A (ja) * 2001-10-09 2003-04-25 Oki Electric Ind Co Ltd 地域内人口算出システム
JP2010221456A (ja) 2009-03-23 2010-10-07 Konica Minolta Business Technologies Inc 画像形成装置
WO2010116900A1 (ja) * 2009-04-06 2010-10-14 株式会社エヌ・ティ・ティ・ドコモ 通信システム、情報分析装置、及び情報分析方法
WO2010116903A1 (ja) 2009-04-06 2010-10-14 株式会社エヌ・ティ・ティ・ドコモ 通信システム、情報分析装置および情報分析方法
WO2010116938A1 (ja) * 2009-04-09 2010-10-14 株式会社エヌ・ティ・ティ・ドコモ 位置情報集計装置及び位置情報集計方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1011276A1 (en) * 1998-12-18 2000-06-21 TELEFONAKTIEBOLAGET LM ERICSSON (publ) Communication system containing information about different time zones in which mobile stations are located

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002259581A (ja) * 2001-02-27 2002-09-13 Nec Custommax Ltd 情報提供方法及びシステム
JP2003122877A (ja) * 2001-10-09 2003-04-25 Oki Electric Ind Co Ltd 地域内人口算出システム
JP2010221456A (ja) 2009-03-23 2010-10-07 Konica Minolta Business Technologies Inc 画像形成装置
WO2010116900A1 (ja) * 2009-04-06 2010-10-14 株式会社エヌ・ティ・ティ・ドコモ 通信システム、情報分析装置、及び情報分析方法
WO2010116903A1 (ja) 2009-04-06 2010-10-14 株式会社エヌ・ティ・ティ・ドコモ 通信システム、情報分析装置および情報分析方法
WO2010116938A1 (ja) * 2009-04-09 2010-10-14 株式会社エヌ・ティ・ティ・ドコモ 位置情報集計装置及び位置情報集計方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220007143A1 (en) * 2018-11-06 2022-01-06 Ntt Docomo, Inc. Population distribution aggregation calculation device

Also Published As

Publication number Publication date
EP2672433A1 (en) 2013-12-11
KR101441996B1 (ko) 2014-09-18
JP5543619B2 (ja) 2014-07-09
JPWO2012105377A1 (ja) 2014-07-03
CN103120001A (zh) 2013-05-22
KR20130024967A (ko) 2013-03-08
US20130157689A1 (en) 2013-06-20

Similar Documents

Publication Publication Date Title
JP5553913B2 (ja) 端末数推計装置及び端末数推計方法
JP5470469B2 (ja) 端末数推計装置および端末数推計方法
KR102097426B1 (ko) 피셀 알고리즘을 이용하여 실시간 유동 인구 데이터의 제공이 가능한 유동인구 정보 분석 방법
JP5442751B2 (ja) 位置情報分析装置及び位置情報分析方法
JP5627702B2 (ja) 位置情報集計装置及び位置情報集計方法
US20130176433A1 (en) Unique-terminal-count estimation device and unique-terminal-count estimation method
CN114173356B (zh) 网络质量的检测方法、装置、设备及存储介质
JP5497899B2 (ja) 情報分析装置および情報分析方法
JP2013153286A (ja) 情報処理装置およびクラスタ生成方法
JP5388243B2 (ja) 管理サーバ、人口情報算出管理サーバ、不在エリア管理方法および人口情報算出方法
JPWO2010116916A1 (ja) 通信システム、情報分析装置および情報分析方法
Duan et al. MobilePulse: Dynamic profiling of land use pattern and OD matrix estimation from 10 million individual cell phone records in Shanghai
JP2012054921A (ja) 移動機分布算出システム及び移動機分布算出方法
JP5543619B2 (ja) 端末数推計装置および端末数推計方法
JP5797120B2 (ja) 情報分析装置および人口分布算出方法
JP5732547B2 (ja) 推計装置及び推計方法
JP2013138417A (ja) 情報分析装置および情報分析方法
JP2012032924A (ja) 情報分析装置および情報分析方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201280002967.2

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12741963

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2012555813

Country of ref document: JP

ENP Entry into the national phase

Ref document number: 20137002545

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2012741963

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 13819009

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE