WO2011132534A1 - 統計情報生成システム及び統計情報生成方法 - Google Patents

統計情報生成システム及び統計情報生成方法 Download PDF

Info

Publication number
WO2011132534A1
WO2011132534A1 PCT/JP2011/058730 JP2011058730W WO2011132534A1 WO 2011132534 A1 WO2011132534 A1 WO 2011132534A1 JP 2011058730 W JP2011058730 W JP 2011058730W WO 2011132534 A1 WO2011132534 A1 WO 2011132534A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
information
statistical
attribute
attribute information
Prior art date
Application number
PCT/JP2011/058730
Other languages
English (en)
French (fr)
Inventor
寺田 雅之
岡島 一郎
勇輝 大薮
Original Assignee
株式会社エヌ・ティ・ティ・ドコモ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社エヌ・ティ・ティ・ドコモ filed Critical 株式会社エヌ・ティ・ティ・ドコモ
Priority to BR112012027137A priority Critical patent/BR112012027137A2/pt
Priority to CN201180019852XA priority patent/CN102859547A/zh
Priority to US13/642,643 priority patent/US8903791B2/en
Priority to JP2012511606A priority patent/JP5406981B2/ja
Priority to KR1020147028590A priority patent/KR20140135244A/ko
Priority to KR1020127029458A priority patent/KR20120139844A/ko
Priority to EP11771870.0A priority patent/EP2562711A4/en
Priority to RU2012149859/08A priority patent/RU2527754C2/ru
Publication of WO2011132534A1 publication Critical patent/WO2011132534A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Definitions

  • the present invention relates to a statistical information generation system and a statistical information generation method.
  • the device described in Patent Document 1 uses a database that stores location information regarding each mobile terminal to tabulate the population distribution corresponding to the target area and target layer.
  • the apparatus of patent document 2 is disclosing producing
  • operation data such as mobile terminal location data and user attribute data, which is data for providing telecommunication services to mobile terminal users, is used.
  • statistical processing such as tabulation to these operational data, it is possible to obtain estimated values related to demographics such as “number distribution”, “number of people moving”, and “number of people composition”.
  • number of people distribution means the number of people distributed in each area
  • number of people moving means the number of people moving between the areas
  • number of people composition means the number of people and the number of people moving according to gender and age group.
  • the tabulation result is not displayed or is represented as zero.
  • a weighted sum multiplied by a different weight is obtained for each attribute of the contractor. The necessity of secrecy cannot be determined by comparing the sizes.
  • the present invention has been made in view of such problems, and a statistical information generation system capable of concealing individual identifiability in statistical data when location data obtained from a mobile phone network is used. It is another object of the present invention to provide a statistical information generation method.
  • the statistical information generation system of the present invention provides first identification information for identifying a mobile communication terminal, position information regarding the position of the mobile communication terminal, and time regarding the time when the position information is acquired.
  • Attribute information storage data including first input means for inputting location information storage data including information, second identification information for identifying a mobile communication terminal, and attribute information relating to a contractor of the mobile communication terminal
  • a second input means for inputting the search information a condition input means for inputting search condition information for the position information storage data and attribute information storage data, and a part of the position information storage data and attribute information storage data based on the search condition information
  • the statistical object Corresponding to
  • the first input means identifies the first identification information for identifying the mobile communication terminal, the position information regarding the position of the mobile communication terminal, and the time when the position information was acquired.
  • a first input step of inputting location information storage data including time information, second identification information by which the second input means identifies the mobile communication terminal, and attributes relating to the contractor of the mobile communication terminal A second input step for inputting attribute information storage data including information, a condition input unit for inputting search condition information for the position information storage data and the attribute information storage data, and an extraction unit for searching Based on the condition information, the extraction step for extracting a part of the position information storage data and the attribute information storage data, and the enlargement coefficient assigning means include the attribute information storage data extracted by the extraction means.
  • an extraction coefficient is extracted by the extraction means, and an expansion coefficient provision step for assigning an expansion coefficient that is a coefficient corresponding to the attribute information included in the attribute information accumulation data and indicates the degree of expansion to the numerical value of the statistical target Position information storage data, attribute information storage data having second identification information corresponding to the first identification information extracted by the extraction means and included in the position information storage data, and attached to the attribute information storage data
  • a determination step for determining the size of the number of data by comparing the number of data aggregated by the aggregation means with a predetermined value; Output the statistical data when it is determined that the number of data is large, and when the determination means determines that the number of data is small, an output step of concealing and outputting the numerical value included in the statistical data; .
  • demographic data is calculated from the position information accumulation data and the attribute information accumulation data, taking into account the degree of expansion to the numerical value of the statistical object, based on the search condition. Is done.
  • the estimated statistical data is not information generated from a “small group”, and the statistical data is concealed according to the determination result.
  • the Judgment whether or not it was generated from a “small group” cannot be made solely from the number of statistics in the statistical data. This is because the statistical number is derived by an expansion estimation based on the contract rate of different mobile terminals for each attribute. Therefore, by using the total number of data, it is possible to accurately determine whether or not the total data is generated from “a small number of groups”.
  • FIG. 1 is a schematic configuration diagram of a statistical information generation system according to a preferred embodiment of the present invention. It is a figure which shows the data structure of the positional infomation storage data input into the 1st input part of FIG. It is a figure which shows the data structure of the attribute information storage data input into the 2nd input part of FIG. It is a flowchart which shows operation
  • FIG. 1 is a schematic configuration diagram of a statistical information generation system 1 according to a preferred embodiment of the present invention.
  • the statistical information generation system 1 shown in FIG. 1 uses a positional information that is data for providing a telecommunication service to mobile communication terminals such as a plurality of mobile terminals 2 in a mobile communication network NW, and estimates the demographics.
  • the statistical information generation system 1 includes a plurality of information processing apparatuses including a non-identified information generation apparatus 11, a totalization apparatus 21, and an information concealment apparatus 31, and passes through the radio base station 3 and the mobile communication network NW.
  • the statistical information generation system 1 may be configured by one information processing apparatus or may be configured by an arbitrary number of information processing apparatuses.
  • the mobile terminal 2 has a function of acquiring its own location information using various positioning calculation methods such as positioning using GPS and positioning using radio waves from the radio base station 3. Further, the position information of the portable terminal 2 obtained as a result of the positioning calculation can be transmitted to the statistical information generation system 1 from the communication device connected to the portable terminal 2 or the mobile communication network NW.
  • the non-identifying information generation apparatus 11 includes a first input unit (first input unit) 12, a second input unit (second input unit) 13, a key management unit (key management unit) 14, and a one-way calculation.
  • the first input unit 12 receives position information from the outside such as the mobile communication network NW and stores it in the position information storage data.
  • the location information accumulation data includes first identification information “090-XXXX-XXX” that is information for identifying the portable terminal 2 such as a line number, and latitude / longitude information or a location registration signal of the portable terminal 2.
  • the first input unit 12 outputs the accumulated position information accumulation data to the non-identified position data generation unit 16.
  • the key management unit 14 holds predetermined electronic key information. It is desirable that the electronic key information is strictly managed so as not to leak outside the key management means.
  • the one-way operation unit 15 receives the first identification information and the second identification information from the non-identified position data generation unit 16 and the non-identification attribute data generation unit 17, respectively, and stores the electronic information held by the key management unit 14. By using the key information and applying a one-way function to the first identification information and the second identification information, the first non-identification information and the second non-identification information are output, respectively.
  • the one-way calculation unit 15 uses a hash function such as SHA (Secure Hash Algorithm) -256 ⁇ ⁇ as a one-way function, and uses the hash value for the connection between the first identification information or the second identification information and the key information.
  • the first non-identifying information or the second non-identifying information is output by arithmetic processing such as outputting.
  • the non-identified position data generation unit 16 deletes the first identification information from the position information accumulation data, and inputs the first identification information created by inputting the first identification information to the one-way calculation unit 15. By adding to the position information accumulation data, non-identified position information accumulation data is generated. Here, it is also preferable that the non-discriminated position data generation unit 16 adds further data processing processing such as adding appropriate noise to the position information and hanging the position. Further, the non-identified position data generation unit 16 delivers the generated non-identified position information accumulation data to the counting device 21.
  • the non-identifying attribute data generation unit 17 deletes the second identification information from the attribute information accumulation data, and inputs the second identification information generated by inputting the second identification information to the one-way calculation unit 15. By adding to attribute information storage data, non-identified attribute information storage data is generated.
  • the non-identifying attribute data generation unit 17 generates abstract attribute information by abstracting the attribute information, and performs processing for replacing the attribute information with the abstract attribute information. Examples of such abstraction processing include processing such as rounding “age” to “age group”, deleting detailed portions of an address, and removing personally identifiable information such as names.
  • the non-identifying attribute data generation unit 17 delivers the generated non-identifying attribute information accumulation data to the counting device 21.
  • the aggregation device 21 of the statistical information generation system 1 includes a storage unit 22, a condition input unit (condition input unit) 23, an extraction unit (extraction unit) 24, an expansion coefficient provision unit (enlargement coefficient provision unit) 25, and a statistics. Part (statistical means) 26 and a totaling part (counting means) 27.
  • the storage unit 22 stores non-identified position information accumulation data and non-identification attribute information accumulation data generated by the non-identification information generation device 11.
  • the extraction unit 24 determines that the unidentified position information accumulation data with respect to the non-identification position information accumulation data when the matching rate for the search condition is obtained as a probability value. You may give the probability information which shows a probability value. For example, when it is probabilistically given whether “location information ⁇ A area”, the probability can be assigned to the extracted set.
  • the expansion coefficient giving unit 25 acquires a numerical expansion coefficient according to a predetermined procedure based on the attribute information included in the non-identified attribute information storage data combined with the non-identified position information storage data, The enlargement factor is assigned to the combined data set.
  • This expansion coefficient is a coefficient indicating the degree of expansion of the statistical target population value.
  • the statistical unit 26 uses the data set obtained by combining the non-identified position information accumulation data and the non-identified attribute information accumulation data extracted by the extraction unit 24 and the expansion coefficient assigned by the expansion coefficient assignment unit 25 to calculate the population. Calculate statistical data on the estimate. Specifically, for each piece of information included in the data set, the statistical unit 26 extracts the age and gender from the attribute information, and calls the expansion coefficient adding unit 25 to obtain a corresponding expansion coefficient. Further, the statistical unit 26 calculates the sum of the expansion coefficients of all data records (data elements) included in the data set as the estimated number of persons. Here, if the probability information indicating the probability value corresponding to the search condition is added to some data records included in the data set, the statistical unit 26 multiplies the probability information by the expansion coefficient. The statistical number of people can be calculated by taking the sum of the values obtained. In addition, the statistical unit 26 outputs the calculated statistical data to the information concealment device 31.
  • the totaling unit 27 totals the number of data in the data records (data elements) of the data set extracted by the extracting unit 24, and outputs the total value to the information concealment device 31 as the total number of persons.
  • the enlargement factor and the probability information are not considered in the calculation of the total number of people.
  • the information concealment device 31 should determine whether or not the statistical data needs to be concealed based on “how many pieces of information are estimated from the group of users of the mobile terminals 2”. This is because a pure number of data elements before the weighting process using probability information is required.
  • the information concealment device 31 of the statistical information generation system 1 includes a determination unit (determination unit) 32 and an output unit (output unit) 33.
  • the determination unit 32 determines the size of the number of data by comparing the number of data aggregated by the aggregation unit 27 with a predetermined value. For example, when “10” is given in advance as a specific reference value, the determination unit 32 determines whether or not the number of people counted by the counting unit 27 is “10” or more. The determination unit 32 determines that the total number of persons is large when the determination result is 10 or more, and determines that the total number of persons is small when the determination result is less than 10. Then, the determination unit 32 passes the determination result to the output unit 33.
  • the output unit 33 determines whether or not to output the statistical data including the estimated number of persons estimated by the counting device 21 based on the determination result of the determination unit 32, and outputs the final statistical data.
  • This statistical data may be output to an output device such as a display device provided directly in the statistical information generation system 1 or to a remote device such as the portable terminal 2 via a communication network such as a mobile communication network NW. It may be output.
  • the output unit 33 outputs the estimated number of persons included in the statistical data as it is.
  • the output unit 33 conceals the estimated number of persons by outputting the estimated number of persons by replacing the estimated number with a predetermined numerical value or sign.
  • the estimated number of people is output as “0”, or “x”, which is a code indicating that the number is concealed, is output with the estimated number of people. Even if it is determined that there are a large number of people, considering the possibility of disclosure of residual values, round the estimated number of people to an approximate value with a certain numerical interval, or add a random number to the estimated value. It is also preferable to output as
  • FIG. 4 is a flowchart showing an operation at the time of statistical information generation by the statistical information generation system 1.
  • the non-identifying information generating device 11 receives the input of the position information and stores it in the position information storage data (step S101).
  • the non-identified position data generation unit 16 of the non-identification information generation apparatus 11 is obtained by deleting the first identification information from the position information accumulation data and inputting it to the one-way calculation unit 15.
  • the first non-identifying information is added to the position information accumulation data to generate non-identification position information accumulation data and store it in the storage unit 22 of the totalization device 21 (step S102).
  • the non-identifying information generating apparatus 11 receives the attribute information and stores it in the attribute information storage data (step S103).
  • the non-identification attribute data generation unit 17 of the non-identification information generation device 11 is obtained by deleting the second identification information from the attribute information accumulation data and inputting it to the one-way calculation unit 15.
  • the non-identifying attribute information storage data is generated and stored in the storage unit 22 of the tabulation device 21 (step S104).
  • the extraction unit 24 extracts from the storage unit 22 a set of non-identified position information accumulation data and non-identification attribute information accumulation data corresponding to the accepted search condition (step S106).
  • the statistical unit 26 extracts a part of the attribute information, for example, age and sex, from the constituent elements of the data set extracted by the extracting unit 24 and gives them to the enlargement coefficient assigning unit 25, thereby providing each constituent element.
  • An enlargement factor for is acquired (step S108).
  • the statistical unit 26 calculates the sum of the enlargement factors and obtains the estimated number of people (step S109).
  • the totaling unit 27 calculates the number of elements of the data set extracted by the extracting unit 24 and acquires it as the total number of persons (step S110).
  • the extraction unit 24 has obtained a data set including four data elements each including the following data items “position, time, age, and sex”.
  • Element 1 (A, t, 23, male)
  • Element 2 (A, t, 33, male)
  • Element 3 (A, t, 31, male)
  • Element 4 (A, t, 85, male)
  • the estimated number of people estimated by the statistical unit 26 is “26.5”, and the total number of people calculated by the totaling unit 27 is “4”.
  • the determination unit 32 of the information concealment device 31 determines whether or not the total number of persons calculated by the totalization unit 27 is equal to or greater than a predetermined value (step S111). Assuming that “10” is given as a specific reference value, in the above example, since the total number of people is “4”, it is determined that the total number of people is small.
  • the output unit 33 determines whether or not to output the estimated number of people as it is based on the determination in the determination unit 32, and outputs the final estimated value. That is, when it is determined that the total number of persons is large (step S111; YES), the output unit 33 outputs the estimated number of persons as an estimated value as it is (step S112). On the other hand, if it is determined that the total number of persons is small (step S111; NO), the estimated number of persons is concealed and output by replacing the estimated number of persons with a predetermined numerical value or sign (step S113). In the above example, since it is determined that the total number of persons is small, the estimated value is output as “0”, for example.
  • the first and second identification information are respectively obtained from the position information accumulation data and the attribute information accumulation data associated with each other by the first and second identification information. Is removed, and first and second non-discriminating information is added.
  • the first and second non-identifying information is obtained by substituting the electronic key information held in advance and the first and second identification information into a one-way function.
  • the identification information cannot be calculated backwards. Also, even if the one-way function is known, as long as the value of the electronic key is kept secret, the correspondence between the identification information and the non-identification information even if the identification information is input to the one-way function brute force I can't know the relationship.
  • demographic data that considers the degree of expansion to the numerical value of the statistical object is calculated from the non-identified position information storage data and the non-identified attribute information storage data to which the non-identification information is added. Is done.
  • the identification information is replaced with non-identification information, it is possible to prevent the execution of statistical processing to disclose the behavior of a specific individual by giving a search condition using the identification information. Can do.
  • the estimated statistical data is not information generated from a “small group”, and the statistical data is concealed according to the determination result.
  • the Judgment whether or not it was generated from a “small group” cannot be made solely from the number of statistics in the statistical data. This is because the statistical number is derived by an expansion estimation based on the contract rate of different mobile terminals for each attribute. Therefore, by using the total number of data, it is possible to accurately determine whether or not the total data is generated from “a small number of groups”.
  • the attribute information included in the attribute information accumulation data is replaced with the abstract attribute information obtained by abstracting the information, and the abstract attribute information and the search condition information are collated to thereby perform non-identification A part of the attribute information storage data is extracted. Therefore, it is possible to obtain an overview of demographics by obtaining statistical data in units of abstracted attribute information. Moreover, by identifying the statistical data, it is possible to make it more difficult to identify an individual based on the statistical data.
  • probability information is given to the non-identified position information accumulation data, and statistical data is calculated by multiplying the probability information by an expansion factor, so that the match rate between the position information and the search condition is obtained as a probability. If it is, statistical data reflecting the probability can be obtained, and statistical data reflecting the entire demographic trend can be obtained. For example, when the position information is obtained as a probability distribution in the area, statistical data reflecting the probability distribution can be obtained.
  • the position information accumulation data and the attribute information accumulation data processed by the statistical information generation system 1 include a line number as the first and second identification information, and the statistical information generation system 1 carries the line number as a mobile phone. It was processed as information for identifying the terminal 2.
  • the statistical information generation system 1 uses, as information for identifying the mobile terminal 2 instead of the line number, a number for identifying the user of the mobile terminal 2 such as IMSI (International Mobile Subscriber Identity) or IMEI (International Mobile A number for identifying the device of the portable terminal 2 such as (Equipment Identity) may be processed.
  • the extraction unit 24 of the totalization device 21 extracts a part of the data set corresponding to the search condition from the non-identified position information accumulation data and the non-identification attribute information accumulation data stored in the storage unit 22. It was. This is because the extraction unit 24 adds the probability information to the combined data set after combining the non-identified position information storage data and the non-identified attribute information storage data by a join operation, and searches among the data sets. You may make it extract the one part data set applicable to conditions. In addition, a data set before the probability information is added may be extracted, or a data set to which the expansion coefficient is added by the expansion coefficient adding unit 25 may be extracted.
  • the statistics unit 26 of the totalization device 21 calculates the sum of the expansion factors of the data records included in the data set extracted by the extraction unit 24, but the sum of the data records included in the data set is calculated for each attribute. May be calculated by multiplying the sum by an expansion coefficient corresponding to the corresponding attribute. For example, first, the total number or sum of probability values of data records that match the attribute “30's male” included in the data set is calculated, and the expansion coefficient “2.0” corresponding to the attribute “30's male” is calculated for the total or total. By multiplying ", the number of statistical persons corresponding to the attribute can be calculated.
  • the output unit 33 of the information concealment device 31 outputs the total number of statistics corresponding to the search condition based on the search condition accepted by the condition input unit 23 of the tabulation device 21.
  • the extraction unit 24 generates data (hereinafter simply referred to as “position data”) generated by the portable terminal 2 by the extraction unit 24 in the following procedure.
  • the feature quantity w ij which is information corresponding to the estimated generation density of the position information, is given, and the number of in-zones may be estimated by aggregating this set of position data by the statistical unit 26.
  • the “estimated generation density” means an estimated value of the number of signals generated per unit time around the generation time of the position information by the terminal that generated the position information.
  • each terminal a i is position information (for example, a position registration signal. The signal is observable.
  • the signals transmitted by the terminal a i from the sector S during the observation period If x i is the total number of signals transmitted by the terminal a i in the sector S during the observation period, the estimation of the number of terminals is based on the observed signal q ij (j is an integer from 1 to x i ). It is none other than estimating the value of m.
  • p i be the density at which the signal q ij is transmitted from the terminal a i (ie, the number of signals per unit time).
  • the probability that the signal is transmitted is independent of the sector
  • the expected value E (t i) the following expression for the residence time t i of the sector S in the observation period of the terminal a i (2) is satisfied.
  • the signal q i (j + 1) related to the position data (second position data) immediately before the first position data is the same identification information as the first position data.
  • the transmission time u i of the signal of the second position data q i (j-1) transmission time u i of (j-1) and the signal q i of the third position data (j + 1) ( The difference of j + 1) , that is, (u i (j + 1) ⁇ u i (j ⁇ 1) ) in the above equation (3) is set as the feature quantity w ij for the first position data. Therefore, the above formula (3) is as follows.
  • the feature amount w ij can be calculated in association with the reciprocal of the density p ij .
  • the extraction unit 24 of the counting device 21 adds the feature value w ij to all the position data to be counted.
  • the estimated value E (m) of the number m of terminals can be calculated by the following equation (6).
  • the terminal a i transmits the signals q i1 , q i2 , and q i3 within the observation period and the period in which the terminal a i stays in the sector S, and the signal q i1 .
  • the signal q i0 is transmitted immediately before the signal q i3
  • the signal q i4 is transmitted immediately after the signal q i3
  • the transmission times of the signals q i0 , q i1 , q i2 , q i3 , q i4 are set to u i0 , u i1 , u, respectively.
  • the above idea is that the stay time t i of the sector S in the observation period of the terminal a i is determined from (the midpoint of u i0 and u i1 ) (from u i3 and u i4 This is equivalent to estimating the period until the midpoint.
  • the statistical unit 26 of the totalization device 21 specifies the feature amount w ij added to all the position data included in the data set, and calculates the sum of the feature amounts w ij as 2 of the observation period length T.
  • the numerical value obtained by dividing by the multiplication is estimated as the number of terminals for each sector S and for each attribute.
  • the statistical unit 26 calculates the estimated number of terminals for each sector S and for each attribute by multiplying the estimated number of terminals by the expansion coefficient.
  • the statistical unit 26 divides each feature quantity w ij for the observation target position data by 2 to obtain the sum of (feature quantity w ij / 2).
  • a numerical value obtained by dividing the sum by the observation period length T may be estimated as the number of terminals.
  • the number of divisions can be overwhelmingly smaller. There is an advantage that the load can be reduced.
  • the statistical unit 26 obtains the sum of the feature values w ij multiplied by the expansion coefficient for each attribute, and divides the obtained sum by twice the observation period length T.
  • the obtained numerical value may be estimated as the number of estimated terminals for each sector S and for each attribute.
  • the statistical unit 26 may calculate the statistical data by converting (area conversion) the estimated number of terminals for each sector S into a population estimation for each other area division such as a mesh.
  • the area conversion method for example, when the estimated number of persons such as the estimated number of terminals is calculated for each sector S, the distribution ratio for a plurality of area sections such as meshes and municipalities is previously managed for each sector. Then, the statistical unit 26 divides the estimated number of people for each mesh into a plurality of area divisions according to the distribution ratio, and adds the estimated number of people divided for each area division for each area division. It can be converted into the estimated number of people.
  • the totaling device 21 uses the following procedure as a target for position data that combines position information and attribute information, and represents the number of unique terminals that have stayed in the observation area in at least part of the observation period. You may estimate "the number of intruders" and “the number of intruders” that is a unique number of people who stayed in the observation area in at least part of the observation period.
  • the position information included in the position data of the mobile terminal is given the sector number of the sector where the mobile terminal is located.
  • the observation period information a set of the observation start time t 0 and the observation end time t 1 is acquired in advance by the condition input unit 23, and the sector number S is acquired in advance by the condition input unit 23 as the observation area information. Shall be.
  • the extraction unit 24 is estimated to have stayed in the observation area in at least a part of the observation period, or the terminal within the observation period or an extended period described later
  • One position data generated inside is extracted.
  • Various methods can be adopted as the extraction method here. In the following, a method using the estimated stay period of each terminal in the observation area will be described as an example.
  • the extraction unit 24 determines the position in the area when the acquisition time is within an extended period to be described later and the position information is arranged in chronological order in the order of the acquisition time. Based on the out-of-area position data adjacent to the data and indicating that the position information is outside the observation area, an estimated stay period during which the terminal stayed in the observation area is calculated for each terminal (step S1 in FIG. 7).
  • the above-mentioned “expansion period” is, as an example here, a period obtained by extending the observation period by a predetermined time width (for example, 1 hour) before and after, that is, a time traced back by a predetermined time from the observation start time t 0.
  • a start point and means a period in which a time advanced from the observation end time t 1 to the future by a predetermined time is the end point.
  • a series of position data related to the same terminal acquired within the extended period is arranged in time series in the order of acquisition time, the position information in the area indicating the observation area is indicated by a black circle, and the position data in the area the at adjacent position information area outside position data indicating the outside observation area open circles, and acquisition time t a of the earliest area position data case, when the series is shown respectively, outermost destination area position data the time t in the corresponding to the proportional division point between the acquisition time t x of the area outside the location data adjacent (midpoint as an example) to the start time of the estimated stay in.
  • the proportional division point between the acquisition time t y of the area outside the location data adjacent to area position data of said last is the end time of the estimated stay period. Accordingly, a period indicated by a rectangle in FIG. 8, that is, a period from time t in to time t out is calculated as the estimated stay period of the terminal.
  • FIG. 9 is a diagram in which a series of position data regarding the terminals A to E acquired within the expansion period are arranged in the horizontal axis direction in time series in order of acquisition time for each terminal.
  • In-area position data whose information indicates the inside of the observation area is indicated by a black circle
  • out-of-area position data whose position information indicates the outside of the observation area is indicated by a white circle. If attention is paid only to in-area position data whose acquisition time is within the observation period (time t 0 to time t 1 ), three terminals C to E are extracted as corresponding terminals.
  • step S2 terminals A to E are included. Are extracted. As a result, it is estimated that the terminals A and B that are excluded when focusing only on the in-area position data indicated by the black circles are staying in the observation area somewhere during the observation period.
  • the method using the estimated stay period in steps S1 and S2 described above is an example, and other methods may be adopted. Other methods will be described later.
  • the statistical unit 26 counts the number of terminals extracted in steps S1 and S2, and estimates the obtained count as the number of incoming terminals in the observation area within the observation period (step S3 in FIG. 7). .
  • the expansion coefficient giving unit 25 derives an expansion coefficient for converting the number of incoming terminals into the incoming number for each extracted terminal based on the corresponding attribute information (step S4 in FIG. 7).
  • the expansion coefficient adding unit 25 extracts the start time of the period in which the estimated stay period and the observation period overlap, and corresponds to the obtained start time It is preferable to derive an expansion coefficient to be used.
  • the statistical unit 26 aggregates the expansion factors for each position data for each terminal derived by the expansion factor assigning unit 25, and the total of the obtained expansion factors is the number of entering the observation area within the observation period. (Step S5 in FIG. 7). And the statistics part 26 outputs the number of insertion obtained by estimation to the information concealment apparatus 31 (step S6 of FIG. 7). At this time, the number of incoming terminals obtained in step S3 may also be output.
  • the expansion coefficient giving unit 25 gives the reciprocal of the contract rate corresponding to the attribute information as the expansion coefficient, but it may give an expansion coefficient reflecting the coverage ratio of the terminal.
  • the expansion coefficient granting unit 25 is a ratio of “the number of contracted terminals of a specific communication carrier from which position data is obtained” in the “population in an area within a predetermined range” as an expansion coefficient reflecting the coverage ratio.
  • the reciprocal of “terminal contract rate” can be used.
  • the “number of contracted terminals of a specific communication carrier from which position data is obtained” can be aggregated from the position data stored in the storage unit 22.
  • Such an expansion coefficient can be calculated for each address category, each age group, each gender, and each time zone.
  • the concealment process by the information concealment device 31 may be executed as follows.
  • the information concealment device 31 When the information concealment device 31 receives an estimated value (estimated population, etc.) from the statistical unit 26, for example, the information concealment device 31 performs the concealment process shown in FIG. That is, the determination unit 32 determines in advance that the number of acquisition source terminals indicating how many pieces of position data for each area (cell) that is the basis of the estimation is acquired from the confidential processing is determined. It is determined whether it is less than the reference value (10 as an example) (step S61 in FIG. 10).
  • the number of acquisition source terminals indicates the number of unique terminals excluding duplication of the same terminal. In order to make the determination here, the number of acquisition source terminals of the position data for each area (cell) is required.
  • the counting unit 27 uses the feature amount associated with the position data by the statistical unit 26. Are counted, the number of identification information in the position data (for example, the hashed telephone number after the non-identification processing by the non-identification position data generation unit 16 described above) is counted, and the obtained hashed
  • the information on the total number of telephone numbers may be passed to the determination unit 32, and the determination unit 32 may use the total number of hashed telephone numbers as the number of acquisition source terminals for each area (cell).
  • the determination unit 32 obtains the position data acquisition terminal for each area division that is aggregated by the aggregation unit 27. Determine the number. For example, when a certain area division Q extends over the sector SA and the sector SB, six units of terminal identification numbers: ID1, ID2, ID3, ID4, ID5, ID6 are included in the sector SA during the observation period to be counted. In the sector SB, location registration signals from five mobile terminals 2 having terminal identification numbers: ID4, ID5, ID6, ID7, and ID8 are observed.
  • the determination by the determination unit 32 is not the sum of the number of acquisition source terminals for each sector SA and SB, but the number of terminals whose position data is the basis of the estimation for the area classification Q. This is performed using the number of acquisition source terminals of the area classification Q indicating whether or not it has been acquired from.
  • the number of unique terminals in sector SA is 6 and the number of unique terminals in sector SB is 5.
  • the number of acquisition source terminals to be determined by determination unit 32 is the number of acquisition source terminals calculated for area classification Q. : 8. If the reference value is 10 units, the number of acquisition source terminals is less than the reference value, and therefore the determination unit 32 sets the estimated value of the area classification Q as a target to be concealed.
  • step S61 if the number of acquisition source terminals of the position data for each area (cell) that is the basis of the estimation is less than the reference value, the output unit 33 sets the estimated value for the area (cell) to zero.
  • the estimated value is concealed (step S62).
  • the concealment method here is not limited to setting the estimated value to zero, and other methods such as a method of representing the estimated value with a predetermined character or symbol (for example, “X”) are adopted. May be.
  • step S63 Such a probabilistic rounding of the class width used in the estimated value output is performed (step S63). That is, assuming that the estimated value for a certain area (cell) is x and the class width is k, the output unit 33 determines that the estimated value x is a probability (if kn ⁇ x ⁇ k (n + 1) (n is an integer)). Round to k (n + 1) with x ⁇ kn) / k and to kn with probability (k (n + 1) ⁇ x) / k.
  • the class width in the probabilistic rounding may be set as a class width by extracting the position data having the maximum expansion coefficient from the position data used for aggregation and multiplying the expansion coefficient by a predetermined value (for example, 10 times). . Further, the class width may be determined in advance, and stochastic rounding may be performed. At this time, a processing rule may be adopted in which data of an area (cell) including position data whose enlargement coefficient exceeds a predetermined ratio (for example, 1/10) of a predetermined class width is discarded.
  • a predetermined value for example, 10 times
  • the concealment process by the information concealment apparatus 31 is not limited to the process shown in FIG. 10, and another process may be adopted.
  • step S61 of FIG. 10 instead of “the number of location data acquisition source terminals for each area (cell) on which the estimation is based”, the “number of position data for each area (cell) on which the estimation is based” "Is less than the reference value, or it may be determined whether the" estimated value to be output (population or number of terminals) "is less than the reference value.
  • the process of step S63 may be omitted.
  • key management means for holding predetermined electronic key information, first identification information and second identification information are input, and first identification information and second identification information are input.
  • a one-way operation means for applying the one-way function using the electronic key information held by the key management means to output the first non-identifying information and the second non-identifying information;
  • the first identification information is deleted from the information accumulation data, and the position information accumulation is performed by adding the first non-identification information output by the one-way calculating means to the position information accumulation data as the first identification information.
  • de-identified attribute data generating means for generating attribute information storing data by adding the second identification information may further include a.
  • the first and second non-identifications are performed after the first and second identification information are removed from the position information accumulation data and the attribute information accumulation data that are associated with each other by the first and second identification information, respectively.
  • Information is given.
  • the first and second non-identifying information is obtained by substituting the electronic key information held in advance and the first and second identification information into a one-way function. The identification information cannot be calculated backwards.
  • the correspondence between the identification information and the non-discriminating information even if the identification information is input to the one-way function brute force I can't know the relationship.
  • the identification information is replaced with non-identification information, it is possible to prevent the execution of statistical processing to disclose the behavior of a specific individual by giving a search condition using the identification information. it can.
  • the non-identifying attribute data generation unit replaces the attribute information included in the attribute information accumulation data with the abstracted attribute information obtained by abstracting the information, and the extracting unit searches the abstracted attribute information and the abstracted attribute information. It is preferable to extract a part of the non-identifying attribute information accumulation data by collating the condition information. In this way, it is possible to obtain an outline of demographics by obtaining statistical data based on the abstracted attribute information, and to make it more difficult to identify individuals based on the statistical data.
  • the extraction means gives probability information indicating a matching rate with the search condition information to the position information accumulation data, and the statistical means multiplies the probability information given to the position information accumulation data by an expansion coefficient. It is also preferable to calculate the statistical data.
  • the extraction means estimates a value corresponding to the estimated generation density related to the position information generated by the mobile communication terminal based on the position information accumulation data, and assigns it as a feature amount, and the statistical means calculates the position information accumulation data It is also preferable to calculate the statistical data by multiplying the staying time information given to by an expansion coefficient. By adopting such a configuration, it is possible to estimate the stay time existing in the sector, obtain statistical data reflecting the stay time, and obtain statistical data reflecting the overall demographic trend.
  • the present invention uses a position information counting device and a position information counting method, and can calculate a highly accurate population distribution with little error even when a positioning method that causes various errors is used. is there.

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

 この統計情報生成システム1は、条件入力部23と、非識別化位置データ及び非識別化属性データを抽出する抽出部24と、非識別化属性データに対して拡大係数を付与する拡大係数付与部25と、非識別化位置データと非識別化属性データと拡大係数とを用いて、統計データを算出する統計部26と、非識別化位置データを集計する集計部27と、集計されたデータ数の大小を判定する判定部32と、統計データを隠蔽して出力する出力部33と、を備える。

Description

統計情報生成システム及び統計情報生成方法
 本発明は、統計情報生成システム及び統計情報生成方法に関するものである。
 従来から、携帯端末の位置情報を取得して、その位置情報をもとに携帯端末のユーザの人口分布を解析する装置が知られている(下記特許文献1,2参照)。このように携帯端末の位置情報を用いることで、国勢調査等により得られた人口統計データに比べて、ユーザの移動傾向も反映した人口分布を得ることができる。
 例えば、特許文献1に記載の装置は、携帯端末のそれぞれに関する位置情報を格納するデータベースを利用して、ターゲット地域およびターゲット層に対応する人口分布を集計している。また、特許文献2に記載の装置は、端末確認信号を受信した端末の応答信号の基地局毎の集計結果を人口密集度情報として生成することを開示している。
 このような従来の人口分布の統計処理においては、携帯端末の利用者に電気通信サービスを提供するためのデータである携帯端末の位置データや利用者の属性データなどの運用データを利用している。これらの運用データに対して集計などの統計処理を施すことにより,「人数分布」「移動人数」「人数構成」などの人口動態に関する推計値を得ることができる。ここで、「人数分布」は各エリアに分布している人数、「移動人数」は各エリア間を移動する人数、「人数構成」は性別や年齢層別に区分した人数分布や移動人数を意味する。
特開2003-30373号公報 特開2005-286657号公報
 しかしながら、上記従来の統計処理においては、集計対象の人口の全てが携帯端末を保持しているわけではないため、単に携帯端末の位置データの総和をとるだけでは正確な人口動態を得ることはできない。正確な人口動態を得るには、携帯端末から得られた位置データに対し、その携帯端末の契約者の属性ごとの契約率の逆数を乗じて重みつきの総和をとることなどにより、集計対象の携帯端末を持っていない人々を含めた人口全体を推計する必要がある。
 従って、従来の統計処理の技術によって人口動態の推計を行おうとすると、以下のような問題が生じる。具体的には、秘匿に関する課題である。統計処理を行うことによって、個々の携帯端末に関する情報は失われ、集団としての統計的な傾向のみが集計結果に示されることになるが、統計処理の過程においてあまりに細かい集計範囲で集計情報を作成してしまうと、統計データに個人の識別性が出てきてしまうのではないかという懸念が生じる。その一方で、あまりに粗い集計範囲で集計情報を作成してしまうと、推計データの有用性を損なうことになる。この課題に対しては、従来の公的統計処理などにおいて、「秘匿処理」と呼ばれる処理が統計結果データに施されることがある。これは、集計表における数値がある一定の値 (秘匿基準と呼ばれる) を下回る場合に、その集計結果を表示しない、もしくは、零として表象する、などの処理を行うものである。しかしながら、上記の通り、携帯電話ネットワークからの位置データを利用した人口推定においては、契約者の属性ごとに異なる重みが乗じられた重みつき総和が求められるので、単純に推計値と秘匿基準との大小を比較することにより、秘匿の要否を判定することはできない。
 そこで、本発明は、かかる課題に鑑みて為されたものであり、携帯電話ネットワークから得られる位置データを利用した場合に、統計データにおける個人の識別性を秘匿することが可能な統計情報生成システム及び統計情報生成方法を提供することを目的とする。
 上記課題を解決するため、本発明の統計情報生成システムは、移動通信端末を識別する第1の識別情報と、該移動通信端末の位置に関する位置情報と、該位置情報が取得された時刻に関する時刻情報と、を含む位置情報蓄積データを入力する第1の入力手段と、移動通信端末を識別する第2の識別情報と、該移動通信端末の契約者に関する属性情報と、を含む属性情報蓄積データを入力する第2の入力手段と、位置情報蓄積データ及び属性情報蓄積データに対する検索条件情報を入力する条件入力手段と、検索条件情報を基に、位置情報蓄積データ及び属性情報蓄積データの一部を抽出する抽出手段と、抽出手段によって抽出された属性情報蓄積データに対して、属性情報蓄積データに含まれる属性情報に対応する係数であって、統計対象の数値への拡大度を示す拡大係数を付与する拡大係数付与手段と、抽出手段によって抽出された位置情報蓄積データと、抽出手段によって抽出され、位置情報蓄積データに含まれる第1の識別情報に対応する第2の識別情報を有する属性情報蓄積データと、該属性情報蓄積データに付与された拡大係数と、を用いて、人口に関する統計データを算出して出力する統計手段と、抽出手段によって抽出された位置情報蓄積データのデータ数を集計する集計手段と、集計手段によって集計されたデータ数を所定値と比較することによってデータ数の大小を判定する判定手段と、判定手段によってデータ数が大きいと判定された場合には、統計データを出力し、判定手段によってデータ数が小さいと判定された場合には、統計データに含まれる数値を隠蔽して出力する出力手段と、を備える。
 或いは、本発明の統計情報生成方法は、第1の入力手段が、移動通信端末を識別する第1の識別情報と、該移動通信端末の位置に関する位置情報と、該位置情報が取得された時刻に関する時刻情報と、を含む位置情報蓄積データを入力する第1の入力ステップと、第2の入力手段が、移動通信端末を識別する第2の識別情報と、該移動通信端末の契約者に関する属性情報と、を含む属性情報蓄積データを入力する第2の入力ステップと、条件入力手段が、位置情報蓄積データ及び属性情報蓄積データに対する検索条件情報を入力する条件入力ステップと、抽出手段が、検索条件情報を基に、位置情報蓄積データ及び属性情報蓄積データの一部を抽出する抽出ステップと、拡大係数付与手段が、抽出手段によって抽出された属性情報蓄積データに対して、属性情報蓄積データに含まれる属性情報に対応する係数であって、統計対象の数値への拡大度を示す拡大係数を付与する拡大係数付与ステップと、統計手段が、抽出手段によって抽出された位置情報蓄積データと、抽出手段によって抽出され、位置情報蓄積データに含まれる第1の識別情報に対応する第2の識別情報を有する属性情報蓄積データと、該属性情報蓄積データに付与された拡大係数と、を用いて、人口に関する統計データを算出して出力する統計ステップと、集計手段が、抽出手段によって抽出された位置情報蓄積データのデータ数を集計する集計ステップと、判定手段が、集計手段によって集計されたデータ数を所定値と比較することによってデータ数の大小を判定する判定ステップと、出力手段が、判定手段によってデータ数が大きいと判定された場合には、統計データを出力し、判定手段によってデータ数が小さいと判定された場合には、統計データに含まれる数値を隠蔽して出力する出力ステップと、を備える。
 このような統計情報生成システム或いは統計情報生成方法によれば、位置情報蓄積データ及び属性情報蓄積データから、検索条件を基に、統計対象の数値への拡大度が考慮された人口統計データが算出される。また、属性に応じた携帯端末の契約率などを考慮した人口の推計値である推計データだけでなく、推計データを生成するのに用いた位置データの真の個数であるデータ数を併せて集計することにより、統計データの秘匿の要否を判断するための材料となる情報が提供される。
 また、上述のようにして集計されたデータ数を基に、推計された統計データが「少数の集団」から生成された情報でないかどうかが判断され、その判断結果に応じて統計データが隠匿される。「少数の集団」から生成されたかどうかの判断は,統計データ中の統計数だけから行うことはできない。これは、統計数は、属性別に異なる携帯端末の契約率に基づく拡大推計によって導かれているためである。そこで、集計された上記データ数を用いることにより、集計データが「少数の集団」から生成されたか否かの判断が正確に行われる。
 その結果、位置情報蓄積データや属性情報蓄積データを基に推計された統計データにおける個人の識別性を秘匿することができる。
 本発明によれば、携帯電話ネットワークから得られる位置データを利用した場合に、統計データにおける個人の識別性を秘匿することができる。
本発明の好適な一実施形態にかかる統計情報生成システムの概略構成図である。 図1の第1の入力部に入力される位置情報蓄積データのデータ構成を示す図である。 図1の第2の入力部に入力される属性情報蓄積データのデータ構成を示す図である。 図1の統計情報生成システムの動作を示すフローチャートである。 本実施形態における端末数推計の考え方を説明するための図である。 本実施形態における端末数推計に係る計算方法を説明するための図である。 本実施形態における入込端末数推計処理を示すフローチャートである。 本実施形態における推定滞在期間の算出方法を説明するための図である。 本実施形態における位置データの抽出方法を説明するための図である。 本実施形態における秘匿処理の一例を示すフローチャートである。
 以下、図面とともに本発明による統計情報生成システム及び統計情報生成方法の好適な実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
 図1は、本発明の好適な一実施形態にかかる統計情報生成システム1の概略構成図である。図1に示す統計情報生成システム1は、移動体通信網NWにおいて複数の携帯端末2等の移動通信端末に電気通信サービスを提供するためのデータである位置情報を利用して、人口動態に関する推計値を含む統計データを生成するコンピュータシステムである。この統計情報生成システム1は、非識別化情報生成装置11、集計装置21、及び情報秘匿装置31を含む複数の情報処理装置によって構成されおり、無線基地局3及び移動体通信網NWを経由して携帯端末2や移動体通信網NWに接続された通信装置との間で相互にデータ通信が可能とされている。なお、統計情報生成システム1は、1台の情報処理装置によって構成されてもいてもよいし、任意の台数の情報処理装置によって構成されていてもよい。
 上記の携帯端末2は、GPSを利用した測位や、無線基地局3からの電波を利用した測位等の様々な測位演算方式を使用した自己の位置情報を取得する機能を有している。また、その測位演算の結果得られた携帯端末2の位置情報は、携帯端末2や移動体通信網NWに接続された通信装置から、統計情報生成システム1に送信可能にされている。
 以下、統計情報生成システム1の構成について詳細に説明する。
 非識別化情報生成装置11は、第1の入力部(第1の入力手段)12、第2の入力部(第2の入力手段)13、鍵管理部(鍵管理手段)14、一方向演算部(一方向演算手段)15、非識別化位置データ生成部(非識別化位置データ生成手段)16、及び、非識別化属性データ生成部(非識別化属性データ生成手段)17から構成される。
 第1の入力部12は、移動体通信網NW等の外部から位置情報の入力を受け、位置情報蓄積データに蓄積する。位置情報蓄積データは、図2に示す通り,回線番号など携帯端末2を識別する情報である第1の識別情報“090-XXXX-XXXX”と、緯度・経度情報若しくは携帯端末2の位置登録信号を受信した無線基地局3の識別情報などの当該携帯端末2の位置に関する情報である位置情報“X1,Y1”と、位置情報を取得した時刻“2010/5/30 12:24”を含んでいる。また、第1の入力部12は、蓄積した位置情報蓄積データを非識別化位置データ生成部16に出力する。
 第2の入力部13は、移動体通信網NW等の外部から携帯端末2の属性を示す属性データの入力を受け、属性情報蓄積データに蓄積する。属性情報蓄積データは、図3に示す通り、回線番号などの携帯端末2を識別する情報である第2の識別情報“090-XXXX-XXXX”と、第2の識別情報により識別される携帯端末2の契約者、すなわち、第2の識別情報が回線番号である場合は当該回線の契約者に関する属性を示す属性情報などを含む。このような属性情報としては、住所“東京都新宿区”、性別“男”や、年齢“30代”等の情報が典型例として挙げられる。なお、同一の携帯端末2については,第1の識別情報と第2の識別情報は同じデータ値が与えられている。また、第2の入力部13は、蓄積した属性情報蓄積データを非識別化属性データ生成部17に出力する。
 図1に戻って、鍵管理部14は,あらかじめ定められた電子鍵情報を保持する。この電子鍵情報は,鍵管理手段の外部に漏洩しないよう厳重に管理されていることが望ましい。
 一方向演算部15は、非識別化位置データ生成部16及び非識別化属性データ生成部17から第1の識別情報及び第2の識別情報がそれぞれ入力されて、鍵管理部14が保持する電子鍵情報を用い、第1の識別情報及び第2の識別情報に対して一方向関数を適用することによって、第1の非識別化情報及び第2の非識別化情報をそれぞれ出力する。たとえば、一方向演算部15は、一方向性関数として SHA (Secure Hash Algorithm)-256 などのハッシュ関数を用い、第1の識別情報もしくは第2の識別情報と鍵情報との連接に対するハッシュ値を出力するなどの演算処理により、第1の非識別化情報もしくは第2の非識別化情報を出力する。
 非識別化位置データ生成部16は、位置情報蓄積データから第1の識別情報を削除し、第1の識別情報を一方向演算部15に入力することにより作成した第1の非識別化情報を、位置情報蓄積データに付加することにより、非識別化位置情報蓄積データを生成する。ここで、非識別化位置データ生成部16は、位置情報に対しても適切なノイズを加えて位置をぶらすなど、さらなるデータ加工処理を加えることも好適である。また、非識別化位置データ生成部16は、生成した非識別化位置情報蓄積データを、集計装置21に引き渡す。
 非識別化属性データ生成部17は,属性情報蓄積データから第2の識別情報を削除し、第2の識別情報を一方向演算部15に入力することにより作成した第2の非識別化情報を、属性情報蓄積データに付加することにより、非識別化属性情報蓄積データを生成する。ここで、非識別化属性データ生成部17は、属性情報を抽象化することによって抽象化属性情報を生成し、属性情報を抽象化属性情報に置換する処理を行うことも好適である。このような抽象化処理の例としては、「年齢」を「年齢層」に丸めたり、住所の詳細部分を削除したり、氏名などの個人識別性を持つ情報を取り除くなどの処理が挙げられる。また、非識別化属性データ生成部17は、生成した非識別化属性情報蓄積データを、集計装置21に引き渡す。
 統計情報生成システム1の集計装置21は、格納部22と、条件入力部(条件入力手段)23と、抽出部(抽出手段)24と,拡大係数付与部(拡大係数付与手段)25と、統計部(統計手段)26と、集計部(集計手段)27とから構成される。
 格納部22は,非識別化情報生成装置11が生成する非識別化位置情報蓄積データと非識別化属性情報蓄積データとを格納する。
 条件入力部23は、統計処理の要求者から、非識別化位置情報蓄積データと非識別化属性情報蓄積データに対する検索条件の入力を受け付ける。このような検索条件の入力は、統計情報生成システム1に直接入力されても良いし、移動体通信網NW等の通信ネットワーク経由で受信されてもよい。たとえば、要求者が「時刻tにA地域にいた男性の人数」を推計したい場合は、検索条件として、「時刻=t,位置情報∈A地域,性別=男性」に相当する情報の入力が受け付けられる。また、条件入力部23は、受け付けた検索条件を抽出部24に引き渡す。
 抽出部24は、条件入力部23から引き渡された検索条件に該当する一部のデータ集合を、格納部22に格納された非識別化位置情報蓄積データ及び非識別化属性情報蓄積データの中から抽出する。たとえば,上述した検索条件が与えられた場合には、抽出部24は、「時刻=t,位置情報∈A地域」に該当する非識別化位置情報蓄積データの集合と、「性別=男性」に該当する非識別化属性情報蓄積データの集合を抽出する。そして、抽出部24は、抽出したそれぞれのデータ集合を対象にして、第1の非識別化情報および第2の非識別化情報をキー情報として、関係代数における結合(join)演算を実行する。これにより、「時刻=t,位置情報∈A地域,性別=男性」に該当する位置情報と属性情報とが結合されたデータ集合を得ることができる。
 ここで、抽出部24は、検索条件と非識別化位置情報蓄積データとを照合した結果、検索条件に対する一致率が確率値として得られる場合には、非識別化位置情報蓄積データに対してその確率値を示す確率情報を付与しても良い。例えば、「位置情報∈A地域」であるかどうかが確率的に与えられる場合、その確率を抽出された集合に付与することができる。また、抽出部24は、非識別化属性情報蓄積データに含まれる属性情報が抽象化属性情報に置換されていた場合には、抽象化位置情報と検索条件とを照合することにより、非識別化属性情報蓄積データを抽出する。例えば、抽象化属性情報が「年齢:50代」と設定されていた場合には、検索条件「年齢=20代以上50代以下」に適合していると判断されることになる。
 拡大係数付与部25は、非識別化位置情報蓄積データと結合された非識別化属性情報蓄積データの含む属性情報を基にして、あらかじめ定められた手順に従って、数値である拡大係数を取得し、その拡大係数を結合されたデータ集合に付与する。この拡大係数は、統計対象の人口数値への拡大度を示す係数である。たとえば、拡大係数付与部25は、「30代男性」「20代女性」などの年齢層及び性別の組み合わせごとの携帯電話の契約率を予め保持しておき、ある年齢及び性別の組み合わせを属性情報として含むデータ集合に対しては、対応する契約率の逆数を付与して出力する。さらに具体的には、「30代男性」の契約率が50% (=0.5)として保持されていた場合は、属性情報「35歳,男性」に対しては、“0.5” の逆数である拡大係数“2.0”を出力する。
 統計部26は、抽出部24により抽出された非識別化位置情報蓄積データ及び非識別化属性情報蓄積データを結合したデータ集合と、拡大係数付与部25によって付与された拡大係数を用いて、人口推計数に関する統計データを算出する。具体的には、統計部26は、データ集合に含まれるそれぞれの情報について、その属性情報から年齢と性別を抽出して、拡大係数付与部25を呼び出して対応する拡大係数を得る。さらに、統計部26は、データ集合に含まれる全データレコード(データ要素)の拡大係数の総和を、推計人数として算出する。ここで、統計部26は、データ集合に含まれる一部のデータレコードについて、検索条件に該当する確率値を示す確率情報が付加されていた場合には、その確率情報に対して拡大係数を乗じた値の総和を取ることによって統計人数を算出することができる。また、統計部26は、算出した統計データを情報秘匿装置31に出力する。
 集計部27は、抽出部24により抽出されたデータ集合のデータレコード(データ要素)のデータ数を集計し、その集計値を集計人数として情報秘匿装置31に出力する。ここでは、集計人数の計算には拡大係数や確率情報は考慮しない。その理由は、情報秘匿装置31は「何人の携帯端末2のユーザの集団から推計された情報であるか」に基づいて、統計データの秘匿の要否を判定すべきであるため、拡大係数や確率情報による重みづけ処理を施す前の純粋なデータ要素数を必要とするためである。
 統計情報生成システム1の情報秘匿装置31は、判定部(判定手段)32と、出力部(出力手段)33とから構成される。
 判定部32は、集計部27によって集計されたデータ数を所定値と比較することによって、データ数の大小を判定する。たとえば、判定部32は、具体的な基準値として「10」が予め与えられていた場合、集計部27によって集計された人数が「10」以上であるか否かを判定する。判定部32は、判定の結果が10以上であった場合、集計人数が多いと判断し、10未満であった場合、集計人数が少ないと判断する。そして、判定部32は、判定結果を出力部33に引き渡す。
 出力部33は、判定部32の判定結果に基づいて、集計装置21によって推計された推計人数を含む統計データを、そのまま出力するか否かを決定し、最終的な統計データを出力する。この統計データは、統計情報生成システム1に直接設けられたディスプレイ装置等の出力装置に出力されてもよいし、移動体通信網NW等の通信ネットワークを介して、携帯端末2等の遠隔装置に出力されてもよい。具体的には、出力部33は、集計人数が多いと判断された場合は、統計データに含まれる推計人数をそのまま出力する。一方で、出力部33は、集計人数が少ないと判断された場合は、推計人数をあらかじめ定められた数値もしくは符号に置き換えて出力することによって推計人数を隠蔽する。たとえば、推計人数を「0」として出力したり、隠蔽されたことを示す符号である「x」を推計人数に置換して出力したりする。なお、集計人数が多いと判断された場合でも、残差値の開示などの可能性を考慮して、推計人数をある数値間隔を有する概算値に丸めたり、乱数を加えた値等を推計値として出力することも好適である。
 以下、図4を参照して、統計情報生成システム1の動作について説明するとともに、併せて統計情報生成システム1における統計情報生成方法について詳述する。図4は、統計情報生成システム1による統計情報生成時の動作を示すフローチャートである。
 まず、非識別化情報生成装置11が、位置情報の入力を受け、位置情報蓄積データに蓄積する(ステップS101)。次に、非識別化情報生成装置11の非識別化位置データ生成部16は、位置情報蓄積データから第1の識別情報を削除するとともに、それを一方向演算部15に入力することにより得られた第1の非識別化情報を、位置情報蓄積データに付加することにより、非識別化位置情報蓄積データを生成し、集計装置21の格納部22に格納する(ステップS102)。 その後、非識別化情報生成装置11が、属性情報の入力を受け、属性情報蓄積データに蓄積する(ステップS103)。次に、非識別化情報生成装置11の非識別化属性データ生成部17は、属性情報蓄積データから第2の識別情報を削除するとともに、それを一方向演算部15に入力することにより得られた第2の非識別化情報を、属性情報蓄積データに付加することにより、非識別化属性情報蓄積データを生成し、集計装置21の格納部22に格納する(ステップS104)。
 さらに、集計装置21の条件入力部23は、統計処理の条件を定める検索条件の入力を受けつける(ステップS105)。たとえば、条件入力部23は、「時刻tにA地域にいた男性の人数」を推計するための検索条件として、「時刻=t,位置情報∈A地域,性別=男性」に相当する情報の入力を受け付ける。これに応じて、抽出部24は、受け付けられた検索条件に該当する非識別化位置情報蓄積データと非識別化属性情報蓄積データの集合を、格納部22から抽出する(ステップS106)。具体的には、抽出部24は、「時刻=t,位置情報∈A地域」に該当する非識別化位置情報蓄積データの集合と、「性別=男性」に該当する非識別化属性情報蓄積データの集合を、それぞれ格納部22から抽出する。さらに、抽出部24は、抽出したそれぞれの集合を対象にして、第1の非識別化情報および第2の非識別化情報をキーとして、結合演算を実行する(ステップS107)。その結果、抽出部24は、検索条件に該当するデータ集合を得る。
 次に、統計部26は、抽出部24により抽出されたデータ集合の構成要素から属性情報の一部、たとえば年齢と性別を抽出して、拡大係数付与部25に与えることによって、それぞれの構成要素に対する拡大係数を取得する(ステップS108)。その後、統計部26は、拡大係数の総和を計算し、推計人数として得る(ステップS109)。さらに、集計部27は、抽出部24により抽出されたデータ集合の要素数を計算し、集計人数として取得する(ステップS110)。
 例えば、抽出部24によって、以下のようなデータ項目「位置,時刻,年齢,性別」をそれぞれ含む4つのデータ要素から構成されるデータ集合が得られたと想定する。
要素1: (A, t, 23, 男性)
要素2: (A, t, 33, 男性)
要素3: (A, t, 31, 男性)
要素4: (A, t, 85, 男性)
 ここで、拡大係数付与部25が、年齢層と性別の組に対する契約率として,以下の情報を保持していたとする。
(20 代,男性): 40% (=0.4)
(30 代,男性): 50% (=0.5)
(80 代,男性):  5% (=0.05)
 この場合、拡大係数は契約率の逆数であるとすると、それぞれの要素に対して、以下のような拡大係数が付与される。
要素1: (A, t, 23, 男性): 2.5
要素2: (A, t, 33, 男性): 2.0
要素3: (A, t, 31, 男性): 2.0
要素4: (A, t, 85, 男性): 20.0
 さらに、上記の例では,統計部26によって推計される推計人数は“26.5”となり、集計部27によって算出される集計人数は“4” となる。
 再び図4を参照して、その後、情報秘匿装置31の判定部32は、集計部27によって算出された集計人数が、所定値以上であるか否かを判定する(ステップS111)。具体的な基準値として「10」が与えられていたとすると、上記の例では、集計人数は“4”であるため、集計人数が少ないと判定される。
 最後に、出力部33は、判定部32における判定に基づいて、推計人数をそのまま出力するか否かを決定し,最終的な推計値を出力する。すなわち、集計人数が多いと判定された場合には(ステップS111;YES)、出力部33は、推計人数を推計値としてそのまま出力する(ステップS112)。一方、集計人数が少ないと判定された場合には(ステップS111;NO)、推計人数をあらかじめ定められた特定の数値もしくは符号に置き換えることにより、推計人数を隠蔽して出力する(ステップS113)。上記の例では、集計人数が少ないと判定されているため、推計値はたとえば「0」として出力されることになる。
 以上説明した統計情報生成システム1及び統計情報生成方法によれば、第1及び第2の識別情報により互いに対応づけられる位置情報蓄積データと属性情報蓄積データから、それぞれ第1及び第2の識別情報が取り除かれた上で第1及び第2の非識別化情報が付与される。この第1及び第2の非識別化情報は,予め保持された電子鍵情報と第1及び第2の識別情報を一方向性関数に代入することにより得られたものであり、非識別化情報から識別情報を逆算することはできない。また、一方向性関数が既知であったとしても、電子鍵の値が秘密にされている限り、識別情報を総当たりで一方向性関数に入力したとしても識別情報と非識別化情報の対応関係を知ることはできない。
 さらに、非識別化情報を付加された非識別化位置情報蓄積データ及び非識別化属性情報蓄積データから、検索条件を基に、統計対象の数値への拡大度が考慮された人口統計データが算出される。ここでは、識別情報は非識別化情報に置き換えられていることから、識別情報を用いた検索条件を与えることにより、特定個人の行動を開示させるような統計処理を実施することを未然に防ぐことができる。また、属性に応じた携帯端末の契約率などを考慮した人口の推計値である推計データだけでなく、推計データを生成するのに用いた位置データの真の個数であるデータ数を併せて集計することにより、統計データの秘匿の要否を判断するための材料となる情報が提供される。
 また、上述のようにして集計されたデータ数を基に、推計された統計データが「少数の集団」から生成された情報でないかどうかが判断され、その判断結果に応じて統計データが隠匿される。「少数の集団」から生成されたかどうかの判断は,統計データ中の統計数だけから行うことはできない。これは、統計数は、属性別に異なる携帯端末の契約率に基づく拡大推計によって導かれているためである。そこで、集計された上記データ数を用いることにより、集計データが「少数の集団」から生成されたか否かの判断が正確に行われる。
 その結果、位置情報蓄積データや属性情報蓄積データに含まれる識別情報からの個人の識別を防止でき、かつ、推計された統計データにおける個人の識別性を秘匿することができる。
 上記統計情報生成システム1においては、属性情報蓄積データに含まれる属性情報が、情報を抽象化した抽象化属性情報に置換され、当該抽象化属性情報と検索条件情報を照合することにより、非識別化属性情報蓄積データの一部が抽出される。従って、抽象化された属性情報を単位にした統計データを得ることによって人口動態の概略を知ることができる。また、統計データを概略化することで統計データを基にした個人の識別をより困難にすることができる。
 また、非識別化位置情報蓄積データに対して確率情報が付与され、確率情報に対して拡大係数を乗じることによって統計データが算出されるので、位置情報と検索条件との一致率が確率として得られる場合に、その確率が反映された統計データを得ることができ、全体の人口動態傾向が反映された統計データを得ることができる。例えば、位置情報がエリアにおける確率分布として得られる場合には、その確率分布を反映した統計データを得ることができる。
 なお、本発明は、前述した実施形態に限定されるものではない。例えば、統計情報生成システム1で処理される位置情報蓄積データおよび属性情報蓄積データには、第1及び第2の識別情報として回線番号が含まれ、統計情報生成システム1は、その回線番号を携帯端末2を識別する情報として処理していた。これに対して、統計情報生成システム1は、回線番号に代えて携帯端末2を識別する情報として、IMSI(International Mobile Subscriber Identity)等の携帯端末2のユーザを識別する番号や、IMEI(International Mobile Equipment Identity)等の携帯端末2のデバイスを識別する番号等を処理してもよい。
 また、集計装置21の抽出部24は、検索条件に該当する一部のデータ集合を、格納部22に格納された非識別化位置情報蓄積データ及び非識別化属性情報蓄積データの中から抽出していた。これは、抽出部24が、非識別化位置情報蓄積データ及び非識別化属性情報蓄積データを結合演算によって結合した後に、結合されたデータ集合に確率情報を付加し、そのデータ集合のうちで検索条件に該当する一部のデータ集合を抽出するようにしてもよい。また、確率情報が付与される前のデータ集合を抽出してもよいし、拡大係数付与部25によって拡大係数が付与されたデータ集合を抽出してもよい。
 また、集計装置21の統計部26は、抽出部24によって抽出されたデータ集合に含まれる各データレコードの拡大係数の総和を算出していたが、データ集合に含まれるデータレコードの総和を属性毎に算出し、その総和に対して該当する属性に対応する拡大係数を乗じてもよい。例えば、データ集合に含まれる属性「30代男性」に適合するデータレコードの総数または確率値の総和をまず算出し、その総数または総和に対して属性「30代男性」に対応する拡大係数“2.0”を乗ずることで、その属性に対応した統計人数を算出できる。
 また、上述した実施形態では、情報秘匿装置31の出力部33は、集計装置21の条件入力部23によって入力が受け付けられた検索条件を基に、検索条件に対応する全体の統計人数を出力しているが、この統計人数は属性別に区分して出力してもよい。例えば、検索条件が「時刻=t,位置情報∈A地域,年齢=30代」と受け付けられた際に、出力部33は、性別ごとの統計人数を出力してもよいし、年齢ごとの統計人数を出力してもよいし、年齢及び性別ごとの統計人数を出力してもよい。
 また、集計装置21では、以下のような手順で、抽出部24によって、位置情報と属性情報とを結合したデータ(以下、単に「位置データ」という。)に対して、携帯端末2によって生成された位置情報についての推定生成密度に対応する情報である特徴量wijを付与し、この位置データの集合を統計部26によって集計することによって在圏数推計を行ってもよい。ここでいう「推定生成密度」とは、当該位置情報を生成した端末が,当該位置情報の生成時刻周辺で単位時間あたりに生成する信号数の推定値を意味する。
 まず、端末数推計の考え方および計算方法を説明する。図5に示すモデルのように、ある観測期間(長さT)の間に、n個の端末a,a,…,aが無線基地局3のセクタSを通過し、各端末aの観測期間内のセクタSの滞在時間がt(0<t≦T)であったとする。このとき、セクタSに存在する端末数m(実際にはセクタSに存在する端末数mの観測期間内における平均値)は、以下の式(1)で表わされる。
Figure JPOXMLDOC01-appb-M000001
 
即ち、各端末aの観測期間内のセクタSの滞在時間tの総和を観測期間の長さTで除した結果を、端末数mとして推計する。ただし、端末aの観測期間内のセクタSの滞在時間tの真の値は観測不能であるが、各端末aは位置情報(例えば位置登録信号であり、以下では単に「信号」と言う。)を発信し、それらの信号は観測可能である。
 端末aが観測期間内にセクタSで発信した信号を、時刻順に
Figure JPOXMLDOC01-appb-M000002
 
(xは、端末aが観測期間内にセクタSで発信した信号の総数)とすると、端末数の推計とは、観測された信号qij(jは1以上x以下の整数)からmの値を推計することに他ならない。
 さて、図6に基づき端末数推計の計算方法を説明する。端末aから信号qijが送信される密度(即ち、単位時間あたりの信号数)をpとする。このとき、信号が送信される確率がセクタに対して独立であれば、端末aが観測期間内にセクタSで発信した信号の総数xの期待値E(x)は、E(x)=t×pであるため、端末aの観測期間内のセクタSの滞在時間tの期待値E(t)について以下の式(2)が成立する。
E(t)=x/p (2)
ここで、信号qijの送信時刻をuijとしたとき、信号qijの密度pijは、以下の式(3)で与えられる。
ij=2/(ui(j+1)-ui(j-1)) (3)
ここで、信号qijを、特徴量wijを求める対象の位置データ(第1の位置データ)に係る信号とすると、信号qi(j-1)は、当該第1の位置データと同一の識別情報を含む位置データのうち、当該第1の位置データの直前の位置データ(第2の位置データ)に係る信号、信号qi(j+1)は、当該第1の位置データと同一の識別情報を含む位置データのうち、当該第1の位置データの直後の位置データ(第3の位置データ)に係る信号に相当する。本実施形態では、第2の位置データに係る信号qi(j-1)の送信時刻ui(j-1)と第3の位置データに係る信号qi(j+1)の送信時刻ui(j+1)の差、即ち、上記式(3)の(ui(j+1)-ui(j-1))を、第1の位置データについての特徴量wijとする。そのため、上記式(3)は、以下となる。即ち、特徴量wijは、密度pijの逆数に対応付けて算出することができる。
ij=2/(ui(j+1)-ui(j-1))=2/wij (4)
集計装置21の抽出部24は、集計対象の全ての位置データに対して特徴量wijを付加する。
 このとき密度pは、
Figure JPOXMLDOC01-appb-M000003
 
で与えられるため、端末数mの推計値E(m)は以下の式(6)で計算することができる。
Figure JPOXMLDOC01-appb-M000004
 
 図6の例に示すように、観測期間内であり且つ端末aがセクタSに滞在していた期間内に、端末aは信号qi1、qi2、qi3を送信し、信号qi1の直前に信号qi0を、信号qi3の直後に信号qi4を送信したものとし、信号qi0、qi1、qi2、qi3、qi4の送信時刻をそれぞれui0、ui1、ui2、ui3、ui4とすると、上記の考え方は、端末aの観測期間内のセクタSの滞在時間tを、(ui0とui1の中点)から(ui3とui4の中点)までの期間と推計することに相当する。
 上記の考え方に従い、集計装置21の統計部26は、データ集合に含まれる全ての位置データに付加された特徴量wijを特定し、それらの特徴量wijの総和を観測期間長Tの2倍によって除して得られた数値を、セクタS毎、属性毎の端末数として推計する。そして、統計部26は、推計された端末数に拡大係数を乗ずることによってセクタS毎、属性毎の推計端末数を算出する。なお、式(6)より明らかなように、統計部26は、観測対象位置データについての特徴量wijそれぞれを2で除して、(特徴量wij/2)の総和を求め、求めた総和を観測期間長Tによって除して得られた数値を、端末数として推計してもよい。ただし、本実施形態のように観測対象位置データについての特徴量wijの総和を観測期間長Tの2倍によって除算する計算方法の方が、除算の回数が圧倒的に少なくて済むため、処理負荷を軽減できるという利点がある。また、統計部26は、推計端末数を算出する際には、属性毎に拡大係数が乗じられた特徴量wijの総和を求め、求めた総和を観測期間長Tの2倍によって除して得られた数値を、セクタS毎、属性毎の推計端末数として推計してもよい。さらに、統計部26は、セクタS毎の推計端末数を、メッシュなどの他のエリア区分毎の人口推計数に変換(エリア変換)して統計データを算出してもよい。
 このエリア変換の方法としては、例えばセクタS毎に推計端末数等の推計人数が算出されていた場合に、予めセクタ毎にメッシュや市町村などの複数のエリア区分に対する按分比を管理しておく。そして、統計部26は、各メッシュ毎に推計された推計人数をその按分比に応じて複数のエリア区分に按分し、各エリア区分毎に按分された推計人数を足し合わせることによってエリア区分毎の推計人数に変換することができる。
 また、集計装置21では、以下のような手順で、位置情報と属性情報とを結合した位置データを対象にして、観測期間の少なくとも一部において観測エリアに滞在したユニークな端末数である「入込端末数」や、観測期間の少なくとも一部において観測エリアに滞在したユニークな人数である「入込数」を推計してもよい。
 ここで、図7を用いて、本発明の入込端末数推計方法に係る入込端末数推計処理を説明する。ここでは、携帯端末の位置データに含まれる位置情報には、一例として、当該携帯端末が在圏するセクタのセクタ番号が与えられているものとする。また、ここでは、観測期間情報として、観測開始時刻tと観測終了時刻tの組が条件入力部23により予め取得され、観測エリア情報として、セクタ番号Sが条件入力部23により予め取得されたものとする。
 まず、抽出部24が、格納部22に蓄積された位置データから、観測期間の少なくとも一部において観測エリアに滞在したと推定される端末、又は、当該端末にて観測期間内又は後述する拡張期間内に生成された1つの位置データを抽出する。ここでの抽出方法は、さまざまな方法を採用しうるが、以下では、一例として、観測エリアの各端末の推定滞在期間を用いた方法を説明する。
 抽出部24は、同一端末に関する位置データにおいて、取得時刻が後述の拡張期間内にあり位置情報が観測エリア内を示すエリア内位置データ、および取得時刻順に時系列に並べた場合に当該エリア内位置データに隣接し位置情報が観測エリア外を示すエリア外位置データに基づいて、端末が観測エリア内に滞在していた推定滞在期間を端末ごとに算出する(図7のステップS1)。なお、上記の「拡張期間」は、ここでは一例として、観測期間を前後に所定の時間幅(例えば1時間)だけ拡張した期間、即ち、観測開始時刻tから所定時間だけ過去に遡った時刻を開始点とし、観測終了時刻tから所定時間だけ未来に進めた時刻を終了点とする期間を意味する。
 図8に示すように、拡張期間内に取得された同一端末に関する一連の位置データを取得時刻順に時系列に並べ、位置情報が観測エリア内を示すエリア内位置データを黒丸で、エリア内位置データに隣接し位置情報が観測エリア外を示すエリア外位置データを白丸で、それぞれ示した場合、時系列上で最先のエリア内位置データの取得時刻tと、該最先のエリア内位置データに隣接するエリア外位置データの取得時刻tとの按分点(一例として中点)に相当する時刻tinを推定滞在期間の開始時刻とする。同様に、時系列上で最後のエリア内位置データの取得時刻tと、該最後のエリア内位置データに隣接するエリア外位置データの取得時刻tとの按分点(一例として中点)に相当する時刻toutを推定滞在期間の終了時刻とする。これにより、図8に長方形で示した期間、即ち、時刻tinから時刻toutまでの期間が、当該端末の推定滞在期間として算出される。
 そして、抽出部24は、算出された推定滞在期間と観測期間とが重複する端末を抽出する(図7のステップS2)。図9には、拡張期間内に取得された端末A~Eに関する一連の位置データを端末ごとに、取得時刻順に時系列に横軸方向に並べた図を示しており、この図9では、位置情報が観測エリア内を示すエリア内位置データを黒丸で、位置情報が観測エリア外を示すエリア外位置データを白丸でそれぞれ示している。仮に、取得時刻が観測期間(時刻t~時刻t)内にあるエリア内位置データにのみ着目すると、対応する端末としては端末C~Eの3つが抽出される。
 ところが、図9で長方形により示した推定滞在期間と観測期間(時刻t~時刻t)とが重複する端末としては、端末A~Eの5つが挙げられるため、ステップS2では端末A~Eの5つが抽出される。これにより、黒丸で示すエリア内位置データにのみ着目した場合に除外される端末A、Bについても、観測期間中のどこかで観測エリア内に滞在していたと推定されることとなる。なお、上述したステップS1、S2における推定滞在期間を用いた方法は一例であり、他の方法を採用しても構わない。他の方法については後述する。
 次に、統計部26が、ステップS1、S2により抽出された端末の数をカウントし、得られたカウント数を観測期間内における観測エリアの入込端末数として推計する(図7のステップS3)。
 次に、拡大係数付与部25が、抽出された端末それぞれについて、対応する属性情報を基にして入込端末数を入込数に変換するための拡大係数を導出する(図7のステップS4)。また、端末契約率などの拡大係数が時刻に応じて変動する場合、拡大係数付与部25は、推定滞在期間と観測期間とが重複する期間の先頭時刻を抽出し、得られた先頭時刻に対応する拡大係数を導出することが好適である。
 次に、統計部26が、拡大係数付与部25により導出された、端末ごとの位置データそれぞれについての拡大係数を集計し、得られた拡大係数の総和を観測期間内における観測エリアの入込数として推計する(図7のステップS5)。そして、統計部26は、推計により得られた入込数を情報秘匿装置31に出力する(図7のステップS6)。このとき、ステップS3で得られた入込端末数も併せて出力してもよい。
 また、上記実施形態では、拡大係数付与部25が、属性情報に対応する契約率の逆数を拡大係数と付与しているが、端末の在圏率を反映した拡大係数を付与してもよい。例えば、拡大係数付与部25は、在圏率を反映した拡大係数として、「所定範囲の地域における人口」に占める「位置データを得られた特定の通信事業者の契約端末数」の割合である「端末契約率」の逆数を用いることができる。この「位置データを得られた特定の通信事業者の契約端末数」は、格納部22に格納された位置データから集計することができる。このような拡大係数は、住所区分毎、年齢層毎、性別毎、時間帯毎に計算することができる。
 また、情報秘匿装置31による秘匿処理は以下のように実行されてもよい。
 情報秘匿装置31は、統計部26から推計値(推計人口など)を受け取ったときに、例えば図10に示す秘匿処理を行う。即ち、判定部32は、推計の基礎となったエリア(セル)ごとの位置データが何台の端末から取得されたかを示す取得元端末数が、秘匿処理が必要と判断するための予め定められた基準値(一例として10)未満であるか否かを判定する(図10のステップS61)。なお、取得元端末数は、同一端末についての重複を除いたユニークな端末数を示す。ここでの判定を行うには、エリア(セル)ごとの位置データの取得元端末数が必要となるが、一例としては、集計部27が、統計部26によって位置データに対応付けられた特徴量が集計される際に、該位置データ中の識別情報(例えば、前述した非識別化位置データ生成部16による非識別化処理後のハッシュ済み電話番号)の数をカウントし、得られたハッシュ済み電話番号総数の情報を判定部32に渡し、判定部32がハッシュ済み電話番号総数をエリア(セル)ごとの位置データの取得元端末数として用いてもよい。
 より具体的には、統計部26がセクタSからエリア区分へのエリア変換を実行している場合には、判定部32は、集計部27によって集計されるエリア区分毎の位置データの取得元端末数を判定する。例えば、あるエリア区分QがセクタSAとセクタSBに跨っていた場合に、集計対象の観測期間の間に、セクタSAでは、端末識別番号:ID1,ID2,ID3,ID4,ID5,ID6の6台の携帯端末2からの位置登録信号が観測され、セクタSBでは、端末識別番号:ID4,ID5,ID6,ID7,ID8の5台の携帯端末2からの位置登録信号が観測されたものとする。このような場合には、判定部32の判定は、各セクタSA,SB毎の取得元端末数の総和では無くて、エリア区分Qについて、その推計の基礎となった位置データが何台の端末から取得されたかを示すエリア区分Qの取得元端末数を用いて行われる。上記の例では、セクタSAではユニーク端末数:6、セクタSBではユニーク端末数5であるが、判定部32が判定対象とする取得元端末数は、エリア区分Qについて算出された取得元端末数:8となる。仮に基準値が10台であれば、取得元端末数が基準値未満となるので、判定部32は、当該エリア区分Qの推計値を秘匿対象とする。
 ステップS61にて、推計の基礎となったエリア(セル)ごとの位置データの取得元端末数が基準値未満ならば、出力部33は当該エリア(セル)に関する推計値をゼロとすることで、当該推計値を秘匿する(ステップS62)。なお、ここでの秘匿方法は、推計値をゼロとすることに限定されるものではなく、推計値を所定の文字や記号(例えば「X」など)で表象する方法など他の方法を採用してもよい。
 一方、ステップS61にて、推計の基礎となったエリア(セル)ごとの位置データの取得元端末数が基準値以上ならば、出力部33は当該エリア(セル)に関する推計値に対し、以下のような、推計値出力にて用いられる階級幅の確率的丸めを行う(ステップS63)。即ち、あるエリア(セル)に関する推計値をx、階級幅をkとすると、出力部33は、kn≦x<k(n+1)(nは整数)の場合に、当該推計値xを、確率(x-kn)/kでk(n+1)に、確率(k(n+1)-x)/kでknに丸める。
 例えば、推計値xが23、階級幅kが10の場合、k×2≦x<k(2+1)なので、n=2となり、推計値「23」は、確率0.3(30%の確率)で「30」に、確率0.7(70%の確率)で「20」に丸められる。
 以上のような情報秘匿装置31による秘匿処理により、推計結果からの個人特定を防止して推計結果の有用性を高めることができる。また、秘匿した値が他の値から推測できてしまうといった不都合を未然に防止することができる。
 なお、確率的丸めにおける階級幅は、集計に用いた位置データのうち拡大係数が最大のものを抽出し、その拡大係数を所定倍(例えば10倍)した値を階級幅として設定してもよい。また、予め階級幅を決定しておき、確率的丸めを実施してもよい。その際、拡大係数が予め定められた階級幅の所定割合(例えば1/10)を超える位置データを含むエリア(セル)のデータは捨てるといった処理規則を採用してもよい。
 また、情報秘匿装置31による秘匿処理は、図10に示す処理には限定されず、別の処理を採用してもよい。例えば、図10のステップS61では、「推計の基礎となったエリア(セル)ごとの位置データの取得元端末数」に代わり、「推計の基礎となったエリア(セル)ごとの位置データの個数」が基準値未満か否かを判定してもよいし、「出力される推計値(人口又は端末数)」が基準値未満か否かを判定してもよい。また、図10のステップS61で否定判定された場合には、ステップS63の処理を省略してもよい。
 上記統計情報生成システムにおいては、予め定められた電子鍵情報を保持する鍵管理手段と、第1の識別情報及び第2の識別情報が入力されて、第1の識別情報及び第2の識別情報それぞれに対して、鍵管理手段が保持する電子鍵情報を用いた一方向関数を適用して、第1の非識別化情報及び第2の非識別化情報を出力する一方向演算手段と、位置情報蓄積データから第1の識別情報を削除するとともに、位置情報蓄積データに対して、一方向演算手段によって出力された第1の非識別化情報を第1の識別情報として付加して位置情報蓄積データを生成する非識別化位置データ生成手段と、属性情報蓄積データから第2の識別情報を削除するとともに、属性情報蓄積データに対して、一方向演算手段によって出力された第2の非識別化情報を第2の識別情報として付加して属性情報蓄積データを生成する非識別化属性データ生成手段と、をさらに備えることが好ましい。この場合、第1及び第2の識別情報により互いに対応づけられる位置情報蓄積データと属性情報蓄積データから、それぞれ第1及び第2の識別情報が取り除かれた上で第1及び第2の非識別化情報が付与される。この第1及び第2の非識別化情報は,予め保持された電子鍵情報と第1及び第2の識別情報を一方向性関数に代入することにより得られたものであり、非識別化情報から識別情報を逆算することはできない。また、一方向性関数が既知であったとしても、電子鍵の値が秘密にされている限り、識別情報を総当たりで一方向性関数に入力したとしても識別情報と非識別化情報の対応関係を知ることはできない。その結果、位置情報蓄積データや属性情報蓄積データに含まれる識別情報からの個人の識別を防止できる。また、識別情報は非識別化情報に置き換えられていることから、識別情報を用いた検索条件を与えることにより、特定個人の行動を開示させるような統計処理を実施することを未然に防ぐことができる。
 また、非識別化属性データ生成手段は、属性情報蓄積データに含まれる属性情報を、情報を抽象化した抽象化属性情報に置換し、抽出手段は、当該抽象化された抽象化属性情報と検索条件情報を照合することにより、非識別化属性情報蓄積データの一部を抽出する、ことが好ましい。こうすれば、抽象化された属性情報を単位にした統計データを得ることによって人口動態の概略を知ることができると共に、統計データを基にした個人の識別をより困難にすることができる。
 また、抽出手段は、位置情報蓄積データに対して、検索条件情報との一致率を示す確率情報を付与し、統計手段は、位置情報蓄積データに付与された確率情報に対して拡大係数を乗じることによって統計データを算出する、ことも好ましい。かかる構成を採れば、位置情報と検索条件との一致率が確率として得られる場合に、その確率が反映された統計データを得ることができ、全体の人口動態傾向が反映された統計データを得ることができる。
 また、抽出手段は、位置情報蓄積データを基にして、移動通信端末によって生成された位置情報に関する推定生成密度に対応する値を推計して特徴量として付与し、統計手段は、位置情報蓄積データに付与された滞在時間情報に対して拡大係数を乗じることによって統計データを算出する、ことも好ましい。かかる構成を採れば、セクタに存在する滞在時間を推計してその滞在時間が反映された統計データを得ることができ、全体の人口動態傾向が反映された統計データを得ることができる。
 本発明は、位置情報集計装置及び位置情報集計方法を使用用途とし、様々な誤差を生じる測位方式を用いた場合であっても、誤差の少ない高精度の人口分布を算出することができるものである。
 1…統計情報生成システム、2…携帯端末(移動通信端末)、11…非識別化情報生成装置、12…第1の入力部(第1の入力手段)、13…第2の入力部(第2の入力手段)、14…鍵管理部(鍵管理手段)、15…一方向演算部(一方向演算手段)、16…非識別化位置データ生成部(非識別化位置データ生成手段)、17…非識別化属性データ生成部(非識別化属性データ生成手段)、21…集計装置、23…条件入力部(条件入力手段)、24…抽出部(抽出手段)、25…拡大係数付与部(拡大係数付与手段)、26…統計部(統計手段)、27…集計部(集計手段)、31…情報秘匿装置、32…判定部(判定手段)、33…出力部(出力手段)。

Claims (9)

  1.  移動通信端末を識別する第1の識別情報と、該移動通信端末の位置に関する位置情報と、該位置情報が取得された時刻に関する時刻情報と、を含む位置情報蓄積データを入力する第1の入力手段と、
     移動通信端末を識別する第2の識別情報と、該移動通信端末の契約者に関する属性情報と、を含む属性情報蓄積データを入力する第2の入力手段と、
     前記位置情報蓄積データ及び前記属性情報蓄積データに対する検索条件情報を入力する条件入力手段と、
     前記検索条件情報を基に、前記位置情報蓄積データ及び前記属性情報蓄積データの一部を抽出する抽出手段と、
     前記抽出手段によって抽出された前記属性情報蓄積データに対して、前記属性情報蓄積データに含まれる属性情報に対応する係数であって、統計対象の数値への拡大度を示す拡大係数を付与する拡大係数付与手段と、
     前記抽出手段によって抽出された前記位置情報蓄積データと、前記抽出手段によって抽出され、前記位置情報蓄積データに含まれる前記第1の識別情報に対応する前記第2の識別情報を有する前記属性情報蓄積データと、該属性情報蓄積データに付与された前記拡大係数と、を用いて、人口に関する統計データを算出して出力する統計手段と、
     前記抽出手段によって抽出された前記位置情報蓄積データのデータ数を集計する集計手段と、
     前記集計手段によって集計された前記データ数を所定値と比較することによって前記データ数の大小を判定する判定手段と、
     前記判定手段によって前記データ数が大きいと判定された場合には、前記統計データを出力し、前記判定手段によって前記データ数が小さいと判定された場合には、前記統計データに含まれる数値を隠蔽して出力する出力手段と、
    を備えることを特徴とする統計情報生成システム。
  2.  前記集計手段は、前記抽出手段によって抽出された位置情報蓄積データ中のユニークな前記第1の識別情報の個数を前記データ数として集計する、
    ことを特徴とする請求項1記載の統計情報生成システム。
  3.  前記集計手段は、前記統計手段による集計単位であるエリア区分毎のユニークな前記第1の識別情報の個数を前記データ数として集計する、
    ことを特徴とする請求項2記載の統計情報生成システム。
  4.  予め定められた電子鍵情報を保持する鍵管理手段と、
     前記第1の識別情報及び前記第2の識別情報が入力されて、前記第1の識別情報及び前記第2の識別情報それぞれに対して、前記鍵管理手段が保持する前記電子鍵情報を用いた一方向関数を適用して、第1の非識別化情報及び第2の非識別化情報を出力する一方向演算手段と、
     前記位置情報蓄積データから前記第1の識別情報を削除するとともに、前記位置情報蓄積データに対して、前記一方向演算手段によって出力された前記第1の非識別化情報を前記第1の識別情報として付加して位置情報蓄積データを生成する非識別化位置データ生成手段と、
     前記属性情報蓄積データから前記第2の識別情報を削除するとともに、前記属性情報蓄積データに対して、前記一方向演算手段によって出力された前記第2の非識別化情報を前記第2の識別情報として付加して属性情報蓄積データを生成する非識別化属性データ生成手段と、
    をさらに備えることを特徴とする請求項1~3のいずれか1項に記載の統計情報生成システム。
  5.  前記非識別化属性データ生成手段は、前記属性情報蓄積データに含まれる属性情報を、情報を抽象化した抽象化属性情報に置換し、
     前記抽出手段は、当該抽象化された抽象化属性情報と前記検索条件情報を照合することにより、前記非識別化属性情報蓄積データの一部を抽出する、
    ことを特徴とする請求項4記載の統計情報生成システム。
  6.  前記抽出手段は、前記位置情報蓄積データに対して、検索条件情報との一致率を示す確率情報を付与し、
     前記統計手段は、前記位置情報蓄積データに付与された前記確率情報に対して前記拡大係数を乗じることによって前記統計データを算出する、
    ことを特徴とする請求項1~5のいずれか1項に記載の統計情報生成システム。
  7.  前記抽出手段は、前記位置情報蓄積データを基にして、前記移動通信端末によって生成された前記位置情報に関する推定生成密度に対応する値を推計して特徴量として付与し、
     前記統計手段は、前記位置情報蓄積データに付与された前記特徴量に対して前記拡大係数を乗じることによって前記統計データを算出する、
    ことを特徴とする請求項1~5のいずれか1項に記載の統計情報生成システム。
  8.  移動通信端末を識別する第1の識別情報と、該移動通信端末の位置に関する位置情報と、該位置情報が取得された時刻に関する時刻情報と、を含む位置情報蓄積データを入力する第1の入力手段と、
     移動通信端末を識別する第2の識別情報と、該移動通信端末の契約者に関する属性情報と、を含む属性情報蓄積データを入力する第2の入力手段と、
     予め定められた電子鍵情報を保持する鍵管理手段と、
     前記第1の識別情報及び前記第2の識別情報が入力されて、前記第1の識別情報及び前記第2の識別情報それぞれに対して、前記鍵管理手段が保持する前記電子鍵情報を用いた一方向関数を適用して、第1の非識別化情報及び第2の非識別化情報を出力する一方向演算手段と、
     前記位置情報蓄積データから前記第1の識別情報を削除するとともに、前記位置情報蓄積データに対して、前記一方向演算手段によって出力された前記第1の非識別化情報を付加して非識別化位置情報蓄積データを生成する非識別化位置データ生成手段と、
     前記属性情報蓄積データから前記第2の識別情報を削除するとともに、前記属性情報蓄積データに対して、前記一方向演算手段によって出力された前記第2の非識別化情報を付加して非識別化属性情報蓄積データを生成する非識別化属性データ生成手段と、
     前記非識別化位置情報蓄積データ及び前記非識別化属性情報蓄積データに対する検索条件情報を入力する条件入力手段と、
     前記検索条件情報を基に、前記非識別化位置情報蓄積データ及び前記非識別化属性情報蓄積データの一部を抽出する抽出手段と、
     前記抽出手段によって抽出された前記非識別化属性情報蓄積データに対して、前記非識別化属性情報蓄積データに含まれる属性情報に対応する係数であって、統計対象の数値への拡大度を示す拡大係数を付与する拡大係数付与手段と、
     前記抽出手段によって抽出された前記非識別化位置情報蓄積データと、前記抽出手段によって抽出され、前記非識別化位置情報蓄積データに含まれる前記第1の非識別化情報に対応する前記第2の非識別化情報を有する前記非識別化属性情報蓄積データと、該非識別化属性情報蓄積データに付与された前記拡大係数と、を用いて、人口に関する統計データを算出して出力する統計手段と、
     前記抽出手段によって抽出された前記非識別化位置情報蓄積データのデータ数を集計する集計手段と、
     前記集計手段によって集計された前記データ数を所定値と比較することによって前記データ数の大小を判定する判定手段と、
     前記判定手段によって前記データ数が大きいと判定された場合には、前記統計データを出力し、前記判定手段によって前記データ数が小さいと判定された場合には、前記統計データに含まれる数値を隠蔽して出力する出力手段と、
    を備えることを特徴とする統計情報生成システム。
  9.  第1の入力手段が、移動通信端末を識別する第1の識別情報と、該移動通信端末の位置に関する位置情報と、該位置情報が取得された時刻に関する時刻情報と、を含む位置情報蓄積データを入力する第1の入力ステップと、
     第2の入力手段が、移動通信端末を識別する第2の識別情報と、該移動通信端末の契約者に関する属性情報と、を含む属性情報蓄積データを入力する第2の入力ステップと、
     条件入力手段が、前記位置情報蓄積データ及び前記属性情報蓄積データに対する検索条件情報を入力する条件入力ステップと、
     抽出手段が、前記検索条件情報を基に、前記位置情報蓄積データ及び前記属性情報蓄積データの一部を抽出する抽出ステップと、
     拡大係数付与手段が、前記抽出手段によって抽出された前記属性情報蓄積データに対して、前記属性情報蓄積データに含まれる属性情報に対応する係数であって、統計対象の数値への拡大度を示す拡大係数を付与する拡大係数付与ステップと、
     統計手段が、前記抽出手段によって抽出された前記位置情報蓄積データと、前記抽出手段によって抽出され、前記位置情報蓄積データに含まれる前記第1の識別情報に対応する前記第2の識別情報を有する前記属性情報蓄積データと、該属性情報蓄積データに付与された前記拡大係数と、を用いて、人口に関する統計データを算出して出力する統計ステップと、
     集計手段が、前記抽出手段によって抽出された前記位置情報蓄積データのデータ数を集計する集計ステップと、
     判定手段が、前記集計手段によって集計された前記データ数を所定値と比較することによって前記データ数の大小を判定する判定ステップと、
     出力手段が、前記判定手段によって前記データ数が大きいと判定された場合には、前記統計データを出力し、前記判定手段によって前記データ数が小さいと判定された場合には、前記統計データに含まれる数値を隠蔽して出力する出力ステップと、
    を備えることを特徴とする統計情報生成方法。
PCT/JP2011/058730 2010-04-23 2011-04-06 統計情報生成システム及び統計情報生成方法 WO2011132534A1 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
BR112012027137A BR112012027137A2 (pt) 2010-04-23 2011-04-06 sistema de geração de imformações estatícas e método de gerção de imformações estatísticas
CN201180019852XA CN102859547A (zh) 2010-04-23 2011-04-06 统计信息生成系统和统计信息生成方法
US13/642,643 US8903791B2 (en) 2010-04-23 2011-04-06 Statistical information generation system and statistical information generation method
JP2012511606A JP5406981B2 (ja) 2010-04-23 2011-04-06 統計情報生成システム及び統計情報生成方法
KR1020147028590A KR20140135244A (ko) 2010-04-23 2011-04-06 통계 정보 생성 시스템 및 통계 정보 생성 방법
KR1020127029458A KR20120139844A (ko) 2010-04-23 2011-04-06 통계 정보 생성 시스템 및 통계 정보 생성 방법
EP11771870.0A EP2562711A4 (en) 2010-04-23 2011-04-06 SYSTEM FOR THE PRODUCTION OF STATISTICAL DATA AND METHOD FOR PRODUCING STATISTICAL DATA
RU2012149859/08A RU2527754C2 (ru) 2010-04-23 2011-04-06 Система генерирования статистической информации и способ генерирования статистической информации

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010-099855 2010-04-23
JP2010099855 2010-04-23

Publications (1)

Publication Number Publication Date
WO2011132534A1 true WO2011132534A1 (ja) 2011-10-27

Family

ID=44834065

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/058730 WO2011132534A1 (ja) 2010-04-23 2011-04-06 統計情報生成システム及び統計情報生成方法

Country Status (8)

Country Link
US (1) US8903791B2 (ja)
EP (1) EP2562711A4 (ja)
JP (1) JP5406981B2 (ja)
KR (2) KR20140135244A (ja)
CN (1) CN102859547A (ja)
BR (1) BR112012027137A2 (ja)
RU (1) RU2527754C2 (ja)
WO (1) WO2011132534A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013125393A (ja) * 2011-12-14 2013-06-24 Zenrin Datacom Co Ltd ユーザ情報出力システム、ユーザ情報出力方法及びユーザ情報出力プログラム
JP2013153287A (ja) * 2012-01-24 2013-08-08 Ntt Docomo Inc 情報分析装置および人口分布算出方法
JP2013156720A (ja) * 2012-01-27 2013-08-15 Nippon Telegr & Teleph Corp <Ntt> 匿名データ提供システム、匿名データ装置、及びそれらが実行する方法
JP2013156719A (ja) * 2012-01-27 2013-08-15 Nippon Telegr & Teleph Corp <Ntt> 匿名データ提供システム、匿名データ装置、及びそれらが実行する方法
JP2013222305A (ja) * 2012-04-16 2013-10-28 Research Organization Of Information & Systems 緊急時情報管理システム
JP2015029216A (ja) * 2013-07-30 2015-02-12 株式会社ゼンリンデータコム 推定値算出装置、推定値算出方法及びプログラム
JP7450685B2 (ja) 2021-10-15 2024-03-15 楽天グループ株式会社 情報処理装置、情報処理方法、およびプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101585985B1 (ko) * 2015-01-19 2016-01-15 경희대학교 산학협력단 개인정보 비식별화 전송장치 및 전송방법
WO2020085993A1 (en) * 2018-10-26 2020-04-30 Eureka Analytics Pte. Ltd. Mathematical summaries of telecommunications data for data analytics
KR102115329B1 (ko) * 2019-08-12 2020-05-26 대영유비텍 주식회사 공개키 기반의 개인 정보 비식별화 시스템 및 방법
US20230169414A1 (en) * 2020-04-23 2023-06-01 Ntt Docomo, Inc. Population extraction device
US20220138260A1 (en) * 2020-10-30 2022-05-05 Here Global B.V. Method, apparatus, and system for estimating continuous population density change in urban areas

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268950A (ja) * 2001-03-07 2002-09-20 Sony Corp 情報管理システム、情報管理方法、および情報処理装置、情報処理方法、並びにプログラム
JP2003030373A (ja) 2001-07-10 2003-01-31 Fujitsu Ltd 人口分布解析装置
JP2003122877A (ja) * 2001-10-09 2003-04-25 Oki Electric Ind Co Ltd 地域内人口算出システム
JP2005234866A (ja) * 2004-02-19 2005-09-02 Nippon Telegr & Teleph Corp <Ntt> プライバシ情報管理サーバ及び方法並びにプログラム
JP2005286657A (ja) 2004-03-29 2005-10-13 Victor Co Of Japan Ltd 人口密集度情報収集システム
JP2009098805A (ja) * 2007-10-15 2009-05-07 Ntt Docomo Inc 配信サーバ、通信システム及び通信方法
JP4364936B1 (ja) * 2009-02-27 2009-11-18 ソフトバンクBb株式会社 流動性人口推定システム、流動性人口推定方法及び流動性人口推定プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7136631B1 (en) * 2000-11-09 2006-11-14 Nortel Networks Limited Apparatus and method to provide one-click logon service for wireless devices
US7010779B2 (en) * 2001-08-16 2006-03-07 Knowledge Dynamics, Inc. Parser, code generator, and data calculation and transformation engine for spreadsheet calculations
WO2006121161A1 (ja) * 2005-05-12 2006-11-16 Ntt Docomo, Inc. 通信機器の検索システム
DE102006018645B4 (de) * 2006-04-21 2008-07-24 Nokia Siemens Networks Gmbh & Co.Kg Verfahren, Vorrichtungen und Computerprogrammprodukt zum Ver- und Entschlüsseln von Mediendaten
KR100818549B1 (ko) 2006-09-27 2008-04-01 김성엽 휴대용 단말기의 위치 정보를 기반으로 한 실시간 정보제공 서비스 방법
CN101083785A (zh) * 2007-07-04 2007-12-05 贾林 获得人口信息的方法及系统
WO2009119393A1 (ja) * 2008-03-24 2009-10-01 日本電気株式会社 マージン設計装置、マージン設計システム、マージン設計方法及びプログラム
US8352493B2 (en) * 2008-06-04 2013-01-08 Hw Llc Searchable health events directory
EP2371149B1 (en) * 2008-12-08 2016-09-14 Telefonaktiebolaget LM Ericsson (publ) Presence service time zone information
US8359238B1 (en) * 2009-06-15 2013-01-22 Adchemy, Inc. Grouping user features based on performance measures
US8401899B1 (en) * 2009-06-15 2013-03-19 Adchemy, Inc. Grouping user features based on performance measures

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268950A (ja) * 2001-03-07 2002-09-20 Sony Corp 情報管理システム、情報管理方法、および情報処理装置、情報処理方法、並びにプログラム
JP2003030373A (ja) 2001-07-10 2003-01-31 Fujitsu Ltd 人口分布解析装置
JP2003122877A (ja) * 2001-10-09 2003-04-25 Oki Electric Ind Co Ltd 地域内人口算出システム
JP2005234866A (ja) * 2004-02-19 2005-09-02 Nippon Telegr & Teleph Corp <Ntt> プライバシ情報管理サーバ及び方法並びにプログラム
JP2005286657A (ja) 2004-03-29 2005-10-13 Victor Co Of Japan Ltd 人口密集度情報収集システム
JP2009098805A (ja) * 2007-10-15 2009-05-07 Ntt Docomo Inc 配信サーバ、通信システム及び通信方法
JP4364936B1 (ja) * 2009-02-27 2009-11-18 ソフトバンクBb株式会社 流動性人口推定システム、流動性人口推定方法及び流動性人口推定プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MIYUKI IMADA: "A Privacy Protection Method using Information Entropy: LooM", IEICE TECHNICAL REPORT ISEC2004-41 TO 66, vol. 104, no. 53, 14 July 2004 (2004-07-14), pages 77 - 94, XP008162575 *
See also references of EP2562711A4

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013125393A (ja) * 2011-12-14 2013-06-24 Zenrin Datacom Co Ltd ユーザ情報出力システム、ユーザ情報出力方法及びユーザ情報出力プログラム
JP2013153287A (ja) * 2012-01-24 2013-08-08 Ntt Docomo Inc 情報分析装置および人口分布算出方法
JP2013156720A (ja) * 2012-01-27 2013-08-15 Nippon Telegr & Teleph Corp <Ntt> 匿名データ提供システム、匿名データ装置、及びそれらが実行する方法
JP2013156719A (ja) * 2012-01-27 2013-08-15 Nippon Telegr & Teleph Corp <Ntt> 匿名データ提供システム、匿名データ装置、及びそれらが実行する方法
JP2013222305A (ja) * 2012-04-16 2013-10-28 Research Organization Of Information & Systems 緊急時情報管理システム
JP2015029216A (ja) * 2013-07-30 2015-02-12 株式会社ゼンリンデータコム 推定値算出装置、推定値算出方法及びプログラム
JP7450685B2 (ja) 2021-10-15 2024-03-15 楽天グループ株式会社 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
JPWO2011132534A1 (ja) 2013-07-18
KR20120139844A (ko) 2012-12-27
JP5406981B2 (ja) 2014-02-05
US8903791B2 (en) 2014-12-02
EP2562711A4 (en) 2015-01-14
EP2562711A1 (en) 2013-02-27
RU2527754C2 (ru) 2014-09-10
BR112012027137A2 (pt) 2016-07-26
KR20140135244A (ko) 2014-11-25
CN102859547A (zh) 2013-01-02
US20130073577A1 (en) 2013-03-21
RU2012149859A (ru) 2014-05-27

Similar Documents

Publication Publication Date Title
JP5406981B2 (ja) 統計情報生成システム及び統計情報生成方法
JP5627702B2 (ja) 位置情報集計装置及び位置情報集計方法
US10304086B2 (en) Techniques for estimating demographic information
US10762237B2 (en) Method for anonymization of data collected within a mobile communication network
US8924433B2 (en) Methods for geotemporal fingerprinting
WO2012056900A1 (ja) 端末数推計装置および端末数推計方法
JP5230815B2 (ja) 世帯人員数分布推定装置及び世帯人員数分布推定方法
JP5944268B2 (ja) ユーザ非特定情報の提供記録を通知するユーザ情報管理装置、プログラム及び方法
CN111148018B (zh) 基于通信数据识别定位区域价值的方法和装置
US20130176433A1 (en) Unique-terminal-count estimation device and unique-terminal-count estimation method
JP2013121073A (ja) 位置情報分析装置及び位置情報分析方法
JP5490908B2 (ja) 人口算出システム及び人口算出方法
JP2012054921A (ja) 移動機分布算出システム及び移動機分布算出方法
US20200413220A1 (en) System and method for identifying associated subjects from location histories
JP5512882B2 (ja) 情報処理装置および端末数推計方法
US20190166465A1 (en) Method and system for determining a suspect data source in a location based services network
CN110310020B (en) Project scheme management method based on data analysis, related device and storage medium
JP7201783B1 (ja) 情報処理装置及び情報処理方法
JP2019101935A (ja) 情報処理装置、情報処理装置、およびプログラム
JP5735888B2 (ja) 人口算出装置および人口算出方法
Chen et al. Social Activity Hubs: Estimating User Specific Contextual Factors from Social Media Data
JP5732547B2 (ja) 推計装置及び推計方法
JP2005050069A (ja) 施設経営支援システム、施設経営支援方法、および、プログラム
JP2013138417A (ja) 情報分析装置および情報分析方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201180019852.X

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11771870

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2012511606

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 9257/CHENP/2012

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 2011771870

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 20127029458

Country of ref document: KR

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2012149859

Country of ref document: RU

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 13642643

Country of ref document: US

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112012027137

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 112012027137

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20121023