WO2024024201A1 - 人口状態判定システム - Google Patents

人口状態判定システム Download PDF

Info

Publication number
WO2024024201A1
WO2024024201A1 PCT/JP2023/016969 JP2023016969W WO2024024201A1 WO 2024024201 A1 WO2024024201 A1 WO 2024024201A1 JP 2023016969 W JP2023016969 W JP 2023016969W WO 2024024201 A1 WO2024024201 A1 WO 2024024201A1
Authority
WO
WIPO (PCT)
Prior art keywords
population
encoder
determination
information
model
Prior art date
Application number
PCT/JP2023/016969
Other languages
English (en)
French (fr)
Inventor
桂一 落合
雅之 寺田
Original Assignee
株式会社Nttドコモ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Nttドコモ filed Critical 株式会社Nttドコモ
Publication of WO2024024201A1 publication Critical patent/WO2024024201A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Definitions

  • the present invention relates to a population status determination system that determines the population status of an area.
  • Patent Document 1 a technique has been proposed for estimating the population of each area and time zone using data from a mobile terminal such as a mobile phone (see, for example, Patent Document 1).
  • An embodiment of the present invention has been made in view of the above, and aims to provide a population status determination system that can appropriately determine the population status.
  • a population status determination system includes an acquisition unit that acquires population information indicating a time-series population of an area whose population status is to be determined; A model calculation unit that inputs the population information acquired by the above into a pre-stored encoder/decoder model that compresses and restores the input data, performs calculations, and obtains an output from the encoder/decoder model, and an acquisition unit. a determination unit that compares the acquired population information with the output obtained by the model calculation unit to determine the state of the population of the area; and a determination criterion generation unit that generates a determination criterion used for determination by the determination unit.
  • the determination criterion generation unit includes population information for determination criterion generation, the first population information for determination criterion generation in each of a first state in the same area and a second state different from the first state. and second population information for determination criterion generation in the first state of the area to be determined, and store the acquired first and second population information in advance for determination criterion generation. calculate the input to the encoder/decoder model, obtain the output from the encoder/decoder model, compare the input and output to the encoder/decoder model, and set the judgment criteria based on the comparison result. generate.
  • the population status determination system it is possible to determine the population status in consideration of the chronological population of an area. Further, the input to the encoder/decoder model and the output are compared to make a determination. Further, an appropriate criterion is generated based on the first and second population information for generating the criterion, and used for the determination. Therefore, according to the population status determination system according to an embodiment of the present invention, the population status can be appropriately determined.
  • the state of the population can be appropriately determined.
  • FIG. 1 is a diagram showing the configuration of a computer that is a population status determination system and a model generation system according to an embodiment of the present invention. It is a graph of an example of population information and an output value from an encoder-decoder model when the population information is used as an input value.
  • FIG. 3 is a diagram showing an example of information used in a computer.
  • FIG. 2 is a diagram schematically showing an example of an encoder/decoder model generated and used by a computer.
  • FIG. 7 is a diagram schematically showing another example of an encoder/decoder model generated and used by a computer.
  • FIG. 3 is a diagram showing an example of information used in a computer.
  • 3 is a diagram schematically showing a learning example and a test example, which are first and second population information for determining criteria generation, which are used to generate determination criteria.
  • 3 is a flowchart showing processing executed by the model generation system according to the embodiment of the present invention. It is a flowchart which shows the processing performed by the population status determination system concerning an embodiment of the present invention. It is a flowchart which shows the process performed at the time of determination criterion generation by the population state determination system based on embodiment of this invention.
  • 1 is a diagram showing the hardware configuration of a computer that is a population status determination system and a model generation system according to an embodiment of the present invention.
  • FIG. 1 shows a computer 1 that is a population status determination system 10 and a model generation system 20 according to the present embodiment.
  • the population status determination system 10 is a system (apparatus) that determines (estimates) the population status of a geographical area.
  • the area to be determined is, for example, a 500 m square area divided into regions. A 1/2 area mesh may be used as the area.
  • administrative divisions such as municipalities or prefectures, or preset land use classifications may be used. In the following explanation, the area will be explained as a mesh. Note that the area to be determined does not need to be the above, and can be any geographical area.
  • Determination by the population state determination system 10 is performed based on population information indicating the chronological population of the area to be determined. For example, population information indicating the population for each hour on a daily basis is used for this determination, as will be described later.
  • the determination is, for example, a determination as to whether the population in the area to be determined is in an abnormal state different from normal times. That is, the determination is to detect an abnormality in population trends in the area to be determined.
  • An abnormal state in which the population differs from normal times is, for example, a state in which population trends are excessively different from normal population trends.
  • the determination by the population state determination system 10 may be not a determination of whether or not the state is abnormal, but a determination of the degree of abnormality.
  • the determination by the population status determination system 10 may be other than the above as long as it determines the population status of the area.
  • the determination by the population status determination system 10 is performed by performing calculations on population information using an encoder-decoder model, which is a learned model generated by machine learning.
  • the encoder/decoder model is a model that compresses and decompresses input data.
  • the model generation system 20 generates an encoder/decoder model used for determination by the population status determination system 10.
  • a conventional computer can be used as the computer 1 that is the population status determination system 10 and model generation system 20 according to the present embodiment. Further, the computer 1 may be a computer system including multiple computers.
  • the model generation system 20 includes a learning acquisition section 21 and a model generation section 22.
  • the learning acquisition unit 21 is a functional unit that acquires learning population information indicating a time-series population, which is used to generate an encoder/decoder model.
  • the learning acquisition unit 21 may acquire learning type information indicating the type of area related to the learning population information.
  • the learning acquisition unit 21 may perform clustering using the learning population information to acquire the learning type information.
  • the learning acquisition unit 21 acquires each piece of information as follows.
  • the individual population information for learning is information in the same format as the population information used to determine the state of the population.
  • the population information is information indicating the population of an area every hour of the day (0:00, 1:00, ..., 23:00).
  • FIG. 2 shows a part of a graph G1 as an example of population information.
  • the population status determination system 10 determines the population status of the area to be determined on that day. Note that the overall time period (one day in the above example), time interval (every hour in the above example), and format of the population information to be determined are not necessarily as described above.
  • the large amount of learning population information is used to generate the encoder/decoder model.
  • the large amount of learning population information usually includes learning population information related to a plurality of areas.
  • the learning acquisition unit 21 acquires, for example, the data shown in FIG. 3(a).
  • the data shown in Figure 3(a) includes a mesh code (information in the "meshcode” column), information indicating time (information in the "timestamp” column), and information indicating population (information in the "population” column). This is associated information.
  • the mesh code is information such as a character string that specifies a mesh that is an area, and is set in advance for each area.
  • the information indicating the time is, for example, information indicating the year, month, day, and time of the day.
  • the information indicating the population indicates the population at the area and time indicated by the corresponding mesh code and information indicating the time.
  • the data related to the population shown in FIG. 3(a) is generated as spatial statistical information using, for example, an existing method from information indicating the location of the mobile phone and information registered about the subscriber of the mobile phone. Moreover, the data related to the population shown in FIG. 3(a) may be generated by any method other than the above.
  • the learning acquisition unit 21 acquires data related to the population shown in FIG. 3A that is stored in advance in a database of the computer 1 or other device.
  • the learning acquisition unit 21 converts the acquired data into data for each mesh code and for each hour of the day (0:00, 1:00, ..., 23:00), that is, area It is formatted into data of daily population trends in units. This data on population trends corresponds to learning population information.
  • the learning acquisition unit 21 acquires enough data on population trends to generate an encoder/decoder model by machine learning.
  • the data on population trends may or may not include data on the area whose population status is to be determined. Note that the learning acquisition unit 21 may acquire information indicating a time-series population other than the above as the learning population information.
  • the learning acquisition unit 21 may be configured to acquire learning type information indicating the type of area related to population change data.
  • the type of area is a type that can affect population trends in the area.
  • the area types are city types such as "office area” and "residential area.”
  • the learning acquisition unit 21 acquires learning type information that is stored in advance in a database of the computer 1 or another device.
  • FIG. 3(c) shows an example of data that is pre-stored learning type information.
  • the data shown in FIG. 3(c) includes a mesh code (information in the "meshcode” column), information indicating the city type (information in the "city type” column), and type code (information in the "type code” column). is the associated information.
  • the information indicating the city type is information indicating the meaning of the area type indicated by the corresponding mesh code.
  • Information indicating the city type is set in advance for each area. Note that the information indicating the city type does not need to be used for processing in the model generation system 20, and therefore does not need to be acquired.
  • the type code is information (a flag indicating the area) that specifies the type of area indicated by the corresponding mesh code, and is set in advance for each area.
  • the type code is a numerical value that can be used for machine learning.
  • the type code is the same numerical value if the city type is the same, and is a different numerical value if the city type is different.
  • the learning acquisition unit 21 acquires, as learning type information, the type code corresponding to the mesh code of the area related to the population change data.
  • the learning acquisition unit 21 may perform clustering using the learning population information to acquire the learning type information.
  • the learning acquisition unit 21 performs clustering using the data on daily population trends in area units. For example, as described below, the learning acquisition unit 21 performs area clustering using the data on daily population trends in area units. By performing such clustering, areas with similar population trends can be divided into clusters.
  • the learning acquisition unit 21 averages the population at each time for each area and generates one population trend data for one area. For example, the learning acquisition unit 21 averages data on daily population trends for each time during a preset period for each area (for example, from one month before the current time to the current time), and One population trend data is generated for each period.
  • the learning acquisition unit 21 performs area clustering by clustering the population change data. Clustering itself may be performed by a conventional method (eg, k-means method).
  • the learning acquisition unit 21 may cluster population change data that may include a plurality of population change data for one area. The learning acquisition unit 21 determines, for each area, the cluster that includes the most population change data as the cluster for the area.
  • the learning acquisition unit 21 assigns a different type code (cluster number) to each cluster.
  • the learning acquisition unit 21 sets the type code of the cluster to which the area belongs as the learning type information regarding the area.
  • the learning acquisition unit 21 stores the correspondence between the mesh code and the type code for each area in the computer 1 so that it can also be used by the population status determination system 10. Note that when learning type information is obtained by performing clustering, there is no information indicating the city type.
  • the learning acquisition unit 21 outputs the acquired learning population information to the model generation unit 22. Furthermore, in the mode of acquiring learning type information, the learning acquisition unit 21 also outputs the acquired learning type information to the model generation unit 22 .
  • the model generation unit 22 is a functional unit that performs machine learning based on the learning population information acquired by the learning acquisition unit 21 and generates an encoder/decoder model that inputs information indicating a time-series population.
  • the model generation unit 22 may generate an encoder/decoder model based on the learning type information acquired by the learning acquisition unit 21.
  • the model generation unit 22 may generate an encoder/decoder model that also receives type information indicating the type of area.
  • the model generation unit 22 may generate a plurality of encoder/decoder models according to type information indicating the type of area.
  • FIG. 4 shows an example of an encoder/decoder model.
  • the encoder/decoder model is composed of a neural network, which is trained to input population information indicating the time-series population of an area, perform dimension compression, and then output the original population information. It is a completed model.
  • autoencoder GPU Hinton and Salakhutdinov Ruslan, “Reducing the dimensionality of data Science, pp. 504-507, 2006
  • Transformer As an encoder/decoder model, autoencoder (Geoffrey Hinton and Salakhutdinov Ruslan, “Reducing the dimensionality of data Science, pp. 504-507, 2006), or Transformer (Ashish Vaswani et al., “Attention Is All You Need.”Advances in neural information processing system 2017) can be used.
  • the input layer of the encoder-decoder model is provided with neurons as many as the number of elements of population information (the number of dimensions of population information). If the population information is information (numerical value) that indicates the population of an area every hour of the day (0:00, 1:00, ..., 23:00), the input layer of the encoder/decoder model contains information about the population for each hour. There are 24 neurons (vectors) that input the numerical value of the population of the area.
  • the output layer of the encoder-decoder model is provided with the same number of neurons (vectors) as neurons in the input layer, corresponding to each neuron in the input layer.
  • the configuration of the encoder/decoder model itself may be similar to a conventional encoder/decoder model.
  • a hidden layer including a plurality of neurons (vectors) is provided between the input layer and the output layer.
  • Each neuron in the input layer and each neuron in the hidden layer are connected to each other with a weight w used for calculation set.
  • each neuron in the hidden layer and each neuron in the output are connected to each other with a weight w used for calculation set.
  • the number of neurons provided in the hidden layer is smaller than the number of neurons in the input layer and the output layer. As a result, dimension compression is performed in the hidden layer.
  • the model generation unit 22 generates an encoder/decoder model as follows. First, an example of a mode in which the learning type information is not used will be explained, and then an example of a mode in which the learning type information is used will be explained.
  • the model generation unit 22 receives data on population trends, which is population information for learning, from the learning acquisition unit 21. As shown in FIG. 4, the model generation unit 22 performs machine learning to generate an encoder-decoder model using data on population trends as input values to the encoder-decoder model and output values (correct answers) of the encoder-decoder model. do.
  • the above machine learning itself for generating the encoder/decoder model can be performed in the same manner as conventional machine learning methods. The above is an example where learning type information is not used.
  • the model generation unit 22 receives a type code as learning type information from the learning acquisition unit 21 along with population change data. In this case, the model generation unit 22 generates an encoder/decoder model that also inputs the type code.
  • FIG. 5 shows an example of this encoder/decoder model.
  • this encoder/decoder model includes neurons corresponding to type codes in the input layer and the output layer.
  • the model generation unit 22 associates the type code of the area with data on the area and daily population trends, as shown in FIG. 6(a). This association is performed using the mesh code as a key. As shown in FIG. 5, the model generation unit 22 inputs the associated population change data and type code (data D1 shown in FIG. 6(a)) to the encoder/decoder model, and As the output value (correct answer), machine learning is performed to generate an encoder/decoder model.
  • the model generation unit 22 may generate a plurality of encoder/decoder models according to the type code. For example, the model generation unit 22 may generate an encoder/decoder model for each type code. The model generation unit 22 uses data on areas with the same type code and daily population trends as shown in FIG. 6(b) to generate one encoder-decoder model. That is, the model generation unit 22 filters the population change data for each type code, and uses the filtered population change data to generate an encoder/decoder model.
  • the model generation unit 22 may generate an encoder/decoder model (an encoder/decoder model that does not input a type code) that inputs only population change data as shown in FIG. 4.
  • the model generation unit 22 performs machine learning to generate an encoder-decoder model by using the population change data as an input value to the encoder-decoder model and as an output value (correct answer) of the encoder-decoder model.
  • the model generation unit 22 may generate an encoder/decoder model that also inputs a type code in addition to the population change data as shown in FIG.
  • the model generation unit 22 inputs the data on population trends and the type code (data D2 shown in FIG. 6(b)) that are associated with each other to the encoder/decoder model, and As the output value (correct answer), machine learning is performed to generate an encoder/decoder model.
  • the model generation unit 22 performs machine learning as described above for each type code to generate an encoder/decoder model for each type code.
  • the model generation unit 22 outputs the generated encoder/decoder model to the population status determination system 10.
  • the model generation unit 22 When the model generation unit 22 generates an encoder/decoder model for each type code, it also outputs the type code corresponding to each encoder/decoder model to the population state determination system 10.
  • the above are the functions of the model generation system 20 according to this embodiment.
  • the population state determination system 10 includes an acquisition section 11, a model calculation section 12, a determination section 13, and a determination criterion generation section 14.
  • the acquisition unit 11 is a functional unit that acquires population information indicating the time-series population of an area whose population status is to be determined.
  • the acquisition unit 11 acquires the above-mentioned population information of the area and time zone to be determined.
  • the acquisition unit 11 may acquire type information indicating the type of area whose population status is to be determined.
  • the acquisition unit 11 receives the designation of the area and time period (date) to be determined from the user of the population status determination system 10, and acquires the population information related to the designated area and time period for the above-mentioned learning purpose.
  • the information is acquired in the same manner as the learning population information is acquired by the acquisition unit 21.
  • the acquisition unit 11 may acquire type information indicating the type of area whose population status is to be determined.
  • the acquisition unit 11 acquires the same type information as the learning type information acquired by the learning acquisition unit 21 for the area related to the population information to be acquired. For example, when the learning acquisition unit 21 acquires the pre-stored learning type information shown in FIG. Obtain the type code corresponding to as type information.
  • the acquisition unit 11 acquires areas related to population information from information on the correspondence between mesh codes and type codes stored in the computer 1 as a result of the clustering. Obtain the type code corresponding to the mesh code as type information.
  • the acquisition unit 11 outputs the acquired population information to the model calculation unit 12 and determination unit 13. Further, when acquiring type information, the acquiring unit 11 also outputs the acquired type information to the model calculation unit 12.
  • the model calculation unit 12 is a functional unit that inputs the population information acquired by the acquisition unit 11 into a pre-stored encoder/decoder model, performs calculations, and obtains an output from the encoder/decoder model.
  • the model calculation unit 12 may perform calculation using an encoder/decoder model based on the type information acquired by the acquisition unit 11.
  • the model calculation unit 12 may also input type information to the encoder/decoder model and obtain an output from the encoder/decoder model.
  • the model calculation unit 12 may select an encoder/decoder model to be used for calculation from a plurality of encoder/decoder models stored in advance based on the type information, and perform calculation using the selected encoder/decoder model.
  • the model calculation unit 12 receives and stores the encoder/decoder model generated by the model generation system 20.
  • the model calculation unit 12 receives population information from the acquisition unit 11 .
  • the model calculation unit 12 uses the population information as an input value to the encoder-decoder model, performs calculation using the weight w of the encoder-decoder model, and obtains an output value from the encoder-decoder model.
  • the output value from the encoder-decoder model is reconstructed data of population change data, which is population information, and is information in the same format as population information.
  • a graph G2 is shown as an example of an output value when the population information shown by the graph G1 shown in FIG. 2 is used as an input value.
  • the model calculation unit 12 receives the type information from the acquisition unit 11 and performs the following processing. In this case, for example, as described above, the model generation system 20 generates an encoder/decoder model that also inputs type information.
  • the model calculation unit 12 uses population information and type information as input values to the encoder-decoder model, performs calculations using the weight w of the encoder-decoder model, and obtains an output value from the encoder-decoder model.
  • the model generation system 20 generates a plurality of encoder/decoder models corresponding to the type code.
  • the model calculation unit 12 selects an encoder/decoder model corresponding to the type code that is the input type information from among the plurality of encoder/decoder models.
  • the model calculation unit 12 uses the selected encoder/decoder model to obtain an output value from the encoder/decoder model in the same manner as described above.
  • the model calculation unit 12 outputs the output value from the obtained encoder/decoder model to the determination unit 13. Note that the output value outputted to the determination unit 13 may be only the portion corresponding to the population information.
  • the determination unit 13 is a functional unit that compares the population information acquired by the acquisition unit 11 and the output obtained by the model calculation unit 12 to determine the state of the population of the area.
  • the determination by the determination unit 13 is, for example, determination as to whether the population in the area to be determined is in an abnormal state different from normal times, as described above. However, other determinations may be made as long as the determination can be made by comparing the population information input to the encoder/decoder model and the output from the encoder/decoder model.
  • the determination unit 13 determines the population status of the area as follows.
  • the determination unit 13 receives population information from the acquisition unit 11.
  • the determination unit 13 receives an output value corresponding to the above population information from the model calculation unit 12.
  • the determination unit 13 receives input to the encoder/decoder model (population transition data, for example, graph G1 in FIG. 2) and output from the encoder/decoder model (restored data of population transition data, for example, the graph in FIG. 2). G2) and calculate the error as the degree of abnormality.
  • the determination unit 13 calculates the absolute value of the difference between the input and output in each time period for each hour, and uses the sum of all time periods as the error.
  • the determination unit 13 compares the calculated error with a preset threshold. If the error is greater than or equal to the threshold, the determining unit 13 determines that the population in the area to be determined is in an abnormal state. In this case, it is presumed that a phenomenon different from normal times, such as an event, is occurring in the area to be determined. If the error is not equal to or greater than the threshold, the determining unit 13 determines that the population in the area to be determined is not in an abnormal state.
  • the above determination utilizes the fact that when an encoder/decoder model is generated by machine learning using only normal data, it cannot be successfully restored if abnormal data is input to the encoder/decoder model. Therefore, during normal times, the determination is based on the learning population information used when the model generation system 20 generates the encoder/decoder model.
  • the determination unit 13 outputs information indicating the determination result.
  • the determination unit 13 may display the determination result on a display device included in the computer 1 so that the user can refer to the determination result.
  • the determination unit 13 may transmit information indicating the determination result to another device.
  • the determination unit 13 may output information indicating the determination result to an output destination other than the above using a method other than the above.
  • the determination criterion generation unit 14 is a functional unit that generates determination criteria used for determination by the determination unit 13.
  • the determination criterion generation unit 14 generates first population information for determination criterion generation in a first state in the same area and in a second state different from the first state. , as well as second population information for determination criterion generation in the first state of the area to be determined, and transmit the acquired first and second population information to an encoder for determination criterion generation stored in advance.
  • An input is input to a decoder model, a calculation is performed, an output is obtained from the encoder/decoder model, the input and output to the encoder/decoder model are compared, and a determination criterion is generated based on the comparison result.
  • the first state may be a normal state
  • the second state may be an abnormal state.
  • the determination unit 13 may use a threshold value as a determination criterion to determine whether the population is in an abnormal state different from normal times, and the determination criterion generation unit 14 may generate the threshold value.
  • the determination criterion generation unit 14 generates a threshold value from the ratio of values based on the comparison results in the first state and the second state for the first population information, and the value based on the comparison results for the second population information. You may.
  • the determination criterion generation unit 14 may acquire the first population information of each of the plurality of areas, and generate the threshold value from the statistical value of the ratio of values based on the comparison results of each of the plurality of areas.
  • the determination criterion generation unit 14 inputs the first population information into an encoder/decoder model for determination criterion generation generated by machine learning from the first population information for determination criterion generation in the first state,
  • the second population information may be input into an encoder/decoder model for determination criterion generation that is generated by machine learning from the second population information for determination criterion generation.
  • the determination criterion generation unit 14 generates a threshold value, which is a determination criterion used in the determination by the determination unit 13, for each area to be determined. For example, the determination criterion generating section 14 generates the determination criterion as follows prior to the determination by the determining section 13.
  • the determination criterion generation unit 14 acquires first population information and second population information that are population information for determination criterion generation.
  • FIG. 7 schematically shows the first population information and the second population information.
  • the learning example shown in FIG. 7 is the first population information
  • the test example is the second population information.
  • the learning example and the test example may include a plurality of pieces of individual population information in the same format as the population information used to determine the state of the population.
  • the learning example is composed of, for example, population information of multiple areas.
  • “Case 1”, “Case 2”, . . . “Case N-1” shown in FIG. 7 are population information for each case.
  • the plurality of cases are different from each other in either area or time.
  • the population information for each case which is a learning example, includes population information in a plurality of units, including population information in a first state in normal times and population information in an abnormal time in a second state.
  • the unit of the population information is the same as the population information used for determining the state of the population or generating the encoder/decoder model, and is, for example, in units of one day as described above.
  • the graph shown in FIG. 7 shows the population information of one case, which is a learning case. In this graph, the horizontal axis is time and the vertical axis is population.
  • the population information at the time of abnormality among the learning examples is, for example, the population information on the day when an event occurred in the area corresponding to the population information, as shown in FIG. This is because the population trends in the area on the day the event occurred are excessively different from the population trends in normal times.
  • the population information during normal times in the learning examples is based on multiple days (for example, about 30 days) before the day when an event occurred in the area (no event occurred in the area). ) population information.
  • the graph in FIG. 7 collectively shows population information during abnormal times on one consecutive day and population information during normal times on multiple days. It is possible to identify in advance whether the population information of the learning case is related to abnormal times or normal times.
  • the learning example for each case includes one day's worth of population information during abnormal times and multiple days' worth of population information during normal times.
  • the learning examples for each area may include population information during abnormal times for multiple days, or may include population information during normal times for only one day.
  • the test example is composed of, for example, population information of the area to be determined by the determination unit 13.
  • the area related to population information is the target of determination, but the population information itself is not the target of determination.
  • "Case N" shown in FIG. 7 is population information of the area to be determined.
  • the population information of the area to be determined which is a test example, includes population information in a normal state, which is the first state.
  • the unit of the population information is the same as the population information used for determining the state of the population or generating the encoder/decoder model, and is, for example, in units of one day as described above.
  • the normal population information in the test case is population information for multiple days (for example, about 30 days) when no events occur in the area to be determined. In this way, the test case includes population information during normal times for multiple days. Note that the test example may include only one day's worth of normal population information.
  • the judgment criterion generation unit 14 receives learning examples and test cases, which are population information for judgment criterion generation, in the same manner as the above-described acquisition of learning population information by the learning acquisition unit 21 or acquisition of population information by the acquisition unit 11. get.
  • the criterion generation unit 14 generates a threshold value from the acquired learning examples and test examples as follows.
  • the judgment criterion generation unit 14 generates an encoder/decoder model for judgment criterion generation by machine learning from normal population information among the learning examples.
  • the encoder/decoder model for generating the determination criteria may be in the same format as the encoder/decoder model used for determination by the determination unit 13.
  • the generation of the encoder/decoder model for generating the determination criteria may be performed in the same manner as the generation of the encoder/decoder model by the model generation unit 22 described above.
  • the determination criterion generation unit 14 stores the generated encoder/decoder model for determination criterion generation, and uses it to generate a threshold value.
  • the encoder/decoder model used for the determination by the determination unit 13 may be an encoder/decoder model for generating determination criteria.
  • the judgment criterion generation unit 14 inputs the population information for each day of population information included in the learning example into the encoder/decoder model for judgment criterion generation as an input value to the encoder/decoder model for judgment criterion generation. A calculation using the weight w is performed to obtain an output value from the encoder/decoder model for generating the criterion. The judgment criterion generation unit 14 compares the input to the encoder/decoder model for judgment criterion generation with the output from the encoder/decoder model for judgment criterion generation, and calculates an abnormality score which is an error as the abnormality degree. do.
  • the criterion generation unit 14 calculates the absolute value of the difference between the input and output for each hourly time period, and sets the sum of all time periods as the abnormality score, which is the error. This calculation of the error is performed in the same manner as the calculation of the error used in the determination by the determination unit 13 described above.
  • the judgment criterion generation unit 14 calculates the maximum value of the abnormality score during normal times (before the event) and the maximum value during abnormality using the following formula for each case i (Case 1 to Case N-1) of the learning examples from the calculated abnormality score.
  • the ratio ⁇ i of the maximum abnormality score (after the event) is calculated.
  • R i before is each abnormality score on a daily basis during normal times (before the event) of case i
  • max(R i before ) is the maximum value thereof for each case i.
  • R i after is each abnormality score on a daily basis at the time of abnormality (after the event) of case i
  • max(R i after ) is their maximum value for each case i.
  • the ratio ⁇ i is the ratio of the maximum values based on the comparison results of the input and output of the encoder/decoder model for generating the criterion in normal times and abnormal times for the learning example.
  • a value other than the maximum value of the abnormality score for each case i may be used as described above.
  • a preset quantile of the abnormality score for each case i may be used.
  • the criterion generation unit 14 calculates the shaded ⁇ from the statistical values of ⁇ i of the plurality of cases i. For example, in the case where the token ⁇ is an average value, the determination criterion generation unit 14 calculates the bracketd ⁇ using the following formula. Note that the bracketd ⁇ may be a statistical value of ⁇ i of a plurality of cases other than the average value, and may be, for example, a median value, a preset quantile, or the like.
  • the judgment criterion generation unit 14 generates an encoder/decoder model for judgment criterion generation (different from the one generated from the learning example) by machine learning from the normal population information that is the test case.
  • the encoder/decoder model for generating the determination criteria may also have the same format as the encoder/decoder model used for determination by the determination unit 13.
  • the generation of the encoder/decoder model for generating the determination criteria may be performed in the same manner as the generation of the encoder/decoder model by the model generation unit 22 described above.
  • the determination criterion generation unit 14 stores the generated encoder/decoder model for determination criterion generation, and uses it to generate a threshold value. Note that the encoder/decoder model used for the determination by the determination unit 13 may be the encoder/decoder model for generating this determination criterion.
  • the judgment criterion generation unit 14 inputs the population information for each day of population information included in the test case into the encoder/decoder model for judgment criterion generation as an input value to the encoder/decoder model for judgment criterion generation. A calculation using the weight w is performed to obtain an output value from the encoder/decoder model for generating the criterion. The judgment criterion generation unit 14 compares the input to the encoder/decoder model for judgment criterion generation with the output from the encoder/decoder model for judgment criterion generation, and calculates an abnormality score which is an error as the abnormality degree. do.
  • the criterion generation unit 14 calculates the absolute value of the difference between the input and output for each hourly time period, and sets the sum of all time periods as the abnormality score, which is the error. This calculation of the error is performed in the same manner as the calculation of the error used in the determination by the determination unit 13 described above.
  • the criterion generation unit 14 calculates the maximum value max (R N before ) of the abnormality score R N before of the test case from the calculated abnormality score.
  • the determination criterion generation unit 14 calculates a threshold value threshold N from the above calculated value using the following formula.
  • the determination criterion generation unit 14 outputs the calculated threshold value threshold N to the determination unit 13.
  • the determination unit 13 receives the threshold value threshold N from the determination criterion generation unit 14, and uses the input threshold value threshold N to determine the population of the area as described above.
  • the maximum value of the abnormality score of each case it is possible to perform a determination based on a threshold value based on the case where the abnormality degree score is the maximum value.
  • the threshold from the shaded ⁇ , which is the statistical value of the anomaly score of multiple learning examples, which is the threshold coefficient, and the maximum value of the anomaly score of the test cases, we can calculate the A threshold value suitable for determination in the determination target area can be set in consideration of the population.
  • the encoder/decoder model for generating the above-mentioned criteria may be for each city, ward, town, or village, or for each prefecture, or for each region within a prefecture.
  • the areas related to the learning cases (“Case 1”, “Case 2”, . . . “Case N-1”) may or may not include the areas related to the test cases.
  • the area related to the learning example may be set as the area of Tokyo, Chiba prefecture, and Saitama prefecture
  • the test case may be set as the area of Kanagawa prefecture, and anomaly detection may be performed in the area of Kanagawa prefecture (if applied to another area) ).
  • the area related to the learning example may be the area of Tokyo, Chiba prefecture, and Saitama prefecture
  • the test example may be the area of Tokyo
  • anomaly detection may be performed in the area of Tokyo (if applied to the same area). . Since this embodiment aims to consider the characteristics of an area, it is expected that an appropriate threshold value can be set especially when applied to another area.
  • the threshold value may also be generated by the determination criterion generation unit 14 using the type information.
  • the method of using the type information by the determination criterion generation section 14 may be the same as that used by the determination section 13. The above are the functions of the population status determination system 10 according to this embodiment.
  • learning population information is acquired by the learning acquisition unit 21 (S01).
  • learning type information is acquired by the learning acquisition unit 21 (S02).
  • acquisition of learning type information (S02) may not be performed.
  • the model generation unit 22 performs machine learning based on the learning population information to generate an encoder/decoder model (S03).
  • an encoder/decoder model is generated based on the learning type information.
  • the generated encoder/decoder model is output to the population status determination system 10 and stored by the model calculation unit 12. The above is the process executed by the model generation system 20 according to this embodiment.
  • the criterion generating section 14 generates a threshold value that is a criterion used in the determination by the determining section 13 (S11).
  • S11 a threshold value used in the determination by the determining section 13
  • An example of the process of generating a threshold value (S11), which is a determination criterion, by the determination criterion generation unit 14 will be described using the flowchart of FIG. 10.
  • a learning example and a test example are acquired (S111). Subsequently, machine learning is performed using the normal population information of the learning case, and an encoder/decoder model for generating a criterion is generated (S112). Subsequently, each piece of population information of the learning example is input to the encoder/decoder model for determination criterion generation generated in S112, calculation is performed, and an output from the encoder/decoder model is obtained (S113). Subsequently, the input to the encoder/decoder model is compared with the output from the encoder/decoder model, and an abnormality score for each population information of the learning example is calculated (S114).
  • ⁇ i for each example i of the learning examples is calculated from the calculated abnormality score (S115). Subsequently, substituted ⁇ is calculated from the statistical values of ⁇ i of the plurality of cases i (S116).
  • population information and type information are acquired by the acquisition unit 11 (S12). Note that in an embodiment in which type information is not used, type information does not need to be acquired.
  • the model calculation unit 12 inputs the population information to the encoder/decoder model, performs calculations, and obtains an output from the encoder/decoder model (S13). Furthermore, in an embodiment where type information is used, calculations using an encoder/decoder model are performed based on the type information.
  • the determination unit 13 compares the input to the encoder/decoder model and the output from the encoder/decoder model (S14). Subsequently, the determination unit 13 determines the population status of the area based on the above comparison (S15). Subsequently, the determination unit 13 outputs information indicating the determination result (S16).
  • the above is the process executed by the population status determination system 10 according to this embodiment.
  • the population state determination system 10 since time-series population information is used, it is possible to determine the population state in consideration of the time-series population of an area. Further, the input to the encoder/decoder model and the output are compared to make a determination. Furthermore, appropriate criteria are generated based on the learning examples and test examples, which are the first and second population information for generating criteria, and used for the determination. The determination criteria generated in this manner take into consideration the characteristics of population trends in each area, as described above. Therefore, according to the population status determination system 10 according to the present embodiment, the population status can be appropriately determined with high accuracy by using appropriate criteria according to the area to be determined.
  • the first state may be a normal state
  • the second state may be an abnormal state
  • the determination criterion is a threshold value
  • the determination of the area to be determined may be a determination of whether the population is in an abnormal state different from normal times. According to this configuration, it is possible to appropriately detect abnormalities in population trends in the area to be determined, as in the present embodiment.
  • the first state and the second state do not necessarily need to be as described above, and may be any two states related to the determination of the state of the population.
  • the generated determination criterion may be other than the threshold value, and determinations other than those described above may be performed.
  • the value ⁇ i of the ratio of the abnormality score which is the comparison result of the input and output of the encoder/decoder model for judgment criterion generation in the learning example, and An anomaly score R N before may be used.
  • the threshold value can be appropriately and reliably generated, and as a result, the state of the population can be appropriately and reliably determined.
  • the learning examples may relate to multiple areas.
  • the shaded ⁇ used for calculating the threshold value can be set in consideration of a plurality of areas, and the threshold value can be made more appropriate.
  • the generation of the threshold value does not necessarily need to be performed as described above, and may be performed using the first and second population information for generating the criterion, such as learning examples and test examples.
  • the encoder/decoder models for generating the criterion used for generating the criterion may be generated by machine learning from the first and second population information for generating the criterion, as described above. According to this configuration, the determination criteria can be generated appropriately and reliably.
  • the encoder/decoder models for generating judgment criteria do not necessarily have to be generated by machine learning from the first and second population information for generating judgment criteria, and can be used to generate judgment criteria. It can be anything as long as it is possible.
  • type information may be used as in the embodiment described above.
  • the type information it is possible to appropriately determine the state of the population according to the characteristics of the area. For example, it is possible to make a determination that takes into account the functional characteristics of a city, such as an office area or a residential area. This makes it possible to perform more accurate and appropriate determinations than determinations based on average population changes that do not take type information into consideration.
  • the type information may be used as input to the encoder/decoder model as described above.
  • the encoder/decoder model used for calculation may be selected based on the type information. According to such a configuration, type information can be used reliably and appropriately, and determination can be performed reliably and appropriately.
  • the type information may be used in a method other than the above. Further, type information does not necessarily need to be used.
  • an encoder/decoder model used in the population status determination system 10 can be generated. Also, when generating an encoder/decoder model, learning type information corresponding to the type information may be used. Further, the learning type information may be obtained by performing clustering using the learning population information as described above. According to this configuration, even if type information is not associated with an area in advance, it is possible to generate an encoder/decoder model based on the area type and to make a determination using the encoder/decoder model.
  • the computer 1 includes the population status determination system 10 and the model generation system 20, but the population status determination system 10 and the model generation system 20 may be implemented independently. may be done.
  • each functional block may be realized using one physically or logically coupled device, or may be realized using two or more physically or logically separated devices directly or indirectly (e.g. , wired, wireless, etc.) and may be realized using a plurality of these devices.
  • the functional block may be realized by combining software with the one device or the plurality of devices.
  • Functions include judgment, decision, judgment, calculation, calculation, processing, derivation, investigation, exploration, confirmation, reception, transmission, output, access, resolution, selection, selection, establishment, comparison, assumption, expectation, consideration, These include, but are not limited to, broadcasting, notifying, communicating, forwarding, configuring, reconfiguring, allocating, mapping, and assigning. I can't.
  • a functional block (configuration unit) that performs transmission is called a transmitting unit or transmitter. In either case, as described above, the implementation method is not particularly limited.
  • the computer 1 in an embodiment of the present disclosure may function as a computer that performs information processing of the present disclosure.
  • FIG. 11 is a diagram illustrating an example of the hardware configuration of the computer 1 according to an embodiment of the present disclosure.
  • the computer 1 described above may be physically configured as a computer device including a processor 1001, a memory 1002, a storage 1003, a communication device 1004, an input device 1005, an output device 1006, a bus 1007, and the like.
  • the word “apparatus” can be read as a circuit, a device, a unit, etc.
  • the hardware configuration of the computer 1 may be configured to include one or more of each device shown in the figure, or may be configured not to include some of the devices.
  • Each function in the computer 1 is performed by loading predetermined software (programs) onto hardware such as the processor 1001 and memory 1002, so that the processor 1001 performs calculations, controls communication by the communication device 1004, and controls communication between the memory 1002 and the memory 1002. This is realized by controlling at least one of reading and writing data in the storage 1003.
  • the processor 1001 for example, operates an operating system to control the entire computer.
  • the processor 1001 may be configured by a central processing unit (CPU) including an interface with peripheral devices, a control device, an arithmetic unit, registers, and the like.
  • CPU central processing unit
  • each function in the computer 1 described above may be realized by the processor 1001.
  • the processor 1001 reads programs (program codes), software modules, data, etc. from at least one of the storage 1003 and the communication device 1004 to the memory 1002, and executes various processes in accordance with these.
  • programs program codes
  • software modules software modules
  • data etc.
  • the program a program that causes a computer to execute at least part of the operations described in the above embodiments is used.
  • each function in the computer 1 may be realized by a control program stored in the memory 1002 and operated in the processor 1001.
  • Processor 1001 may be implemented by one or more chips. Note that the program may be transmitted from a network via a telecommunications line.
  • the memory 1002 is a computer-readable recording medium, and includes at least one of ROM (Read Only Memory), EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable Programmable ROM), and RAM (Random Access Memory). may be done.
  • Memory 1002 may be called a register, cache, main memory, or the like.
  • the memory 1002 can store executable programs (program codes), software modules, and the like to implement information processing according to an embodiment of the present disclosure.
  • the storage 1003 is a computer-readable recording medium, such as an optical disk such as a CD-ROM (Compact Disc ROM), a hard disk drive, a flexible disk, or a magneto-optical disk (for example, a compact disk, a digital versatile disk, or a Blu-ray disk). (registered trademark disk), smart card, flash memory (eg, card, stick, key drive), floppy disk, magnetic strip, etc.
  • Storage 1003 may also be called an auxiliary storage device.
  • the storage medium included in the computer 1 may be, for example, a database including at least one of the memory 1002 and the storage 1003, a server, or other appropriate medium.
  • the communication device 1004 is hardware (transmission/reception device) for communicating between computers via at least one of a wired network and a wireless network, and is also referred to as a network device, network controller, network card, communication module, etc., for example.
  • the input device 1005 is an input device (eg, keyboard, mouse, microphone, switch, button, sensor, etc.) that accepts input from the outside.
  • the output device 1006 is an output device (for example, a display, a speaker, an LED lamp, etc.) that performs output to the outside. Note that the input device 1005 and the output device 1006 may have an integrated configuration (for example, a touch panel).
  • each device such as the processor 1001 and the memory 1002 is connected by a bus 1007 for communicating information.
  • the bus 1007 may be configured using a single bus, or may be configured using different buses for each device.
  • the computer 1 also includes hardware such as a microprocessor, a digital signal processor (DSP), an application specific integrated circuit (ASIC), a programmable logic device (PLD), and a field programmable gate array (FPGA).
  • DSP digital signal processor
  • ASIC application specific integrated circuit
  • PLD programmable logic device
  • FPGA field programmable gate array
  • a part or all of each functional block may be realized by the hardware.
  • processor 1001 may be implemented using at least one of these hardwares.
  • the input/output information may be stored in a specific location (for example, memory) or may be managed using a management table. Information etc. to be input/output may be overwritten, updated, or additionally written. The output information etc. may be deleted. The input information etc. may be transmitted to other devices.
  • Judgment may be made using a value expressed by 1 bit (0 or 1), a truth value (Boolean: true or false), or a comparison of numerical values (for example, a predetermined value). (comparison with a value).
  • notification of prescribed information is not limited to being done explicitly, but may also be done implicitly (for example, not notifying the prescribed information). Good too.
  • Software includes instructions, instruction sets, code, code segments, program code, programs, subprograms, software modules, whether referred to as software, firmware, middleware, microcode, hardware description language, or by any other name. , should be broadly construed to mean an application, software application, software package, routine, subroutine, object, executable, thread of execution, procedure, function, etc.
  • software, instructions, information, etc. may be sent and received via a transmission medium.
  • a transmission medium For example, if the software uses wired technology (coaxial cable, fiber optic cable, twisted pair, digital subscriber line (DSL), etc.) and/or wireless technology (infrared, microwave, etc.) to create a website, When transmitted from a server or other remote source, these wired and/or wireless technologies are included within the definition of transmission medium.
  • wired technology coaxial cable, fiber optic cable, twisted pair, digital subscriber line (DSL), etc.
  • wireless technology infrared, microwave, etc.
  • system and “network” are used interchangeably.
  • information, parameters, etc. described in this disclosure may be expressed using absolute values, relative values from a predetermined value, or using other corresponding information. may be expressed.
  • determining may encompass a wide variety of operations.
  • “Judgment” and “decision” include, for example, judging, calculating, computing, processing, deriving, investigating, looking up, search, and inquiry. (e.g., searching in a table, database, or other data structure), and regarding an ascertaining as a “judgment” or “decision.”
  • judgment and “decision” refer to receiving (e.g., receiving information), transmitting (e.g., sending information), input, output, and access.
  • (accessing) may include considering something as a “judgment” or “decision.”
  • judgment and “decision” refer to resolving, selecting, choosing, establishing, comparing, etc. as “judgment” and “decision”. may be included.
  • judgment and “decision” may include regarding some action as having been “judged” or “determined.”
  • judgment (decision) may be read as “assuming", “expecting", “considering”, etc.
  • connection refers to any connection or coupling, direct or indirect, between two or more elements and to each other. It may include the presence of one or more intermediate elements between two elements that are “connected” or “coupled.”
  • the bonds or connections between elements may be physical, logical, or a combination thereof. For example, "connection” may be replaced with "access.”
  • two elements may include one or more electrical wires, cables, and/or printed electrical connections, as well as in the radio frequency domain, as some non-limiting and non-inclusive examples. , electromagnetic energy having wavelengths in the microwave and optical (both visible and non-visible) ranges.
  • the phrase “based on” does not mean “based solely on” unless explicitly stated otherwise. In other words, the phrase “based on” means both “based only on” and “based at least on.”
  • any reference to elements using the designations "first,” “second,” etc. does not generally limit the amount or order of those elements. These designations may be used in this disclosure as a convenient way to distinguish between two or more elements. Thus, reference to a first and second element does not imply that only two elements may be employed or that the first element must precede the second element in any way.
  • a and B are different may mean “A and B are different from each other.” Note that the term may also mean that "A and B are each different from C”. Terms such as “separate” and “coupled” may also be interpreted similarly to “different.”
  • the population status determination system of the present disclosure has the following configuration.
  • An acquisition unit that acquires population information indicating a time-series population of an area whose population status is to be determined; a model calculation unit that inputs the population information acquired by the acquisition unit into a pre-stored encoder/decoder model that compresses and restores input data, performs calculations, and obtains an output from the encoder/decoder model; a determination unit that compares the population information acquired by the acquisition unit and the output obtained by the model calculation unit to determine the state of the population of the area; a determination criterion generation unit that generates a determination criterion used in the determination by the determination unit, The determination criterion generation unit generates population information for determination criterion generation, the first population information for determination criterion generation in each of a first state in the same area and a second state different from the first state.
  • the determination unit determines whether the population is in an abnormal state different from normal times, using a threshold value as the determination criterion;
  • the population status determination system according to [2], wherein the determination criterion generation unit generates the threshold value.
  • the determination criterion generation unit generates a ratio of values based on the comparison results in the first state and the second state for the first population information, and a value based on the comparison results for the second population information.
  • the population status determination system according to [3], which generates the threshold value from.
  • the criterion generation unit obtains first population information for each of the plurality of areas, and generates the threshold from a statistical value of a ratio of values based on the comparison results for each of the plurality of areas.
  • the judgment criterion generation unit inputs the first population information to an encoder/decoder model for judgment criterion generation, which is generated by machine learning from the first population information for judgment criterion generation in the first state.
  • input the second population information to the encoder/decoder model for judgment criterion generation generated by machine learning from the second population information for judgment criterion generation. Described population status determination system.
  • the acquisition unit acquires type information indicating the type of area whose population status is to be determined;
  • the population status determination system according to any one of [1] to [6], wherein the model calculation unit performs calculation using the encoder/decoder model based on the type information acquired by the acquisition unit.
  • the model calculation unit selects an encoder/decoder model to be used for calculation from a plurality of pre-stored encoder/decoder models based on the type information, and performs calculation using the selected encoder/decoder model.
  • the population status determination system according to [7] or [8].

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

人口の状態を適切に判定する。 人口状態判定システム10は、人口の状態の判定対象となるエリアの時系列の人口を示す人口情報を取得する取得部11と、取得部11によって取得された人口情報を、入力データを圧縮して復元する予め記憶したエンコーダ・デコーダモデルに入力して演算を行って、当該エンコーダ・デコーダモデルからの出力を得るモデル演算部12と、取得部11によって取得された人口情報と、モデル演算部12によって得られた出力とを比較して、エリアの人口の状態を判定する判定部13と、判定部13による判定に用いられる判定基準を生成する判定基準生成部14とを備え、判定基準生成部14は、判定基準生成用の人口情報を、予め記憶した判定基準生成用のエンコーダ・デコーダモデルに入力して演算を行って判定基準を生成する。

Description

人口状態判定システム
 本発明は、エリアの人口の状態を判定する人口状態判定システムに関する。
 従来、携帯電話機等の携帯端末のデータを用いて、エリア及び時間帯毎の人口を推定する技術が提案されている(例えば、特許文献1参照)。
特開2020-123011号公報
 上記の推定された人口の情報を用いて、人口が平常時よりも多い等の人口が異常であるエリアを検出することができる。これによって、突発的なイベントの検出を行うことができたり、災害時に多くの人が滞留している場所を発見できたりすることができる。
 人口の異常検知の方法として、エリア及び時間帯での人口の平均及び分散をもとにした統計的な手法によるものがある。この方法では、あるエリア及び時間帯での異常を検知することができる。しかしながら、この方法は、人口推移を考慮したものでなく、必ずしも高精度に異常を検出することができない。
 本発明の一実施形態は、上記に鑑みてなされたものであり、人口の状態を適切に判定することができる人口状態判定システムを提供することを目的とする。
 上記の目的を達成するために、本発明の一実施形態に係る人口状態判定システムは、人口の状態の判定対象となるエリアの時系列の人口を示す人口情報を取得する取得部と、取得部によって取得された人口情報を、入力データを圧縮して復元する予め記憶したエンコーダ・デコーダモデルに入力して演算を行って、当該エンコーダ・デコーダモデルからの出力を得るモデル演算部と、取得部によって取得された人口情報と、モデル演算部によって得られた出力とを比較して、エリアの人口の状態を判定する判定部と、判定部による判定に用いられる判定基準を生成する判定基準生成部と、を備え、判定基準生成部は、判定基準生成用の人口情報であって、同一エリアの第1の状態及び第1の状態とは異なる第2の状態それぞれでの判定基準生成用の第1の人口情報、並びに判定対象となるエリアの第1の状態での判定基準生成用の第2の人口情報を取得し、取得した第1及び第2の人口情報を、予め記憶した判定基準生成用のエンコーダ・デコーダモデルに入力して演算を行って、当該エンコーダ・デコーダモデルからの出力を得て、当該エンコーダ・デコーダモデルへの入力と出力とを比較して、比較結果に基づいて判定基準を生成する。
 本発明の一実施形態に係る人口状態判定システムによれば、エリアの時系列の人口を考慮した人口の状態を判定することができる。また、エンコーダ・デコーダモデルへの入力と、出力とが比較されて判定が行われる。また、判定基準生成用の第1及び第2の人口情報に基づいた適切な判定基準が生成されて、判定に用いられる。従って、本発明の一実施形態に係る人口状態判定システムによれば、人口の状態を適切に判定することができる。
 本発明の一実施形態によれば、人口の状態を適切に判定することができる。
本発明の実施形態に係る人口状態判定システム及びモデル生成システムであるコンピュータの構成を示す図である。 人口情報、及び当該人口情報を入力値とした場合のエンコーダ・デコーダモデルからの出力値の例のグラフである。 コンピュータで用いられる情報の例を示す図である。 コンピュータで生成及び利用されるエンコーダ・デコーダモデルの例を模式的に示す図である。 コンピュータで生成及び利用されるエンコーダ・デコーダモデルの別の例を模式的に示す図である。 コンピュータで用いられる情報の例を示す図である。 判定基準の生成に用いられる判定基準生成用の第1及び第2の人口情報である学習事例及びテスト事例を模式的に示す図である。 本発明の実施形態に係るモデル生成システムで実行される処理を示すフローチャートである。 本発明の実施形態に係る人口状態判定システムで実行される処理を示すフローチャートである。 本発明の実施形態に係る人口状態判定システムで判定基準生成の際に実行される処理を示すフローチャートである。 本発明の実施形態に係る人口状態判定システム及びモデル生成システムであるコンピュータのハードウェア構成を示す図である。
 以下、図面と共に本発明に係る人口状態判定システムの実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
 図1に本実施形態に係る人口状態判定システム10及びモデル生成システム20であるコンピュータ1を示す。人口状態判定システム10は、地理的なエリアの人口の状態を判定(推定)するシステム(装置)である。判定対象となるエリアは、例えば、地域を区切った500m四方のエリアである。当該エリアとして、2分の1地域メッシュが用いられてもよい。また、エリアとしては、市町村若しくは都道府県等の行政の区分、又は予め設定された土地利用区分が用いられてもよい。以下の説明では、エリアをメッシュとして説明する。なお、判定対象となるエリアは、上記である必要はなく、任意の地理的なエリアとすることができる。
 人口状態判定システム10による判定は、判定対象となるエリアの時系列の人口を示す人口情報に基づいて行われる。例えば、当該判定には、後述するように1日単位での1時間毎の人口を示す人口情報が用いられる。当該判定は、例えば、判定対象となるエリアにおける人口が平常時とは異なる異常な状態であるか否かの判定である。即ち、当該判定は、判定対象となるエリアにおける人口推移の異常検知を行うものである。人口が平常時とは異なる異常な状態は、例えば、人口推移が平常時の人口推移と比べて過度に異なっている状態である。上記の判定によって、例えば、突発的なイベントの検出を行うことができたり、災害時に多くの人が滞留している場所を発見できたりすることができる。なお、人口状態判定システム10による判定は、異常な状態であるか否かの判定ではなく、異常な度合いの判定であってもよい。あるいは、人口状態判定システム10による判定は、エリアの人口の状態の判定であれば上記以外のものであってもよい。
 後述するように、人口状態判定システム10による判定は、人口情報に対して、機械学習によって生成される学習済モデルであるエンコーダ・デコーダモデルを用いた演算を行うことで行われる。エンコーダ・デコーダモデルは、入力データを圧縮して復元するモデルである。モデル生成システム20は、人口状態判定システム10による判定に用いられるエンコーダ・デコーダモデルを生成するものである。
 本実施形態に係る人口状態判定システム10及びモデル生成システム20であるコンピュータ1としては、従来のコンピュータを用いることができる。また、コンピュータ1は、複数のコンピュータを含むコンピュータシステムであってもよい。
 引き続いて、本実施形態に係る人口状態判定システム10及びモデル生成システム20の機能を説明する。まず、モデル生成システム20の機能を説明して、その後に人口状態判定システム10の機能を説明する。図1に示すようにモデル生成システム20は、学習用取得部21と、モデル生成部22とを備えて構成される。
 学習用取得部21は、エンコーダ・デコーダモデルの生成に用いられる、時系列の人口を示す学習用人口情報を取得する機能部である。学習用取得部21は、学習用人口情報に係るエリアの種別を示す学習用種別情報を取得してもよい。学習用取得部21は、学習用人口情報を用いたクラスタリングを行って学習用種別情報を取得してもよい。学習用取得部21は、以下のように各情報を取得する。
 個々の学習用人口情報は、人口の状態の判定に用いられる人口情報と同様の形式の情報である。例えば、人口情報は、1日の1時間毎(0時、1時、…、23時)のエリアの人口を示す情報である。図2に人口情報の一例のグラフG1の一部を示す。このような人口情報が用いられる場合、人口状態判定システム10は、その日の判定対象のエリアの人口の状態を判定する。なお、判定対象となる人口情報の全体の時間帯(上記の例では1日)、時間間隔(上記の例では1時間毎)及び人口情報の形式は、必ずしも上記のものでなくてもよい。
 エンコーダ・デコーダモデルの生成には、多数の学習用人口情報が用いられる。多数の学習用人口情報には、通常、複数のエリアに係る学習用人口情報が含まれる。学習用取得部21は、例えば、図3(a)に示すデータを取得する。図3(a)に示すデータは、メッシュコード(「meshcode」の欄の情報)、時刻を示す情報(「timestamp」の欄の情報)及び人口を示す情報(「人口」の欄の情報)が対応付けられた情報である。メッシュコードは、エリアであるメッシュを特定する文字列等の情報であり、予めエリア毎に設定されている。時刻を示す情報は、例えば、年月日及び1日の内の何時かを示す情報である。人口を示す情報は、対応するメッシュコード及び時刻を示す情報によって示されるエリア及び時刻での人口を示す。
 図3(a)に示す人口に係るデータは、例えば、既存の方法によって、携帯電話機の位置を示す情報及び携帯電話機の契約者について登録された情報から空間統計情報として生成されている。また、図3(a)に示す人口に係るデータは、上記以外の任意の方法で生成されてもよい。学習用取得部21は、コンピュータ1又は他の装置のデータベースに予め記憶されている図3(a)に示す人口に係るデータを取得する。
 学習用取得部21は、取得したデータを図3(b)に示すようにメッシュコード毎及び1日単位での1時間毎(0時、1時、…、23時)のデータ、即ち、エリア単位での1日毎の人口推移のデータに整形する。この人口推移のデータが、学習用人口情報に相当する。学習用取得部21は、機械学習によるエンコーダ・デコーダモデルの生成に十分な数の人口推移のデータを取得する。人口推移のデータには、人口の状態の判定対象となるエリアのデータが含まれていてもよいし、含まれていなくてもよい。なお、学習用取得部21は、上記以外の時系列の人口を示す情報を学習用人口情報として取得してもよい。
 学習用取得部21は、人口推移のデータに係るエリアの種別を示す学習用種別情報を取得する態様であってもよい。エリアの種別は、当該エリアにおける人口推移に影響を及ぼし得る種別である。例えば、エリアの種別は、「オフィス街」及び「住宅街」といった都市種別である。
 例えば、学習用取得部21は、コンピュータ1又は他の装置のデータベースに予め記憶されている学習用種別情報を取得する。図3(c)に、予め記憶されている学習用種別情報であるデータの例を示す。図3(c)に示すデータは、メッシュコード(「meshcode」の欄の情報)、都市種別を示す情報(「都市種別」の欄の情報)及び種別コード(「種別コード」の欄の情報)が対応付けられた情報である。都市種別を示す情報は、対応するメッシュコードによって示されるエリアの種別の意味を示す情報である。都市種別を示す情報は、予めエリア毎に設定されている。なお、都市種別を示す情報は、モデル生成システム20における処理には用いられなくてもよいため、取得されなくてもよい。
 種別コードは、対応するメッシュコードによって示されるエリアの種別を特定する情報(エリアを示すフラグ)であり、予めエリア毎に設定されている。種別コードは、機械学習に用いることができる数値である。種別コードは、同一の都市種別であれば同一の数値、異なる都市種別であれば異なる数値である。学習用取得部21は、人口推移のデータに係るエリアのメッシュコードに対応する種別コードを学習用種別情報として取得する。
 学習用取得部21は、予め記憶されている学習用種別情報を取得するのではなく、学習用人口情報を用いたクラスタリングを行って学習用種別情報を取得してもよい。学習用取得部21は、上記のエリア単位での1日毎の人口推移のデータを用いてクラスタリングを行う。例えば以下のように、学習用取得部21は、上記のエリア単位での1日毎の人口推移のデータを用いてエリアのクラスタリングを行う。このようなクラスタリングを行うことで、人口推移が似ているエリアをクラスタに分けることができる。
 学習用取得部21は、エリア単位で時刻毎に人口の平均を取って、1つのエリアについて1つの人口推移のデータを生成する。例えば、学習用取得部21は、エリア毎に予め設定された期間(例えば、現時点の1か月前から現時点までの期間)の1日毎の人口推移のデータの時刻毎の平均を取って、エリア毎に1つの人口推移のデータを生成する。学習用取得部21は、その人口推移のデータをクラスタリングしてエリアのクラスタリングを行う。クラスタリング自体は、従来の方法(例えば、k-means法)によって行われればよい。
 あるいは、学習用取得部21は、1つのエリアについて複数の人口推移のデータを含み得る人口推移のデータをクラスタリングしてもよい。学習用取得部21は、各エリアについて、最も多く人口推移のデータを含むクラスタを当該エリアのクラスタとする。
 学習用取得部21は、クラスタ毎に異なる種別コード(クラスタ番号)を付与する。学習用取得部21は、エリアが属するクラスタの種別コードを、当該エリアに係る学習用種別情報とする。学習用取得部21は、エリア毎のメッシュコードと種別コードとの対応付けをコンピュータ1に記憶させ、人口状態判定システム10でも利用できるようにしておく。なお、クラスタリングを行って学習用種別情報が取得される場合には、都市種別を示す情報はない。
 学習用取得部21は、取得した学習用人口情報をモデル生成部22に出力する。また、学習用取得部21は、学習用種別情報を取得する態様では、取得した学習用種別情報もモデル生成部22に出力する。
 モデル生成部22は、学習用取得部21によって取得された学習用人口情報に基づいて機械学習を行って、時系列の人口を示す情報を入力するエンコーダ・デコーダモデルを生成する機能部である。モデル生成部22は、学習用取得部21によって取得された学習用種別情報に基づいて、エンコーダ・デコーダモデルを生成してもよい。モデル生成部22は、エリアの種別を示す種別情報も入力するエンコーダ・デコーダモデルを生成してもよい。モデル生成部22は、エリアの種別を示す種別情報に応じた複数のエンコーダ・デコーダモデルを生成してもよい。
 モデル生成部22によって生成されるエンコーダ・デコーダモデルを説明する。図4にエンコーダ・デコーダモデルの例を示す。エンコーダ・デコーダモデルは、ニューラルネットワークによって構成されており、エリアの時系列の人口を示す人口情報を入力して、次元圧縮を行った後、元の人口情報が出力されるように学習された学習済みモデルである。エンコーダ・デコーダモデルとしては、オートエンコーダ(Geoffrey Hinton and Salakhutdinov Ruslan,“Reducing the dimensionality of data with neural network.”Science,pp.504-507,2006)、又はTransformer(Ashish Vaswaniら、“Attention Is All You Need.”Advances in neural information processing system 2017)等が利用できる。エンコーダ・デコーダモデルの入力層には、人口情報の要素の数(人口情報の次元数)のニューロンが設けられる。人口情報が、1日の1時間毎(0時、1時、…、23時)のエリアの人口を示す情報(数値)である場合、エンコーダ・デコーダモデルの入力層には、それぞれ1時間毎のエリアの人口の数値を入力する24個のニューロン(ベクトル)が設けられる。エンコーダ・デコーダモデルの出力層には、入力層のニューロンそれぞれに対応する、入力層のニューロンと同数のニューロン(ベクトル)が設けられる。
 エンコーダ・デコーダモデルの構成自体は、従来のエンコーダ・デコーダモデルと同様のものでよい。図4に示すように、入力層と出力層との間には、複数のニューロン(ベクトル)が設けられた隠れ層が設けられている。入力層のニューロンそれぞれと隠れ層のニューロンそれぞれとは、演算に用いられる重みwが設定されて接続されている。また、隠れ層のニューロンそれぞれと出力のニューロンそれぞれとは、演算に用いられる重みwが設定されて接続されている。隠れ層に設けられるニューロンの数は、入力層及び出力層のニューロンの数より少ない。これによって、隠れ層では、次元圧縮が行われる。
 モデル生成部22は、以下のようにエンコーダ・デコーダモデルを生成する。まず、学習用種別情報が用いられない態様の例を説明し、その後、学習用種別情報が用いられる態様の例を説明する。
 モデル生成部22は、学習用取得部21から学習用人口情報である人口推移のデータを入力する。図4に示すように、モデル生成部22は、人口推移のデータをエンコーダ・デコーダモデルへの入力値及びエンコーダ・デコーダモデルの出力値(正解)として、機械学習を行ってエンコーダ・デコーダモデルを生成する。エンコーダ・デコーダモデルを生成する上記の機械学習自体は、従来の機械学習の方法と同様に行うことができる。以上が、学習用種別情報が用いられない場合の例である。
 続いて、学習用種別情報が用いられる態様の例を説明する。モデル生成部22は、学習用取得部21から人口推移のデータとあわせて学習用種別情報である種別コードを入力する。この場合、モデル生成部22は、種別コードも入力するエンコーダ・デコーダモデルを生成する。図5にこのエンコーダ・デコーダモデルの例を示す。このエンコーダ・デコーダモデルは、図4に示すエンコーダ・デコーダモデルに加えて、入力層及び出力層に、種別コードに対応するニューロンが設けられる。
 モデル生成部22は、図6(a)に示すようにエリア及び1日毎の人口推移のデータに当該エリアの種別コードを対応付ける。この対応付けは、メッシュコードをキーとして行われる。図5に示すように、モデル生成部22は、対応付いた人口推移のデータ及び種別コード(図6(a)に示すデータD1)をエンコーダ・デコーダモデルへの入力値とすると共にエンコーダ・デコーダモデルの出力値(正解)として、機械学習を行ってエンコーダ・デコーダモデルを生成する。
 また、モデル生成部22は、種別コードに応じた複数のエンコーダ・デコーダモデルを生成してもよい。例えば、モデル生成部22は、種別コード毎のエンコーダ・デコーダモデルを生成してもよい。モデル生成部22は、図6(b)に示すような同一の種別コードのエリア及び1日毎の人口推移のデータを1つのエンコーダ・デコーダモデルの生成に用いる。即ち、モデル生成部22は、種別コード毎に人口推移のデータをフィルタリングして、フィルタリング後の人口推移のデータをエンコーダ・デコーダモデルの生成に用いる。
 この場合、モデル生成部22は、図4に示すような人口推移のデータのみを入力するエンコーダ・デコーダモデル(種別コードを入力としないエンコーダ・デコーダモデル)を生成してもよい。モデル生成部22は、人口推移のデータをエンコーダ・デコーダモデルへの入力値とすると共にエンコーダ・デコーダモデルの出力値(正解)として、機械学習を行ってエンコーダ・デコーダモデルを生成する。
 あるいは、モデル生成部22は、図5に示すような人口推移のデータに加えて種別コードも入力するエンコーダ・デコーダモデルを生成してもよい。この際には、モデル生成部22は、互いに対応付いた人口推移のデータ及び種別コード(図6(b)に示すデータD2)をエンコーダ・デコーダモデルへの入力値とすると共にエンコーダ・デコーダモデルの出力値(正解)として、機械学習を行ってエンコーダ・デコーダモデルを生成する。モデル生成部22は、種別コード毎に上記のように機械学習を行って、種別コード毎のエンコーダ・デコーダモデルを生成する。
 モデル生成部22は、生成したエンコーダ・デコーダモデルを人口状態判定システム10に出力する。モデル生成部22は、種別コード毎にエンコーダ・デコーダモデルを生成した場合には、エンコーダ・デコーダモデル毎に対応する種別コードも人口状態判定システム10に出力する。以上が、本実施形態に係るモデル生成システム20の機能である。
 続いて、人口状態判定システム10の機能を説明する。図1に示すように人口状態判定システム10は、取得部11と、モデル演算部12と、判定部13と、判定基準生成部14とを備えて構成される。
 取得部11は、人口の状態の判定対象となるエリアの時系列の人口を示す人口情報を取得する機能部である。取得部11は、判定対象とするエリア及び時間帯の上述した人口情報を取得する。取得部11は、人口の状態の判定対象となるエリアの種別を示す種別情報を取得してもよい。
 例えば、取得部11は、人口状態判定システム10のユーザからの判定対象とするエリア及び時間帯(日付)の指定を受け付けて、指定されたエリア及び時間帯に係る人口情報を、上述した学習用取得部21による学習用人口情報の取得と同様に取得する。
 取得部11は、人口の状態の判定対象となるエリアの種別を示す種別情報を取得する態様であってもよい。取得部11は、取得する人口情報に係るエリアについて、学習用取得部21によって取得された学習用種別用情報と同じ種別情報を取得する。例えば、学習用取得部21が、上述した図3(c)に示す予め記憶されている学習用種別情報を取得する場合には、取得部11は、同じ情報から人口情報に係るエリアのメッシュコードに対応する種別コードを種別情報として取得する。
 また、学習用取得部21によってクラスタリングが行われた場合には、取得部11は、クラスタリングの結果、コンピュータ1に記憶されるメッシュコードと種別コードとの対応付けの情報から、人口情報に係るエリアのメッシュコードに対応する種別コードを種別情報として取得する。
 取得部11は、取得した人口情報をモデル演算部12及び判定部13に出力する。また、取得部11は、種別情報を取得する場合には、取得した種別情報もモデル演算部12に出力する。
 モデル演算部12は、取得部11によって取得された人口情報を、予め記憶したエンコーダ・デコーダモデルに入力して演算を行って、当該エンコーダ・デコーダモデルからの出力を得る機能部である。モデル演算部12は、取得部11によって取得された種別情報に基づいて、エンコーダ・デコーダモデルを用いた演算を行ってもよい。モデル演算部12は、種別情報もエンコーダ・デコーダモデルに入力して、当該エンコーダ・デコーダモデルからの出力を得てもよい。モデル演算部12は、種別情報に基づいて、予め記憶した複数のエンコーダ・デコーダモデルから演算に用いるエンコーダ・デコーダモデルを選択して、選択したエンコーダ・デコーダモデルを用いた演算を行ってもよい。
 モデル演算部12は、モデル生成システム20によって生成されたエンコーダ・デコーダモデルを入力して記憶しておく。モデル演算部12は、取得部11から人口情報を入力する。
 モデル演算部12は、人口情報を、エンコーダ・デコーダモデルへの入力値として、エンコーダ・デコーダモデルの重みwを用いた演算を行って、エンコーダ・デコーダモデルからの出力値を得る。エンコーダ・デコーダモデルからの出力値は、人口情報である人口推移のデータの復元データであり、人口情報と同様の形式の情報である。図2に示すグラフG1によって示される人口情報を入力値とした場合の出力値の一例のグラフG2を示す。
 種別情報が用いられる態様では、モデル演算部12は、取得部11から種別情報を入力して以下の処理を行う。この場合、例えば、上述したようにモデル生成システム20によって、種別情報も入力するエンコーダ・デコーダモデルが生成されている。モデル演算部12は、人口情報及び種別情報を、エンコーダ・デコーダモデルへの入力値として、エンコーダ・デコーダモデルの重みwを用いた演算を行って、エンコーダ・デコーダモデルからの出力値を得る。
 また、この場合、例えば、上述したようにモデル生成システム20によって、種別コードに対応する複数のエンコーダ・デコーダモデルが生成されている。モデル演算部12は、複数のエンコーダ・デコーダモデルから、入力した種別情報である種別コードに対応するエンコーダ・デコーダモデルを選択する。モデル演算部12は、選択したエンコーダ・デコーダモデルを用いて、上記と同様にエンコーダ・デコーダモデルからの出力値を得る。
 モデル演算部12は、得られたエンコーダ・デコーダモデルからの出力値を判定部13に出力する。なお、判定部13に出力される出力値は、人口情報に対応する部分のみでよい。
 判定部13は、取得部11によって取得された人口情報と、モデル演算部12によって得られた出力とを比較して、エリアの人口の状態を判定する機能部である。判定部13による判定は、例えば、上述したように判定対象となるエリアにおける人口が平常時とは異なる異常な状態であるか否かの判定である。但し、エンコーダ・デコーダモデルに入力される人口情報と、エンコーダ・デコーダモデルからの出力とを比較して判定できるものであれば、上記以外の判定であってもよい。判定部13は、以下のようにエリアの人口の状態を判定する。
 判定部13は、取得部11から人口情報を入力する。判定部13は、モデル演算部12から、上記の人口情報に対応する出力値を入力する。判定部13は、エンコーダ・デコーダモデルへの入力(人口推移のデータ、例えば、図2のグラフG1)と、エンコーダ・デコーダモデルからの出力(人口推移のデータの復元データ、例えば、図2のグラフG2)とを比較して、異常度として誤差を算出する。例えば、判定部13は、1時間毎の各時間帯の入力と出力との差分の絶対値を算出して、全ての時間帯の合計を誤差とする。
 判定部13は、算出した誤差と予め設定した閾値とを比較する。判定部13は、誤差が閾値以上であったら、判定対象となるエリアにおける人口が異常な状態であると判定する。この場合、判定対象となるエリアでイベント等の平常時と異なる事象が発生していると推定される。判定部13は、誤差が閾値以上でなかったら、判定対象となるエリアにおける人口が異常な状態でないと判定する。
 上記の判定は、正常データのみで機械学習を行ってエンコーダ・デコーダモデルを生成した場合、異常データをエンコーダ・デコーダモデルに入力するとうまく復元できないことを利用している。そのため、判定に係る平常時は、モデル生成システム20でエンコーダ・デコーダモデルの生成の際に用いられた学習用人口情報によるものである。
 判定部13は、判定結果を示す情報を出力する。例えば、判定部13は、コンピュータ1が備える表示装置に判定結果を表示させて、ユーザが判定結果を参照できるようにしてもよい。あるいは、判定部13は、別の装置に判定結果を示す情報を送信してもよい。また、判定部13は、上記以外の方法で上記以外の出力先に、判定結果を示す情報を出力してもよい。
 判定基準生成部14は、判定部13による判定に用いられる判定基準を生成する機能部である。判定基準生成部14は、判定基準生成用の人口情報であって、同一エリアの第1の状態及び第1の状態とは異なる第2の状態それぞれでの判定基準生成用の第1の人口情報、並びに判定対象となるエリアの第1の状態での判定基準生成用の第2の人口情報を取得し、取得した第1及び第2の人口情報を、予め記憶した判定基準生成用のエンコーダ・デコーダモデルに入力して演算を行って、当該エンコーダ・デコーダモデルからの出力を得て、当該エンコーダ・デコーダモデルへの入力と出力とを比較して、比較結果に基づいて判定基準を生成する。
 第1の状態は平常時であり、第2の状態は異常時であってもよい。判定部13は、判定基準として閾値を用いて、人口が平常時とは異なる異常な状態であるか否かを判定し、判定基準生成部14は、閾値を生成してもよい。判定基準生成部14は、第1の人口情報についての第1の状態及び第2の状態それぞれでの比較結果に基づく値の比、第2の人口情報についての比較結果に基づく値から閾値を生成してもよい。判定基準生成部14は、複数のエリアそれぞれの第1の人口情報を取得し、複数のエリアそれぞれの比較結果に基づく値の比の統計値から、閾値を生成してもよい。判定基準生成部14は、第1の状態での判定基準生成用の第1の人口情報から機械学習によって生成された判定基準生成用のエンコーダ・デコーダモデルに、第1の人口情報を入力し、判定基準生成用の第2の人口情報から機械学習によって生成された判定基準生成用のエンコーダ・デコーダモデルに、第2の人口情報を入力してもよい。
 人口推移の特徴はエリア毎に異なるため、判定部13によって算出される誤差である異常度スコアもエリア毎に変化する。従って、判定部13による判定に用いられる閾値を全てのエリアで共通の値とすると適切な判定を行えないおそれがある。判定基準生成部14は、判定部13によって適切な判定を行うために、判定対象となるエリア毎に判定部13による判定に用いられる判定基準である閾値を生成する。例えば、判定基準生成部14は、判定部13による判定に先立って以下のように判定基準を生成する。
 判定基準生成部14は、判定基準生成用の人口情報である第1の人口情報及び第2の人口情報を取得する。図7に、第1の人口情報及び第2の人口情報を模式的に示す。図7に示す学習事例が第1の人口情報であり、テスト事例が第2の人口情報である。学習事例及びテスト事例は、人口の状態の判定に用いられる人口情報と同様の形式の個々の人口情報を複数含んで構成されていてもよい。
 学習事例は、例えば、複数のエリアの人口情報から構成されている。図7に示す「Case1」「Case2」、…「Case N-1」は、それぞれの事例毎の人口情報である。複数の事例は、エリア及び時刻の何れかが互いに異なっている。学習事例である事例毎の人口情報は、複数の単位の人口情報を含み、第1の状態である平常時での人口情報と、第2の状態である異常時での人口情報とを含む。人口情報の単位は、人口の状態の判定又はエンコーダ・デコーダモデルの生成に用いられる人口情報と同様であり、例えば上述したように1日単位である。図7に示すグラフは、学習事例である、1つの事例の人口情報を示している。このグラフでは、横軸が時刻であり、縦軸が人口である。
 学習事例のうちの異常時の人口情報は、例えば、図7に示すように当該人口情報に対応するエリアでイベントが発生した日の人口情報である。イベントが発生した日のエリアにおける人口推移は、平常時の人口推移と比べて過度に異なっているためである。学習事例のうちの平常時の人口情報は、例えば、図7に示すように当該エリアでイベントが発生した日の前の(当該エリアでイベントが発生していない)複数日(例えば、30日程度)の人口情報である。図7のグラフは、連続する1日の異常時の人口情報と複数日の平常時の人口情報とをまとめて示している。学習事例の人口情報が、異常時に係るものか、平常時に係るものかは予め識別できるようになっている。上記のように事例毎の学習事例には、1日分の異常時の人口情報と、複数日分の平常時の人口情報とを含む。なお、エリア毎の学習事例には、複数日分の異常時の人口情報が含まれていてもよいし、1日分のみの平常時の人口情報が含まれていてもよい。
 テスト事例は、例えば、判定部13による判定対象のエリアの人口情報から構成されている。なお、テスト事例は、人口情報に係るエリアが判定対象であるが、人口情報自体は判定対象ではない。図7に示す「CaseN」は、判定対象のエリアの人口情報である。テスト事例である判定対象のエリアの人口情報は、第1の状態である平常時での人口情報を含む。人口情報の単位は、人口の状態の判定又はエンコーダ・デコーダモデルの生成に用いられる人口情報と同様であり、例えば上述したように1日単位である。
 テスト事例の平常時の人口情報は、判定対象のエリアでイベントが発生していない複数日(例えば、30日程度)の人口情報である。このようにテスト事例には、複数日分の平常時の人口情報を含む。なお、テスト事例には、1日分のみの平常時の人口情報が含まれていてもよい。
 判定基準生成部14は、判定基準生成用の人口情報である学習事例及びテスト事例を、上述した学習用取得部21による学習用人口情報の取得、又は取得部11による人口情報の取得と同様に取得する。判定基準生成部14は、取得した学習事例及びテスト事例から以下のように閾値を生成する。
 判定基準生成部14は、学習事例のうちの平常時の人口情報から機械学習によって判定基準生成用のエンコーダ・デコーダモデルを生成する。判定基準生成用のエンコーダ・デコーダモデルは、判定部13による判定に用いられるエンコーダ・デコーダモデルと同様の形式であってもよい。判定基準生成用のエンコーダ・デコーダモデルの生成は、上述したモデル生成部22によるエンコーダ・デコーダモデルの生成と同様に行われればよい。判定基準生成部14は、生成した判定基準生成用のエンコーダ・デコーダモデルを記憶しておき、閾値の生成に利用する。なお、判定部13による判定に用いられるエンコーダ・デコーダモデルを、判定基準生成用のエンコーダ・デコーダモデルとしてもよい。
 判定基準生成部14は、学習事例に含まれる1日単位の人口情報毎に、人口情報を、判定基準生成用のエンコーダ・デコーダモデルへの入力値として、判定基準生成用のエンコーダ・デコーダモデルの重みwを用いた演算を行って、判定基準生成用のエンコーダ・デコーダモデルからの出力値を得る。判定基準生成部14は、判定基準生成用のエンコーダ・デコーダモデルへの入力と、判定基準生成用のエンコーダ・デコーダモデルからの出力とを比較して、異常度として誤差である異常度スコアを算出する。例えば、判定基準生成部14は、1時間毎の各時間帯の入力と出力との差分の絶対値を算出して、全ての時間帯の合計を誤差である異常度スコアとする。この誤差の算出は、上述した判定部13による判定に用いられる誤差の算出と同様に行われる。
 判定基準生成部14は、算出した異常度スコアから、学習事例の事例i(Case1~CaseN-1)毎に、以下の式によって、平常時(イベント前)の異常度スコアの最大値と異常時(イベント後)の異常度スコアの最大値の比率αを算出する。
Figure JPOXMLDOC01-appb-M000001
ここで、R beforeは、事例iの平常時(イベント前)の1日単位での各異常度スコアであり、max(R before)は、事例i毎のそれらの最大値である。R afterは、事例iの異常時(イベント後)の1日単位での各異常度スコアであり、max(R after)は、事例i毎のそれらの最大値である。上記の通り、比率αは、学習事例についての平常時及び異常時のそれぞれでの、判定基準生成用のエンコーダ・デコーダモデルの入出力の比較結果に基づく最大値の比である。
 なお、比率αに用いる値としては、上記ように事例i毎の異常度スコアの最大値以外の値が用いられてもよい。例えば、事例i毎の異常度スコアの予め設定された分位点を用いてもよい。
 続いて、判定基準生成部14は、複数の事例iのαの統計値からハット付きαを算出する。例えば、判定基準生成部14は、ハット付きαを平均値とする場合、以下の式によってハット付きαを算出する。
Figure JPOXMLDOC01-appb-M000002
なお、ハット付きαは、平均値以外の複数の事例のαの統計値であってもよく、例えば、中央値又は予め設定された分位点等であってもよい。
 また、判定基準生成部14は、テスト事例である平常時の人口情報から機械学習によって(学習事例から生成されるものとは別の)判定基準生成用のエンコーダ・デコーダモデルを生成する。この判定基準生成用のエンコーダ・デコーダモデルも、判定部13による判定に用いられるエンコーダ・デコーダモデルと同様の形式であってもよい。この判定基準生成用のエンコーダ・デコーダモデルの生成も、上述したモデル生成部22によるエンコーダ・デコーダモデルの生成と同様に行われればよい。判定基準生成部14は、生成した判定基準生成用のエンコーダ・デコーダモデルを記憶しておき、閾値の生成に利用する。なお、判定部13による判定に用いられるエンコーダ・デコーダモデルを、この判定基準生成用のエンコーダ・デコーダモデルとしてもよい。
 判定基準生成部14は、テスト事例に含まれる1日単位の人口情報毎に、人口情報を、判定基準生成用のエンコーダ・デコーダモデルへの入力値として、判定基準生成用のエンコーダ・デコーダモデルの重みwを用いた演算を行って、判定基準生成用のエンコーダ・デコーダモデルからの出力値を得る。判定基準生成部14は、判定基準生成用のエンコーダ・デコーダモデルへの入力と、判定基準生成用のエンコーダ・デコーダモデルからの出力とを比較して、異常度として誤差である異常度スコアを算出する。例えば、判定基準生成部14は、1時間毎の各時間帯の入力と出力との差分の絶対値を算出して、全ての時間帯の合計を誤差である異常度スコアとする。この誤差の算出は、上述した判定部13による判定に用いられる誤差の算出と同様に行われる。
 判定基準生成部14は、算出した異常度スコアから、テスト事例の異常度スコアR beforeの最大値max(R before)を算出する。判定基準生成部14は、算出した上記の値から、以下の式によって閾値thresholdを算出する。
Figure JPOXMLDOC01-appb-M000003
 判定基準生成部14は、算出した閾値thresholdを判定部13に出力する。判定部13は、判定基準生成部14から閾値thresholdを入力して、入力した閾値thresholdを用いて上述したようにエリアの人口の判定を行う。
 上記のように各事例の異常度スコアの最大値を用いることで、異常度スコアが最大値の場合を基準とした閾値による判定を行うことができる。また、閾値の係数である、複数の学習事例の異常度スコアの統計値であるハット付きαと、テスト事例の異常度スコアの最大値とから閾値を算出することで、各事例における異常時の人口を考慮した上で判定対象のエリアでの判定に適した閾値とすることができる。
 なお、上記の判定基準生成用のエンコーダ・デコーダモデルは、市区町村単位、都道府県単位、又は都道府県内の地域毎のものであってもよい。また、学習事例(「Case1」「Case2」、…「Case N-1」)に係るエリアに、テスト事例に係るエリアが含まれていてもよいし、含まれていなくてもよい。例えば、学習事例に係るエリアを東京都、千葉県及び埼玉県のエリアとして、テスト事例を神奈川県のエリアとして、神奈川県のエリアの異常検知を行うこととしてもよい(別のエリアに適用する場合)。あるいは、学習事例に係るエリアを東京都、千葉県及び埼玉県のエリアとして、テスト事例を東京都のエリアとして、東京都のエリアの異常検知を行うこととしてもよい(同じエリアに適用する場合)。本実施形態は、エリアの特性を考慮することが狙いであるため、特に別のエリアに適用する場合に適切な閾値を設定できることが期待できる。
 判定部13による判定が種別コード等の種別情報を用いて行われるものであれば、判定基準生成部14による閾値の生成も種別情報を用いて行われてもよい。判定基準生成部14による種別情報の用いられ方は、判定部13によるものと同様でよい。以上が、本実施形態に係る人口状態判定システム10の機能である。
 引き続いて、図8~図10のフローチャートを用いて、本実施形態に係るコンピュータ1で実行される処理(コンピュータ1が行う動作方法)を説明する。まず、図8のフローチャートを用いて、モデル生成システム20で実行される処理を説明する。
 本処理では、まず、学習用取得部21によって学習用人口情報が取得される(S01)。続いて、学習用取得部21によって学習用種別情報が取得される(S02)。なお、学習用種別情報が用いられない態様では、学習用種別情報の取得(S02)は行われなくてもよい。続いて、モデル生成部22によって、学習用人口情報に基づいて機械学習が行われてエンコーダ・デコーダモデルが生成される(S03)。また、学習用種別情報が用いられる態様では、学習用種別情報に基づいてエンコーダ・デコーダモデルが生成される。生成されたエンコーダ・デコーダモデルは、人口状態判定システム10に出力されて、モデル演算部12によって記憶される。以上が、本実施形態に係るモデル生成システム20で実行される処理である。
 続いて、図9のフローチャートを用いて、人口状態判定システム10で実行される処理を説明する。本処理では、まず、判定基準生成部14によって、判定部13による判定に用いられる判定基準である閾値が生成される(S11)。判定基準生成部14による判定基準である閾値の生成(S11)の処理の例について、図10のフローチャートを用いて説明する。
 本処理では、まず、学習事例及びテスト事例が取得される(S111)。続いて、学習事例の平常時の人口情報を用いた機械学習が行われて、判定基準生成用のエンコーダ・デコーダモデルが生成される(S112)。続いて、学習事例の各人口情報が、S112において生成された判定基準生成用のエンコーダ・デコーダモデルに入力されて演算が行われて、当該エンコーダ・デコーダモデルからの出力が得られる(S113)。続いて、当該エンコーダ・デコーダモデルへの入力と、当該エンコーダ・デコーダモデルからの出力とが比較されて、学習事例の各人口情報の異常度スコアが算出される(S114)。
 続いて、算出された異常度スコアから学習事例の事例i毎のαが算出される(S115)。続いて、複数の事例iのαの統計値から、ハット付きαが算出される(S116)。
 続いて、テスト事例の人口情報を用いた機械学習が行われて、判定基準生成用のエンコーダ・デコーダモデルが生成される(S117)。続いて、テスト事例の各人口情報が、S117において生成された判定基準生成用のエンコーダ・デコーダモデルに入力されて演算が行われて、当該エンコーダ・デコーダモデルからの出力が得られる(S118)。続いて、当該エンコーダ・デコーダモデルへの入力と、当該エンコーダ・デコーダモデルからの出力とが比較されて、テスト事例の各人口情報の異常度スコアが算出される(S119)。続いて、S116において算出されたハット付きαと、S119において算出されたテスト事例の異常度スコアとから、閾値thresholdが算出される(S120)。算出された閾値thresholdは、判定基準生成部14から判定部13に出力され、判定部13に記憶され、以下の判定部13による判定に用いられる。
 続いて、図9に示すように、取得部11によって人口情報及び種別情報が取得される(S12)。なお、種別情報が用いられない態様では、種別情報の取得は行われなくてもよい。続いて、モデル演算部12によって、人口情報がエンコーダ・デコーダモデルに入力されて演算が行われて、当該エンコーダ・デコーダモデルからの出力が得られる(S13)。また、種別情報が用いられる態様では、種別情報に基づいてエンコーダ・デコーダモデルを用いた演算が行われる。
 続いて、判定部13によって、エンコーダ・デコーダモデルへの入力と、エンコーダ・デコーダモデルからの出力とが比較される(S14)。続いて、判定部13によって、上記の比較に基づいて、エリアの人口の状態が判定される(S15)。続いて、判定部13によって、判定結果を示す情報が出力される(S16)。以上が、本実施形態に係る人口状態判定システム10で実行される処理である。
 本実施形態に係る人口状態判定システム10によれば、時系列の人口情報を用いているため、エリアの時系列の人口を考慮した人口の状態を判定することができる。また、エンコーダ・デコーダモデルへの入力と、出力とが比較されて判定が行われる。また、判定基準生成用の第1及び第2の人口情報である学習事例及びテスト事例に基づいた適切な判定基準が生成されて、判定に用いられる。このように生成される判断基準は、上述したようにエリア毎の人口推移の特徴が考慮されたものとなる。従って、本実施形態に係る人口状態判定システム10によれば、判定対象のエリアに応じた適切な判定基準が用いられて、人口の状態を高精度で適切に判定することができる。
 また、本実施形態のように第1の状態は平常時であり、第2の状態は異常時であってもよい。更に、本実施形態のように判定基準は閾値であり、判定対象のエリアの判定は、人口が平常時とは異なる異常な状態であるか否かの判定であってもよい。この構成によれば、本実施形態のような、判定対象となるエリアにおける人口推移の異常検知を適切に行うことができる。但し、第1の状態及び第2の状態は、必ずしも上記のものである必要はなく、人口の状態の判定に係る2つの状態であればどのようなものであってもよい。また、生成される判定基準を閾値以外のものとし、また上記以外の判定が行われてもよい。
 また、閾値の生成では、上述したように、学習事例における、判定基準生成用のエンコーダ・デコーダモデルへの入力と出力との比較結果である異常度スコアの比の値α、及び学習事例における異常度スコアR beforeが用いられてもよい。この構成によれば、適切かつ確実に閾値を生成することができ、その結果、人口の状態を適切かつ確実に判定することができる。また、学習事例は、複数のエリアに係るものとしてもよい。これによって、閾値の算出に用いられるハット付きαを複数のエリアを考慮したものとすることができ、閾値を更に適切なものとすることができる。但し、閾値の生成は、必ずしも上記のように行われる必要はなく、学習事例及びテスト事例のような、判定基準生成用の第1及び第2の人口情報が用いて行われればよい。
 また、判定基準の生成に用いられる判定基準生成用のエンコーダ・デコーダモデルを、上述したように判定基準生成用の第1及び第2の人口情報から機械学習によってそれぞれ生成されるものとしてもよい。この構成によれば、適切かつ確実に判定基準を生成することができる。但し、判定基準生成用のエンコーダ・デコーダモデルは、必ずしも判定基準生成用の第1及び第2の人口情報から機械学習によってそれぞれ生成されるものである必要はなく、判定基準の生成に用いることができるものであればどのようなものであってもよい。
 また、上述した実施形態のように種別情報が用いられてもよい。種別情報が用いられることで、エリアの特性に応じて人口の状態を適切に判定することができる。例えば、オフィス街、住宅街等の都市の機能特性を考慮した判定を行うことができる。これによって、種別情報を考慮しない平均的な人口変動に応じた判定と比べて、より高精度で適切な判定を行うことができる。
 種別情報の用いられ方としては、上述したようにエンコーダ・デコーダモデルへの入力とすることとしてもよい。また、種別情報に基づいて演算に用いるエンコーダ・デコーダモデルを選択することとしてもよい。このような構成によれば、確実かつ適切に種別情報を用いることができ、確実かつ適切に判定を行うことができる。但し、種別情報は、上記以外の方法で用いられてもよい。また、種別情報は、必ずしも用いられる必要はない。
 本実施形態に係るモデル生成システム20によれば、人口状態判定システム10で用いられるエンコーダ・デコーダモデルを生成することができる。また、エンコーダ・デコーダモデルを生成する際にも、種別情報に対応する学習用種別情報が用いられてもよい。また、学習用種別情報は、上述したように学習用人口情報を用いたクラスタリングを行って取得されてもよい。この構成によれば、エリアに予め種別情報が対応付いていない場合であっても、エリアの種別に基づくエンコーダ・デコーダモデルの生成及びエンコーダ・デコーダモデルを用いた判定を行うことができる。
 なお、本実施形態では、コンピュータ1は、人口状態判定システム10と、モデル生成システム20とを含むこととしたが、人口状態判定システム10と、モデル生成システム20とは、それぞれ独立してそれぞれ実施されてもよい。
 なお、上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。
 機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック(構成部)は、送信部(transmitting unit)又は送信機(transmitter)と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。
 例えば、本開示の一実施の形態におけるコンピュータ1は、本開示の情報処理を行うコンピュータとして機能してもよい。図11は、本開示の一実施の形態に係るコンピュータ1のハードウェア構成の一例を示す図である。上述のコンピュータ1は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
 なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。コンピュータ1のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
 コンピュータ1における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。
 プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。例えば、上述のコンピュータ1における各機能は、プロセッサ1001によって実現されてもよい。
 また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、コンピュータ1における各機能は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
 メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る情報処理を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
 ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。コンピュータ1が備える記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
 通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。
 入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
 また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
 また、コンピュータ1は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
 本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。
 入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
 判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
 本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
 以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。
 ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
 また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。
 本開示において使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。
 また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。
 本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)(例えば、テーブル、データベース又は別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断(決定)」は、「想定する(assuming)」、「期待する(expecting)」、「みなす(considering)」などで読み替えられてもよい。
 「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。
 本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
 本開示において使用する「第1の」、「第2の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみが採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
 本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。
 本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
 本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。
 本開示の人口状態判定システムは、以下の構成を有する。
 [1]人口の状態の判定対象となるエリアの時系列の人口を示す人口情報を取得する取得部と、
 前記取得部によって取得された人口情報を、入力データを圧縮して復元する予め記憶したエンコーダ・デコーダモデルに入力して演算を行って、当該エンコーダ・デコーダモデルからの出力を得るモデル演算部と、
 前記取得部によって取得された人口情報と、前記モデル演算部によって得られた出力とを比較して、前記エリアの人口の状態を判定する判定部と、
 前記判定部による判定に用いられる判定基準を生成する判定基準生成部と、を備え、
 前記判定基準生成部は、判定基準生成用の人口情報であって、同一エリアの第1の状態及び第1の状態とは異なる第2の状態それぞれでの判定基準生成用の第1の人口情報、並びに判定対象となるエリアの第1の状態での判定基準生成用の第2の人口情報を取得し、取得した第1及び第2の人口情報を、予め記憶した判定基準生成用のエンコーダ・デコーダモデルに入力して演算を行って、当該エンコーダ・デコーダモデルからの出力を得て、当該エンコーダ・デコーダモデルへの入力と出力とを比較して、比較結果に基づいて判定基準を生成する人口状態判定システム。
 [2]前記第1の状態は平常時であり、前記第2の状態は異常時である[1]に記載の人口状態判定システム。
 [3]前記判定部は、前記判定基準として閾値を用いて、人口が平常時とは異なる異常な状態であるか否かを判定し、
 前記判定基準生成部は、前記閾値を生成する[2]に記載の人口状態判定システム。
 [4]前記判定基準生成部は、第1の人口情報についての第1の状態及び第2の状態のそれぞれでの比較結果に基づく値の比、第2の人口情報についての比較結果に基づく値から前記閾値を生成する[3]に記載の人口状態判定システム。
 [5]前記判定基準生成部は、複数のエリアそれぞれの第1の人口情報を取得し、複数のエリアそれぞれの前記比較結果に基づく値の比の統計値から、前記閾値を生成する[4]に記載の人口状態判定システム。
 [6]前記判定基準生成部は、第1の状態での判定基準生成用の第1の人口情報から機械学習によって生成された判定基準生成用のエンコーダ・デコーダモデルに、第1の人口情報を入力し、判定基準生成用の第2の人口情報から機械学習によって生成された判定基準生成用のエンコーダ・デコーダモデルに、第2の人口情報を入力する[1]~[5]の何れかに記載の人口状態判定システム。
 [7]前記取得部は、人口の状態の判定対象となるエリアの種別を示す種別情報を取得し、
 前記モデル演算部は、前記取得部によって取得された種別情報に基づいて、前記エンコーダ・デコーダモデルを用いた演算を行う、[1]~[6]の何れかに記載の人口状態判定システム。
 [8]前記モデル演算部は、前記種別情報も前記エンコーダ・デコーダモデルに入力して、当該エンコーダ・デコーダモデルからの出力を得る[7]に記載の人口状態判定システム。
 [9]前記モデル演算部は、前記種別情報に基づいて、予め記憶した複数のエンコーダ・デコーダモデルから演算に用いるエンコーダ・デコーダモデルを選択して、選択したエンコーダ・デコーダモデルを用いた演算を行う[7]又は[8]に記載の人口状態判定システム。
 1…コンピュータ、10…人口状態判定システム、11…取得部、12…モデル演算部、13…判定部、14…判定基準生成部、20…モデル生成システム、21…学習用取得部、22…モデル生成部、1001…プロセッサ、1002…メモリ、1003…ストレージ、1004…通信装置、1005…入力装置、1006…出力装置、1007…バス。

Claims (9)

  1.  人口の状態の判定対象となるエリアの時系列の人口を示す人口情報を取得する取得部と、
     前記取得部によって取得された人口情報を、入力データを圧縮して復元する予め記憶したエンコーダ・デコーダモデルに入力して演算を行って、当該エンコーダ・デコーダモデルからの出力を得るモデル演算部と、
     前記取得部によって取得された人口情報と、前記モデル演算部によって得られた出力とを比較して、前記エリアの人口の状態を判定する判定部と、
     前記判定部による判定に用いられる判定基準を生成する判定基準生成部と、を備え、
     前記判定基準生成部は、判定基準生成用の人口情報であって、同一エリアの第1の状態及び第1の状態とは異なる第2の状態それぞれでの判定基準生成用の第1の人口情報、並びに判定対象となるエリアの第1の状態での判定基準生成用の第2の人口情報を取得し、取得した第1及び第2の人口情報を、予め記憶した判定基準生成用のエンコーダ・デコーダモデルに入力して演算を行って、当該エンコーダ・デコーダモデルからの出力を得て、当該エンコーダ・デコーダモデルへの入力と出力とを比較して、比較結果に基づいて判定基準を生成する人口状態判定システム。
  2.  前記第1の状態は平常時であり、前記第2の状態は異常時である請求項1に記載の人口状態判定システム。
  3.  前記判定部は、前記判定基準として閾値を用いて、人口が平常時とは異なる異常な状態であるか否かを判定し、
     前記判定基準生成部は、前記閾値を生成する請求項2に記載の人口状態判定システム。
  4.  前記判定基準生成部は、第1の人口情報についての第1の状態及び第2の状態のそれぞれでの比較結果に基づく値の比、第2の人口情報についての比較結果に基づく値から前記閾値を生成する請求項3に記載の人口状態判定システム。
  5.  前記判定基準生成部は、複数のエリアそれぞれの第1の人口情報を取得し、複数のエリアそれぞれの前記比較結果に基づく値の比の統計値から、前記閾値を生成する請求項4に記載の人口状態判定システム。
  6.  前記判定基準生成部は、第1の状態での判定基準生成用の第1の人口情報から機械学習によって生成された判定基準生成用のエンコーダ・デコーダモデルに、第1の人口情報を入力し、判定基準生成用の第2の人口情報から機械学習によって生成された判定基準生成用のエンコーダ・デコーダモデルに、第2の人口情報を入力する請求項1に記載の人口状態判定システム。
  7.  前記取得部は、人口の状態の判定対象となるエリアの種別を示す種別情報を取得し、
     前記モデル演算部は、前記取得部によって取得された種別情報に基づいて、前記エンコーダ・デコーダモデルを用いた演算を行う、請求項1に記載の人口状態判定システム。
  8.  前記モデル演算部は、前記種別情報も前記エンコーダ・デコーダモデルに入力して、当該エンコーダ・デコーダモデルからの出力を得る請求項7に記載の人口状態判定システム。
  9.  前記モデル演算部は、前記種別情報に基づいて、予め記憶した複数のエンコーダ・デコーダモデルから演算に用いるエンコーダ・デコーダモデルを選択して、選択したエンコーダ・デコーダモデルを用いた演算を行う請求項7に記載の人口状態判定システム。
PCT/JP2023/016969 2022-07-27 2023-04-28 人口状態判定システム WO2024024201A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022-119460 2022-07-27
JP2022119460 2022-07-27

Publications (1)

Publication Number Publication Date
WO2024024201A1 true WO2024024201A1 (ja) 2024-02-01

Family

ID=89705957

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/016969 WO2024024201A1 (ja) 2022-07-27 2023-04-28 人口状態判定システム

Country Status (1)

Country Link
WO (1) WO2024024201A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020123011A (ja) * 2019-01-29 2020-08-13 Kddi株式会社 所定圏における滞在圏人口を推定するプログラム、装置及び方法
JP2021177284A (ja) * 2020-05-07 2021-11-11 Kddi株式会社 複数の投稿時系列データを用いた異常・変化推定方法、プログラム及び装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020123011A (ja) * 2019-01-29 2020-08-13 Kddi株式会社 所定圏における滞在圏人口を推定するプログラム、装置及び方法
JP2021177284A (ja) * 2020-05-07 2021-11-11 Kddi株式会社 複数の投稿時系列データを用いた異常・変化推定方法、プログラム及び装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
OCHIAI, KEIICHI: "Consideration of detecting non-designated evacuation centers by extracting populated areas during disasters", IPSJ SIG TECHNICAL REPORT, INFORMATION PROCESSING SOCIETY OF JAPAN, vol. 2021-HCI-195, no. 18, 23 November 2021 (2021-11-23), pages 1 - 6, XP009552789, ISSN: 2188-8698 *

Similar Documents

Publication Publication Date Title
US9852524B2 (en) Device based visualization and analysis of multivariate data
WO2018207878A1 (ja) 需要予測装置
CN113852603B (zh) 网络流量的异常检测方法、装置、电子设备和可读介质
CN111612038A (zh) 异常用户检测方法及装置、存储介质、电子设备
CN111612037A (zh) 异常用户检测方法、装置、介质及电子设备
CN111178687A (zh) 金融风险分类方法、装置及电子设备
CN114721912A (zh) 一种数据分析方法、装置、设备及介质
WO2024024201A1 (ja) 人口状態判定システム
WO2021039797A1 (ja) クリック率予測モデル構築装置
WO2019167684A1 (ja) 在宅予測装置
US20200402004A1 (en) Visit-time-determining device
WO2023084874A1 (ja) 人口状態判定システム及びモデル生成システム
JPWO2019159585A1 (ja) 学習システム、推定システム及び学習済モデル
CN110826616A (zh) 信息处理方法及装置、电子设备、存储介质
WO2024048036A1 (ja) 店舗判定装置
US20230169414A1 (en) Population extraction device
US20230289863A1 (en) Recommendation system
US20220198341A1 (en) State estimation device, state estimation program, estimation model, and state estimation method
JP7377678B2 (ja) 異常検知モデル学習装置、異常検知モデル及び異常検知装置
WO2023214484A1 (ja) 興味推定装置
US20230214716A1 (en) Learning device
WO2020230735A1 (ja) 需要予測装置
WO2023188808A1 (ja) レコメンドシステム
WO2023053776A1 (ja) 投信価値予測装置及び予測モデル
JP7382859B2 (ja) 災害規模推定装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23845940

Country of ref document: EP

Kind code of ref document: A1