WO2019078101A1 - 情報処理装置、リスク予測方法、およびプログラム - Google Patents

情報処理装置、リスク予測方法、およびプログラム Download PDF

Info

Publication number
WO2019078101A1
WO2019078101A1 PCT/JP2018/038052 JP2018038052W WO2019078101A1 WO 2019078101 A1 WO2019078101 A1 WO 2019078101A1 JP 2018038052 W JP2018038052 W JP 2018038052W WO 2019078101 A1 WO2019078101 A1 WO 2019078101A1
Authority
WO
WIPO (PCT)
Prior art keywords
risk
combination
distribution function
data
evaluation value
Prior art date
Application number
PCT/JP2018/038052
Other languages
English (en)
French (fr)
Inventor
中川 淳子
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US16/756,972 priority Critical patent/US20210201219A1/en
Publication of WO2019078101A1 publication Critical patent/WO2019078101A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/2163Partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B31/00Predictive alarm systems characterised by extrapolation or other computation using updated historic data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Definitions

  • the present invention relates to a technique for predicting a possible risk.
  • Patent Document 1 a server mathematically analyzes past crime data, calculates a quantitative probability (that is, a prediction) as to what type of crime occurs when, where, and where the prediction is There is disclosed a technique of projecting to a target rear, which is called as, and proposing a police resource allocation plan based on mathematical analysis.
  • Patent Literatures 2 and 3 below disclose techniques for mathematically analyzing crime data generated in the past, and predicting and presenting risks in a target area.
  • Patent Document 4 provides information useful for reviewing the installation layout of the monitoring camera by specifying the monitoring camera with a low display frequency based on the display frequency of the monitoring camera and the increase degree of the display frequency. Technology is disclosed.
  • Non-Patent Document 1 discloses a technique for analyzing the phenomenon of proximity repeated damage of crime occurrence by calculating a statistic called a space-time K function from crime occurrence history data in a certain area.
  • Proximity repeat damage is the nature that occurs repeatedly in a short period of time and in a place near a crime occurrence, by analyzing the accumulation degree of occurrence temporally and spatially, proximity repeat damage The presence or absence of is known, and the spatio-temporal K function is used for the analysis.
  • the present invention has been made in view of the above problems.
  • One of the objects of the present invention is to provide a technology that makes it possible to predict possible risks with high accuracy.
  • Data division means for dividing into learning data used for calculation, and evaluation value calculation data used for evaluation of the combination of the distribution function, the spatial parameter, and the temporal parameter;
  • the distribution function, the spatial parameter, and the temporal parameter based on the evaluation value for each combination calculated based on the risk value for each combination based on the learning data and the data for calculating the evaluation value.
  • Selection means for selecting one combination from among combinations of An output unit that outputs a risk prediction result in the target area using the one combination selected by the selection unit;
  • An information processing apparatus is provided.
  • Cell dividing means for dividing the target area into a plurality of cells;
  • a generation unit that generates a plurality of combinations of a distribution function that indicates the risk distribution in the target region spatially and temporally, a spatial parameter of the distribution function, and a temporal parameter of the distribution function; From the risk occurrence history data of the target area, the evaluation value for each combination is calculated using the risk occurrence history data for each cell, and one of the plurality of combinations is calculated based on the evaluation value for each combination.
  • Selection means for selecting a combination of An output unit that outputs a risk prediction result in the target area using the one combination selected by the selection unit;
  • An information processing apparatus is provided.
  • the computer is The risk occurrence history data of the target area, a distribution function indicating the risk distribution in the target area spatially and temporally, a spatial parameter of the distribution function, and a risk value for each combination of temporal parameters of the distribution function Divided into learning data used for calculation and data for evaluation value calculation used for evaluation of a combination of the distribution function, the spatial parameter, and the temporal parameter, The distribution function, the spatial parameter, and the temporal parameter based on the evaluation value for each combination calculated based on the risk value for each combination based on the learning data and the data for calculating the evaluation value. Select one combination from among the combinations of Output the risk prediction result in the target area using the selected one combination The first risk prediction method is provided.
  • the target area into multiple cells, Generating a plurality of combinations of a distribution function that indicates the risk distribution in the target region spatially and temporally, a spatial parameter of the distribution function, and a temporal parameter of the distribution function, From the risk occurrence history data of the target area, the evaluation value for each combination is calculated using the risk occurrence history data for each cell, and one of the plurality of combinations is calculated based on the evaluation value for each combination. Choose a combination of Output the risk prediction result in the target area using the selected one combination A second risk prediction method is provided.
  • a program causes a computer to perform a first risk prediction method.
  • a program is provided that causes a computer to perform the second risk prediction method.
  • each block diagram represents a configuration of a function unit, not a configuration of a hardware unit, unless otherwise described.
  • the information processing apparatus uses a history data of risks that have occurred in the past (hereinafter referred to as “risk occurrence history data”), a distribution function that indicates the distribution of risks spatially and temporally, and Among the combinations of spatial and temporal parameters used in the distribution function, the optimal combination is determined.
  • “optimal combination” refers to a combination in which the predictive value of the risk is higher than the other combinations.
  • “risk” in the present specification is not particularly limited, but for example, due to crime, disease, infectious disease (influenza etc.), disease caused by livestock or crop infectious disease etc., pest, natural disaster such as earthquake or typhoon is there. In each of the following embodiments, the case of handling "criminals” among these "risks” is mainly illustrated.
  • FIG. 1 is a block diagram conceptually showing the functional configuration of the information processing apparatus 10 in the first embodiment.
  • the information processing apparatus 10 of the present embodiment includes a data division unit 110, a selection unit 120, and an output unit 130.
  • the data division unit 110 uses the risk generation history data of the target area, data used to calculate the risk value for each combination of distribution function, spatial parameter, and temporal parameter (hereinafter referred to as “learning data”), and the combination Divided into data (hereinafter referred to as data for calculating an evaluation value) used for evaluation of
  • the risk value is a value indicating the magnitude of the probability of occurrence of risk, and can take an arbitrary range of values.
  • the selection unit 120 calculates an evaluation value for each combination based on the risk value for each combination based on the learning data and the evaluation value calculation data. In addition, the selection unit 120 selects one optimal combination from among a plurality of combinations of the distribution function, the spatial parameter, and the temporal parameter based on the calculated evaluation value for each combination.
  • the output unit 130 predicts the risk in the target region using the combination selected by the selection unit 120, and outputs the result.
  • Each functional component of the information processing apparatus 10 may be realized by hardware (for example, a hard-wired electronic circuit or the like) that realizes each functional component, or a combination of hardware and software (for example: It may be realized by a combination of an electronic circuit and a program for controlling it.
  • hardware for example, a hard-wired electronic circuit or the like
  • software for example: It may be realized by a combination of an electronic circuit and a program for controlling it.
  • each functional configuration unit of the information processing apparatus 10 is realized by a combination of hardware and software will be further described.
  • FIG. 2 is a diagram conceptually showing the hardware configuration of the information processing apparatus 10. As shown in FIG. As shown in FIG. 2, the information processing apparatus 10 includes a bus 101, a processor 102, a memory 103, a storage device 104, an input / output interface 105, and a network interface 106.
  • the information processing apparatus 10 includes a bus 101, a processor 102, a memory 103, a storage device 104, an input / output interface 105, and a network interface 106.
  • the bus 101 is a data transmission path for the processor 102, the memory 103, the storage device 104, the input / output interface 105, and the network interface 106 to mutually transmit and receive data.
  • the method of connecting the processor 102, the memory 103, the storage device 104, the input / output interface 105, the network interface 106 and the like to one another is not limited to the bus connection.
  • the processor 102 is an arithmetic device such as a central processing unit (CPU) or a graphics processing unit (GPU).
  • the memory 103 is a main storage device implemented using a random access memory (RAM), a read only memory (ROM), or the like.
  • the storage device 104 is an auxiliary storage device realized using a hard disk drive (HDD), a solid state drive (SSD), a memory card, and the like.
  • the storage device 104 stores program modules for realizing each functional component (data division unit 110, selection unit 120, output unit 130) of the information processing apparatus 10.
  • the processor 102 implements the functions corresponding to each program module by reading the program modules into the memory 103 and executing them.
  • the input / output interface 105 is an interface for connecting the information processing apparatus 10 and peripheral devices.
  • the input device 30 and the display device 40 are connected to the input / output interface 105.
  • the input device 30 is an input device such as a keyboard and a mouse.
  • the display device 40 is, for example, a device for display output such as a liquid crystal display (LCD) or a cathode ray tube (CRT) display.
  • LCD liquid crystal display
  • CRT cathode ray tube
  • the network interface 106 is an interface for connecting the information processing apparatus 10 to a communication network such as a local area network (LAN) or a wide area network (WAN).
  • the method of connecting to the communication network may be wireless connection or wired connection.
  • the network interface 106 may be connected to an external device 20 including a history data storage unit 210 that stores risk occurrence history data.
  • the history data storage unit 210 may be included in the information processing apparatus 10.
  • the history data storage unit 210 accumulates data indicating the history of occurrence of risk (example: FIG. 3).
  • FIG. 3 is a diagram showing an example of information stored in the history data storage unit 210. As shown in FIG. In the example of FIG.
  • the history data storage unit 210 stores data including the crime type, the date and time of occurrence of the crime, and the location of the crime.
  • crime types are classified into categories such as types of crimes (eg: snatching, bicycle theft, shoplifting etc.) and attributes of victims (eg: gender, age etc.) May be
  • FIG. 4 is a flowchart illustrating the flow of processing in the information processing apparatus 10 according to the first embodiment.
  • the data dividing unit 110 receives, for example, a designation input of a target area by the operator of the information processing apparatus 10 via the input device 30 (S102). Then, from the risk occurrence history data stored in the history data storage unit 210, data of the target area specified in the process of S102 is extracted (S104). Here, the data division unit 110 may further receive an input for specifying a period, and may extract data of the specified period as a target. Then, the data division unit 110 divides the extracted data into learning data and evaluation value calculation data (S106). As an example, the data dividing unit 110 can divide data extracted as follows into learning data and data for evaluation value calculation. First, the data division unit 110 sets a sample time within a designated period.
  • the data division unit 110 specifies a point in time before the sample time based on the temporal parameter, and sets data included in a period defined by the sample time and the point in time in the past as learning data. Further, the data division unit 110 sets data included in a predetermined evaluation period after the sample time as evaluation value calculation data. Note that the data dividing unit 110 may set a plurality of sample times within a designated period, and set learning data and evaluation value calculation data at each of the plurality of sample times. By providing a plurality of sample times, a plurality of combinations of learning data and evaluation value calculation data are generated. Then, the reliability of the evaluation value is improved by calculating the evaluation value using a plurality of combinations.
  • the selection unit 120 calculates a risk value using learning data for each combination of the distribution function, the spatial parameter, and the temporal parameter (S108).
  • a plurality of combinations of the distribution function, the spatial parameters, and the temporal parameters may be stored in advance in a predetermined storage device (for example, the memory 103 or the storage device 104).
  • the selection unit 120 may create a plurality of combinations of distribution functions, spatial parameters, and temporal parameters according to predetermined rules.
  • the selection unit 120 calculates an evaluation value for each combination based on the risk value for each combination calculated for each combination using learning data and the data for evaluation value calculation (S110).
  • the selection unit 120 calculates the risk value for each combination calculated using learning data of each sample time, the number of risk occurrences in the evaluation period corresponding to each sample time (for calculating the evaluation value of each sample time Based on the number of data), it is possible to calculate a numerical value indicating how much the risk value calculated by each combination is related to the actual number of risk occurrences. Then, the selection unit 120 selects a combination with the highest evaluation value based on the calculated evaluation value for each combination (S112).
  • the output unit 130 calculates a risk distribution at a future point in time using a combination of a distribution function, a spatial parameter, and a temporal parameter selected for the target region, and uses it as a prediction result in the display device 40 or the like. It outputs (S114). For example, the output unit 130 outputs a map indicating the prediction result of the risk distribution to the display device 40 or the like. Further, the output unit 130 may output a map indicating the prediction result of the risk distribution to a printing device (not shown). In this case, a printing apparatus (not shown) outputs a map indicating the prediction result of the risk distribution.
  • processing up to S112 of selecting the combination of the optimal distribution function and each parameter and the processing of S114 of predicting the risk using the selected combination may not necessarily be performed in succession.
  • the height of the predictive accuracy is evaluated for each combination of the distribution function and the parameters of the distribution function using the historical data of the risk that has occurred in the past. Then, from among the plurality of combinations, the combination with the highest evaluation (that is, the combination with high predictive predictive value of risk) is selected. And, by predicting the risk of the target area using the combination selected in this way, it is possible to predict with high accuracy the risk that may occur in the target area. In addition, it is possible to expect an effect that it is easier for a person who performs risk management to take effective measures by improving the accuracy of prediction.
  • FIG. 5 is a block diagram conceptually showing the functional configuration of the information processing apparatus 10 of the second embodiment.
  • the information processing apparatus 10 includes a cell division unit 140, a generation unit 150, a selection unit 160, and an output unit 170.
  • the cell division unit 140 receives the input of the information specifying the target area, and divides the target area into a plurality of small areas (hereinafter referred to as "cells").
  • the generation unit 150 generates a plurality of combinations of a distribution function that indicates the risk distribution in the target region spatially and temporally, a spatial parameter of the distribution function, and a temporal parameter of the distribution function.
  • the selection unit 160 uses the risk occurrence history data for each cell in the risk occurrence history data of the target area, and evaluates each combination of the distribution function, the spatial parameter, and the temporal parameter generated by the generation unit 150. Calculate the value.
  • the selection unit 160 selects one combination out of a plurality of combinations of the distribution function, the spatial parameter, and the temporal parameter based on the calculated evaluation value for each combination. Specifically, the selection unit 160 selects a combination with the highest evaluation value.
  • the output unit 170 outputs the risk prediction result in the target area using the combination of the distribution function, the spatial parameter, and the temporal parameter selected by the selection unit 160 as in the first embodiment.
  • the hardware configuration of this embodiment is the same as that of the first embodiment (example: FIG. 2).
  • the storage device 104 stores program modules for realizing the functions of the cell division unit 140, the generation unit 150, the selection unit 160, and the output unit 170 described above.
  • the processor 102 of the information processing apparatus 10 executes these program modules to realize the functions of the above-described cell division unit 140, generation unit 150, selection unit 160, and output unit 170.
  • FIG. 6 is a flowchart illustrating the flow of processing in the information processing apparatus 10 according to the second embodiment. Here, an example of processing when the risk is “crime” is shown.
  • the information processing apparatus 10 receives an input of conditions for selecting an optimal combination of a distribution function and each parameter (S202).
  • the information processing apparatus 10 receives a designation input of a target area and a learning period (a period to which data used in evaluation for each combination belongs).
  • the information processing apparatus 10 further includes a reception unit (not shown) that receives a crime type (for example, a type of crime, sex / age of a crime victim, or a combination thereof) as one of the above conditions. It may be Further, the information processing apparatus 10 acquires a risk distribution function.
  • the risk distribution function is stored, for example, in the memory 103, the storage device 104, or an external storage device (not shown).
  • the distribution function of risk can be defined, for example, using the following equation (1).
  • R (g, k) means “risk value of cell g at time t k ”.
  • h s is a spatial bandwidth (spatial parameter)
  • h t is a temporal bandwidth (temporal parameter).
  • I k indicates the number of crime occurrence history data used to calculate the risk value.
  • i is a label number assigned to each crime occurrence history data used to calculate the risk value.
  • K s and K t respectively indicate the shape of a kernel function which determines the spatial and temporal spread in the distribution function. Kernel functions to be set to K s and K t can be selected from kernel functions of various shapes as shown in FIG. 7, for example. FIG.
  • FIG. 7 exemplifies kernel functions of five shapes (Uniform (solid line), Triangular (dotted line), Quartic (short broken line), Normal (dashed dotted line), Negative Exponential (long broken line)).
  • FIG. 7 is merely an example, and the kernel function is not limited to the shape shown in FIG. Also, the kernel functions set to K s and K t may have the same shape or different shapes. In the example of FIG. 7, 25 combinations are obtained as combinations of kernel functions with respect to the above equation (1).
  • the parameter used in the distribution function may be either a spatial parameter or a temporal parameter. For example, the definition of a distribution function that indicates that the risk distribution of the target area is different on Sunday and public holidays and on other days does not include spatial parameters but includes temporal parameters.
  • the distribution function may be defined as the sum of a plurality of terms, and a coefficient representing the proportion of each term may be used as a parameter.
  • two kernel functions may be selected from among the kernel functions shown in FIG. 7, and each kernel function may be multiplied by an individual coefficient and the sum may be taken as a distribution function. Also in this case, the optimum combination can be selected by the method of each embodiment.
  • Equation (2) is a specific example in which the kernel function is combined with the equation (1).
  • x g and y g indicate the position coordinates of the cell g (for example, the position coordinates of the center point of the cell) in the space defined by the x axis and the y axis orthogonal to each other.
  • x i and y i indicate position coordinates of a crime included in the ith crime occurrence history data in a space defined by x and y axes orthogonal to each other.
  • t i indicates the date and time of occurrence of a crime included in the ith crime occurrence history data.
  • the cell g the shorter the distance between the position coordinate (x g , y g ) of cell g and the position coordinate (x i , y i ) of the i-th crime occurrence history data, the cell g It can be seen that the risk value increases and the risk value of cell g decreases as the distance increases. Further, according to the above equation (2), the risk value of the cell g increases as the time t k and the occurrence date and time t i of the i-th crime occurrence history data are closer, the time t increases.
  • the risk value of the cell g decreases as the distance k between the date k and the occurrence date and time t i of the i-th crime occurrence history data labeled k increases.
  • the cell division unit 140 divides the designated target area into a plurality of cells (S204).
  • the cell division unit 140 can arbitrarily set the shape and size of the cell based on a predetermined rule or an input from the operator of the information processing apparatus 10. As an example, assuming that the length of the short side of the square including the target area is ⁇ s, the cell division unit 140 sets a square having a length of 1/100 of the ⁇ s as the length of one side as a unit cell. can do. Then, the cell division unit 140 determines the position of each unit cell in the target area so that the unit cells do not overlap each other, and adds a label g (information for identifying each cell) to each unit cell. Divide the target area by.
  • the generation unit 150 generates a plurality of combinations of the distribution function and each parameter (S206).
  • the generation unit 150 can generate a plurality of combinations of the distribution function and each parameter, for example, as follows.
  • the number K of sample times may be automatically determined by the generation unit 150, or may be arbitrarily set by an input of the operator.
  • the generation unit 150 when a period from 00:00 on January 1, 2000 to 23:59 on December 31, 2000 is designated, the generation unit 150 generates 1/100 of the period (366 days).
  • the generation unit 150 determines a period (evaluation period ⁇ t) in which the number of crime occurrences for each sample time is counted. For example, based on the crime type and position information of the crime occurrence history data stored in the history data storage unit 210, the generation unit 150 first creates crime occurrence data of the crime type and the target area designated in the process of S202. Identify. Then, the generation unit 150 can set an average value of the occurrence intervals calculated based on the occurrence date and time of the specified crime occurrence data as the evaluation period ⁇ t. Specifically, when a specified type of crime occurs at an average interval of 3 days in the target area, the generation unit 150 can set ⁇ t to 3 days.
  • the evaluation period may be a value different for each sample time.
  • the generation unit 150 generates the spatial parameter h s by a constant multiple (for example, 1, 5, 10 times) of the length ⁇ s of one side of the unit cell set by the cell division unit 140, and the evaluation period A constant multiple of ⁇ t (e.g., 5, 10, 100) can be set as the temporal parameter h t . Then, the generation unit 150 sets a spatial parameter h s and a temporal parameter h t for each of a plurality of distribution functions stored in advance in, for example, the memory 103, the storage device 104, or another storage device (not shown). For example, a table as shown in FIG. 8 is generated. FIG.
  • FIG. 8 is a diagram showing an example of a table storing combinations of distribution functions, spatial parameters, and temporal parameters. As illustrated in FIG. 8, the table stores the spatial parameter h s and the temporal parameter h t in association with the risk distribution function (such as the above equation (2)).
  • Non-Patent Document 1 discloses a technique for analyzing the phenomenon of proximity repeated damage of crime occurrence by calculating a statistic called a space-time K function from crime occurrence history data in a certain area. Proximity repeated damage is the property that if a crime occurs in a certain place, crime will occur repeatedly in a short period of time in the vicinity of that place. It is said that the presence or absence of close repeat damage can be determined by analyzing temporally and spatially the degree of accumulation of crimes that have occurred. In Non-Patent Document 1, this is analyzed using a space-time K function.
  • the value obtained by calculating the spatiotemporal K function in Non-Patent Document 1 from crime occurrence history data (hereinafter referred to as “D 0 ”) is the degree or time at which the generated crimes are accumulated temporally and spatially It is supposed to represent the range. That is, D 0 represents the temporal and spatial distribution of crime occurrence.
  • the generation unit 150 can use this D 0 as a risk distribution function.
  • the generation unit 150 may evaluate “the length of one side of the unit cell ⁇ s” as “the distance band”, “the length of the short side of the target area” as the “range of distance”, and A combination of a distribution function and each parameter can be generated by setting D0 as “Period” or the like as “Period ⁇ t” and “Time range” and calculating D 0 according to the method of Non-Patent Document 1.
  • the selection unit 160 selects one combination from a plurality of combinations of distribution functions, spatial parameters, and temporal parameters stored in a table as exemplified in FIG.
  • the risk value of is calculated (S208).
  • learning data crime occurrence history data
  • FIG. 9 is a diagram for explaining the flow of the selection unit 160 extracting learning data.
  • the cross indicates the crime occurrence history data satisfying the equation (3).
  • Selection unit 160 the distribution function selected in the processing of S208, spatial parameters, and a combination of temporal parameters, sample time t 1, t 2, ⁇ , t K I k pieces of learning that has been extracted for each Using the data, the risk values of all the cells at each of the sample times t 1 , t 2 ,..., T K are calculated.
  • the selection unit 160 as an evaluation value calculation data, sample time t 1, t 2, ⁇ ⁇ ⁇ , crime history data corresponding to t K crimes occurring within each evaluation period Delta] t (hereinafter, "evaluation The “value calculation data” is also extracted from the history data storage unit 210, and the number is identified (S210). Specifically, the selection unit 160 selects “t k ⁇ occurrence date time ⁇ t k from among the crime occurrence history data of the target area stored in the history data storage unit 210 as evaluation value calculation data. Crime occurrence history data satisfying + ⁇ t ”is extracted.
  • the selection unit 160 counts the total number of evaluation value calculation data for each cell based on the position information of the extracted evaluation value calculation data, and calculates the number of crime occurrences of each cell at the sample time t k .
  • the crime occurrence number of the cell g at the sample time t k is expressed as follows in the equation.
  • the selection unit 160 is based on the risk value for each cell in each combination calculated by the above equation (4) and the number of crime occurrences of each cell at the sample time t k calculated by the above equation (5). An evaluation value for each combination is calculated (S212).
  • the selection unit 160 can calculate the correlation coefficient CORR (h s , h t ) using the following equation (6).
  • the symbol ⁇ > means the expected value in all cells distinguished by all sample times t k and the label g.
  • the part represented using symbol ⁇ > can be replaced as shown in the following formula (7).
  • the correlation coefficient CORR (h s , h t ) indicates the strength of the association between the risk value calculated using the combination of the distribution function, the spatial parameter, and the temporal parameter, and the number of crime occurrences. As the absolute value of the correlation coefficient CORR (h s , h t ) is closer to 1, it indicates that the numerical values are more related to each other. For example, when the correlation coefficient CORR (h s , h t ) takes a positive value close to 1, a cell having a higher risk value calculated by a combination of a selected distribution function, spatial parameters, and temporal parameters It can be determined that the probability of a crime occurring is also high.
  • the selection unit 160 may calculate the risk value relative rank sum, which is an index different from the correlation coefficient.
  • the selection unit 160 can calculate the risk value relative rank sum, for example, as follows. First, the selection unit 160 sets the risk value for each cell calculated using a combination of a distribution function, a spatial parameter, and a temporal parameter, and learning data that satisfies the condition of the above equation (3) at a certain sample time. Rank each cell based on it. For example, the selection unit 160 ranks the cells in the ascending order of the first place and the second place from the cell with the largest calculated risk value.
  • the selection unit 160 specifies a cell corresponding to the evaluation value calculation data (that is, a cell in which a crime of the evaluation value calculation data has occurred), and identifies A value corresponding to the rank of the selected cell is added to the risk value relative rank sum.
  • the selection unit 160 repeats the above process at all sample times (t 1 , t 2 , t 3 ,..., T K ) to calculate the risk value relative rank sum.
  • the risk value relative rank sum may be expressed by the following equation (8).
  • the selection unit 160 selects, for example, nine cells, for example, (1) cell C3, (2) cell B2, (3) cell A3 and cell B1, (4) cell A2 and cell C2, (5) cell A1. And B3, (6) cell C1, and so on. Then, based on the position information of the evaluation value calculation data extracted within the evaluation period ⁇ t of the sample time, the selection unit 160 determines in which cell the crime of the evaluation value calculation data has occurred.
  • An evaluation value obtained as a result of repeating the above-described process on all evaluation value calculation data extracted within the evaluation period ⁇ t is “a risk value relative rank sum at a certain sample time”. Then, all the sample time the above process (t 1, t 2, t 3, ⁇ , t K) By performing, the "final risk value relative rank sum” is obtained.
  • the “final risk value relative rank sum” is a total value or an average value of results obtained at all sample times (t 1 , t 2 , t 3 ,..., T K ).
  • the selection unit 160 calculates the correlation coefficient CORR (h s , h t ) for each combination and the risk value relative rank sum calculated using, for example, the above equation (6) or the above equation (8).
  • the values are stored in a table (example: FIG. 11) stored in the memory 103 or the like as an evaluation value for each combination (S214).
  • FIG. 11 is a diagram illustrating an example of a table storing evaluation values for each combination. In the example of this figure, the selecting unit 160 adds the correlation coefficient “0.11” calculated for the combination of the first row to the column of the evaluation value.
  • the selection unit 160 determines whether evaluation values of all combinations have been calculated (S216).
  • the selection unit 160 can determine whether the evaluation values of all the combinations have been calculated, for example, based on whether all the columns of the evaluation values of the table illustrated in FIG. 11 have been input. If the evaluation values of all the combinations have not been calculated (S216: NO), the process returns to S208, and the process of calculating the evaluation values for the new combination is repeated. On the other hand, when the evaluation values of all the combinations have been calculated (S216: YES), the selection unit 160 selects the combination with the highest evaluation value, and stores the combination in the table (example: FIG. 12) that stores the optimum combination. (S218). In the table illustrated in FIG.
  • the selection unit 160 can use the input of S202 (for example, a crime type, a target area, a learning period, and the like) as information indicating a condition.
  • the output unit 170 receives an input of a condition (crime type, target area, date and time of performing prediction, period of prediction, etc.) regarding the prediction.
  • a condition relating to prediction is input
  • the output unit 170 calculates the future risk distribution using the optimal combination of the distribution function, spatial parameters, and temporal parameters selected for the condition, and Are output to the display device 40 as a prediction result (S220).
  • the output unit 170 outputs a map indicating the prediction result of the risk distribution to the display device 40 or the like.
  • the output unit 170 may output a map indicating the prediction result of the risk distribution to a printing device (not shown). In this case, a printing apparatus (not shown) outputs a map indicating the prediction result of the risk distribution.
  • the output unit 170 refers to a table as shown in FIG. 12 based on the input prediction conditions (crime type, target area, date and time t p , prediction period ⁇ t ′, etc.) Read out combinations of distribution functions, spatial parameters, and temporal parameters that meet the conditions.
  • the output unit 170 select a combination in which the “learning period” in the table illustrated in FIG. 12 is as close as possible to the period ⁇ t ′ of prediction.
  • the output unit 170 corrects, for example, the evaluation value of the combination according to the degree to which the “learning period” of the table illustrated in FIG. 12 is separated from the start time of the prediction period ⁇ t ′. I do.
  • the output unit 170 read on the input conditions, distribution function, the spatial parameter, and a combination of temporal parameters, using the I p pieces of data, date and time t p Calculate the risk value of each cell in For example, when a combination of the first line of FIG. 12 is selected, the equation (10) shown below, the risk value of each cell in date and time t p R (g, p) is calculated.
  • the output unit 170 the risk value R (g, p) and cell area Delta] s 2 of the target region in the following value obtained by multiplying a forecast period Derutati', and outputs as a prediction result of criminal incidents.
  • processing up to S218 for selecting the combination of the optimal distribution function and each parameter and the processing for S220 for predicting the risk using the selected combination may not necessarily be performed in succession.
  • the prediction result of a risk is output using the optimal combination according to the input conditions (type of risk, object area
  • the same effect as that of the first embodiment can be obtained also by the present embodiment.
  • the present embodiment has the same configuration as that of the second embodiment except for the following points.
  • FIG. 13 is a block diagram conceptually showing the functional configuration of the information processing apparatus 10 of the third embodiment. As shown in FIG. 13, the information processing apparatus 10 of the present embodiment further includes an acquisition unit 180 in addition to the configuration of the second embodiment.
  • the acquisition unit 180 acquires a cell coverage rate.
  • the cell coverage rate is a value indicating the ratio of cells to which personnel or mobiles can be dispatched among the plurality of cells divided by the cell division unit 140.
  • the term "mobile” as used herein includes a manned mobile moving with personnel such as a patrol vehicle and an unmanned mobile such as a drone.
  • the hardware configuration of this embodiment is the same as that of the first embodiment (example: FIG. 2).
  • the storage device 104 of the present embodiment further stores a program module for realizing the function of the acquisition unit 180 described above.
  • the processor 102 of the information processing apparatus 10 executes the program module to implement the function of the acquisition unit 180 described above.
  • FIG. 14 is a flowchart illustrating the flow of processing in the information processing apparatus 10 according to the third embodiment.
  • an example of processing when the risk is “crime” is shown.
  • an operation different from that of the second embodiment will be mainly described.
  • the processes of S302 to S310 in FIG. 14 are the same as the processes of S202 to S210 in FIG.
  • the acquisition unit 180 acquires a cell coverage rate (S312).
  • the acquisition unit 180 can display, for example, a screen for causing the operator to input the cell coverage on the display device 40, and acquire the cell coverage based on the information input by the operator.
  • the acquisition unit 180 passes the acquired cell coverage to the selection unit 160.
  • the selection unit 160 uses the cell coverage rate acquired by the acquisition unit 180 and the risk value of each cell calculated for each sample time calculated using the combination selected in the process of S308, for all the cells in the target area. Among them, a cell (hereinafter referred to as a “high risk cell”) to which personnel and mobile units should be dispatched is specified (S 314). Generally, a high risk cell to be dispatched for dispatching personnel and mobile bodies is determined with priority given to cells having a relatively high risk value.
  • selection unit 160 the sample time t 1, t 2, t 3 , ⁇ , lined cells of the target area in a high risk values sequentially for each t K, sample time for each A cell (high risk cell) corresponding to the upper ⁇ % is identified in, and its set is G k ( ⁇ ) .
  • G 1 ( ⁇ ) is a set of high risk cells at sample time t 1 .
  • selection unit 160 the sample time t 1, t 2, t 3 , ⁇ , at each t K, risk value R (g, k) the 100 cells in the descending order identified as high-risk cell Then, using the identified cell label g, a set of high risk cells G k ( ⁇ ) is generated.
  • G k ( ⁇ ) for all sample times (t 1 , t 2 , t 3 ,..., T K ) includes a cell with the number of sample times K ⁇ 100.
  • Selection unit 160 the sample time t 1, t 2, t 3 , ⁇ , t K in each crime incidence and all the cells in the set G k of high-risk cells identified in the process of S314 (beta)
  • the evaluation value for each combination is calculated based on the number of crime occurrences in (S316). Specifically, the selection unit 160 calculates an index (hereinafter referred to as “patrol cover rate”) represented by the following equation (12) as an evaluation value for each combination.
  • Equation (12) is an example in the case where the cell coverage rate ⁇ is 1%. For example, when the cell coverage rate ⁇ is 10%, the equation (12) takes different values.
  • the numerator of division is the total sample time (t 1 , t 2 , t 3 ,...,) Of the sum of the number of high risk cell occurrence crimes at sample time t k specified in the process of S 314.
  • the summation at t K ) is shown.
  • the denominator of division is the sum of the total number of crime occurrences of all cells at sample time t k at all sample times (t 1 , t 2 , t 3 ,..., T K )
  • the selection unit 160 selects all the sample times (t 1 , t 1 ,..., T 1 ) of the number of occurrences in high risk cells (that is, cells targeted for patrol) among all crimes occurring in the evaluation period ⁇ t at a certain sample time t k t 2, t 3, ⁇ , t the sum of at K), the total sample time of the crime the number of a certain sample time t k all of the cells that have occurred in the evaluation period ⁇ t of (t 1, t 2, t 3 ,..., T K ), it is possible to calculate the patrol coverage for each combination.
  • the selection unit 160 stores, for example, the patrol coverage rate for each combination calculated using the above equation (12) in a table (eg, FIG. 15) stored in the memory 103 or the like as an evaluation value for each combination (S318) ).
  • FIG. 15 is a diagram showing an example of a table storing evaluation values for each combination.
  • the selection part 160 is adding the patrol coverage "11%" calculated with respect to the combination of the 1st line to the column of an evaluation value.
  • the selection unit 160 determines whether evaluation values of all combinations have been calculated (S320).
  • the selecting unit 160 can determine whether the evaluation values of all the combinations have been calculated, for example, based on whether all the columns of the evaluation values of the table illustrated in FIG. 15 have been input. If the evaluation values of all the combinations have not been calculated (S320: NO), the process returns to S308, and the process of calculating the evaluation values for the new combination is repeated. On the other hand, when the evaluation values of all the combinations are calculated (S320: YES), the selecting unit 160 selects the combination having the highest evaluation value, and stores the combination in the table (example: FIG. 16) for storing the optimum combination. (S322). In the table illustrated in FIG.
  • the selection unit 160 can use the input (for example, crime type, target area, learning period, and the like) in S302 and the cell coverage rate acquired in S312 as information indicating a condition.
  • the output unit 170 receives an input of a condition (crime type, target area, date and time of prediction, time period of prediction, cell coverage, etc.) regarding the prediction.
  • a condition relating to prediction is input
  • the output unit 170 calculates a risk distribution at a future point in time using a combination of a distribution function, spatial parameters, and temporal parameters selected for the condition, and predicts it.
  • the information is output to the display device 40 or the like (S324).
  • the output unit 170 outputs a map indicating the prediction result of the risk distribution to the display device 40 or the like.
  • the output unit 170 may output a map indicating the prediction result of the risk distribution to a printing device (not shown). In this case, a printing apparatus (not shown) outputs a map indicating the prediction result of the risk distribution.
  • the output unit 170 generates a table as shown in FIG. 16 based on the input prediction conditions (criminal type, target area, date and time t p , prediction period ⁇ t ′, cell coverage etc.).
  • the input prediction conditions discriminal type, target area, date and time t p , prediction period ⁇ t ′, cell coverage etc.
  • the cell coverage is a factor that affects the evaluation value used when selecting the “optimal combination”, for example, as shown in the above-mentioned equation (12). Therefore, it is considered that the optimal combination of the distribution function, the spatial parameter and the temporal parameter is different if the cell coverage rate inputted as the condition for prediction is different. For example, from the table illustrated in FIG.
  • the output unit 170 selects a combination having a cell coverage rate as close as possible to the cell coverage rate input as a condition for prediction as a combination used in the prediction of the risk distribution.
  • the output unit 170 can select a combination in which the absolute value of the cell coverage difference is equal to or less than a predetermined threshold.
  • a predetermined threshold As a specific example, it is assumed that the crime type is bicycle theft and the xx city in the target area is divided into 10000 cells.
  • the cell coverage rate of the condition regarding prediction is 1.5%. This means that it is possible to dispatch personnel or mobiles to 150 cells of the cells in the target area of ⁇ city. Further, it is assumed that the above-mentioned predetermined threshold is 1%. In this case, in the table of FIG.
  • combinations of distribution functions, spatial parameters, and temporal parameters that meet the condition (crime type and target area) on prediction are the first and second rows.
  • the cell coverage rate in the first row is 1%
  • the cell coverage rate in the second row is 10%, both being different from the cell coverage rate of 1.5% of the condition regarding prediction.
  • the absolute value of the difference between the cell coverage rate of 1% in the first row and the cell coverage rate of 1.5% of the condition regarding prediction is equal to or less than a predetermined threshold (1%). Therefore, the output unit 170 can select the first row as a combination used for the prediction of the risk distribution. If the corresponding combination does not exist in the table illustrated in FIG. 16, the selection unit 160 executes the processing from S314 to S322 to update the table, using the cell coverage ratio input as the condition for prediction. May be After that, the output unit 170 can read out the combination that meets the condition related to the prediction from the updated table.
  • a high risk cell (cell to be patrolled) is calculated based on the risk value of each cell calculated using a combination of the distribution function and each parameter and the cell coverage rate (proportion of cells that can be patrolled). ) Is determined. Then, the ratio of the number of crime occurrences of high risk cells to the number of crime occurrences of all cells is used as an evaluation value for each combination. Then, based on the evaluation value calculated in this manner, the “optimal combination” is selected, and is stored in a predetermined storage unit together with the “cell coverage rate”. In this way, when there are only a limited number of cells to which personnel and equipment can be dispatched in the target area, an optimal combination of distribution function, spatial parameter, and temporal parameter is selected according to the proportion of the cell (cell coverage). Can make accurate predictions.
  • the cell type is, for example, the land use type of the national land numerical information provided by the Ministry of Land, Infrastructure, Transport and Tourism.
  • the following process may be further performed.
  • the cell division unit 140 determines whether the land use type corresponding to each cell is the type of patrol target (for example, “building site” or the like) with reference to the land numerical value information, and the type of patrol target is The cell is given a predetermined flag.
  • the selection unit 160 identifies a high risk cell for cells to which a predetermined flag is given, and calculates a patrol coverage rate based on the number of crime occurrences in the high risk cell. By doing this, it is possible to select an optimal combination that maximizes predictive predictive value in a desired type of cell, such as “building site”. This is useful in the case where a specific place is to be monitored, such as when planning a patrol plan of a residential area. Also in the case of the second embodiment, the selection unit 160 can calculate the correlation coefficient and the risk value relative rank total for the cell corresponding to the desired cell type.
  • the selection unit 160 may be configured to hold such information.
  • the distribution function, the spatial parameter, and the temporal parameter based on the evaluation value for each combination calculated based on the risk value for each combination based on the learning data and the data for calculating the evaluation value.
  • Selection means for selecting one combination from among combinations of An output unit that outputs a risk prediction result in the target area using the one combination selected by the selection unit;
  • An information processing apparatus comprising: 2. Cell dividing means for dividing the target area into a plurality of cells; A generation unit that generates a plurality of combinations of a distribution function that indicates the risk distribution in the target region spatially and temporally, a spatial parameter of the distribution function, and a temporal parameter of the distribution function; From the risk occurrence history data of the target area, the evaluation value for each combination is calculated using the risk occurrence history data for each cell, and one of the plurality of combinations is calculated based on the evaluation value for each combination.
  • Selection means for selecting a combination of An output unit that outputs a risk prediction result in the target area using the one combination selected by the selection unit;
  • An information processing apparatus comprising: 3. It further comprises acquiring means for acquiring a cell coverage rate indicating a ratio of cells to which personnel or mobiles can be dispatched among the plurality of cells, The selection means calculates the evaluation value based on the cell coverage rate. 2. The information processing apparatus according to claim 1. 4. The output means determines a combination to be used for generating the risk prediction result based on a second cell coverage as a condition for prediction, which is input separately from the cell coverage. 3. The information processing apparatus according to claim 1. 5.
  • the selection means evaluates the correlation coefficient calculated based on the risk value for each combination of the distribution function, the spatial parameter, and the temporal parameter, and the number of risk occurrence based on the risk occurrence history data. Calculate as a value, 2.
  • the selection means is a risk value relative rank sum calculated based on the risk value for each combination of the distribution function, the spatial parameter, and the temporal parameter, and the number of risk occurrence based on the risk occurrence history data, Calculated as the evaluation value 2.
  • the generation unit sets a plurality of sample times in a designated period, and the risk value calculated based on data of a predetermined time before the sample time among the risk occurrence history data and the combination.
  • the evaluation value for each combination is calculated using data of the risk occurrence history data up to a predetermined time after the sample time, 2.
  • the system further comprises a reception unit for receiving a designation input of the type of risk, The selection means selects data corresponding to the type of risk designated by the designation input from among the risk occurrence history data of the target area. 1.
  • the information processing apparatus according to any one of the above. 9.
  • the computer is The risk occurrence history data of the target area, a distribution function indicating the risk distribution in the target area spatially and temporally, a spatial parameter of the distribution function, and a risk value for each combination of temporal parameters of the distribution function Divided into learning data used for calculation and data for evaluation value calculation used for evaluation of a combination of the distribution function, the spatial parameter, and the temporal parameter, The distribution function, the spatial parameter, and the temporal parameter based on the evaluation value for each combination calculated based on the risk value for each combination based on the learning data and the data for calculating the evaluation value. Select one combination from among the combinations of Output the risk prediction result in the target area using the selected one combination Risk prediction methods, including: 10.
  • the computer is Divide the target area into multiple cells, Generating a plurality of combinations of a distribution function that indicates the risk distribution in the target region spatially and temporally, a spatial parameter of the distribution function, and a temporal parameter of the distribution function, From the risk occurrence history data of the target area, the evaluation value for each combination is calculated using the risk occurrence history data for each cell, and one of the plurality of combinations is calculated based on the evaluation value for each combination.
  • the computer Among the plurality of cells, obtain a cell coverage rate indicating a ratio of cells to which personnel or mobiles can be dispatched, Calculating the evaluation value based on the cell coverage rate; 10. including.
  • Risk prediction method described in. 12. The computer The combination to be used to generate the risk prediction result is determined based on a second cell coverage as a condition for prediction, which is input separately from the cell coverage. 11. including. Risk prediction method described in. 13.
  • the computer A correlation coefficient calculated based on the risk value for each combination of the distribution function, the spatial parameter, and the temporal parameter, and the number of risk occurrence based on the risk occurrence history data is calculated as the evaluation value. 10. including. Risk prediction method described in. 14.
  • the computer The risk value relative rank sum calculated based on the risk value for each combination of the distribution function, the spatial parameter, and the temporal parameter, and the number of risk occurrence based on the risk occurrence history data is calculated as the evaluation value Do, 10. including. Risk prediction method described in. 15.
  • the computer A plurality of sample times are set in a designated period, and the risk value calculated based on data of a predetermined time before the sample time among the risk occurrence history data and the combination, and the risk occurrence history The evaluation value for each combination is calculated using data from the sample time to a predetermined time after the sample time among the data. 10. including. To 14. The risk prediction method described in any one of the above. 16. The computer Accept the specified input of the type of risk, The data corresponding to the type of risk specified by the specified input is selected from the risk occurrence history data of the target area, 9. including. To 15. The risk prediction method described in any one of the above. 17. 9 to the computer. To 16. A program that executes the risk prediction method described in any one of the above.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Emergency Management (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Alarm Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

情報処理装置(10)は、対象領域のリスク発生履歴データを、対象領域におけるリスク分布を空間的および時間的に示す分布関数、分布関数の空間的パラメータ、および、分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、分布関数、空間的パラメータ、および時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割するデータ分割部(110)と、学習データに基づく組み合わせ毎のリスク値と評価値算出用データとを基に算出された組み合わせ毎の評価値に基づいて、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせの中から、一の組み合わせを選択する選択部(120)と、選択された一の組み合わせを用いて、対象領域におけるリスク予測結果を出力する出力部(130)と、を備える。

Description

情報処理装置、リスク予測方法、およびプログラム
 本発明は、発生し得るリスクを予測する技術に関する。
 犯罪や疾病といったリスクを予測する技術の一例が、例えば下記特許文献および非特許文献に開示されている。
 下記特許文献1では、サーバが、過去の犯罪データを数学的に分析し、いつ、どこで、どのようなタイプの犯罪が起こるかについての定量的確率(すなわち予測)を算出し、当該予測をboxと呼ぶターゲットリアに投影し、数学的な分析に基いて警察のリソース配置案を提案する技術が開示されている。その他にも、下記特許文献2および3には、過去に発生した犯罪データを数学的に分析し、対象の領域におけるリスクを予測して提示する技術が開示されている。
 また、下記特許文献4には、監視カメラの表示頻度および表示頻度の増加度合いに基づいて、表示頻度の少ない監視カメラを特定することによって、監視カメラの設置レイアウトを見直す際に役立つ情報を提供する技術が開示されている。
 また、下記非特許文献1には、ある領域における犯罪発生履歴データから時空間K関数という統計量を算出することで犯罪発生の近接反復被害の現象を分析する技術が開示されている。犯罪発生の近接反復被害とは、ある犯罪発生の近くの場所でかつ時間的に短い間に繰り返し発生する、という性質で、発生の集積度合いを時間的空間的に分析することで、近接反復被害の有無がわかるとされ、その分析に時空間K関数を用いている。
米国特許第8949164号明細書 米国特許第9129219号明細書 米国特許出願公開第2015/0379413号明細書 特開2012-213124号公報
菊池城治、雨宮護、島田貴仁、齊藤知範、原田豊、「近接反復被害の罪種間比較 -時空間K関数の応用-」、GIS-理論と応用、2010、Vol.18、No.2、pp.21-30
 上述したような、発生し得るリスクの予測を行う技術においては、その予測結果と実際の観測結果(リスクの発生結果)とが高い確率で一致することが望ましい。
 本発明は、上記の課題に鑑みてなされたものである。本発明の目的の一つは、発生し得るリスクを高い精度で予測可能とする技術を提供することである。
 本発明によれば、
 対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割するデータ分割手段と、
 前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択する選択手段と、
 前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
 を備える情報処理装置が提供される。
 本発明によれば、
 対象領域を複数のセルに分割するセル分割手段と、
 前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成する生成手段と、
 前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択する選択手段と、
 前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
 を備える情報処理装置が提供される。
 本発明によれば、
 コンピュータが、
 対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割し、
 前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択し、
 選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
 ことを含む第1のリスク予測方法が提供される。
 本発明によれば、
 対象領域を複数のセルに分割し、
 前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成し、
 前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択し、
 選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
 ことを含む第2のリスク予測方法が提供される。
 本発明によれば、
 コンピュータに第1のリスク予測方法を実行させるプログラムが提供される。
 本発明によれば、
 コンピュータに第2のリスク予測方法を実行させるプログラムが提供される。
 本発明によれば、発生し得るリスクを高い精度で予測可能とする技術が提供される。
 上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
第1実施形態における情報処理装置の機能構成を概念的に示すブロック図である。 情報処理装置のハードウエア構成を概念的に示す図である。 履歴データ記憶部が記憶する情報の一例を示す図である。 第1実施形態の情報処理装置での処理の流れを例示するフローチャートである。 第2実施形態の情報処理装置の機能構成を概念的に示すブロック図である。 第2実施形態の情報処理装置での処理の流れを例示するフローチャートである。 カーネル関数を例示する図である。 分布関数、空間的パラメータ、および時間的パラメータの組み合わせを記憶するテーブルの一例を示す図である。 選択部が学習データを抽出する流れを説明するための図である。 リスク値相対ランク合計を算出する流れを説明するための図である。 組み合わせ毎の評価値を記憶するテーブルの一例を示す図である。 分布関数、空間的パラメータ、および時間的パラメータの最適な組み合わせを記憶するテーブルの一例を示す図である。 第3実施形態の情報処理装置の機能構成を概念的に示すブロック図である。 第3実施形態の情報処理装置での処理の流れを例示するフローチャートである。 組み合わせ毎の評価値を記憶するテーブルの一例を示す図である。 分布関数、空間的パラメータ、および時間的パラメータの最適な組み合わせを記憶するテーブルの一例を示す図である。
 以下、本発明の実施形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また、特に説明する場合を除き、各ブロック図において、各ブロックは、ハードウエア単位の構成ではなく、機能単位の構成を表している。
 [概要説明]
 本発明に係る情報処理装置は、過去に発生したリスクの履歴データ(以下、「リスク発生履歴データ」と表記)を用いて、リスクの分布を空間的および時間的に示す分布関数、並びに、該分布関数で使用される空間的パラメータおよび時間的パラメータの組み合わせの中から、最適な組み合わせを決定する。本明細書において、「最適な組み合わせ」とは、リスクの予測的中率が、その他の組み合わせよりも高い組み合わせのことを言う。また、本明細書における「リスク」とは、特に限定されないが、例えば、犯罪、疾病、感染症(インフルエンザなど)、家畜または農作物の伝染病などによる病害、害虫、地震や台風といった自然災害などである。以下の各実施形態では、これらの「リスク」のうち「犯罪」を取り扱うケースを主に例示する。
 [第1実施形態]
 〔機能構成〕
 図1は、第1実施形態における情報処理装置10の機能構成を概念的に示すブロック図である。図1に示されるように、本実施形態の情報処理装置10は、データ分割部110、選択部120、および、出力部130を有する。
 データ分割部110は、対象領域のリスク発生履歴データを、分布関数、空間的パラメータ、時間的パラメータの組み合わせ毎のリスク値の算出に用いるデータ(以下、「学習データ」と表記)と、当該組み合わせの評価に用いるデータ(以下、評価値算出用データ)と表記)と、に分割する。ここで、リスク値とは、リスクが発生する確率の高低を示す値であり、任意の範囲の値を取り得る。選択部120は、学習データに基づく組み合わせ毎のリスク値と、評価値算出用データとを基に、当該組み合わせ毎の評価値を算出する。また、選択部120は、算出された組み合わせ毎の評価値に基づいて、分布関数、空間的パラメータ、および、時間的パラメータの複数の組み合わせの中から、最適な組み合わせを一つ選択する。出力部130は、選択部120により選択された組み合わせを用いて、対象領域におけるリスクを予測し、その結果を出力する。
 〔ハードウエア構成〕
 情報処理装置10の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、情報処理装置10の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。
 図2は、情報処理装置10のハードウエア構成を概念的に示す図である。図2に示されるように、情報処理装置10は、バス101、プロセッサ102、メモリ103、ストレージデバイス104、入出力インタフェース105、及びネットワークインタフェース106を含んで構成される。
 バス101は、プロセッサ102、メモリ103、ストレージデバイス104、入出力インタフェース105、及びネットワークインタフェース106が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ102、メモリ103、ストレージデバイス104、入出力インタフェース105、及びネットワークインタフェース106などを互いに接続する方法は、バス接続に限定されない。
 プロセッサ102は、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)などの演算装置である。メモリ103は、RAM(Random Access Memory)やROM(Read Only Memory)などを用いて実現される主記憶装置である。ストレージデバイス104は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカードなどを用いて実現される補助記憶装置である。
 ストレージデバイス104は、情報処理装置10の各機能構成部(データ分割部110、選択部120、出力部130)を実現するプログラムモジュールを記憶している。プロセッサ102は、これら各プログラムモジュールをメモリ103に読み出して実行することで、各プログラムモジュールに対応する機能を実現する。
 入出力インタフェース105は、情報処理装置10と周辺機器とを接続するためのインタフェースである。入出力インタフェース105には、入力装置30や表示装置40等が接続される。入力装置30は、キーボードやマウスといった入力用のデバイスである。表示装置40は、例えば、LCD(Liquid Crystal Display)やCRT(Cathode Ray Tube)ディスプレイといった表示出力用のデバイスである。
 ネットワークインタフェース106は、情報処理装置10をLAN(Local Area Network)やWAN(Wide Area Network)などの通信網に接続するためのインタフェースである。なお、通信網に接続する方法は、無線接続であってもよいし、有線接続であってもよい。ネットワークインタフェース106には、例えば、リスク発生履歴データを記憶する履歴データ記憶部210を備える外部装置20などが接続され得る。また、履歴データ記憶部210は、情報処理装置10に備えられていてもよい。履歴データ記憶部210は、リスクの発生履歴を示すデータを蓄積する(例:図3)。図3は、履歴データ記憶部210が記憶する情報の一例を示す図である。図3の例において、履歴データ記憶部210は、犯罪タイプ、犯罪の発生年月日および時刻、並びに、犯罪の発生位置を含むデータを記憶している。なお、図3に示されるように、犯罪タイプは、例えば、犯罪の種類(例:ひったくり、自転車盗、万引き等)や、被害者の属性(例:性別、年齢等)といったカテゴリーに分類されていてもよい。
 〔動作例〕
 図4を用いて、第1実施形態の情報処理装置10の動作例を説明する。図4は、第1実施形態の情報処理装置10での処理の流れを例示するフローチャートである。
 データ分割部110は、例えば、情報処理装置10のオペレータによる対象領域の指定入力を、入力装置30を介して受け付ける(S102)。そして、履歴データ記憶部210に記憶されているリスク発生履歴データの中から、S102の処理で指定された対象領域のデータを抽出する(S104)。ここで、データ分割部110は、期間を指定する入力を更に受け付け、当該指定期間のデータを対象として抽出してもよい。そして、データ分割部110は、抽出したデータを学習データと評価値算出用データとに分割する(S106)。一例として、データ分割部110は、次のように抽出したデータを学習データと評価値算出用データとに分割することができる。まず、データ分割部110は、指定された期間内にサンプル時刻を設定する。そして、データ分割部110は、時間的パラメータに基づいて当該サンプル時刻よりも過去の時点を特定し、サンプル時刻と過去の時点とで定義される期間に含まれるデータを学習データとして設定する。またデータ分割部110は、サンプル時刻後の所定の評価期間に含まれるデータを評価値算出用データとして設定する。なお、データ分割部110は、指定された期間内に、複数のサンプル時刻を設定し、その複数のサンプル時刻の各々において、学習データと評価値算出用データとを設定してもよい。複数のサンプル時刻を設けることより、学習データと評価値算出用データの組み合わせが複数生成される。そして、複数の組み合わせを用いて評価値を算出することによって、評価値の信頼性が向上する。
 そして、選択部120は、分布関数、空間的パラメータ、および時間的パラメータの組み合わせ毎に、学習データを用いてリスク値を算出する(S108)。ここで、分布関数、空間的パラメータ、および時間的パラメータの複数の組み合わせは、所定の記憶装置(例えば、メモリ103やストレージデバイス104)に予め記憶されていてもよい。また、選択部120が、所定のルールに従って分布関数、空間的パラメータ、および時間的パラメータの複数の組み合わせを作成してもよい。さらに、選択部120は、学習データを用いて組み合わせ毎に算出された組み合わせ毎のリスク値と、評価値算出用データとに基づいて、組み合わせ毎の評価値を算出する(S110)。一例として、選択部120は、各サンプル時刻の学習データを用いて算出された組み合わせ毎のリスクの値と、各サンプル時刻に対応する評価期間でのリスク発生件数(各サンプル時刻の評価値算出用データの件数)とに基づいて、各組み合わせによって算出されたリスク値が実際のリスク発生件数にどの程度関連するかを示す数値を算出することができる。そして、選択部120は、算出した組み合わせ毎の評価値に基づいて、最も評価値の高い組み合わせを選択する(S112)。
 そして、出力部130は、対象領域に対して選択された、分布関数、空間的パラメータ、時間的パラメータの組み合わせを用いて未来時点のリスク分布を算出し、それを予測結果として表示装置40などに出力する(S114)。例えば、出力部130は、リスク分布の予測結果を示すマップを表示装置40などに出力する。また、出力部130は、リスク分布の予測結果を示すマップを図示しない印刷装置に出力してもよい。この場合、図示しない印刷装置から、リスク分布の予測結果を示すマップが出力される。
 なお、最適な分布関数と各パラメータの組み合わせを選択するS112までの処理と、選択された組み合わせを使ってリスクを予測するS114の処理は、必ずしも続けて実行されなくてもよい。
 以上、本実施形態では、過去に発生したリスクの履歴データを用いて、分布関数および当該分布関数のパラメータの組み合わせ毎に、その予測的中率の高さが評価される。そして、複数の組み合わせの中から、最も評価の高い組み合わせ(即ち、リスクの予測的中率の高い組み合わせ)が選択される。そして、このように選択された組み合わせを用いて、対象領域のリスクを予測することによって、当該対象領域で発生し得るリスクを高精度に予測することができる。また、予測の精度が上がることにより、リスク管理を行う人物が効果的な対策を立て易くなるという効果も見込める。
 [第2実施形態]
 〔機能構成〕
 図5は、第2実施形態の情報処理装置10の機能構成を概念的に示すブロック図である。本実施形態の情報処理装置10は、セル分割部140、生成部150、選択部160、及び出力部170を備える。
 セル分割部140は、対象領域を指定する情報の入力を受け、当該対象領域を複数の小領域(以下、「セル」と表記)に分割する。生成部150は、対象領域におけるリスク分布を空間的および時間的に示す分布関数、当該分布関数の空間的パラメータ、および、当該分布関数の時間的パラメータの組み合わせを複数生成する。選択部160は、対象領域のリスク発生履歴データの中からセル毎のリスク発生履歴データを用いて、生成部150により生成された、分布関数、空間的パラメータ、および時間的パラメータの組み合わせ毎の評価値を算出する。また、選択部160は、算出した組み合わせ毎の評価値に基づいて、分布関数、空間的パラメータ、および時間的パラメータの複数の組み合わせの中から一の組み合わせを選択する。具体的には、選択部160は、評価値が最も高い組み合わせを選択する。出力部170は、第1実施形態と同様に、選択部160により選択された分布関数、空間的パラメータ、および時間的パラメータの組み合わせを用いて、対象領域におけるリスク予測結果を出力する。
 〔ハードウエア構成〕
 本実施形態のハードウエア構成は、第1実施形態と同様(例:図2)である。本実施形態のストレージデバイス104は、上述のセル分割部140、生成部150、選択部160、および出力部170の機能をそれぞれ実現するプログラムモジュールを記憶している。情報処理装置10のプロセッサ102がこれらのプログラムモジュールを実行することによって、上述のセル分割部140、生成部150、選択部160、および出力部170の機能が実現される。
 〔動作例〕
 図6を用いて、第2実施形態の情報処理装置10の動作例を説明する。図6は、第2実施形態の情報処理装置10での処理の流れを例示するフローチャートである。ここでは、リスクが「犯罪」である場合の処理の一例を示す。
 まず、情報処理装置10は、分布関数および各パラメータの最適な組み合わせを選択する際の条件の入力を受け付ける(S202)。一例として、情報処理装置10は、対象領域、学習期間(組み合わせ毎の評価で用いるデータが属する期間)の指定入力を受け付ける。また、情報処理装置10は、上記条件の1つとして、犯罪タイプ(例えば、犯罪の種類や、犯罪被害者の性別/年齢、又はそれらの組み合わせ)を受け付ける受付部(図示せず)を更に備えていてもよい。また、情報処理装置10は、リスクの分布関数を取得する。リスクの分布関数は、例えば、メモリ103やストレージデバイス104、或いは、図示しない外部の記憶装置に記憶されている。
 ここで、リスクの分布関数は例えば下記の式(1)を用いて定義され得る。
Figure JPOXMLDOC01-appb-M000001
 上記の式(1)において、R(g,k)は「時刻tにおけるセルgのリスク値」を意味する。また、上記の式(1)において、hは空間バンド幅(空間的パラメータ)、hは時間バンド幅(時間的パラメータ)である。また、上記の式(1)において、Iは、リスク値の算出に利用する犯罪発生履歴データの数を示す。また、iは、リスク値の算出に利用する各犯罪発生履歴データに付与されるラベル番号である。また、上記の式(1)において、KおよびKは、それぞれ、分布関数における空間的および時間的な広がり方を決定するカーネル関数の形状を示す。KおよびKに設定するカーネル関数は、例えば、図7に示すような様々な形状のカーネル関数から選択され得る。図7には、5つの形状のカーネル関数(Uniform(実線)、Triangular(点線)、Quartic(短破線)、Normal(一点鎖線)、Negative Exponential(長破線))が例示されている。なお、図7はあくまで一例であり、カーネル関数は図7に示される形状に限定されない。また、KおよびKに設定するカーネル関数は、同じ形状であってもよいし、異なる形状であってもよい。図7の例では、上記式(1)に対するカーネル関数の組み合わせとして、25通りの組み合わせが得られる。なお、分布関数で使用されるパラメータは、空間的パラメータおよび時間的パラメータのいずれか一方であってもよい。例えば、対象領域のリスク分布が、日曜日および祝日と他の曜日とでは異なることを表す分布関数の定義は、空間的パラメータを含まず時間的パラメータを含む。また、分布関数は、複数の項の和で定義され、各項の割合を表す係数をパラメータにしてもよい。たとえば、図7に示すカーネル関数の中から2つのカーネル関数を選び、各カーネル関数にそれぞれ個別の係数を乗じて和をとったものを分布関数としてもよい。この場合も各実施形態の方法で最適な組み合わせを選択できる。
 下記の式(2)は、上記(1)の式にカーネル関数を組み合わせた具体例である。なお、下記の式(2)において、xおよびyは、互いに直交するx軸およびy軸で定義される空間における、セルgの位置座標(例えば、セルの中心点の位置座標)を示す。また、xおよびyは、互いに直交するx軸およびy軸で定義される空間における、ラベルi番目の犯罪発生履歴データに含まれる犯罪の位置座標を示す。また、tはラベルi番目の犯罪発生履歴データに含まれる犯罪の発生年月日時刻を示す。
Figure JPOXMLDOC01-appb-M000002
 上記の式(2)によれば、セルgの位置座標(x,y)とラベルi番目の犯罪発生履歴データの位置座標(x,y)との距離が短いほどセルgのリスク値が増加し、また、該距離が長いほどセルgのリスク値が減少することが分かる。また、上記の式(2)によれば、時刻tとラベルi番目の犯罪発生履歴データの発生年月日時刻tとが近いほど、セルgのリスク値が増加し、また、時刻tとラベルi番目の犯罪発生履歴データの発生年月日時刻tとが離れているほどセルgのリスク値が減少することが分かる。上記で例示されるような式を用いて全てのセルのリスク値を算出することによって、対象領域のリスク分布が得られる。
 次に、セル分割部140は、指定された対象領域を複数のセルに分割する(S204)。セル分割部140は、予め決められたルールまたは情報処理装置10のオペレータからの入力に基づいて、セルの形状およびサイズを任意に設定することができる。一例として、セル分割部140は、対象領域を包含する四角形の短辺の長さをΔsとした場合、当該Δsの100分の1の長さを一辺の長さとして有する正方形を単位セルとして設定することができる。そして、セル分割部140は、単位セル同士が重ならないように各々の単位セルの対象領域内での位置を決定し、各々の単位セルにラベルg(各セルを区別する情報)を付与することによって、対象領域を分割する。
 次に、生成部150は、分布関数および各パラメータの組み合わせを複数生成する(S206)。生成部150は、例えば次のようにして、分布関数および各パラメータの複数の組み合わせを生成することができる。
 まず、生成部150は、指定された期間において、複数のサンプル時刻t(k=1,2,3,・・・,K)を設定する。また、サンプル時刻の数Kは、生成部150により自動的に決定されてもよいし、オペレータの入力によって任意に設定されてもよい。具体的な例として、2000年1月1日0時0分から2000年12月31日23時59分までの期間が指定された場合、生成部150は、当該期間(366日)の1/100を四捨五入した4日間隔でサンプル時刻tを設定することができる。この場合、サンプル時刻tは、「t=2000年1月1日0時0分、t=2000年1月5日0時0分、・・・、t=2000年12月30日0時0分」であり、そのサンプル時刻数Kは92である。
 そして、生成部150は、サンプル時刻毎の犯罪発生件数を集計する期間(評価期間Δt)を決定する。例えば、生成部150は、まず、履歴データ記憶部210に記憶されている犯罪発生履歴データの犯罪タイプおよび位置情報を基に、S202の処理で指定された犯罪タイプかつ対象領域の犯罪発生データを特定する。そして、生成部150は、当該特定した犯罪発生データの発生年月日時刻を基に算出される発生間隔の平均値を、評価期間Δtとして設定することができる。具体的には、指定されたタイプの犯罪が対象領域において平均3日間隔で発生している場合、生成部150は、Δtを3日と設定することができる。なお、評価期間は、サンプル時刻毎に異なる値であってもよい。
 そして、生成部150は、例えば、セル分割部140により設定された単位セルの一辺の長さΔsの定数倍(例:1、5、10倍)を空間的パラメータhと、また、評価期間Δtの定数倍(例:5、10、100倍)を時間的パラメータhとして設定することができる。そして、生成部150は、例えばメモリ103やストレージデバイス104、或いは、図示しない他の記憶装置に予め記憶された複数の分布関数毎に、空間的パラメータhおよび時間的パラメータhを設定し、例えば図8に示すようなテーブルを生成する。図8は、分布関数、空間的パラメータ、および時間的パラメータの組み合わせを記憶するテーブルの一例を示す図である。図8に例示されるように、テーブルは、リスクの分布関数(上記の式(2)等)に、空間的パラメータhおよび時間的パラメータhを紐付けて記憶している。
 また、生成部150は、非特許文献1に開示される技術を基に、分布関数および各パラメータの組み合わせを生成することができる。非特許文献1には、ある領域における犯罪発生履歴データから時空間K関数という統計量を算出することで犯罪発生の近接反復被害の現象を分析する技術が開示されている。犯罪発生の近接反復被害とは、ある場所で犯罪が発生した場合に、その場所の近隣において、短い期間のうちに犯罪が繰り返し発生する、という性質である。近接反復被害の有無は、発生した犯罪の集積度合いを時間的および空間的に分析することでわかるとされている。非特許文献1では、これを、時空間K関数を用いて分析している。犯罪発生履歴データから、非特許文献1において時空間K関数を算出して得られる値(以下、「D」と表記)は、発生した犯罪が時間的および空間的に集積する程度や集積する範囲を表すとされている。つまり、Dは、犯罪発生の時間的および空間的な分布を表す。生成部150は、このDをリスク分布関数として用いることができる。なお、非特許文献1において、空間的パラメータとして「発生場所からの距離帯と距離の範囲」を、時間的パラメータとして「発生年月日時刻からの時間幅と時間範囲」をそれぞれ指定して、Dが算出される。生成部150は、例えば、「距離帯」として「単位セルの一辺の長さΔs」、「距離の範囲」として「対象領域の短辺の長さ」、「時間幅」として、上述の「評価期間Δt」、「時間範囲」として例えば「一年間」等と設定し、非特許文献1の方法でDを算出することで、分布関数および各パラメータの組み合わせを生成できる。
 次に、選択部160は、図8に例示されるようなテーブルに記憶されている、分布関数、空間的パラメータ、および時間的パラメータの複数の組み合わせの中から1つの組み合わせを選択し、その組み合わせのリスク値を算出する(S208)。例えば、選択部160は次のようにリスク値を算出することができる。まず、選択部160は、サンプル時刻t(k=1,2,3,・・・,K)と、選択した組み合わせの空間的パラメータhおよび時間的パラメータhとを基に、以下の式(3)で示す条件を満たす犯罪発生履歴データ(以下、「学習データ」とも表記)を、履歴データ記憶部210から抽出する。ここで、図示しない受付部が犯罪タイプ(リスクの種別)の指定入力を受け付けている場合、選択部160は、当該指定入力により指定された犯罪タイプ(リスクの種別)に対応するデータを選別することができる。サンプル時刻t(k=1,2,3,・・・,K)で抽出された学習データの件数をIとすると、選択部160は、I個の学習データそれぞれにラベルi(i=1,2,3,・・・,I)を付与する。
Figure JPOXMLDOC01-appb-M000003
 上述の流れを、図9を用いて説明する。図9は、選択部160が学習データを抽出する流れを説明するための図である。図9において、バツ印は上記(3)式を満たす犯罪発生履歴データを示す。選択部160は、サンプル時刻t(t,t,・・・,t)のそれぞれにおいて、バツ印で示す犯罪発生履歴データを学習データとして抽出する。例えば、サンプル時刻tの場合には、i=1からIのラベルが付与されたI個の学習データが選択部160により抽出される。また、点線の矢印で示されるように、サンプル時刻毎に評価期間Δtが設定されており、選択部160は、この評価期間Δtにおける犯罪履歴データを、後述の評価値算出用データとして使用する。
 選択部160は、S208の処理で選択した分布関数、空間的パラメータ、および時間的パラメータの組み合わせと、サンプル時刻t,t,・・・,tそれぞれについて抽出されたI個の学習データとを用いて、サンプル時刻t,t,・・・,tそれぞれにおける、全てのセルのリスク値を算出する。一例として、図8のテーブルの1行目の組み合わせが選択されている場合を考える。この場合、選択部160は、上記式(2)で示される分布関数に、h=100m、h=15日、サンプル時刻t,t,・・・,tそれぞれについて抽出されたI個の学習データの位置座標(x,y)、発生年月日時刻tを代入する。これにより、サンプル時刻t,t,・・・,tそれぞれにおける、ラベルg(g=1,2,3,・・・,G:Gは全セル数)で区別されるセル毎のリスク値R(g,k)が得られる。そして、選択部160は、以下の式(4)に示すように、サンプル時刻毎、且つ、セル毎のリスク値R(g,k)に、単位セルの面積Δsとサンプル時刻毎の評価期間Δtを掛けた値を、その組み合わせのリスク値として算出する。
Figure JPOXMLDOC01-appb-M000004
 そして、選択部160は、評価値算出用データとして、サンプル時刻t,t,・・・,tそれぞれの評価期間Δt内で発生した犯罪に対応する犯罪発生履歴データ(以下、「評価値算出用データ」とも表記)を履歴データ記憶部210から抽出し、その件数を特定する(S210)。具体的には、選択部160は、評価値算出用データとして、履歴データ記憶部210に記憶されている対象領域の犯罪発生履歴データの中から、「t≦発生年月日時刻<t+Δt」を満たす犯罪発生履歴データを抽出する。選択部160は、抽出した評価値算出用データの位置情報に基づいて評価値算出用データの総数をセル毎に集計し、サンプル時刻tにおける各セルの犯罪発生件数を算出する。サンプル時刻tにおけるセルgの犯罪発生件数は、数式上では以下のように表現する。
Figure JPOXMLDOC01-appb-M000005
 選択部160は、上記式(4)で算出された、各組み合わせにおけるセル毎のリスク値と、上記式(5)で算出されたサンプル時刻tにおける各セルの犯罪発生件数とに基づいて、組み合わせ毎の評価値を算出する(S212)。
 <評価値の具体例1>
 一例として、選択部160は、以下の式(6)を用いて、相関係数CORR(h,h)を算出することができる。
Figure JPOXMLDOC01-appb-M000006
 なお、上記の式(6)において、記号〈 〉は、全てのサンプル時刻t、および、ラベルgにより区別される全てのセルにおける期待値を意味する記号である。例えば、記号〈 〉を用いて表現される部分は、以下の式(7)に示すように置き換えることができる。
Figure JPOXMLDOC01-appb-M000007
 相関係数CORR(h,h)は、分布関数、空間的パラメータ、および時間的パラメータの組み合わせを用いて算出されるリスク値と、犯罪発生件数との関連性の強さを示す。相関係数CORR(h,h)の絶対値が1に近いほど、互いの数値の関連性が強いことを示す。例えば、相関係数CORR(h,h)が1に近い正の値をとる場合、選択された分布関数、空間的パラメータ、および時間的パラメータの組み合わせによって算出されるリスク値が高いセルほど、犯罪が発生する確率も高いと判断することができる。
 <評価値の具体例2>
 また、他の例として、選択部160は、相関係数とは異なる指標である、リスク値相対ランク合計を算出してもよい。選択部160は、リスク値相対ランク合計を、例えば次のように算出することができる。まず、選択部160は、分布関数、空間的パラメータ、および時間的パラメータの組み合わせと、あるサンプル時刻で上記式(3)の条件を満たす学習データとを用いて算出されたセル毎のリスク値に基づいて各セルをランク付けする。例えば、選択部160は、算出されたリスク値の大きいセルから1位、2位と昇順にランクを付けていく。そして、選択部160は、各評価値算出用データの位置情報を基に当該評価値算出用データに対応するセル(即ち、当該評価値算出用データの犯罪が発生したセル)を特定し、特定したセルのランクに応じた値をリスク値相対ランク合計に加算する。選択部160は、全てのサンプル時刻(t,t,t,・・・,t)で、上記処理を繰り返して、リスク値相対ランク合計を算出する。例えば、リスク値相対ランク合計は、以下の式(8)で表現され得る。
Figure JPOXMLDOC01-appb-M000008
 具体的な例として、分布関数、空間的パラメータ、および時間的パラメータの組み合わせと、あるサンプル時刻で上記式(3)の条件を満たす学習データとを用いて、各セルのリスク値として、図10に示すような結果が得られた場合を考える。この場合、選択部160は、9つのセルを、例えば、(1)セルC3、(2)セルB2、(3)セルA3およびセルB1、(4)セルA2およびセルC2、(5)セルA1およびB3、(6)セルC1、の順にランク付けすることができる。そして、選択部160は、上記サンプル時刻の評価期間Δt内で抽出された評価値算出用データの位置情報に基づいて、その評価値算出用データの犯罪がどのセルで発生したかを判別する。そして、選択部160は、例えば、「該当するセルのランク/全てのセルの数」の値を、組み合わせ毎のリスク値に加算する。具体的には、評価期間Δt内に発生した犯罪の位置がセルC3に対応する場合、「セルC3のランク/全セル数=1/9」が組み合わせ毎のリスク値に加算される。評価期間Δt内で抽出された全ての評価値算出用データに対して上述の処理を繰り返した結果として得られる評価値が、「あるサンプル時刻のリスク値相対ランク合計」となる。そして、上述の処理を全てのサンプル時刻(t,t,t,・・・,t)で実施することで、「最終的なリスク値相対ランク合計」が得られる。「最終的なリスク値相対ランク合計」は、全てのサンプル時刻(t,t,t,・・・,t)で得られた結果の合計値や平均値などである。
 図6に戻り、選択部160は、例えば上記式(6)や上記式(8)等を用いて算出した、組み合わせ毎の相関係数CORR(h,h)やリスク値相対ランク合計を、組み合わせ毎の評価値としてメモリ103などに記憶されるテーブル(例:図11)に格納する(S214)。図11は、組み合わせ毎の評価値を記憶するテーブルの一例を示す図である。この図の例では、選択部160は、1行目の組み合わせに対して算出された相関係数「0.11」を評価値の列に追加している。
 そして、選択部160は、全ての組み合わせの評価値が算出されたか否かを判定する(S216)。選択部160は、例えば、図11に例示されるテーブルの評価値の列が全て入力されたか否かによって、全ての組み合わせの評価値が算出されたか否かを判定できる。全ての組み合わせの評価値が算出されていない場合(S216:NO)、処理はS208に戻り、新たな組み合わせについて評価値を算出する処理が繰り返される。一方、全ての組み合わせの評価値が算出された場合(S216:YES)、選択部160は、評価値の最も高い組合せを選択し、最適な組み合わせを記憶するテーブル(例:図12)に格納する(S218)。図12に例示されるテーブルでは、分布関数、空間的パラメータ、および時間的パラメータの最適な組み合わせが、その条件を示す情報と紐付けて記憶されている。選択部160は、S202の入力(例えば、犯罪タイプ、対象領域、学習期間など)を、条件を示す情報として利用することができる。
 なお、図11のテーブルでは明確に示していないが、評価値の列には、「相関係数」と「リスク値相対ランク合計」とが混在する可能性もある。ここで、式(6)の「相関係数」の場合、正で最も1近い値が「最も高い評価値」である。また、式(8)の「リスク値相対ランク合計」の場合、最も小さい値が「最も高い評価値」である。このため、「相関係数」の評価値と「リスク値相対ランク合計」の評価値とを比較した場合、正確な結果が得られないおそれがある。そこで、選択部160は、図11に例示されるテーブルの評価値の列に値を追加する際、その値が「相関係数」と「リスク値相対ランク合計」のどちらであるかを示す評価値種別情報(例:0=「相関係数」、1=「リスク値相対ランク合計」)を更に関連付けて記憶してもよい。このようにすることで、選択部160は、同種の評価値同士を比較して「評価値の最も高い組み合わせ」を適切に選ぶことができる。
 そして、出力部170は、予測に関する条件(犯罪タイプ、対象領域、予測を行う年月日時刻、予測の期間など)の入力を受け付ける。予測に関する条件が入力されると、出力部170は、当該条件に対して選択された、分布関数、空間的パラメータ、時間的パラメータの最適な組み合わせを用いて未来時点のリスク分布を算出し、それを予測結果として表示装置40などに出力する(S220)。例えば、出力部170は、リスク分布の予測結果を示すマップを表示装置40などに出力する。また、出力部170は、リスク分布の予測結果を示すマップを図示しない印刷装置に出力してもよい。この場合、図示しない印刷装置から、リスク分布の予測結果を示すマップが出力される。
 S220の処理の詳細を説明する。まず、出力部170は、入力された予測に関する条件(犯罪タイプ、対象領域、年月日時刻t、予測の期間Δt´など)を基に図12に示されるようなテーブルを参照し、当該条件に合う、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせを読み出す。ここで、出力部170は、図12に例示するテーブルの「学習期間」が予測の期間Δt´になるべく近い組み合わせを選択するのが好ましい。特に限定されないが、出力部170は、例えば、図12に例示するテーブルの「学習期間」が予測の期間Δt´の開始時点から離れている度合に応じて、その組み合わせの評価値を小さくする補正を行う。このようにすることで、予測の期間Δt´に近い組み合わせが選択され易くなる。これにより、リスク分布の関数やパラメータが時間の経過により変化する場合に、その影響を避けることが可能となる。そして、出力部170は、履歴データ記憶部210に記憶されている犯罪発生履歴データの中から、入力された年月日時刻tに関して以下の条件を満たすデータを抽出する。そして、出力部170は、抽出されたデータの件数をIとすると、I個のデータそれぞれにラベルi(i=1,2,3,・・・,I)を付与する。
Figure JPOXMLDOC01-appb-M000009
 そして、出力部170は、入力された条件に対して読み出された、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせと、I個のデータを用いて、年月日時刻tにおける各セルのリスク値を算出する。例えば、図12の1行目の組み合わせが選ばれた場合、以下に示す式(10)により、年月日時刻tにおける各セルのリスク値R(g,p)が算出される。
Figure JPOXMLDOC01-appb-M000010
 そして、出力部170は、リスク値R(g,p)に対象領域のセル面積Δsと予測期間Δt´とを掛けた以下の値を、犯罪発生件数の予測結果として出力する。
Figure JPOXMLDOC01-appb-M000011
 なお、最適な分布関数と各パラメータの組み合わせを選択するS218までの処理と、選択された組み合わせを使ってリスクを予測するS220の処理は、必ずしも連続して実行されなくてもよい。
 以上、本実施形態では、入力された条件(リスクのタイプ、対象領域など)に応じた最適な組み合わせを用いて、リスクの予測結果が出力される。本実施形態によっても、第1実施形態と同様の効果を得ることができる。
 [第3実施形態]
 本実施形態は、以下の点を除き、第2実施形態と同様の構成を有する。
 〔機能構成〕
 図13は、第3実施形態の情報処理装置10の機能構成を概念的に示すブロック図である。図13に示されるように、本実施形態の情報処理装置10は、第2実施形態の構成に加え、取得部180を更に備える。
 取得部180は、セルカバー率を取得する。セルカバー率とは、セル分割部140により分割された複数のセルのうち、人員または移動体を派遣することができるセルの割合を示す値である。ここで言う「移動体」には、パトロール用の車両といった人員を載せて移動する有人の移動体と、ドローンといった無人の移動体が含まれる。
 〔ハードウエア構成〕
 本実施形態のハードウエア構成は、第1実施形態と同様(例:図2)である。本実施形態のストレージデバイス104は、上述の取得部180の機能を実現するプログラムモジュールを更に記憶している。情報処理装置10のプロセッサ102が当該プログラムモジュールを実行することによって、上述の取得部180の機能が実現される。
 〔動作例〕
 図14を用いて、第3実施形態の情報処理装置10の動作例を説明する。図14は、第3実施形態の情報処理装置10での処理の流れを例示するフローチャートである。ここでは、リスクが「犯罪」である場合の処理の一例を示す。ここでは、第2実施形態と異なる動作について主に説明する。図14のS302~S310の処理は、図6のS202~210の処理と同様である。
 取得部180は、セルカバー率を取得する(S312)。取得部180は、例えば、セルカバー率をオペレータに入力させる画面を表示装置40上に表示し、オペレータによって入力された情報を基にセルカバー率を取得することができる。取得部180は、取得したセルカバー率を選択部160に渡す。
 選択部160は、取得部180によって取得されたセルカバー率と、S308の処理で選択した組み合わせを用いて算出されたサンプル時刻毎の各セルのリスク値を基に、対象領域の全てのセルの中で人員や移動体を派遣すべきセル(以下、「高リスクセル」と表記)を特定する(S314)。一般的に、リスク値が相対的に高いセルから優先的に、人員や移動体を派遣してパトロールを行うべき高リスクセルが決定される。セルカバー率がβ%であった場合、選択部160は、サンプル時刻t,t,t,・・・,tそれぞれについて対象領域のセルをリスク値が高い順に並べ、サンプル時刻毎に上位β%に該当するセル(高リスクセル)を特定し、その集合をGk(β)とする。例えば、G1(β)は、サンプル時刻tにおける高リスクセルの集合である。具体的な例として、ある対象領域が10000個のセルに分割され、また、取得部180により取得されたセルカバー率が1%であったとする。この場合、選択部160は、サンプル時刻t,t,t,・・・,tそれぞれにおいて、リスク値R(g,k)が高い順に100個のセルを高リスクセルとして特定し、特定したセルのラベルgを用いて高リスクセルの集合Gk(β)を生成する。したがって、高リスクセルの集合Gk(β)について、ある1つのサンプル時刻tのGk(β)には100個のセルが含まれる。また、全サンプル時刻(t,t,t,・・・,t)分のGk(β)にはサンプル時刻数K×100個のセルが含まれる。
 選択部160は、サンプル時刻t,t,t,・・・,tそれぞれにおける、S314の処理で特定された高リスクセルの集合Gk(β)の犯罪発生件数と全てのセルの犯罪発生件数とに基づいて、組み合わせ毎の評価値を算出する(S316)。具体的には、選択部160は、組み合わせ毎の評価値として、以下の式(12)で示される指標(以下、「パトロールカバー率」と表記)を算出する。なお、式(12)は、セルカバー率βが1%であった場合の例である。例えば、セルカバー率βが10%の場合は、式(12)は異なる値になる。
Figure JPOXMLDOC01-appb-M000012
 上記式において、除算の分子は、S314の処理で特定された、サンプル時刻tにおける高リスクセルの発生犯罪件数の総和の、全サンプル時刻(t,t,t,・・・,t)での総和を示す。また、上記式において、除算の分母は、サンプル時刻tにおける全てのセルの犯罪発生件数の総和の、全サンプル時刻(t,t,t,・・・,t)での総和を示す。つまり、選択部160は、あるサンプル時刻tの評価期間Δtに発生した全ての犯罪のうち、高リスクセル(すなわち、パトロールの対象となるセル)で発生した件数の全サンプル時刻(t,t,t,・・・,t)での総和を、あるサンプル時刻tの評価期間Δtに発生した全てのセルの犯罪発生件数の全サンプル時刻(t,t,t,・・・,t)での総和で割ることによって、組み合わせ毎のパトロールカバー率を算出することができる。
 選択部160は、例えば上記式(12)を用いて算出した、組み合わせ毎のパトロールカバー率を、組み合わせ毎の評価値としてメモリ103などに記憶されるテーブル(例:図15)に格納する(S318)。図15は、組み合わせ毎の評価値を記憶するテーブルの一例を示す図である。この図の例では、選択部160は、1行目の組み合わせに対して算出されたパトロールカバー率「11%」を評価値の列に追加している。
 そして、選択部160は、全ての組み合わせの評価値が算出されたか否かを判定する(S320)。選択部160は、例えば、図15に例示されるテーブルの評価値の列が全て入力されたか否かによって、全ての組み合わせの評価値が算出されたか否かを判定できる。全ての組み合わせの評価値が算出されていない場合(S320:NO)、処理はS308に戻り、新たな組み合わせについて評価値を算出する処理が繰り返される。一方、全ての組み合わせの評価値が算出された場合(S320:YES)、選択部160は、評価値の最も高い組合せを選択し、最適な組み合わせを記憶するテーブル(例:図16)に格納する(S322)。図16に例示されるテーブルでは、分布関数、空間的パラメータ、および時間的パラメータの最適な組み合わせが、その条件を示す情報と紐付けて記憶されている。選択部160は、S302の入力(例えば、犯罪タイプ、対象領域、学習期間など)とS312で取得したセルカバー率とを、条件を示す情報として利用することができる。
 そして、出力部170は、予測に関する条件(犯罪タイプ、対象領域、予測を行う年月日時刻、予測の期間、セルカバー率など)の入力を受け付ける。予測に関する条件が入力されると、出力部170は、当該条件に対して選択された、分布関数、空間的パラメータ、時間的パラメータの組み合わせを用いて未来時点のリスク分布を算出し、それを予測結果として表示装置40などに出力する(S324)。例えば、出力部170は、リスク分布の予測結果を示すマップを表示装置40などに出力する。また、出力部170は、リスク分布の予測結果を示すマップを図示しない印刷装置に出力してもよい。この場合、図示しない印刷装置から、リスク分布の予測結果を示すマップが出力される。
 S324の処理の詳細を説明する。まず、出力部170は、入力された予測に関する条件(犯罪タイプ、対象領域、年月日時刻t、予測の期間Δt´、セルカバー率など)を基に図16に示されるようなテーブルを参照し、当該条件に合う、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせを読み出す。ここで、セルカバー率は、例えば上述の式(12)で示されるように、「最適な組み合わせ」の選択時に利用する評価値に影響を与える因子である。そのため、予測の条件として入力されたセルカバー率が異なれば、分布関数、空間的パラメータおよび時間的パラメータの最適な組み合わせも異なると考えられる。出力部170は、例えば図16に例示されるテーブルの中から、予測の条件として入力されたセルカバー率になるべく近いセルカバー率を有する組み合わせを、リスク分布の予測で用いる組み合わせとして選択する。例えば、出力部170は、セルカバー率の差分の絶対値が所定の閾値以下である組み合わせを選択することができる。具体的な例として、犯罪タイプが自転車盗で、対象領域の××市が10000個のセルに分割されたとする。また、予測に関する条件のセルカバー率が1.5%であったとする。これは、対象領域の××市のセルのうち、150個のセルに、人員または移動体を派遣できることを意味する。また、上述の所定の閾値は1%であったとする。この場合、図16のテーブルの中で、予測に関する条件(犯罪タイプおよび対象領域)に合う、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせは、1行目と2行目である。ここで、1行目のセルカバー率は1%、2行目のセルカバー率は10%であり、いずれも予測に関する条件のセルカバー率1.5%とは異なる。しかし、1行目のセルカバー率1%と予測に関する条件のセルカバー率1.5%との差分の絶対値は所定の閾値(1%)以下である。そのため、出力部170は、1行目を、リスク分布の予測に用いる組み合わせとして選択することができる。図16に例示されるテーブルの中に該当する組み合わせが存在しない場合、選択部160は、予測の条件として入力されたセルカバー率を用いて、S314からS322の処理を実行してテーブルを更新してもよい。その後、出力部170は、更新されたテーブルから予測に関する条件に合う組み合わせを読み出すことができる。
 以降の処理は、第2実施形態と同様である。具体的には、出力部170は、履歴データ記憶部210に記憶されている犯罪発生履歴データの中から、入力された年月日時刻tに関して、式(9)に示す条件を満たすデータを抽出する。そして、出力部170は、抽出されたデータの件数をIとすると、I個のデータそれぞれにラベルi(i=1,2,3,・・・,I)を付与する。そして、出力部170は、入力された条件に対して読み出された、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせと、I個のデータを用いて、年月日時刻tにおける各セルのリスク値R(g,p)を算出する。例えば、図16の1行目の組み合わせが選ばれた場合、式(10)を用いて、年月日時刻tにおける各セルのリスク値R(g,p)を算出する。そして、出力部170は、式(11)に示すように、リスク値R(g,p)に対象領域のセル面積Δsと予測期間Δt´とを掛けた値を、犯罪発生件数の予測結果として出力する。
 以上、本実施形態によれば、上述の各実施形態と同様の効果が得られる。また、本実施形態では、分布関数と各パラメータの組み合わせを用いて算出した各セルのリスク値と、セルカバー率(パトロール可能なセルの割合)とを基に、高リスクセル(パトロール対象のセル)が決定される。そして、全てのセルの犯罪発生件数に占める高リスクセルの犯罪発生件数の割合が、組み合わせ毎の評価値として用いられる。そして、このように算出された評価値を基に「最適な組み合わせ」が選択され、「セルカバー率」と共に所定の記憶部に記憶される。これにより、対象領域において人員や機材を派遣可能なセルが限られる場合において、当該セルの割合(セルカバー率)に応じた、分布関数、空間的パラメータ、時間的パラメータの最適な組み合わせを選択して、精度の高い予測を行うことができる。
 以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
 例えば、上述の各実施形態において、セル種別を特定する情報を更に取得し、そのセル種別毎に分布関数、空間的パラメータ、時間的パラメータの最適な組み合わせを選択するように構成されていてもよい。ここでセル種別とは、例えば、国土交通省により提供される国土数値情報の土地利用種別などである。第3実施形態のセルカバー率を用いる場合、例えば、次のような処理が更に実行され得る。まず、セル分割部140は、国土数値情報を参照して、各セルに対応する土地利用種別がパトロール対象の種別(例えば、「建物用地」など)か否かを判定し、パトロール対象の種別のセルに所定のフラグを付与する。そして、選択部160は、所定のフラグが付与されたセルを対象に高リスクセルを特定し、当該高リスクセルでの犯罪発生件数に基づいてパトロールカバー率を算出する。このようにすることで、「建物用地」など、所望の種別のセルで予測的中率を最大化する最適な組み合わせを選択することができる。これは、住宅地のパトロール計画を立案する場合など、特定の場所を監視対象とするケースで有用である。なお、第2実施形態の場合においても、選択部160は、所望のセル種別に対応するセルについて、相関係数やリスク値相対ランク合計を算出することができる。
 また、第2および第3実施形態において、組み合わせ毎の評価値を記憶するテーブル(例:図11および図15)を生成する例を示したが、そのようなテーブルを生成せずに、選択部160がこれらの情報を保持するように構成されていてもよい。
 また、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。
 上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
1.
 対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割するデータ分割手段と、
 前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択する選択手段と、
 前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
 を備える情報処理装置。
2.
 対象領域を複数のセルに分割するセル分割手段と、
 前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成する生成手段と、
 前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択する選択手段と、
 前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
 を備える情報処理装置。
3.
 前記複数のセルのうち、人員または移動体を派遣することができるセルの割合を示すセルカバー率を取得する取得手段を更に備え、
 前記選択手段は、前記セルカバー率に基づいて前記評価値を算出する、
 2.に記載の情報処理装置。
4.
 前記出力手段は、前記セルカバー率とは別に入力された、予測の条件としての第2のセルカバー率に基づいて、前記リスク予測結果の生成に用いる組み合わせを決定する、
 3.に記載の情報処理装置。
5.
 前記選択手段は、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出される相関係数を、前記評価値として算出する、
 2.に記載の情報処理装置。
6.
 前記選択手段は、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出されるリスク値相対ランク合計を、前記評価値として算出する、
 2.に記載の情報処理装置。
7.
 前記生成手段は、指定された期間の中で複数のサンプル時刻を設定し、前記リスク発生履歴データのうち当該サンプル時刻より所定時間前のデータと前記組み合わせとを基に算出される前記リスク値と、前記リスク発生履歴データのうち当該サンプル時刻より所定時間後までのデータとを用いて、前記組み合わせ毎の評価値を算出する、
 2.から6.のいずれか1つに記載の情報処理装置。
8.
 リスクの種別の指定入力を受け付ける受付手段を更に備え、
 前記選択手段は、前記対象領域のリスク発生履歴データの中から、前記指定入力により指定されたリスクの種別に対応するデータを選別する、
 1.から7.のいずれか1つに記載の情報処理装置。
9.
 コンピュータが、
 対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割し、
 前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択し、
 選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
 ことを含むリスク予測方法。
10.
 コンピュータが、
 対象領域を複数のセルに分割し、
 前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成し、
 前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択し、
 選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
 ことを含むリスク予測方法。
11.
 前記コンピュータが、
 前記複数のセルのうち、人員または移動体を派遣することができるセルの割合を示すセルカバー率を取得し、
 前記セルカバー率に基づいて前記評価値を算出する、
 ことを含む10.に記載のリスク予測方法。
12.
 前記コンピュータが、
 前記セルカバー率とは別に入力された、予測の条件としての第2のセルカバー率に基づいて、前記リスク予測結果の生成に用いる組み合わせを決定する、
 ことを含む11.に記載のリスク予測方法。
13.
 前記コンピュータが、
 前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出される相関係数を、前記評価値として算出する、
 ことを含む10.に記載のリスク予測方法。
14.
 前記コンピュータが、
 前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出されるリスク値相対ランク合計を、前記評価値として算出する、
 ことを含む10.に記載のリスク予測方法。
15.
 前記コンピュータが、
 指定された期間の中で複数のサンプル時刻を設定し、前記リスク発生履歴データのうち当該サンプル時刻より所定時間前のデータと前記組み合わせとを基に算出される前記リスク値と、前記リスク発生履歴データのうち当該サンプル時刻より所定時間後までのデータとを用いて、前記組み合わせ毎の評価値を算出する、
 ことを含む10.から14.のいずれか1つに記載のリスク予測方法。
16.
 前記コンピュータが、
 リスクの種別の指定入力を受け付け、
 前記対象領域のリスク発生履歴データの中から、前記指定入力により指定されたリスクの種別に対応するデータを選別する、
 ことを含む9.から15.のいずれか1つに記載のリスク予測方法。
17.
 コンピュータに、9.から16.のいずれか1つに記載のリスク予測方法を実行させるプログラム。
 この出願は、2017年10月18日に出願された日本出願特願2017-202195号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (17)

  1.  対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割するデータ分割手段と、
     前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択する選択手段と、
     前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
     を備える情報処理装置。
  2.  対象領域を複数のセルに分割するセル分割手段と、
     前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成する生成手段と、
     前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択する選択手段と、
     前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
     を備える情報処理装置。
  3.  前記複数のセルのうち、人員または移動体を派遣することができるセルの割合を示すセルカバー率を取得する取得手段を更に備え、
     前記選択手段は、前記セルカバー率に基づいて前記評価値を算出する、
     請求項2に記載の情報処理装置。
  4.  前記出力手段は、前記セルカバー率とは別に入力された、予測の条件としての第2のセルカバー率に基づいて、前記リスク予測結果の生成に用いる組み合わせを決定する、
     請求項3に記載の情報処理装置。
  5.  前記選択手段は、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出される相関係数を、前記評価値として算出する、
     請求項2に記載の情報処理装置。
  6.  前記選択手段は、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出されるリスク値相対ランク合計を、前記評価値として算出する、
     請求項2に記載の情報処理装置。
  7.  前記生成手段は、指定された期間の中で複数のサンプル時刻を設定し、前記リスク発生履歴データのうち当該サンプル時刻より所定時間前のデータと前記組み合わせとを基に算出される前記リスク値と、前記リスク発生履歴データのうち当該サンプル時刻より所定時間後までのデータとを用いて、前記組み合わせ毎の評価値を算出する、
     請求項2から6のいずれか1項に記載の情報処理装置。
  8.  リスクの種別の指定入力を受け付ける受付手段を更に備え、
     前記選択手段は、前記対象領域のリスク発生履歴データの中から、前記指定入力により指定されたリスクの種別に対応するデータを選別する、
     請求項1から7のいずれか1項に記載の情報処理装置。
  9.  コンピュータが、
     対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割し、
     前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択し、
     選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
     ことを含むリスク予測方法。
  10.  コンピュータが、
     対象領域を複数のセルに分割し、
     前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成し、
     前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択し、
     選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
     ことを含むリスク予測方法。
  11.  前記コンピュータが、
     前記複数のセルのうち、人員または移動体を派遣することができるセルの割合を示すセルカバー率を取得し、
     前記セルカバー率に基づいて前記評価値を算出する、
     ことを含む請求項10に記載のリスク予測方法。
  12.  前記コンピュータが、
     前記セルカバー率とは別に入力された、予測の条件としての第2のセルカバー率に基づいて、前記リスク予測結果の生成に用いる組み合わせを決定する、
     ことを含む請求項11に記載のリスク予測方法。
  13.  前記コンピュータが、
     前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出される相関係数を、前記評価値として算出する、
     ことを含む請求項10に記載のリスク予測方法。
  14.  前記コンピュータが、
     前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出されるリスク値相対ランク合計を、前記評価値として算出する、
     ことを含む請求項10に記載のリスク予測方法。
  15.  前記コンピュータが、
     指定された期間の中で複数のサンプル時刻を設定し、前記リスク発生履歴データのうち当該サンプル時刻より所定時間前のデータと前記組み合わせとを基に算出される前記リスク値と、前記リスク発生履歴データのうち当該サンプル時刻より所定時間後までのデータとを用いて、前記組み合わせ毎の評価値を算出する、
     ことを含む請求項10から14のいずれか1項に記載のリスク予測方法。
  16.  前記コンピュータが、
     リスクの種別の指定入力を受け付け、
     前記対象領域のリスク発生履歴データの中から、前記指定入力により指定されたリスクの種別に対応するデータを選別する、
     ことを含む請求項9から15のいずれか1項に記載のリスク予測方法。
  17.  コンピュータに、請求項9から16のいずれか1項に記載のリスク予測方法を実行させるプログラム。
PCT/JP2018/038052 2017-10-18 2018-10-12 情報処理装置、リスク予測方法、およびプログラム WO2019078101A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US16/756,972 US20210201219A1 (en) 2017-10-18 2018-10-12 Information processing apparatus, risk forecasting method, and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-202195 2017-10-18
JP2017202195A JP6627842B2 (ja) 2017-10-18 2017-10-18 情報処理装置、リスク予測方法、およびプログラム

Publications (1)

Publication Number Publication Date
WO2019078101A1 true WO2019078101A1 (ja) 2019-04-25

Family

ID=66173673

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/038052 WO2019078101A1 (ja) 2017-10-18 2018-10-12 情報処理装置、リスク予測方法、およびプログラム

Country Status (3)

Country Link
US (1) US20210201219A1 (ja)
JP (1) JP6627842B2 (ja)
WO (1) WO2019078101A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110826852A (zh) * 2019-09-27 2020-02-21 安徽四创电子股份有限公司 一种强制隔离戒毒人员风险评估方法及系统
CN110826852B (zh) * 2019-09-27 2024-05-31 安徽四创电子股份有限公司 一种强制隔离戒毒人员风险评估方法及系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6828132B1 (ja) * 2019-12-25 2021-02-10 典志 藤本 アクシデント発生予測システム及びアクシデント発生予測方法
CN113744882B (zh) * 2021-09-17 2023-09-19 腾讯科技(深圳)有限公司 目标区域的确定方法、装置、设备以及存储介质
CN115358721B (zh) * 2022-08-30 2023-05-23 中新华都国际工程咨询有限公司 一种基于大数据的工程监理信息监管系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092312A (ja) * 2004-09-24 2006-04-06 Takenaka Komuten Co Ltd 犯罪発生確率提示装置、犯罪発生確率提示方法及び犯罪発生確率提示プログラム
US9129219B1 (en) * 2014-06-30 2015-09-08 Palantir Technologies, Inc. Crime risk forecasting
US20160321563A1 (en) * 2015-04-30 2016-11-03 University Of Southern California Optimized artificial intelligence machines that allocate patrol agents to minimize opportunistic crime based on learned model
WO2017130902A1 (ja) * 2016-01-29 2017-08-03 日本電気株式会社 情報処理装置、情報処理方法、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092312A (ja) * 2004-09-24 2006-04-06 Takenaka Komuten Co Ltd 犯罪発生確率提示装置、犯罪発生確率提示方法及び犯罪発生確率提示プログラム
US9129219B1 (en) * 2014-06-30 2015-09-08 Palantir Technologies, Inc. Crime risk forecasting
US20160321563A1 (en) * 2015-04-30 2016-11-03 University Of Southern California Optimized artificial intelligence machines that allocate patrol agents to minimize opportunistic crime based on learned model
WO2017130902A1 (ja) * 2016-01-29 2017-08-03 日本電気株式会社 情報処理装置、情報処理方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110826852A (zh) * 2019-09-27 2020-02-21 安徽四创电子股份有限公司 一种强制隔离戒毒人员风险评估方法及系统
CN110826852B (zh) * 2019-09-27 2024-05-31 安徽四创电子股份有限公司 一种强制隔离戒毒人员风险评估方法及系统

Also Published As

Publication number Publication date
US20210201219A1 (en) 2021-07-01
JP6627842B2 (ja) 2020-01-08
JP2019075017A (ja) 2019-05-16

Similar Documents

Publication Publication Date Title
US11436510B1 (en) Event forecasting system
US10909647B2 (en) Damage data propagation in predictor of structural damage
US8924332B2 (en) Forecasting hotspots using predictive visual analytics approach
US20180096253A1 (en) Rare event forecasting system and method
CN104750768B (zh) 用于从社交媒体中识别、监控和排名事件的方法和系统
KR101825023B1 (ko) 리스크 조기 경보 방법 및 장치
US20150100355A1 (en) Method and apparatus for identifying early status
WO2019078101A1 (ja) 情報処理装置、リスク予測方法、およびプログラム
US10740684B1 (en) Method and system to predict the extent of structural damage
Avvenuti et al. Nowcasting of earthquake consequences using big social data
US10915829B1 (en) Data model update for structural-damage predictor after an earthquake
AU2014201088A1 (en) Predicting and managing impacts from catastrophic events using weighted period event tables
Karabuk et al. A multi-stage stochastic program for evacuation management under tornado track uncertainty
Zhao et al. A network distance and graph-partitioning-based clustering method for improving the accuracy of urban hotspot detection
Wang et al. The uncertainties of a Pd3–PGV onsite earthquake early warning system
JPWO2017038449A1 (ja) 監視システム、監視方法、およびプログラム
US8600957B2 (en) Mesh data creation method
EP2975562A1 (en) System, method, and program for supporting intervention action decisions in hazard scenarios
Gao et al. Leveraging high-resolution weather information to predict hail damage claims: A spatial point process for replicated point patterns
KR20190119082A (ko) 기상 데이터의 통계 분석을 사용하여 경제 동향들을 예측하기 위한 시스템 및 방법
Meng et al. A dynamic emergency decision support model for emergencies in urban areas
Chandra et al. Modelling and assessment of the arrival and departure process at the terminal area: A case study of Chennai international airport
Vatresia et al. Mining Fire Hotspots Over Nusa Tenggara and Bali Islands
CN113298438A (zh) 区域风险等级的评估方法、装置、计算机设备及存储介质
Ghazali et al. Development of a decision support system with risk: Supporting police and government in crime prevention

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18867867

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18867867

Country of ref document: EP

Kind code of ref document: A1