WO2020031296A1 - 地図データ処理装置 - Google Patents

地図データ処理装置 Download PDF

Info

Publication number
WO2020031296A1
WO2020031296A1 PCT/JP2018/029793 JP2018029793W WO2020031296A1 WO 2020031296 A1 WO2020031296 A1 WO 2020031296A1 JP 2018029793 W JP2018029793 W JP 2018029793W WO 2020031296 A1 WO2020031296 A1 WO 2020031296A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
map data
area
missing
map
Prior art date
Application number
PCT/JP2018/029793
Other languages
English (en)
French (fr)
Inventor
威郎 坂入
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to JP2018562696A priority Critical patent/JP6472589B1/ja
Priority to PCT/JP2018/029793 priority patent/WO2020031296A1/ja
Publication of WO2020031296A1 publication Critical patent/WO2020031296A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/17Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B29/00Maps; Plans; Charts; Diagrams, e.g. route diagram

Definitions

  • the present invention relates to a map data processing device, and more particularly to a map data processing device for performing an area analysis or the like using map data.
  • map data is used for various tasks such as planning and business evaluation.
  • entities such as municipalities, retailers and delivery companies
  • map data is used for various tasks such as planning and business evaluation.
  • municipalities formulate city plans by performing area analysis and the like using map data
  • retailers formulate plans for opening stores.
  • Such map data is composed of a collection of features such as roads and buildings that make up a map.
  • the feature is geometric information representing its shape in a coordinate sequence such as latitude and longitude, attribute information indicating characteristics of the feature such as a road name and a construction year, and phase information indicating a positional relationship between the features. It is composed of
  • Patent Document 2 discloses a technique in which when road surface image information necessary for traveling control is missing, a similar image feature is acquired from peripheral image information accumulated in the past to supplement the missing portion. Have been.
  • Patent Literature 1 discloses a technique for complementing a missing portion of map information using map information with a lower degree of detail
  • Patent Literature 2 discloses a technique for complementing a missing portion of image information. Only the technology that complements the part that is similar using similar image information of the surroundings is disclosed, and the technology that complements even the attribute information necessary for performing area analysis etc. using map data is disclosed. Absent.
  • the present invention has been made to solve the above-described problem, and has as its object to provide a map data processing device capable of complementing attribute information necessary for performing an area analysis or the like.
  • a map data processing device is a map data processing device that complements map data of a data missing area where the attribute data is missing in map data including attribute data of a terrestrial feature.
  • a similar area search unit that retrieves and obtains a similar area similar to the data missing area, and based on the map data of the similar area, based on the map data of the data missing area, supplemented map data that supplements missing data in the map data of the data missing area.
  • a sex determination unit, and a data output unit that outputs the complemented map data when the determination result by the consistency determination unit is appropriate. , And a.
  • the missing data is complemented using map data of a similar area, so that the data analysis unit Can be performed.
  • FIG. 1 is a block diagram illustrating a configuration of a map data processing device according to a first embodiment of the present invention.
  • FIG. 2 is a block diagram illustrating a hardware configuration of the map data processing device according to the first embodiment of the present invention. It is a figure showing composition of map data. It is a figure which shows the kind of geometric shape. It is a figure showing composition of geometric information on a feature. It is a figure showing composition of topological information on a feature. It is a figure showing composition of attribute information on a feature. It is a figure showing composition of complement data. It is a figure showing missing data.
  • 3 is a flowchart illustrating an entire process of the map data processing device according to the first embodiment of the present invention.
  • FIG. 13 is a diagram in which a mesh is superimposed on a map according to the second embodiment of the present invention.
  • FIG. 15 is a diagram for explaining storage of complementary data according to the third embodiment of the present invention.
  • FIG. 1 is a functional block diagram showing a configuration of the map data processing device 1 according to the first embodiment of the present invention.
  • the map data processing device 1 includes a similar area search unit 2, a complementary data construction unit 3, a data analysis unit 4, a consistency determination unit 5, and a data output unit 6.
  • FIG. 2 is a block diagram illustrating an example of a hardware configuration of the map data processing device 1.
  • the map data processing device 1 shown in FIG. 2 is incorporated in an information terminal device such as a personal computer (personal computer), a smartphone, a mobile phone, and a PDA (Personal Digital Assistant), and each function is performed by hardware of the information terminal device. Is achieved.
  • an information terminal device such as a personal computer (personal computer), a smartphone, a mobile phone, and a PDA (Personal Digital Assistant)
  • PDA Personal Digital Assistant
  • the external storage device 206 shown in FIG. 2 includes a database such as a map database used by the similar area search unit 2, a data access program for accessing the database, an application program for executing a desired function using the map data, and an application. Data and the like used in the processing are stored (stored). Programs such as a data access program and an application program are developed on the memory 205 from the external storage device 206 and executed by the CPU (Central Processing Unit) 204.
  • a database such as a map database used by the similar area search unit 2
  • a data access program for accessing the database
  • an application program for executing a desired function using the map data
  • an application Data and the like used in the processing are stored (stored).
  • Programs such as a data access program and an application program are developed on the memory 205 from the external storage device 206 and executed by the CPU (Central Processing Unit) 204.
  • CPU Central Processing Unit
  • the application program is a program for realizing various functions executed by the map data processing apparatus 1.
  • the application program is executed by the similar area search unit 2 and is searched for by the similar area search unit 2.
  • a function to compare the data missing area and evaluate the similarity is realized.
  • the data access program is a program for accessing a database and acquiring, from the database, information necessary for executing the application program.
  • the function of the similar area search unit 2 is realized by acquiring necessary map data from a map database managed by an external storage device.
  • the external storage device 206 includes a hard disk device (HDD) in which the map data processing device 1 is incorporated, an external storage medium such as a CD (Compact Disc) and a DVD (Digital Versatile Disk) that can be reproduced by the drive device, and a predetermined input / output interface. It can be constructed in a USB (Universal Serial Bus) memory or the like which can read and write data via the USB.
  • HDD hard disk device
  • CD Compact Disc
  • DVD Digital Versatile Disk
  • the calculation result by the CPU 204 is output to the display device 202 via the bus and displayed on the screen.
  • the display device 202 is realized by a CRT monitor, a liquid crystal display, a plasma display, or the like.
  • the communication device 203 communicates with an external device (not shown) and, when receiving a GPS signal and an FM radio wave from a GPS (Global Positioning System) satellite, is managed by an external server system connected via the Internet or an intranet. It is used when communicating with existing external information.
  • GPS Global Positioning System
  • the input device 201 is a device that receives an external operation input, and is realized by a keyboard, a mouse, an operation switch, and a touch panel incorporated in the display device 202.
  • Each function of the map data processing device 1 in FIG. 1 is realized by the hardware configuration described above.
  • the similar area search unit 2, the supplementary data construction unit 3, the data analysis unit 4, and the consistency determination unit 5 in FIG. 1 execute the program expanded from the external storage device 206 to the memory 205 by the CPU 204 in FIG. This is achieved by:
  • the components of the map data processing device 1 may be configured as one information terminal device as described above, or may be configured as separate information terminal devices on a network such as the Internet and an intranet. good.
  • a configuration may be adopted in which the similar area search unit 2 having a high processing load is distributed to a plurality of information terminal devices to perform processing.
  • the similar area search unit 2 searches the map data of each of the plurality of areas to obtain similar areas having the same characteristics as the data missing area, that is, similar areas. In order to search for a similar area, map data of a data missing area is also used.
  • the map data used by the similar area search unit 2 is classified and managed for each type (layer) of the features constituting the map, and is divided into rectangular units or given a spatial index so that the data can be easily accessed. Managed.
  • the map data is stored in the external storage device 206 shown in FIG.
  • map geometric information and attribute information differ depending on the subject of map data. For example, when performing a simulation for estimating a crime prone area for a crime prevention plan, the ratio of daytime population, the distance to the nearest station (closest station distance), the time distance to the city center (city center time distance), the road area ratio Attribute information (attribute data) that is not included in general commercial maps, such as the ratio of commercial and residential area and the ratio of owned houses, is required.
  • the similar area search unit 2 for example, based on map data in which attribute information such as population, area, main industry, and green space ratio is stored, feature amounts are quantitatively expressed using a statistical analysis method, The similarity is determined based on the magnitude of the value, and a similar area is acquired.
  • the main analysis technique is multivariate analysis.
  • the multivariate analysis is a statistical method for summarizing and predicting a certain event using a plurality of variables related to each other, and examples thereof include a multiple regression analysis, a quantification analysis, and a cluster analysis. Multiple regression analysis is a method of predicting one variable from a plurality of variables expressed quantitatively. In quantification analysis, quantification 1 and quantification 2 depend on whether the data form of the variable is qualitative or quantitative.
  • the cluster analysis is a method of grouping groups having different properties from those having different properties by using any one of the analysis methods of Quantification and Class 3.
  • Each analysis method has its own characteristics, and the direction of analysis depends on the data used. Therefore, even if the same data is used, the results may differ.
  • the similarity can be determined to be similar if the values such as the category score and the sample score obtained by each analysis method are similar.
  • the similar area search unit 2 can also search for a similar area using attribute information other than the missing attribute data (missing data). That is, the similar area search unit 2 allows the user to select a data-missing area via the display device 202 (FIG. 2) such as a CRT monitor or a liquid crystal display provided in the map data processing apparatus 1 and to use which map data. Settings such as whether to search for a similar area can be made. Selection of area and map data is performed using the input device 201 (FIG. 2) which is a user interface such as a mouse and a keyboard.
  • the similar area search unit 2 may search for a similar area using a plurality of search patterns.
  • the supplementary data construction unit 3 Based on the map data of the similar area calculated as a result, the supplementary data construction unit 3 generates supplementary data (complemented map data) that supplements the missing data of the data missing area.
  • This complementary data is tagged for each search pattern and output from the data output unit 6. An attribute name is used as this tag.
  • search pattern 1 in which similar areas are calculated using three indices of the number of persons per household, population density, and area ratio, and a ratio of daytime population, time distance to the city center, and ownership rate Search pattern 2 for calculating a similar area using one index can be given.
  • Search pattern 1 is a pattern viewed from the viewpoint of densely populated houses, and search pattern 2 can be said to be a search pattern viewed from a bedtown-like property.
  • the search pattern 1 uses “densely populated areas”
  • the search pattern 2 uses “bedtown”, and the like, from which viewpoint the complementary data is calculated.
  • the user can compare the results of the regional analysis for each search pattern.
  • the supplementary data construction unit 3 generates supplementary data based on the map data of the similar area searched by the similar area search unit 2.
  • the map data of the data missing area and the map data of the similar area are compared, and the map data of the similar area is corrected according to the difference between the two map data, and may be used as the supplementary data.
  • a method of creating complementary data using a difference in similarity obtained by the statistical method used in the similar area search unit 2 can be considered.
  • city B is a missing area
  • similar areas are calculated using data that is uniformly prepared throughout the country such as the census, which is general statistical data
  • the area of city A is 20 km 2
  • the area of city B is When the area is 40 km 2 , it is assumed that City A is calculated as a similar area from the viewpoint of the growth potential of the city. In this case, it is assumed that the result that the city A is 80% similar to the city B is obtained. For example, if the index of the total length of road construction per year is used as an indirect index indicating the growth potential of the city, the city A has a distance of 50 km and that of the city B is missing.
  • the area ratio is simply added to the total length of road construction for the city B in the year, it will be 100 km. However, since the similarity of City A is 80%, it is assumed that there is an error of 20% for the similarity of 100%, and the total length of road construction in City B should be complemented as 80km-120km ( ⁇ 20km). Can be.
  • the data analysis unit 4 performs area analysis such as simulation and statistical analysis using the map data stored in the external storage device 206, including the supplementary data generated by the supplemental data construction unit 3.
  • the user determines what kind of analysis is to be performed, and the data analyzer 4 executes the analysis determined by the user. At this time, the user can execute the analysis without being aware that the map data includes a data missing area and uses complementary data that complements the data missing area.
  • the analysis result in the data analysis unit 4 is presented to the user via a display device 202 such as a CRT monitor or a liquid crystal display provided in the map data processing device 1.
  • a display device 202 such as a CRT monitor or a liquid crystal display provided in the map data processing device 1.
  • the consistency determination unit 5 determines whether the analysis result of the data analysis unit 4 is appropriate. If the supplementary data is not correctly generated, it is assumed that the analysis result in the data analysis unit 4 is largely different from the expected result, and the appropriateness of the analysis result is determined based on the difference between the analysis result and a previously assumed value. judge. For example, if the crime rate in City A calculated based on the supplementary data is 100 times the crime rate in City B adjacent to City A, which is the assumed value, the analysis result is determined to be inappropriate. Is done.
  • the suitability of the complementary data may be determined. Whether or not the complementary data is correct can be determined, for example, by comparing the complementary data obtained by a method of searching for a similar area with a plurality of search patterns. For example, if the deviation of the complementary data is within ⁇ 10%, it can be determined that the data has been correctly complemented. It is also conceivable that the user judges the analysis result and improves the complementation accuracy based on the tendency.
  • the data output unit 6 has a function of outputting, to a storage medium such as the external storage device 206, the complementary data generated by the complementary data construction unit 3 and determined to be correct by the consistency determination unit 5. By outputting the complementary data in this way, it is possible to reuse the complementary data when it becomes necessary to use it again.
  • the supplementary data is provided with a flag indicating that it is the supplementary data, and is stored in the existing map database.
  • the supplementary data and the map data in the external storage device 206 separate from the map data processing device 1, it is possible to use the supplementary data and the map data in an analyzer other than the map data processing device 1. .
  • FIG. 3 is a diagram illustrating an example of the configuration of the map data.
  • Map data is managed using a relational database and a file system.
  • map DB 20 a map database 20 that manages map data using a relational database.
  • the map database DB20 manages map data based on the following data structure. That is, the map DB 20 is a set of features 21 that are components of the map data, and the features 21 are configured by a combination of geometric information 31, attribute information 41, and phase information 51.
  • the geometric information 31 is information in which positional information based on coordinates such as latitude and longitude for expressing the shape of a feature is arranged.
  • the attribute information 41 is information indicating a feature of the feature.
  • the phase information 51 is information indicating a connection between features.
  • phase information 51 and attribute information 41 are used, and when indicating a road shape, geometric information 31 and attribute information 41 are used in combination.
  • geometric information 31 and attribute information 41 are used in combination.
  • each piece of information is managed as an array and is associated with the attribute information 41.
  • the association between the geometric information 31 and the attribute information 41 will be described. The same applies to the association between the phase information 51 and the attribute information 41.
  • FIG. 4 is a diagram illustrating an example of the types of the main geometric shapes (geometric types 31 a) indicated in the geometric information 31.
  • the geometric type 31a includes, for example, point (point) data representing representative points of municipalities and place names, polyline (line) data representing lines such as rivers, bus routes, contour lines, and house shapes. (Plane) data expressing closed spaces such as parks, lakes and marshes.
  • point (point) data representing representative points of municipalities and place names
  • polyline (line) data representing lines such as rivers, bus routes, contour lines, and house shapes.
  • Plant data expressing closed spaces such as parks, lakes and marshes.
  • a road for example, a road type such as a national road, a prefectural road, a municipal road, a road width, a road name, and the like are defined as the attribute information 41 expressing these features.
  • FIG. 5 is a diagram showing an example of the configuration of the geometric information 31 of a plurality of features.
  • the geometric information 31 manages not only the geometric type 31a but also an array of coordinate points (coordinate array) constituting the shape of the feature, a feature ID for uniquely identifying the feature, and the like. May be done.
  • a coordinate point is represented by numerical information defined by a latitude, longitude, plane rectangular coordinate system, and the like. Note that, depending on the characteristics of the map data (map information), the array of coordinate values may be encrypted or compressed for security reasons.
  • FIG. 6 is a diagram showing an example of the configuration of the phase information 51.
  • the phase information 51 is information indicating a connection between features, and is represented by, for example, a node 1 and a link 1.
  • the phase information 51 manages data of a network such as a road network and a railway network.
  • a node is a node that forms a network such as an intersection, and represents a start point, an end point, and the like, and a link is an element such as a line connecting the nodes.
  • FIG. 7 is a diagram showing an example of a table structure 61 for storing attribute information of a plurality of features.
  • the table structure 61 includes, for example, a feature ID for uniquely identifying a target feature, and a plurality of types of attribute information indicating characteristics of the feature.
  • a road type such as a national road, a prefectural road, a municipal road, a road width, a road name, and the like are defined as attribute information.
  • the type of attribute value is composed of various information that characterizes a feature, such as a numerical value, a character string, and an image.
  • a set of attribute information for a plurality of features is an attribute information list.
  • FIG. 8 is a diagram showing an example of a table structure of attribute information of map data in which complementary data is stored.
  • the table structure 71 includes attribute information of map data of an area including a data missing area, and a complementary data flag indicating whether or not the information is complementary data.
  • ID2 is a data missing area where the attribute information Attr5 is missing
  • the attribute information Attr5 is the complementary data generated by the complementary data construction unit 3, and the complementary data flag indicating that it is the complementary data is True.
  • ID1 holds Attr5 instead of the data-missing area where the attribute information Attr5 is missing, the complementary data flag is False.
  • the table structure 71 shown in FIG. 8 is managed in the map database 20 included in the map data processing device 1. As described above, by managing the supplementary data in the map database 20, hardware costs can be reduced.
  • FIG. 9 is a diagram illustrating an example of missing data.
  • city A, city B, and city C are shown as the similar area 81 calculated by the similar area search unit 2.
  • the data items in the figure are used for crime occurrence simulation, assuming a city near Tokyo, and the number of people per household, population density, daytime population ratio, nearest station distance, city center time distance, road area ratio, commercial and residential area
  • the explanatory variables (x n ) such as the ratio, district coverage ratio, district floor area ratio, ownership ratio, public corporation ratio, and private rent ratio, and the crime occurrence rate (y), which is the dependent variable (dependent variable) based on these, calculate.
  • the daytime population ratio is defined by the ratio of the daytime population to the population (daytime population / population), and the nearest station distance is defined by the distance from the center point of the town (city) to the starting point.
  • the distance is defined by the time required for the train from the Yamanote Line to the nearest station,
  • the road area ratio is defined by the ratio of the road area to the town area (road area / town area), and the commercial and residential area ratio is defined by the residential land area It is defined by the ratio of commercial land area (commercial land area / residential land area).
  • the area coverage ratio is defined by the ratio of the building area to the town area (building area / town area), and the area floor area ratio is the ratio of the building area x the number of building floors to the town area ((building area x building number of floors) / town area). Is defined by
  • the above equation (1) is a regression equation of the multiple regression analysis used in the multivariate analysis, and uses the number of persons per household, population density, daytime population ratio, etc. shown in FIG. 9 as explanatory variables (x n ).
  • the coefficient ( ⁇ n ) of each explanatory variable is a partial regression coefficient.
  • City A has all the explanatory variables necessary for calculating the crime incidence rate, and has all the data.
  • the road area ratio, the ownership ratio, the public corporation ratio, and the private rent ratio are marked X, and these data are missing.
  • the ratio of commercial and residential area, the area coverage ratio, and the area floor area ratio are marked with x, and these data are missing.
  • supplementary data is used to supplement the missing road area rate, the ownership rate, the public corporation rate, and the private rent rate.
  • the construction unit 3 creates complementary data based on the data of City A. Complementary data is also created for data missing in city C based on data in city A.
  • the similar area search processing in the similar area search unit 2 does not calculate the similar area using all the given explanatory variables. First, it decides from which viewpoint the similar area is calculated, selects an explanatory variable suitable as an index for judging the similarity, and calculates the similar area using it. Even if there is data, if they are not used, the similar area search processing can be executed. For example, if the number of persons per household, population density, daytime population ratio, and the like are selected, there is no problem in determining the similarity.
  • the similar area search unit 2 executes a similar area search and outputs a similar area (step S1).
  • the supplementary data construction unit 3 selects a specific similar area from the similar areas output from the similar area search unit 2 and creates supplementary data that supplements the missing data of the data missing area (step S2).
  • the data analysis unit 4 executes the area analysis selected by the user using the supplementary data created by the supplemental data construction unit 3 (step S3).
  • the consistency determination unit 5 determines whether or not there is consistency in the result of the area analysis in the data missing area executed by the data analysis unit 4 (step S4). If the result of the area analysis is significantly different from the surrounding area or far from the expected, it is determined that the analysis result is inconsistent (No), the construction of the supplemental data in step S2 is executed again, and the reconstructed supplemental data is Then, the area analysis in step S3 is performed again. On the other hand, if the analysis results are consistent (Yes), the process moves to step S5.
  • step S5 in order to use the complementary data again, the complementary data generated in step S3 is output to the external storage device 206 such as an HDD, and a series of processing ends.
  • the external storage device 206 such as an HDD
  • FIG. 11 is a flowchart showing in detail the similar area search processing in the similar area search unit 2 in step S1 shown in FIG.
  • a search target range including a data missing area and searching for a similar area to supplement missing data is set (step S21).
  • the user selects based on a pre-defined administrative area such as a prefecture and a municipal area, and sets the selected area as a search area for a similar area search.
  • a pre-defined administrative area such as a prefecture and a municipal area
  • the user can specify a search target range in a similar area, so that the processing cost required for the search can be reduced.
  • the user sets a data missing area included in the search target range set in step S21 and for which complementary data is to be created (step S22).
  • the data missing area is assumed to be an area defined in advance, such as the above administrative area.
  • step S22 the user sets missing data for which complementary data is to be created (step S23).
  • the missing data set here may be plural. This processing may be executed before step S31 in FIG. 12 described later.
  • the user sets, from the target range for searching for a similar area set in step S21, the area data to be used for searching for a similar area having characteristics similar to the data missing area to be complemented set in step S22.
  • the regional data used here includes, for example, topography, land use, rivers, weather, area, etc., indicating the geographical characteristics of the region, as well as population, housing, social disasters, past disaster damage, and the number of crimes that indicate social characteristics. And other data.
  • the similar area may be calculated using data used in the analysis performed by the data analysis unit 4 instead of the general statistical information described above. In this case, since the data to be used for analysis is determined in advance, it is possible to save the trouble of setting as in the case of using general statistical information.
  • the similar area search unit 2 searches for similarities such as multiple regression analysis, quantification analysis, and cluster analysis, which are multivariate analyses.
  • a similar area search is executed using a statistical method characterized by analyzing (step S25).
  • the similar area search is executed based on a quantitative numerical value (similarity) indicating similarity.
  • the similar area search unit 2 arranges and outputs similar areas in descending order of similarity (step S26). In this case, it is possible to specify the number of similar areas to be output. The value of the similarity is also output.
  • FIG. 12 is a flowchart showing in detail the complementary data construction processing in the complementary data construction unit 3 in step S2 shown in FIG.
  • the user sets a similar area as a complement source for constructing complementary data of a data missing area from among the similar areas searched by the similar area search unit 2 (step S31). . For this reason, the search result in the similar area search unit 2 is presented to the user via the display device 202 (FIG. 2). The user selects a similar area using the input device 201 (FIG. 2).
  • this similar area has data corresponding to the missing data in the data missing area. If the corresponding data is missing even in the similar area, another similar area having the corresponding data is set.
  • the user can intentionally select a similar area to be a complement source. If the value of the similarity is low, it is possible to make a determination such as retrying to search for a similar area using another area data.
  • the complementary data construction unit 3 may automatically select the first similar area to be output and set the similar area as the similar area. In this case, if the similar area output first does not have the data corresponding to the missing data in the data missing area, the similar area output second may be selected.
  • the complementary data construction unit 3 generates the complementary data of the data missing area (step S32).
  • a coefficient in consideration of a regional difference between the similar area and the data missing area is calculated, and the calculated coefficient is multiplied by data as a complement source in the similar area to generate complementary data of the data missing area.
  • This coefficient can be calculated by using area data having a correlation with the missing data, such as the population ratio and the area ratio of the data missing area and similar areas.
  • the supplementary data construction unit 3 performs a process of correcting the supplementary data generated in step 32 (step S33). For example, if the data of the similar area serving as the complement source is old, the data needs to be corrected to the current data. When the supplementary data needs to be corrected as described above, the correction is performed during this step. For example, if the population density is known, if the increase coefficient (or decrease coefficient) of the population in the area is known, the supplementary data is corrected by calculating the population density of the similar area serving as the complement source from the population increase coefficient ( Or a reduction coefficient) to correct the data at the present time.
  • the supplementary data corrected in step 33 is temporarily stored (cached) in the memory 205 (FIG. 2) of the map data processing device 1 (step S34).
  • the cached complementary data is used for data analysis in the data analysis unit 4.
  • the complementary data is provided with a flag indicating that the data is complementary data, the current state of the area can be grasped by looking at the complementary data itself. Also, it can be determined from the analysis result whether the missing data should be prepared. In addition, knowing the similar areas can refer to the measures adopted there.
  • the setting of the search target range and the data missing area for performing the similar area search has been described as being set by the user based on a predefined administrative area such as a prefecture or a municipal office.
  • the user may specify and set an arbitrary range.
  • the user may set an arbitrary range using the input device 201 (FIG. 2) such as a mouse.
  • FIG. 13 shows an example in which one rectangular mesh 101 of meshes superimposed on a map is designated as an arbitrary range.
  • the hatched mesh 101 in FIG. 13 is the specified data missing area, and the area where the mesh is superimposed is the specified search target range for performing the similar area search.
  • the local data of the search target range on which meshes of other places are superimposed is used according to the processing flow of the first embodiment described with reference to FIGS. Perform similar area search and construct complementary data. Therefore, it is necessary to aggregate regional data for each mesh. In order to aggregate the regional data for each mesh, the regional data of a predefined administrative area or the like covered with the mesh is used.
  • the area data of the administrative districts extending there is corrected according to the ratio of the administrative districts in the mesh. For example, City A, City B and City C span the mesh, occupying 60%, 30% and 10% respectively in area, and the population of City A, City B and City C is 50,000, If there are 30,000 and 20,000 people, the population of the mesh 101 is 41,000, which is the total value of 50,000 ⁇ 60%, 30,000 ⁇ 30%, and 20,000 ⁇ 10%. In this way, the map data of each mesh is totaled and set as attribute values of the mesh.
  • the map data in units of meshes is managed using the map database 20 described in the first embodiment.
  • the supplementary data of the data missing area output by the data output unit 6 of the map data processing device 1 is the complement data in the map database 20 provided in the map data processing device 1.
  • Has been described as being managed by the table structure 71 provided with a flag indicating that the map database 23 is composed of only complementary data separately from the map database 20 (first database) as shown in FIG. A (second database) may be provided and managed there.
  • the map database 23 that manages the complementary data has a table structure 71 that stores the complementary data, and the ID of the table and the ID of the table structure 61 that stores the attribute information of the map database 20 are respectively With the structure indicating the same feature, it is possible to link the map database 20 with the map database 23 storing the supplementary data using the ID as a key.
  • each embodiment can be freely combined, or each embodiment can be appropriately modified or omitted within the scope of the invention.

Abstract

本発明は地図データ処理装置に関し、地物の属性データを含む地図データにおいて、属性データが欠落しているデータ欠落地域の地図データを補完する地図データ処理装置であって、複数の地域を検索して、データ欠落地域と類似する類似地域を取得する類似地域検索部と、類似地域の地図データに基づいて、データ欠落地域の地図データにおける欠落データを補完した補完済み地図データを生成する補完データ構築部と、補完済み地図データを含む前記地図データに基づいて分析を行うデータ分析部と、データ分析部における補完済み地図データに基づいた分析結果の適否を判定する整合性判定部と、整合性判定部による判定結果が適正である場合は、補完済み地図データを出力するデータ出力部と、を備えている。

Description

地図データ処理装置
 本発明は地図データ処理装置に関し、特に、地図データを用いて地域分析などを行う地図データ処理装置に関する。
 自治体、小売業者および配送業者などの事業体においては、地図データは各種計画立案、事業評価などの様々な業務で利用されている。例えば、自治体では地図データを用いて地域分析などを行って都市計画を立案し、小売業者では店舗の出店計画などを立案する。
 このような、地図データは、道路、建物などの地図を構成する地物の集合で構成されている。そして、地物は、その形状を緯度、経度などの座標列で表現する幾何情報と、道路名、施工年など当該地物の特性を示す属性情報、さらには地物どうし位置関係を示す位相情報で構成されている。
 詳細な地図データを作成するには、個々の地物の幾何および属性をきめ細かく調査する必要があり、時間および費用などのコストを多く必要とする。一般的に規模の小さい自治体および小売業者などが、地図データを用いて高サービスの業務を遂行するためには、広域かつ詳細な地図データが必要になる場合があるが、コスト面から対象地域全域の地図データが整備されず、優先度の高い地域の地図データのみを作成することにより、地図データの一部が欠落してしまうといった課題がある。
 地図データが欠落している場合において、欠落したデータを補完するために、例えば、特許文献1に開示される地図情報表示処理装置では、ディスプレイ画面で地図を拡大表示する際に、詳細な地図情報を有さないエリアでも見栄えを落とすことなく表示するために、詳細度が低い(小縮尺の)地図情報を用いて補完表示する技術が開示されている。
 また、特許文献2では、走行制御に必要な路面画像情報が欠損しているような場合、過去に蓄積した周辺の画像情報から、類似する画像特徴を取得し、欠損部分を補完する技術が開示されている。
特開平10-293534号公報 特開2016-126605号公報
 以上説明したように、特許文献1においては、地図情報の欠損している部分を、より詳細度が低い地図情報を用いて補完する技術が開示され、特許文献2においては、画像情報の欠損している部分を、周辺の類似する画像情報を用いて補完する技術が開示されているだけであり、地図データを用いて地域分析などを行うのに必要な属性情報まで補完する技術は開示されていない。
 本発明は上記のような問題を解決するためになされたものであり、地域分析などを行うのに必要な属性情報まで補完することができる地図データ処理装置を提供することを目的とする。
 本発明に係る地図データ処理装置は、地物の属性データを含む地図データにおいて、前記属性データが欠落しているデータ欠落地域の地図データを補完する地図データ処理装置であって、複数の地域を検索して、前記データ欠落地域と類似する類似地域を取得する類似地域検索部と、前記類似地域の地図データに基づいて、前記データ欠落地域の地図データにおける欠落データを補完した補完済み地図データを生成する補完データ構築部と、前記補完済み地図データを含む前記地図データに基づいて分析を行うデータ分析部と、前記データ分析部における前記補完済み地図データに基づいた分析結果の適否を判定する整合性判定部と、前記整合性判定部による判定結果が適正である場合は、前記補完済み地図データを出力するデータ出力部と、を備えている。
 上記の地図データ処理装置によれば、地域分析等に用いる属性データが欠落したデータ欠落地域があった場合でも、類似地域の地図データを用いて欠落データを補完するので、データ分析部での分析を実行することができる。
本発明に係る実施の形態1の地図データ処理装置の構成を示すブロック図である。 本発明に係る実施の形態1の地図データ処理装置のハードウェア構成を示すブロック図である。 地図データの構成を示す図である。 幾何形状の種類を示す図である。 地物の幾何情報の構成を示す図である。 地物の位相情報の構成を示す図である。 地物の属性情報の構成を示す図である。 補完データの構成を示す図である。 欠落データを示す図である。 本発明に係る実施の形態1の地図データ処理装置の全体処理を説明するフローチャートである。 類似地域検索部における類似地域検索処理を説明するフローチャートである。 補完データ構築部における補完データ構築処理を説明するフローチャートである。 本発明に係る実施の形態2における地図上にメッシュを重畳した図である。 本発明に係る実施の形態3における補完データの保存を説明する図である。
 <実施の形態1>
 図1は、本発明に係る実施の形態1の地図データ処理装置1の構成を示す機能ブロック図である。図1に示されるように、地図データ処理装置1は、類似地域検索部2、補完データ構築部3、データ分析部4、整合性判定部5およびデータ出力部6を備えている。
 図2は、地図データ処理装置1のハードウェア構成の一例を示すブロック図である。図2に示される地図データ処理装置1は、例えば、パーソナルコンピュータ(パソコン)、スマートフォン、携帯電話およびPDA(Personal Digital Assistantなどの情報端末装置に組み込まれ、当該情報端末装置のハードウェアにより各機能が実現される。
 図2に示す外部記憶装置206には、類似地域検索部2で用いる地図データベースなどのデータベース、当該データベースにアクセスするデータアクセスプログラム、地図データを用いて所望の機能を実行するためのアプリケーションプログラム、アプリケーション処理で利用されるデータなどが記憶(格納)される。データアクセスプログラム、アプリケーションプログラムなどのプログラムは、外部記憶装置206からメモリ205上に展開されて、CPU(Central Processing Unit)204で実行される。
 アプリケーションプログラムは、地図データ処理装置1で実行される各種の機能を実現するためのプログラムであり、例えば、類似地域検索部2で実行される、類似地域検索部2で検索された類似地域と、データ欠落地域とを比較し、類似度を評価する機能を実現する。
 データアクセスプログラムは、データベースにアクセスして、当該データベースから、アプリケーションプログラムの実行に必要な情報を取得するためのプログラムである。このデータアクセスプログラムが実行されることにより、外部記憶装置で管理されている地図データベースから必要な地図データを取得することで、類似地域検索部2の機能が実現される。
 外部記憶装置206は、地図データ処理装置1が組み込まれたハードディスク装置(HDD)、ドライブ装置で再生可能なCD(Compact Disc)およびDVD(Digital Versatile Disk)などの外部記憶メディア、所定の入出力インターフェースを介してデータ読み書きが可能なUSB(Universal Serial Bus)メモリ等に構築することができる。
 CPU204による演算結果は、バスを介して表示装置202に出力されて画面表示される。表示装置202は、CRTモニター、液晶ディスプレイ、プラズマディスプレイ等により実現される。
 通信装置203は、図示しない外部装置と通信を行い、GPS(Global Positioning System)衛星からのGPS信号およびFM電波を受信する場合、インターネットまたはイントラネットを介して接続された外部のサーバシステムで管理されている外部情報との通信を行う場合に利用される。
 入力装置201は、外部からの操作入力を受け付ける装置であり、キーボード、マウス、操作スイッチおよび表示装置202に組み込まれたタッチパネルで実現される。
 以上説明したハードウェア構成により、図1の地図データ処理装置1の各機能が実現される。例えば、図1の類似地域検索部2、補完データ構築部3、データ分析部4および整合性判定部5は、図2のCPU204が外部記憶装置206からメモリ205上に展開されたプログラムを実行することにより実現される。
 なお、地図データ処理装置1の構成要素は、上述したような1台の情報端末装置で構成される場合の他、インターネットおよびイントラネットなどのネットワーク上に別々の情報端末装置に分けて構成しても良い。例えば、処理負荷の高い類似地域検索部2を複数台の情報端末装置に分散して処理を行う構成を採っても良い。
 ここで、図1のブロック図の説明に戻り、地図データ処理装置1の各機能について説明する。類似地域検索部2は、複数の地域のそれぞれの地図データを検索して、データ欠落地域と同様の特徴を有する、すなわち類似する類似地域を取得する。類似地域を探すために、データ欠落地域の地図データも使用する。
 類似地域検索部2で使用する地図データは、地図を構成する地物の種類(レイヤ)ごとに分類して管理され、さらにデータアクセスしやすいように、矩形単位で分割、または空間インデックスを付与して管理されている。当該地図データは、図2に示す外部記憶装置206に記憶されている。
 地図データは、何を主題とするかによって、地図の幾何情報および属性情報の詳細度および構成が異なる。例えば、防犯計画のために犯罪が起こりやすい地域を推定するシミュレーションを行う場合は、昼間人口比、最寄り駅までの距離(最寄り駅距離)、都心までの時間距離(都心時間距離)、道路面積率、商住面積比および持ち家率など、一般的な市販地図には含まれていない属性情報(属性データ)が必要となる。
 類似地域検索部2では、例えば、人口、面積、主要産業、緑地率などの属性情報が格納された地図データに基づいて、統計学的な分析手法を用いて特徴量を定量的に表現し、その値の大きさによって類似性を判定して類似地域を取得する。主な分析手法としては、多変量解析が挙げられる。多変量解析は、互いに関係のある複数の変数を用いてある事象の要約や予測を行う統計手法であり、重回帰分析、数量化分析、クラスタ分析などが一例として挙げられる。重回帰分析は、定量的に表される複数の変数からある1つの変数を予測する手法であり、数量化分析では、変数のデータ形態が定性か定量かで数量化1類、数量化2類および数量化3類の何れかの分析手法を使用し、クラスタ分析は、異なる性質を持つものの集団から、互いに類似した性質を持つものどうしでグルーピングするような分析方法である。
 それぞれの分析方法には特徴があり、用いるデータによって分析の向き、不向きがあるため、同じデータを用いたとしても結果が異なる場合がある。類似性の判定は、例えば、各分析方法で得られたカテゴリスコア、サンプルスコアなどの値が近いものであれば、類似していると判定することができる。
 また、類似地域検索部2では、欠落している属性データ(欠落データ)以外の属性情報を用いて、類似地域を検索することも可能である。すなわち、類似地域検索部2は、地図データ処理装置1が具備するCRTモニターまたは液晶ディスプレイなどの表示装置202(図2)を介して、ユーザがデータ欠落地域を選択し、どの地図データを使って類似地域を検索するかなどの設定が可能である。地域および地図データの選択は、マウスおよびキーボードなどのユーザインターフェースである入力装置201(図2)を用いて行う。
 また、類似地域検索部2では、複数の検索パターンで類似地域を検索することも想定される。その場合、結果として算出された類似地域の地図データに基づいて、補完データ構築部3がデータ欠落地域の欠落データを補完した補完データ(補完済み地図データ)を生成する。この補完データは、検索パターンごとにタグ付けされて、データ出力部6から出力される。このタグとしては、属性名が用いられる。
 複数の検索パターンの一例としては、例えば、世帯当たり人員、人口密度、地区容積率の3つの指標で類似地域を算出する検索パターン1と、昼間人口比、都心までの時間距離、持ち家率の3つの指標で類似地域を算出する検索パターン2とを挙げることができる。検索パターン1は、住宅密集の観点から見たパターンであり、検索パターン2は、ベッドタウン的な性質から見た検索パターンと言える。
 このような場合、タグとしては、例えば、検索パターン1には「住宅密集地」、検索パターン2には「ベッドタウン」などを使用することで、補完データがどのような観点から算出されているかをイメージすることが可能となり、また、ユーザは検索パターンごとに地域分析の結果を比較することができる。
 補完データ構築部3は、類似地域検索部2で検索された類似地域の地図データに基づいて補完データを生成する。補完データの生成においては、データ欠落地域の地図データと類似地域の地図データとを比較し、2つの地図データの差に応じて類似地域の地図データを補正し、補完データとしても良い。例えば、類似地域検索部2で使用した統計手法により得られた類似度の差を用いて補完データを作成する方法が考えられる。
 すなわち、B市が欠落地域であり、一般的な統計データである国勢調査などの全国一律で整備されているデータを使って類似地域を算出する場合、A市の面積が20km、B市の面積が40kmであった場合、都市の成長力の観点からA市が類似地域として算出されたと仮定する。この場合、B市に対してA市は80%類似しているという結果が得られてものとする。例えば、都市の成長力を示す間接的な指標として、年間の道路工事総延長という指標を用いると、A市は50km、B市のそれは欠落している場合、B市の面積はA市の2倍であるので、単純に面積比でB市の年間の道路工事総延長を補完すると、100kmとなる。しかし、A市の類似度は80%であるため、類似度100%に対して20%分の誤差があるものとして、B市の道路工事総延長は80km~120km(±20km)として補完することができる。
 その他、類似地域とデータ欠落地域との両方が持っている地図データを用いて、両者の地図データの比率から補完データを導出する方法も考えられる。例えば犯罪発生率を表現する説明変数の集合において、A市とB市の両方が持っている指標のみで類似地域を算出することも考えられる。この場合も、類似性を示す比率から補完データを導出する点については同じである。
 データ分析部4は、補完データ構築部3で生成された補完データも含めて、外部記憶装置206に記憶された地図データを用いて、シミュレーションおよび統計分析などの地域分析を行う。どのような分析を実施するかはユーザが決定し、データ分析部4はユーザが決定した分析を実行する。この際、ユーザは、地図データにデータ欠落地域が含まれ、それを補完した補完データを使用していることなどは意識することなく、分析を実行させることができる。
 データ分析部4での分析結果は、地図データ処理装置1が具備するCRTモニターまたは液晶ディスプレイなどの表示装置202を介してユーザに提示される。
 整合性判定部5は、データ分析部4での分析結果の適否を判定する。補完データが正しく生成されなかった場合、データ分析部4での分析結果が予期したものとは大きく外れることが想定され、分析結果と予め想定した想定値との差に基づいて分析結果の適否を判定する。例えば、補完データに基づいて求めたA市の犯罪発生率が、想定値であるA市の隣のB市の犯罪発生率の100倍となった場合は、分析結果が不適切であると判定される。
 また、ある年度の地図データのみが欠落している場合、補完データがその前後の年度の地図データの傾向と異なっていれば、それは補完データが正しく生成されていないと判定することができる。
 なお、分析結果の適否の判定に替えて、補完データの適否を判定するようにしても良い。補完データが正しいか否かは、例えば、複数の検索パターンで類似地域を検索する方法で得られた補完データどうしを比較することで判定することができる。例えば、補完データのズレが±10%以内に収まっていれば、正しく補完できていると判定することができる。また、分析結果をユーザが判断し、その傾向に基づいて補完精度を向上させることも考えられる。
 データ出力部6は、補完データ構築部3で生成され、整合性判定部5で正しいと判断された補完データを、外部記憶装置206などの記憶媒体に出力する機能を有している。このように補完データを出力することで、再度この補完データを用いる必要性が生じた場合に再利用することができる。補完データは、それが補完データあることを明示するフラグを付与し、既存の地図データベースに格納される。
 また、補完データおよび地図データを地図データ処理装置1とは別個の外部記憶装置206に保存することで、補完データおよび地図データを地図データ処理装置1以外の分析装置でも使用することが可能となる。
  <地図データ>
 図3は、地図データの構成の一例を示す図である。地図データは、リレーショナルデータベースおよびファイルシステムなどを用いて管理される。以下では、このうちリレーショナルデータベースを用いて地図データを管理する地図データベース20(以下「地図DB20」と記す)を例にして地図データの構成を説明する。
 地図データベースDB20は、以下に示すデータ構造に基づき、地図データを管理している。すなわち、地図DB20は、地図データの構成要素である地物21の集合であり、地物21は、幾何情報31、属性情報41および位相情報51の組み合わせで構成されている。幾何情報31は、地物の形状を表現するための緯度および経度などの座標による位置情報を配列した情報である。属性情報41は、地物の特徴を示す情報である。位相情報51は、地物どうしのつながりを示す情報である。
 これらの情報は組み合わせることが可能である。例えば、道路ネットワークを示す場合は、位相情報51と属性情報41、道路形状を示す場合は、幾何情報31と属性情報41などのように組みあわせて利用される。幾何情報31と位相情報51との組み合わせでは、それぞれの情報が配列として管理され、それぞれ属性情報41と関連付けられる。以下、幾何情報31と属性情報41との関連付けについて説明する。なお、位相情報51と属性情報41との関連付けについても同様である。
 図4は、幾何情報31に示される主な幾何形状の種類(幾何種別31a)の一例を示す図である。幾何種別31aには、例えば、市区町村名および地名の代表点などを表現するポイント(点)データと、川、バス路線、等高線などの線を表現するポリライン(線)データと、家形図、公園、湖沼などの閉空間を表現するポリゴン(面)データなどが含まれる。また、これらの特徴を表現する属性情報41として、例えば道路の場合、国道、県道、市町村道などの道路種別、道路幅、道路名称などが定義される。
 図5は、複数の地物の幾何情報31の構成の一例を示す図である。図5に示すように、幾何情報31は、幾何種別31aだけでなく、地物の形を構成する座標点の配列(座標配列)、地物を一意に識別する地物IDなども合わせて管理される場合がある。座標点は、緯度、経度および平面直角座標系などで定義された数値情報で表現される。なお、地図データ(地図情報)の特徴によっては、セキュリティ面から座標値の配列に対して暗号化、圧縮化が行われている場合もある。
 図6は、位相情報51の構成の一例を示す図である。図6に示すように、位相情報51は、地物どうしのつながりを示す情報であり、例えばノード1およびリンク1などによって表現される。位相情報51は、道路ネットワークおよび鉄道ネットワークなどのネットワークのデータを管理する。ノードは、交差点などのネットワークを構成する結節点であり、始点、終点などを表現し、リンクは、ノードとノードとの間をつなぐ線などの要素である。
 図7は、複数の地物の属性情報を格納するテーブル構造61の一例を示す図である。テーブル構造61は、例えば、対象となる地物を一意に識別する地物IDと、当該地物の特徴を示した複数種類の属性情報とで構成される。例えば、地物が道路である場合には、その属性情報として、国道、県道、市町村道などの道路種別、道路幅、道路名称などが定義される。属性値の種類としては、数値、文字列、画像など、地物を特徴付ける各種情報から構成される。複数の地物に対する属性情報の集合は、属性情報リストとなる。
 図8は、補完データが格納された地図データの属性情報のテーブル構造の一例を示す図である。図8に示すように、テーブル構造71は、データ欠落地域を含むエリアの地図データの属性情報と、それが補完データであるか否かを示す補完データフラグで構成されている。例えば、ID2は、属性情報Attr5が欠落しているデータ欠落地域であり、属性情報Attr5は補完データ構築部3で生成された補完データであり、それが補完データであることを示す補完データフラグがTrueとなっている。一方、ID1は、属性情報Attr5が欠落しているデータ欠落地域ではなく、Attr5を保持しているため、補完データフラグがFalseとなっている。
 なお、図8に示すテーブル構造71は、地図データ処理装置1が具備する地図データベース20の中で管理される。このように、地図データベース20の中で補完データも管理することで、ハードウェアコストを抑制できる。
 図9は、欠落データの一例を示す図である。図9においては、類似地域検索部2で算出された類似地域81としてA市、B市およびC市が示されている。図中のデータ項目は、犯罪発生シミュレーションに用いるものであり、東京近郊の都市を想定し、世帯当たり人員、人口密度、昼間人口比、最寄り駅距離、都心時間距離、道路面積率、商住面積比、地区建ぺい率、地区容積率、持ち家率、公営公団率および民営借家率などの説明変数(x)であり、これらに基づいて被説明変数(従属変数)である犯罪発生率(y)を算出する。
 ここで、昼間人口比は、人口に対する昼間人口の比率(昼間人口/人口)で規定され、最寄り駅距離は、町(市)の中心点を起点とする駅までの距離で規定され、都心時間距離は、山手線から最寄り駅までの電車所要時間で規定され、道路面積率は、町面積に対する道路面積の比率(道路面積/町面積)で規定され、商住面積比は、住宅用地面積に対する商業用地面積の比率(商業用地面積/住宅用地面積)で規定される。地区建ぺい率は、町面積に対する建物面積の比率(建物面積/町面積)で規定され、地区容積率は、町面積に対する建物面積×建物階数の比率((建物面積×建物階数)/町丁面積)で規定される。
 犯罪発生率(y)と説明変数(x)との関係式を以下の数式(1)で表す。
 y=xβ+xβ+xβ+xβ+xβ+xβ+・・・+xβ・・・(1)
 上記数式(1)は、多変量解析で使用される重回帰分析の回帰式であり、説明変数(x)として、図9に表される世帯当たり人員、人口密度、昼間人口比などを使用し、各説明変数の係数(β)は、偏回帰係数である。
 図9に示されるように、A市は、犯罪発生率を算出するために必要な説明変数が全て○印であり、データを全て有している。一方、B市は道路面積率、持ち家率、公営公団率および民営借家率が×印であり、これらのデータが欠落している。またC市は、商住面積比、地区建ぺい率、地区容積率が×印であり、これらのデータが欠落している。
 この場合、B市において、上記数式(1)から犯罪発生率を算出するために、欠落している道路面積率、持ち家率、公営公団率および民営借家率のデータを補完するために、補完データ構築部3が、A市のデータに基づいて補完データを作成する。また、C市において欠落しているデータについても同様にA市のデータに基づいて補完データを作成する。
 上記のように、B市およびC市においては欠落データを有しているが、類似地域検索部2における類似地域検索処理では、与えられた全ての説明変数を使って類似地域を算出するものではなく、まず、どの視点から類似地域を算出するかを決め、類似性を判断する指標としてふさわしい説明変数を選出し、それを用いて類似地域を算出するものであり、B市およびC市において欠落データがあっても、それらを使用しなければ、類似地域検索処理は実行できる。例えば、世帯当たり人員、人口密度、昼間人口比などを選出すれば、類似性を判断に支障はない。
 次に、図10に示すフローチャートを用いて、地図データ処理装置1の全体処理について説明する。地図データ処理装置1が動作を開始すると、まず、類似地域検索部2において類似地域検索を実行し、類似地域を出力する(ステップS1)。
 次に、補完データ構築部3において、類似地域検索部2から出力された類似地域のうち特定の類似地域を選定し、データ欠落地域の欠落データを補完した補完データを作成する(ステップS2)。
 次に、データ分析部4において、補完データ構築部3で作成した補完データを用いて、ユーザによって選択された地域分析を実行する(ステップS3)。
 次に、整合性判定部5において、データ分析部4で実行したデータ欠落地域における地域分析の結果の整合性の有無を判定する(ステップS4)。地域分析の結果が周辺地域と大きく異なったり、予想とかけ離れたりした場合は、分析結果に整合性なしと(No)として、ステップS2の補完データの構築を再度実行し、再構築した補完データを用いて、ステップS3の地域分析をやり直す。一方、分析結果に整合性がある場合(Yes)は、ステップS5に移行する。
 ステップS5では、再度補完データを利用するために、ステップS3で生成した補完データをHDDなどの外部記憶装置206に出力し、一連の処理を終了する。
 図11は、図10に示したステップS1の類似地域検索部2における類似地域検索処理を詳細に示したフローチャートである。
 類似地域検索処理を開始すると、まず、データ欠落地域を含み、欠落データを補完するための類似地域を検索する検索対象範囲を設定する(ステップS21)。
 本実施の形態では、都道府県および市区町村などの予め定義された行政区域に基づいてユーザが選択し、類似地域検索の検索対象範囲として設定することを想定している。これにより、行政区域に従った分析を行うことができる。
 また、ユーザが類似地域の検索対象範囲を指定することで、検索にかかる処理コストを抑えることができる。
 次に、ステップS21で設定した検索対象範囲に含まれ、補完データを作成する対象であるデータ欠落地域をユーザが設定する(ステップS22)。データ欠落地域は、上記行政区域などのように予め定義された地域を想定している。
 次に、ステップS22で設定したデータ欠落地域において、補完データを作成する対象である欠落データをユーザが設定する(ステップS23)。ここで設定する欠落データは、複数であっても良い。なお、この処理は、後述する図12におけるステップS31の前に実行しても良い。
 次に、ステップS21で設定した類似地域を検索する対象範囲から、ステップS22で設定した補完対象であるデータ欠落地域と類似の特徴を有する類似地域を検索するために用いる地域データをユーザが設定する(ステップS24)。ここで用いる地域データとは、例えば地域の地理的特性を示す地形、土地利用、河川、気象、面積などのデータに加え、社会的特性を示す人口、住宅数、過去の災害被害、犯罪発生数などのデータが挙げられる。
 これらは、一般的に整備されている統計情報であり、汎用性が高い情報である。類似地域を検索するためにこれらを用いることで、地域ごとの特徴に基づいた類似地域を算出することができる。
 なお、上述した一般的な統計情報ではなく、データ分析部4で実行される分析で使用されるデータを用いて類似地域を算出しても良い。この場合、分析使用するデータが予め決まっているので、一般的な統計情報を用いる場合のように、設定の手間を省くことができる。
 次に、ステップS24で設定した類似地域を算出するために設定した地域データに基づいて、類似地域検索部2において、多変量解析である重回帰分析、数量化分析、クラスタ分析など、類似性を分析することを特徴とする統計手法を用いて類似地域検索を実行する(ステップS25)。類似地域検索は、類似性を示す定量的な数値(類似度)に基づいて実行される。
 次に、ステップS25で算出した類似度に基づき、類似地域検索部2において、類似度の高い順に類似地域を並べて出力する(ステップS26)。この場合、出力する類似地域数を指定することも可能である。また、類似度の値も併せて出力する。
 図12は、図10に示したステップS2の補完データ構築部3における補完データ構築処理を詳細に示したフローチャートである。
 補完データ構築処理を開始すると、まず、類似地域検索部2において検索した類似地域の中から、データ欠落地域の補完データを構築するための補完元となる類似地域をユーザが設定する(ステップS31)。このため、類似地域検索部2での検索結果は、表示装置202(図2)を介してユーザに提示される。ユーザは、入力装置201(図2)を類似地域を選択する。
 この類似地域はデータ欠落地域における欠落データに対応するデータを有していることを前提条件とする。もし、対応するデータが類似地域においても欠落している場合は、その対応するデータを有している別の類似地域を設定する。
 また、ユーザは類似度の値も見ることができるので、ユーザは意図的に補完元となる類似地域を選択することができる。また類似度の値が低い場合は、別の地域データを用いて類似地域の検索をやり直すなどの判断をすることができる。
 なお、類似地域検索部2からは類似度の高い順に類似地域が出力されるので、補完データ構築部3が最初に出力される類似地域を自動的に選択して類似地域としても良い。この場合、最初に出力される類似地域が、データ欠落地域における欠落データに対応するデータを有していない場合は、2番目に出力される類似地域を選択するようにすれば良い。
 次に、ステップS31で設定された類似地域の地図データに基づいて、補完データ構築部3がデータ欠落地域の補完データを生成する(ステップS32)。この際に、類似地域とデータ欠落地域の地域差を考慮した係数を算出し、それを類似地域における補完元となるデータに掛けることで、データ欠落地域の補完データを生成する。この係数は、例えばデータ欠落地域と類似地域の人口比および面積比など、欠落データと相関関係にある地域データを用いることで算出することができる。
 欠落データと相関関係にある地域データを用いて算出した係数を使用して補完データを生成することにより、定量的にデータを補完することができる。
 次に、ステップ32で生成した補完データに対して補完データ構築部3が補正する処理を行う(ステップS33)。例えば、補完元となる類似地域のデータの作成年が古い場合、現時点でのデータに補正する必要がある。このように補完データを補正する必要がある場合は、本ステップ中で実行する。補完データの補正は、例えば、人口密度であれば、該当地域の人口の増加係数(または減少係数)が判っているような場合は、補完元となる類似地域の人口密度を人口の増加係数(または減少係数)に基づいて現時点でのデータに補正する。
 次に、ステップ33で補正した補完データを地図データ処理装置1が備えるメモリ205(図2)上に一時保管(キャッシュ)する(ステップS34)。キャッシュされた補完データは、データ分析部4でのデータ分析で用いられる。
 このように、補完データに対して補完データ構築部3が補正する処理を行うことで、高度な地域分析で必要となるきめ細かい地図データを得ることができ、都市計画および観光計画で利用される高度なシミュレーションを手軽に行うことができる。また、補完データは、それが補完データあることを明示するフラグが付与されているので、補完データそのものを見ることで、当該地域の現状を把握できる。また、分析結果から欠落データを整備すべきかどうかを判断できる。また、類似地域が判ることで、そこで採用している施策などを参考にすることができる。
 <実施の形態2>
 以上説明した実施の形態1では、類似地域検索を行う検索対象範囲およびデータ欠落地域の設定を、都道府県および市区町村などの予め定義された行政区域に基づいてユーザが設定するものとして説明したが、ユーザが任意の範囲を指定して設定するようにしても良い。例えば、ユーザが任意の範囲をマウス等の入力装置201(図2)を用いて設定しても良い。
 図13は、任意の範囲として、地図上に重畳したメッシュの矩形状の1つのメッシュ101を指定する例を示している。この図13中のハッチングを付したメッシュ101が指定されたデータ欠落地域であり、メッシュが重畳された領域が類似地域検索を行う指定された検索対象範囲である。
 このメッシュ101のデータを補完するために、それ以外の場所のメッシュが重畳された検索対象範囲の地域データを用いて、図10~図12を用いて説明した実施の形態1の処理フローに従って、類似地域検索を行い、補完データを構築する。そのために、メッシュごとに地域データを集計する必要がある。メッシュごとに地域データを集計するためには、メッシュが被せられた予め定義された行政区域などが有する地域データを用いる。
 図13のメッシュ101のように、同じメッシュ内に複数の行政区域がまたがっている場合、そのメッシュ内に占める割合に応じて、そこにまたがっている行政区域が有する地域データを補正する。例えば、メッシュ内にA市、B市およびC市がまたがっており、それぞれ面積的に60%、30%および10%を占めており、A市、B市およびC市の人口が5万人、3万人および2万人だった場合、メッシュ101の人口は、5万人×60%、3万人×30%、2万人×10%の合計値である4.1万人となる。このようにして、各メッシュの地図データを集計し、メッシュが持つ属性値とする。なおこのメッシュ単位の地図データは、実施の形態1で示した地図データベース20を用いて管理する。
 このように、類似地域検索を行う範囲およびデータ欠落地域を任意の範囲として設定することで、よりきめ細かい地域分析が可能となる。例えば人口集中地区などをメッシュで区切って分析することで、地域の状態をより詳細に把握することができる。
 <実施の形態3>
 以上説明した実施の形態1では、地図データ処理装置1のデータ出力部6が出力するデータ欠落地域の補完データは、地図データ処理装置1が具備する地図データベース20の中で、補完データであることを示すフラグを設けたテーブル構造71で管理されるものとして説明したが、図14に示されるように、地図データベース20(第1のデータベース)とは別に、補完データのみで構成される地図データベース23(第2のデータベース)を設け、そこで管理する形態としても良い。
 この場合、補完データを管理する地図データベース23は、補完データを格納するテーブル構造71を有し、そのテーブルが持つIDと、地図データベース20が有する属性情報を格納するテーブル構造61のIDとがそれぞれ同一の地物であることを示す構造とすることで、そのIDをキーとして地図データベース20と補完データを格納する地図データベース23とを連携させることが可能となる。
 補完データを管理する地図データベース23を別途設けることで、既存の地図データベース20に手を加える必要がないため、保守性が向上する。
 この発明は詳細に説明されたが、上記した説明は、全ての局面において、例示であって、この発明がそれに限定されるものではない。例示されていない無数の変形例が、この発明の範囲から外れることなく想定され得るものと解される。
 なお、本発明は、その発明の範囲内において、各実施の形態を自由に組み合わせたり、各実施の形態を適宜、変形、省略することが可能である。

Claims (11)

  1.  地物の属性データを含む地図データにおいて、前記属性データが欠落しているデータ欠落地域の地図データを補完する地図データ処理装置であって、
     複数の地域を検索して、前記データ欠落地域と類似する類似地域を取得する類似地域検索部と、
     前記類似地域の地図データに基づいて、前記データ欠落地域の地図データにおける欠落データを補完した補完済み地図データを生成する補完データ構築部と、
     前記補完済み地図データを含む前記地図データに基づいて分析を行うデータ分析部と、
     前記データ分析部における前記補完済み地図データに基づいた分析結果の適否を判定する整合性判定部と、
     前記整合性判定部による判定結果が適正である場合は、前記補完済み地図データを出力するデータ出力部と、を備える、地図データ処理装置。
  2.  前記類似地域検索部は、
     前記データ欠落地域の地図データに含まれる、前記欠落データ以外の地域の地理的特性および社会的特性を示すデータを統計学的な分析手法により処理して、前記類似地域を取得する、請求項1記載の地図データ処理装置。
  3.  前記類似地域検索部は、
     取得した前記類似地域を、前記データ欠落地域との類似の程度を示す類似度と共に出力する、請求項1記載の地図データ処理装置。
  4.  前記補完データ構築部は、
     前記類似地域の地図データのうち、前記欠落データと相関の高いデータに基づいて前記類似地域と前記データ欠落地域との地域差を考慮した係数を算出し、該係数を前記類似地域の地図データの補完元となるデータに掛けることで、前記欠落データを補完する、請求項1記載の地図データ処理装置。
  5.  前記類似地域検索部は、
     検索パターンを使用して前記複数の地域を検索して前記類似地域を取得し、
     前記データ出力部は、
     前記補完データ構築部で生成した前記補完済み地図データに、前記検索パターンを表すタグを付けて出力する、請求項1記載の地図データ処理装置。
  6.  前記類似地域検索部は、
     前記データ分析部で分析に使用する前記地図データのうち、前記欠落データ以外のデータを統計学的な分析手法により処理して、前記類似地域を取得する、請求項1記載の地図データ処理装置。
  7.  前記類似地域検索部は、
     ユーザによって指定された検索対象範囲で前記類似地域を検索する、請求項1記載の地図データ処理装置。
  8.  前記検索対象範囲は、
     予め定義された行政区域に従って指定される、請求項7記載の地図データ処理装置。
  9.  前記検索対象範囲は、
     ユーザによって設定されたメッシュに従って指定される、請求項7記載の地図データ処理装置。
  10.  前記補完済み地図データは、
     外部に設けられた外部記憶装置に保存される、請求項1記載の地図データ処理装置。
  11.  前記補完済み地図データは、
     前記外部記憶装置内の、前記地図データを保存する第1のデータベースとは別の第2のデータベースで管理される、請求項10記載の地図データ処理装置。
PCT/JP2018/029793 2018-08-08 2018-08-08 地図データ処理装置 WO2020031296A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018562696A JP6472589B1 (ja) 2018-08-08 2018-08-08 地図データ処理装置
PCT/JP2018/029793 WO2020031296A1 (ja) 2018-08-08 2018-08-08 地図データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/029793 WO2020031296A1 (ja) 2018-08-08 2018-08-08 地図データ処理装置

Publications (1)

Publication Number Publication Date
WO2020031296A1 true WO2020031296A1 (ja) 2020-02-13

Family

ID=65443098

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/029793 WO2020031296A1 (ja) 2018-08-08 2018-08-08 地図データ処理装置

Country Status (2)

Country Link
JP (1) JP6472589B1 (ja)
WO (1) WO2020031296A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112767653A (zh) * 2020-12-21 2021-05-07 武汉达梦数据技术有限公司 一种地质灾害专业监测数据获取方法及系统
CN113377885A (zh) * 2020-03-10 2021-09-10 株式会社日立制作所 数据补充系统以及数据补充方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150373674A1 (en) * 2014-06-23 2015-12-24 Seunghee Han Lte-u communication devices and methods for aperiodic beacon and reference signal transmission
US20170156152A1 (en) * 2010-01-08 2017-06-01 Interdigital Patent Holdings, Inc. Channel state information transmission for multiple carriers
US20170208568A1 (en) * 2016-01-19 2017-07-20 Samsung Electronics Co., Ltd Method and apparatus for frame structure for advanced communication systems
WO2018031727A1 (en) * 2016-08-10 2018-02-15 Interdigital Patent Holdings, Inc. Systems and methods for aperiodic measurement reference signal transmission in multiple antenna systems
US20180145851A1 (en) * 2015-05-15 2018-05-24 Sharp Kabushiki Kaisha Terminal device

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5509666B2 (ja) * 2008-05-08 2014-06-04 日本電気株式会社 電波伝搬特性推測支援システム、電波伝搬特性推測支援方法及び電波伝搬特性推測支援装置
JP2017207878A (ja) * 2016-05-18 2017-11-24 富士通株式会社 欠落データ推定方法、欠落データ推定装置および欠落データ推定プログラム
JP2017220050A (ja) * 2016-06-08 2017-12-14 株式会社東芝 電力量予測装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170156152A1 (en) * 2010-01-08 2017-06-01 Interdigital Patent Holdings, Inc. Channel state information transmission for multiple carriers
US20150373674A1 (en) * 2014-06-23 2015-12-24 Seunghee Han Lte-u communication devices and methods for aperiodic beacon and reference signal transmission
US20180145851A1 (en) * 2015-05-15 2018-05-24 Sharp Kabushiki Kaisha Terminal device
US20170208568A1 (en) * 2016-01-19 2017-07-20 Samsung Electronics Co., Ltd Method and apparatus for frame structure for advanced communication systems
WO2018031727A1 (en) * 2016-08-10 2018-02-15 Interdigital Patent Holdings, Inc. Systems and methods for aperiodic measurement reference signal transmission in multiple antenna systems

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377885A (zh) * 2020-03-10 2021-09-10 株式会社日立制作所 数据补充系统以及数据补充方法
JP7384713B2 (ja) 2020-03-10 2023-11-21 株式会社日立製作所 データ補完システム、およびデータ補完方法
CN112767653A (zh) * 2020-12-21 2021-05-07 武汉达梦数据技术有限公司 一种地质灾害专业监测数据获取方法及系统

Also Published As

Publication number Publication date
JP6472589B1 (ja) 2019-02-20
JPWO2020031296A1 (ja) 2020-08-20

Similar Documents

Publication Publication Date Title
US10360228B1 (en) Ranking of geographic information
US8996523B1 (en) Forming quality street addresses from multiple providers
Zhu et al. Analysis of the impact of the MRT system on accessibility in Singapore using an integrated GIS tool
JP5914349B2 (ja) 多数の地図ビルディングブロックにおけるオブジェクトの相互参照と重複排除を行う方法と装置
US7085650B2 (en) System and method of geospatially mapping topological regions and displaying their attributes
US7953548B2 (en) Location-based information determination
US8782041B1 (en) Text search for weather data
US11703352B2 (en) Vector tile pyramiding
US20160328430A1 (en) Address/latitude and longitude converting device and geographical information system using the same
CN102012930A (zh) 一种扩充和更新地图的方法及电子辞典
WO2020031296A1 (ja) 地図データ処理装置
US20130018704A1 (en) Systems and methods for determining school geographic boundaries and related searches
Monir et al. Address Geocoding Services in Geospatial-based Epidemiological Analysis: A Comparative Reliability for Domestic Disease Mapping.
Koshkarev et al. Geo-portals as part of spatial data infrastructures: Russian Academy-supported resources and geoservices
US10521943B1 (en) Lot planning
Qian et al. Data cleaning approaches in Web2. 0 VGI application
Lu et al. A Comparison of Spatial and Nonspatial Methods in Statistical Modeling of NO 2: Prediction Accuracy, Uncertainty Quantification, and Model Interpretation
JP3673504B2 (ja) 地理情報検索システムと地理情報検索プログラム
Idhoko et al. Development of a geographic information systems road network database for emergency response: A case study of Oyo-Town, Oyo State, Nigeria
Kilic et al. Effects of reverse geocoding on OpenStreetMap tag quality assessment
Antonini et al. Topology-aware indexing system for urban knowledge
JP2013156990A (ja) 複数の空間客体を利用した検索方法
CN114996600B (zh) 一种多时相影像管理数据库数据写入、读取方法及装置
CN114723338A (zh) 资源数据的评估方法、装置和计算机设备
Grant et al. Urban modelling

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2018562696

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18929259

Country of ref document: EP

Kind code of ref document: A1