WO2015059877A1 - Information processing device and information processing method - Google Patents

Information processing device and information processing method Download PDF

Info

Publication number
WO2015059877A1
WO2015059877A1 PCT/JP2014/005041 JP2014005041W WO2015059877A1 WO 2015059877 A1 WO2015059877 A1 WO 2015059877A1 JP 2014005041 W JP2014005041 W JP 2014005041W WO 2015059877 A1 WO2015059877 A1 WO 2015059877A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
link
time
interpolation
traffic
Prior art date
Application number
PCT/JP2014/005041
Other languages
French (fr)
Japanese (ja)
Inventor
智晴 竹内
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to JP2015543697A priority Critical patent/JP6107964B2/en
Publication of WO2015059877A1 publication Critical patent/WO2015059877A1/en

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • G08G1/0112Measuring and analyzing of parameters relative to traffic conditions based on the source of data from the vehicle, e.g. floating car data [FCD]
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0133Traffic data processing for classifying traffic situation

Definitions

  • It relates to an information processing device that interpolates traffic information data.
  • the car navigation device provides the driver with the map information and the time it takes to reach the destination and the time it takes to pass through the traffic.
  • Some smartphone applications have similar functions. These times are calculated based on the past or present traffic situation of the road section (hereinafter referred to as a link), the link passage time, and the like. For example, it is calculated based on traffic data transmitted by VICS (registered trademark) (Vehicle Information and Communication System).
  • VICS registered trademark
  • VICS Vehicle Information and Communication System
  • probe car As another method of collecting vehicle travel data, there is a method of mounting sensors on the vehicle and collecting travel data of the vehicle.
  • a vehicle equipped with a sensor is called a probe car, and traveling data of the probe car is called probe data.
  • the probe data includes position coordinates and speed of the vehicle.
  • probe data When probe data is used, probe data in a range in which the probe car has traveled can be collected, and thus a wider range of travel data than VICS (registered trademark) can be collected.
  • VICS registered trademark
  • probe data since the position and time zone where the probe car travels are random, probe data may be lost depending on the road section or time zone. Therefore, interpolation of probe data for missing road sections and time zones is performed.
  • Patent Document 1 since the base is calculated for each area composed of the link group, the accuracy of the base deteriorates when the proportion of links that are biased in time increases although the total number of probe data is a certain amount or more. .
  • a link with time bias is, for example, a case where a road is mostly used during morning and evening commuting hours. In this case, daytime and nighttime probe data is lost.
  • the present invention has been made to solve the above-described problems, and an object of the present invention is to obtain an information processing apparatus that accurately interpolates data regardless of the proportion of links in which data is missing in an area. Yes.
  • a traffic data estimator that estimates time series data of link passage time indicating the time taken to pass the link from probe data collected from a vehicle traveling on a link that is a road section, and time series data of link passage time The correlation coefficient related to the link transit time between the interpolation target link that has a deficiency in the data and multiple interpolation application links that have no deficiency in the time series data of the link transit time is calculated. And a traffic data interpolation unit for calculating interpolation data for interpolating the link passing time at the missing time of the interpolation target link.
  • data can be accurately interpolated regardless of the proportion of links in which data is missing in the area.
  • FIG. 2 is a block diagram illustrating a configuration of an information processing device according to Embodiment 1.
  • FIG. FIG. 5 shows an example of probe data according to the first embodiment. The figure which shows an example of the map data of map data DB which concerns on Embodiment 1.
  • FIG. 3 is a flowchart showing a processing flow of the information processing apparatus according to the first embodiment.
  • FIG. 4 is a diagram showing an example of time-series data of link passage times according to the first embodiment.
  • FIG. 5 is a flowchart showing a process flow of a traffic data interpolation unit according to the first embodiment.
  • 9 is a flowchart showing a process flow of a traffic data estimation unit according to the second embodiment.
  • FIG. 9 is a flowchart showing a process flow of a traffic data interpolation unit according to the second embodiment.
  • the figure which shows the link to which the value of the correlation coefficient which concerns on Embodiment 2 is 2nd.
  • the figure which shows the graph of the time series data of the link passage time until the value of the correlation coefficient which concerns on Embodiment 2 is 2nd.
  • FIG. FIG. 4 is a block diagram illustrating a configuration of an information processing device according to a third embodiment.
  • FIG. 1 is a block diagram showing the configuration of the information processing apparatus 1 according to the first embodiment.
  • the information processing apparatus 1 includes a probe data receiving unit 10, a probe data processing unit 11, a map data database (hereinafter referred to as map data DB) 12 as a map data storage unit, a traffic data estimation unit 13, a traffic data output unit 14, It comprises a statistical data database (hereinafter referred to as statistical data DB) 15 as a statistical data storage unit and a traffic data interpolation unit 16.
  • Probe data is input to the probe data receiving unit 10 as vehicle travel data.
  • the probe data is data collected from a plurality of probe cars.
  • the probe data includes physical quantity data such as the position, travel speed, and traveling direction of the vehicle, and estimated data such as the type of road and the road surface condition.
  • the physical quantity data is a value measured by a sensor device such as GPS (Global Positioning System) or a gyro sensor.
  • the estimated data is data estimated from values measured by the sensor device.
  • the probe data receiving unit 10 outputs the received probe data to the probe data processing unit 11.
  • the probe data processing unit 11 refers to the map information held in the map data DB 12 and determines on which link each probe data is acquired.
  • the probe data processing unit 11 classifies the probe data for each link and outputs it to the traffic data estimation unit 13.
  • the map data DB 12 holds map information indicating the link position.
  • the traffic data estimation unit 13 aggregates the classified probe data and estimates the time series data of the link transit time for each link. In many cases, the time-series data of the link transit time changes periodically with a period of 24 hours. Therefore, in the present embodiment, the traffic data estimation unit 13 estimates time-series data for 24 hours, which is one day, but may not be one day. The traffic data estimation unit 13 determines whether or not there is a deficiency in the time series data of the link passage time, and if there is no deficiency, outputs to the traffic data output unit 14. Data missing is a case where there is no link transit time value at a certain time. When there is a defect, the traffic data estimation unit 13 outputs the link as an interpolation target link to the traffic data interpolation unit 16. Moreover, the traffic data estimation part 13 outputs the time series data of the estimated link passage time to the statistical data DB 15 regardless of the presence or absence of data loss.
  • Statistic data DB 15 holds time-series data of the link passage time of each link as a statistic value. When new data is input for a link that already holds data, the statistical data DB 15 updates the statistical value. For example, the statistical data DB 15 obtains an average value with the value already held and holds it as a new statistical value. By holding it as a statistical value, the amount of data can be kept low.
  • the traffic data interpolation unit 16 refers to the time series data of the link passage times of a plurality of links held in the statistical data DB 15 and interpolates the time series data of the link passage times of the interpolation target links. The traffic data interpolation unit 16 outputs the interpolated link passage time series data to the traffic data output unit 14.
  • the traffic data output unit 14 outputs time-series data of the link passage time for each link.
  • the output data is used, for example, in a traffic data use service.
  • the traffic data utilization service is a service for distributing traffic information to car navigation systems.
  • the car navigation system calculates the time required to arrive at the destination based on the link passing time at the current time. Further, the output data is used for calculating a traffic jam degree indicating an average speed and a traffic jam degree when passing through the link. Furthermore, it may be used to determine the presence or absence of traffic.
  • the traffic data output unit 14 may change the format and timing of data to be output according to the output destination.
  • FIG. 2 is a diagram illustrating an example of the probe data 21 according to the first embodiment.
  • the probe data 21 includes a vehicle ID, longitude, latitude, traveling direction, road type, date and time, and travel speed.
  • the vehicle ID is a value for identifying each vehicle.
  • the longitude and latitude indicate the position of the vehicle.
  • the traveling direction is a value indicating the direction in which the vehicle travels.
  • the road type is a value indicating the type of road such as an expressway or a general national road.
  • the date / time indicates the date / time when the data was acquired.
  • the traveling speed is a value indicating the speed of the vehicle.
  • the longitude, latitude, traveling direction, and road type are map information.
  • the date / time and the traveling speed are traveling information.
  • Probe data 21 a to e are specific examples of data stored as probe data 21.
  • a vehicle having a vehicle ID of 0001 is traveling on a highway in a direction of 10 ° at a position of longitude 35.000 and latitude 139.000, and the date and time is 9 o'clock on September 1, 2013.
  • the traveling speed is 90 km / hour.
  • Probe data 21 is an example.
  • the probe data only needs to include at least map information that identifies the link on which the vehicle is traveling and traveling information that can estimate the time required for the vehicle to pass through the link.
  • the item of the map information of the probe data 21 includes the item of the map data DB 12, the link on which the vehicle is traveling can be easily specified.
  • the map data DB 12 is provided with latitude and longitude as items, if the latitude and longitude are included as the map information of the probe data 21, the link on which the vehicle is traveling can be easily specified.
  • the map data DB 12 is a database that stores link map data.
  • the link map data is data indicating the position of the link.
  • the map data includes at least a link number that identifies the link, and a latitude and longitude that indicate the position of the link.
  • the map data may include traffic restriction information such as a speed limit and a traveling direction, a road type that distinguishes an expressway, a general national road, a prefectural road, and the like. By adding the traffic restriction information and the road type to the map data, the accuracy of associating the links with the probe data 21a-n is improved.
  • FIG. 3 is a diagram illustrating an example of the map data 31 of the map data DB 12 according to the first embodiment.
  • the map data 31 includes a forward link number, a reverse link number, a road number, longitude, latitude, and a road type.
  • the forward link number is a value indicating the uplink lane of the link.
  • the reverse link number is a value indicating the downlink lane of the link.
  • the road number is a value for identifying the road.
  • the longitude is a value indicating the longitude of the link.
  • the latitude is a value indicating the latitude of the link.
  • the road type is a value indicating the type of road such as an expressway or a general national road.
  • the map data 31 a to f are specific examples of data stored as the map data 31.
  • the map data 31a indicates that the forward link number is 100, the reverse link number is 103, the road number is 10, the longitude is 35.000, the latitude is 139.200, and the road type is a general national road.
  • the map data 31a to 31c are data relating to the same road having the same road number 10. Although it is the data regarding the same road, since the position where data was collected is different, different values for longitude and latitude are stored.
  • FIG. 4 is a flowchart showing a process flow of the information processing apparatus 1 according to the first embodiment.
  • the information processing apparatus 1 starts processing from step S41.
  • the probe data receiving unit 10 receives the probe data 21.
  • the timing at which the probe data 21 is input to the probe data receiving unit 10 is not particularly limited.
  • the probe data 21 may be input regularly or irregularly. Further, the smaller the measurement interval of the probe data 21 is, the higher the accuracy of the link passing time can be estimated. If the measurement interval is small, the amount of data increases, and fluctuations in the estimated value of the link transit time can be reduced.
  • the measurement interval is arbitrary, but it is desirable to set it at several seconds.
  • the probe data receiving unit 10 outputs the probe data 21 to the probe data processing unit 11. The process proceeds to step S42.
  • step S42 the probe data processing unit 11 classifies the input probe data 21a to 21n for each link.
  • the association between the link and each probe data 21a-n is called map matching.
  • the probe data processing unit 11 determines and classifies which link each probe data 21a to 21n is running on the basis of the map data DB 12 and the map information of each probe data 21a to 21n. Further, the probe data processing unit 11 calculates the length of each link. The length of each link is a road.
  • the probe data processing unit 11 outputs the probe data 21a to 21n classified for each link and the length of each link to the traffic data estimation unit 13. The process proceeds to step S43.
  • step S43 the traffic data estimation unit 13 aggregates the probe data classified for each link, and estimates the time series data of the link passage time for each link.
  • the link passing time is the time taken for the link to pass.
  • the time series data of the link passage time represents the daily time series change with respect to the link passage time. Details of the processing will be described later. The process proceeds to step S44.
  • step S44 the traffic data estimation unit 13 determines whether or not interpolation is required for the time series data of the link passage time for each link.
  • FIG. 5 is a diagram illustrating an example of time-series data of the link passage time according to the first embodiment. The horizontal axis is time. The vertical axis is the link passing time. This is an example in which there is no missing data. Since there is no deficiency in the data, the data exists at equal intervals. The traffic data estimation unit 13 determines that interpolation is not necessary when data is not missing. The process proceeds to step S46 in FIG.
  • FIG. 6 is a diagram illustrating an example of time-series data of link passage times according to the first embodiment.
  • the horizontal axis is time.
  • the vertical axis is the link passing time. This is an example of missing data. Since there is a deficiency in data, there are places where data does not exist at regular intervals. If the data is missing, the traffic data estimation unit 13 determines that interpolation is necessary, and sets the link as an interpolation target link. The process proceeds to step S45 in FIG.
  • the traffic data interpolation unit 16 interpolates the time series data of the link passage time with respect to the interpolation target link. Details of the processing will be described later. The process proceeds to step S46.
  • step S46 the traffic data output unit 14 outputs time series data of the link passage time for each link. The process ends.
  • FIG. 7 is a flowchart showing a process flow of the traffic data estimation unit 13 according to the first embodiment. It is the detail of step S43 of FIG.
  • the traffic data estimation unit 13 starts processing from step S71 when the probe data 21a to n classified for each link and the length of each link are input from the probe data processing unit 11.
  • the traffic data estimation unit 13 aggregates the probe data 21a to 21n classified for each link and estimates time series data of the link passage time.
  • the traffic data estimation unit 13 calculates an average passing speed at each time for each link based on the date and traveling speed of the probe data 21a to 21n.
  • the traffic data estimation unit 13 estimates the time series data of the link passage time by calculating the average passage time for each time from the length of each link. At this time, if the sampling interval is set to be as small as about 5 minutes, it is possible to confirm the change in the traffic congestion state of the link.
  • the traffic data estimation unit 13 may estimate the time series data of the link transit time separately according to weekdays, holidays, days of the week, and the like.
  • the traffic data estimation unit 13 may smooth the time series data of the link passage time. For example, the traffic data estimation unit 13 smoothes the data by averaging the link passage time data for 30 minutes before and after each sampled time. However, if the averaging time width is too large, link characteristics such as traffic congestion will be lost. Therefore, it is necessary to perform averaging by setting an appropriate time interval from the estimation accuracy and processing cost. The process proceeds to step S72.
  • step S72 the traffic data estimation unit 13 determines the presence or absence of data loss in the time series data of the link passage time. When there is a data loss, the traffic data estimation unit 13 determines a data loss rate. The time at which data is missing is called the missing time, and the rate at which the data is missing is called the degree of deficiency. Two conditions for determining the height of the deficiency are illustrated.
  • the traffic data estimation unit 13 determines that the deficiency is high when the total time during which data is missing is greater than or equal to a threshold value in a certain time width.
  • FIG. 8 is a diagram illustrating a case where data is missing in the time series data of the link passage time according to the first embodiment and the first determination condition is satisfied.
  • FIG. 8 shows an example in which the sampling interval of the link passage time is 5 minutes, the time width for loss determination is 30 minutes, and the threshold is 20 minutes. Since the sampling interval is 5 minutes, 6 points of data should exist in a time width of 30 minutes. However, in the time width of 30 minutes indicated by the dotted frame in FIG. 8, there are only two points of data, and a total of 20 minutes of data is missing. Since the threshold value is 20 minutes, the traffic data estimation unit 13 determines that the degree of data loss is high in the time span.
  • the time span for determining the deficiency may be the entire time-series data of the link passage time. Further, the traffic data estimation unit 13 shifts the time width little by little for the entire time series data of the link passage time, and determines the data loss degree. When the number of times that the loss degree is determined to be high is equal to or greater than the threshold, the link It may be determined that the degree of deficiency of the entire time series data of the passage time is high.
  • the traffic data estimation unit 13 determines that the deficiency is high when the total time for which data is continuously missing is equal to or greater than a threshold.
  • FIG. 9 is a diagram illustrating a case where data is missing in the time series data of the link passage time according to the first embodiment and the second determination condition is satisfied.
  • FIG. 9 shows a case where, for example, the sampling interval of the link passage time is 5 minutes and the threshold of the continuous missing time is 15 minutes. Since the sampling interval is 5 minutes, it is determined that the degree of data loss is high when three or more points of data are continuously lost. At 15 minutes indicated by the arrow in FIG. 9, data is missing.
  • the traffic data estimation unit 13 determines that the time series data has a high degree of deficiency.
  • the traffic data estimation unit 13 determines that the degree of data loss is high when one of the two determination conditions is satisfied, but may determine the data by other methods.
  • FIG. 10 is a diagram showing a case where data is not lost in the time series data of the link passage time according to the first embodiment.
  • the traffic data estimation unit 13 determines that the data deficiency is low.
  • the traffic data estimation unit 13 sets the link as an interpolation target link when the degree of data loss is low.
  • the interpolation when the data deficiency is high is described in the second embodiment.
  • the process of FIG. 7 proceeds to step S73.
  • the traffic data estimation unit 13 outputs time-series data of the estimated link passage time to the statistical data DB 15. The process proceeds to step S74.
  • step S74 the traffic data estimation unit 13 outputs the time series data of the link passage time of the interpolation target link to the traffic data interpolation unit 16.
  • the traffic data estimation unit 13 outputs the time series data of the link passage times of links that are not interpolation targets to the traffic data output unit 14. The process ends.
  • FIG. 11 is a diagram illustrating an example of statistical data of the statistical data DB 15 according to the first embodiment.
  • the statistical data DB 15 holds time-series data of link transit times input from the traffic data estimation unit 13.
  • the horizontal axis represents time
  • the vertical axis represents link passage time.
  • FIG. 12 is a flowchart showing a processing flow of the traffic data interpolation unit 16 according to the first embodiment.
  • the traffic data interpolation unit 16 interpolates the time series data of the link transit time of the link determined as the interpolation target link by the traffic data estimation unit 13.
  • the traffic data interpolation unit 16 starts processing from step S121 when time series data of the link passage time of the interpolation target link is input.
  • the traffic data interpolation unit 16 refers to the statistical data DB 15 and extracts time-series data of the link transit times of links for which no data is missing.
  • the extracted link is called a reference link.
  • the traffic data interpolation unit 16 extracts the reference link without considering the positional relationship between the reference link and the interpolation target link.
  • the area may be arbitrarily determined. For example, you may divide
  • the traffic data interpolation unit 16 can secure a certain number of reference links.
  • the traffic data interpolation unit 16 may use all links without data loss among the links stored in the statistical data DB 15 as reference links, but the processing cost increases. Therefore, the traffic data interpolation unit 16 may extract the reference link from the area to which the interpolation target link belongs. The process proceeds to step S122.
  • step S122 the traffic data interpolation unit 16 calculates the correlation coefficient between the time series data of the link passage time of the interpolation target link and the time series data of the link passage time of the reference link. If the data deficiency is low, the correlation coefficient is calculated by thinning out the data, or for example, the traffic data interpolation unit 16 is deficient in the intermediate value of the data at the time before and after the deficient data.
  • the correlation coefficient is calculated as follows. A correlation coefficient is calculated for each of the plurality of reference links. Further, the traffic data interpolation unit 16 ranks the reference links in descending order of the correlation coefficient, and extracts data up to the R rank. The process proceeds to step S123.
  • step S123 the traffic data interpolation unit 16 standardizes the time series data of the link passage times of the reference links up to the R rank. Since each link has a different length, the link transit time differs when passing through each link at the same speed. Therefore, for example, the time series data of the link passage time is standardized by a value obtained by dividing the link length by the regulation speed.
  • the traffic data interpolation unit 16 can match the length of the link passage time of the interpolation target link by multiplying the normalized time series data of the link passage time by the length of the interpolation target link. The process proceeds to step S124.
  • the traffic data interpolation unit 16 sets the reference link having the correlation coefficient value up to the R rank as the interpolation application link.
  • the traffic data interpolation unit 16 calculates the interpolation data by adding the weighted time series data of the link transit times of the plurality of interpolation application links.
  • the traffic data interpolation unit 16 calculates the interpolation data L0 (T) using Equation 1.
  • L (T, r) indicates time-series data of the standardized link transit time.
  • x (T, r) represents a correlation coefficient.
  • the traffic data interpolation unit 16 substitutes the interpolation data as the missing time value. In addition, the traffic data interpolation unit 16 smoothes data in an arbitrary time width in order to maintain continuity. The process proceeds to step S125.
  • step S125 the traffic data interpolation unit 16 returns to step S121 if there are other interpolation target links. If there is no other interpolation target link, the traffic data interpolation unit 16 ends the process.
  • the statistical data DB 15 stores the statistical values for the time series data of the link transit time of each link.
  • the statistical data DB 15 may hold the data or the statistical values by dividing the period. . For example, by using data of the past several hours, it is possible to estimate the link transit time according to the current situation such as an accident or traffic jam. Further, by using data when a similar event in the past is used as the link passage time when an event such as a fireworks display or a concert is held, it is possible to estimate the link passage time with higher accuracy.
  • a traffic data estimation unit that estimates time series data of a link passing time indicating a time taken to pass the link from probe data collected from a vehicle traveling on a link that is a road section; , Calculate the correlation coefficient for the link transit time between the link to be interpolated that has a deficiency in the time series data of the link transit time and a plurality of interpolation application links that have no deficiency in the time series data of the link transit time.
  • a traffic data interpolating unit that calculates interpolation data for interpolating the link passing time of the missing time of the interpolation target link based on the link passing time and the correlation coefficient, so that data is missing in the area Regardless of the link ratio, the accuracy of data interpolation can be increased.
  • interpolation data is calculated from time-series data of link passage times of links with higher correlation by making the top N correlation coefficients (N is an integer equal to or greater than 1) as an interpolation application link.
  • N is an integer equal to or greater than 1.
  • the traffic data estimation unit divides a map including a plurality of links into a plurality of regions, and determines an interpolation application link from links included in the same region as the interpolation target link. Processing costs can be reduced.
  • the traffic data estimation unit determines the size of the area according to the amount of probe data collected in the area, a certain amount of probe data can be secured. Therefore, it is possible to improve accuracy in data interpolation.
  • Embodiment 2 the time series data of the link transit time is interpolated using data of another link having a high correlation when the data is missing. Shows an embodiment in which time-series data of link transit times is divided into a plurality of time zones, and interpolation is performed using link data having a high correlation in other time zones when the rate of data loss is high. .
  • all the configurations described in the first embodiment as shown in FIG. 1 are provided, and further additional configurations will be described. Since the configuration of the information processing apparatus 1 is the same as that of the first embodiment, the description thereof is omitted.
  • FIG. 13 is a flowchart showing a process flow of the traffic data estimation unit 13 according to the second embodiment.
  • Step S131 is the same as step S71 in FIG. The process proceeds to step S132.
  • step S132 the traffic data estimation unit 13 divides the time series data of the link passage time into a plurality of time zones.
  • the number of divisions is not particularly limited. The process proceeds to step S133.
  • step S133 the traffic data estimation unit 13 determines the data loss degree in each of a plurality of time zones.
  • the determination of the degree of data loss is the same as the method described in step S72 in FIG. In the present embodiment, even when the degree of data loss is high, the interpolation is performed. Details will be described later.
  • the process proceeds to step S134.
  • steps S134 to S135 are the same as those in steps S73 to S74 in FIG. 7 for the time series data in each of a plurality of time zones. Description is omitted. The process ends.
  • FIG. 14 is a diagram illustrating an example in which the time-series data of the link passage time according to the second embodiment is divided into four time zones.
  • 141a is time series data of the link passage time for one day of the interpolation target link.
  • 141b is time-series data of the link transit time in the first time zone T1. There is no missing data and it is not an interpolation target link.
  • 141c is time-series data of the link transit time in the second time zone T2. Since the degree of data loss is high, the correlation with the reference link cannot be calculated.
  • 141d is time-series data of the link transit time in the third time zone T3. There is no missing data and it is not an interpolation target link.
  • 141e is time-series data of the link transit time in the fourth time zone T4. Since the data deficiency is low, the interpolation data can be calculated by calculating the correlation with the reference link.
  • FIG. 15 is a flowchart showing a processing flow of the traffic data interpolation unit 16 according to the second embodiment.
  • the traffic data interpolation unit 16 interpolates the time series data of the link transit time of the link determined as the interpolation target link by the traffic data estimation unit 13.
  • the traffic data interpolation unit 16 starts processing from step S151 when time-series data of the link passage time of each time zone including the interpolation target link is input.
  • step S151 is the same as step S121 of FIG. 12, description thereof is omitted.
  • the process proceeds to step S152.
  • step S152 the traffic data interpolation unit 16 calculates a correlation with the reference link for a time zone in which there is no data loss and a time zone in which the data loss degree is low.
  • a correlation coefficient between the time series data of the link passage times of the time zones T1, T3, and T4 and the time series data of the link passage times of the same time zone of the reference link is calculated.
  • the time zone T4 is a case where the degree of data loss is low.
  • the traffic data interpolation unit 16 calculates a correlation coefficient as data that lacks an intermediate value of data at times before and after the missing data. In the time zone T2, since data loss is high, the correlation cannot be calculated.
  • the traffic data interpolation unit 16 ranks the reference links in descending order of the correlation coefficient, and extracts data up to the R rank.
  • graphs of links up to the second place, correlation coefficient values, and time-series data are shown in FIGS.
  • FIG. 16 is a diagram showing links up to the second place of correlation coefficient values according to the second embodiment.
  • the first place is the link L1
  • the second place is the link L2.
  • the time zone T2 has no value because the correlation cannot be calculated.
  • the first place is the link L1
  • the second place is the link L3.
  • the first place is the link L2, and the second place is the link L3.
  • FIG. 17 is a diagram showing values up to the second place of the correlation coefficient according to the second embodiment.
  • the first-order correlation coefficient is a1
  • the second-order correlation coefficient is a2.
  • the time zone T2 has no value because the correlation cannot be calculated.
  • the first-order correlation coefficient is c1
  • the second-order correlation coefficient is c2.
  • the first-order correlation coefficient is d1
  • the second-order correlation coefficient is d2.
  • FIG. 18 is a diagram showing a graph of time-series data of the link transit time up to the second-order correlation coefficient value according to the second embodiment.
  • the first place in the time zone T1 is 181a, and the second place is 181b.
  • the first place in the time zone T3 is 181c, and the second place is 181d.
  • the first place in the time zone T4 is 181e, and the second place is 181f.
  • step S153 the traffic data interpolation unit 16 normalizes the time series data of the link passage time of each link.
  • the process is the same as step S123 in FIG. The process proceeds to step S154.
  • the traffic data interpolation unit 16 calculates the interpolation data of the time zone in which the data is missing by adding the weighted time series data of the link passing times of the plurality of interpolation application links.
  • the traffic data interpolation unit 16 calculates the interpolation data L0 (Tk) using Equation 2.
  • the traffic data interpolation unit 16 calculates the time series data L (Tk, r) of the link transit time until the correlation coefficient rank r reaches R, and the correlation coefficient x (Tk, r).
  • the traffic data interpolation unit 16 calculates the interpolation data L0 (T4) using Equation 3.
  • the traffic data interpolation unit 16 calculates the interpolation data L0 (Tk) using Equation 4.
  • the traffic data interpolation unit 16 uses the time series data L (Tk, r) of the link transit time up to the R rank of the correlation coefficient in the time zone other than Tk, and the correlation coefficient x (Tk, r). To calculate.
  • the traffic data interpolation unit 16 calculates the interpolation data L0 (T2) using Equation 5.
  • the traffic data interpolation unit 16 substitutes the interpolation data as the missing time value. In addition, the traffic data interpolation unit 16 smoothes data in an arbitrary time width in order to maintain continuity. The process proceeds to step S155.
  • step S155 the traffic data interpolation unit 16 combines the interpolated time zone data and the non-interpolated time zone data to generate one day of interpolated data.
  • the time series data in the interpolated time zone may lose continuity with the time series data in the preceding and following time zones. Therefore, the traffic data interpolation unit 16 smoothes the data before and after the interpolated time zone. For example, the traffic data interpolation unit 16 averages and smoothes the data for 30 minutes before and after each of the data included in the first 30 minutes and the last 30 minutes of the time zone.
  • FIG. 19 is a diagram illustrating an example in which time-series data of link passage times divided into four time zones according to the second embodiment are combined.
  • 19a is time-series data of the link transit time in the first time zone T1. There is no missing data and no interpolation.
  • 19b is time-series data of the link transit time in the second time zone T2. The data is missing and the data is interpolated.
  • 19c is time series data of the link passing time in the third time zone T3.
  • 19d is the time series data of the link passing time in the fourth time zone T4. The data is missing and the data is interpolated.
  • Reference numeral 19e denotes data for one day including the time series data of the link passage times of 19a to 19d.
  • step S156 the traffic data interpolation unit 16 returns to step S151 if there are other interpolation target links. If there is no other interpolation target link, the traffic data interpolation unit 16 ends the process.
  • the time-series data cannot express the characteristics of changes in the link transit time even if the intermediate value of the previous and subsequent data is taken. Therefore, even if the correlation with the reference link is calculated, an appropriate interpolation application link cannot be extracted. Therefore, it is more likely that the link passage time can be estimated with higher accuracy when the interpolation data is calculated using data in other time zones. Note that even when the data deficiency is low, interpolation data may be calculated using data in other time zones.
  • the traffic data interpolation unit divides the time series data of the link passage time into a plurality of time zones, calculates a correlation coefficient regarding the link passage time with the interpolation application link for each time zone, Interpolation data is calculated based on the correlation coefficient in the time zone including the missing time and the link transit time of the interpolation application link, so that the interpolation application link with higher correlation can be used depending on the time zone, and in data interpolation Increase accuracy.
  • the traffic data interpolation unit divides the time series data of the link passage time into a plurality of time zones, calculates the correlation coefficient regarding the link passage time with the interpolation application link for each time zone, and does not include the missing time. Since the interpolation data is calculated based on the correlation coefficient in the band and the link passage time of the interpolation application link, the interpolation data can be calculated for more links. Therefore, the information processing apparatus 1 can output highly accurate traffic data for more links.
  • the traffic data estimation unit estimates the time series data of the link transit time of the interpolation application link based on the probe data of the first period, the current situation or the situation that occurred in the past specific period It is possible to estimate the link transit time according to
  • Embodiment 3 FIG.
  • the time series data of the link transit time is divided into a plurality of time zones, and when the data loss rate is high, interpolation is performed using data of links having high correlation in other time zones.
  • an embodiment in which data collected from road sensors is added to the data of the statistical data DB is shown.
  • all the configurations described in the first embodiment as shown in FIG. 1 are provided, and further additional configurations will be described.
  • FIG. 20 is a block diagram showing a configuration of the information processing apparatus 200 according to the third embodiment.
  • the information processing apparatus 200 includes a probe data reception unit 10, a probe data processing unit 11, a map data DB 12, a traffic data estimation unit 13, a traffic data output unit 14, a statistical data DB 15, a traffic data interpolation unit 16, and a road sensor data reception unit 201.
  • the road sensor data processing unit 202 is configured.
  • the road sensor data collected from the road sensor is input to the road sensor data receiving unit 201 as travel data.
  • the road sensor data is based on data collected by road sensors such as vehicle detectors installed on the road.
  • the road sensor observes a passing vehicle and collects data.
  • the timing at which road sensor data is input is not particularly limited.
  • the road sensor data may be input regularly or irregularly.
  • a typical example of road sensor data is VICS (registered trademark).
  • VICS registered trademark
  • the link currency time estimated from the data collected by the road sensor every 5 minutes is transmitted to the center.
  • the road sensor data receiving unit 18 outputs road sensor data to the road sensor data processing unit 202.
  • the road sensor data processing unit 19 aggregates the input road sensor data and outputs time-series data of the link passage time for each link to the statistical data DB 15.
  • the statistical data DB 15 holds the time series data of the link passage times of the links input from the traffic data estimation unit 13 and the road sensor data processing unit 202 as statistical values. When new data is input for a link that already holds data, the statistical data DB 15 updates the statistical value.
  • Traffic Information Processing Device 10 Probe Data Receiving Unit 11
  • Probe Data Processing Unit 12 Map Data DB 13
  • Traffic data estimation unit 14 Traffic data output unit 15
  • Statistical data DB 16 Traffic data interpolation unit 21, 21a-n Probe data 31, 31a-n Map data 111a-n, 141a-e, 181a-f, 191a-e Time series data of link passing time 201 Road sensor data reception unit 202 Road sensor Data processing section

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)

Abstract

An information processing device according to the present invention is provided with: a traffic data estimation unit which estimates, from probe data collected from vehicles traveling along links, time-series data for the link transit time of each link, where the term "link" refers to a road segment and the term "link transit time" refers to the time required to transit a link; and a traffic data interpolation unit which calculates the correlation coefficients between the link transit time of a link to be interpolated, the time-series data for which has missing data, and the link transit times of a plurality of links to be applied, the time-series data for which does not have any missing data and is used for interpolation, and then calculates interpolation data for interpolating data at missing time points in the time-series data for the link transit time of the link to be interpolated, on the basis of the calculated correlation coefficients and the link transit times of the plurality of links to be applied. This makes it possible to accurately interpolate data for links in an area, regardless of the proportion of links for which all data is not available.

Description

情報処理装置及び情報処理方法Information processing apparatus and information processing method
 交通情報のデータを補間する情報処理装置に関する。 It relates to an information processing device that interpolates traffic information data.
 カーナビゲーション装置は、地図情報とともに目的地に到着するまでにかかる時間や渋滞を通過するのにかかる時間などをドライバーに提供している。スマートフォンのアプリケーションでも、同様の機能を有するものがある。これらの時間は、道路区間(以下、リンクと称す)の過去または現在の渋滞状況や、リンク通過時間などに基づいて算出される。例えば、VICS(登録商標)(Vehicle Information and Communication System)によって送信される交通データに基づいて算出される。VICS(登録商標)は、道路上に設置された路上センサから収集される車両の走行データを集約し、交通データとして提供するシステムである。路上センサの設置や維持には費用がかかるため、路上センサの設置は高速道路や国道等の主要幹線に限られているのが現状である。したがって、路上センサが設置されていない道路に関する交通情報は、VICS(登録商標)から提供されない。 The car navigation device provides the driver with the map information and the time it takes to reach the destination and the time it takes to pass through the traffic. Some smartphone applications have similar functions. These times are calculated based on the past or present traffic situation of the road section (hereinafter referred to as a link), the link passage time, and the like. For example, it is calculated based on traffic data transmitted by VICS (registered trademark) (Vehicle Information and Communication System). VICS (registered trademark) is a system that aggregates vehicle travel data collected from road sensors installed on a road and provides the data as traffic data. Since installation and maintenance of road sensors are expensive, installation of road sensors is currently limited to major trunk lines such as highways and national roads. Therefore, the traffic information regarding the road where the road sensor is not installed is not provided from VICS (registered trademark).
 車両の走行データを収集する他の方法として、車両にセンサを搭載し、当該車両の走行データを収集する方法がある。センサを搭載した車両をプローブカーと呼び、プローブカーの走行データをプローブデータと呼ぶ。プローブデータには、当該車両の位置座標や速度等が含まれる。プローブデータを利用する場合、プローブカーが走行した範囲のプローブデータを収集することができるため、VICS(登録商標)より広範囲の走行データを収集することが可能である。
 一方、現状ではプローブカーが少ない。また、プローブカーが走行する位置や時間帯はランダムであるため、道路区間や時間帯によってプローブデータが欠損する場合がある。そこで、欠損した道路区間や時間帯のプローブデータの補間が行われている。
As another method of collecting vehicle travel data, there is a method of mounting sensors on the vehicle and collecting travel data of the vehicle. A vehicle equipped with a sensor is called a probe car, and traveling data of the probe car is called probe data. The probe data includes position coordinates and speed of the vehicle. When probe data is used, probe data in a range in which the probe car has traveled can be collected, and thus a wider range of travel data than VICS (registered trademark) can be collected.
On the other hand, there are few probe cars at present. In addition, since the position and time zone where the probe car travels are random, probe data may be lost depending on the road section or time zone. Therefore, interpolation of probe data for missing road sections and time zones is performed.
 過去のプローブデータについてリンク群毎に主成分分析を行い、算出した複数の基底から相関の強い基底を選択し、線形合成することにより、欠損したリンクを含むリンク群のプローブデータの補間データを推定する技術が開示されている。(下記特許文献1参照) Principal component analysis of past probe data is performed for each link group, and a highly correlated base is selected from the calculated multiple bases, and linear synthesis is performed to estimate the interpolated data of the probe data of the link group including the missing link. Techniques to do this are disclosed. (See Patent Document 1 below)
特許第4729469号公報Japanese Patent No. 4729469
 しかしながら、特許文献1では、リンク群から成るエリアごとに基底を算出するため、プローブデータの総数は一定量以上であるものの時間的に偏りのあるリンクの割合が増加すると、基底の精度が悪化する。時間的に偏りのあるリンクとは、例えば、朝夕の通勤時間帯に道路を利用されるのがほとんどであるようなケースである。この場合、日中や夜間のプローブデータが欠損する。 However, in Patent Document 1, since the base is calculated for each area composed of the link group, the accuracy of the base deteriorates when the proportion of links that are biased in time increases although the total number of probe data is a certain amount or more. . A link with time bias is, for example, a case where a road is mostly used during morning and evening commuting hours. In this case, daytime and nighttime probe data is lost.
 本発明は上記のような問題点を解決するためになされたもので、エリア内においてデータが欠損しているリンクの割合に拘らず、精度よくデータを補間する情報処理装置を得ることを目的としている。 The present invention has been made to solve the above-described problems, and an object of the present invention is to obtain an information processing apparatus that accurately interpolates data regardless of the proportion of links in which data is missing in an area. Yes.
 道路の区間であるリンクを走行する車両より収集されたプローブデータからリンクを通過するのにかかる時間を示すリンク通過時間の時系列データを推定する交通データ推定部と、リンク通過時間の時系列データに欠損がある補間対象リンクと、リンク通過時間の時系列データに欠損のない複数の補間適用リンクとのリンク通過時間に関する相関係数を算出し、補間適用リンクのリンク通過時間と相関係数とに基づいて補間対象リンクの欠損時刻のリンク通過時間を補間する補間データを算出する交通データ補間部と、を備えた。 A traffic data estimator that estimates time series data of link passage time indicating the time taken to pass the link from probe data collected from a vehicle traveling on a link that is a road section, and time series data of link passage time The correlation coefficient related to the link transit time between the interpolation target link that has a deficiency in the data and multiple interpolation application links that have no deficiency in the time series data of the link transit time is calculated. And a traffic data interpolation unit for calculating interpolation data for interpolating the link passing time at the missing time of the interpolation target link.
 本発明によれば、エリア内においてデータが欠損しているリンクの割合に拘らず、精度よくデータを補間することができる。 According to the present invention, data can be accurately interpolated regardless of the proportion of links in which data is missing in the area.
実施の形態1に係る情報処理装置の構成を示すブロック図。2 is a block diagram illustrating a configuration of an information processing device according to Embodiment 1. FIG. 実施の形態1に係るプローブデータの一例を示す図。FIG. 5 shows an example of probe data according to the first embodiment. 実施の形態1に係る地図データDBの地図データの一例を示す図。The figure which shows an example of the map data of map data DB which concerns on Embodiment 1. FIG. 実施の形態1に係る情報処理装置の処理の流れを示すフローチャート。3 is a flowchart showing a processing flow of the information processing apparatus according to the first embodiment. 実施の形態1に係るリンク通過時間の時系列データの一例を示す図。FIG. 4 is a diagram showing an example of time-series data of link passage times according to the first embodiment. 実施の形態1に係るリンク通過時間の時系列データの一例を示す図。FIG. 4 is a diagram showing an example of time-series data of link passage times according to the first embodiment. 実施の形態1に係る交通データ推定部の処理の流れを示すフローチャート。4 is a flowchart showing a process flow of a traffic data estimation unit according to the first embodiment. 実施の形態1に係るリンク通過時間の時系列データにおいてデータが欠損し、1つ目の判定条件に該当するケースを示す図。The figure which shows the case where data are missing in the time series data of the link passage time according to the first embodiment and the first determination condition is satisfied. 実施の形態1に係るリンク通過時間の時系列データにおいてデータが欠損し、2つ目の判定条件に該当するケースを示す図。The figure which shows the case where data are missing in the time series data of the link passage time according to the first embodiment and the second determination condition is satisfied. 実施の形態1に係るリンク通過時間の時系列データにおいてデータが欠損しているケースを示す図。The figure which shows the case where data are missing in the time series data of the link passage time according to the first embodiment. 実施の形態1に係る統計データDBの統計データの一例を示す図。The figure which shows an example of the statistical data of statistical data DB which concerns on Embodiment 1. FIG. 実施の形態1に係る交通データ補間部の処理の流れを示すフローチャート。5 is a flowchart showing a process flow of a traffic data interpolation unit according to the first embodiment. 実施の形態2に係る交通データ推定部の処理の流れを示すフローチャート。9 is a flowchart showing a process flow of a traffic data estimation unit according to the second embodiment. 実施の形態2に係るリンク通過時間の時系列データを4つの時間帯に分割した例を示す図。The figure which shows the example which divided | segmented the time series data of the link passage time concerning Embodiment 2 into four time zones. 実施の形態2に係る交通データ補間部の処理の流れを示すフローチャート。9 is a flowchart showing a process flow of a traffic data interpolation unit according to the second embodiment. 実施の形態2に係る相関係数の値が2位までのリンクを示す図。The figure which shows the link to which the value of the correlation coefficient which concerns on Embodiment 2 is 2nd. 実施の形態2に係る相関係数の値が2位までの値を示す図。The figure which shows the value of the correlation coefficient which concerns on Embodiment 2 to the 2nd place. 実施の形態2に係る相関係数の値が2位までのリンク通過時間の時系列データのグラフを示す図。The figure which shows the graph of the time series data of the link passage time until the value of the correlation coefficient which concerns on Embodiment 2 is 2nd. 実施の形態2に係る4つの時間帯に分割されたリンク通過時間の時系列データを合わせる例を示す図。The figure which shows the example which matches the time series data of the link passage time divided | segmented into the four time zones which concern on Embodiment 2. FIG. 実施の形態3に係る情報処理装置の構成を示すブロック図。FIG. 4 is a block diagram illustrating a configuration of an information processing device according to a third embodiment.
 実施の形態1.
 図1は、実施の形態1に係る情報処理装置1の構成を示すブロック図である。情報処理装置1は、プローブデータ受信部10、プローブデータ処理部11、地図データ保存部としての地図データデータベース(以下、地図データDBと称す)12、交通データ推定部13、交通データ出力部14、統計データ保存部としての統計データデータベース(以下、統計データDBと称す)15、交通データ補間部16から構成される。
Embodiment 1 FIG.
FIG. 1 is a block diagram showing the configuration of the information processing apparatus 1 according to the first embodiment. The information processing apparatus 1 includes a probe data receiving unit 10, a probe data processing unit 11, a map data database (hereinafter referred to as map data DB) 12 as a map data storage unit, a traffic data estimation unit 13, a traffic data output unit 14, It comprises a statistical data database (hereinafter referred to as statistical data DB) 15 as a statistical data storage unit and a traffic data interpolation unit 16.
 プローブデータ受信部10には、車両の走行データとして、プローブデータが入力される。プローブデータは、複数のプローブカーから収集されたデータである。プローブデータには、車両の位置や走行速度、進行方向などの物理量データ、及び、走行道路の種別や路面状況などの推定データが含まれる。物理量データは、GPS(Global Positioning System)やジャイロセンサなどのセンサ機器によって測定された値である。推定データは、センサ機器によって測定された値から推定されたデータである。 Probe data is input to the probe data receiving unit 10 as vehicle travel data. The probe data is data collected from a plurality of probe cars. The probe data includes physical quantity data such as the position, travel speed, and traveling direction of the vehicle, and estimated data such as the type of road and the road surface condition. The physical quantity data is a value measured by a sensor device such as GPS (Global Positioning System) or a gyro sensor. The estimated data is data estimated from values measured by the sensor device.
 プローブデータ受信部10は、受信したプローブデータをプローブデータ処理部11に出力する。プローブデータ処理部11は、地図データDB12が保持する地図情報を参照し、各プローブデータがどのリンク上で取得されたデータなのか判定する。プローブデータ処理部11は、リンクごとにプローブデータを分類し、交通データ推定部13に出力する。地図データDB12は、リンクの位置を示す地図情報を保持している。 The probe data receiving unit 10 outputs the received probe data to the probe data processing unit 11. The probe data processing unit 11 refers to the map information held in the map data DB 12 and determines on which link each probe data is acquired. The probe data processing unit 11 classifies the probe data for each link and outputs it to the traffic data estimation unit 13. The map data DB 12 holds map information indicating the link position.
 交通データ推定部13は、分類されたプローブデータを集計し、リンクごとにリンク通過時間の時系列データを推定する。リンク通過時間の時系列データは、24時間の周期で周期的に変化する場合が多い。よって、本実施の形態において、交通データ推定部13は、1日分である24時間の時系列データを推定するが、1日分でなくてもよい。交通データ推定部13は、リンク通過時間の時系列データに欠損があるか判定し、欠損がない場合は交通データ出力部14に出力する。データに欠損があるとは、ある時刻におけるリンク通過時間の値が存在しないケースである。欠損がある場合、交通データ推定部13は、当該リンクを補間対象リンクとして交通データ補間部16に出力する。また、交通データ推定部13は、データの欠損の有無に拘らず、推定したリンク通過時間の時系列データを統計データDB15に出力する。 The traffic data estimation unit 13 aggregates the classified probe data and estimates the time series data of the link transit time for each link. In many cases, the time-series data of the link transit time changes periodically with a period of 24 hours. Therefore, in the present embodiment, the traffic data estimation unit 13 estimates time-series data for 24 hours, which is one day, but may not be one day. The traffic data estimation unit 13 determines whether or not there is a deficiency in the time series data of the link passage time, and if there is no deficiency, outputs to the traffic data output unit 14. Data missing is a case where there is no link transit time value at a certain time. When there is a defect, the traffic data estimation unit 13 outputs the link as an interpolation target link to the traffic data interpolation unit 16. Moreover, the traffic data estimation part 13 outputs the time series data of the estimated link passage time to the statistical data DB 15 regardless of the presence or absence of data loss.
 統計データDB15は、各リンクのリンク通過時間の時系列データを統計値で保持する。すでにデータを保持しているリンクについて新たなデータが入力された場合、統計データDB15は、統計値を更新する。例えば、統計データDB15は、すでに保持している値との平均値を求め、新たな統計値として保持する。統計値として保持することにより、データ量を低く抑えることができる。交通データ補間部16は、統計データDB15が保持している複数のリンクのリンク通過時間の時系列データを参照し、補間対象リンクのリンク通過時間の時系列データを補間する。交通データ補間部16は、補間したリンク通過時間の時系列データを交通データ出力部14に出力する。 Statistic data DB 15 holds time-series data of the link passage time of each link as a statistic value. When new data is input for a link that already holds data, the statistical data DB 15 updates the statistical value. For example, the statistical data DB 15 obtains an average value with the value already held and holds it as a new statistical value. By holding it as a statistical value, the amount of data can be kept low. The traffic data interpolation unit 16 refers to the time series data of the link passage times of a plurality of links held in the statistical data DB 15 and interpolates the time series data of the link passage times of the interpolation target links. The traffic data interpolation unit 16 outputs the interpolated link passage time series data to the traffic data output unit 14.
 交通データ出力部14は、リンク毎にリンク通過時間の時系列データを出力する。出力されたデータは、例えば、交通データ利用サービスで利用される。交通データ利用サービスは、カーナビに交通情報を配信するサービスである。カーナビは、配信された現在の時刻のリンク通過時間に基づいて、目的地に到着するまでにかかる時間を算出する。また、出力されたデータは、当該リンクを通過するときの平均速度や渋滞の度合いを示す渋滞度の算出に利用される。さらに、渋滞の有無の判断に利用されることもある。なお、交通データ出力部14は出力先に応じて、出力するデータの形式やタイミングを変えてもよい。 The traffic data output unit 14 outputs time-series data of the link passage time for each link. The output data is used, for example, in a traffic data use service. The traffic data utilization service is a service for distributing traffic information to car navigation systems. The car navigation system calculates the time required to arrive at the destination based on the link passing time at the current time. Further, the output data is used for calculating a traffic jam degree indicating an average speed and a traffic jam degree when passing through the link. Furthermore, it may be used to determine the presence or absence of traffic. The traffic data output unit 14 may change the format and timing of data to be output according to the output destination.
 図2は、実施の形態1に係るプローブデータ21の一例を示す図である。プローブデータ21は車両ID、経度、緯度、進行方向、道路種別、日時、及び、走行速度で構成される。車両IDは、各車両を識別する値である。経度及び緯度は、車両の位置を示す。進行方向は、車両が進む方向を示す値である。道路種別は、高速道路や一般国道等の道路の種別を示す値である。日時は、データを取得した日時を示す。走行速度は、車両の速度を示す値である。経度、緯度、進行方向、及び道路種別は地図情報である。また、日時及び走行速度は走行情報である。 FIG. 2 is a diagram illustrating an example of the probe data 21 according to the first embodiment. The probe data 21 includes a vehicle ID, longitude, latitude, traveling direction, road type, date and time, and travel speed. The vehicle ID is a value for identifying each vehicle. The longitude and latitude indicate the position of the vehicle. The traveling direction is a value indicating the direction in which the vehicle travels. The road type is a value indicating the type of road such as an expressway or a general national road. The date / time indicates the date / time when the data was acquired. The traveling speed is a value indicating the speed of the vehicle. The longitude, latitude, traveling direction, and road type are map information. The date / time and the traveling speed are traveling information.
 プローブデータ21a~eは、プローブデータ21として保存されているデータの具体例である。例えば、プローブデータ21aは、車両IDが0001の車両が経度35.000、緯度139.000の位置で10°の方向に高速道路を進んでおり、日時は2013年9月1日9時で、走行速度は90km/時であることを示している。 Probe data 21 a to e are specific examples of data stored as probe data 21. For example, in the probe data 21a, a vehicle having a vehicle ID of 0001 is traveling on a highway in a direction of 10 ° at a position of longitude 35.000 and latitude 139.000, and the date and time is 9 o'clock on September 1, 2013. The traveling speed is 90 km / hour.
 プローブデータ21は、一例である。プローブデータは、少なくとも車両が走行しているリンクを特定する地図情報と、当該車両がリンクの通過にかかる時間を推定できるような走行情報を含んでいればよい。なお、プローブデータ21の地図情報の項目は、地図データDB12の項目を含むようにすると車両の走行しているリンクを容易に特定することができる。例えば、地図データDB12が緯度及び経度を項目として設けている場合、プローブデータ21の地図情報として緯度及び経度を含むようにすると車両の走行しているリンクを容易に特定することができる。 Probe data 21 is an example. The probe data only needs to include at least map information that identifies the link on which the vehicle is traveling and traveling information that can estimate the time required for the vehicle to pass through the link. In addition, if the item of the map information of the probe data 21 includes the item of the map data DB 12, the link on which the vehicle is traveling can be easily specified. For example, when the map data DB 12 is provided with latitude and longitude as items, if the latitude and longitude are included as the map information of the probe data 21, the link on which the vehicle is traveling can be easily specified.
 地図データDB12は、リンクの地図データを保存するデータベースである。リンクの地図データは、リンクの位置を示すデータである。地図データは、少なくとも、リンクを識別するリンク番号、及び、リンクの位置を示す緯度並びに経度を含む。地図データは、制限速度や進行方向といった交通制約情報、高速道や一般国道、都道府県道などを区別する道路種別などを含むようにしてもよい。地図データに交通制約情報や道路種別が付加されることにより、リンクとプローブデータ21a~nとの対応付けの精度が上がる。 The map data DB 12 is a database that stores link map data. The link map data is data indicating the position of the link. The map data includes at least a link number that identifies the link, and a latitude and longitude that indicate the position of the link. The map data may include traffic restriction information such as a speed limit and a traveling direction, a road type that distinguishes an expressway, a general national road, a prefectural road, and the like. By adding the traffic restriction information and the road type to the map data, the accuracy of associating the links with the probe data 21a-n is improved.
 図3は、実施の形態1に係る地図データDB12の地図データ31の一例を示す図である。地図データ31は、順方向リンク番号、逆方向リンク番号、道路番号、経度、緯度、及び道路種別で構成される。順方向リンク番号は、リンクの上り車線を示す値である。逆方向リンク番号は、リンクの下り車線を示す値である。道路番号は、道路を識別する値である。経度は、リンクの経度を示す値である。緯度は、リンクの緯度を示す値である。道路種別は、高速道路や一般国道等の道路の種別を示す値である。 FIG. 3 is a diagram illustrating an example of the map data 31 of the map data DB 12 according to the first embodiment. The map data 31 includes a forward link number, a reverse link number, a road number, longitude, latitude, and a road type. The forward link number is a value indicating the uplink lane of the link. The reverse link number is a value indicating the downlink lane of the link. The road number is a value for identifying the road. The longitude is a value indicating the longitude of the link. The latitude is a value indicating the latitude of the link. The road type is a value indicating the type of road such as an expressway or a general national road.
 地図データ31a~fは、地図データ31として保存されているデータの具体例である。例えば、地図データ31aは、順方向リンク番号が100、逆方向リンク番号が103、道路番号が10、経度が35.000、緯度が139.200、道路種別が一般国道であることを示している。
 地図データ31a~cは、道路番号10が同じであり、同一の道路に関するデータである。同一の道路に関するデータではあるが、データを収集された位置が異なるため、経度及び緯度は異なる値が保存されている。
The map data 31 a to f are specific examples of data stored as the map data 31. For example, the map data 31a indicates that the forward link number is 100, the reverse link number is 103, the road number is 10, the longitude is 35.000, the latitude is 139.200, and the road type is a general national road. .
The map data 31a to 31c are data relating to the same road having the same road number 10. Although it is the data regarding the same road, since the position where data was collected is different, different values for longitude and latitude are stored.
 次に情報処理装置1の動作について説明する。
 図4は、実施の形態1に係る情報処理装置1の処理の流れを示すフローチャートである。情報処理装置1は、プローブデータを受信すると、ステップS41より処理を開始する。
Next, the operation of the information processing apparatus 1 will be described.
FIG. 4 is a flowchart showing a process flow of the information processing apparatus 1 according to the first embodiment. When receiving the probe data, the information processing apparatus 1 starts processing from step S41.
 ステップS41において、プローブデータ受信部10は、プローブデータ21を受信する。プローブデータ21がプローブデータ受信部10に入力されるタイミングは、特に限定しない。プローブデータ21は、定期的に入力されてもよいし、不定期に入力されてもよい。また、プローブデータ21の測定間隔は、細かいほうがより高い精度でリンク通過時間を推定することができる。測定間隔が細かいとデータ量が多くなり、リンク通過時間の推定値の揺らぎも軽減できる。測定間隔は任意であるが、数秒間隔とすることが望ましい。プローブデータ受信部10は、プローブデータ21をプローブデータ処理部11に出力する。処理はステップS42へ進む。 In step S41, the probe data receiving unit 10 receives the probe data 21. The timing at which the probe data 21 is input to the probe data receiving unit 10 is not particularly limited. The probe data 21 may be input regularly or irregularly. Further, the smaller the measurement interval of the probe data 21 is, the higher the accuracy of the link passing time can be estimated. If the measurement interval is small, the amount of data increases, and fluctuations in the estimated value of the link transit time can be reduced. The measurement interval is arbitrary, but it is desirable to set it at several seconds. The probe data receiving unit 10 outputs the probe data 21 to the probe data processing unit 11. The process proceeds to step S42.
 ステップS42において、プローブデータ処理部11は、入力されたプローブデータ21a~nについてそれぞれリンク毎に分類する。リンクと各プローブデータ21a~nとの対応付けをマップマッチングと呼ぶ。プローブデータ処理部11は、地図データDB12と各プローブデータ21a~nの地図情報に基づいて、各プローブデータ21a~nがどのリンクを走行しているものか判定し、分類する。また、プローブデータ処理部11は、各リンクの長さを算出する。各リンクの長さは、道のりである。プローブデータ処理部11は、リンク毎に分類されたプローブデータ21a~nと各リンクの長さを交通データ推定部13に出力する。処理はステップS43へ進む。 In step S42, the probe data processing unit 11 classifies the input probe data 21a to 21n for each link. The association between the link and each probe data 21a-n is called map matching. The probe data processing unit 11 determines and classifies which link each probe data 21a to 21n is running on the basis of the map data DB 12 and the map information of each probe data 21a to 21n. Further, the probe data processing unit 11 calculates the length of each link. The length of each link is a road. The probe data processing unit 11 outputs the probe data 21a to 21n classified for each link and the length of each link to the traffic data estimation unit 13. The process proceeds to step S43.
 ステップS43において、交通データ推定部13は、リンク毎に分類されたプローブデータを集計し、リンク毎にリンク通過時間の時系列データを推定する。リンク通過時間は、リンクの通過にかかる時間である。リンク通過時間の時系列データは、リンク通過時間について、1日の時系列変化を表したものである。処理の詳細は後述する。処理はステップS44へ進む。 In step S43, the traffic data estimation unit 13 aggregates the probe data classified for each link, and estimates the time series data of the link passage time for each link. The link passing time is the time taken for the link to pass. The time series data of the link passage time represents the daily time series change with respect to the link passage time. Details of the processing will be described later. The process proceeds to step S44.
 ステップS44において、交通データ推定部13は、リンク毎にリンク通過時間の時系列データについて補間が必要かどうか判定する。
 図5は、実施の形態1に係るリンク通過時間の時系列データの一例を示す図である。横軸が時間である。縦軸がリンク通過時間である。データに欠損がない例である。データに欠損がないため、等間隔にデータが存在する。
 交通データ推定部13は、データが欠損していない場合、補間が不要と判定する。処理は図4のステップS46へ進む。
In step S44, the traffic data estimation unit 13 determines whether or not interpolation is required for the time series data of the link passage time for each link.
FIG. 5 is a diagram illustrating an example of time-series data of the link passage time according to the first embodiment. The horizontal axis is time. The vertical axis is the link passing time. This is an example in which there is no missing data. Since there is no deficiency in the data, the data exists at equal intervals.
The traffic data estimation unit 13 determines that interpolation is not necessary when data is not missing. The process proceeds to step S46 in FIG.
 図6は、実施の形態1に係るリンク通過時間の時系列データの一例を示す図である。横軸が時間である。縦軸がリンク通過時間である。データに欠損がある例である。データに欠損があるため、等間隔にデータが存在しない箇所がある。
 交通データ推定部13は、データが欠損している場合、補間が必要と判定し、当該リンクを補間対象リンクとする。処理は図4のステップS45へ進む。
FIG. 6 is a diagram illustrating an example of time-series data of link passage times according to the first embodiment. The horizontal axis is time. The vertical axis is the link passing time. This is an example of missing data. Since there is a deficiency in data, there are places where data does not exist at regular intervals.
If the data is missing, the traffic data estimation unit 13 determines that interpolation is necessary, and sets the link as an interpolation target link. The process proceeds to step S45 in FIG.
 図4のステップS45において、交通データ補間部16は、補間対象リンクに対してリンク通過時間の時系列データの補間を行う。処理の詳細は後述する。処理はステップS46へ進む。 4, the traffic data interpolation unit 16 interpolates the time series data of the link passage time with respect to the interpolation target link. Details of the processing will be described later. The process proceeds to step S46.
 ステップS46において、交通データ出力部14は、リンク毎にリンク通過時間の時系列データを出力する。処理は終了する。 In step S46, the traffic data output unit 14 outputs time series data of the link passage time for each link. The process ends.
 次に、交通データ推定部13の動作について説明する。
 図7は、実施の形態1に係る交通データ推定部13の処理の流れを示すフローチャートである。図4のステップS43の詳細である。交通データ推定部13は、リンク毎に分類されたプローブデータ21a~nと各リンクの長さをプローブデータ処理部11から入力されるとステップS71より処理を開始する。
Next, the operation of the traffic data estimation unit 13 will be described.
FIG. 7 is a flowchart showing a process flow of the traffic data estimation unit 13 according to the first embodiment. It is the detail of step S43 of FIG. The traffic data estimation unit 13 starts processing from step S71 when the probe data 21a to n classified for each link and the length of each link are input from the probe data processing unit 11.
 ステップS71において、交通データ推定部13は、リンク毎に分類されたプローブデータ21a~nを集計し、リンク通過時間の時系列データを推定する。交通データ推定部13は、プローブデータ21a~nの日時及び走行速度をもとに、各リンクにおける時刻ごとの平均通過速度を算出する。交通データ推定部13は、各リンクの長さから時刻ごとの平均通過時間を算出することにより、リンク通過時間の時系列データを推定する。このとき、サンプリング間隔は、5分程度の細かさにすると、リンクの渋滞の状況の変化を確認することができる。なお、交通データ推定部13は、リンク通過時間の時系列データを、平日や休日、曜日などによって別々に推定してもよい。 In step S71, the traffic data estimation unit 13 aggregates the probe data 21a to 21n classified for each link and estimates time series data of the link passage time. The traffic data estimation unit 13 calculates an average passing speed at each time for each link based on the date and traveling speed of the probe data 21a to 21n. The traffic data estimation unit 13 estimates the time series data of the link passage time by calculating the average passage time for each time from the length of each link. At this time, if the sampling interval is set to be as small as about 5 minutes, it is possible to confirm the change in the traffic congestion state of the link. The traffic data estimation unit 13 may estimate the time series data of the link transit time separately according to weekdays, holidays, days of the week, and the like.
 また、リンク通過時間の時系列データを推定すると、ノイズのような揺らぎが発生することがある。これは、一般的な走行車両の特性として、同時刻、同リンクを走行した車両であっても、走行車両ごとに実際の走行速度は異なるため、データにばらつきが発生することが原因である。この揺らぎを解消するため、交通データ推定部13は、リンク通過時間の時系列データを平滑化してもよい。交通データ推定部13は、例えば、サンプリングした各時刻について前後30分間のリンク通過時間のデータを平均化することにより、平滑化する。ただし、平均化の時間幅が大きすぎると、渋滞などリンクの特徴が薄れてしまう。よって、推定精度や処理コストから適切な時間間隔を設定して平均化を行う必要がある。
 処理はステップS72へ進む。
In addition, fluctuations such as noise may occur when the time series data of the link transit time is estimated. This is because, as a general characteristic of a traveling vehicle, even if the vehicle travels on the same link at the same time, the actual traveling speed differs from one traveling vehicle to another, and thus data varies. In order to eliminate this fluctuation, the traffic data estimation unit 13 may smooth the time series data of the link passage time. For example, the traffic data estimation unit 13 smoothes the data by averaging the link passage time data for 30 minutes before and after each sampled time. However, if the averaging time width is too large, link characteristics such as traffic congestion will be lost. Therefore, it is necessary to perform averaging by setting an appropriate time interval from the estimation accuracy and processing cost.
The process proceeds to step S72.
 ステップS72において、交通データ推定部13は、リンク通過時間の時系列データについて、データの欠損の有無を判定する。データの欠損がある場合、交通データ推定部13は、データの欠損の割合を判定する。データが欠損している時間を欠損時間、データの欠損している割合を欠損度と呼ぶ。欠損度の高さを判定する条件を2つ例示する。 In step S72, the traffic data estimation unit 13 determines the presence or absence of data loss in the time series data of the link passage time. When there is a data loss, the traffic data estimation unit 13 determines a data loss rate. The time at which data is missing is called the missing time, and the rate at which the data is missing is called the degree of deficiency. Two conditions for determining the height of the deficiency are illustrated.
 まず、第1の判定条件を説明する。交通データ推定部13は、ある時間幅において、データが欠損している時間の合計が閾値以上の場合、欠損度が高いと判定する。 First, the first determination condition will be described. The traffic data estimation unit 13 determines that the deficiency is high when the total time during which data is missing is greater than or equal to a threshold value in a certain time width.
 図8は、実施の形態1に係るリンク通過時間の時系列データにおいてデータが欠損し、1つ目の判定条件に該当するケースを示す図である。図8は、リンク通過時間のサンプリング間隔を5分、欠損判定の時間幅を30分、閾値を20分とした例である。サンプリング間隔が5分のため、時間幅30分にはデータが6点存在するはずである。しかし、図8の点線の枠で示した30分の時間幅には、データは2点のみであり、合計20分のデータが欠損している。閾値が20分のため、交通データ推定部13は、当該時間幅においてデータの欠損度が高いと判定する。 FIG. 8 is a diagram illustrating a case where data is missing in the time series data of the link passage time according to the first embodiment and the first determination condition is satisfied. FIG. 8 shows an example in which the sampling interval of the link passage time is 5 minutes, the time width for loss determination is 30 minutes, and the threshold is 20 minutes. Since the sampling interval is 5 minutes, 6 points of data should exist in a time width of 30 minutes. However, in the time width of 30 minutes indicated by the dotted frame in FIG. 8, there are only two points of data, and a total of 20 minutes of data is missing. Since the threshold value is 20 minutes, the traffic data estimation unit 13 determines that the degree of data loss is high in the time span.
 なお、欠損度の判定の時間幅はリンク通過時間の時系列データ全体としてもよい。
 さらに、交通データ推定部13は、リンク通過時間の時系列データ全体について、少しずつ時間幅をずらしてデータの欠損度を判定し、欠損度が高いと判定した回数が閾値以上の場合に、リンク通過時間の時系列データ全体の欠損度が高いと判定してもよい。
Note that the time span for determining the deficiency may be the entire time-series data of the link passage time.
Further, the traffic data estimation unit 13 shifts the time width little by little for the entire time series data of the link passage time, and determines the data loss degree. When the number of times that the loss degree is determined to be high is equal to or greater than the threshold, the link It may be determined that the degree of deficiency of the entire time series data of the passage time is high.
 次に、第2の判定条件を説明する。交通データ推定部13は、連続してデータが欠損している時間の合計が閾値以上の場合、欠損度が高いと判定する。 Next, the second determination condition will be described. The traffic data estimation unit 13 determines that the deficiency is high when the total time for which data is continuously missing is equal to or greater than a threshold.
 図9は、実施の形態1に係るリンク通過時間の時系列データにおいてデータが欠損し、2つ目の判定条件に該当するケースを示す図である。図9は、例えば、リンク通過時間のサンプリング間隔を5分、連続する欠損時間の閾値を15分とした場合である。サンプリング間隔が5分のため、データが3点以上連続して欠損した場合にデータの欠損度が高いと判定する。図9の矢印で示した15分において、データが欠損している。交通データ推定部13は、当該時系列データの欠損度が高いと判定する。 FIG. 9 is a diagram illustrating a case where data is missing in the time series data of the link passage time according to the first embodiment and the second determination condition is satisfied. FIG. 9 shows a case where, for example, the sampling interval of the link passage time is 5 minutes and the threshold of the continuous missing time is 15 minutes. Since the sampling interval is 5 minutes, it is determined that the degree of data loss is high when three or more points of data are continuously lost. At 15 minutes indicated by the arrow in FIG. 9, data is missing. The traffic data estimation unit 13 determines that the time series data has a high degree of deficiency.
 本実施の形態において、交通データ推定部13は、2つの判定条件のうちどちらかの条件に該当する場合、データの欠損度が高いと判定するが、他の方法で判定してもよい。 In the present embodiment, the traffic data estimation unit 13 determines that the degree of data loss is high when one of the two determination conditions is satisfied, but may determine the data by other methods.
 図10は、実施の形態1に係るリンク通過時間の時系列データにおいてデータが欠損していないケースを示す図である。図10は、10分のデータが2回欠損しているが、第1の判定条件にも第2の判定条件にも該当しない。したがって、交通データ推定部13は、データの欠損度は低いと判定する。 FIG. 10 is a diagram showing a case where data is not lost in the time series data of the link passage time according to the first embodiment. In FIG. 10, although 10 minutes of data is missing twice, neither the first determination condition nor the second determination condition is satisfied. Therefore, the traffic data estimation unit 13 determines that the data deficiency is low.
 交通データ推定部13は、データの欠損度が低い場合、当該リンクを補間対象リンクとする。データの欠損度が高い場合の補間については、実施の形態2に示す。図7の処理はステップS73へ進む。 The traffic data estimation unit 13 sets the link as an interpolation target link when the degree of data loss is low. The interpolation when the data deficiency is high is described in the second embodiment. The process of FIG. 7 proceeds to step S73.
 図7のステップS73において、交通データ推定部13は、推定したリンク通過時間の時系列データを統計データDB15に出力する。処理はステップS74へ進む。 7, the traffic data estimation unit 13 outputs time-series data of the estimated link passage time to the statistical data DB 15. The process proceeds to step S74.
 ステップS74において、交通データ推定部13は、補間対象リンクのリンク通過時間の時系列データを交通データ補間部16に出力する。交通データ推定部13は、補間対象でないリンクのリンク通過時間の時系列データを交通データ出力部14に出力する。処理を終了する。 In step S74, the traffic data estimation unit 13 outputs the time series data of the link passage time of the interpolation target link to the traffic data interpolation unit 16. The traffic data estimation unit 13 outputs the time series data of the link passage times of links that are not interpolation targets to the traffic data output unit 14. The process ends.
 図11は、実施の形態1に係る統計データDB15の統計データの一例を示す図である。統計データDB15は、交通データ推定部13から入力されるリンク通過時間の時系列データを保持する。図11の各グラフ111a~nは、横軸を時間、縦軸をリンク通過時間とする。 FIG. 11 is a diagram illustrating an example of statistical data of the statistical data DB 15 according to the first embodiment. The statistical data DB 15 holds time-series data of link transit times input from the traffic data estimation unit 13. In each graph 111a-n in FIG. 11, the horizontal axis represents time, and the vertical axis represents link passage time.
 次に、交通データ補間部16の動作について説明する。
 図12は、実施の形態1に係る交通データ補間部16の処理の流れを示すフローチャートである。交通データ補間部16は、交通データ推定部13において補間対象リンクと判定されたリンクのリンク通過時間の時系列データを補間する。交通データ補間部16は、補間対象リンクのリンク通過時間の時系列データが入力されると、ステップS121より処理を開始する。
Next, the operation of the traffic data interpolation unit 16 will be described.
FIG. 12 is a flowchart showing a processing flow of the traffic data interpolation unit 16 according to the first embodiment. The traffic data interpolation unit 16 interpolates the time series data of the link transit time of the link determined as the interpolation target link by the traffic data estimation unit 13. The traffic data interpolation unit 16 starts processing from step S121 when time series data of the link passage time of the interpolation target link is input.
 ステップS121において、交通データ補間部16は、統計データDB15を参照し、データが欠損していないリンクのリンク通過時間の時系列データを抽出する。抽出したリンクを参照リンクと呼ぶ。交通データ補間部16は、参照リンクと補間対象リンクの位置関係を考慮することなく、参照リンクを抽出する。エリアは任意に決定してよい。例えば、地図上でメッシュ状に分割してもよい。エリアの大きさは、データが欠損していないリンクの数に応じて変えてもよい。 In step S121, the traffic data interpolation unit 16 refers to the statistical data DB 15 and extracts time-series data of the link transit times of links for which no data is missing. The extracted link is called a reference link. The traffic data interpolation unit 16 extracts the reference link without considering the positional relationship between the reference link and the interpolation target link. The area may be arbitrarily determined. For example, you may divide | segment into a mesh shape on a map. The size of the area may be changed according to the number of links in which data is not missing.
 例えば、駅前や幹線道路付近など、交通量が多くプローブデータが集まりやすい地域はエリアを小さくし、一方、地方の農村部や山間部など、交通量が少ない地域はエリアを大きくしてもよい。エリアの大きさを変えることにより、交通データ補間部16は一定数の参照リンクを確保することができる。交通データ補間部16は、統計データDB15に保存されているリンクのうちデータ欠損のないリンクすべてを参照リンクとしてもよいが、処理コストは大きくなる。したがって、交通データ補間部16は、補間対象リンクの属するエリアから参照リンクを抽出するとよい。処理はステップS122へ進む。 For example, areas where there is a lot of traffic and where probe data is likely to gather, such as in front of a station or near a main road, may be reduced, while areas such as rural areas and mountainous areas where traffic is low may be enlarged. By changing the size of the area, the traffic data interpolation unit 16 can secure a certain number of reference links. The traffic data interpolation unit 16 may use all links without data loss among the links stored in the statistical data DB 15 as reference links, but the processing cost increases. Therefore, the traffic data interpolation unit 16 may extract the reference link from the area to which the interpolation target link belongs. The process proceeds to step S122.
 ステップS122において、交通データ補間部16は、補間対象リンクのリンク通過時間の時系列データと、参照リンクのリンク通過時間の時系列データの相関係数を算出する。データの欠損度が低い場合は、データを間引いて相関係数を算出するか、例えば、交通データ補間部16は、欠損しているデータの前後の時刻のデータの中間値を欠損しているデータとして、相関係数を算出する。複数の参照リンクそれぞれに対して相関係数を算出する。また、交通データ補間部16は、相関係数の高い順に参照リンクを順位付けし、R位までのデータを抽出する。処理はステップS123へ進む。 In step S122, the traffic data interpolation unit 16 calculates the correlation coefficient between the time series data of the link passage time of the interpolation target link and the time series data of the link passage time of the reference link. If the data deficiency is low, the correlation coefficient is calculated by thinning out the data, or for example, the traffic data interpolation unit 16 is deficient in the intermediate value of the data at the time before and after the deficient data. The correlation coefficient is calculated as follows. A correlation coefficient is calculated for each of the plurality of reference links. Further, the traffic data interpolation unit 16 ranks the reference links in descending order of the correlation coefficient, and extracts data up to the R rank. The process proceeds to step S123.
 ステップS123において、交通データ補間部16は、R位までの参照リンクのリンク通過時間の時系列データを規格化する。各リンクは長さが異なるため、同じ速度で各リンクを通過するとリンク通過時間が異なる。そこで、例えば、リンク通過時間の時系列データについて、リンクの長さを規制速度で除算した値で規格化する。交通データ補間部16は、規格化したリンク通過時間の時系列データに補間対象リンクの長さを乗算することにより、補間対象リンクのリンク通過時間の長さに一致させることができる。処理はステップS124へ進む。 In step S123, the traffic data interpolation unit 16 standardizes the time series data of the link passage times of the reference links up to the R rank. Since each link has a different length, the link transit time differs when passing through each link at the same speed. Therefore, for example, the time series data of the link passage time is standardized by a value obtained by dividing the link length by the regulation speed. The traffic data interpolation unit 16 can match the length of the link passage time of the interpolation target link by multiplying the normalized time series data of the link passage time by the length of the interpolation target link. The process proceeds to step S124.
 ステップS124において、交通データ補間部16は、相関係数の値がR位までの参照リンクを補間適用リンクとする。交通データ補間部16は、複数の補間適用リンクのリンク通過時間の時系列データに重みを付けて加算することにより、補間データを算出する。交通データ補間部16は、数式1により補間データL0(T)を算出する。L(T,r)は、規格化されたリンク通過時間の時系列データを示す。x(T,r)は、相関係数を示す。 In step S124, the traffic data interpolation unit 16 sets the reference link having the correlation coefficient value up to the R rank as the interpolation application link. The traffic data interpolation unit 16 calculates the interpolation data by adding the weighted time series data of the link transit times of the plurality of interpolation application links. The traffic data interpolation unit 16 calculates the interpolation data L0 (T) using Equation 1. L (T, r) indicates time-series data of the standardized link transit time. x (T, r) represents a correlation coefficient.
Figure JPOXMLDOC01-appb-M000001
Figure JPOXMLDOC01-appb-M000001
 交通データ補間部16は、欠損している時刻の値として補間データを代入する。また、交通データ補間部16は、連続性を維持するため、任意の時間幅でデータの平滑化を行う。処理はステップS125へ進む。 The traffic data interpolation unit 16 substitutes the interpolation data as the missing time value. In addition, the traffic data interpolation unit 16 smoothes data in an arbitrary time width in order to maintain continuity. The process proceeds to step S125.
 ステップS125において、交通データ補間部16は、他にも補間対象リンクがあれば、ステップS121へ戻る。交通データ補間部16は、他に補間対象リンクがなければ、処理を終了する。 In step S125, the traffic data interpolation unit 16 returns to step S121 if there are other interpolation target links. If there is no other interpolation target link, the traffic data interpolation unit 16 ends the process.
 なお、本実施の形態において、統計データDB15は、各リンクのリンク通過時間の時系列データについて統計値を保存するようにしたが、期間を区切ってデータ又は統計値を保持するようにしてもよい。例えば、過去数時間のデータを用いることにより、事故や渋滞等の現在の状況にあわせたリンク通過時間を推定することができる。また、花火大会やコンサート等のイベントが開催された場合のリンク通過時間を過去の同様のイベントが実施されたときのデータを用いることにより、より精度の高いリンク通過時間を推定することができる。 In the present embodiment, the statistical data DB 15 stores the statistical values for the time series data of the link transit time of each link. However, the statistical data DB 15 may hold the data or the statistical values by dividing the period. . For example, by using data of the past several hours, it is possible to estimate the link transit time according to the current situation such as an accident or traffic jam. Further, by using data when a similar event in the past is used as the link passage time when an event such as a fireworks display or a concert is held, it is possible to estimate the link passage time with higher accuracy.
 したがって、本実施の形態では、道路の区間であるリンクを走行する車両より収集されたプローブデータからリンクを通過するのにかかる時間を示すリンク通過時間の時系列データを推定する交通データ推定部と、リンク通過時間の時系列データに欠損がある補間対象リンクと、リンク通過時間の時系列データに欠損のない複数の補間適用リンクとのリンク通過時間に関する相関係数を算出し、補間適用リンクのリンク通過時間と相関係数とに基づいて補間対象リンクの欠損時刻のリンク通過時間を補間する補間データを算出する交通データ補間部と、を備えているので、エリア内においてデータが欠損しているリンクの割合に拘らず、データの補間において精度を高めることができる。 Therefore, in the present embodiment, a traffic data estimation unit that estimates time series data of a link passing time indicating a time taken to pass the link from probe data collected from a vehicle traveling on a link that is a road section; , Calculate the correlation coefficient for the link transit time between the link to be interpolated that has a deficiency in the time series data of the link transit time and a plurality of interpolation application links that have no deficiency in the time series data of the link transit time. A traffic data interpolating unit that calculates interpolation data for interpolating the link passing time of the missing time of the interpolation target link based on the link passing time and the correlation coefficient, so that data is missing in the area Regardless of the link ratio, the accuracy of data interpolation can be increased.
 また、相関係数が上位N個(Nは1以上の整数)のリンクを補間適用リンクとすることにより、より相関の高いリンクのリンク通過時間の時系列データから補間データを算出しているので、データの補間において精度を高めることができる。 Also, interpolation data is calculated from time-series data of link passage times of links with higher correlation by making the top N correlation coefficients (N is an integer equal to or greater than 1) as an interpolation application link. The accuracy in data interpolation can be increased.
 また、複数の補間適用リンクから補間データを算出することにより、補間適用リンクのリンク通過時間の時系列データに固有の特徴が補間データに反映されにくくなる。 In addition, by calculating the interpolation data from a plurality of interpolation application links, it becomes difficult to reflect the characteristic unique to the time series data of the link transit time of the interpolation application link in the interpolation data.
 また、交通データ推定部は、複数のリンクを含む地図を複数の領域に分割し、補間対象リンクと同じ領域に含まれるリンクから補間適用リンクを決定しているので、相関係数の算出にかかる処理コストを抑制することができる。 In addition, the traffic data estimation unit divides a map including a plurality of links into a plurality of regions, and determines an interpolation application link from links included in the same region as the interpolation target link. Processing costs can be reduced.
 また、交通データ推定部は、領域において収集されるプローブデータの量に応じて、領域の大きさを決定しているので、一定量のプローブデータを確保することができる。よって、データの補間において精度を高めることができる。 In addition, since the traffic data estimation unit determines the size of the area according to the amount of probe data collected in the area, a certain amount of probe data can be secured. Therefore, it is possible to improve accuracy in data interpolation.
実施の形態2.
 以上の実施の形態1では、リンク通過時間の時系列データについて、データが欠損している場合に相関の高い他のリンクのデータを用いて補間するようにしたものであるが、本実施の形態においては、リンク通過時間の時系列データを複数の時間帯に分割し、データの欠損の割合が高い場合には他の時間帯において相関の高いリンクのデータを用いて補間する実施の形態を示す。
 なお、本実施の形態においては、図1のように実施の形態1に記載の構成を全て備えた上で、更に付加的な構成について説明する。
 情報処理装置1の構成は実施の形態1と同じであるため、説明を割愛する。
Embodiment 2. FIG.
In the first embodiment described above, the time series data of the link transit time is interpolated using data of another link having a high correlation when the data is missing. Shows an embodiment in which time-series data of link transit times is divided into a plurality of time zones, and interpolation is performed using link data having a high correlation in other time zones when the rate of data loss is high. .
In the present embodiment, all the configurations described in the first embodiment as shown in FIG. 1 are provided, and further additional configurations will be described.
Since the configuration of the information processing apparatus 1 is the same as that of the first embodiment, the description thereof is omitted.
 交通データ推定部13の動作について説明する。
 図13は、実施の形態2に係る交通データ推定部13の処理の流れを示すフローチャートである。交通データ推定部13は、リンク毎に分類されたプローブデータ21a~nと各リンクの長さをプローブデータ処理部11から入力されるとステップS131より処理を開始する。
The operation of the traffic data estimation unit 13 will be described.
FIG. 13 is a flowchart showing a process flow of the traffic data estimation unit 13 according to the second embodiment. When the probe data 21a-n classified for each link and the length of each link are input from the probe data processing unit 11, the traffic data estimation unit 13 starts processing from step S131.
 ステップS131は、図7のステップS71と同じため、説明を省略する。処理はステップS132へ進む。 Step S131 is the same as step S71 in FIG. The process proceeds to step S132.
 ステップS132において、交通データ推定部13は、リンク通過時間の時系列データを複数の時間帯に分割する。分割数は特に限定しない。処理はステップS133へ進む。 In step S132, the traffic data estimation unit 13 divides the time series data of the link passage time into a plurality of time zones. The number of divisions is not particularly limited. The process proceeds to step S133.
 ステップS133において、交通データ推定部13は、複数の時間帯それぞれにおいてデータの欠損度を判定する。データの欠損度の判定については、図7のステップS72に記載した方法と同じため、説明を省略する。
 本実施の形態においては、データの欠損度が高い場合についても補間の対象とする。詳細は後述する。処理はステップS134へ進む。
In step S133, the traffic data estimation unit 13 determines the data loss degree in each of a plurality of time zones. The determination of the degree of data loss is the same as the method described in step S72 in FIG.
In the present embodiment, even when the degree of data loss is high, the interpolation is performed. Details will be described later. The process proceeds to step S134.
 ステップS134~S135の処理は、複数の時間帯それぞれの時系列データについて、図7のステップS73~S74と同じ処理を行う。説明は省略する。処理は終了する。 The processes in steps S134 to S135 are the same as those in steps S73 to S74 in FIG. 7 for the time series data in each of a plurality of time zones. Description is omitted. The process ends.
 図14は、実施の形態2に係るリンク通過時間の時系列データを4つの時間帯に分割した例を示す図である。141aは補間対象リンクの1日分のリンク通過時間の時系列データである。141bは1番目の時間帯T1のリンク通過時間の時系列データである。データの欠損はなく、補間対象リンクではない。141cは2番目の時間帯T2のリンク通過時間の時系列データである。データの欠損度が高いため、参照リンクとの相関を計算することができない。141dは3番目の時間帯T3のリンク通過時間の時系列データである。データの欠損はなく、補間対象リンクではない。141eは4番目の時間帯T4のリンク通過時間の時系列データである。データの欠損度は低いため、参照リンクとの相関を計算することにより補間データを算出することができる。 FIG. 14 is a diagram illustrating an example in which the time-series data of the link passage time according to the second embodiment is divided into four time zones. 141a is time series data of the link passage time for one day of the interpolation target link. 141b is time-series data of the link transit time in the first time zone T1. There is no missing data and it is not an interpolation target link. 141c is time-series data of the link transit time in the second time zone T2. Since the degree of data loss is high, the correlation with the reference link cannot be calculated. 141d is time-series data of the link transit time in the third time zone T3. There is no missing data and it is not an interpolation target link. 141e is time-series data of the link transit time in the fourth time zone T4. Since the data deficiency is low, the interpolation data can be calculated by calculating the correlation with the reference link.
 なお、どの時間帯も欠損度が高く、全ての時間帯において参照リンクとの相関計算が行えない場合は、本実施の形態の対象としない。 It should be noted that, if the degree of deficiency is high in any time zone and the correlation calculation with the reference link cannot be performed in all time zones, it is not a target of this embodiment.
 次に、交通データ補間部16の動作について説明する。図14に示したケースを例として説明する。 Next, the operation of the traffic data interpolation unit 16 will be described. The case shown in FIG. 14 will be described as an example.
 図15は、実施の形態2に係る交通データ補間部16の処理の流れを示すフローチャートである。交通データ補間部16は、交通データ推定部13において補間対象リンクと判定されたリンクのリンク通過時間の時系列データを補間する。交通データ補間部16は、補間対象リンクを含む各時間帯のリンク通過時間の時系列データが入力されると、ステップS151より処理を開始する。 FIG. 15 is a flowchart showing a processing flow of the traffic data interpolation unit 16 according to the second embodiment. The traffic data interpolation unit 16 interpolates the time series data of the link transit time of the link determined as the interpolation target link by the traffic data estimation unit 13. The traffic data interpolation unit 16 starts processing from step S151 when time-series data of the link passage time of each time zone including the interpolation target link is input.
 ステップS151は、図12のステップS121と同じため、説明を省略する。処理はステップS152へ進む。 Since step S151 is the same as step S121 of FIG. 12, description thereof is omitted. The process proceeds to step S152.
 ステップS152において、交通データ補間部16は、データの欠損のない時間帯及びデータの欠損度が低い時間帯について、参照リンクとの相関を計算する。時間帯T1、T3、T4それぞれのリンク通過時間の時系列データと、参照リンクの同一時間帯のリンク通過時間の時系列データとの相関係数を算出する。時間帯T4は、データの欠損度が低い場合である。この場合、交通データ補間部16は、欠損しているデータの前後の時刻のデータの中間値を欠損しているデータとして、相関係数を算出する。時間帯T2は、データの欠損が高いため、相関を計算することはできない。 In step S152, the traffic data interpolation unit 16 calculates a correlation with the reference link for a time zone in which there is no data loss and a time zone in which the data loss degree is low. A correlation coefficient between the time series data of the link passage times of the time zones T1, T3, and T4 and the time series data of the link passage times of the same time zone of the reference link is calculated. The time zone T4 is a case where the degree of data loss is low. In this case, the traffic data interpolation unit 16 calculates a correlation coefficient as data that lacks an intermediate value of data at times before and after the missing data. In the time zone T2, since data loss is high, the correlation cannot be calculated.
 交通データ補間部16は、相関係数の高い順に参照リンクを順位付けし、R位までのデータを抽出する。例として、2位までのリンク、相関係数の値、時系列データのグラフを図16~18に示す。 The traffic data interpolation unit 16 ranks the reference links in descending order of the correlation coefficient, and extracts data up to the R rank. As an example, graphs of links up to the second place, correlation coefficient values, and time-series data are shown in FIGS.
 図16は、実施の形態2に係る相関係数の値が2位までのリンクを示す図である。時間帯T1では、1位がリンクL1、2位がリンクL2である。時間帯T2は相関の計算を行うことができないため、値がない。時間帯T3では、1位がリンクL1、2位がリンクL3である。時間帯T4では、1位がリンクL2、2位がリンクL3である。 FIG. 16 is a diagram showing links up to the second place of correlation coefficient values according to the second embodiment. In the time zone T1, the first place is the link L1, and the second place is the link L2. The time zone T2 has no value because the correlation cannot be calculated. In the time zone T3, the first place is the link L1, and the second place is the link L3. In the time zone T4, the first place is the link L2, and the second place is the link L3.
 図17は、実施の形態2に係る相関係数の値が2位までの値を示す図である。時間帯T1では、1位の相関係数がa1、2位の相関係数がa2である。時間帯T2は相関の計算を行うことができないため、値がない。時間帯T3では、1位の相関係数がc1、2位の相関係数がc2である。時間帯T4では、1位の相関係数がd1、2位の相関係数がd2である。 FIG. 17 is a diagram showing values up to the second place of the correlation coefficient according to the second embodiment. In the time zone T1, the first-order correlation coefficient is a1, and the second-order correlation coefficient is a2. The time zone T2 has no value because the correlation cannot be calculated. In the time zone T3, the first-order correlation coefficient is c1, and the second-order correlation coefficient is c2. In the time zone T4, the first-order correlation coefficient is d1, and the second-order correlation coefficient is d2.
 図18は、実施の形態2に係る相関係数の値が2位までのリンク通過時間の時系列データのグラフを示す図である。時間帯T1の1位が181a、2位が181bである。時間帯T3の1位が181c、2位が181dである。時間帯T4の1位が181e、2位が181fである。 FIG. 18 is a diagram showing a graph of time-series data of the link transit time up to the second-order correlation coefficient value according to the second embodiment. The first place in the time zone T1 is 181a, and the second place is 181b. The first place in the time zone T3 is 181c, and the second place is 181d. The first place in the time zone T4 is 181e, and the second place is 181f.
 図15において、処理はステップS153へ進む。
 ステップS153において、交通データ補間部16は、各リンクのリンク通過時間の時系列データを規格化する。処理は図12のステップS123と同じため、説明を省略する。処理はステップS154へ進む。
In FIG. 15, the process proceeds to step S153.
In step S153, the traffic data interpolation unit 16 normalizes the time series data of the link passage time of each link. The process is the same as step S123 in FIG. The process proceeds to step S154.
 ステップS154において、交通データ補間部16は、複数の補間適用リンクのリンク通過時間の時系列データに重みを付けて加算することにより、データが欠損している時間帯の補間データを算出する。時間帯Tkのデータの欠損度が低い場合、交通データ補間部16は、数式2により補間データL0(Tk)を算出する。交通データ補間部16は、相関係数の順位rがR位までのリンク通過時間の時系列データL(Tk,r)、及び相関係数x(Tk,r)を用いて算出する。 In step S154, the traffic data interpolation unit 16 calculates the interpolation data of the time zone in which the data is missing by adding the weighted time series data of the link passing times of the plurality of interpolation application links. When the deficiency of the data in the time zone Tk is low, the traffic data interpolation unit 16 calculates the interpolation data L0 (Tk) using Equation 2. The traffic data interpolation unit 16 calculates the time series data L (Tk, r) of the link transit time until the correlation coefficient rank r reaches R, and the correlation coefficient x (Tk, r).
Figure JPOXMLDOC01-appb-M000002
Figure JPOXMLDOC01-appb-M000002
 時間帯T4の場合、交通データ補間部16は、数式3により補間データL0(T4)を算出する。 In the time zone T4, the traffic data interpolation unit 16 calculates the interpolation data L0 (T4) using Equation 3.
Figure JPOXMLDOC01-appb-M000003
Figure JPOXMLDOC01-appb-M000003
 時間帯Tkのデータの欠損度が高い場合、交通データ補間部16は、数式4により補間データL0(Tk)を算出する。交通データ補間部16は、Tk以外の時間帯の相関係数の順位rがR位までのリンク通過時間の時系列データL(Tk,r)、及び相関係数x(Tk,r)を用いて算出する。 When the degree of data loss in the time zone Tk is high, the traffic data interpolation unit 16 calculates the interpolation data L0 (Tk) using Equation 4. The traffic data interpolation unit 16 uses the time series data L (Tk, r) of the link transit time up to the R rank of the correlation coefficient in the time zone other than Tk, and the correlation coefficient x (Tk, r). To calculate.
Figure JPOXMLDOC01-appb-M000004
Figure JPOXMLDOC01-appb-M000004
 時間帯T2の場合、交通データ補間部16は、数式5により補間データL0(T2)を算出する。 In the time zone T2, the traffic data interpolation unit 16 calculates the interpolation data L0 (T2) using Equation 5.
Figure JPOXMLDOC01-appb-M000005
Figure JPOXMLDOC01-appb-M000005
 交通データ補間部16は、欠損している時刻の値として補間データを代入する。また、交通データ補間部16は、連続性を維持するため、任意の時間幅でデータの平滑化を行う。処理はステップS155へ進む。 The traffic data interpolation unit 16 substitutes the interpolation data as the missing time value. In addition, the traffic data interpolation unit 16 smoothes data in an arbitrary time width in order to maintain continuity. The process proceeds to step S155.
 ステップS155において、交通データ補間部16は、補間された時間帯のデータと補間されていない時間帯のデータをあわせ、補間された1日分のデータを生成する。このとき、補間された時間帯の時系列データは前後の時間帯の時系列データとの連続性がなくなっていることがある。そこで、交通データ補間部16は、補間された時間帯の前後でデータを平滑化する。交通データ補間部16は、例えば、時間帯の最初の30分と最後の30分に含まれる各データについてそれぞれ前後30分間のデータを平均化して平滑化する。 In step S155, the traffic data interpolation unit 16 combines the interpolated time zone data and the non-interpolated time zone data to generate one day of interpolated data. At this time, the time series data in the interpolated time zone may lose continuity with the time series data in the preceding and following time zones. Therefore, the traffic data interpolation unit 16 smoothes the data before and after the interpolated time zone. For example, the traffic data interpolation unit 16 averages and smoothes the data for 30 minutes before and after each of the data included in the first 30 minutes and the last 30 minutes of the time zone.
 図19は、実施の形態2に係る4つの時間帯に分割されたリンク通過時間の時系列データを合わせる例を示す図である。19aは1番目の時間帯T1のリンク通過時間の時系列データである。データの欠損はなく、補間されていない。19bは2番目の時間帯T2のリンク通過時間の時系列データである。データの欠損度があり、補間されたデータである。19cは3番目の時間帯T3のリンク通過時間の時系列データである。データの欠損はなく、補間されていない。19dは4番目の時間帯T4のリンク通過時間の時系列データである。データの欠損度があり、補間されたデータである。19eは19a~dのリンク通過時間の時系列データをあわせた1日分のデータである。 FIG. 19 is a diagram illustrating an example in which time-series data of link passage times divided into four time zones according to the second embodiment are combined. 19a is time-series data of the link transit time in the first time zone T1. There is no missing data and no interpolation. 19b is time-series data of the link transit time in the second time zone T2. The data is missing and the data is interpolated. 19c is time series data of the link passing time in the third time zone T3. There is no missing data and no interpolation. 19d is the time series data of the link passing time in the fourth time zone T4. The data is missing and the data is interpolated. Reference numeral 19e denotes data for one day including the time series data of the link passage times of 19a to 19d.
 図15において、処理はステップS156へ進む。
 ステップS156において、交通データ補間部16は、他にも補間対象リンクがあれば、ステップS151へ戻る。交通データ補間部16は、他に補間対象リンクがなければ、処理を終了する。
In FIG. 15, the process proceeds to step S156.
In step S156, the traffic data interpolation unit 16 returns to step S151 if there are other interpolation target links. If there is no other interpolation target link, the traffic data interpolation unit 16 ends the process.
 データの欠損度が高い場合、前後のデータの中間値をとったとしても、時系列データは、リンク通過時間の変化の特徴を表すことができていない可能性が高い。したがって、参照リンクとの相関を計算しても、適切な補間適用リンクを抽出することができない。よって、他の時間帯のデータを用いて補間データを算出したほうが、より精度の高いリンク通過時間を推定できる可能性が高い。なお、データの欠損度が低い場合でも他の時間帯のデータを用いて補間データを算出してもよい。 If the data deficiency is high, it is highly possible that the time-series data cannot express the characteristics of changes in the link transit time even if the intermediate value of the previous and subsequent data is taken. Therefore, even if the correlation with the reference link is calculated, an appropriate interpolation application link cannot be extracted. Therefore, it is more likely that the link passage time can be estimated with higher accuracy when the interpolation data is calculated using data in other time zones. Note that even when the data deficiency is low, interpolation data may be calculated using data in other time zones.
 したがって、本実施の形態では、交通データ補間部は、リンク通過時間の時系列データを複数の時間帯に分割し、時間帯ごとに補間適用リンクとのリンク通過時間に関する相関係数を算出し、欠損時刻を含む時間帯における相関係数と補間適用リンクのリンク通過時間とに基づいて、補間データを算出するので、時間帯によってより相関の高い補間適用リンクを用いることができ、データの補間において精度を高める。 Therefore, in the present embodiment, the traffic data interpolation unit divides the time series data of the link passage time into a plurality of time zones, calculates a correlation coefficient regarding the link passage time with the interpolation application link for each time zone, Interpolation data is calculated based on the correlation coefficient in the time zone including the missing time and the link transit time of the interpolation application link, so that the interpolation application link with higher correlation can be used depending on the time zone, and in data interpolation Increase accuracy.
 また、交通データ補間部は、リンク通過時間の時系列データを複数の時間帯に分割し、時間帯ごとに補間適用リンクとのリンク通過時間に関する相関係数を算出し、欠損時刻を含まない時間帯における相関係数と補間適用リンクのリンク通過時間とに基づいて、補間データを算出するので、より多くのリンクについて補間データを算出することができる。よって、情報処理装置1は、より多くのリンクについて、精度のよい交通データを出力することができる。 In addition, the traffic data interpolation unit divides the time series data of the link passage time into a plurality of time zones, calculates the correlation coefficient regarding the link passage time with the interpolation application link for each time zone, and does not include the missing time. Since the interpolation data is calculated based on the correlation coefficient in the band and the link passage time of the interpolation application link, the interpolation data can be calculated for more links. Therefore, the information processing apparatus 1 can output highly accurate traffic data for more links.
 また、交通データ推定部は、第1の期間のプローブデータに基づいて、補間適用リンクのリンク通過時間の時系列データを推定するので、現在発生している状況や過去の特定期間に発生した状況に応じたリンク通過時間を推定することができる。 Moreover, since the traffic data estimation unit estimates the time series data of the link transit time of the interpolation application link based on the probe data of the first period, the current situation or the situation that occurred in the past specific period It is possible to estimate the link transit time according to
実施の形態3.
 以上の実施の形態2では、リンク通過時間の時系列データを複数の時間帯に分割し、データの欠損の割合が高い場合には他の時間帯において相関の高いリンクのデータを用いて補間するようにしたものであるが、本実施の形態においては、路上センサから収集したデータを統計データDBのデータに加える実施の形態を示す。
 なお、本実施の形態においては、図1のように実施の形態1に記載の構成を全て備えた上で、更に付加的な構成について説明する。
Embodiment 3 FIG.
In the second embodiment described above, the time series data of the link transit time is divided into a plurality of time zones, and when the data loss rate is high, interpolation is performed using data of links having high correlation in other time zones. In this embodiment, an embodiment in which data collected from road sensors is added to the data of the statistical data DB is shown.
In the present embodiment, all the configurations described in the first embodiment as shown in FIG. 1 are provided, and further additional configurations will be described.
 図20は、実施の形態3に係る情報処理装置200の構成を示すブロック図である。情報処理装置200は、プローブデータ受信部10、プローブデータ処理部11、地図データDB12、交通データ推定部13、交通データ出力部14、統計データDB15、交通データ補間部16、路上センサデータ受信部201、路上センサデータ処理部202から構成される。 FIG. 20 is a block diagram showing a configuration of the information processing apparatus 200 according to the third embodiment. The information processing apparatus 200 includes a probe data reception unit 10, a probe data processing unit 11, a map data DB 12, a traffic data estimation unit 13, a traffic data output unit 14, a statistical data DB 15, a traffic data interpolation unit 16, and a road sensor data reception unit 201. The road sensor data processing unit 202 is configured.
 路上センサデータ受信部201には、走行データとして、路上センサから収集された路上センサデータが入力される。路上センサデータは、道路上に設置された車両感知器等の路上センサが収集したデータに基づいたものである。路上センサは、通過する車両を観測し、データを収集する。路上センサデータが入力されるタイミングは、特に限定しない。路上センサデータは、定期的に入力されてもよいし、不定期に入力されてもよい。 The road sensor data collected from the road sensor is input to the road sensor data receiving unit 201 as travel data. The road sensor data is based on data collected by road sensors such as vehicle detectors installed on the road. The road sensor observes a passing vehicle and collects data. The timing at which road sensor data is input is not particularly limited. The road sensor data may be input regularly or irregularly.
 路上センサデータの代表例は、VICS(登録商標)である。VICS(登録商標)では、路上センサが5分毎に収拾したデータから推定したリンク通貨時間をセンターに送信する。路上センサデータ受信部18は路上センサデータ処理部202に路上センサデータを出力する。 A typical example of road sensor data is VICS (registered trademark). In VICS (registered trademark), the link currency time estimated from the data collected by the road sensor every 5 minutes is transmitted to the center. The road sensor data receiving unit 18 outputs road sensor data to the road sensor data processing unit 202.
 路上センサデータ処理部19は、入力された路上センサデータを集計し、リンク毎のリンク通過時間の時系列データを統計データDB15に出力する。 The road sensor data processing unit 19 aggregates the input road sensor data and outputs time-series data of the link passage time for each link to the statistical data DB 15.
 統計データDB15は、交通データ推定部13及び路上センサデータ処理部202から入力される各リンクのリンク通過時間の時系列データを統計値で保持する。すでにデータを保持しているリンクについて新たなデータが入力された場合、統計データDB15は、統計値を更新する。 The statistical data DB 15 holds the time series data of the link passage times of the links input from the traffic data estimation unit 13 and the road sensor data processing unit 202 as statistical values. When new data is input for a link that already holds data, the statistical data DB 15 updates the statistical value.
 したがって、本実施の形態では、リンク上に設置された路上センサによって収集された、リンクを走行する車両の走行データである路上センサデータが入力されると、リンク毎に分類してリンク通過時間の時系列データを推定する路上センサデータ処理部を備え、統計データ保存部は、交通データ推定部と路上センサデータ処理部とから入力されるリンク通過時間の時系列データを統計値としてリンク毎に保持するので、より多くのリンク通過時間の時系列データを参照リンクとして利用できるため、リンク通過時間の時系列データの補間において精度を高めることができる。 Therefore, in this embodiment, when road sensor data that is travel data of a vehicle traveling on a link collected by a road sensor installed on the link is input, it is classified for each link and the link passing time is calculated. It is equipped with a road sensor data processing unit that estimates time-series data, and a statistical data storage unit holds time-series data of link transit times input from the traffic data estimation unit and road sensor data processing unit as statistical values for each link. Therefore, since more time series data of link passage times can be used as a reference link, accuracy can be improved in interpolation of time series data of link passage times.
1、200 交通情報処理装置
10 プローブデータ受信部
11 プローブデータ処理部
12 地図データDB
13 交通データ推定部
14 交通データ出力部
15 統計データDB
16 交通データ補間部
21、21a~n プローブデータ
31、31a~n 地図データ
111a~n、141a~e、181a~f、191a~e リンク通過時間の時系列データ
201 路上センサデータ受信部
202 路上センサデータ処理部
1,200 Traffic Information Processing Device 10 Probe Data Receiving Unit 11 Probe Data Processing Unit 12 Map Data DB
13 Traffic data estimation unit 14 Traffic data output unit 15 Statistical data DB
16 Traffic data interpolation unit 21, 21a- n Probe data 31, 31a-n Map data 111a-n, 141a-e, 181a-f, 191a-e Time series data of link passing time 201 Road sensor data reception unit 202 Road sensor Data processing section

Claims (14)

  1.  道路の区間であるリンクを走行する車両より収集されたプローブデータからリンクを通過するのにかかる時間を示すリンク通過時間の時系列データを推定する交通データ推定部と、
     前記リンク通過時間の時系列データに欠損がある補間対象リンクと、前記リンク通過時間の時系列データに欠損のない複数の前記補間適用リンクとのリンク通過時間に関する相関係数を算出し、前記補間適用リンクのリンク通過時間と前記相関係数とに基づいて前記補間対象リンクの前記欠損時刻のリンク通過時間を補間する補間データを算出する交通データ補間部と、
    を備えることを特徴とする情報処理装置。
    A traffic data estimating unit that estimates time series data of a link passing time indicating a time taken to pass the link from probe data collected from a vehicle traveling on a link that is a road section;
    Calculating a correlation coefficient relating to a link passage time between the interpolation target link having a deficiency in the time series data of the link passage time and a plurality of the interpolation application links having no deficiency in the time series data of the link passage time, and the interpolation A traffic data interpolation unit that calculates interpolation data for interpolating the link passage time of the missing time of the interpolation target link based on the link passage time of the application link and the correlation coefficient;
    An information processing apparatus comprising:
  2.  前記交通データ補間部は、リンク通過時間の時系列データを複数の時間帯に分割し、時間帯ごとに前記補間適用リンクとのリンク通過時間に関する前記相関係数を算出し、前記欠損時刻を含む時間帯における前記相関係数と前記補間適用リンクのリンク通過時間とに基づいて、前記補間データを算出することを特徴とする請求項1に記載の情報処理装置。 The traffic data interpolation unit divides the time series data of the link passage time into a plurality of time zones, calculates the correlation coefficient regarding the link passage time with the interpolation application link for each time zone, and includes the missing time The information processing apparatus according to claim 1, wherein the interpolation data is calculated based on the correlation coefficient in a time zone and a link passage time of the interpolation application link.
  3.  前記交通データ補間部は、リンク通過時間の時系列データを複数の時間帯に分割し、時間帯ごとに前記補間適用リンクとのリンク通過時間に関する前記相関係数を算出し、前記欠損時刻を含まない時間帯における前記相関係数と前記補間適用リンクのリンク通過時間とに基づいて、前記補間データを算出することを特徴とする請求項1又は2に記載の情報処理装置。 The traffic data interpolation unit divides the time series data of the link passage time into a plurality of time zones, calculates the correlation coefficient regarding the link passage time with the interpolation application link for each time zone, and includes the missing time The information processing apparatus according to claim 1, wherein the interpolation data is calculated based on the correlation coefficient in a non-period of time and a link passage time of the interpolation application link.
  4.  前記交通データ補間部は、前記相関係数の大きさが上位N個(Nは1以上の整数)のリンクを前記補間適用リンクとすることを特徴とする請求項1から3のいずれか一項に記載の情報処理装置。 4. The traffic data interpolation unit according to claim 1, wherein the link having the highest N correlation coefficients (N is an integer of 1 or more) is set as the interpolation application link. 5. The information processing apparatus described in 1.
  5.  前記交通データ推定部は、リンク通過時間の時系列データのうち第1の時間幅においてデータが欠損している時間の合計が第1の閾値以上の場合、データの欠損している割合を示す欠損度が高いと判定することを特徴とする請求項1から4のいずれか一項に記載の情報処理装置。 The traffic data estimation unit is a deficiency indicating a rate of data deficiency when the total time for which data is missing in the first time width of the time series data of link passing time is equal to or greater than a first threshold. The information processing apparatus according to claim 1, wherein the information processing apparatus determines that the degree is high.
  6.  前記交通データ推定部は、リンク通過時間の時系列データについて第2の閾値以上の時間のデータが連続して欠損している場合、前記欠損度が高いと判定することを特徴とする請求項1から5のいずれか一項に記載の情報処理装置。 The traffic data estimation unit determines that the deficiency is high when data of a time equal to or greater than a second threshold is continuously missing in the time series data of the link transit time. To 5. The information processing apparatus according to any one of 5 to 5.
  7.  前記交通データ補間部は、分割された時間帯のリンク通過時間の時系列データの前記欠損度が高い場合、前記欠損時刻を含まない時間帯における前記相関係数と前記補間適用リンクのリンク通過時間とに基づいて、前記補間データを算出することを特徴とする請求項3から6のいずれか一項に記載の情報処理装置。 The traffic data interpolation unit, when the loss degree of the time series data of the link passage time of the divided time zone is high, the correlation coefficient in the time zone not including the loss time and the link passage time of the interpolation application link The information processing apparatus according to claim 3, wherein the interpolation data is calculated based on the information.
  8.  前記交通データ推定部は、複数のリンクを含む地図を複数の領域に分割し、前記補間対象リンクと同じ前記領域に含まれるリンクから前記補間適用リンクを決定することを特徴とする請求項1から7のいずれか一項に記載の情報処理装置。 The traffic data estimation unit divides a map including a plurality of links into a plurality of regions, and determines the interpolation application link from links included in the same region as the interpolation target link. The information processing apparatus according to any one of claims 7 to 9.
  9.  前記交通データ推定部は、前記領域において収集される前記プローブデータの量に応じて、前記領域の大きさを決定することを特徴とする請求項1から8のいずれか一項に記載の情報処理装置。 The information processing according to any one of claims 1 to 8, wherein the traffic data estimation unit determines the size of the region according to an amount of the probe data collected in the region. apparatus.
  10.  前記交通データ補間部は、前記補間適用リンクの長さを前記補間対象リンクの長さ分に補正した前記欠損時刻のリンク通過時間に前記相関係数を乗算し、足し合わせることにより、前記補間データを算出することを特徴とする請求項1から9のいずれか一項に記載の情報処理装置。 The traffic data interpolation unit multiplies the correlation coefficient by the link transit time at the missing time obtained by correcting the length of the interpolation application link by the length of the interpolation target link, thereby adding the interpolation data. The information processing apparatus according to any one of claims 1 to 9, wherein the information processing apparatus is calculated.
  11.  リンクを識別する地図情報に基づいて、入力された前記プローブデータをリンク毎に前記プローブデータを分類し、前記交通データ推定部に出力するプローブデータ処理部と、
     前記交通データ推定部から入力されるリンク通過時間の時系列データを統計値としてリンク毎に保持する統計データ保存部と、
    を備えることを特徴とする請求項1から10のいずれか一項に記載の情報処理装置。
    A probe data processing unit that classifies the probe data for each link based on map information for identifying a link, and outputs the classified probe data to the traffic data estimation unit;
    A statistical data storage unit that holds, as a statistical value, time-series data of link transit times input from the traffic data estimation unit;
    The information processing apparatus according to claim 1, further comprising:
  12.  リンク上に設置された路上センサによって収集された、リンクを走行する車両の走行データである路上センサデータが入力されると、リンク毎に分類してリンク通過時間の時系列データを推定する路上センサデータ処理部を備え、
     前記統計データ保存部は、前記交通データ推定部と前記路上センサデータ処理部とから入力されるリンク通過時間の時系列データを統計値としてリンク毎に保持することを特徴とする請求項1から11のいずれか一項に記載の情報処理装置。
    When road sensor data, which is travel data of a vehicle traveling on a link, collected by a road sensor installed on the link is input, the road sensor classifies each link and estimates time-series data of the link transit time. A data processing unit,
    12. The statistical data storage unit holds time-series data of link passage times input from the traffic data estimation unit and the road sensor data processing unit as a statistical value for each link. The information processing apparatus according to any one of the above.
  13.  前記交通データ推定部は、第1の期間の前記プローブデータに基づいて、前記補間適用リンクのリンク通過時間の時系列データを推定することを特徴とする請求項1から12のいずれか一項に記載の情報処理装置。 The said traffic data estimation part estimates the time series data of the link passage time of the said interpolation application link based on the said probe data of a 1st period, It is any one of Claim 1 to 12 characterized by the above-mentioned. The information processing apparatus described.
  14.  道路の区間であるリンクを走行する車両より収集されたプローブデータからリンクを通過するのにかかる時間を示すリンク通過時間の時系列データを推定する交通データ推定ステップと、
     前記リンク通過時間の時系列データに欠損がある補間対象リンクと、前記リンク通過時間の時系列データに欠損のない複数の前記補間適用リンクとのリンク通過時間に関する相関係数を算出し、前記補間適用リンクのリンク通過時間と前記相関係数とに基づいて前記補間対象リンクの前記欠損時刻のリンク通過時間を補間する補間データを算出する交通データ補間ステップと、
    を有する情報処理方法。
    A traffic data estimation step for estimating time series data of a link passing time indicating a time taken to pass the link from probe data collected from a vehicle traveling on a link which is a road section;
    Calculating a correlation coefficient relating to a link passage time between the interpolation target link having a deficiency in the time series data of the link passage time and a plurality of the interpolation application links having no deficiency in the time series data of the link passage time, and the interpolation A traffic data interpolation step for calculating interpolation data for interpolating the link passage time of the missing time of the interpolation target link based on the link passage time of the application link and the correlation coefficient;
    An information processing method comprising:
PCT/JP2014/005041 2013-10-24 2014-10-03 Information processing device and information processing method WO2015059877A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015543697A JP6107964B2 (en) 2013-10-24 2014-10-03 Information processing apparatus and information processing method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013-220760 2013-10-24
JP2013220760 2013-10-24

Publications (1)

Publication Number Publication Date
WO2015059877A1 true WO2015059877A1 (en) 2015-04-30

Family

ID=52992499

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/005041 WO2015059877A1 (en) 2013-10-24 2014-10-03 Information processing device and information processing method

Country Status (2)

Country Link
JP (1) JP6107964B2 (en)
WO (1) WO2015059877A1 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017102788A (en) * 2015-12-03 2017-06-08 トヨタ自動車株式会社 Congestion prediction method
JP2020047293A (en) * 2019-11-30 2020-03-26 株式会社セラク Environment monitoring system
JPWO2021240716A1 (en) * 2020-05-28 2021-12-02
US20220099459A1 (en) * 2019-06-13 2022-03-31 Denso Corporation Map data generation system, data center, and in-vehicle apparatus
US11395096B2 (en) 2018-06-04 2022-07-19 Nec Corporation Information sharing device, information sharing method, and recording medium
WO2024202338A1 (en) * 2023-03-30 2024-10-03 株式会社Nttドコモ Data complementation system

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102384434B1 (en) * 2017-08-31 2022-04-08 현대오토에버 주식회사 Apparatus and method of providing pattern traffic information according to turning of link

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031422A (en) * 2004-07-16 2006-02-02 Matsushita Electric Ind Co Ltd Device and method for generating traffic information, device for providing traffic information and system for distributing same
JP2011008569A (en) * 2009-06-26 2011-01-13 Clarion Co Ltd Apparatus for generating statistic traffic information and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4913689B2 (en) * 2007-07-25 2012-04-11 クラリオン株式会社 Traffic information distribution system
JP2009087097A (en) * 2007-09-28 2009-04-23 Panasonic Corp Device for generating traffic information and system for providing traffic information

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031422A (en) * 2004-07-16 2006-02-02 Matsushita Electric Ind Co Ltd Device and method for generating traffic information, device for providing traffic information and system for distributing same
JP2011008569A (en) * 2009-06-26 2011-01-13 Clarion Co Ltd Apparatus for generating statistic traffic information and program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017102788A (en) * 2015-12-03 2017-06-08 トヨタ自動車株式会社 Congestion prediction method
US11395096B2 (en) 2018-06-04 2022-07-19 Nec Corporation Information sharing device, information sharing method, and recording medium
US20220099459A1 (en) * 2019-06-13 2022-03-31 Denso Corporation Map data generation system, data center, and in-vehicle apparatus
JP2020047293A (en) * 2019-11-30 2020-03-26 株式会社セラク Environment monitoring system
JPWO2021240716A1 (en) * 2020-05-28 2021-12-02
WO2021240716A1 (en) * 2020-05-28 2021-12-02 日本電信電話株式会社 Interpolation processing device, interpolation processing method, and interpolation processing program
JP7417161B2 (en) 2020-05-28 2024-01-18 日本電信電話株式会社 Interpolation processing device, interpolation processing method, and interpolation processing program
WO2024202338A1 (en) * 2023-03-30 2024-10-03 株式会社Nttドコモ Data complementation system

Also Published As

Publication number Publication date
JPWO2015059877A1 (en) 2017-03-09
JP6107964B2 (en) 2017-04-05

Similar Documents

Publication Publication Date Title
JP6107964B2 (en) Information processing apparatus and information processing method
EP1938296B1 (en) Assessing road traffic conditions using data from mobile data sources
CN111712862B (en) Method and system for generating traffic volume or traffic density data
US8700294B2 (en) Representative road traffic flow information based on historical data
US8185299B2 (en) Route search device and route search method
AU2010238762B2 (en) Predicting expected road traffic conditions based on historical and current data
JP5374067B2 (en) Traffic condition simulation apparatus and program
US9947218B2 (en) Traffic-light cycle length estimation device
CN102737504B (en) Method for estimating bus arrival time in real time based on drive characteristics
US20080046165A1 (en) Rectifying erroneous road traffic sensor data
US11127289B2 (en) Traffic congestion estimating device, traffic congestion estimating method, and recording medium storing program thereof
US20110137545A1 (en) Obtaining road traffic condition data from mobile data sources
US20070208501A1 (en) Assessing road traffic speed using data obtained from mobile data sources
JP2017097088A (en) Map generation device and map generation method, and navigation management system
US20200284594A1 (en) Vehicle and navigation system
EP1548405A1 (en) System, method, and data structure for smoothing navigation data
EP1589320A2 (en) Navigation apparatus and navigation method
JP2008158562A (en) Traffic information distribution center, probe device for vehicle, traffic information system, and traffic information distribution method for traffic information distribution center
US11030831B2 (en) Fuel efficiency estimation system, fuel efficiency estimation method, and computer readable medium
KR19990068262A (en) Automobile traffic information providing system_
EP2287821B1 (en) Method and apparatus for determining traffic information and system for route calculation
KR20170015271A (en) Method for predicting link traffic speed and device for the same
JP5315222B2 (en) Traffic information generator
KR101448921B1 (en) Apparatus for real-time adjusting pattern velocity in a car navigation system and method thereof
El Esawey et al. Using buses as probes for neighbor links travel time estimation in an urban network

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14855773

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2015543697

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14855773

Country of ref document: EP

Kind code of ref document: A1