WO2016015312A1 - 一种轨迹数据查询的方法及装置 - Google Patents

一种轨迹数据查询的方法及装置 Download PDF

Info

Publication number
WO2016015312A1
WO2016015312A1 PCT/CN2014/083485 CN2014083485W WO2016015312A1 WO 2016015312 A1 WO2016015312 A1 WO 2016015312A1 CN 2014083485 W CN2014083485 W CN 2014083485W WO 2016015312 A1 WO2016015312 A1 WO 2016015312A1
Authority
WO
WIPO (PCT)
Prior art keywords
index
index leaf
trajectory
leaf node
leaf nodes
Prior art date
Application number
PCT/CN2014/083485
Other languages
English (en)
French (fr)
Inventor
李彦华
周志贤
袁明轩
杨强
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Priority to PCT/CN2014/083485 priority Critical patent/WO2016015312A1/zh
Priority to EP14898690.4A priority patent/EP3163466B1/en
Priority to CN201480080003.9A priority patent/CN106575294B/zh
Publication of WO2016015312A1 publication Critical patent/WO2016015312A1/zh
Priority to US15/414,888 priority patent/US20170132264A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2264Multidimensional index structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing

Definitions

  • the present invention relates to the field of database technologies, and in particular, to a method and device for querying trajectory data.
  • the track contains a series of geographical locations.
  • the track can include a time stamp in addition to the feature of geographic location. That is to say, the trajectory can be composed of a series of geographical locations with time stamps, which can theoretically be understood as "in a three-dimensional space, a trajectory consists of multiple data containing time and geographic location".
  • the data of these tracks can be stored in the spatiotemporal database for user query.
  • the user's query of the trajectory data can be implemented by a spatiotemporal indexing technique. First, create a space-time index.
  • a first aspect of the present invention provides a trajectory data query method, the method comprising: establishing a spatiotemporal index and an inverted index (or inverted index) for trajectory data in a spatiotemporal database, wherein the inverted index is used to form an inclusion
  • the index to which each track is associated a first relationship correspondence table of the correspondence between the leaf nodes, wherein the association form of each of the tracks with its associated index leaf node includes: the middle portion of the track passes through an index leaf node, and the beginning of the track or The end is in an index leaf node, the track is completely in an index leaf node; receiving a trajectory data query of the user, wherein the trajectory data query of the user includes, the user performing a spatial area in the spatiotemporal database Specifying to count data results in the spatial region; sampling the index leaf nodes included in the specified spatial region, wherein determining the
  • the forming a first relationship correspondence table that includes a correspondence between each trajectory and an associated index leaf node includes: determining, by using the space-time index All index leaf nodes in the spatiotemporal database;
  • the indexing the leaf node included in the spatial area is sampled, where The number of index leaf nodes in the spatial region and the number of index leaf nodes obtained by sampling are specifically as follows:
  • the index leaf node and the first relationship correspondence table determine a correspondence between each track included in the sampled index leaf node and an index leaf node associated with the track, to form a second relationship correspondence table
  • the method includes: collecting, according to the sampled index leaf node, a plurality of trajectories included in the index leaf node; acquiring, from the first relationship correspondence table, at least each trajectory associated with each of the plurality of trajectories An index leaf node;
  • the method further includes:
  • Obtaining, by the first relationship correspondence table, the at least one index leaf node associated with each of the plurality of trajectories is: acquiring the multiple tracks that are not repeated from the first relationship correspondence table At least one index leaf node associated with each of the tracks.
  • determining an unbiased estimation operator, and determining the query result includes: Calculating, respectively, a number of index leaf nodes corresponding to each track in the second relationship correspondence table;
  • the number of leaf nodes determines the unbiased estimation operator, and determines the query result according to the unbiased estimation operator calculation, wherein the combined probability statistical method and the large number theorem determine the unbiased estimation algorithm Specifically, determining a true value expression including all leaf node information in the specified area, and then sampling all the leaf nodes in the specified area, by using the sampled leaf node information and combining the large numbers The theorem determines the unbiased estimation operator to estimate the true value derived from the true value expression.
  • ⁇ ⁇ ⁇ ⁇ 5 ⁇ l/k ⁇ ;
  • q represents the spatio-temporal region related to the user's query range, n represents the number of all leaf nodes in the space-time region q before sampling, and B represents the number of leaf nodes after sampling r denotes a trajectory obtained from the B index leaf nodes and the second relationship correspondence table obtained after sampling, and k denotes the number of index leaf nodes that the trajectory r passes in the spatiotemporal region q of the query.
  • h q ( R q represents the space-time region related to the user's query range
  • n represents the number of all leaf nodes in the space-time region q before sampling
  • B represents the sampled leaf segment.
  • the number of points, r represents the trajectory obtained from the B index leaf nodes and the second relationship correspondence table obtained after sampling
  • represents the trajectory characteristic of the trajectory r
  • W represents the number of index leaf nodes traversed by the trajectory r in the spatiotemporal region q of the query.
  • l r /k? ;
  • q represents the space-time region related to the user's query range, n represents the number of all leaf nodes in the space-time region q before sampling, B represents the number of leaf nodes after sampling, and r represents the leaf nodes and samples according to the B indexes.
  • represents the trajectory characteristic of the trajectory r, and k represents the number of index leaf nodes traversed by the trajectory r in the spatiotemporal region q of the query.
  • the second aspect of the present invention provides a trajectory data query.
  • the device includes: an establishing unit, configured to establish a spatiotemporal index and an inverted index for the trajectory data in the spatiotemporal database, where the inverted index is used to form an index leaf node including each trajectory associated with the trajectory Corresponding relationship first correspondence table, wherein the association form of each track with its associated index leaf node includes: the middle portion of the track passes through an index leaf node, and the beginning or end of the track is in an index In the leaf node, the track is completely in an index leaf node; a receiving unit is configured to receive the user's track Data query, wherein the trajectory data query of the user includes: the user specifies a spatial region in the spatiotemporal database to count data results in the spatial region; and a sampling unit, configured to: The index leaf node included in the spatial region is sampled, wherein the number of index leaf nodes in the spatial region and the number of index leaf nodes obtained by sampling are determined; a determining unit, configured to determine, according to the index leaf node sampled by the sampling unit and the first
  • the sampling unit is specifically configured to:
  • the index leaf nodes perform random sampling with return-type, and obtain B repeatable index leaf nodes, where n>B, n, and B are positive integers.
  • the determining unit includes: determining a module, configured to list, according to the sampled index leaf node, a plurality of trajectories included in the index leaf node, and an acquiring module, configured to acquire the multiple trajectories from the first relationship correspondence table At least one index leaf node associated with each track; a determining module, configured to determine whether at least one index leaf node acquired by the acquiring module exists in an index leaf node sampled by the sampling unit, and if the judgment result is that, The index leaf nodes corresponding to the track are reserved, and the corresponding relationship is recorded in the second relationship correspondence table.
  • the determining module is further configured to: determine whether the listed multiple trajectories are recurring If the trajectory is re-appeared, the re-occurring trajectory is not listed, so as to ensure that a plurality of trajectories are not repeated.
  • the acquiring module is specifically configured to: correspond to the first relationship At least one index leaf node associated with each of the plurality of trajectories determined by the determining module is obtained in the table.
  • the determining unit is specifically configured to:
  • the number of leaf nodes determines the unbiased estimation operator, and determines the query result according to the unbiased estimation operator calculation, wherein the combined probability statistical method and the large number theorem determine the unbiased estimation algorithm Specifically, determining a true value expression including all leaf node information in the specified area, and then sampling all the leaf nodes in the specified area, by using the sampled leaf node information and combining the large numbers The theorem determines the unbiased estimation operator to estimate the true value derived from the true value expression.
  • a third aspect of the present invention provides a trajectory data query device, the device comprising: a processor, configured to establish a spatiotemporal index and an inverted index for trajectory data in a spatiotemporal database, wherein the inverted index is used to form a first relationship correspondence table including a correspondence between each trajectory and its associated index leaf node, wherein the association form of each trajectory with its associated index leaf node includes: the middle portion of the trajectory passes through an index a leaf node, the beginning or end of the track is in an index leaf node, and the track is completely in an index leaf node; a receiver, configured to receive a trajectory data query of the user, where the trajectory data query of the user includes: the user specifies a spatial region in the spatiotemporal database, and collects data results in the spatial region;
  • the processor is further configured to: sample the index leaf node included in the specified spatial region, where the number of index leaf nodes in the spatial region and the number of index leaf nodes obtained by sampling are determined; according to the sampling unit The sampled index leaf node
  • the processor is specifically configured to: determine, by using the space-time index, all index leaf nodes in the spatiotemporal database;
  • a correspondence between each of the tracks and its associated index leaf nodes is stored to form a first relationship correspondence table.
  • the processor is specifically configured to:
  • the index leaf nodes perform random sampling with return-type, and obtain B repeatable index leaf nodes, where n>B, n, and B are positive integers.
  • the processor is specifically configured to: determine whether the listed multiple trajectories are recurring a track, if there is a track again, the re-occurring track is not listed, thereby ensuring a plurality of tracks that are not repeated; and obtaining the non-repeating determined by the determining module from the first relationship correspondence table At least one index leaf node associated with each of the plurality of tracks.
  • the processor is specifically configured to:
  • the number of nodes in the spatial region determines an unbiased estimation operator, and determines a query result according to the unbiased estimation operator calculation, wherein the combined probability statistical method and the large number theorem determine the unbiased estimation operator Specifically, determining a true value expression including all leaf node information in the specified area, and then sampling all the leaf nodes in the specified area, by using the sampled leaf node information and combining the large number theorem An unbiased estimation operator is determined to estimate the true value derived from the true value expression.
  • the method and device for querying trajectory data establish a spatiotemporal index and an inverted index for trajectory data in a spatiotemporal database; wherein the inverted index is used to form an index leaf node including each trajectory associated with it a first relationship correspondence table of the correspondence relationship; next, receiving a trajectory data query of the user, wherein the trajectory data query of the user includes: the user designating a spatial area in the spatiotemporal database, and the designated space
  • the index leaf node included in the area is sampled, wherein the number of index leaf nodes in the space area and the number of index leaf nodes obtained by the sampling are determined; and the sampled leaf nodes and the first relationship correspondence table are determined according to the sampling.
  • Corresponding relationship between each trajectory included in the index leaf node and the index leaf node associated with the trajectory forming a second relationship correspondence table; and then, according to the number of index leaf nodes in the spatial region, the sampled index leaf node obtained by sampling The number and the data in the second relationship correspondence table determine the query result.
  • the present invention in addition to establishing a spatiotemporal index, the present invention also establishes an inverted index, whereby the retrace contained in the sampled index leaf node and the index leaf node associated with the trajectory can be determined according to the two indexes.
  • Corresponding relationship that is, a second relationship correspondence table is formed; thus, an unbiased estimation operator can be determined according to the number of index leaf nodes in the spatial region, the number of index leaf nodes obtained by sampling, and the data in the second relationship correspondence table, The calculation determines the query result.
  • an unbiased estimation operator can be determined according to the number of index leaf nodes in the spatial region, the number of index leaf nodes obtained by sampling, and the data in the second relationship correspondence table, The calculation determines the query result.
  • FIG. 1 is an exemplary schematic diagram of establishing a spatiotemporal index in the prior art
  • FIG. 2 is a schematic flow chart of a method for querying trajectory data according to Embodiment 1 of the present invention
  • FIG. 3 is a schematic flow chart of a method for querying trajectory data according to Embodiment 2 of the present invention.
  • FIG. 4 is a schematic structural diagram of an apparatus for querying trajectory data according to Embodiment 3 of the present invention
  • FIG. 5 is another schematic structural diagram of an apparatus for querying trajectory data according to Embodiment 3 of the present invention
  • FIG. 6 is a schematic structural diagram of an apparatus for querying trajectory data according to Embodiment 4 of the present invention
  • FIG. 7 is another schematic structural diagram of an apparatus for querying trajectory data according to Embodiment 4 of the present invention.
  • Embodiment 1 of the present invention provides a method for querying trajectory data. As shown in FIG. 2, the method includes the following steps:
  • each track with its associated index leaf node may include the following three forms: In the first form, a track passes through an index leaf node, that is, the middle portion of the track is in the In the index leaf node; the second form, the beginning or end of a track is in an index leaf node; the third form, a track is completely in an index leaf node.
  • the trajectory data since the trajectory data has the characteristics of time and space, an index needs to be established before the trajectory data is queried.
  • the method of establishing an index may employ, for example, a method such as Quad-tree, B-tee, B+-tree.
  • a fall is also established.
  • Index is used to form a first relationship correspondence table including a correspondence relationship between each trajectory and its associated index leaf node.
  • the step of establishing an inverted index to form a first relationship correspondence table including a correspondence relationship between each track and its associated index leaf node may be divided into the following steps:
  • 1 12 determining, according to each track in the spatio-temporal database, an index leaf node associated with each track;
  • each track in the spatio-temporal database can span at least one index leaf node, and in general, one track cannot span all index leaf nodes in the spatio-temporal database, so it is necessary to determine the index leaf nodes associated with each track. .
  • each index leaf node Stores a correspondence between each track and its associated index leaf node to form a first relationship correspondence table.
  • each index leaf node also has ID information. That is, a corresponding ID (identity) may be set for each index leaf node, so in the first relationship correspondence table, the correspondence between each track and its associated index leaf node is specifically, There is a correspondence between the trajectories and the IDs of at least one index leaf node associated therewith. It should be noted that the correspondence between each track in the spatio-temporal database and its associated index leaf node can be obtained by establishing the inverted index. Understandably, the above spatial index and inverted index will not be re-established before each query.
  • the index data created by them is stored. This stored data can be applied to multiple queries, saving query time.
  • those skilled in the art can periodically update and establish the spatial index and the inverted index according to experience, and the present invention is not limited thereto.
  • trajectory data query of the user where the trajectory data query of the user includes: the user specifies a spatial region in the spatiotemporal database to collect data results in the spatial region.
  • the user's trajectory data query usually includes the scope of the query and the purpose of the query. For example, if the user's trajectory data query is "out of the Beijing range during 2013" The number of "car rental passenger trajectories", then the "2013 period” and “Beijing area” are the scope of inquiry; among them, the "number of taxi passenger trajectories” is for the purpose of inquiry. Understandably, when the user gives When a query scope is specified, that is, a query is made for a certain spatial region in the spatiotemporal database.
  • step S13 specifically includes: performing random back sampling on the n index leaf nodes included in the determined spatial region, to obtain B repeatable indexes.
  • Leaf nodes, where n>B, n, and B are positive integers. Therefore, the index leaf nodes obtained by each sampling are recorded and then returned to the original spatial region, so that the index leaf nodes in the spatial region are always n at each sampling time.
  • the sampling method may be any sampling algorithm.
  • other sampling methods may be used, such as a biased sampling with a return type, or a partial offset without a return type. Sampling, etc.
  • the second relationship correspondence table is dynamically formed. That is, when the user makes a different query for the trajectory data, the content of the generated second relationship correspondence table is also different. It can be understood from this that the embodiment of the present invention focuses on how to generate the second relationship correspondence table instead of the second relationship correspondence table itself.
  • step S14 specifically includes:
  • the index leaf node corresponding to the track is reserved. And the corresponding relationship is recorded in the second relationship correspondence table. It is to be noted that at least one index leaf node associated with each track of the plurality of tracks is obtained from the first relationship correspondence table, where the index leaf node may be located in the space-time region, or may be located in the space-time region. In addition, after the above judgment process, only the index leaf nodes in the space-time region are retained.
  • the method may further include the following steps: determining whether there is a recurring trajectory among the listed plurality of trajectories, and if a trajectory occurs again, The re-occurring trajectory is not listed, so as to ensure that a plurality of trajectories are not repeated.
  • step 142 is specifically: acquiring each of the plurality of non-repeating trajectories from the first relationship correspondence table. At least one index leaf node associated with the trajectory.
  • step 143 by the step of culling the repeated trajectory above, the number of judgments of "at least one index leaf node existing in the sampled index leaf node" in step 143 can be reduced, thereby shortening the judgment time and improving the efficiency.
  • step S15 specifically includes:
  • the unbiased estimation operator is determined by combining the probability statistical method and the large number theorem, and the query result is determined according to the unbiased estimation operator calculation.
  • the "combination probability statistical method and the large number theorem determine the unbiased estimation operator" are specifically divided into the following steps: First, determining a true value expression including all the leaf node information in the specified area; and then, in the designation All the leaf nodes are sampled in the region, and the real part is estimated by using the sampled leaf node information and determining the unbiased estimation operator in combination with the large number theorem. The actual value derived from the value expression. It should be noted that the unbiased estimation operator can be determined in advance as described above. Once the unbiased estimation operator is determined, it can be directly applied to the same or similar query in the future.
  • step 152 When the formula in step 152 is calculated using unbiased estimation, the inventor has proved that the accuracy of the query result determined by the sampled trajectory data is over 95%. Therefore, the sampled data is determined by unbiased estimation. The accuracy rate. It can be understood that the embodiment of the present invention may also adopt a biased estimation or other estimation operator, which is not specifically limited in the present invention.
  • the query of the trajectory data of the user is the number of query trajectories (Count Query )
  • the following unbiased estimator is determined, and the query result is determined:
  • q represents the space-time region associated with the user's query range
  • n represents the number of all index leaf nodes in the space-time region q before sampling
  • B represents the number of indexed leaf nodes after sampling, in particular, when the sampling mode is a back-type random
  • the B leaf nodes can be repeated, that is, the leaf nodes of each sample are randomly selected from all the leaf nodes in q
  • r represents the leaf nodes according to the B indexes and the samples are obtained after sampling.
  • the second relationship corresponds to the trajectory obtained by the table
  • 1 ⁇ represents the number of index leaf nodes that the trajectory r passes in the spatiotemporal region q of the query.
  • the query of the trajectory data of the user is a query trajectory characteristic (Sum Query)
  • the following unbiased estimator is determined, and the query result is determined:
  • q represents the space-time region associated with the user's query range
  • n represents the number of all leaf nodes in the space-time region q before sampling
  • B represents the number of leaf nodes after sampling, in particular, when the sampling mode is a back-sampling random sampling
  • the B leaf nodes may be repeated, that is, the leaf nodes of each sample are randomly selected from all the leaf nodes in the q
  • r represents the leaf nodes according to the B indexes and the samples obtained after sampling
  • represents the trajectory characteristic of the trajectory r, such trajectory characteristics such as the number of kilometers, the number of crossings, the duration of the trajectory, and the like, and the statistical characteristics of the trajectory
  • k indicates that the trajectory r is in the space-time region q of the query The number of index leaf nodes that have passed.
  • the query of the trajectory data of the user is an average of the query trajectory (Average Query)
  • the following unbiased estimator is determined, and the query result is determined:
  • q the spatiotemporal region associated with the user's query range
  • n the number of all leaf nodes in the spatiotemporal region q before sampling
  • the number of leaf nodes after sampling in particular, when the sampling mode is put back random sampling, the B leaf nodes can be repeated, that is, each sampled leaf node is independent from all of q Randomly selected from the leaf nodes
  • r represents the trajectory obtained from the B index leaf nodes and the second relationship correspondence table obtained after sampling
  • represents the trajectory characteristics of the trajectory r, such as the number of kilometers, the number of crossings, the length of time, etc.
  • the statistical property; k r q represents the number of index leaf nodes that the trajectory r passes in the spatiotemporal region q of the query.
  • the method for querying the trajectory data provided by the first embodiment of the present invention establishes a spatiotemporal index and an inverted index for the trajectory data in the spatiotemporal database, wherein the inverted index is used to form an index leaf node including each trajectory associated therewith.
  • a first relationship correspondence table of the correspondence relationship next, receiving a trajectory data query of the user, wherein the trajectory data query of the user includes: the user specifies a spatial region in the spatiotemporal database, and then the designated spatial region The included index leaf node samples, wherein the index leaf in the space area is determined The number of nodes and the number of index leaf nodes obtained by sampling; and determining, according to the sampled index leaf node and the first relationship correspondence table, each index track included in the sampled index leaf node and the index leaf node associated with the track Corresponding relationship, forming a second relationship correspondence table; then, determining an unbiased estimation operator according to the number of index leaf nodes in the spatial region, the number of index leaf nodes obtained by sampling, and the data in the second relationship correspondence table, and determining search result.
  • the present invention in addition to establishing a spatiotemporal index, the present invention also establishes an inverted index, whereby the retrace contained in the sampled index leaf node and the index leaf node associated with the trajectory can be determined according to the two indexes.
  • the corresponding relationship that is, the second relationship correspondence table is formed; thus, the query result can be determined according to the number of index leaf nodes in the spatial region, the number of index leaf nodes obtained by sampling, and the data in the second relationship correspondence table.
  • the application scenario of the embodiment of the present invention is not limited to querying some trajectory data from a spatiotemporal database, and may also be applied to a scenario related to trajectory data query. For example, when operators want to use trajectory data to other industry stores, such as McDonald's, provide shop location services.
  • the traffic planning department can query the distribution of taxi demand in each time and space area of the city based on the city taxi trajectory data to find out where to build the taxi stop.
  • trajectory data query issued by the user is "Query the number of all the rental car trajectories in Beijing Chaoyang District in 2013”
  • the “number of voyages for renting car passengers” is for the purpose of inquiry
  • “Beijing Chaoyang District 2013” For the scope of the query, the query corresponds to a specific space-time region in the spatio-temporal database. As shown in Figure 3, the following steps are specifically performed:
  • each sampled leaf node is independently selected from all the leaf nodes in q.
  • the number of index leaf nodes can be flexibly set by a person skilled in the art according to actual conditions, and the present invention is not limited herein.
  • the query purpose of the trajectory data is the trajectory characteristic query
  • the query is "query the total distance traveled by all the rental car trajectories of the Beijing Chaoyang District in 2013”
  • the number of kilometers corresponding to each track in the second relationship correspondence table is calculated, and the formula (2) can be applied to obtain the result that the user wants to query.
  • Embodiment 3 of the present invention further provides a device 40 for querying trajectory data.
  • the device 40 includes: an establishing unit 401, configured to establish a spatiotemporal index on trajectory data in a database.
  • an inverted index wherein the inverted index is used to form a first relationship correspondence table including a correspondence relationship between each trajectory and its associated index leaf node, wherein each trajectory is associated with the index leaf node thereof
  • the association form includes: The middle part of the track passes through an index leaf node, and the beginning or end of the track is in an index leaf node, and the track is completely in an index leaf node;
  • the receiving unit 402 is configured to receive a trajectory data query of the user, where the trajectory data query of the user includes: the user specifies a spatial region in the spatiotemporal database to count the data result in the spatial region; and the sampling unit 403 is configured to: And sampling an index leaf node included in the specified spatial area, where the number of index leaf nodes in the space area and the number of index leaf nodes obtained by sampling are determined;
  • a determining unit 404 configured to determine, according to the index leaf node sampled by the sampling unit 403 and the first relationship correspondence table, an index leaf node associated with each track included in the sampled index leaf node and the track Corresponding relationship, forming a second relationship correspondence table; and determining, according to the number of index leaf nodes in the spatial region, the number of index leaf nodes obtained by sampling, and the data in the second relationship correspondence table, determining an unbiased estimation The operator calculates the result of the query.
  • the establishing unit 401 establishes a spatiotemporal index and an inverted index for the trajectory data in the spatiotemporal database, wherein the inverted index is used to form a trajectory containing each trajectory associated therewith a first relationship correspondence table for mapping the correspondence between the leaf nodes; a trajectory data query received by the receiving unit 402, wherein the trajectory data query of the user includes a user specifying a spatial region in the spatiotemporal database, and the sampling unit 403 specifies the The index leaf node included in the spatial region is sampled, wherein the number of index leaf nodes in the spatial region and the number of index leaf nodes obtained by the sampling are determined; the index leaf node sampled by the determining unit 404 according to the sampling unit 403 and the first relationship correspondence table Determining, by the sampling, the correspondence between each track included in the index leaf node and the index leaf node associated with the track, forming a second relationship correspondence table; and determining unit 404 further according to the
  • the establishing unit 401 establishes an inverted index in addition to establishing a space-time index, whereby the determining unit 404 can determine, according to the two indexes, that the track included in the sampled index leaf node is associated with the track.
  • Corresponding relationship between the index leaf nodes that is, the second relationship correspondence table is formed; thus the determining unit 404 can be based on the number of index leaf nodes in the spatial region, the number of index leaf nodes obtained by sampling, and the second relationship correspondence table. Data, determine the unbiased estimate operator, and calculate the query result.
  • the above-mentioned apparatus for establishing a spatiotemporal index and an inverted index and based on the sampling can avoid the problem of scanning all the trajectory data in the spatio-temporal region related to the query, thereby shortening the query time, improving the query efficiency, and saving system resources.
  • the query result determined by the unbiased estimation operator has higher accuracy.
  • the establishing unit 401 is specifically configured to: determine, by using a space-time index, all index leaf nodes in the spatio-temporal database; and determine, according to each track in the spatio-temporal database, An index leaf node associated with each track;
  • the sampling unit 403 is specifically configured to: perform a back-to-back randomization on the n index leaf nodes included in the specified spatial region. Sampling, obtains B repeatable index leaf nodes, where n>B, n, and B are positive integers.
  • the determining unit 404 includes: a determining module 4041, configured to list, according to the sampled index leaf node, the index leaf node Multiple tracks included;
  • the obtaining module 4042 is configured to obtain, from the first relationship correspondence table, at least one index leaf node associated with each of the plurality of tracks, and a determining module 4043, configured to determine at least one index acquired by the acquiring module If the leaf node exists in the index leaf node sampled by the sampling unit, if the result of the determination is that the index leaf node corresponding to the track is retained, the corresponding relationship is recorded in the second relationship correspondence table.
  • the determining module 4041 is further configured to: determine whether there is a recurring trajectory among the listed plurality of trajectories, and if the trajectory appears again, the reappearing The trajectory is not listed, so as to ensure that a plurality of trajectories are not repeated.
  • the obtaining module 4042 is specifically configured to: obtain, from the first relationship correspondence table, each of the plurality of trajectories determined by the determining module that are not repeated. At least one index leaf node associated with the trajectory.
  • the determining unit 404 is specifically configured to: separately calculate a number of index leaf nodes corresponding to each track in the second relationship correspondence table;
  • the number of index leaf nodes in the spatial region, the number of index leaf nodes obtained by sampling, the number of trajectories in the second relationship correspondence table, and the number of index leaf nodes corresponding to each trajectory in the space-time region Combining the probability statistical method and the large number theorem to determine an unbiased estimation operator, and determining a query result according to the unbiased estimation operator calculation, wherein the combined probability statistical method and the large number theorem determine that the unbiased estimation operator is specifically Determining a true value expression including all leaf node information in the specified area, and then sampling all the leaf nodes in the specified area, and determining unbiased by using the sampled leaf node information combined with the large number theorem Estimating the operator to estimate the true value of the true value expression Real value.
  • Embodiment 4 of the present invention further provides a device 60 for querying trajectory data.
  • the device 60 includes: a processor 601, configured to establish time and space for trajectory data in a spatiotemporal database.
  • An index and an inverted index where the inverted index is used to form a first relationship correspondence table including a correspondence relationship between each track and its associated index leaf node, wherein each track and its associated index leaf node
  • the association form includes: the middle part of the track passes through an index leaf node, and the beginning or end of the track is in an index leaf node, and the track is completely in an index leaf node;
  • the receiver 602 is configured to receive a trajectory data query of the user, where the trajectory data query of the user includes: the user specifies a spatial area in the spatiotemporal database, and collects data results in the spatial area; the processor 601 The method further includes: sampling an index leaf node included in the specified spatial region, where determining the number of index leaf nodes in the spatial region and the number of index leaf nodes obtained by sampling; and determining an index leaf node according to the sampling unit sampling And determining, by the first relationship correspondence table, a correspondence between each track included in the sampled index leaf node and an index leaf node associated with the track, to form a second relationship correspondence table; The unbiased estimation operator is determined according to the number of index leaf nodes in the spatial region, the number of index leaf nodes obtained by sampling, and the data in the second relationship correspondence table, and the query result is determined.
  • the trajectory data querying apparatus 60 of the fourth embodiment of the present invention provides a spatiotemporal index and an inverted index for the trajectory data in the spatiotemporal database, wherein the inverted index is used to form an index leaf node including each trajectory associated with the trajectory data.
  • the processor 601 refers to the specified spatial region
  • the included index leaf node performs sampling, wherein the number of index leaf nodes in the spatial region and the number of index leaf nodes obtained by sampling are determined;
  • the index leaf node and the first relationship correspondence table determine a correspondence relationship between each track included in the sampled index leaf node and the index leaf node associated with the track, to form a second relationship correspondence table;
  • the number of index leaf nodes in the spatial region, the number of index leaf nodes obtained by sampling, and the data in the second relationship correspondence table determine the query result.
  • the processor 601 establishes an inverted index in addition to establishing a space-time index, thereby determining, according to the two indexes, the track included in the sampled index leaf node and the index leaf associated with the track.
  • the correspondence between the nodes that is, the second relationship correspondence table is formed; thus, the unbiased estimation can be determined according to the number of index leaf nodes in the spatial region, the number of index leaf nodes obtained by sampling, and the data in the second relationship correspondence table.
  • the operator calculates the result of the query.
  • the foregoing apparatus for establishing a spatiotemporal index and an inverted index and based on the sampling 60 can avoid the problem of scanning all the trajectory data in the spatio-temporal region related to the query, thereby shortening the query time, improving the query efficiency, and saving system resources. And the query result determined by the unbiased estimation operator has higher accuracy.
  • the processor 601 is specifically configured to: determine, by using a space-time index, all index leaf nodes in the spatiotemporal database; based on each track in the database, Determining an index leaf node associated with each track; and a memory 603 for storing a correspondence between each track and its associated index leaf node to form a first relationship correspondence table.
  • the processor 601 is specifically configured to: perform random back sampling on the n index leaf nodes included in the specified spatial region, and obtain B repeatable indexes.
  • the processor 601 is specifically configured to: list, according to the sampled index leaf node, multiple trajectories included in the index leaf node; Acquiring at least one index leaf node associated with each of the plurality of trajectories; and determining whether at least one index leaf node acquired by the acquiring module exists in an index leaf node sampled by the sampling unit, if the result is determined If yes, the index leaf nodes corresponding to the track are reserved, and the corresponding relationship is recorded in the second relationship correspondence table.
  • the processor 602 is specifically configured to: Determining whether there is a recurring trajectory among the plurality of listed trajectories, and if there is a trajectory reappearing therein, the recurring trajectory is not listed, thereby ensuring that a plurality of trajectories are not repeated; and from the Obtaining, in a relationship correspondence table, at least one index leaf node associated with each of the plurality of tracks that are determined by the determining module that are not repeated.
  • the processor 601 is specifically configured to: separately calculate, according to an index leaf node, an index leaf node corresponding to each track in the second relationship correspondence table; The number, the number of index leaf nodes obtained by sampling, the number of trajectories in the second relationship correspondence table, and the number of index leaf nodes corresponding to each trajectory in the space-time region, combined with probability statistical method and large number theorem to determine unbiased
  • the estimation operator determines the query result according to the unbiased estimation operator calculation, wherein the combination probability statistical method and the large number theorem determine that the unbiased estimation operator is specifically determined to include all leaf node information in the specified area a true value expression, then sampling all the leaf nodes in the specified area, and estimating the true value expression by using the sampled leaf node information and determining the unbiased estimation operator in combination with the large number theorem The true value obtained.
  • each structural unit of the trajectory data querying apparatus 60 refers to the first or second method embodiment.
  • a person skilled in the art may understand that all or part of the steps of implementing the above embodiments may be performed by a program to instruct related hardware, and the program may be stored in a computer readable storage medium, and the storage medium may be Is a read-only memory, a disk or a disc, and so on.

Abstract

本发明公开了一种轨迹数据查询的方法及装置,涉及数据库技术领域,能缩短查询轨迹数据的时间。包括:对时空数据库中的轨迹数据建立时空索引和倒排索引,倒排索引用于,形成包含每个轨迹与其相关联的索引叶子节点之间对应关系的第一关系对应表;对用户指定的空间区域所包含的索引叶子节点进行采样,其中确定该空间区域内的索引叶子节点数目和采样得到的索引叶子节点数目;根据采样得到的索引叶子节点和第一关系对应表,确定采样得到的索引叶子节点中包含的每个轨迹与该轨迹相关联的索引叶子节点之间的对应关系,形成第二关系对应表;根据空间区域内和采样得到的索引叶子节点数目,及第二关系对应表中的数据,确定无偏估计算子,计算确定查询结果。

Description

一种轨迹数据查询的方法及装置 技术领域 本发明涉及数据库技术领域, 尤其涉及一种轨迹数据查询的方法及 装置。
背景技术
众所周知, 轨迹包含一连串的地理位置。 然而随着科技的发展, 轨 迹除包含地理位置这个特性外, 还可以包括时间标签。 也就是说, 轨迹 可以由一连串带有时间标签的地理位置组成, 这在理论上可理解为 "在 三维空间中, 一条轨迹由多个包含时间和地理位置的数据构成" 。 而且 这些轨迹的数据可以存放在时空数据库中以便用户查询。 目前, 用户对轨迹数据的查询可以通过时空索引技术实现。 首先, 建立时空索引。 如图 1 所示, 对数据库中的所有轨迹数据划分成小的时 空区域, 每个小的时空区域 (即如图 1 所示的小立方体) 称为一个索引 的叶子节点(index leaf node)。 然后, 当收到用户所要查询的轨迹数据时, 对数据库中相关的时空区域 (即如图 1 所示的大立方体) 内的所有叶子 节点进行扫描并统计, 通过扫描就能得出用户所要查询的轨迹数据的统 计结果。 但是, 上述方式需要对用户所要查询轨迹数据对应的时空区域进行 扫描才能得出用户所需的结果, 当用户所要查询轨迹数据量庞大时, 其 所对应的时空区域也就很庞大, 在扫描这个庞大的时空区域就需要消耗 很长时间。
发明内容 本发明的实施例提供一种轨迹数据查询的方法及装置, 能够极大缩 短查询轨迹数据的时间。 本发明的第一方面, 提供一种轨迹数据查询方法, 该方法包括: 对时空数据库中的轨迹数据建立时空索引和倒排索引 (Inverted Index) , 其中, 所述倒排索引用于, 形成包含每个轨迹与其相关联的索引 叶子节点之间对应关系的第一关系对应表, 其中所述每个轨迹与其相关 联的索引叶子节点的关联形式包括: 所述轨迹的中间部分穿过一个索引 叶子节点, 所述轨迹的始端或末端在一个索引叶子节点中, 所述轨迹完 全在一个索引叶子节点中; 接收用户的轨迹数据查询, 其中所述用户的轨迹数据查询包括, 所 述用户对所述时空数据库中的一个空间区域进行指定, 以统计所述空间 区域内的数据结果; 对所述指定的空间区域所包含的索引叶子节点进行采样, 其中确定 所述空间区域内的索引叶子节点数目 以及采样得到的索引叶子节点数 目;
根据所述采样得到的索引叶子节点以及所述第一关系对应表, 确定 所述采样得到的索引叶子节点中包含的每个轨迹与所述轨迹相关联的索 引叶子节点之间的对应关系, 形成第二关系对应表; 根据所述空间区域内的索引叶子节点数目、 所述采样得到的索引叶 子节点数目以及所述第二关系对应表中的数据, 确定无偏估计算子, 计 算确定查询结果。
在第一方面的第一种可能的实现方式中, 所述形成包含每个轨迹与 其相关联的索引叶子节点之间对应关系的第一关系对应表包括: 通过所述时空索引的方式确定所述时空数据库中的所有索引叶子节 点;
基于所述时空数据库中的每个轨迹, 确定所述每个轨迹相关联的索 引叶子节点; 存储所述每个轨迹与其相关联的索引叶子节点之间的对应关系, 形 成第一关系对应表。 结合第一方面或第一方面的第一种可能的实现方式, 在第一方面的 第二种可能的实现方式中, 所述对所述空间区域所包含的索引叶子节点 进行采样, 其中确定所述空间区域内的索引叶子节点数目以及采样得到 的索引叶子节点数目具体为:
对所述指定的空间区域所包含的 n个索引叶子节点进行有放回式的 随机采样, 得到 B个可重复的索引叶子节点, 其中 n>B , n、 B均为正整 数。 结合第一方面或第一方面的第一种可能的实现方式或第一方面的第 二种可能的实现方式, 在第一方面的第三种可能的实现方式中, 所述根 据所述采样得到的索引叶子节点以及所述第一关系对应表, 确定所述采 样得到的索引叶子节点中包含的每个轨迹与所述轨迹相关联的索引叶子 节点之间的对应关系, 形成第二关系对应表包括: 根据所述采样得到的索引叶子节点, 列出所述索引叶子节点中所包 含的多个轨迹; 从所述第一关系对应表中获取所述多个轨迹中每一个轨迹相关联的 至少一个索引叶子节点;
判断所述至少一个索引叶子节点是否存在于所述采样得到的索引叶 子节点, 若判断结果为存在, 则保留所述轨迹对应的索引叶子节点, 并 将其对应关系记录在第二关系对应表中。 结合第一方面的第三种可能的实现方式, 在第一方面的第四种可能 的实现方式中, 在所述根据所述采样得到的索引叶子节点, 列出所述索 引叶子节点中所包含的多个轨迹之后, 所述方法还包括:
确定所述列出的多个轨迹中是否存在重复出现的轨迹, 若其中有轨 迹再次出现, 则所述再次出现的轨迹不列出, 从而保证得到不重复的多 个轨迹; 此种情况下, 所述从所述第一关系对应表中获取所述多个轨迹中每 一个轨迹相关联的至少一个索引叶子节点具体为: 从所述第一关系对应表中获取所述不重复的多个轨迹中每一个轨迹 相关联的至少一个索引叶子节点。 结合第一方面或第一方面的上述各个可能的实现方式中的任意一种 实现方式, 在第一方面的第五种可能的实现方式中: 所述根据所述空间区域内的索引叶子节点数目、 所述采样得到的索 引叶子节点数目, 以及所述第二关系对应表中的数据, 确定无偏估计算 子, 计算确定查询结果包括: 分别计算所述第二关系对应表中每个轨迹对应的索引叶子节点数 目;
根据所述空间区域内的索引叶子节点数目、 所述采样得到的索引叶 子节点数目、 所述第二关系对应表中的轨迹的数目、 每个所述轨迹在所 述时空区域内对应经过的索引叶子节点的数目, 结合概率统计方法和大 数定理确定无偏估计算子, 根据所述无偏估计算子计算确定查询结果, 其中,所述结合概率统计方法和大数定理确定无偏估计算子具体为, 确定包括所述指定区域内的所有叶子节点信息的真实值表达式, 然后在 所述指定区域内对所述所有叶子节点进行采样, 通过使用采样得到的叶 子节点信息并结合大数定理确定无偏估计算子, 来估计所述真实值表达 式得出的真实值。
结合第一方面的第五种可能的实现方式, 在第一方面的第六种可能 的实现方式中, 当所述用户的轨迹数据查询为查询轨迹数目时, 确定以 下无偏估计算子, 计算确定查询结果:
n B q
其中, ]^ = ^(^) = 5 {l/k^; q表示与用户查询范围相关的时空区 域, n表示采样前时空区域 q内所有的叶子节点数目, B表示采样后的叶 子节点数目, r表示根据 B个索引叶子节点和采样后得到的第二关系对应 表得到的轨迹, k表示轨迹 r在查询的时空区域 q内经过的索引叶子节点 数目。 结合第一方面的第五种可能的实现方式, 在第一方面的第七种可能 的实现方式中, 当所述用户的轨迹数据查询为查询轨迹特性时, 确定以 下无偏估计算子, 计算确定查询结果:
t-i q
其中, hq (R
Figure imgf000006_0001
q表示与用户查询范围相关的时空区域, n 表示采样前时空区域 q 内所有的叶子节点数目, B表示采样后的叶子节 点数目, r表示根据 B个索引叶子节点和采样后得到的第二关系对应表得 到的轨迹, ^表示轨迹 r的轨迹特性, W表示轨迹 r在查询的时空区域 q 内经过的索引叶子节点数目。 结合第一方面的第五种可能的实现方式, 在第一方面的第八种可能 的实现方式中, 当所述用户的轨迹数据查询为查询轨迹特性平均值时, 确定以下无 偏估计算子, 计算确定查询结果:
Figure imgf000007_0001
其中, =
Figure imgf000007_0002
lr/k? ; q表示与用户查询 范围相关的时空区域, n表示采样前时空区域 q内所有的叶子节点数目, B表示采样后的叶子节点数目, r表示根据 B个索引叶子节点和采样后得 到的第二关系对应表得到的轨迹, ^表示轨迹 r的轨迹特性, k表示轨迹 r在查询的时空区域 q内经过的索引叶子节点数目 本发明的第二方面, 提供一种轨迹数据查询装置, 该装置包括: 建立单元, 用于对时空数据库中的轨迹数据建立时空索引和倒排索 引, 其中, 所述倒排索引用于, 形成包含每个轨迹与其相关联的索引叶 子节点之间对应关系的第一关系对应表, 其中所述每个轨迹与其相关联 的索引叶子节点的关联形式包括: 所述轨迹的中间部分穿过一个索引叶 子节点, 所述轨迹的始端或末端在一个索引叶子节点中, 所述轨迹完全 在一个索引叶子节点中; 接收单元, 用于接收用户的轨迹数据查询, 其中所述用户的轨迹数 据查询包括, 所述用户对所述时空数据库中的一个空间区域进行指定, 以统计所述空间区域内的数据结果; 采样单元, 用于对所述指定的的空间区域所包含的索引叶子节点进 行采样, 其中确定所述空间区域内的索引叶子节点数目以及采样得到的 索引叶子节点数目; 确定单元, 用于根据所述采样单元采样得到的索引叶子节点以及所 述第一关系对应表, 确定所述采样得到的索引叶子节点中包含的每个轨 迹与所述轨迹相关联的索引叶子节点之间的对应关系, 形成第二关系对 应表; 以及, 用于根据所述空间区域内的索引叶子节点数目、 所述采样 得到的索引叶子节点数目以及所述第二关系对应表中的数据, 确定无偏 估计算子, 计算确定查询结果。 在第二方面的第一种可能的实现方式中, 所述建立单元具体用于: 通过所述时空索引的方式确定所述时空数据库中的所有索引叶子节 点;
基于所述时空数据库中的每个轨迹, 确定所述每个轨迹相关联的索 引叶子节点; 存储所述每个轨迹与其相关联的索引叶子节点之间的对应关系, 形 成第一关系对应表。
结合第二方面或第二方面的第一种可能的实现方式, 在第二方面的 第二种可能的实现方式中, 所述采样单元具体用于: 对所述指定的空间区域所包含的 n个索引叶子节点进行有放回式的 随机采样, 得到 B个可重复的索引叶子节点, 其中 n>B , n、 B均为正整 数。
结合第二方面或第二方面的第一种可能的实现方式或第二方面的第 二种可能的实现方式, 在第二方面的第三种可能的实现方式中, 所述确 定单元包括: 确定模块, 用于根据所述采样得到的索引叶子节点, 列出所述索引 叶子节点中所包含的多个轨迹; 获取模块, 用于从所述第一关系对应表中获取所述多个轨迹中每一 个轨迹相关联的至少一个索引叶子节点; 判断模块, 用于判断所述获取模块获取的至少一个索引叶子节点是 否存在于所述采样单元采样得到的索引叶子节点, 若判断结果为存在, 则保留所述轨迹对应的索引叶子节点, 并将其对应关系记录在第二关系 对应表中。 结合第二方面的第三种可能的实现方式, 在第二方面的第四种可能 的实现方式中, 所述确定模块还用于: 确定所述列出的多个轨迹中是否存在重复出现的轨迹, 若其中有轨 迹再次出现, 则所述再次出现的轨迹不列出, 从而保证得到不重复的多 个轨迹; 此种情况下, 所述获取模块具体用于: 从所述第一关系对应表中获取所述确定模块确定的不重复的多个轨 迹中每一个轨迹相关联的至少一个索引叶子节点。
结合第二方面或第二方面的上述各个可能的实现方式中的任意一种 实现方式, 在第二方面的第五种可能的实现方式中, 所述确定单元具体 用于:
分别计算所述第二关系对应表中每个轨迹对应的索引叶子节点数 目;
根据所述空间区域内的索引叶子节点数目、 所述采样得到的索引叶 子节点数目、 所述第二关系对应表中的轨迹的数目、 每个所述轨迹在所 述时空区域内对应经过的索引叶子节点的数目, 结合概率统计方法和大 数定理确定无偏估计算子, 根据所述无偏估计算子计算确定查询结果, 其中,所述结合概率统计方法和大数定理确定无偏估计算子具体为, 确定包括所述指定区域内的所有叶子节点信息的真实值表达式, 然后在 所述指定区域内对所述所有叶子节点进行采样, 通过使用采样得到的叶 子节点信息并结合大数定理确定无偏估计算子, 来估计所述真实值表达 式得出的真实值。 本发明的第三方面, 提供一种轨迹数据查询装置, 该装置包括: 处理器,用于对时空数据库中的轨迹数据建立时空索引和倒排索引, 其中, 所述倒排索引用于, 形成包含每个轨迹与其相关联的索引叶子节 点之间对应关系的第一关系对应表, 其中所述每个轨迹与其相关联的索 引叶子节点的关联形式包括: 所述轨迹的中间部分穿过一个索引叶子节 点, 所述轨迹的始端或末端在一个索引叶子节点中, 所述轨迹完全在一 个索引叶子节点中; 接收器, 用于接收用户的轨迹数据查询, 其中所述用户的轨迹数据 查询包括, 所述用户对所述时空数据库中的一个空间区域进行指定, 并 统计所述空间区域内的数据结果; 所述处理器还用于, 对所述指定的的空间区域所包含的索引叶子节 点进行采样, 其中确定所述空间区域内的索引叶子节点数目以及采样得 到的索引叶子节点数目; 根据所述采样单元采样得到的索引叶子节点以 及所述第一关系对应表, 确定所述采样得到的索引叶子节点中包含的每 个轨迹与所述轨迹相关联的索引叶子节点之间的对应关系, 形成第二关 系对应表; 以及, 用于根据所述空间区域内的索引叶子节点数目、 所述 采样得到的索引叶子节点数目以及所述第二关系对应表中的数据, 确定 无偏估计算子, 计算确定查询结果。
在第三方面的第一种可能的实现方式中, 所述处理器具体用于: 通过所述时空索引的方式确定所述时空数据库中的所有索引叶子节 点;
基于所述时空数据库中的每个轨迹, 确定所述每个轨迹相关联的索 引叶子节点;
存储所述每个轨迹与其相关联的索引叶子节点之间的对应关系, 形 成第一关系对应表。
结合第三方面或第三方面的第一种可能的实现方式, 在第三方面的 第二种可能的实现方式中, 所述处理器具体用于: 对所述指定的空间区域所包含的 n个索引叶子节点进行有放回式的 随机采样, 得到 B个可重复的索引叶子节点, 其中 n>B , n、 B均为正整 数。
结合第三方面或第三方面的第一种可能的实现方式或第三方面的第 二种可能的实现方式, 在第三方面的第三种可能的实现方式中, 所述处 理器具体用于: 根据所述采样得到的索引叶子节点, 列出所述索引叶子节点中所包 含的多个轨迹; 从所述第一关系对应表中获取所述多个轨迹中每一个轨迹相关联的 至少一个索引叶子节点; 以及 判断所述获取模块获取的至少一个索引叶子节点是否存在于所述采 样单元采样得到的索引叶子节点, 若判断结果为存在, 则保留所述轨迹 对应的索引叶子节点, 并将其对应关系记录在第二关系对应表中。 结合第三方面的第三种可能的实现方式, 在第三方面的第四种可能 的实现方式中, 所述处理器具体用于: 确定所述列出的多个轨迹中是否存在重复出现的轨迹, 若其中有轨 迹再次出现, 则所述再次出现的轨迹不列出, 从而保证得到不重复的多 个轨迹; 以及 从所述第一关系对应表中获取所述确定模块确定的不重复的多个轨 迹中每一个轨迹相关联的至少一个索引叶子节点。 结合第三方面或第三方面的上述各个可能的实现方式中的任意一种 实现方式, 在第三方面的第五种可能的实现方式中, 所述处理器具体用 于:
分别计算所述第二关系对应表中每个轨迹对应的索引叶子节点数 目; 以及
根据所述空间区域内的索引叶子节点数目、 所述采样得到的索引叶 子节点数目、 所述第二关系对应表中的轨迹数目、 所述每个轨迹在所述 时空区域内对应经过的索引叶子节点的数目, 结合概率统计方法和大数 定理确定无偏估计算子, 根据所述无偏估计算子计算确定查询结果, 其中,所述结合概率统计方法和大数定理确定无偏估计算子具体为, 确定包括所述指定区域内的所有叶子节点信息的真实值表达式, 然后在 所述指定区域内对所述所有叶子节点进行采样, 通过使用采样得到的叶 子节点信息并结合大数定理确定无偏估计算子, 来估计所述真实值表达 式得出的真实值。
本发明提供的轨迹数据查询的方法及装置, 对时空数据库中的轨迹 数据建立时空索引和倒排索引; 其中所述倒排索引用于, 形成包含每个 轨迹与其相关联的索引叶子节点之间对应关系的第一关系对应表; 接下 来, 接收用户的轨迹数据查询, 其中所述用户的轨迹数据查询包括, 所 述用户对所述时空数据库中的一个空间区域进行指定, 对该指定的空间 区域所包含的索引叶子节点进行采样, 其中确定所述空间区域内的索引 叶子节点数目以及采样得到的索引叶子节点数目; 并根据采样得到的索 引叶子节点以及第一关系对应表, 确定采样得到的索引叶子节点中包含 的每个轨迹与所述轨迹相关联的索引叶子节点之间的对应关系, 形成第 二关系对应表; 然后, 根据空间区域内的索引叶子节点数目、 采样得到 的索引叶子节点数目 以及第二关系对应表中的数据, 确定查询结果。 从 上可看出, 除建立时空索引外本发明还建立了倒排索引, 由此可根据这 两个索引确定采样后的索引叶子节点所包含的轨迹和该轨迹相关联的索 引叶子节点之间的对应关系, 也即形成了第二关系对应表; 从而可根据 空间区域内的索引叶子节点数目、 采样得到的索引叶子节点数目以及第 二关系对应表中的数据, 确定无偏估计算子, 计算确定查询结果。 这种 通过建立时空索引和倒排索引、 基于采样的方式, 能够避免在查询相关 的时空区域内扫描所有轨迹数据的问题, 从而缩短了查询时间, 提高了 查询效率, 节约了系统资源。 并且通过无偏估计算子计算确定的查询结 果具有较高的准确率。
附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将 对实施例或现有技术描述中所需要使用的附图作简单地介绍, 显而易见 地, 下面描述中的附图仅仅是本发明的一些实施例, 对于本领域普通技 术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附图获得 其他的附图。 图 1为现有技术建立时空索引的示例性示意图; 图 2为本发明实施例一提供的轨迹数据查询的方法的一种流程示意 图;
图 3为本发明实施例二提供的轨迹数据查询的方法的一种流程示意 图;
图 4为为本发明实施例三提供的轨迹数据查询的装置的一种结构示 意图; 图 5为本发明实施例三提供的轨迹数据查询的装置的另一种结构示 意图; 图 6为本发明实施例四提供的轨迹数据查询的装置的一种结构示意 图;
图 7为本发明实施例四提供的轨迹数据查询的装置的另一种结构示 意图。
具体实施方式 下面将结合本发明实施例中的附图, 对本发明实施例的技术方案进 行清楚、 完整地描述, 显然, 所描述的实施例仅仅是本发明的一部分实 施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通技术 人员在没有做出创造性劳动的前提下所获得的所有其它实施例, 都属于 本发明保护的范围。 首先需要说明的是, 在时空数据库中存在多个时空点, 该时空点具 有时间、 经度、 纬度的时空信息, 同时该时空点还具有标识信息, 这样, 具有相同标识信息的时空点可形成一条轨迹。 另外, 在时空数据库中还 存在索引叶子节点, 索引叶子节点为人为规定的最小单位的空间区域, 该索引叶子节点包括时间范围内的多个时空点。 由于时空点具有时间、 经度、 纬度的时空信息, 因此索引叶子节点也具有这样的时空信息。 本发明实施例一提供了一种轨迹数据查询的方法, 如图 2所示, 该 方法包括以下步骤:
S 1 1 , 对时空数据库中的轨迹数据建立时空索引和倒排索引, 其中, 倒排索引用于, 形成包含每个轨迹与其相关联的索引叶子节点之间对应 关系的第一关系对应表。 此步骤中, "每个轨迹与其相关联的索引叶子节点" 的关联形式可 包括以下三种形式: 第一种形式, 一条轨迹穿过一个索引叶子节点, 也 即该条轨迹的中间部分在该索引叶子节点中; 第二种形式, 一条轨迹的 始端或末端在一个索引叶子节点中; 第三种形式, 一条轨迹完全在一个 索引叶子节点中。
此步骤中, 由于轨迹数据具有时间和空间的特性, 因此在查询轨迹 数据前需要建立索引。 现有技术中仅建立空间索引, 用于确定所述数据 库中的所有索引叶子节点。 其中建立索引的方法可采用例如 Quad-tree, B-tee, B+-tree等方法。 但在本发明中, 除建立空间索引外, 还建立了倒 排索引。 该倒排索引用于形成包含每个轨迹与其相关联的索引叶子节点 之间对应关系的第一关系对应表。 可选地, 在本发明一个具体实施例中, 建立倒排索引以形成包含每 个轨迹与其相关联的索引叶子节点之间对应关系的第一关系对应表的步 骤可分为以下步骤:
1 1 1 , 通过时空索引的方式确定数据库中的所有索引叶子节点;
1 12 , 基于时空数据库中的每个轨迹, 确定所述每个轨迹相关联的索 引叶子节点;
可理解的, 时空数据库中的每个轨迹可以跨越至少一个索引叶子节 点, 而且一般情况下, 一个轨迹不能够跨越时空数据库中的所有索引叶 子节点, 因此需要确定每个轨迹相关联的索引叶子节点。
1 13 , 存储所述每个轨迹与其相关联的索引叶子节点之间的对应关 系, 形成第一关系对应表。 在步骤 1 13中, 每个索引叶子节点还具有 ID信息。 也即, 可对每个 索引叶子节点设定对应的 ID ( Identity, 身份标识) , 因此在第一关系对 应表中, 每个轨迹与其相关联的索引叶子节点之间的对应关系具体为, 每个轨迹与其相关联的至少一个索引叶子节点的 ID之间存在对应关系。 需要说明的是, 通过上述建立倒排索引能够地得到时空数据库中的 每个轨迹与其相关联的索引叶子节点之间的对应关系。 可理解地,上述的空间索引和倒排索引不会在每次查询前重新建立。 也即, 空间索引和倒排索引一旦建立后, 将其建立的索引数据进行存储。 该存储数据可应用于多次查询, 从而节省了查询时间。 当然, 本领域技 术人员可根据经验定期更新建立该空间索引和倒排索引, 本发明在此不 做限定。
S 12 , 接收用户的轨迹数据查询, 其中用户的轨迹数据查询包括, 用 户对时空数据库中的一个空间区域进行指定, 以统计该空间区域内的数 据结果。 此步骤中, 用户的轨迹数据查询通常包括查询范围和查询目的。 举 例而言, 如果用户的轨迹数据查询为 "在 2013年期间北京市范围内的出 租车载客轨迹的数目" , 则其中的 "2013 年期间" 、 "北京市范围内" 为查询范围; 其中的 "出租车载客轨迹的数目 " 为查询目的。 可理解的, 当用户给出一个查询范围时, 也即指定了对时空数据库中的的某个空间 区域进行查询。
513 , 对指定的空间区域所包含的索引叶子节点进行采样, 其中确定 该空间区域内的索引叶子节点数目以及采样得到的索引叶子节点数目。 可选地, 在本发明一个具体实施例中, 步骤 S 13具体包括: 对所述确定的空间区域所包含的 n个索引叶子节点进行有放回式的 随机采样, 得到 B个可重复的索引叶子节点, 其中 n>B , n、 B均为正整 数。 由此, 每次采样得到的索引叶子节点被记录后, 再放回原来所在的 空间区域中, 从而每次采样时空间区域中的索引叶子节点总是为 n个。 其中, 采样方法可以是任何采样算法, 除了本发明实施例中的有放 回式的随机采样, 还可以采用其它采样方式, 例如有放回式的有偏采样、 或不放回式的有偏采样等。
514 , 根据采样得到的索引叶子节点以及第一关系对应表, 确定采样 得到的索引叶子节点中包含的每个轨迹与所述轨迹相关联的索引叶子节 点之间的对应关系, 形成第二关系对应表。 其中, 需注意的是, 在本发明实施例中, 第二关系对应表是动态形 成的。 也即, 当用户对轨迹数据进行不同的查询时, 则所生成第二关系 对应表的内容也是不同的。 由此可理解, 本发明实施例侧重于如何生成 第二关系对应表, 而不是第二关系对应表本身。
可选地, 在本发明一个具体实施例中, 步骤 S 14具体包括:
141 , 根据采样得到的索引叶子节点, 列出所述索引叶子节点中所包 含的多个轨迹;
142 ,从所述第一关系对应表中获取多个轨迹中每一个轨迹相关联的 至少一个索引叶子节点;
143 ,判断所述至少一个索引叶子节点是否存在于所述采样得到的索 引叶子节点, 若判断结果为存在, 则保留所述轨迹对应的索引叶子节点, 并将其对应关系记录在第二关系对应表中。 需说明的是, 从第一关系对应表中获取多个轨迹中每一个轨迹相关 联的至少一个索引叶子节点, 其中该索引叶子节点可能位于所述时空区 域内, 也可能位于所述时空区域之外, 经过上述判断过程, 则仅仅保留 了在所述时空区域内的索引叶子节点。 进一步地, 在本发明的一个具体实施例中, 在上述步骤 141之后, 还可包括以下步骤: 确定所列出的多个轨迹中是否存在重复出现的轨迹, 若其中有轨迹 再次出现, 则所述再次出现的轨迹不列出, 从而保证得到不重复的多个 轨迹; 这种情况下, 步骤 142具体为: 从所述第一关系对应表中获取所述 不重复的多个轨迹中每一个轨迹相关联的至少一个索引叶子节点。
需说明的是, 通过以上将重复轨迹剔除的步骤可以减少步骤 143 中 "至少一个索引叶子节点是否存在于所述采样得到的索引叶子节点" 的 判断次数, 从而缩短判断时间, 提高效率。
S 15 , 根据空间区域内的索引叶子节点数目、 采样得到的索引叶子节 点数目, 以及所述第二关系对应表中的数据, 确定无偏估计算子, 计算 确定查询结果。
可选地, 在本发明的一个具体实施例中, 步骤 S 15具体包括:
151 ,分别计算所述第二关系对应表中每个轨迹对应的索引叶子节点 数目;
152 , 根据空间区域内的索引叶子节点数目、 采样得到的索引叶子节 点数目、 第二关系对应表中的轨迹的数目、 每个所述轨迹在所述时空区 域内对应经过的索引叶子节点的数目, 结合概率统计方法和大数定理确 定无偏估计算子, 根据所述无偏估计算子计算确定查询结果。 其中, "结 合概率统计方法和大数定理确定无偏估计算子" 具体分为以下步骤: 首 先, 确定包括所述指定区域内的所有叶子节点信息的真实值表达式; 然 后, 在所述指定区域内对所述所有叶子节点进行采样, 通过使用采样得 到的叶子节点信息并结合大数定理确定无偏估计算子, 来估计所述真实 值表达式得出的真实值。 需说明的是, 无偏估计算子可如上述步骤预先确定, 一旦无偏估计 算子被确定下来, 则可直接应用于以后相同或类似的查询。 当步骤 152 中的公式采用无偏估计计算时, 经发明人试验证明, 利 用采样的轨迹数据确定的查询结果的准确率达到 95%以上, 因此, 采样 数据通过无偏估计确定查询结果具有较高的准确率。 可理解的, 本发明实施例也可采用有偏估计或其它估计算子, 对此 本发明不做具体限定。
可选地, 在本发明的一个具体实施例中, 当用户的轨迹数据的查询 为查询轨迹数目 (Count Query ) 时, 确定以下无偏估计算子, 计算确定 查询结果:
∑fq(Rt ) ;
其中,
Figure imgf000017_0001
其中, q表示与用户查询范围相关的时空区域; n表示采样前时空区 域 q 内所有的索引叶子节点数目; B表示采样后的索引叶子节点数目, 特别地, 当采样方式为放回式的随机采样时, 这 B个叶子节点是可以有 重复的, 也即每个采样的叶子节点都是独立的从 q 中的所有叶子节点中 随机选取的; r表示根据 B个索引叶子节点和采样后得到的第二关系对应 表得到的轨迹; 1 ^表示轨迹 r在查询的时空区域 q内经过的索引叶子节点 数目。
可选地, 在本发明的一个具体实施例中, 当用户的轨迹数据的查询 为查询轨迹特性(Sum Query)时, 确定以下无偏估计算子, 计算确定查询 结果:
其中
Figure imgf000017_0002
其中, q表示与用户查询范围相关的时空区域; n表示采样前时空区 域 q 内所有的叶子节点数目; B表示采样后的叶子节点数目, 特别地, 当采样方式为放回式的随机采样时, 这 B个叶子节点是可以有重复的, 也即每个采样的叶子节点都是独立的从 q 中的所有叶子节点中随机选取 的; r表示根据 B个索引叶子节点和采样后得到的第二关系对应表得到的 轨迹; ^表示轨迹 r的轨迹特性, 该轨迹特性例如公里数, 跨越街区的数 目, 经历时长, 等等轨迹的统计特性等; k表示轨迹 r在查询的时空区域 q内经过的索引叶子节点数目。
可选地, 在本发明的一个具体实施例中, 当用户的轨迹数据的查询 为查询轨迹特性平均值 (Average Query ) 时, 确定以下无偏估计算子, 计算确定查询结果: ; ( 3 )
其中, = fq(^) =∑r k }, Κ^ = Σ^λ . 其中, q表示与用户查询范围相关的时空区域; n表示采样前时空区 域 q 内所有的叶子节点数目; B表示采样后的叶子节点数目, 特别地, 当采样方式为放回式的随机采样时, 这 B个叶子节点是可以有重复的, 也即每个采样的叶子节点都是独立的从 q 中的所有叶子节点中随机选取 的; r表示根据 B个索引叶子节点和采样后得到的第二关系对应表得到的 轨迹; ^表示轨迹 r的轨迹特性, 例如公里数, 跨越街区的数目, 经历时 长等轨迹的统计特性; krq表示轨迹 r在查询的时空区域 q内经过的索引叶 子节点数目。 本发明实施例一提供的轨迹数据查询的方法, 对时空数据库中的轨 迹数据建立时空索引和倒排索引, 其中所述倒排索引用于, 形成包含每 个轨迹与其相关联的索引叶子节点之间对应关系的第一关系对应表; 接 下来, 接收用户的轨迹数据查询, 其中用户的轨迹数据查询包括, 用户 对所述时空数据库中的一个空间区域进行指定, 然后对该指定的空间区 域所包含的索引叶子节点进行采样, 其中确定该空间区域内的索引叶子 节点数目以及采样得到的索引叶子节点数目; 并根据采样得到的索引叶 子节点以及第一关系对应表, 确定采样得到的索引叶子节点中包含的每 个轨迹与所述轨迹相关联的索引叶子节点之间的对应关系, 形成第二关 系对应表; 然后, 根据空间区域内的索引叶子节点数目、 采样得到的索 引叶子节点数目以及第二关系对应表中的数据, 确定无偏估计算子, 计 算确定查询结果。 从上可看出, 除建立时空索引外本发明还建立了倒排 索引, 由此可根据这两个索引确定采样后的索引叶子节点所包含的轨迹 和该轨迹相关联的索引叶子节点之间的对应关系, 也即形成了第二关系 对应表; 从而可根据空间区域内的索引叶子节点数目、 采样得到的索引 叶子节点数目以及第二关系对应表中的数据, 确定查询结果。 这种通过 建立时空索引和倒排索引、 基于采样的方式, 能够避免在查询相关的时 空区域内扫描所有轨迹数据的问题, 从而缩短了查询时间, 提高了查询 效率, 节约了系统资源。 并且通过无偏估计算子计算确定的查询结果具 有较高的准确率。 需要说明的是, 本发明实施例的应用场景不仅限于从时空数据库中 查询一些轨迹数据, 也可应用于与轨迹数据查询相关的场景。 举例而言, 当运营商想利用轨迹数据给其它行业实体店, 例如麦当劳, 提供店铺选 址服务。 如果麦当劳要求店铺开在人流量最大的地方, 则可以通过我们 的快速轨迹查询, 迅速选出若干目标区域, 给店铺选址做建议规划。 另 外, 交通规划部门可以基于城市出租车轨迹数据, 查询城市各个时空区 域的打车需求分布, 从而找出哪里该修建出租车停靠站。
实施例二 为了本领域技术人员更好的理解本发明实施例提供的轨迹数据查询 查询为轨迹数目为例进行详细说明。 当用户下发的轨迹数据查询为 "查询北京市朝阳区 2013年所有出租 车载客轨迹的数目 " 时, 其中 "出租车载客轨迹的数目 " 为查询目的, 而 "北京市朝阳区 2013年" 为查询范围, 该查询对应时空数据库中一个 特定的时空区域。 如图 3所示, 具体进行以下步骤:
1000、 对存储有出租车轨迹数据的数据库预先建立的时空索引和倒 排索引;
其中, 建立空间索引, 用于确定所述数据库中的所有索引叶子节点; 建立倒排索引, 用于形成包含每个轨迹与其相关联的索引叶子节点 ID之 间对应关系的第一关系对应表。
1001 , 根据所接收的轨迹数据查询范围, 在存储有出租车轨迹数据 的数据库中找到与 "北京市朝阳区 2013年" 相关的时空区域 q;
1002 , 计算该时空区域 q内所有的索引叶子节点数目 n;
1003 , 针对该时空区域内的所有索引叶子节点进行有放回式的随机 采样, 得到采样后的可重复的索引叶子节点数目 B , 其中 n>B , n、 B均 为正整数; 其中, 由于为放回式的随机采样, 因此这 B个叶子节点是可以有重 复的, 也即每个采样的叶子节点都是独立的从 q 中的所有叶子节点中随 机选取的。 此外, 索引叶子节点数目可由本领域技术人员根据实际情况 灵活设定, 本发明在此不做限定。
1004 , 根据采样得到的索引叶子节点, 列出每一个索引叶子节点中 所包含的多个轨迹;
1005 , 确定所列出的多个轨迹中是否存在重复出现的轨迹, 若其中 有轨迹再次出现, 则所述再次出现的轨迹不列出, 从而得到不重复的多 个轨迹;
1006 , 从建立好的第一关系对应表中获取所述不重复的多个轨迹中 每一个轨迹相关联的至少一个索引叶子节点的 ID;
1007 ,将至少一个索引叶子节点的 ID与采样得到的索引叶子节点的 ID相比较, 若比较结果相同, 则保留所述轨迹对应的索引叶子节点, 并 将其对应关系记录在第二关系对应表中;
1008 , 分别计算所述第二关系对应表中每个轨迹对应的索引叶子节 点数目, 得到 k ;
1009 , 将上述各个参数代入上述公式( 1 )得出计算结果, 该计算结 果即为用户此次查询的结果。 通过上述步骤, 能够在极短时间内得出查询结果, 从而提高了查询 效率, 并节约了系统资源。
另外, 当轨迹数据的查询目的为轨迹特性查询时, 举例而言, 当查 询为"查询北京市朝阳区 2013年所有出租车载客轨迹的行驶距离总里程 " 时, 在上述步骤 1000-1009的基础上, 再计算第二关系对应表中每个轨迹 对应的公里数, 即可应用公式 (2 ) 得出用户所要查询的结果。 以及, 当轨迹数据的查询目的为轨迹特性平均值查询时, 举例而言, 当查询为 "查询北京市朝阳区 2013年所有出租车载客轨迹的平均速度" 时, 在上述步骤 1000-1009的基础上, 再计算第二关系对应表中每个轨迹 对应的公里数, 以及应用公式 (3 ) 即可得出用户所要查询的结果。 实施例三 相应地, 本发明的实施例三还提供了一种轨迹数据查询的装置 40 , 如图 4所示, 该装置 40包括: 建立单元 401 , 用于对数据库中的轨迹数据建立时空索引和倒排索 引, 其中, 所述倒排索引用于, 形成包含每个轨迹与其相关联的索引叶 子节点之间对应关系的第一关系对应表, 其中每个轨迹与其相关联的索 引叶子节点的关联形式包括: 轨迹的中间部分穿过一个索引叶子节点, 轨迹的始端或末端在一个索引叶子节点中, 轨迹完全在一个索引叶子节 点中;
接收单元 402 , 用于接收用户的轨迹数据查询, 其中用户的轨迹数 据查询包括, 用户对时空数据库中的一个空间区域进行指定, 以统计所 述空间区域内的数据结果; 采样单元 403 , 用于对指定的空间区域所包含的索引叶子节点进行 采样, 其中确定所述空间区域内的索引叶子节点数目以及采样得到的索 引叶子节点数目;
确定单元 404 , 用于根据采样单元 403 采样得到的索引叶子节点以 及所述第一关系对应表, 确定所述采样得到的索引叶子节点中包含的每 个轨迹与所述轨迹相关联的索引叶子节点之间的对应关系, 形成第二关 系对应表; 以及, 用于根据空间区域内的索引叶子节点数目、 采样得到 的索引叶子节点数目以及所述第二关系对应表中的数据, 确定无偏估计 算子, 计算确定查询结果。 本发明实施例三提供的轨迹数据查询的装置 40 , 建立单元 401对时 空数据库中的轨迹数据建立时空索引和倒排索引, 其中所述倒排索引用 于, 形成包含每个轨迹与其相关联的索引叶子节点之间对应关系的第一 关系对应表; 接收单元 402接收的轨迹数据查询, 其中所述用户的轨迹 数据查询包括用户对时空数据库中的一个空间区域进行指定, 采样单元 403对指定的空间区域所包含的索引叶子节点进行采样,其中确定该空间 区域内的索引叶子节点数目以及采样得到的索引叶子节点数目; 确定单 元 404根据采样单元 403采样得到的索引叶子节点以及第一关系对应表, 确定采样得到的索引叶子节点中包含的每个轨迹与所述轨迹相关联的索 引叶子节点之间的对应关系, 形成第二关系对应表; 以及确定单元 404 还根据空间区域内的索引叶子节点数目、 采样得到的索引叶子节点数目 以及第二关系对应表中的数据, 确定无偏估计算子, 计算确定查询结果。 从上可看出, 建立单元 401除建立时空索引外本发明还建立了倒排索引, 由此确定单元 404 可根据这两个索引确定采样后的索引叶子节点所包含 的轨迹和该轨迹相关联的索引叶子节点之间的对应关系, 也即形成了第 二关系对应表; 从而确定单元 404 可根据空间区域内的索引叶子节点数 目、 采样得到的索引叶子节点数目以及第二关系对应表中的数据, 确定 无偏估计算子, 计算确定查询结果。 这种上述建立时空索引和倒排索引 并基于采样的装置 40 , 能够避免在查询相关的时空区域内扫描所有轨迹 数据的问题, 从而缩短了查询时间, 提高了查询效率, 节约了系统资源。 并且通过无偏估计算子计算确定的查询结果具有较高的准确率。 可选地, 在本发明的一个具体实施例中, 建立单元 401具体用于: 通过时空索引的方式确定所述时空数据库中的所有索引叶子节点; 基于时空数据库中的每个轨迹, 确定所述每个轨迹相关联的索引叶 子节点;
存储所述每个轨迹与其相关联的索引叶子节点之间的对应关系, 形 成第一关系对应表。 可选地, 在本发明的一个具体实施例中, 采样单元 403具体用于: 对指定的空间区域所包含的 n个索引叶子节点进行有放回式的随机 采样, 得到 B个可重复的索引叶子节点, 其中 n>B , n、 B均为正整数。 可选地, 在本发明的一个具体实施例中, 如图 5所示, 确定单元 404 包括: 确定模块 4041 , 用于根据所述采样得到的索引叶子节点, 列出所述 索引叶子节点中所包含的多个轨迹;
获取模块 4042 , 用于从所述第一关系对应表中获取所述多个轨迹中 每一个轨迹相关联的至少一个索引叶子节点; 判断模块 4043 , 用于判断所述获取模块获取的至少一个索引叶子节 点是否存在于所述采样单元采样得到的索引叶子节点, 若判断结果为存 在, 则保留所述轨迹对应的索引叶子节点, 并将其对应关系记录在第二 关系对应表中。 进一步地, 在本发明的一个具体实施例中, 确定模块 4041还用于: 确定所述列出的多个轨迹中是否存在重复出现的轨迹, 若其中有轨 迹再次出现, 则所述再次出现的轨迹不列出, 从而保证得到不重复的多 个轨迹; 此种情况下, 获取模块 4042具体用于: 从第一关系对应表中获取所述确定模块确定的不重复的多个轨迹中 每一个轨迹相关联的至少一个索引叶子节点。 可选地, 在本发明的一个具体实施例中, 确定单元 404具体用于: 分别计算所述第二关系对应表中每个轨迹对应的索引叶子节点数 目;
根据空间区域内的索引叶子节点数目、 采样得到的索引叶子节点数 目、 所述第二关系对应表中的轨迹的数目、 每个所述轨迹在所述时空区 域内对应经过的索引叶子节点的数目, 结合概率统计方法和大数定理确 定无偏估计算子, 根据所述无偏估计算子计算确定查询结果, 其中, 所 述结合概率统计方法和大数定理确定无偏估计算子具体为, 确定包括所 述指定区域内的所有叶子节点信息的真实值表达式, 然后在所述指定区 域内对所述所有叶子节点进行采样, 通过使用采样得到的叶子节点信息 并结合大数定理确定无偏估计算子, 来估计所述真实值表达式得出的真 实值。
需要说明的是,本发明实施例三提供的轨迹数据查询装置 40的各结 构单元的具体功能请参见前文方法实施例一或二。 实施例四 相应地, 本发明的实施例四还提供了一种轨迹数据查询的装置 60 , 如图 6所示, 该装置 60包括: 处理器 601 , 用于对时空数据库中的轨迹数据建立时空索引和倒排 索引, 其中, 所述倒排索引用于, 形成包含每个轨迹与其相关联的索引 叶子节点之间对应关系的第一关系对应表, 其中每个轨迹与其相关联的 索引叶子节点的关联形式包括: 轨迹的中间部分穿过一个索引叶子节点, 所述轨迹的始端或末端在一个索引叶子节点中, 轨迹完全在一个索引叶 子节点中;
接收器 602 , 用于接收用户的轨迹数据查询, 其中用户的轨迹数据 查询包括, 用户对所述时空数据库中的一个空间区域进行指定, 并统计 该空间区域内的数据结果; 所述处理器 601还用于, 对指定的空间区域所包含的索引叶子节点 进行采样, 其中确定所述空间区域内的索引叶子节点数目以及采样得到 的索引叶子节点数目; 根据所述采样单元采样得到的索引叶子节点以及 所述第一关系对应表, 确定所述采样得到的索引叶子节点中包含的每个 轨迹与所述轨迹相关联的索引叶子节点之间的对应关系, 形成第二关系 对应表; 以及, 用于根据空间区域内的索引叶子节点数目、 采样得到的 索引叶子节点数目以及第二关系对应表中的数据, 确定无偏估计算子, 计算确定查询结果。 本发明实施例四提供的轨迹数据查询装置 60 , 处理器 601对时空数 据库中的轨迹数据建立时空索引和倒排索引, 其中倒排索引用于, 形成 包含每个轨迹与其相关联的索引叶子节点之间对应关系的第一关系对应 表; 当接收器 602接收轨迹数据查询, 其中用户的轨迹数据查询包括用 户对所述时空数据库中的一个空间区域进行指定时, 处理器 601 对指定 的空间区域所包含的索引叶子节点进行采样, 其中确定该空间区域内的 索引叶子节点数目以及采样得到的索引叶子节点数目; 并根据采样得到 的索引叶子节点以及第一关系对应表, 确定采样得到的索引叶子节点中 包含的每个轨迹与所述轨迹相关联的索引叶子节点之间的对应关系, 形 成第二关系对应表; 以及还根据空间区域内的索引叶子节点数目、 采样 得到的索引叶子节点数目以及第二关系对应表中的数据, 确定查询结果。 从上可看出, 处理器 601 除建立时空索引外本发明还建立了倒排索引, 由此可根据这两个索引确定采样后的索引叶子节点所包含的轨迹和该轨 迹相关联的索引叶子节点之间的对应关系, 也即形成了第二关系对应表; 从而可根据空间区域内的索引叶子节点数目、 采样得到的索引叶子节点 数目以及第二关系对应表中的数据, 确定无偏估计算子, 计算确定查询 结果。 上述建立时空索引和倒排索引并基于采样的装置 60 , 能够避免在 查询相关的时空区域内扫描所有轨迹数据的问题, 从而缩短了查询时间, 提高了查询效率, 节约了系统资源。 并且通过无偏估计算子计算确定的 查询结果具有较高的准确率。 可选地, 在本发明的一个具体实施例中, 如图 7 所示, 处理器 601 具体用于: 通过时空索引的方式确定时空数据库中的所有索引叶子节点; 基于 数据库中的每个轨迹, 确定所述每个轨迹相关联的索引叶子节点; 以及, 存储器 603 , 用于存储每个轨迹与其相关联的索引叶子节点之间的 对应关系, 形成第一关系对应表。 可选地, 在本发明的一个具体实施例中, 处理器 601具体用于: 对指定的空间区域所包含的 n个索引叶子节点进行有放回式的随机 采样, 得到 B个可重复的索引叶子节点, 其中 n>B , n、 B均为正整数。 可选地, 在本发明的一个具体实施例中, 处理器 601具体用于: 根据采样得到的索引叶子节点, 列出所述索引叶子节点中所包含的 多个轨迹; 从第一关系对应表中获取所述多个轨迹中每一个轨迹相关联 的至少一个索引叶子节点; 以及判断所述获取模块获取的至少一个索引 叶子节点是否存在于所述采样单元采样得到的索引叶子节点, 若判断结 果为存在, 则保留所述轨迹对应的索引叶子节点, 并将其对应关系记录 在第二关系对应表中。 可选地, 在本发明的一个具体实施例中, 处理器 602具体用于: 确定所述列出的多个轨迹中是否存在重复出现的轨迹, 若其中有轨 迹再次出现, 则所述再次出现的轨迹不列出, 从而保证得到不重复的多 个轨迹; 以及从所述第一关系对应表中获取所述确定模块确定的不重复 的多个轨迹中每一个轨迹相关联的至少一个索引叶子节点。 可选地, 在本发明的一个具体实施例中, 处理器 601具体用于: 分别计算所述第二关系对应表中每个轨迹对应的索引叶子节点数 目; 以及根据空间区域内的索引叶子节点数目、 采样得到的索引叶子节 点数目、 第二关系对应表中的轨迹的数目、 每个轨迹在所述时空区域内 对应经过的索引叶子节点的数目, 结合概率统计方法和大数定理确定无 偏估计算子, 根据所述无偏估计算子计算确定查询结果, 其中, 所述结 合概率统计方法和大数定理确定无偏估计算子具体为, 确定包括所述指 定区域内的所有叶子节点信息的真实值表达式, 然后在所述指定区域内 对所述所有叶子节点进行采样, 通过使用采样得到的叶子节点信息并结 合大数定理确定无偏估计算子, 来估计所述真实值表达式得出的真实值。 需要说明的是,本发明实施例四提供的轨迹数据查询装置 60的各结 构单元的具体功能请参见前文方法实施例一或二。 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分 步骤是可以通过程序来指令相关的硬件完成, 所述的程序可以存储于一 种计算机可读存储介质中, 所述存储介质可以是只读存储器、 磁盘或光 盘等。
以上所述, 仅为本发明的具体实施方式, 但本发明的保护范围并不 局限于此, 任何熟悉本技术领域的技术人员在本发明揭露的技术范围内, 可轻易想到变化或替换, 都应涵盖在本发明的保护范围之内。 因此, 本 发明的保护范围应以权利要求的保护范围为准。

Claims

权 利 要 求 书
1、 一种轨迹数据查询的方法, 其特征在于, 包括:
对时空数据库中的轨迹数据建立时空索引和倒排索引, 其中, 所述 倒排索引用于, 形成包含每个轨迹与其相关联的索引叶子节点之间对应 关系的第一关系对应表, 其中所述每个轨迹与其相关联的索引叶子节点 的关联形式包括: 所述轨迹的中间部分穿过一个索引叶子节点, 所述轨 迹的始端或末端在一个索引叶子节点中, 所述轨迹完全在一个索引叶子 节点中;
接收用户的轨迹数据查询, 其中所述用户的轨迹数据查询包括, 所 述用户对所述时空数据库中的一个空间区域进行指定, 以统计所述空间 区域内的数据结果;
对所述指定的空间区域所包含的索引叶子节点进行采样, 其中确定 所述空间区域内的索引叶子节点数目 以及采样得到的索引叶子节点数 目;
根据所述采样得到的索引叶子节点以及所述第一关系对应表, 确定 所述采样得到的索引叶子节点中包含的每个轨迹与所述轨迹相关联的索 引叶子节点之间的对应关系, 形成第二关系对应表;
根据所述空间区域内的索引叶子节点数目、 所述采样得到的索引叶 子节点数目, 以及所述第二关系对应表中的数据, 确定无偏估计算子, 计算确定查询结果。
2、 根据权利要求 1所述的方法, 其特征在于, 所述形成包含每个轨 迹与其相关联的索引叶子节点之间对应关系的第一关系对应表包括: 通过所述时空索引的方式确定所述时空数据库中的所有索引叶子节 点;
基于所述时空数据库中的每个轨迹, 确定所述每个轨迹相关联的索 引叶子节点;
存储所述每个轨迹与其相关联的索引叶子节点之间的对应关系, 形 成第一关系对应表。
3、 根据权利要求 1或 2所述的方法, 其特征在于,
所述对所述空间区域所包含的索引叶子节点进行采样, 其中确定所 述空间区域内的索引叶子节点数目以及采样得到的索引叶子节点数目具 体为: 对所述指定的空间区域所包含的 n个索引叶子节点进行有放回式的 随机采样, 得到 B个可重复的索引叶子节点, 其中 n>B , n、 B均为正整 数。
4、 根据权利要求 1-3任一项所述的方法, 其特征在于, 所述根据所 述采样得到的索引叶子节点以及所述第一关系对应表, 确定所述采样得 到的索引叶子节点中包含的每个轨迹与所述轨迹相关联的索引叶子节点 之间的对应关系, 形成第二关系对应表包括:
根据所述采样得到的索引叶子节点, 列出所述索引叶子节点中所包 含的多个轨迹;
从所述第一关系对应表中获取所述多个轨迹中每一个轨迹相关联的 至少一个索引叶子节点;
判断所述至少一个索引叶子节点是否存在于所述采样得到的索引叶 子节点, 若判断结果为存在, 则保留所述轨迹对应的索引叶子节点, 并 将其对应关系记录在第二关系对应表中。
5、 根据权利要求 4所述的方法, 其特征在于, 在所述根据所述采样 得到的索引叶子节点, 列出所述索引叶子节点中所包含的多个轨迹之后, 所述方法还包括:
确定所述列出的多个轨迹中是否存在重复出现的轨迹, 若其中有轨 迹再次出现, 则所述再次出现的轨迹不列出, 从而保证得到不重复的多 个轨迹;
所述从所述第一关系对应表中获取所述多个轨迹中每一个轨迹相关 联的至少一个索引叶子节点具体为:
从所述第一关系对应表中获取所述不重复的多个轨迹中每一个轨迹 相关联的至少一个索引叶子节点。
6、 根据权利要求 1-5任一项所述的方法, 其特征在于, 所述根据所 述空间区域内的索引叶子节点数目、 所述采样得到的索引叶子节点数目, 以及所述第二关系对应表中的数据, 确定无偏估计算子, 计算确定查询 结果包括:
分别计算所述第二关系对应表中每个轨迹对应的索引叶子节点数 目;
根据所述空间区域内的索引叶子节点数目、 所述采样得到的索引叶 子节点数目、 所述第二关系对应表中的轨迹的数目、 每个所述轨迹在所 述时空区域内对应经过的索引叶子节点的数目, 结合概率统计方法和大 数定理确定无偏估计算子, 根据所述无偏估计算子计算确定查询结果, 其中, 所述结合概率统计方法和大数定理确定无偏估计算子具体为, 确定包括所述指定区域内的所有叶子节点信息的真实值表达式, 然后在 所述指定区域内对所述所有叶子节点进行采样, 通过使用采样得到的叶 子节点信息并结合大数定理确定无偏估计算子, 来估计所述真实值表达 式得出的真实值。
7、 根据权利要求 6所述的方法, 其特征在于, 当所述用户的轨迹数 据查询为查询轨迹数目时, 确定以下无偏估计算子, 计算确定查询结果:
ΤΊ B 1
其中, q
Figure imgf000029_0001
表示与用户查询范围相关的时空区 域, n表示采样前时空区域 q内所有的索引叶子节点数目, B表示采样 后的索引叶子节点数目, r表示根据 B个索引叶子节点和采样后得到的 第二关系对应表得到的轨迹, 表示轨迹 r在查询的时空区域 q内经过 的索引叶子节点数目。
8、 根据权利要求 6所述的方法, 其特征在于, 当所述用户的轨迹数 据查询为查询轨迹特性时, 确定以下无偏估计算子, 计算确定查询结果:
n B q
其中, h q(R
Figure imgf000029_0002
; q表示与用户查询范围相关的时空区域, n 表示采样前时空区域 q内所有的索引叶子节点数目, B表示采样后的索 引叶子节点数目, r表示根据 B个索引叶子节点和采样后得到的第二关 系对应表得到的轨迹, ^表示轨迹 r的轨迹特性, k表示轨迹 r在查询的 时空区域 q内经过的索引叶子节点数目。
9、 根据权利要求 6所述的方法, 其特征在于, 当所述用户的轨迹数 据查询为查询轨迹特性平均值时, 确定以下无偏估计算子, 计算确定查 询结果: ∑» ) .
其中, = fq(^) =∑ Aq{l/k }, hq(R =∑re- lr/kr q ; q表示与用户查询 范围相关的时空区域, n表示采样前时空区域 q内所有的索引叶子节点 数目, B表示采样后的索引叶子节点数目, r表示根据 B个索引叶子节 点和采样后得到的第二关系对应表得到的轨迹, ^表示轨迹 r的轨迹特 性, krq表示轨迹 r在查询的时空区域 q内经过的索引叶子节点数目。
10、 一种轨迹数据查询的装置, 其特征在于, 包括:
建立单元, 用于对时空数据库中的轨迹数据建立时空索引和倒排索 引, 其中, 所述倒排索引用于, 形成包含每个轨迹与其相关联的索引叶 子节点之间对应关系的第一关系对应表, 其中每个轨迹与其相关联的索 引叶子节点的关联形式包括: 所述轨迹的中间部分穿过一个索引叶子节 点, 所述轨迹的始端或末端在一个索引叶子节点中, 所述轨迹完全在一 个索引叶子节点中;
接收单元, 用于接收用户的轨迹数据查询, 其中所述用户的轨迹数 据查询包括, 所述用户对所述时空数据库中的一个空间区域进行指定, 以统计所述空间区域内的数据结果;
采样单元, 用于对所述指定的空间区域所包含的索引叶子节点进行 采样, 其中确定所述空间区域内的索引叶子节点数目以及采样得到的索 引叶子节点数目;
确定单元, 用于根据所述采样单元采样得到的索引叶子节点以及所 述第一关系对应表, 确定所述采样得到的索引叶子节点中包含的每个轨 迹与所述轨迹相关联的索引叶子节点之间的对应关系, 形成第二关系对 应表, 以及, 用于根据所述空间区域内的索引叶子节点数目、 所述采样 得到的索引叶子节点数目, 以及所述第二关系对应表中的数据, 确定无 偏估计算子, 计算确定查询结果。
1 1、 根据权利要求 10所述的装置, 其特征在于, 所述建立单元具体 用于: 通过所述时空索引的方式确定所述时空数据库中的所有索引叶子节 点;
基于所述时空数据库中的每个轨迹, 确定所述每个轨迹相关联的索 引叶子节点;
存储所述每个轨迹与其相关联的索引叶子节点之间的对应关系, 形 成第一关系对应表。
12、 根据权利要求 10或 1 1所述的装置, 其特征在于,
所述采样单元具体用于:
对所述指定的空间区域所包含的 n个索引叶子节点进行有放回式的 随机采样, 得到 B个可重复的索引叶子节点, 其中 n>B , n、 B均为正整 数。
13、 根据权利要求 10- 12任一项所述的装置, 其特征在于, 所述确定单元包括:
确定模块, 用于根据所述采样得到的索引叶子节点, 列出所述索引 叶子节点中所包含的多个轨迹;
获取模块, 用于从所述第一关系对应表中获取所述多个轨迹中每一 个轨迹相关联的至少一个索引叶子节点;
判断模块, 用于判断所述获取模块获取的至少一个索引叶子节点是 否存在于所述采样单元采样得到的索引叶子节点, 若判断结果为存在, 则保留所述轨迹对应的索引叶子节点, 并将其对应关系记录在第二关系 对应表中。
14、 根据权利要求 13所述的装置, 其特征在于,
所述确定模块还用于:
确定所述列出的多个轨迹中是否存在重复出现的轨迹, 若其中有轨 迹再次出现, 则所述再次出现的轨迹不列出, 从而保证得到不重复的多 个轨迹;
所述获取模块具体用于:
从所述第一关系对应表中获取所述确定模块确定的不重复的多个轨 迹中每一个轨迹相关联的至少一个索引叶子节点。
15、 根据权利要求 10- 14任一项所述的装置, 其特征在于, 所述确定单元具体用于:
分别计算所述第二关系对应表中每个轨迹对应的索引叶子节点数 n;
根据所述空间区域内的索引叶子节点数目、 所述采样得到的索引叶 子节点数目、 所述第二关系对应表中的轨迹的数目、 每个所述轨迹在所 述时空区域内对应经过的索引叶子节点的数目, 结合概率统计方法和大 数定理确定无偏估计算子, 根据所述无偏估计算子计算确定查询结果, 其中, 所述结合概率统计方法和大数定理确定无偏估计算子具体为, 确定包括所述指定区域内的所有叶子节点信息的真实值表达式, 然后在 所述指定区域内对所述所有叶子节点进行采样, 通过使用采样得到的叶 子节点信息并结合大数定理确定无偏估计算子, 来估计所述真实值表达 式得出的真实值。
16、 一种轨迹数据查询的装置, 其特征在于, 包括:
处理器, 用于对时空数据库中的轨迹数据建立时空索引和倒排索引, 其中, 所述倒排索引用于, 形成包含每个轨迹与其相关联的索引叶子节 点之间对应关系的第一关系对应表, 其中每个轨迹与其相关联的索引叶 子节点的关联形式包括: 所述轨迹的中间部分穿过一个索引叶子节点, 所述轨迹的始端或末端在一个索引叶子节点中, 所述轨迹完全在一个索 引叶子节点中;
接收器, 用于接收用户的轨迹数据查询, 其中所述用户的轨迹数据 查询包括, 所述用户对所述时空数据库中的一个空间区域进行指定, 并 统计所述空间区域内的数据结果;
所述处理器还用于, 对所述指定的空间区域所包含的索引叶子节点 进行采样, 其中确定所述空间区域内的索引叶子节点数目以及采样得到 的索引叶子节点数目, 根据所述采样单元采样得到的索引叶子节点以及 所述第一关系对应表, 确定所述采样得到的索引叶子节点中包含的每个 轨迹与所述轨迹相关联的索引叶子节点之间的对应关系, 形成第二关系 对应表, 以及, 用于根据所述空间区域内的索引叶子节点数目、 所述采 样得到的索引叶子节点数目, 以及所述第二关系对应表中的数据, 确定 无偏估计算子, 计算确定查询结果。
17、 根据权利要求 16所述的装置, 其特征在于, 所述处理器具体用 于:
通过所述时空索引的方式确定所述时空数据库中的所有索引叶子节 点;
基于所述时空数据库中的每个轨迹, 确定所述每个轨迹相关联的索 引叶子节点;
存储所述每个轨迹与其相关联的索引叶子节点之间的对应关系, 形 成第一关系对应表。
18、 根据权利要求 16或 17所述的装置, 其特征在于,
所述处理器具体用于:
对所述指定的空间区域所包含的 n个索引叶子节点进行有放回的随 机采样, 得到 B个可重复的索引叶子节点, 其中 n>B , n、 B均为正整数。
19、 根据权利要求 16- 18任一项所述的装置, 其特征在于,
所述处理器具体用于:
根据所述采样得到的索引叶子节点, 列出所述索引叶子节点中所包 含的多个轨迹;
从所述第一关系对应表中获取所述多个轨迹中每一个轨迹相关联的 至少一个索引叶子节点; 以及
判断所述获取模块获取的至少一个索引叶子节点是否存在于所述采 样单元采样得到的索引叶子节点, 若判断结果为存在, 则保留所述轨迹 对应的索引叶子节点, 并将其对应关系记录在第二关系对应表中。
20、 根据权利要求 19所述的装置, 其特征在于,
所述处理器具体用于:
确定所述列出的多个轨迹中是否存在重复出现的轨迹, 若其中有轨 迹再次出现, 则所述再次出现的轨迹不列出, 从而保证得到不重复的多 个轨迹; 以及
从所述第一关系对应表中获取所述确定模块确定的不重复的多个轨 迹中每一个轨迹相关联的至少一个索引叶子节点。
21、 根据权利要求 16-20任一项所述的装置, 其特征在于,
所述处理器具体用于:
分别计算所述第二关系对应表中每个轨迹对应的索引叶子节点数 目; 以及
根据所述空间区域内的索引叶子节点数目、 所述采样得到的索引叶 子节点数目、 所述第二关系对应表中的轨迹的数目、 每个所述轨迹在所 述时空区域内对应经过的索引叶子节点的数目, 结合概率统计方法和大 数定理确定无偏估计算子, 根据所述无偏估计算子计算确定查询结果, 其中, 所述结合概率统计方法和大数定理确定无偏估计算子具体为, 确定包括所述指定区域内的所有叶子节点信息的真实值表达式, 然后在 所述指定区域内对所述所有叶子节点进行采样, 通过使用采样得到的叶 子节点信息并结合大数定理确定无偏估计算子, 来估计所述真实值表达 式得出的真实值。
PCT/CN2014/083485 2014-07-31 2014-07-31 一种轨迹数据查询的方法及装置 WO2016015312A1 (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
PCT/CN2014/083485 WO2016015312A1 (zh) 2014-07-31 2014-07-31 一种轨迹数据查询的方法及装置
EP14898690.4A EP3163466B1 (en) 2014-07-31 2014-07-31 Trajectory data inquiry method and apparatus
CN201480080003.9A CN106575294B (zh) 2014-07-31 2014-07-31 一种轨迹数据查询的方法及装置
US15/414,888 US20170132264A1 (en) 2014-07-31 2017-01-25 Trajectory Data Query Method and Apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/083485 WO2016015312A1 (zh) 2014-07-31 2014-07-31 一种轨迹数据查询的方法及装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/414,888 Continuation US20170132264A1 (en) 2014-07-31 2017-01-25 Trajectory Data Query Method and Apparatus

Publications (1)

Publication Number Publication Date
WO2016015312A1 true WO2016015312A1 (zh) 2016-02-04

Family

ID=55216666

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2014/083485 WO2016015312A1 (zh) 2014-07-31 2014-07-31 一种轨迹数据查询的方法及装置

Country Status (4)

Country Link
US (1) US20170132264A1 (zh)
EP (1) EP3163466B1 (zh)
CN (1) CN106575294B (zh)
WO (1) WO2016015312A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018161729A1 (zh) * 2017-03-07 2018-09-13 华为技术有限公司 用户轨迹恢复方法及装置
CN112988849A (zh) * 2021-04-27 2021-06-18 北京航空航天大学 一种交通轨迹模式分布式挖掘方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10521671B2 (en) 2014-02-28 2019-12-31 Second Spectrum, Inc. Methods and systems of spatiotemporal pattern recognition for video content development
US20160104071A1 (en) * 2014-10-08 2016-04-14 AxonAl, Inc. Spatio-temporal forecasting of future risk from past events
CN109344337B (zh) * 2018-08-09 2019-11-05 百度在线网络技术(北京)有限公司 移动热点与移动兴趣点的匹配方法、装置及存储介质
US11463248B2 (en) * 2018-09-03 2022-10-04 Munia Limited Management system
CN111353104A (zh) * 2018-12-21 2020-06-30 深圳市优必选科技有限公司 车辆查询方法、系统、装置、计算机设备及存储介质
CN111949688A (zh) * 2019-05-16 2020-11-17 广州汽车集团股份有限公司 一种采样车辆轨迹数据的方法、客户端和服务器
US11113535B2 (en) 2019-11-08 2021-09-07 Second Spectrum, Inc. Determining tactical relevance and similarity of video sequences
CN113643078B (zh) * 2021-10-14 2022-04-01 北京华宜信科技有限公司 基于区块链的信息价值标记方法、装置、设备及介质
CN115204269B (zh) * 2022-06-15 2024-03-12 南通市测绘院有限公司 一种基于时空基准的城市治理数据融合方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915346A (zh) * 2012-09-26 2013-02-06 中国科学院软件研究所 面向物联网智能感知的数据索引建立与查询方法
CN103106280A (zh) * 2013-02-22 2013-05-15 浙江大学 一种道路网络环境下不确定时空轨迹数据的范围查询方法
US20130339371A1 (en) * 2012-06-18 2013-12-19 Hitachi, Ltd. Spatio-temporal data management system, spatio-temporal data management method, and program thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007096002A1 (en) * 2006-02-27 2007-08-30 Robert Bosch Gmbh Trajectory retrieval system, method and software for trajectory data retrieval
CN102368237B (zh) * 2010-10-18 2013-03-27 中国科学技术大学 图像检索方法、装置及系统
CN103853772B (zh) * 2012-12-04 2017-02-08 北京拓尔思信息技术股份有限公司 一种高效倒排索引组织方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130339371A1 (en) * 2012-06-18 2013-12-19 Hitachi, Ltd. Spatio-temporal data management system, spatio-temporal data management method, and program thereof
CN102915346A (zh) * 2012-09-26 2013-02-06 中国科学院软件研究所 面向物联网智能感知的数据索引建立与查询方法
CN103106280A (zh) * 2013-02-22 2013-05-15 浙江大学 一种道路网络环境下不确定时空轨迹数据的范围查询方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018161729A1 (zh) * 2017-03-07 2018-09-13 华为技术有限公司 用户轨迹恢复方法及装置
CN108574933A (zh) * 2017-03-07 2018-09-25 华为技术有限公司 用户轨迹恢复方法及装置
CN112988849A (zh) * 2021-04-27 2021-06-18 北京航空航天大学 一种交通轨迹模式分布式挖掘方法

Also Published As

Publication number Publication date
EP3163466B1 (en) 2018-11-07
CN106575294A (zh) 2017-04-19
EP3163466A1 (en) 2017-05-03
US20170132264A1 (en) 2017-05-11
EP3163466A4 (en) 2017-05-10
CN106575294B (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
WO2016015312A1 (zh) 一种轨迹数据查询的方法及装置
CN106534392B (zh) 一种定位信息采集方法、定位方法及装置
CN105992338B (zh) 一种定位方法和装置
EP2247126A2 (en) Predicting presence of a mobile user equipment
CN111343301B (zh) 一种定位方法、定位装置、电子设备及存储介质
US20160377443A1 (en) Method and apparatus for determining a location of a point of interest
WO2017107800A1 (zh) 获取交通道路中路线热度的方法及装置
KR20160086812A (ko) 속성과 네트워크 주소 사이의 연관
CN114173356B (zh) 网络质量的检测方法、装置、设备及存储介质
CN110995885B (zh) 一种基于路由器误差训练的ip定位方法
WO2017084006A1 (en) Telecommunication network signal analysis for matching a mobile device cellular identifier with a mobile device network identifier
WO2016127879A1 (zh) 一种确定热点区域的方法和装置
CN106817712B (zh) 一种定位方法及装置和一种服务器
JP6049186B2 (ja) 携帯端末を所持したユーザの滞在地を推定する装置、プログラム及び方法
WO2016127880A1 (zh) 一种确定离线定位数据质量的方法和装置
CN109754631B (zh) 车辆位置追踪的方法、装置、计算机设备及存储介质
CN106528559B (zh) 一种位置信息的提供方法和设备
JP5986028B2 (ja) 携帯端末を所持したユーザの短時間滞留地を推定する装置、プログラム及び方法
US20160192155A1 (en) Facilitating estimation of mobile device presence inside a defined region
US11792110B2 (en) Geolocation system and method
CN109447882B (zh) 一种基于信令数据的人口交换量估计方法
Claro et al. Lisbon hotspots: Wi-fi access point dataset for time-bound location proofs
CN113840157A (zh) 访问检测方法、系统及装置
AU2016433153B2 (en) Estimated user location from cellular telephony data
Chong et al. Not all trips are equal: Analyzing foursquare check-ins of trips and city visitors

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14898690

Country of ref document: EP

Kind code of ref document: A1

REEP Request for entry into the european phase

Ref document number: 2014898690

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2014898690

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE