CN109413683B - 一种获取发射概率、转移概率以及序列定位的方法和装置 - Google Patents
一种获取发射概率、转移概率以及序列定位的方法和装置 Download PDFInfo
- Publication number
- CN109413683B CN109413683B CN201710698562.1A CN201710698562A CN109413683B CN 109413683 B CN109413683 B CN 109413683B CN 201710698562 A CN201710698562 A CN 201710698562A CN 109413683 B CN109413683 B CN 109413683B
- Authority
- CN
- China
- Prior art keywords
- mrs
- terminal
- position information
- base station
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
- H04W64/003—Locating users or terminals or network equipment for network management purposes, e.g. mobility management locating network equipment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/10—Scheduling measurement reports ; Arrangements for measurement reports
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/023—Services making use of location information using mutual or relative location information between multiple location based services [LBS] targets or of distance thresholds
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
- H04W64/006—Locating users or terminals or network equipment for network management purposes, e.g. mobility management with additional information processing, e.g. for direction or speed determination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/04—Wireless resource allocation
- H04W72/044—Wireless resource allocation based on the type of the allocated resource
- H04W72/0446—Resources in time domain, e.g. slots or frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W76/00—Connection management
- H04W76/10—Connection setup
- H04W76/11—Allocation or use of connection identifiers
Abstract
本申请提供了一种获得发射概率的方法,该方法包括:获取目标区域内终端的多个测量报告MR和基站的工程参数;根据参数信息和工程参数得到每个MR各自对应的特征向量;通过机器学习模型处理位置信息和特征向量得到单点定位模型;根据单点定位模型、位置信息和特征向量计算发射概率。本申请提供的获得发射概率的方法应用了机器学习模型,属于人工智能AI技术领域。
Description
技术领域
本发明涉及电信定位领域,尤其涉及获得用于序列定位的发射概率的方法和装置。
背景技术
电信定位是指通过移动设备发送到管道侧(例如电信运营商)的数据和基站侧数据计算出该移动设备的位置。目前,常见的电信定位技术有Range‐Based方法、Fingerprint方法、序列定位方法,其中序列定位方法(或序列方法)的主要思想是将定位过程描述成从观测序列到隐含序列的匹配模型,经纬度位置作为隐状态,信号强度作为观测值。在定位的时候,以一个观测值序列作为输入,输出一个最佳的隐状态序列与输入的观测值序列一一对应来作为定位结果。这类定位方法的核心是要定义发射概率(emission probability)和转移概率(transition probability)发射概率是指从隐状态到观测值的映射,转移概率是指不同隐状态之间的转换。
序列定位方法的主要优点是利用了位置的上下文信息,使得每个位置的预测结果都能够受到前一个位置的约束,进而得到的轨迹比较平滑,可以有效避免出现如Range‐Based方法和Fingerprint方法得到的预测结果“乱跳”的情况。发射概率和转移概率的获取直接影响序列定位方法的定位能力,现有技术中通过对信号强度的均值方差进行建模得到发射概率,通过该方法得到的发射概率无法表述复杂的观测信息,直接影响序列定位方法的定位精度、可靠性。
发明内容
针对现有技术中存在的技术问题,本申请提供了一种获得发射概率的方法,使得获得的发射概率能够表述复杂的观测信息,将该发射概率用于序列定位能够提高序列定位方法的定位精度、可靠性。
第一方面,本申请提供了一种获得发射概率(emission probability)的方法,该方法包括:获取目标区域内终端的多个测量报告MR和所述目标区域内至少一个基站的工程参数,其中,所述目标区域为预定的地理区域,具体地,可以根据人口数量、行政区域划分目标区域,例如某一城市的郊区为目标区域,或某一城市的市区为目标区域,本申请并不限制目标区域的面积大小、地理位置等,一般情况而言,根据某一区域的终端的MR得到的发射概率应用于该某一区域;需要说明的是,获取的目标区域内终端的多个MR可以是获取目标区域内的一个终端的多个MR;也可以是获取目标区域内的多个终端的多个MR,且不限定一个终端的MR的数量,多个终端的MR可以是一个也可以多个。所述多个MR中的每个MR包含位置信息和参数信息,所述位置信息用于指示包含所述位置信息的MR对应的终端在所述目标区域内的位置;本申请对MR的参数信息不做限定,一般是指MR中除位置信息之外的其他信息均可以归于参数信息;根据所述多个MR中的每个MR的参数信息和所述至少一个基站的工程参数,得到所述多个MR中的每个MR各自对应的特征向量,参数信息包括很多信息,以参数信息及相应基站的工程参数得到的特征向量能够表达复杂的观测信息;通过机器学习模型处理所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量,得到单点定位模型;根据所述单点定位模型、所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量,计算所述多个MR中的每个MR各自对应的特征向量的发射概率,其中,所述发射概率包括至少一个发射概率值,所述发射概率值用于指示某一特征向量对应某一位置信息的概率;需要注意的,输入单点定位模型的MR和用于训练单点定位模型的MR可以不限于相同终端的,也可以是目标区域终端之外的其他终端的MR,即用于得到单点定位模型的MR和用于输入单点定位模型计算发射概率的MR可以是目标区域内不同的终端上传的MR。通过目标区域终端的MR训练得到单点定位模型,再将该目标区域内的终端的MR输入该单点定位模型,利用单点定位模型的空间模型统计特征向量与位置信息的对应关系,使得对应关系更加可靠。
第一方面的一种可能的实现方式,所述多个MR中的每个MR的参数信息包含至少一个基站ID,所述基站ID用于指示包含所述基站ID的MR对应的终端所连接的基站,在实际中,一个MR可能包含对应终端连接的多个基站的信息,所述至少一个基站至少包括所述多个MR包含的基站ID所指示的基站,进而每个MR中的基站ID都有对应的工程参数用于得到特征向量;所述根据所述多个MR中的每个MR的参数信息和所述至少一个基站的工程参数,得到所述多个MR中的每个MR各自对应的特征向量,包括:根据基站ID将所述多个MR与所述至少一个基站的工程参数进行匹配,得到所述多个MR中每个MR各自的关联工程参数,其中,任一MR的关联工程参数包括所述任一MR中每个基站ID所指示基站的工程参数;根据所述多个MR中每个MR各自的关联工程参数和参数信息,得到所述多个MR中每个MR各自对应的特征向量,其中,任一特征向量包括同一MR的关联工程参数和参数信息。需要注意的,特征向量中包含几个基站的工程参数一般取决于对应MR中基站ID指示的基站数量,可选的,特征向量可以仅包含对应MR中包含的至少一个基站ID指示的至少一个基站中的一个的工程参数。
第一方面的一种可能的实现方式,所述通过机器学习模型处理所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量,得到单点定位模型,包括:根据所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量,得到所述多个MR中的每个MR各自对应的训练集合,其中,任一训练集合包括同一MR对应的特征向量和位置信息;将所述多个MR中的每个MR各自对应的训练集输入所述机器学习模型进行训练,得到所述单点定位模型。
第一方面的一种可能的实现方式,所述根据所述单点定位模型、所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量,计算所述多个MR中的每个MR各自对应的特征向量的发射概率,包括:将所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量输入所述单点定位模型得到映射关系,其中,所述映射关系用于指示特征向量与位置信息的对应关系;根据所述映射关系计算所述多个MR中的每个MR各自对应的特征向量的发射概率。可选的,输入单点定位模型的MR的特征向量和其中的位置信息,可以不是终端的MR对应的特征向量和其中的位置信息,可能是与终端所在相同目标区域内的其他多个终端的MR,且特征向量的获得方法与终端的MR对应的特征向量的获得方法相同,此处不再赘述。
第一方面的一种可能的实现方式,所述机器学习模型为回归模型,例如逻辑回归、随机森林等,此处对回归模型的具体模型不做限定。
本申请提供的获得发射概率的方法,以MR中多种参数信息、相应基站的工程参数得到的特征向量作为观测值,在以上述MR对应的特征向量和位置信息训练单点定位模型,利用单点定位模型的空间模型得到的发射概率,能够表达复杂的观测信息,且特征向量(观测值)与位置信息之间的对应关系更可靠。
第二方面,本发明提供了一种获得转移概率(transition probability)的方法,获取目标区域内终端的多个轨迹数据,其中,所述目标区域为预定的地理区域,具体地,可以根据人口数量、行政区域划分目标区域,例如某一城市的郊区为目标区域,或某一城市的市区为目标区域,本申请并不限制目标区域的面积大小、地理位置等,一般情况而言,根据某一区域的终端的MR得到的发射概率应用于该某一区域;所述多个轨迹数据中的每一轨迹数据包含至少两个位置信息,该位置信息用于指示包含所述位置信息的轨迹数据对应的终端在所述目标区域内的位置,所述多个轨迹数据包含的多个位置信息中的每一位置信息对应一个时间戳;根据所述多个轨迹数据计算转移概率,其中,所述转移概率包括至少一个转移概率值,所述转移概率值用于指示某一位置信息经时间间隔T到另一位置信息的概率。可选的,目标区域内终端的多个轨迹数据来自第三方平台,例如第三方APP滴滴出行、共享单车平台等。
第二方面的一种可能的实现方式,所述根据所述多个轨迹数据计算转移概率包括:对所述多个轨迹数据进行处理,得到所述多个轨迹数据中的每一轨迹数据的至少一个组合序列,其中,所述组合序列包括同一轨迹数据中的任意两个位置信息及所述任意两个位置信息的时间间隔,其中,两个位置信息之间的时间间隔可以根据两个位置信息格子对应的时间戳计算得到;根据第一预设条件和所述多个轨迹数据中的每一轨迹数据的至少一个组合序列,得到对应所述第一预设条件的转移概率,其中,所述第一预设条件为多个预设条件中的任一个,所述多个预设条件中的每一预设条件包括预设时间间隔和预设位置信息,所述预设时间间隔对应所述时间间隔T,所述预设位置信息对应所述某一位置信息。
第二方面的一种可能的实现方式,所述根据第一预设条件和所述多个轨迹数据中的每一轨迹数据的至少一个组合序列,得到对应所述第一预设条件的转移概率包括:确定所述多个轨迹数据包含的全部组合序列中包含所述第一预设条件中的预设时间间隔和预设位置信息的组合序列;统计所述包含所述预设条件中的预设时间间隔和预设位置信息的组合序列,计算对应所述第一预设条件的转移概率。举例,确定包含位置信息A、时间间隔T1的全部组合序列的数量为M,可表示为[位置信息A,时间间隔T1,位置信息Xn],在包含位置A、时间间隔T1的全部组合序列中分别统计位置信息X1~Xn个数,进而得到包含位置信息X1~Xn占M的概率值,对应位置信息X1~Xn的各个概率值构成对应位置信息A、时间间隔T1条件的转移概率。可选的,所述预设时间间隔为预设的时间间隔范围,预设时间间隔可以是特定时长,也可以是一个时长范围,例如预设时间间隔为2秒,或预设时间间隔为2~4秒,这样可以获得某一时长范围对应的转移概率,因为不同终端获得MR的频率有可能不同,导致不同终端的轨迹数据得到的组合序列中的时间间隔可能不同,通过将预设条件中时间间隔设定为一个取值范围,可以将不同时间间隔的组合序列进行融合,最大化利用现有数据。
第二方面的一种可能的实现方式,在所述根据所述多个轨迹数据计算转移概率之前,还包括:剔除所述多个轨迹数据中的瑕疵轨迹数据,其中,所述瑕疵轨迹数据为存在至少一个位置信息偏离所述目标区域内道路的距离大于第一阈值的轨迹数据,或,存在相邻的两个位置信息之间的距离大于第二阈值的轨迹数据。在实际中,通过第三方获得轨迹数据可能存在不可靠的数据,即瑕疵轨迹数据,通过从获取的多个轨迹数据中剔除瑕疵轨迹数据,在对剔除后的轨迹数据继续进行处理得到转移概率,可以提高以此转移概率恢复/预测终端的移动轨迹更加可靠、平滑。
第二方面的一种可能的实现方式,在所述根据所述多个轨迹数据计算转移概率之前,还包括:确定所述多个轨迹数据中的稀疏轨迹数据,其中,所述稀疏轨迹数据为包含的所述至少两个位置信息中的任意两个相邻的位置信息之间的距离大于第三阈值的轨迹数据;根据所述目标区域的地图信息,在所述稀疏轨迹数据的任意两个相邻的位置信息之间插入一个或多个位置信息。通过插值处理,可以使得获取的轨迹数据中的位置信息更加稠密,根据插值处理后的轨迹数据得到的转移概率并用于恢复/预测终端的移动轨迹可以使得恢复/预测的移动轨迹更加平滑,也可以得到更多不同的时间间隔的转移概率。第二方面的一种可能的实现方式,所述获取目标区域内终端的多个轨迹数据包括:获取交通高峰时段或交通非高峰时段的所述目标区域内终端的多个轨迹数据。在实际中,交通高峰时段内的终端移动轨迹与交通非高峰时段内的终端移动轨迹通常存在区别,针对交通高峰时段和交通非高峰时段得到不同的转移概率,用于恢复/预测相应时段内的终端的移动轨迹,能够提高恢复/预测终端移动轨迹的准确性、可靠性。
本申请提供的获得转移概率的方法,通过第三方平台提供的目标区域内终端移动轨迹数据,根据移动轨迹数据计算的转移概率用于恢复或预测目标区域内某终端的移动轨迹会更平滑,可以有效避免轨迹跳跃现象。
第三方面,本申请提供了一种序列定位的方法,获取目标区域内目标终端的多个目标测量报告MR和所述目标区域内至少一个基站的工程参数,其中,所述目标区域为预定的地理区域,所述多个目标MR中每个目标MR包含参数信息;根据所述多个目标MR中的每个目标MR的参数信息和所述至少一个基站的工程参数,得到所述多个目标MR中的每个目标MR各自对应的目标特征向量;将所述多个目标MR中的每个目标MR各自对应的目标特征向量输入序列定位模型,得到所述目标终端的移动轨迹;其中,所述序列定位模型的应用参数包括发射概率和转移概率,该发射概率可以通过为第一方面或第一方面的任一可能的实现方式中描述的方法获得,或者/和,该转移概率可以通过为第二方面或第二方面的任一可能的实现方式中描述的方法获得,此处不在赘述。
本申请提供的序列定位的方法,根据MR中的多种参数信息及相应基站的工程参数得到的特征向量获得发射概率能够表达更复杂的观测信息,进一步提高序列定位恢复/预测的移动轨迹更加准确、可靠。
第四方面,本申请提供了一种序列定位的方法,该方法包括:获取目标区域内目标终端的多个目标测量报告MR和所述目标区域内至少一个基站的工程参数,其中,所述目标区域为预定的地理区域,所述多个目标MR中每个目标MR包含参数信息;根据所述多个目标MR中的每个目标MR的参数信息和所述至少一个基站的工程参数,得到所述多个目标MR中的每个目标MR各自对应的目标特征向量;将所述多个目标MR中的每个目标MR各自对应的目标特征向量输入序列定位模型,得到所述目标终端的移动轨迹;
其中,所述序列定位模型的应用参数包括发射概率和转移概率,所述转移概率通过以下方法获得:获取目标区域内终端的多个轨迹数据,其中,所述终端的多个轨迹数据中的每一轨迹数据包含至少两个第二位置信息,所述第二位置信息用于指示包含所述第二位置信息的轨迹数据对应的终端在所述目标区域内的位置,所述终端的多个轨迹数据包含的多个第二位置信息中的每一第二位置信息对应一个时间戳;根据所述终端的多个轨迹数据计算转移概率,其中,所述转移概率包括至少一个转移概率值,所述转移概率值用于指示某一第二位置信息经时间间隔T到另一第二位置信息的概率。
第四方面的一个可能的实现方式,所述根据所述终端的多个轨迹数据计算转移概率包括:对所述终端的多个轨迹数据进行处理,得到所述终端的多个轨迹数据中的每一轨迹数据的至少一个组合序列,其中,所述组合序列包括所述终端的同一轨迹数据中的任意两个第二位置信息及所述任意两个第二位置信息的时间间隔;根据第一预设条件和所述终端的多个轨迹数据中的每一轨迹数据的至少一个组合序列,得到对应所述第一预设条件的转移概率,其中,所述第一预设条件为多个预设条件中的任一个,所述多个预设条件中的每一预设条件包括预设时间间隔和预设第二位置信息,所述预设时间间隔对应所述时间间隔T,所述预设第二位置信息对应所述某一第二位置信息。
第四方面的一个可能的实现方式,所述根据第一预设条件和所述终端的多个轨迹数据中的每一轨迹数据的至少一个组合序列,得到对应所述第一预设条件的转移概率包括:确定所述终端的多个轨迹数据包含的全部组合序列中包含所述第一预设条件中的预设时间间隔和预设第二位置信息的组合序列;统计所述包含所述预设条件中的预设时间间隔和预设第二位置信息的组合序列,计算对应所述第一预设条件的转移概率。
第四方面的一个可能的实现方式,在所述根据所述终端的多个轨迹数据计算转移概率之前,还包括:剔除所述终端的多个轨迹数据中的瑕疵轨迹数据,其中,所述瑕疵轨迹数据为存在至少一个第二位置信息偏离所述目标区域内道路的距离大于第一阈值的轨迹数据,或,存在相邻的两个第二位置信息之间的距离大于第二阈值的轨迹数据。
第四方面的一个可能的实现方式,在所述根据所述终端的多个轨迹数据计算转移概率之前,还包括:确定所述终端的多个轨迹数据中的稀疏轨迹数据,其中,所述稀疏轨迹数据为包含的所述至少两个第二位置信息中的任意两个相邻的第二位置信息之间的距离大于第三阈值的轨迹数据;根据所述目标区域的地图信息,在所述稀疏轨迹数据的任意两个相邻的第二位置信息之间插入一个或多个第二位置信息。
第四方面的一个可能的实现方式,所述获取目标区域内终端的多个轨迹数据包括:获取交通高峰时段或交通非高峰时段的所述目标区域内终端的多个轨迹数据。
第四方面的一个可能的实现方式,所述预设时间间隔为预设的时间间隔范围。
第四方面的一个可能的实现方式,所述发射概率通过第一方面或第一方面的任一可能的实现方式中描述的方法获得。
本申请提供的序列定位的方法,以第三方真实的轨迹数据获得的转移概率用于序列定位,能够提高恢复/预测的移动轨迹的平滑性,得到移动轨迹更加可靠。
第五方面,本申请提供了一种发射概率计算装置,该发射概率计算装置包括:测量报告MR获取模块、特征向量模块、回归处理模块、发射概率计算模块;所述MR获取模块用于获取目标区域内终端的多个测量报告MR和所述目标区域内至少一个基站的工程参数,其中,所述目标区域为预定的地理区域,所述多个MR中的每个MR包含位置信息和参数信息,所述位置信息用于指示包含所述位置信息的MR对应的终端在所述目标区域内的位置;所述特征向量模块用于根据所述MR获取模块获取的多个MR中的每个MR的参数信息和至少一个基站的工程参数,得到所述多个MR中的每个MR各自对应的特征向量;所述回归处理模块用于根据所述MR获取模块获取的多个MR中的每个MR的位置信息和所述特征向量模块得到的多个MR中的每个MR各自对应的特征向量,得到单点定位模型;所述发射概率计算模块用于根据所述回归处理模块得到的单点定位模型、所述MR获取模块获取的多个MR中的每个MR的位置信息和所述特征向量模块得到多个MR中的每个MR各自对应的特征向量,计算所述多个MR中的每个MR各自对应的特征向量的发射概率,其中,所述发射概率包括至少一个发射概率值,所述发射概率值用于指示某一特征向量对应某一位置信息的概率。
第五方面的一个可能的实现方式,所述多个MR中的每个MR的参数信息包含至少一个基站ID,所述基站ID用于指示包含所述基站ID的MR对应的终端所连接的基站,所述至少一个基站至少包括所述多个MR包含的基站ID所指示的基站;所述特征向量模块具体用于:
根据基站ID将所述MR获取模块获取的多个MR与所述MR获取模块获取的至少一个基站的工程参数进行匹配,得到所述多个MR中每个MR各自的关联工程参数,其中,任一MR的关联工程参数包括所述任一MR中每个基站ID所指示基站的工程参数;根据所述MR获取模块获取的多个MR中每个MR各自的关联工程参数和参数信息,得到所述多个MR中每个MR各自对应的特征向量,其中,任一特征向量包括同一MR的关联工程参数和参数信息。
第五方面的一个可能的实现方式,所述回归处理模块具体用于:根据所述MR获取模块获取的多个MR中的每个MR的位置信息和所述特征向量模块得到的多个MR中的每个MR各自对应的特征向量,得到所述多个MR中的每个MR各自对应的训练集合,其中,任一训练集合包括同一MR对应的特征向量和位置信息;将所述多个MR中的每个MR各自对应的训练集输入所述机器学习模型进行训练,得到所述单点定位模型。
第五方面的一个可能的实现方式,所述发射概率计算模块具体用于:将所述MR获取模块获取的多个MR中的每个MR的位置信息和所述特征向量模块得到的多个MR中的每个MR各自对应的特征向量输入所述回归处理模块得到的单点定位模型,得到映射关系,其中,所述映射关系用于指示特征向量与位置信息的对应关系;根据所述映射关系计算所述多个MR中的每个MR各自对应的特征向量的发射概率。
本申请提供的发射概率计算装置,以MR中多种参数信息、相应基站的工程参数得到的特征向量作为观测值,在以上述MR对应的特征向量和位置信息训练单点定位模型,利用单点定位模型的空间模型得到的发射概率,能够表达复杂的观测信息,且特征向量(观测值)与位置信息之间的对应关系更可靠。
第六方面,本申请提供了一种转移概率计算装置,该转移概率计算装置包括:轨迹获取模块、转移概率计算模块;所述轨迹获取模块用于获取目标区域内终端的多个轨迹数据,其中,所述目标区域为预定的地理区域,所述多个轨迹数据中的每一轨迹数据包含至少两个位置信息,所述位置信息用于指示包含所述位置信息的轨迹数据对应的终端在所述目标区域内的位置,所述多个轨迹数据包含的多个位置信息中的每一位置信息对应一个时间戳;所述转移概率计算模块用于根据所述轨迹获取模块获取的多个轨迹数据计算转移概率,其中,所述转移概率包括至少一个转移概率值,所述转移概率值用于指示某一位置信息经时间间隔T到另一位置信息的概率。可选的,获取交通高峰时段或交通非高峰时段的所述目标区域内终端的多个轨迹数据。
第六方面的一个可能的实现方式,所述转移概率计算模块包括:预处理单元和转移概率计算单元;所述预处理单元用于对所述轨迹获取模块获得的多个轨迹数据进行处理,得到所述多个轨迹数据中的每一轨迹数据的至少一个组合序列,其中,所述组合序列包括同一轨迹数据中的任意两个位置信息及所述任意两个位置信息的时间间隔;所述转移概率计算单元用于根据第一预设条件和所述预处理单元得到的多个轨迹数据中的每一轨迹数据的至少一个组合序列,得到对应所述第一预设条件的转移概率,其中,所述第一预设条件为多个预设条件中的任一个,所述多个预设条件中的每一预设条件包括预设时间间隔和预设位置信息,所述预设时间间隔对应所述时间间隔T,所述预设位置信息对应所述某一位置信息。可选的,所述预设时间间隔为预设的时间间隔范围。
第六方面的一个可能的实现方式,所述转移概率计算单元具体用于:确定所述预处理单元得到的多个轨迹数据包含的全部组合序列中包含所述第一预设条件中的预设时间间隔和预设位置信息的组合序列;统计所述包含所述预设条件中的预设时间间隔和预设位置信息的组合序列,计算对应所述第一预设条件的转移概率。
第六方面的一个可能的实现方式,所述装置还包括:第一轨迹处理模块;所述第一轨迹处理模块用于剔除所述轨迹获取模块获取的多个轨迹数据中的瑕疵轨迹数据,其中,所述瑕疵轨迹数据为存在至少一个位置信息偏离所述目标区域内道路的距离大于第一阈值的轨迹数据,或,存在相邻的两个位置信息之间的距离大于第二阈值的轨迹数据。
第六方面的一个可能的实现方式,所述装置还包括:第二轨迹处理模块;所述第二轨迹处理模块用于确定所述轨迹获取模块获取的多个轨迹数据中的稀疏轨迹数据,其中,所述稀疏轨迹数据为包含的所述至少两个位置信息中的任意两个相邻的位置信息之间的距离大于第三阈值的轨迹数据;根据所述目标区域的地图信息,在所述稀疏轨迹数据的任意两个相邻的位置信息之间插入一个或多个位置信息。
本申请提供的转移概率计算装置,通过第三方平台提供的目标区域内终端移动轨迹数据,根据移动轨迹数据计算的转移概率用于恢复或预测目标区域内某终端的移动轨迹会更平滑,可以有效避免轨迹跳跃现象。
第七方面,本申请提供了一种序列定位装置,该序列定位装置包括:发射概率计算模块、转移概率计算模块、序列定位模块;
所述序列定位模块包括目标测量报告MR获取单元、目标特征向量单元、轨迹预测单元;其中,所述目标MR单元用于获取目标区域内目标终端的多个目标测量报告MR和所述目标区域内至少一个基站的工程参数,所述目标区域为预定的地理区域,所述多个目标MR中每个目标MR包含参数信息,所述目标特征向量单元用于根据所述目标MR单元获取的多个目标MR中的每个目标MR的参数信息和所述至少一个基站的工程参数,得到所述多个目标MR中的每个目标MR各自对应的目标特征向量,所述轨迹预测单元用于根据所述目标特征向量单元得到的多个目标MR中的每个目标MR各自对应的目标特征向量,得到所述目标终端的移动轨迹,所述序列定位模型的应用参数包括发射概率和转移概率;
所述发射概率计算模块用于计算所述发射概率,所述转移概率计算模块用于计算所述转移概率;
其中,所述发射概率计算模块包括测量报告MR获取单元、特征向量单元、回归处理单元、发射概率计算单元;所述MR获取单元用于获取目标区域内第一终端的多个测量报告MR和所述目标区域内至少一个基站的工程参数,其中,所述多个MR中的每个MR包含位置信息和参数信息,所述位置信息用于指示包含所述位置信息的MR对应的第一终端在所述目标区域内的位置;所述特征向量单元用于根据所述MR获取单元获取的多个MR中的每个MR的参数信息和至少一个基站的工程参数,得到所述多个MR中的每个MR各自对应的特征向量;所述回归处理单元用于根据所述MR获取单元获取的多个MR中的每个MR的位置信息和所述特征向量单元得到的多个MR中的每个MR各自对应的特征向量,得到单点定位模型;所述发射概率计算单元用于根据所述回归处理单元得到的单点定位模型、所述MR获取单元获取的多个MR中的每个MR的参数信息和所述特征向量单元得到多个MR中的每个MR各自对应的特征向量,计算所述多个MR中的每个MR各自对应的特征向量的发射概率,其中,所述发射概率包括至少一个发射概率值,所述发射概率值用于指示某一特征向量对应某一位置信息的概率;
或者,所述转移概率计算模块包括轨迹获取单元、转移概率计算单元;所述轨迹获取单元用于获取目标区域内第二终端的多个轨迹数据,其中,所述多个轨迹数据中的每一轨迹数据包含至少两个位置信息,所述位置信息用于指示包含所述位置信息的轨迹数据对应的第二终端在所述目标区域内的位置,所述多个轨迹数据包含的多个位置信息中的每一位置信息对应一个时间戳;所述转移概率计算单元用于根据所述轨迹获取单元获取的多个轨迹数据计算转移概率,其中,所述转移概率包括至少一个转移概率值,所述转移概率值用于指示某一位置信息经时间间隔T到另一位置信息的概率。
第七方面的一个可能的实现方式,所述多个MR中的每个MR的参数信息包含至少一个基站ID,所述基站ID用于指示包含所述基站ID的MR对应的第一终端所连接的基站,所述至少一个基站至少包括所述多个MR包含的基站ID所指示的基站;所述特征向量单元具体用于:根据基站ID将所述MR获取单元获取的多个MR与所述MR获取单元获取的至少一个基站的工程参数进行匹配,得到所述多个MR中每个MR各自的关联工程参数,其中,任一MR的关联工程参数包括所述任一MR中每个基站ID所指示基站的工程参数;根据所述MR获取单元获取的多个MR中每个MR各自的关联工程参数和参数信息,得到所述多个MR中每个MR各自对应的特征向量,其中,任一特征向量包括同一MR的关联工程参数和参数信息。
第七方面的一个可能的实现方式,所述回归处理单元具体用于:根据所述MR获取单元获取的多个MR中的每个MR的位置信息和所述特征向量单元得到的多个MR中的每个MR各自对应的特征向量,得到所述多个MR中的每个MR各自对应的训练集合,其中,任一训练集合包括同一MR对应的特征向量和位置信息;将所述多个MR中的每个MR各自对应的训练集输入所述机器学习模型进行训练,得到所述单点定位模型。
第七方面的一个可能的实现方式,所述发射概率计算单元具体用于:将所述MR获取单元获取的多个MR中的每个MR的位置信息和所述特征向量单元得到的多个MR中的每个MR各自对应的特征向量输入所述回归处理单元得到的单点定位模型,得到映射关系,其中,所述映射关系用于指示特征向量与位置信息的对应关系;根据所述映射关系计算所述多个MR中的每个MR各自对应的特征向量的发射概率。
第七方面的一个可能的实现方式,所述转移概率计算单元包括:预处理子单元和转移概率计算子单元;所述预处理子单元用于对所述轨迹获取单元获得的多个轨迹数据进行处理,得到所述多个轨迹数据中的每一轨迹数据的至少一个组合序列,其中,所述组合序列包括同一轨迹数据中的任意两个位置信息及所述任意两个位置信息的时间间隔;所述转移概率计算子单元用于根据第一预设条件和所述预处理子单元得到的多个轨迹数据中的每一轨迹数据的至少一个组合序列,得到对应所述第一预设条件的转移概率,其中,所述第一预设条件为多个预设条件中的任一个,所述多个预设条件中的每一预设条件包括预设时间间隔和预设位置信息,所述预设时间间隔对应所述时间间隔T,所述预设位置信息对应所述某一位置信息。
第七方面的一个可能的实现方式,所述转移概率计算子单元具体用于:确定所述预处理子单元得到的多个轨迹数据包含的全部组合序列中包含所述第一预设条件中的预设时间间隔和预设位置信息的组合序列;统计所述包含所述预设条件中的预设时间间隔和预设位置信息的组合序列,计算对应所述第一预设条件的转移概率。
第八方面,本申请提供了一种序列定位系统,本申请提供了一种序列定位系统,该系统包括:定位装置、第五方面或第五方面的任一可能的实现方式中描述的发射概率计算装置和第六方面或第六方面的任一可能的实现方式中描述的转移概率计算装置;所述定位装置包括目标测量报告MR获取模块、目标特征向量模块和轨迹预测模块;其中,所述目标MR模块用于获取目标区域内目标终端的多个目标测量报告MR和所述目标区域内至少一个基站的工程参数,其中,所述目标区域为预定的地理区域,所述多个目标MR中每个目标MR包含参数信息;所述目标特征向量模块用于根据所述目标MR模块获取的多个目标MR中的每个目标MR的参数信息和所述至少一个基站的工程参数,得到所述多个目标MR中的每个目标MR各自对应的目标特征向量;所述轨迹预测模块用于根据输入所述序列定位模块的所述目标特征向量模块得到的多个目标MR中的每个目标MR各自对应的目标特征向量,得到到所述目标终端的移动轨迹。所述发射概率计算装置向所述轨迹预测模块输入发射概率,所述转移概率计算装置相所述轨迹预测模块输入转移概率。
第九方面,本申请提供了一种发射概率计算装置,该发射概率计算装置包括:存储器、处理器;上述存储器用于存储可编程序指令,上述处理器调用上述存储器中存储的可编程序指令可以实现第一方面或第一方面的任一可能的实现方式中描述的方法。
第十方面,本申请提供了一种转移概率计算装置,该转移概率计算装置包括:存储器、处理器;上述存储器用于存储可编程序指令,上述处理器调用上述存储器中存储的可编程序指令可以实现第二方面或第二方面的任一可能的实现方式中描述的方法。
第十一方面,本申请提供了一种序列定位装置,该序列定位装置包括:存储器、处理器;上述存储器用于存储可编程序指令,上述处理器调用上述存储器中存储的可编程序指令可以实现第三方面或第四方面或第四方面的任一可能的实现方式中描述的方法。
第十二方面,本申请提供了一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行第一方面或第一方面的任一可能的实现方式或第二方面或第二方面的任一可能的实现方式或第三方面或第四方面或第四方面的任一可能实现方式中描述的方法。
第十三方面,本申请提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行第一方面或第一方面的任一可能的实现方式或第二方面或第二方面的任一可能的实现方式或第三方面或第四方面或第四方面的任一可能实现方式中描述的方法。
第十四方面,本申请提供的一种序列定位系统,该序列定位系统包括第九方面描述的发射概率计算装置、第十方面描述的转移概率计算装置和序列定位装置。所述序列定位装置包括处理器和存储器,所述存储器用于存储可编程序指令,所述处理器调用所述存储器中存储的可编程序指令执行:获取目标区域内目标终端的多个目标测量报告MR和所述目标区域内至少一个基站的工程参数,其中,所述目标区域为预定的地理区域,所述多个目标MR中每个目标MR包含参数信息;根据所述多个目标MR中的每个目标MR的参数信息和所述至少一个基站的工程参数,得到所述多个目标MR中的每个目标MR各自对应的目标特征向量;将所述多个目标MR中的每个目标MR各自对应的目标特征向量输入序列定位模型,得到所述目标终端的移动轨迹。
本申请提供的序列定位的方法,根据MR中的多种参数信息及相应基站的工程参数得到的特征向量获得发射概率能够表达更复杂的观测信息,进一步提高序列定位恢复/预测的移动轨迹更加准确、可靠;或者,以第三方真实的轨迹数据获得的转移概率用于序列定位,能够提高恢复/预测的移动轨迹的平滑性,得到移动轨迹更加可靠。
附图说明
图1是本申请提供的一种序列定位系统的结构示意图;
图2是本申请提供的一种序列定位系统应用场景的示意图;
图3是本申请提供的一种获取发射概率方法的流程图;
图4是本申请提供的一种计算发射概率的示意图;
图5是本申请提供的一种获取转移概率方法的流程图;
图6是本申请提供的一种地图匹配和插值方法的示意图;
图7是本申请提供的一种离线索引方式计算转移概率方法的示意图;
图8是本申请提供的一种在线索引方式计算转移概率方法的示意图;
图9是本申请提供的一种序列定位方法的流程图;
图10是本申请提供的一种根据列定位方法恢复轨迹的示意图;
图11是本申请提供的一种粒子滤波序列定位方法的示意图;图12是本申请提供的一种发射概率计算装置的示意图;
图13是本申请提供的一种转移概率计算装置的示意图;
图14是本申请提供的一种序列定位装置的示意图;
图15是本申请提供的一种计算发射概率和或转移概率设备的示意图;
图16是本申请提供的实际测试实验的实验设置及结果。
具体实施方式
下面将结合附图,对本申请实施例中的技术方案进行描述。
本申请一个实施例描述了一种定位系统,该系统用于对电信用户进行定位,恢复电信用户移动的轨迹。如图1所示,该定位系统包括发射概率(emission probability)计算装置、转移概率(transition probability)计算装置和序列定位装置,发射概率装置、转移概率装置、序列定位装置之间通过数据链路进行数据通信;其中,发射概率计算装置用于计算用于序列定位的发射概率,输入为带位置标注的测量报告(Measurement Report,MR)数据,输出发射概率;转移概率计算装置用于计算用于序列定位的转移概率,输入为移动轨迹数据,输出为转移概率;序列定位装置用于根据发射概率、转移概率以及待定位终端/设备的MR数据,恢复该待定终端/设备的移动轨迹,输入为待定位目标终端的一串MR(无位置信息),输出为待定位目标终端移动轨迹,需要注意的是,也可以用于单点定位,即输入为一个MR,输出一个对应位置;下面会结合附图在进一步描述发射概率装置、转移概率装置和序列定位装置的具体结构及功能,在此不再赘述。需要注意的是,发射概率装置、转移概率装置、序列定位装置也可以组成一个整体设备,发射概率装置是该整体设备的发射概率计算模块,转移概率装置是该整体设备的转移概率计算模块,序列定位装置是该整体设备的序列定位模块,各模块的功能与对应装置的功能相同,各模块之间可以进行数据传递。可选的,由发射概率计算模块、转移概率计算模块和序列定位模块各个模块或上述三个功能模块构成的整体所实现的功能通过软件实现,也可以软件+硬件实现。
通常上,可以将上述定位系统部署在大数据分析平台上,当每天的MR存储到平台上时,首先会输入到定位系统,定位系统会根据MR抽取特征然后用我们离线训练好的模型预测出每一条MR记录的经纬度位置并添加回MR中,带经纬度位置的MR可以进行进一步的分析建模。
本申请一个实施例描述了一种应用场景,如图2所示,在该应用场景中,上述实施例描述的定位系统可以作为运营商大数据分析平台的一个组件,以小时或日为单位将移动设备上传运营商管道中的MR输入定位系统中,定位系统会对输入其中的每一个MR得到一个相应的位置信息并添加到MR中;随后,这些已添加位置信息的MR可以用于运营商进行用户画像、人流预测、户外广告投放策略优化等用途。
本申请一个实施例描述了一种获得发射概率的方法,如图3所示,该方法包括以下步骤:
S101,获取目标区域内终端的多个测量报告MR和基站的工程参数;目标区域是指特定的地理区域,例如郊区、市区、城市、农村等,不限于面积大小、行政区域、地理位置;每个MR中包含位置信息和参数信息,位置信息用于标注对应的终端在该目标区域内的位置。
S102,根据参数信息和工程参数得到每个MR各自对应的特征向量;具体地,根据参数信息中的基站ID,将MR与基站工程参数进行匹配,得到每个MR的关联工程参数;将每个MR的关联工程参数与其信息参数组合成其对应的特征向量。在具体实现上,MR中的信息参数可能包含一个或多个基站ID,这也表示该MR对应的终端同一时刻与一个或多个基站连接;当MR终端的参数信息包含多个基站ID时,那么某一MR的关联工程则为多个基站ID指示的基站的工程参数的集合。
S103,通过机器学习模型处理位置信息和特征向量得到单点定位模型;具体地,将每一MR的位置信息和对应的特征向量构成一组训练集合,并将每一MR对应的训练集合输入机器学习模型进行训练,得到单点定位模型;可选的,该单点定位模型可直接用于对目标区域的待定位终端进行定位,其输入为该待定位终端的MR中参数信息和基站工程参数组成的特征向量,输出为该待定位终端的位置信息。可选的,机器学习模型为回归模型,例如线性回归、随机森林等。
S104,根据单点定位模型、位置信息和特征向量计算发射概率;发射概率包括至少一个发射概率值,发射概率值用于指示作为观测值的某一特征向量对应作为隐含值的某一的位置信息的映射关系。具体地,将每个MR的位置信息和对应的特征向量输入所述单点定位模型得到映射关系,映射关系用于指示特征向量与位置信息的对应关系;根据映射关系计算每个MR各自对应的特征向量的发射概率。需要注意的是,S104涉及的位置信息和特征向量与S101–S103中可能涉及的位置信息和特征向量不一定是基于相同的MR得到,因为需要获取大量的MR,使用相同的MR减少数据再获取环节,且从结果来看,在MR基数足够大的情况下,是否使用不同的MR对结果影响较小。
一个计算发射概率的可能的实现方式,如下:
通过训练一个单点定位模型,随后使用这个单点定位模型的模型空间进行发射概率的计算,具体的包括:
首先,获取预设的地理区域内多个移动终端的MR,MR包括位置标注,例如MR中携带的GPS信息,以及获取一些其他电信网络中的数据,例如基站的工程参数,工程参数主要包括工程参数中主要包括了基站的ID、经纬度位置、天线挂高、天线方位角等信息。
然后,通过特征工程的方法从上述获取的数据中抽取与定位相关的特征作为相应MR的特征向量,特征向量可能包括连接基站、临区基站的工程参数、连接的信号强度等;具体的,将携带GPS的MR与基站的工程参数按照基站ID进行匹配,为MR中每一基站在工程参数中找到对应的参数信息;进一步地,在匹配后的数据上再加上一些简单的特征工程参数,例如每个MR连接的基站数量,不同基站位于不同的经纬度位置;或者,扇区数量,多个扇区可能会位于同一个经纬度为位置。这样,就可以为每一个MR创建一个特征向量,同一MR的特征向量和位置标注则组成相应该MR的训练集合,用于训练单点定位模型。
表1给出了一些用于训练定位模型的电信特征。包括了MR中的一些原始字段和基站工程参数中的一些字段。带*号的特征表示这些字段针对的是同一条MR的连接基站和临区基站,因此同一个字段会在特征向量中出现多次,对应不同的基站。
表1定位模型使用的特征列表
再则,将上面步骤得到的全部训练集合输入机器学习回归模型,进行训练得到相对应模型——单点定位模型。机器学习回归模型可以有多种,比如线性回归,随机森林等;通常对于较大区域的单点定位模型训练,我们会将区域进行分块,对每块都训练一个单点定位模型,这样可以学习到不同区域的不同特征,比如城区和郊区训练两个模型。
最后,将上面步骤得到的特征向量或者基于其他带有位置标注的MR样本得到的特征序列作为观测值,位置标注作为隐含状态,输入上面步骤得到单点定位模型,则可以通过分析该单点定位模型的模型空间,得到位置标注和特征向量之间的对应关系,进而得得到P(特征向量|位置)。
不同模型的模型空间对应着不同的计算方式,下面以随机森林为例介绍模型空间的分析方法以及发射概率的计算方式,具体介绍如下:
当一个样本(包括特征向量和位置标注)输入到随机森林之后,会不断根据比较样本的特征值与决策节点的分裂特征值的大小,从而选择左孩子节点或者右孩子节点,直到最后到达叶子节点。因此,随机森林中的每一个叶子节点都可以看成一系列特征向量(通过一系列决策节点的分裂特征得到),一个叶子节点看作一个观测值,于是发射概率就转变为给定标签得到叶子节点的概率P(叶子节点|标注)。如图4所示,将标注样本输入到训练好的树模型中,每个标注样本都能在树中找到自己对应的一个叶子节点(如图4第三部分所示)。于是,发射概率值就可以由该标注样本落在该叶子节点中的数量除以该标注样本中相同标签的总表标注样本数得到,比如圆点样本一共有10个而只有一个落在图4第三幅图的最左侧的的叶子节点中,那么发射概率值就是1/10,它表示标注样本的位置与观测值的符合程度(在该位置上可以得到类似的观测值的概率),符合程度越高说明预测的位置越准。
本申请一个实施例描述了一种获得转移概率的方法,如图5所示,该方法包括以下步骤:
S201,获取目标区域内一个或多个终端的多个轨迹数据,目标区域是指特定的地理区域,例如郊区、市区、城市、农村等,不限于面积大小、行政区域、地理位置;每一轨迹数据包含至少两个位置信息,位置信息用于标注终端在该目标区域内的位置,每一位置信息对应一个时间戳,时间戳用于指示终端生成对应的位置信息的时刻。在具体实现中,可以从第三方平台获取轨迹数据,例如滴滴出行、交通数据公布平台等。
可选的,获取目标区域内一个或多个终端的多个轨迹数据为:获取交通高峰时段的该目标区域内终端的轨迹数据,或者,获取交通非高峰时段的该目标区域内一个或多个终端的轨迹数据;也可以,预设的时间段的一个或多个终端的轨迹数据。当然,根据某一时间段获取的终端的轨迹数据得到转移概率,应用于相同的某一时间段的序列定位的效果最佳,也可以应用于与该时间段类似的时间段的序列定位的。
S202,根据上述多个轨迹数据计算转移概率,转移概率包括至少一个转移概率值,转移概率值用于指示某一位置信息(起始位置)经时间间隔T到另一位置信息(到达位置)的概率。具体地,对获取的多个轨迹数据进行处理,得到每一轨迹数据的组合序列,同一轨迹数据中的任意两个位置信息及该任意两个位置信息的时间间隔构成一个组合序列;一个轨迹数据可能有一个或多个组合序列;一个组合序列中的两个位置信息,起一个位置信息作为起始位置,另一个则为到达位置,该组合序列则表示起始位置经过某一时间间隔至到达位置;在上面得到所有组合序列中筛选出包含预设条件的组合序列,该预设条件为预设起始位置和时间间隔,预设条件不同筛选出的组合序列也不同;在筛选出的符合预设条件的组合序列中,以到达位置为对象,统计不同到达位置的数量并计算相应占符合预设条件的全部组合序列的概率值,即转移概率值,计算得到全部概率值的集合为对应该预设条件的转移概率。可选的,预设条件中的预设时间间隔可以是某一时间间隔,也可以是时间间隔范围,例如:预设时间间隔为2秒,或者,预设时间间隔为2—4秒,也就是时间间隔满足2‐4范围则符合预设条件的预设时间间隔。
可选的,在根据上多个轨迹数据计算转移概率之前,剔除多个轨迹数据中的瑕疵轨迹数据,瑕疵轨迹数据是指存在位置信息偏离目标区域内道路的距离大于一定阈值的轨迹数据,或,存在相邻的两个位置信息之间的距离大于一定阈值的轨迹数据。将剔除瑕疵轨迹数据后多个轨迹数据用于计算转移概率,可以提高转移概率的可靠程度或两相邻位置过渡的平滑程度。
可选的,在根据上多个轨迹数据计算转移概率之前,通过插值稠密化获得的轨迹数据中的稀疏轨迹数据,稀疏轨迹数据是指任意两个相邻的位置信息之间的距离大于第三阈值的轨迹数据,插值是指根据地图信息和轨迹数据在相邻的位置信息之间添加一个或多个位置信息,使得轨迹数据中的位置信息稠密,具体的可以根据间隔时间进行添加位置信息,例如某一轨迹仅有两个位置且两位置之时间间隔6秒,要实现时间间隔为3秒,则在两个位置之间插入一个位置,可以使得该轨迹的位置之间的时间间隔为3秒;基于上一例子,要实现时间间隔为1秒,则可以两个位置之间插入5个位置,即每个1秒插入一个位置,可以使得该轨迹的位置之间的时间间隔为1秒。插入的位置的具体地理位置信息则根据地图信息和轨迹可以比较准确的确定。
本申请一个实施例描述的获得转移概率的方法是利用迁移知识的概念,将从真实轨迹数据中学习到的运动模式用于计算转移概率。
一个计算转移概率的可能的实现方式,如下:
首先,获取一批在定位区域中的第三方轨迹数据,随后将数据中偏差比较大的轨迹去掉,偏差大表现在轨迹中的点距离道路比较远或者轨迹中频繁出现点瞬间跳跃到很远地方的情况。然后,对不够稠密的轨迹数据使用地图匹配加插值的方法进行密集化,使得我们能够得到比较细粒度(轨迹相邻两点的时间间隔尽量小)的转移概率。最后需要对轨迹点坐标进行离散化,对整块定位区域均匀划分矩形栅格(栅格大小在20m*20m左右),这样每一个坐标点就可以唯一对应一个栅格ID。
转移概率计算过程可以分为轨迹密集化和转移概率学习两大过程。
轨迹密集化过程是为了能够学习到任意时间间隔的转移概率,具体的,首先把每条轨迹通过地图匹配算法映射到路网上,这样每条轨迹经过的路段都可以被推测出来。随后我们沿着轨迹经过的道路均匀地进行插值,使得插值之后相邻两点间的时间间隔为1s,这样以秒为粒度任意时间间隔的转移概率都可以被学习出来。
如图6所示的一种地图匹配和插值的实现方法。地图匹配方法有很多种,比如使用的是针对低采样频率轨迹的地图匹配方法,通过计算原始轨迹点到附近路段的匹配概率和路段之间的转移概率,就能得到一个概率最大的路段序列,得到匹配的路径之后,再在轨迹相邻点之间均匀插值直到满足相邻两点之间的时间间隔等于1s。
转移概率学习过程主要是从轨迹中学习到从每个位置到其他位置的转移概率,具体的学习方式有很多种。
本申请一个实施例描述了一种离线索引方式学习转移概率的方法,如图7所示,该方式分为两个部分,上半部分是离线索引建立,下半部分是在线查询。
建立离线索引一共需要三步,第一步将轨迹数据处理成图7中表格形式,一共为3列(轨迹ID,时间戳,栅格ID),每一行代表一个轨迹点的记录。接下来第二步是从这个表格中抽取出三元组<Δt,i,j>,Δt为两条记录的时间戳之差,i和j分别为两条记录的栅格ID。相同轨迹ID的记录两两可以生成一个三元组,表示可以在Δt时间内从栅格i移动到栅格j。在实际实现中,只需要抽取Δt<60s的记录即可。第三步通过统计第二步生成的三元组得到转移概率矩阵。比如从栅格1出发1s内到达其他栅格的概率,只需要找出所有满足Δt=1,i=1的三元组<1,1,j>,然后统计不同j出现的频率可以得到转移概率向量,即满足Δt=1,i=1条件的转移概率。根据不同的出发栅格i可以得到转移概率矩阵(转移的时间间隔相同),然后不同的转移时间间隔又可以得到不同的转移概率矩阵。同时,为了更符合现实情况,我们区分了高峰时段和非高峰时段的转移概率。使用高峰时段(比如7:00-9:00,17:00-19:00)的轨迹数据来生成高峰时段的转移矩阵,用其他时段的轨迹数据来生成非高峰时段的转移矩阵。
在线查询过程主要是在序列定位时,给定转移时间间隔和出发栅格的条件下,获得到达其他栅格的概率分布向量。首先,根据当前的时间是否是高峰时段选择对应的离线索引;随后,根据时间间隔Δt选取对应的转移概率矩阵;最后,根据出发栅格i,找到转移概率矩阵中的对应行即为要求的转移概率向量。
本申请一个实施例描述了一种在线索引方式的转移概率计算方法,如图8所示,该方式也可以分为三步,前两步和离线索引一样。首先将轨迹数据处理成三列的表格形式(轨迹ID,时间戳,栅格ID),然后从这个表格中抽取出三元组<Δt,i,j>。接下来用RTree对所有抽取出来的三元组<Δt,i,j>建立三维索引(三元组中的三个元素分别对应索引的三维)。
在线查询时,利用RTree的范围查询(Range Query),给定Δt和i的范围,比如1≤Δt≤2,1≤i≤1,RTree能返回所有满足这个条件的三元组,之后再从中取出所有第三个元素j,根据j的值分布得到转移概率分布。在线索引与离线索引不同之处是它可以把时间间隔设置为一个范围,比如上面例子里设置的1-2s。
本申请一个实施例描述了一种序列定位的方法,如图9所示,该方法包括以下步骤:
S301,获取目标区域内目标终端的多个目标MR和基站的工程参数,每个目标MR包含参数信息;
S302,根据目标MR的参数信息和基站的工程参数得到目标特征向量;每个目标MR对应一个目标特征向量,目标特征向量作为观测值,用于输入序列定位模型得到相应的隐含的位置;
S303,将得到的目标特征向量输入序列定位模型得到该目标终端的移动轨迹。该序列定位模型应用到的发射概率和转移概率通过上面实施例描述的获得发射概率的方法和获得转移概率的方法计算,此处不再赘述。需要注意的是,获得发射概率、转移概率的目标区域与序列定位的目标区域为同一个地理区域,同样的,时间段上也为同一时间段,这样的效果更佳。
当发射概率和转移概率都准备好之后,就可以使用序列定位方法恢复用户的轨迹。与计算发射概率时得到特征向量的方法一样,这里也需要对待定位的终端的MR做同样的处理,生成对应的特征向量,将同一个待定位终端的一串特征向量加上之前得到的发射概率和转移概率输入到序列定位方法中,算法就能够根据特征序列预测出待定位终端移动的轨迹,如图10所示。
序列定位方法有多种方式,本申请一个实施例描述了一种粒子滤波序列定位方法,如图11所示。粒子滤波的思想是找到一串粒子序列长度为T(长度和要恢复的轨迹长度相同),使这个序列和MR的特征向量最相符。
第一步,在状态空间内初始化粒子,生成一个粒子集P={p^((1)),p^((2)),…,p^((N))},每个粒子对应一个状态和一个重要性权重<x_1^((i)),w_1^((i))>(上标i表示第几个粒子,下标1表示这个粒子对应轨迹中的第一个点),通常粒子的个数在几百几千这个范围,初始化的每个粒子都会在后面的步骤中通过状态转移形成一个粒子序列,并且初始的状态会选择一个在合理的范围内进行随机初始化(比如在连接基站方圆几百米之内)。重要性权重即为发射概率p(y|x)给定状态得到观测值的概率,根据之前发射概率的计算方法,输入粒子的状态(相当于标注),得到对应的发射概率值。
第二步是采样。随后根据每个粒子的当前状态x_j^((i))、MR中前后两点的时间间隔Δt_j采样下一状态,这里使用到了前面实施例中的离线索引,通过上面描述的在线查询方法输入Δt_j和x_j^((i))之后得到状态转移概率分布p(x_(j+1)^((i))|x_j^((i)))。从这个分布中采样一个状态作为第i个粒子j+1时刻的状态x_(j+1)^((i))。
第三步是决策。根据x_(j+1)^((i))和w_j^((i))计算对应的重要性权重w_(j+1)^((i))=w_j^((i))p(y_(j+1)|x_(j+1)^((i)))。对所有粒子序列的重要性权重进行归一化可以得到一个重要性的分布。做完第二和第三步之后,粒子集中的所有粒子序列的长度都增加了1。
第四步是重采样。如果此时所有粒子序列的重要性权重的分布满足一定条件,则对粒子进行重采样。重采样就是一种有放回采样的过程,按照权重的大小来进行采样,权重越大的粒子序列被采样到的概率就越大(并且可能会被采样到多次)。用重采样之后的粒子序列替换之前的(采样前后序列的数量不变)。如果当前粒子序列长度小于T,则需要把所有粒子序列的重要性权重都重置成1/N。
重复二三四步,直到粒子序列长度等于T。此时用重要性权重最大的粒子序列来作为预测轨迹输出,一个粒子序列对应着一串状态,也就是一串经纬度位置。
本申请一个实施例描述了一种Viterbi序列定位的方法。该方法利用了动态规划的思想,不断地更新V_(t,k)矩阵,它表示前t个序列的最终状态为k的状态序列的概率。每次计算V_(t+1,k)时,都要找V_(t,x)*a_(x,k)的最大值,其中x是变量,也就是找到最合适的k的前一个状态;a_(x,k)是我们求出的转移概率,从x栅格移动到k栅格的概率。随后V_(t+1,k)=〖b_y(k)*max(V〗_(t,x)*a_(x,k)),其中b代表求出的发射概率,这样更新完所有的V矩阵值之后就可以找到V_(T,k)这一行中的最大值,接着回溯找前一个状态(满足前面公式中最大值得状态),直到得到一个状态转移序列。
本申请一个实施例描述了一种发射概率计算装置,如图12所示,发射概率计算装置100包括:MR获取模块110、特征向量模块120、回归处理模块130和发射概率计算模块140;MR获取模块110用于获取目标区域内终端的多个测量报告MR和目标区域内至少一个基站的工程参数,其中,目标区域为预定的地理区域,多个MR中的每个MR包含位置信息和参数信息,位置信息用于指示对应的终端在目标区域内的位置;特征向量模块120用于根据MR获取模块110获取的多个MR中的每个MR的参数信息和至少一个基站的工程参数,得到多个MR中的每个MR各自对应的特征向量;回归处理模块130用于根据MR获取模块110获取的多个MR中的每个MR的位置信息和特征向量模块120得到的多个MR中的每个MR各自对应的特征向量,得到单点定位模型;发射概率计算模块140用于根据回归处理模块130得到的单点定位模型、MR获取模块110获取的多个MR中的每个MR的位置信息和特征向量模块120得到多个MR中的每个MR各自对应的特征向量,计算多个MR中的每个MR各自对应的特征向量的发射概率,其中,发射概率包括至少一个发射概率值,发射概率值用于指示某一特征向量对应某一位置信息的概率。
进一步地,多个MR中的每个MR的参数信息包含至少一个基站ID,基站ID用于指示包含基站ID的MR对应的终端所连接的基站,至少一个基站至少包括多个MR包含的基站ID所指示的基站;特征向量模块120具体用于:根据基站ID将MR获取模块110获取的多个MR与MR获取模块110获取的至少一个基站的工程参数进行匹配,得到多个MR中每个MR各自的关联工程参数,其中,任一MR的关联工程参数包括任一MR中每个基站ID所指示基站的工程参数;根据MR获取模块获取的多个MR中每个MR各自的关联工程参数和参数信息,得到多个MR中每个MR各自对应的特征向量,其中,任一特征向量包括同一MR的关联工程参数和参数信息。
进一步地,回归处理模块130具体用于:根据MR获取模块110获取的多个MR中的每个MR的位置信息和特征向量模块120得到的多个MR中的每个MR各自对应的特征向量,得到多个MR中的每个MR各自对应的训练集合,其中,任一训练集合包括同一MR对应的特征向量和位置信息;将多个MR中的每个MR各自对应的训练集输入机器学习模型进行训练,得到单点定位模型。
进一步地,发射概率计算模块140具体用于:将MR获取模块110获取的多个MR中的每个MR的位置信息和特征向量模块120得到的多个MR中的每个MR各自对应的特征向量输入回归处理模块130得到的单点定位模型,得到映射关系,其中,映射关系用于指示特征向量与位置信息的对应关系;根据述映射关系计算多个MR中的每个MR各自对应的特征向量的发射概率。
本实施例描述的发射概率计算装置用于实现图3对应实施例描述的方法,更为具体的描述可以参见图3对应的实施例,此处不再赘述。
本申请一个实施例提供的发射概率计算装置,以MR中多种参数信息、相应基站的工程参数得到的特征向量作为观测值,在以上述MR对应的特征向量和位置信息训练单点定位模型,利用单点定位模型的空间模型得到的发射概率,能够表达复杂的观测信息,且特征向量(观测值)与位置信息之间的对应关系更可靠。
本申请一个实施例描述了一种转移概率计算装置,如图13所示,转移概率计算装置200包括:轨迹获取模块210、庄毅概率计算模块220;轨迹获取模块210用于获取目标区域内终端的多个轨迹数据,其中,目标区域为预定的地理区域,多个轨迹数据中的每一轨迹数据包含至少两个位置信息,位置信息用于指示对应的终端在目标区域内的位置,多个轨迹数据包含的多个位置信息中的每一位置信息对应一个时间戳;转移概率计算模块220用于根据轨迹获取模块210获取的多个轨迹数据计算转移概率,其中,转移概率包括至少一个转移概率值,转移概率值用于指示某一位置信息经时间间隔T到另一位置信息的概率。可选的,获取交通高峰时段或交通非高峰时段的目标区域内终端的多个轨迹数据。
进一步地,转移概率计算模块220包括:预处理单元221和转移概率计算单元222;预处理单元221用于对轨迹获取模块210获得的多个轨迹数据进行处理,得到多个轨迹数据中的每一轨迹数据的至少一个组合序列,其中,组合序列包括同一轨迹数据中的任意两个位置信息及该任意两个位置信息的时间间隔;转移概率计算单元222用于根据第一预设条件和预处理单元221得到的多个轨迹数据中的每一轨迹数据的至少一个组合序列,得到对应该第一预设条件的转移概率,其中,第一预设条件为多个预设条件中的任一个,多个预设条件中的每一预设条件包括预设时间间隔和预设位置信息,预设时间间隔对应上述时间间隔T,预设位置信息对应上述某一位置信息。可选的,预设时间间隔为预设的时间间隔范围。
进一步地,转移概率计算单元222具体用于:确定预处理单元221得到的多个轨迹数据包含的全部组合序列中包含第一预设条件中的预设时间间隔和预设位置信息的组合序列;统计包含预设条件中的预设时间间隔和预设位置信息的组合序列,计算对应该第一预设条件的转移概率。
可选的,转移概率计算装置200还包括:第一轨迹处理模块230;第一轨迹处理模块230用于剔除轨迹获取模块210获取的多个轨迹数据中的瑕疵轨迹数据,其中,瑕疵轨迹数据为存在至少一个位置信息偏离目标区域内道路的距离大于第一阈值的轨迹数据,或,存在相邻的两个位置信息之间的距离大于第二阈值的轨迹数据。
可选的,转移概率计算装置200还包括:第二轨迹处理模块240;第二轨迹处理模块240用于确定轨迹获取模块210获取的多个轨迹数据中的稀疏轨迹数据,其中,稀疏轨迹数据为包含的至少两个位置信息中的任意两个相邻的位置信息之间的距离大于第三阈值的轨迹数据;根据目标区域的地图信息,在稀疏轨迹数据的任意两个相邻的位置信息之间插入一个或多个位置信息。
本实施例描述的转移概率计算装置用于实现图5对应实施例描述的方法,更为具体的描述可以参见图5对应的实施例,此处不再赘述
本申请一个实施例提供的转移概率计算装置,通过第三方平台提供的目标区域内终端移动轨迹数据,根据移动轨迹数据计算的转移概率用于恢复或预测目标区域内某终端的移动轨迹会更平滑,可以有效避免轨迹跳跃现象。
本申请一个实施例提供了一种序列定位装置,如图14所示,序列定位装置300包括:发射概率计算模块310、转移概率计算模块320和序列定位模块330,序列定位模型330的应用参数包括发射概率和转移概率;发射概率计算模块310用于计算发射概率,转移概率计算模块320用于计算转移概率,序列定位模块330用于得到目标终端的移动轨迹。
具体的,发射概率计算模块310包括测量报告MR获取单元311、特征向量单元312、回归处理单元313、发射概率计算单元314;其中,MR获取单元311用于获取目标区域内第一终端的多个测量报告MR和目标区域内至少一个基站的工程参数,其中,目标区域为预定的地理区域,多个MR中的每个MR包含位置信息和参数信息,位置信息用于指示对应的第一终端在目标区域内的位置;特征向量单元312用于根据MR获取单元311获取的多个MR中的每个MR的参数信息和至少一个基站的工程参数,得到多个MR中的每个MR各自对应的特征向量;回归处理单元313用于根据MR获取单元311获取的多个MR中的每个MR的位置信息和特征向量单元312得到的多个MR中的每个MR各自对应的特征向量,得到单点定位模型;发射概率计算单元314用于根据回归处理单元313得到的单点定位模型、MR获取单元获取311的多个MR中的每个MR的参数信息和特征向量单元312得到多个MR中的每个MR各自对应的特征向量,计算多个MR中的每个MR各自对应的特征向量的发射概率,其中,发射概率包括至少一个发射概率值,发射概率值用于指示某一特征向量对应某一位置信息的概率。本实施例描述的发射概率计算模块310与图12对应的实施例描述的发射概率计算装置的功能上一致,关于发射概率计算模块310具体描述可以参见图12对应的实施例的买描述,此处不再赘述。
转移概率计算模块320包括轨迹获取单元321、第一轨迹处理单元322、第二轨迹处理单元323和转移概率计算单元324;其中,轨迹获取单元321用于获取目标区域内第二终端的多个轨迹数据,其中,多个轨迹数据中的每一轨迹数据包含至少两个位置信息,位置信息用于指示对应的第二终端在目标区域内的位置,多个轨迹数据包含的多个位置信息中的每一位置信息对应一个时间戳;第一轨迹处理单元322用于剔除轨迹获取单元321获取的多个轨迹数据中的瑕疵轨迹数据,其中,瑕疵轨迹数据为存在至少一个位置信息偏离目标区域内道路的距离大于第一阈值的轨迹数据,或,存在相邻的两个位置信息之间的距离大于第二阈值的轨迹数据。第二轨迹处理单元323用于确定轨迹获取单元321获取的多个轨迹数据中的稀疏轨迹数据,其中,稀疏轨迹数据为包含的至少两个位置信息中的任意两个相邻的位置信息之间的距离大于第三阈值的轨迹数据;根据目标区域的地图信息,在稀疏轨迹数据的任意两个相邻的位置信息之间插入一个或多个位置信息。转移概率计算单元324用于第一轨迹处理单元322和/或第二轨迹处理单元323处理后得的多个轨迹数据计算转移概率,其中,转移概率包括至少一个转移概率值,转移概率值用于指示某一位置信息经时间间隔T到另一位置信息的概率。可选的,对轨迹获取单元321获得的多个轨迹数据不经过第一轨迹处理单元322和第二轨迹处理单元323处理,转移概率计算单元324根据轨迹获取单元321获得的多个轨迹数据计算转移概率。本实施例描述的转移概率计算模块320与图13对应的实施例描述的转移概率计算装置的功能上一致,关于转移概率计算模块320的具体描述可以参见图13对应的实施例的描述,此处不再赘述。
序列定位模块330包括目标测量报告MR获取单元331、目标特征向量单元332、轨迹预测单元333;其中,目标MR单元331用于获取目标区域内目标终端的多个目标测量报告MR和目标区域内至少一个基站的工程参数,上述目标区域为预定的地理区域,上述多个目标MR中每个目标MR包含参数信息,目标特征向量单元332用于根据目标MR单元331获取的多个目标MR中的每个目标MR的参数信息和至少一个基站的工程参数,得到多个目标MR中的每个目标MR各自对应的目标特征向量,轨迹预测单元333用于根据目标特征向量单元332得到的多个目标MR中的每个目标MR各自对应的目标特征向量,得到目标终端的移动轨迹。本申请的一个实施例提供的序列定位装置,根据MR中的多种参数信息及相应基站的工程参数得到的特征向量获得发射概率能够表达更复杂的观测信息,进一步提高序列定位恢复/预测的移动轨迹更加准确、可靠;或者,以第三方真实的轨迹数据获得的转移概率用于序列定位,能够提高恢复/预测的移动轨迹的平滑性,得到移动轨迹更加可靠。
本申请一个实施例提供设备,如图15所示,设备400包括:存储器410、处理器420、输入/输出端口430和电源440。
存储器410用于存储可编程序指令;
处理器420调用存储器410中存储的可编程序指令可以执行图3对应实施例描述的获取发射概率的方法和/或图5对应实施例描述的获取转移概率的方法;具体方法参见相应实施例的描述,此处不再赘述。
输入/输出端口430用于处理器420与设备400外的设别或装置进行数据交互,具体的,处理器420通过输入/输出端口430从外界获取MR和/或轨迹数据,并通过输入/输出端口430将计算的结果输出;
电源440用于为设备400提供所需的电力。
图16展示了本申请方案实际测试实验的实验设置及结果;本申请实施例描述的基于机器学习和特征工程的序列定位方法,相比当前业界主流的单点定位方法指纹库(Fingerprint)定位、距离相关(Range-Based)定位及其他序列定位,精度上均有了大幅的提升;本申请实施例描述的序列定位方法的中位误差在路测数据上可以达到22米,精度提高超过20%以上。
相对现有技术中对于观测值的定义仅考虑了单一的信号强度,本发明将这个扩展到了任意维度的特征组合。
现有技术中对于转移概率的计算主要有两种,一种是直接从当前栅格平均概率转移到临近的栅格;另一种是假定运动模式的方程,根据该方程推算出转移概率。本申请实施例描述的方法通过真实数据计算出对于每个时间粒度的转移概率,相比现有的技术更佳切合实际并且概率更精细。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (17)
1.一种获得发射概率的方法,所述发射概率用于序列定位,其特征在于,包括:
获取目标区域内终端的多个测量报告MR和所述目标区域内至少一个基站的工程参数,其中,所述目标区域为预定的地理区域,所述多个MR中的每个MR包含位置信息和参数信息,所述位置信息用于指示包含所述位置信息的MR对应的终端在所述目标区域内的位置; 所述工程参数包括与基站的ID、经纬度位置、天线挂高、天线方位角有关的信息;
根据所述多个MR中的每个MR的参数信息和所述至少一个基站的工程参数,得到所述多个MR中的每个MR各自对应的特征向量;
通过回归模型处理所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量,得到单点定位模型;
根据所述单点定位模型、所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量,计算所述多个MR中的每个MR各自对应的特征向量的发射概率,其中,所述发射概率包括至少一个发射概率值,所述发射概率值用于指示某一特征向量对应某一位置信息的概率。
2.如权利要求1所述的方法,其特征在于,所述多个MR中的每个MR的参数信息包含至少一个基站ID,所述基站ID用于指示包含所述基站ID的MR对应的终端所连接的基站,所述至少一个基站至少包括所述多个MR包含的基站ID所指示的基站;
所述根据所述多个MR中的每个MR的参数信息和所述至少一个基站的工程参数,得到所述多个MR中的每个MR各自对应的特征向量,包括:
根据基站ID将所述多个MR与所述至少一个基站的工程参数进行匹配,得到所述多个MR中每个MR各自的关联工程参数,其中,任一MR的关联工程参数包括所述任一MR中每个基站ID所指示基站的工程参数;
根据所述多个MR中每个MR各自的关联工程参数和参数信息,得到所述多个MR中每个MR各自对应的特征向量,其中,任一特征向量包括同一MR的关联工程参数和参数信息。
3.如权利要求1所述的方法,其特征在于,所述通过回归模型处理所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量,得到单点定位模型,包括:
根据所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量,得到所述多个MR中的每个MR各自对应的训练集合,其中,任一训练集合包括同一MR对应的特征向量和位置信息;
将所述多个MR中的每个MR各自对应的训练集输入机器学习模型进行训练,得到所述单点定位模型。
4.如权利要求1所述的方法,其特征在于,所述根据所述单点定位模型、所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量,计算所述多个MR中的每个MR各自对应的特征向量的发射概率,包括:
将所述多个MR中的每个MR的位置信息和所述多个MR中的每个MR各自对应的特征向量输入所述单点定位模型,得到映射关系,其中,所述映射关系用于指示特征向量与位置信息的对应关系;
根据所述映射关系计算所述多个MR中的每个MR各自对应的特征向量的发射概率。
5.一种序列定位方法,其特征在于,包括:
获取目标区域内目标终端的多个目标测量报告MR和所述目标区域内至少一个基站的工程参数,其中,所述目标区域为预定的地理区域,所述多个目标MR中每个目标MR包含参数信息;所述工程参数包括与基站的ID、经纬度位置、天线挂高、天线方位角有关的信息;
根据所述多个目标MR中的每个目标MR的参数信息和所述至少一个基站的工程参数,得到所述多个目标MR中的每个目标MR各自对应的目标特征向量;
将所述多个目标MR中的每个目标MR各自对应的目标特征向量输入序列定位模型,得到所述目标终端的移动轨迹;
其中,所述序列定位模型的应用参数包括发射概率,在所述获取目标区域内目标终端的多个目标测量报告MR和所述目标区域内至少一个基站的工程参数之前,所述方法还包括通过以下方法获得所述发射概率:
获取目标区域内第一终端的多个测量报告MR,所述第一终端的多个MR中的每个MR包含位第一位置信息和参数信息,所述第一位置信息用于指示包含所述第一位置信息的MR对应的第一终端在所述目标区域内的位置;
根据所述第一终端的多个MR中的每个MR的参数信息和所述至少一个基站的工程参数,得到所述第一终端的多个MR中的每个MR各自对应的特征向量;
通过机器学习模型处理所述第一终端的多个MR中的每个MR的第一位置信息和所述第一终端的多个MR中的每个MR各自对应的特征向量,得到单点定位模型;
根据所述单点定位模型、所述第一终端的多个MR中的每个MR的第一位置信息和所述第一终端的多个MR中的每个MR各自对应的特征向量,计算所述第一终端的多个MR中的每个MR各自对应的特征向量的发射概率,所述发射概率包括至少一个发射概率值,所述发射概率值用于指示某一特征向量对应某一第一位置信息的概率,所述机器学习模型为回归模型。
6.如权利要求5所述的方法,其特征在于,所述第一终端的多个MR中的每个MR的参数信息包含至少一个基站ID,所述基站ID用于指示包含所述基站ID的MR对应的第一终端所连接的基站,所述至少一个基站至少包括所述第一终端的多个MR包含的全部基站ID所指示的基站;
所述根据所述第一终端的多个MR中的每个MR的参数信息和所述至少一个基站的工程参数,得到所述第一终端的多个MR中的每个MR各自对应的特征向量,包括:
根据基站ID将所述第一终端的多个MR与所述至少一个基站的工程参数进行匹配,得到所述第一终端的多个MR中每个MR各自的关联工程参数,其中,任一第一终端的MR各自的关联工程参数包括所述任一第一终端的MR中每个基站ID所指示基站的工程参数;
根据所述第一终端的多个MR中每个MR的关联工程参数和参数信息,得到所述第一终端的多个MR中每个MR各自对应的特征向量,其中,任一特征向量包括所述第一终端的同一MR的关联工程参数和参数信息。
7.如权利要求5所述的方法,其特征在于,所述通过机器学习模型处理所述第一终端的多个MR中的每个MR的第一位置信息和所述第一终端的多个MR中的每个MR各自对应的特征向量,得到单点定位模型,包括:
根据所述第一终端的多个MR中的每个MR的第一位置信息和所述第一终端的多个MR中的每个MR各自对应的特征向量,得到所述第一终端的多个MR中的每个MR各自对应的训练集合,其中,任一训练集合包括所述第一终端的同一MR对应的特征向量和第一位置信息;
将所述第一终端的多个MR中的每个MR各自对应的训练集输入所述机器学习模型进行训练,得到所述单点定位模型。
8.如权利要求5所述的方法,其特征在于, 所述根据所述单点定位模型、所述第一终端的多个MR中的每个MR的第一位置信息和所述第一终端的多个MR中的每个MR各自对应的特征向量,计算所述第一终端的多个MR中的每个MR各自对应的特征向量的发射概率,包括:
将所述第一终端的多个MR中的每个MR的第一位置信息和所述第一终端的多个MR中的每个MR各自对应的特征向量输入所述单点定位模型,得到映射关系,其中,所述映射关系用于指示特征向量与第一位置信息的对应关系;
根据所述映射关系计算所述第一终端的多个MR中的每个MR各自对应的特征向量的发射概率。
9.如权利要求5-8任选一所述的方法,其特征在于,所述序列定位模型的应用参数包括转移概率,在所述获取目标区域内目标终端的多个目标测量报告MR和所述目标区域内至少一个基站的工程参数之前,所述方法还包括通过以下方法获得所述转移概率:
获取目标区域内第二终端的多个轨迹数据,其中,所述第二终端的多个轨迹数据中的每一轨迹数据包含至少两个第二位置信息,所述第二位置信息用于指示包含所述第二位置信息的轨迹数据对应的第二终端在所述目标区域内的位置,所述第二终端的多个轨迹数据包含的多个位置信息中的每一第二位置信息对应一个时间戳;
根据所述第二终端的多个轨迹数据计算转移概率,其中,所述转移概率包括至少一个转移概率值,所述转移概率值用于指示某一第二位置信息经时间间隔T到另一第二位置信息的概率。
10.如权利要求9所述的方法,其特征在于,所述根据所述第二终端的多个轨迹数据计算转移概率包括:
对所述第二终端的多个轨迹数据进行处理,得到所述第二终端的多个轨迹数据中的每一轨迹数据的至少一个组合序列,其中,所述组合序列包括所述第二终端的同一轨迹数据中的任意两个第二位置信息及所述任意两个第二位置信息的时间间隔;
根据第一预设条件和所述第二终端的多个轨迹数据中的每一轨迹数据的至少一个组合序列,得到对应所述第一预设条件的转移概率,其中,所述第一预设条件为多个预设条件中的任一个,所述多个预设条件中的每一预设条件包括预设时间间隔和预设第二位置信息,所述预设时间间隔对应所述时间间隔T,所述预设第二位置信息对应所述某一第二位置信息。
11.如权利要求10所述的方法,其特征在于,所述根据第一预设条件和所述第二终端的多个轨迹数据中的每一轨迹数据的至少一个组合序列,得到对应所述第一预设条件的转移概率包括:
确定所述第二终端的多个轨迹数据包含的全部组合序列中包含所述第一预设条件中的预设时间间隔和预设第二位置信息的组合序列;
统计所述包含所述预设条件中的预设时间间隔和预设第二位置信息的组合序列,计算对应所述第一预设条件的转移概率。
12.如权利要求9所述的方法,其特征在于,在所述根据所述多个轨迹数据计算转移概率之前,还包括:
剔除所述多个轨迹数据中的瑕疵轨迹数据,其中,所述瑕疵轨迹数据为存在至少一个位置信息偏离所述目标区域内道路的距离大于第一阈值的轨迹数据,或,存在相邻的两个位置信息之间的距离大于第二阈值的轨迹数据。
13.如权利要求9所述的方法,其特征在于,在所述根据所述多个轨迹数据计算转移概率之前,还包括:
确定所述多个轨迹数据中的稀疏轨迹数据,其中,所述稀疏轨迹数据为包含的所述至少两个位置信息中的任意两个相邻的位置信息之间的距离大于第三阈值的轨迹数据;
根据所述目标区域的地图信息,在所述稀疏轨迹数据的任意两个相邻的位置信息之间插入一个或多个位置信息。
14.如权利要求9所述的方法,其特征在于,所述获取目标区域内终端的多个轨迹数据包括:
获取交通高峰时段或交通非高峰时段的所述目标区域内终端的多个轨迹数据。
15.一种发射概率计算装置,其特征在于,包括:存储器、处理器;
所述存储器用于存储可编程序指令;
所述处理器调用所述存储器中存储的可编程序指令执行权利要求1-4任选一所述的方法。
16.一种序列定位装置,其特征在于,包括:存储器、处理器;
所述存储器用于存储可编程序指令;
所述处理器调用所述存储器中存储的可编程序指令执行权利要求5-14任选一所述的方法。
17.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序代码,其特征在于,当该计算机程序代码由计算机执行时,使该计算机执行权利要求1-14任选一所述的方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710698562.1A CN109413683B (zh) | 2017-08-15 | 2017-08-15 | 一种获取发射概率、转移概率以及序列定位的方法和装置 |
CN201780087427.1A CN110326323B (zh) | 2017-08-15 | 2017-10-31 | 一种获取发射概率、转移概率以及序列定位的方法和装置 |
PCT/CN2017/108647 WO2019033565A1 (zh) | 2017-08-15 | 2017-10-31 | 一种获取发射概率、转移概率以及序列定位的方法和装置 |
EP17921756.7A EP3657841A4 (en) | 2017-08-15 | 2017-10-31 | METHOD AND DEVICE FOR OBTAINING THE EMISSION PROBABILITY, TRANSMISSION PROBABILITY AND SEQUENCE POSITIONING |
US16/791,795 US11290975B2 (en) | 2017-08-15 | 2020-02-14 | Method and apparatus for obtaining emission probability, method and apparatus for obtaining transition probability, and sequence positioning method and apparatus |
US17/688,087 US20220191818A1 (en) | 2017-08-15 | 2022-03-07 | Method and Apparatus for Obtaining Emission Probability, Method and Apparatus for Obtaining Transition Probability, and Sequence Positioning Method and Apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710698562.1A CN109413683B (zh) | 2017-08-15 | 2017-08-15 | 一种获取发射概率、转移概率以及序列定位的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109413683A CN109413683A (zh) | 2019-03-01 |
CN109413683B true CN109413683B (zh) | 2021-09-21 |
Family
ID=65361759
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710698562.1A Active CN109413683B (zh) | 2017-08-15 | 2017-08-15 | 一种获取发射概率、转移概率以及序列定位的方法和装置 |
CN201780087427.1A Active CN110326323B (zh) | 2017-08-15 | 2017-10-31 | 一种获取发射概率、转移概率以及序列定位的方法和装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780087427.1A Active CN110326323B (zh) | 2017-08-15 | 2017-10-31 | 一种获取发射概率、转移概率以及序列定位的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (2) | US11290975B2 (zh) |
EP (1) | EP3657841A4 (zh) |
CN (2) | CN109413683B (zh) |
WO (1) | WO2019033565A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109413683B (zh) * | 2017-08-15 | 2021-09-21 | 华为技术有限公司 | 一种获取发射概率、转移概率以及序列定位的方法和装置 |
CN111867049B (zh) * | 2019-04-25 | 2021-11-19 | 华为技术服务有限公司 | 定位方法、装置及存储介质 |
CN110809284B (zh) * | 2019-09-25 | 2022-09-16 | 福建新大陆软件工程有限公司 | 基于mr数据的定位方法、系统、设备、可读存储介质 |
CN115297506B (zh) * | 2022-10-10 | 2022-12-20 | 中通服建设有限公司 | 一种基于大数据的地铁线路网络智能测评方法和系统 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7257414B2 (en) * | 1998-09-22 | 2007-08-14 | Polaris Wireless, Inc. | Estimating the Location of a Wireless Terminal Based on Non-Uniform Probabilities of Movement |
JP4053234B2 (ja) * | 2000-12-11 | 2008-02-27 | 株式会社日立グローバルストレージテクノロジーズ | ディスク装置 |
FI113409B (fi) * | 2002-05-31 | 2004-04-15 | Ekahau Oy | Sekvenssiperusteinen paikannustekniikka |
AU2006309464B2 (en) * | 2005-10-31 | 2009-10-29 | Lg Electronics Inc. | Method for processing control information in a wireless mobile communication system |
US8209121B1 (en) * | 2007-10-10 | 2012-06-26 | Google Inc. | Registration of location data to street maps using hidden markov models, and application thereof |
US8554247B2 (en) * | 2008-11-13 | 2013-10-08 | Glopos Fzc | Method and system for refining accuracy of location positioning |
CN103037507A (zh) * | 2012-12-17 | 2013-04-10 | 浙江鸿程计算机系统有限公司 | 一种基于Cell-ID定位技术的地图匹配方法 |
US9225789B2 (en) * | 2013-10-10 | 2015-12-29 | Pushd, Inc. | Automated mobile positional social media method and system |
ES2458621B1 (es) * | 2013-10-15 | 2015-02-10 | Aoife Solutions, S.L. | Sistema de control descentralizado de redes inalámbricas |
CN103634810B (zh) | 2013-12-24 | 2017-04-12 | 英国Ranplan无线网络设计公司 | 一种室内无线网络覆盖问题区域定位的方法 |
CN104853432A (zh) * | 2014-02-18 | 2015-08-19 | 电信科学技术研究院 | Wlan接入点的位置确定方法及用户设备、网络侧设备 |
US9125019B1 (en) * | 2014-05-01 | 2015-09-01 | Glopos Fzc | Positioning arrangement, method, mobile device and computer program |
IL239503B (en) * | 2014-06-19 | 2018-08-30 | Cellwize Wireless Tech Ltd | A method and system for analyzing data collected in a cellular network |
CN104202761A (zh) * | 2014-09-15 | 2014-12-10 | 南通大学 | 信道状态转移概率估计方法 |
US9173064B1 (en) * | 2014-10-06 | 2015-10-27 | Polaris Wireless, Inc. | Estimating proximity to a mobile station by manipulating an interfering signal |
CN105303837A (zh) * | 2015-11-24 | 2016-02-03 | 东南大学 | 一种检测驾驶人跟驰行为特性参数的方法及系统 |
CN106595633B (zh) * | 2016-11-25 | 2019-07-19 | 北京邮电大学 | 室内定位方法及装置 |
CN106709606B (zh) * | 2016-12-29 | 2020-10-30 | 平安科技(深圳)有限公司 | 个性化场景预测方法及装置 |
CN107231615A (zh) * | 2017-06-27 | 2017-10-03 | 深圳市优网精蜂网络有限公司 | 一种基于网络指纹的定位方法及系统 |
CN109413683B (zh) * | 2017-08-15 | 2021-09-21 | 华为技术有限公司 | 一种获取发射概率、转移概率以及序列定位的方法和装置 |
-
2017
- 2017-08-15 CN CN201710698562.1A patent/CN109413683B/zh active Active
- 2017-10-31 CN CN201780087427.1A patent/CN110326323B/zh active Active
- 2017-10-31 EP EP17921756.7A patent/EP3657841A4/en active Pending
- 2017-10-31 WO PCT/CN2017/108647 patent/WO2019033565A1/zh unknown
-
2020
- 2020-02-14 US US16/791,795 patent/US11290975B2/en active Active
-
2022
- 2022-03-07 US US17/688,087 patent/US20220191818A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN109413683A (zh) | 2019-03-01 |
US20200187149A1 (en) | 2020-06-11 |
EP3657841A1 (en) | 2020-05-27 |
US11290975B2 (en) | 2022-03-29 |
CN110326323B (zh) | 2021-12-14 |
CN110326323A (zh) | 2019-10-11 |
US20220191818A1 (en) | 2022-06-16 |
EP3657841A4 (en) | 2020-05-27 |
WO2019033565A1 (zh) | 2019-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109413683B (zh) | 一种获取发射概率、转移概率以及序列定位的方法和装置 | |
CN106981198B (zh) | 用于旅行时间预测的深度学习网络模型及其建立方法 | |
CN106355289B (zh) | 一种基于位置服务的景区客流量预测方法 | |
CN106790468B (zh) | 一种分析用户WiFi活动轨迹规律的分布式实现方法 | |
CN106920387B (zh) | 获取交通道路中路线热度的方法及装置 | |
CN105682025A (zh) | 基于移动信令数据的用户驻留地识别方法 | |
CN103747523A (zh) | 一种基于无线网络的用户位置预测系统和方法 | |
CN109688532A (zh) | 一种划分城市功能区域的方法及装置 | |
CN109041218B (zh) | 一种预测用户位置的方法和智能硬件 | |
CN107018493A (zh) | 一种基于连续时序马尔科夫模型的地理位置预测方法 | |
CN111148030A (zh) | 指纹数据库的更新方法、装置、服务器及存储介质 | |
CN108632832B (zh) | 网络覆盖分析方法及系统 | |
CN105844031B (zh) | 一种基于手机定位数据的城市交通廊道识别方法 | |
CN112712169A (zh) | 基于图卷积的全残差深度网络的模型建立方法及应用 | |
CN111950798A (zh) | 一种基于小波神经网络的区域短期人流量趋势预测方法及其系统 | |
CN110766792B (zh) | 基于ArcGIS水文分析工具网格演算次序编码方法 | |
Padmanaban | Integrating of urban growth modelling and utility management system using spatio temporal data mining | |
CN111008730B (zh) | 基于城市空间结构的人群聚集度预测模型构建方法及装置 | |
CN104504900B (zh) | 基于emd算法的个体出行手机切换序列道路匹配方法 | |
EP2302571A1 (en) | Method and apparatus for efficiently configuring a motion simulation device | |
KR102364331B1 (ko) | 퍼스널 모빌리티를 이용하는 이용자의 위치를 추정하는 위치 추정 장치, 방법 및 시스템 | |
CN111970685B (zh) | 一种大数据环境下一人多卡识别方法 | |
Shad et al. | Precise location acquisition of mobility data using cell-id | |
CN110795519A (zh) | 基于Markov模型和概率统计的位置预测方法及可读存储介质 | |
Tan et al. | The methods of extracting spatiotemporal characteristics of travel based on mobile phone data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |