CN111858800B - 确定大门通行状态的方法、装置、设备和计算机存储介质 - Google Patents

确定大门通行状态的方法、装置、设备和计算机存储介质 Download PDF

Info

Publication number
CN111858800B
CN111858800B CN202010610821.2A CN202010610821A CN111858800B CN 111858800 B CN111858800 B CN 111858800B CN 202010610821 A CN202010610821 A CN 202010610821A CN 111858800 B CN111858800 B CN 111858800B
Authority
CN
China
Prior art keywords
gate
regional
track
geographic location
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010610821.2A
Other languages
English (en)
Other versions
CN111858800A (zh
Inventor
夏德国
王帅
卢振
白玉
白红霞
蒋冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010610821.2A priority Critical patent/CN111858800B/zh
Publication of CN111858800A publication Critical patent/CN111858800A/zh
Application granted granted Critical
Publication of CN111858800B publication Critical patent/CN111858800B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Traffic Control Systems (AREA)

Abstract

本申请公开了一种确定大门通行状态的方法、装置、设备和计算机存储介质,涉及大数据及智能交通技术领域。具体实现方案为:获取预设时段内的车行类轨迹数据;从所述车行类轨迹数据中获取穿行具有大门的区域类地理位置的轨迹数据;从穿行所述区域类地理位置的轨迹数据中提取与穿行所述大门相关的特征;基于提取的特征,通过预先训练得到的预测通行概率模型对所述大门的通行概率进行预测,基于预测结果确定所述大门的通行状态。本申请能够有效降低大门数据采集的成本,提高采集效率,且大大缩短采集周期。

Description

确定大门通行状态的方法、装置、设备和计算机存储介质
技术领域
本申请涉及计算机应用技术领域,特别涉及大数据及智能交通技术领域,尤其涉及一种确定大门通行状态的方法、装置、设备和计算机存储介质。
背景技术
在地图类应用中,由于一些诸如小区、医院、体育馆等涉及区域类地理位置点存在一个以上用于进出的大门。当用户需要到达区域类地理位置点或途径区域类地理位置时,面临需要选择是否从大门进出以及从哪个大门进出的问题。因此,在地图类应用的数据采集中,确定大门通行状态是其中一个重要的环节。
发明内容
有鉴于此,本申请提供了一种确定大门通行状态的方法、装置、设备和计算机存储介质。
第一方面,本申请提供了一种确定大门通行状态的方法,包括:
获取预设时段内的车行类轨迹数据;
从车行类轨迹数据中获取穿行具有大门的区域类地理位置的轨迹数据;
从穿行区域类地理位置的轨迹数据中提取与穿行大门相关的特征;
基于提取的特征,通过预先训练得到的预测通行概率模型对大门的通行概率进行预测,基于预测结果确定大门的通行状态。
第二方面,本申请还提供了一种训练通行概率预测模型的方法,包括:
获取穿行具有大门的区域类地理位置的车行类轨迹数据以及对应的大门通行状态作为训练数据;
从车行类轨迹数据中提取与穿行大门相关的特征;
将提取的特征作为分类模型的输入,获得分类模型对大门通行概率的预测,依据预测结果优化分类模型,以得到通行概率预测模型;
其中优化目标为:最小化预测结果对应的大门通行状态与训练数据中大门通行状态的差异。
第三方面,本申请提供了一种确定大门通行状态的装置,包括:
第一获取单元,用于获取预设时段内的车行类轨迹数据;
第二获取单元,用于从车行类轨迹数据中获取穿行具有大门的区域类地理位置的轨迹数据;
特征提取单元,用于从穿行区域类地理位置的轨迹数据中提取与穿行大门相关的特征;
状态预测单元,用于基于特征提取单元提取的特征,通过预先训练得到的预测通行概率模型对大门的通行概率进行预测,基于预测结果确定大门的通行状态。
第四方面,本申请还提供了一种训练通行概率预测模型的装置,包括:
数据获取单元,用于获取穿行具有大门的区域类地理位置的车行类轨迹数据以及对应的大门通行状态作为训练数据;
特征提取单元,用于从车行类轨迹数据中提取与穿行大门相关的特征;
模型训练单元,用于将特征提取单元提取的特征作为分类模型的输入,获得分类模型对大门通行概率的预测,依据预测结果优化分类模型,以得到通行概率预测模型;
其中优化目标为:最小化预测结果对应的大门通行状态与训练数据中大门通行状态的差异。
第五方面,本申请提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的方法。
第六方面,本申请还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述的方法。
第七方面,本申请还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一项所述的方法。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1示出了可以应用本发明实施例的示例性系统架构;
图2为本申请实施例一提供的确定大门通行状态的方法流程图;
图3为本申请实施例二提供的训练通行概率预测模型的方法流程图;
图4为本申请实施例三提供的确定大门通行状态的方法流程图;
图5为本申请实施例五提供的确定大门通行状态的装置结构图;
图6为本申请实施例六提供的训练通行概率预测模型的装置结构图;
图7是用来实现本申请实施例的方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
传统确定大门通行状态主要通过采集车来采集,即人为驾驶采集车到实地进行采集。这种方式显然对于大门数据更新慢,但现实情况中大门通行状态的变化是比较频繁的,例如在疫情期间小区、景区等区域就封闭了部分大门;或者原来内、外部车辆都能够通行的大门,现在只有内部车辆才能通行。显然,传统的采集方式采集周期长、无法及时更新,从而导致地图应用的算路、导航等应用质量不佳。
本申请的核心思想在于,从预设时段内的车行类轨迹数据中,穿行具有大门的区域类地理位置的轨迹数据来挖掘该大门的通行状态,从而实现大门通行状态的自动挖掘。下面结合实施例对本申请提供的方法进行详细描述。
图1示出了可以应用本发明实施例的示例性系统架构。如图1所示,该系统架构可以包括终端设备101和102,网络103和服务器104。网络103用以在终端设备101、102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101和102通过网络103与服务器104交互。终端设备101和102上可以安装有各种应用,例如地图类应用、语音交互类应用、网页浏览器应用、通信类应用等。
终端设备101和102可以是能够支持并展现地图类应用的各种电子设备,包括但不限于智能手机、平板电脑、智能穿戴式设备等等。本发明所提供的装置可以设置并运行于上述服务器104中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块,在此不做具体限定。
例如,确定大门通行状态的装置设置并运行于上述服务器104中,服务器104可以获取并存储终端设备101或102的各种轨迹数据。确定大门通行状态的装置使用本发明实施例提供的方式确定区域类地理位置的大门通行状态,并将大门的通行状态存储于地图数据库。并可以基于大门通行状态进行导航路线的计算、导航引导点的推荐等,并将计算或推荐结果返回终端设备101或102。在服务器104端维护有地图类应用数据(包括轨迹数据),该地图类应用数据可以存储于服务器104本地,也可以存储于其他服务器中由服务器104进行调用。
服务器104可以是单一服务器,也可以是多个服务器构成的服务器群组。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
大门通常是区域类地理位置所具有的,所谓区域类地理位置可以是具有一定面积的区域,可以是POI(Point Of Interest,兴趣点)、AOI(Area of Interest,兴趣面)、ROI(Regin of Interest,兴趣区域)等。例如,医院通常具有一个以上的大门、小区通常具有一个以上的大门、学校通常具有一个以上的大门、景区通常具有一个以上的大门,等等。
大门依据类型首先可以划分为:紧急通行大门和开放大门。其中紧急通行大门通常处于常闭状态,只有在极特殊情况下才开放,例如火灾时消防车通行。对于这类大门无需进行通行状态的挖掘,本申请所提供的确定大门通行状态的方式主要针对开放大门。开放大门通常是门卫站岗大门,这类大门可能处于通行状态,也可能由于特殊时期、特殊政策、区域管理要求等处于不可通行状态。对于通行状态的大门,又可以进一步分为仅限内部车辆通行和允许、内外用户通行。下面实施例一首先对大门是否通行这种通行状态进行挖掘。
实施例一
图2为本申请实施例一提供的确定大门通行状态的方法流程图,该方法由确定大门通行状态的装置执行,该装置可以是位于服务器端的应用,或者还可以为位于服务器端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元。如图2中所示,该方法可以包括以下步骤:
在201中,获取预设时段内的车行类轨迹数据。
由于开放大门的通行状态变化还是比较频繁的,因此为了获取最新的大门通行状态,可以获取最近一段时长内的车型类轨迹数据进行挖掘。其中,预设时段的长度可以是天级别、小时级别、甚至是分钟级别。
在此,本申请实施例提供了一种车行类轨迹数据的获取方式,具体可以采用以下步骤S11~S13:
S11、获取预设时段内的轨迹数据。
可以从数据库中获取预设时段内的所有轨迹数据。如果数据库中的轨迹数据本身已经对应各类别的,那么直接获取车行类轨迹数据即可。若并未对应各类别,则需要对获取的轨迹数据进行分类,继续执行以下步骤。
S12、从获取的轨迹数据中提取运动相关特征。
其中,运动相关特征可以包括轨迹平均速度、最高速度、速度方差、加速度、最高加速度、加速度方差、是否经过步行或骑行道路、是否经过高速道路中至少一种。
由于上述特征中可能包含与道路相关的内容,因此,在本步骤S12之前,可以首先将步骤S11获取的轨迹数据匹配到路网数据,即匹配到具体的路段上。一条轨迹通常可以由一系列的轨迹点组成,可以表示为:[(x1,y1,t1),(x2,y2,t2),...,(xn,yn,tn)],其中,x和y表示坐标,t表示时间,x、y和t的下标代表轨迹点的编号,n表示一条轨迹所包含的轨迹点数量。地图的路网数据由路段和节点构成,每个路段和节点都有对应的坐标信息。将轨迹中的各轨迹点匹配到路网数据中的各路段上,例如可以使用HMM(Hidden Markov Model,隐马尔可夫模型)将轨迹数据匹配到道路上,得到序列,诸如[(x1,y1,t1,link1),(x2,y2,t2,link1),...,(xn,yn,tn,linkj)],其中link代表路段,其下表代表路段的编号。
S13、基于提取的运动相关特征,通过预先训练得到的车行轨迹分类模型对所述轨迹数据进行分类,得到车行类轨迹数据。
对于S12中提取的特征,可以构成特征向量输入预先训练得到的车型轨迹分类模型。车型轨迹分类模型可以使用预先标注了轨迹类型的轨迹数据作为训练数据,例如将已知的步行、骑行轨迹数据作为负样本,已知的车行轨迹数据作为正样本,采用诸如GBDT(Gradient Boosting Decision Tree,梯度提升迭代决策树)等分类模型进行训练,从而得到车行轨迹分类。
更进一步地,还可以对其中车行类轨迹数据进行质量分类和过滤,从而排除质量较为低下的轨迹数据,一方面降低质量低下的轨迹数据对于后续挖掘结果的准确性影响,另一方面也降低了计算量。具体地,可以执行以下步骤S21~S23:
在S21中,从获取的车行类轨迹数据中提取轨迹质量特征。
其中,获取的轨迹质量特征可以包括但不限于以下至少一种:轨迹偏离道路的最大垂直距离、平均垂直距离、垂直距离方差、在前预设排次(例如前10个)的垂直距离平均值、轨迹点数量是否小于预设轨迹点数量阈值(例如10个)、平均速度是否小于预设平均速度阈值、最大线角度与路段的角度差、平均线角度与路段的角度差、线角度与路段的角度差方差、线角度与路段的角度差在前预设排次的平均值、轨迹与轨迹中心线的DTW(DynamicTime Warping,动态时间归整)距离、轨迹与轨迹中心线的LCSS(Longest-Common-Subsequence,最长公共子序列)相似度。
其中,若轨迹在路面区域之内的话,轨迹偏离道路的垂直距离为0;若轨迹在路面区域之外的话,轨迹偏离道路的垂直距离就是轨迹距离道路最近边缘的距离。
所谓“线角度”可以定义为:相邻两个轨迹点的位移矢量方向与正北方向的顺时针夹角。例如,相邻两个轨迹点P0和P1,由P0指向P1的方向与正北方向的顺时针夹角即为线角度。
在S22中,基于提取的轨迹质量特征,通过预先训练得到的轨迹质量分类模型对所述轨迹数据进行质量分类;
将步骤S21提取的轨迹质量特征构成特征向量输入预先训练得到的轨迹质量分类模型,得到对各轨迹数据的质量分类结果。
轨迹质量分类模型可以使用预先标注了质量类型的轨迹数据作为训练数据。例如:预先标注轨迹点分布杂乱无章,无法判断行驶路径的轨迹为低质量轨迹;标注轨迹点围绕少量link且有较大波动,但基本可以判断行驶路径的轨迹为一般质量轨迹;标注非常贴合道路且能够准确确定轨迹所处link的轨迹为高质量轨迹。然后采用分类模型进行训练,得到轨迹质量分类模型。
其中分类模型可以采用但不限于机器学习模型、深度学习模型等。其中机器学习模型可以包括但不限于:DT(Decision Tree,决策树)模型、SVM(Support Vector Machine,支持向量机)模型、GBDT(Gradient Boosting Decision Tree,梯度提升迭代决策树)模型、RF(Random Forest,随机森林)模型、XGBOOST(eXtreme Gradient Boosting,梯度提升决策树)模型。深度学习模型可以包括但不限于:LSTM(Long Short-Term Memory,长短期记忆网络),或者CNN(Convolutional Neural Networks,卷积神经网络)等。例如,本申请可以采用GBDT模型。
在S23中,从所述车行类轨迹数据中过滤掉被分类为低质量的车行类轨迹数据。
继续参见图2,在202中,从车行类轨迹数据中获取穿行具有大门的区域类地理位置的轨迹数据。
由于本申请是要挖掘大门的通行状态,因此从车行轨迹数据中筛选出穿行区域类地理位置的轨迹数据。后续步骤中,针对每个大门都执行203和204的通行状态预测,即每个大门都分别作为指定的大门。
在203中,从穿行区域类地理位置的轨迹数据中提取与穿行指定的一个大门相关的特征。
假设针对区域类地理位置A的大门a,从穿行A的轨迹数据中,提取与穿行大门a相关的特征,可以包括以下至少一种特征或任意组合:
1)穿行量,即穿行大门a的轨迹数量。
2)进入占比,即从大门a进入区域类地理位置A的轨迹数量与进入区域类地理位置A的所有轨迹数量的比率。
3)退出占比,即从大门a驶出区域类地理位置A的轨迹数量与驶出区域类地理位置A的所有轨迹数量的比率。
4)偏航率,即导航规划从大门a进入但实际从其他大门进入区域类地理位置A的轨迹数量与导航规划从大门a进入且实际从任意大门进入区域类地理位置A的轨迹数量的比率。
5)从大门a进入区域类地理位置A的单位时长环比率与从大门a进入区域类地理位置A的单位时长缩放因子的比值。其中,单位时长可以采用周、月、年等。大门a进入区域类地理位置A的单位时长缩放因子可以为:当前预设时段进入区域类地理位置A的轨迹量与历史时段进入区域类地理位置A的轨迹量的比值。
6)从大门a驶出区域类地理位置A的单位时长环比率与从大门a驶出区域类地理位置A的单位时长缩放因子的比值。从大门a驶出区域类地理位置A的单位时长缩放因子可以为:当前预设时段驶出区域类地理位置A的轨迹量与历史时段驶出区域类地理位置A的轨迹量的比值。
上面这些从轨迹中提取出的特征均能够在一定程度上体现出穿行大门a的通行状态,能够基于此来判别大门a的通行状态。
在204中,基于提取的特征,通过预先训练得到的预测通行概率模型对大门的通行概率进行预测,基于预测结果确定大门的通行状态。
将针对大门a提取的特征输入预测通行概率模型后,就能够得到模型对大门a的通行概率预测结果。其中,预测通行概率模型的训练方法将在后续实施例二中进行详细描述。
若预测的通行概率大于或等于预设的第一概率阈值th1,则确定大门a可通行。
若预测的通行概率小于或等于预设的第二概率阈值th2,则确定大门a不可通行。
若预测的通行概率小于第一概率阈值th1且大于第二概率阈值th2,则进一步根据众包核实的结果,确定大门a的通行状态。其中众包核实的方式可以采用诸如终端用户上报大门通行状态等方式,本申请对此不加以限制。
其中,th1>th2,th1和th2为超参数,可以采用经验值或试验值,可以根据挖掘效果进行调整。例如th1和th2可以分别取0.85和0.15。
如果通过本实施例得到的大门的通行状态与数据库中记录的一致,则可以保持数据库中的记录不变。不过不一致,利用得到的大门的通行状态更新数据库中记录的大门的通行状态。
由本实施例的技术方案可以看出,本申请能够从预设时段内穿行区域类地理位置的轨迹数据中提取与穿行大门相关的特征,基于此对大门的通行概率进行预测,从而确定大门的通行状态。本申请无需人工参与,降低了大门数据的采集成本、提高了采集效率,且能够大大缩短采集周期。
实施例二
图3为本申请实施例二提供的训练通行概率预测模型的方法流程图,如图3中所示,该方法可以包括以下步骤:
在301中,获取穿行具有大门的区域类地理位置的车行类轨迹数据以及对应的大门通行状态作为训练数据。
在本步骤中,可以对于已知通行状态的大门,收集其处于通行状态期间穿行该大门所在区域类地理位置的车行类轨迹数据,将车行类轨迹数据与该大门的通行状态作为训练数据。其中已知通行状态可以包括可通行和不可通行。
在302中,从车行类轨迹数据中提取与穿行大门相关的特征。
针对每一训练数据,例如,某训练数据是穿行区域类地理位置B的车行类轨迹数据以及B的大门b的通行状态为可通行。那么从该车行类轨迹数据中提取与穿行大门b相关的特征,可以包括但不限于以下中的一种或任意组合:
1)穿行量,即穿行大门b的轨迹数量。
2)进入占比,即从大门b进入区域类地理位置B的轨迹数量与进入区域类地理位置B的所有轨迹数量的比率。
3)退出占比,即从大门b驶出区域类地理位置B的轨迹数量与驶出区域类地理位置B的所有轨迹数量的比率。
4)偏航率,即导航规划从大门b进入但实际从其他大门进入区域类地理位置B的轨迹数量与导航规划从大门b进入且实际从任意大门进入区域类地理位置B的轨迹数量的比率。
5)从大门b进入区域类地理位置B的单位时长环比率与从大门b进入区域类地理位置B的单位时长缩放因子的比值。其中,单位时长可以采用周、月、年等。大门b进入区域类地理位置B的单位时长缩放因子可以为:当前预设时段进入区域类地理位置B的轨迹量与历史时段进入区域类地理位置B的轨迹量的比值。
6)从大门b驶出区域类地理位置B的单位时长环比率与从大门b驶出区域类地理位置B的单位时长缩放因子的比值。从大门b驶出区域类地理位置B的单位时长缩放因子可以为:当前预设时段驶出区域类地理位置B的轨迹量与历史时段驶出区域类地理位置B的轨迹量的比值。
在训练预测通行概率模型时使用的特征需要与实施例一的步骤203中实际使用预测通行概率模型进行预测时提取的特征相一致。
在303中,将提取的特征作为分类模型的输入,获得分类模型对大门通行概率的预测,依据预测结果优化分类模型,以得到通行概率预测模型;其中优化目标为:最小化预测结果对应的大门通行状态与训练数据中大门通行状态的差异。
本实施例中,分类模型可以采用但不限于机器学习模型、深度学习模型等。其中机器学习模型可以包括但不限于:DT(Decision Tree,决策树)模型、SVM(Support VectorMachine,支持向量机)模型、GBDT(Gradient Boosting Decision Tree,梯度提升迭代决策树)模型、RF(Random Forest,随机森林)模型、XGBOOST(eXtreme Gradient Boosting,梯度提升决策树)模型。深度学习模型可以包括但不限于:LSTM(Long Short-Term Memory,长短期记忆网络),或者CNN(Convolutional Neural Networks,卷积神经网络)等。例如,本申请可以采用GBDT模型。
仍以上述的训练数据为例,分类模型依据输入的特征对大门b的通行概率进行预测,依据该预测结果能够得到其对应的大门b的通行状态。依据预测得到的通行状态与训练数据中大门b的通行状态(即可通行)的差异创建损失函数,利用损失函数反向优化分类模型的模型参数,以最小化损失函数的取值。训练结束后,得到通行概率预测模型。
其中训练结束的条件可以包括但不限于:所有训练数据都训练完毕、损失函数的值趋于收敛或者迭代次数达到预设的阈值等等。
经过上述实施例一所述的方法已经可以得到大门是可通行状态还是不可通行状态。对于可通行状态的大门,还可以进一步采用实施例三所示的方式确定大门是仅限内部用户通行,还是内、外部用户均可通行。
实施例三
图4为本申请实施例三提供的确定大门通行状态的方法流程图,如图4中所示,该方法可以包括以下步骤:
在401中,从穿行具有大门区域类地理位置的轨迹数据中,识别区域内用户的轨迹数据和非区域内用户的轨迹数据。
本步骤中使用的轨迹数据可以是实施例一中经过步骤202处理后获得的轨迹数据。也可以是从合作方(例如与出租车公司、网约车公司等合作)的实时轨迹数据中获取的穿行具有大门区域类地理位置的轨迹数据。
在对用户是是否为区域内用户进行识别时,可以采用但不限于以下两种方式:
第一种方式:依据用户对区域类地理位置设置的标签,确定该用户是否为区域类地理位置的区域内用户。例如,用户在地图类应用中设置区域类地理位置A为“家”、“公司”、“学校”、“单位”等标签,则可以认为该用户为区域类地理位置A的区域内用户(即内部用户)。
第二种方式:依据在区域类地理位置的驻留时间分布,确定该用户是否为区域类地理位置的区域内用户。例如,统计用户每天在区域类地理位置A的驻留时间分布序列,对该序列进行对齐和快速傅里叶变换后,分析其分布。如果用户每天在区域类地理位置A的驻留呈天或周的周期性,且月累计驻留时间超过4小时,则认为用户是区域类地理位置A的区域内用户。
在402中,获取大门在数据库中记录的通行状态,若大门在数据库中的记录为仅限内部用户通行,则执行403a;若大门在大门在数据库中的记录为内、外部用户均可通行,则执行403b。
在403a中,从非区域内用户的轨迹数据中提取与穿行所述大门相关的特征,并基于提取的特征,通过所述预测通行概率模型对所述大门的通行概率进行预测。
若通过实施例一中所示的方式已经确定大门a为可通行状态,且该大门a在数据库中记录的通行状态为仅限内部用户通行,则从401中获取的非区域内用户的轨迹数据中提取与穿行大门a相关的特征,这部分特征的提取方式与实施例一中步骤203中一致。并将提取的特征输入预测通信概率模型进行预测,这部分也与实施例一中类似,在此不做赘述。
在404a中,获取预测的通行概率,若预测的通行概率大于或等于预设的第三概率阈值th3,则执行405a;若预测通行概率小于或等于预设的第五概率阈值th5,则执行406a;若预测通行概率大于第五概率阈值且小于第三概率阈值,则执行407a。
其中,th3>th5,th3和th5为超参数,可以采用经验值或试验值,可以根据挖掘效果进行调整。例如th3和th5可以分别取0.85和0.6。
在405a中,确定大门的通行状态变化为内、外部用户均可通行,更新数据库中的上述记录。
在406a中,大门的通行状态未变更,保持数据库中的记录。
在407a中,采用众包核实的方式确定大门的通行状态是仅限内部用户通行还是内、外部用户均可通行,如果变化为内、外部用户均可通行,则更新数据库中的上述记录。
再来看另外一个分支,在403b中,从非区域内用户的轨迹数据中提取与穿行所述大门相关的特征,并基于提取的特征,通过所述预测通行概率模型对所述大门的通行概率进行预测。
若通过实施例一中所示的方式已经确定大门a为可通行状态,且该大门a在数据库中记录的通行状态为内、外部用户均可通行,则从401中获取的非区域内用户的轨迹数据中提取与穿行大门a相关的特征,这部分特征的提取方式与实施例一中步骤203中一致。并将提取的特征输入预测通信概率模型进行预测,这部分也与实施例一中类似,在此不做赘述。
在404b中,获取预测的通行概率,如果预测的通行概率大于或等于预设的第四概率阈值th4且偏航率大于预设的偏航率阈值,则执行405b;否则,执行406b。
其中,th4和偏航率阈值均为超参数,可以采用经验值或试验值。例如th4采用0.5,偏航率阈值采用0.8。
其中偏航率的定义与实施例一步骤203所提取的特征中偏航率的定义一致:导航规划从大门a进入但实际从其他大门进入区域类地理位置A的轨迹数量与导航规划从大门a进入且实际从任意大门进入区域类地理位置A的轨迹数量的比率,即为大门a的偏航率。
在405b中,确定大门的通行状态变化为仅内部用户可通行,或者进一步确定众包核实的结果;如果确定大门的通行状态变化为仅内部用户可通行,则更新数据库中该大门的记录。
在本步骤中可以直接确定大门的通行状态变化为内部用户可通行。
也可以进一步进行众包核实,依据众包核实的结果确定大门的通行状态是否变化为仅内部用户可通行。
在406b中,保持数据库中该大门的记录不变。
通过本实施例三能够对可通行的大门进行细分,及时发现大门限行信息的变化,从而对数据库进行及时更新。
实施例四
在本申请中,采用实施例一、三中的方式确定出大门的通行状态后,可以将其应用于地图类应用中的导航场景。具体的应用可以包括但不限于以下几种:
第一种:在计算导航路线时将大门通行状态作为考虑因素之一。
例如,若导航路线经过区域类地理位置A的大门a,且大门a为仅内部用户可通行,而导航用户为区域外用户,则加重该导航路线的导航惩罚。若导航路线经过区域类地理位置A的大门a,且大门a为仅内部用户可通行,而导航用户为区域内用户,则导航规划时,对大门a加以比较小的权重。
再例如,若导航路线经过区域类地理位置A,而大门a的通行状态为不可通行,则路线规划时对该大门a采用一个大数值的惩罚,例如惩罚该路线的时间超过5个小时。
再例如,若导航路线经过区域类地理位置A,且大门a的通行状态为允许内、外部用户通行,则导航规划时对大门a加以比较小的权重。例如增加一个排队进入区域类地理位置A的时间。
这种导航路线的计算方式使得算路方法更加精细,减少导航路线不必要绕路或外部车辆无法进入的问题产生。
第二种:对于途径大门的导航路线,对大门的通行状态进行提示。
如果某导航路线途径了大门a,则可以在用户发起导航规划时,在界面上或者通过语音等方式提示用户大门a的通行状态。例如,如果大门a仅允许内部用户可通行,而用户为区域外用户,则可以提示用户途径外部车辆无法通行的大门。再例如,如果大门a仅允许内部用户可通行,而用户为区域内用户,则提示用户途径了区域内道路。再例如,如果大门a对于内、外部用户都可通行,则提示用户途径了区域内道路。
上述提示信息可以有效帮助用户对导航路线进行决策,或者对行驶过程有一定的心理预期,从而提升用户体验。
第三种:针对基于检索区域类地理位置的导航路线,依据区域类地理位置所具有各大门的通行状态确定候选导航引导点。
导航引导点是指在导航过程中为了提醒用户行驶信息而设置的导航提示点。导航引导点是非常重要的数据,用户可以基于导航引导点的信息快速、准确地行驶到目的地。
对于通过检索区域类地理位置A而发起的导航路线,例如以区域类地理位置A为起始地或目的地而发起的导航。对于紧急通行大门或者大门连接道路存在阻断的开放大门,需要从候选导航引导点中剔除。而对于大门连接道路阻断开通的开放大门,需要及时将该大门加入候选导航引导点。
第四种:针对基于检索区域类地理位置的导航路线,依据用户在最近预设时段内习惯穿行的大门信息,从候选导航引导点中向用户推荐引导点。
对于通过检索区域类地理位置A而发起的导航路线,例如以区域类地理位置A为起始地或目的地而发起的导航,如果候选导航引导点中包含大门a和c,可以结合用户习惯,统计用户最近一段时间从各大门进入区域类地理位置A的占比,依据占比从高到低的排序,确定是向用户推荐大门a还是大门c作为引导点。
第五种:针对基于检索所述区域类地理位置的导航路线,将向用户推荐的引导点的大门通行状态进行提示。
若向用户推荐的引导点包含大门a,如果大门a的开放通行类型、开放时间等与用户的导航类型不匹配,或者用户首次到达区域类地理位置A,则可以采用界面或语音的方式提示大门a的信息,从而引导用户主动选择。
上述引导点的设置方式,使得导航过程中的引导更加精确,且融入了用户个性化信息,更符合用户习惯,有效解决了“最后一公里”的问题。
以上是对本申请所提供方法进行的详细描述,下面结合实施例五和六对本申请所提供的装置进行详细描述。
实施例五
图5为本申请实施例五提供的确定大门通行状态的装置结构图,如图5中所示,该装置可以包括:第一获取单元01、第二获取单元02、特征提取单元03和状态预测单元04,还可以进一步包括质量筛选单元05、用户识别单元06和导航应用单元07。其中各组成单元的主要功能如下:
第一获取单元01,用于获取预设时段内的车行类轨迹数据。
具体地,第一获取单元01可以首先获取预设时段内的轨迹数据;从轨迹数据中提取运动相关特征,运动相关特征包括轨迹平均速度、最高速度、速度方差、加速度、最高加速度、加速度方差、是否经过步行或骑行道路、是否经过高速道路中至少一种;基于提取的运动相关特征,通过预先训练得到的车行轨迹分类模型对轨迹数据进行分类,得到车行类轨迹数据。
更进一步地,第一获取单元01在获取预设时段内的轨迹数据后,可以首先将轨迹数据匹配到路网数据,即匹配到具体的路段上。
更进一步地,质量筛选单元05可以从第一获取单元01获取的车行类轨迹数据中提取轨迹质量特征,轨迹质量特征包括轨迹偏离道路的最大垂直距离、平均垂直距离、垂直距离方差、在前预设排次的垂直距离平均值、轨迹点数量是否小于预设轨迹点数量阈值、平均速度是否小于预设平均速度阈值、最大线角度与路段的角度差、平均线角度与路段的角度差、线角度与路段的角度差方差、线角度与路段的角度差在前预设排次的平均值、轨迹与轨迹中心线的动态时间归整距离、轨迹与轨迹中心线的最长公共子序列相似度中的至少一个;基于提取的轨迹质量特征,通过预先训练得到的轨迹质量分类模型对轨迹数据进行质量分类;从车行类轨迹数据中过滤掉被分类为低质量的车行类轨迹数据。
第二获取单元02,用于从车行类轨迹数据中获取穿行具有大门的区域类地理位置的轨迹数据。
特征提取单元03,用于从穿行区域类地理位置的轨迹数据中提取与穿行大门相关的特征。
具体地,特征提取单元03提取的与穿行大门相关的特征可以包括以下至少之一:
穿行大门的轨迹数量;
从大门进入区域类地理位置的轨迹数量与进入区域类地理位置的所有轨迹数量的比率;
从大门驶出区域类地理位置的轨迹数量与驶出区域类地理位置的所有轨迹数量的比率;
导航规划从大门进入但实际从其他大门进入区域类地理位置的轨迹数量与导航规划从大门进入且实际从任意大门进入区域类地理位置的轨迹数量的比率;
从大门进入区域类地理位置的单位时长环比率与从大门进入区域类地理位置的单位时长缩放因子的比值;
从大门驶出区域类地理位置的单位时长环比率与从大门驶出区域类地理位置的单位时长缩放因子的比值。
状态预测单元04,用于基于特征提取单元提取的特征,通过预先训练得到的预测通行概率模型对大门的通行概率进行预测,基于预测结果确定大门的通行状态。
其中,状态预测单元04在基于预测结果确定大门的通行状态时,可以具体执行:
若预测的通行概率大于或等于预设的第一概率阈值,则确定大门可通行;若预测的通行概率小于或等于预设的第二概率阈值,则确定大门不可通行,第一概率阈值大于第二概率阈值;若预测的通行概率小于第一概率阈值且大于第二概率阈值,则进一步根据众包核实的结果,确定大门的通行状态。
用户识别单元06,用于若状态预测单元04确定大门可通行,则从穿行具有大门的区域类地理位置的轨迹数据中,识别内部用户的轨迹数据和非区域内用户的轨迹数据。
具体地,用户识别单元06可以依据用户对区域类地理位置设置的标签,确定用户是否为区域类地理位置的区域内用户;或者,依据用户在区域类地理位置的驻留时间分布,确定用户是否为区域类地理位置的区域内用户。
此时,状态预测单元04,还用于若确定大门可通行且大门在数据库中的记录为仅限内部用户通行,则从非区域内用户的轨迹数据中提取与穿行大门相关的特征,并基于提取的特征,通过预测通行概率模型对大门的通行概率进行预测;如果预测的通行概率大于或等于预设的第三概率阈值,则确定大门的通行状态变化为内、外部用户均可通行,更新记录。
状态预测单元04,还用于若确定大门可通行且大门在数据库中的记录为内、外部用户均可通行,则从非区域内用户的轨迹数据中提取与穿行大门相关的特征,并基于提取的特征,通过预测通行概率模型对大门的通行概率进行预测;如果预测的通行概率大于或等于预设的第四概率阈值且偏航率大于预设的偏航率阈值,则:确定大门的通行状态变化为仅内部用户可通行,或者进一步确定众包核实的结果;如果确定大门的通行状态变化为仅内部用户可通行,则更新记录;其中偏航率为:导航规划从大门进入但实际从其他大门进入区域类地理位置的轨迹数量与导航规划从大门进入且实际从任意大门进入区域类地理位置的轨迹数量的比率。
导航应用单元07,用于将状态预测单元04确定出的大门的通行状态后,将其应用于地图类应用中的导航场景。具体可以包括但不限于以下几种:
第一种:在计算导航路线时将大门通行状态作为考虑因素之一。
第二种:对于途径大门的导航路线,对大门的通行状态进行提示。
第三种:针对基于检索区域类地理位置的导航路线,依据区域类地理位置所具有各大门的通行状态确定候选导航引导点。
第四种:针对基于检索区域类地理位置的导航路线,依据用户在最近预设时段内习惯穿行的大门信息,从候选导航引导点中向用户推荐引导点。
第五种:针对基于检索区域类地理位置的导航路线,将向用户推荐的引导点的大门通行状态进行提示。
实施例六、
图6为本申请实施例六提供的训练通行概率预测模型的装置结构图,如图6中所示,该装置可以包括:数据获取单元11、特征提取单元12和模型训练单元13。其中,各组成单元的主要功能如下:
数据获取单元11,用于获取穿行具有大门的区域类地理位置的车行类轨迹数据以及对应的大门通行状态作为训练数据;
特征提取单元12,用于从车行类轨迹数据中提取与穿行大门相关的特征;
模型训练单元13,用于将特征提取单元提取的特征作为分类模型的输入,获得分类模型对大门通行概率的预测,依据预测结果优化分类模型,以得到通行概率预测模型;
其中优化目标为:最小化预测结果对应的大门通行状态与训练数据中大门通行状态的差异。
其中,特征提取单元12提取的与穿行大门相关的特征可以包括以下至少之一:
穿行大门的轨迹数量;
从大门进入区域类地理位置的轨迹数量与进入区域类地理位置的所有轨迹数量的比率;
从大门驶出区域类地理位置的轨迹数量与驶出区域类地理位置的所有轨迹数量的比率;
导航规划从大门进入但实际从其他大门进入区域类地理位置的轨迹数量与导航规划从大门进入且实际从任意大门进入区域类地理位置的轨迹数量的比率;
从大门进入区域类地理位置的单位时长环比率与从大门进入区域类地理位置的单位时长缩放因子的比值;
从大门驶出区域类地理位置的单位时长环比率与从大门驶出区域类地理位置的单位时长缩放因子的比值。
本实施例中,分类模型可以采用但不限于机器学习模型、深度学习模型等。其中机器学习模型可以包括但不限于:DT(Decision Tree,决策树)模型、SVM(Support VectorMachine,支持向量机)模型、GBDT(Gradient Boosting Decision Tree,梯度提升迭代决策树)模型、RF(Random Forest,随机森林)模型、XGBOOST(eXtreme Gradient Boosting,梯度提升决策树)模型。深度学习模型可以包括但不限于:LSTM(Long Short-Term Memory,长短期记忆网络),或者CNN(Convolutional Neural Networks,卷积神经网络)等。例如,本申请可以采用GBDT模型。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的确定大门通行状态或训练通行概率预测模型的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的确定大门通行状态或训练通行概率预测模型的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的确定大门通行状态或训练通行概率预测模型的方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的确定大门通行状态或训练通行概率预测模型的方法对应的程序指令/模块。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的确定大门通行状态或训练通行概率预测模型的方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据该电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至该电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
该电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与该电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (20)

1.一种确定大门通行状态的方法,包括:
获取预设时段内的车行类轨迹数据;
从所述车行类轨迹数据中获取穿行具有大门的区域类地理位置的轨迹数据;
从穿行所述区域类地理位置的轨迹数据中提取与穿行所述大门相关的特征;
基于提取的特征,通过预先训练得到的预测通行概率模型对所述大门的通行概率进行预测,基于预测结果确定所述大门的通行状态;其中,
所述基于预测结果确定所述大门的通行状态包括:
若预测的通行概率大于或等于预设的第一概率阈值,则确定所述大门可通行;从所述穿行具有大门的区域类地理位置的轨迹数据中,识别内部用户的轨迹数据和非区域内用户的轨迹数据;若所述大门在数据库中的记录为仅限内部用户通行,则从所述非区域内用户的轨迹数据中提取与穿行所述大门相关的特征,并基于提取的特征,通过所述预测通行概率模型对所述大门的通行概率进行预测;如果预测的通行概率大于或等于预设的第三概率阈值,则确定所述大门的通行状态变化为内、外部用户均可通行,更新所述记录;
若预测的通行概率小于或等于预设的第二概率阈值,则确定所述大门不可通行,所述第一概率阈值大于所述第二概率阈值。
2.根据权利要求1所述的方法,其中,所述获取预设时段内的车行类轨迹数据包括:
获取预设时段内的轨迹数据;
从所述轨迹数据中提取运动相关特征,所述运动相关特征包括轨迹平均速度、最高速度、速度方差、加速度、最高加速度、加速度方差、是否经过步行或骑行道路、是否经过高速道路中至少一种;
基于提取的运动相关特征,通过预先训练得到的车行轨迹分类模型对所述轨迹数据进行分类,得到车行类轨迹数据。
3.根据权利要求1所述的方法,还包括:
从获取的所述车行类轨迹数据中提取轨迹质量特征,所述轨迹质量特征包括轨迹偏离道路的最大垂直距离、平均垂直距离、垂直距离方差、在前预设排次的垂直距离平均值、轨迹点数量是否小于预设轨迹点数量阈值、平均速度是否小于预设平均速度阈值、最大线角度与路段的角度差、平均线角度与路段的角度差、线角度与路段的角度差方差、线角度与路段的角度差在前预设排次的平均值、轨迹与轨迹中心线的动态时间归整距离、轨迹与轨迹中心线的最长公共子序列相似度中的至少一个;
基于提取的轨迹质量特征,通过预先训练得到的轨迹质量分类模型对所述轨迹数据进行质量分类;
从所述车行类轨迹数据中过滤掉被分类为低质量的车行类轨迹数据。
4.根据权利要求1所述的方法,所述基于预测结果确定所述大门的通行状态还包括:
若预测的通行概率小于所述第一概率阈值且大于所述第二概率阈值,则进一步根据众包核实的结果,确定所述大门的通行状态。
5.根据权利要求1所述的方法,若确定所述大门可通行,则该方法还包括:
从所述穿行具有大门的区域类地理位置的轨迹数据中,识别内部用户的轨迹数据和非区域内用户的轨迹数据;
若所述大门在数据库中的记录为内、外部用户均可通行,则从所述非区域内用户的轨迹数据中提取与穿行所述大门相关的特征,并基于提取的特征,通过所述预测通行概率模型对所述大门的通行概率进行预测;
如果预测的通行概率大于或等于预设的第四概率阈值且偏航率大于预设的偏航率阈值,则:确定所述大门的通行状态变化为仅内部用户可通行,或者进一步确定众包核实的结果;如果确定所述大门的通行状态变化为仅内部用户可通行,则更新所述记录;
其中所述偏航率为:导航规划从所述大门进入但实际从其他大门进入所述区域类地理位置的轨迹数量与导航规划从所述大门进入且实际从任意大门进入所述区域类地理位置的轨迹数量的比率。
6.根据权利要求5所述的方法,其中,从所述穿行具有大门的区域类地理位置的轨迹数据中,识别内部用户的轨迹数据和非区域内用户的轨迹数据包括:
依据用户对所述区域类地理位置设置的标签,确定所述用户是否为所述区域类地理位置的区域内用户;或者,
依据用户在所述区域类地理位置的驻留时间分布,确定所述用户是否为所述区域类地理位置的区域内用户。
7.根据权利要求1至5中任一项所述的方法,其中,所述与穿行所述大门相关的特征包括以下至少之一:
穿行所述大门的轨迹数量;
从所述大门进入所述区域类地理位置的轨迹数量与进入所述区域类地理位置的所有轨迹数量的比率;
从所述大门驶出所述区域类地理位置的轨迹数量与驶出所述区域类地理位置的所有轨迹数量的比率;
导航规划从所述大门进入但实际从其他大门进入所述区域类地理位置的轨迹数量与导航规划从所述大门进入且实际从任意大门进入所述区域类地理位置的轨迹数量的比率;
从所述大门进入所述区域类地理位置的单位时长环比率与从所述大门进入所述区域类地理位置的单位时长缩放因子的比值;
从所述大门驶出所述区域类地理位置的单位时长环比率与从所述大门驶出所述区域类地理位置的单位时长缩放因子的比值。
8.根据权利要求1至5中任一项所述的方法,还包括:
在计算导航路线时将大门通行状态作为考虑因素之一;或者,
对于途径所述大门的导航路线,对所述大门的通行状态进行提示;或者,
针对基于检索所述区域类地理位置的导航路线,依据所述区域类地理位置所具有各大门的通行状态确定候选导航引导点;或者,
针对基于检索所述区域类地理位置的导航路线,依据用户在最近预设时段内习惯穿行的大门信息,从候选导航引导点中向用户推荐引导点;或者,
针对基于检索所述区域类地理位置的导航路线,将向用户推荐的引导点的大门通行状态进行提示。
9.一种训练通行概率预测模型的方法,包括:
获取穿行具有大门的区域类地理位置的车行类轨迹数据以及对应的大门通行状态作为训练数据;
从所述车行类轨迹数据中提取与穿行大门相关的特征;
将提取的特征作为分类模型的输入,获得所述分类模型对大门通行概率的预测,依据预测结果优化所述分类模型,以得到所述通行概率预测模型;
其中优化目标为:最小化预测结果对应的大门通行状态与训练数据中大门通行状态的差异;其中,
所述与穿行大门相关的特征包括以下至少之一:
穿行所述大门的轨迹数量;
从所述大门进入所述区域类地理位置的轨迹数量与进入所述区域类地理位置的所有轨迹数量的比率;
从所述大门驶出所述区域类地理位置的轨迹数量与驶出所述区域类地理位置的所有轨迹数量的比率;
导航规划从所述大门进入但实际从其他大门进入所述区域类地理位置的轨迹数量与导航规划从所述大门进入且实际从任意大门进入所述区域类地理位置的轨迹数量的比率;
从所述大门进入所述区域类地理位置的单位时长环比率与从所述大门进入所述区域类地理位置的单位时长缩放因子的比值;
从所述大门驶出所述区域类地理位置的单位时长环比率与从所述大门驶出所述区域类地理位置的单位时长缩放因子的比值。
10.根据权利要求9所述的方法,其中,所述分类模型包括:梯度提升迭代决策树模型。
11.一种确定大门通行状态的装置,包括:
第一获取单元,用于获取预设时段内的车行类轨迹数据;
第二获取单元,用于从所述车行类轨迹数据中获取穿行具有大门的区域类地理位置的轨迹数据;
特征提取单元,用于从穿行所述区域类地理位置的轨迹数据中提取与穿行所述大门相关的特征;
状态预测单元,用于基于所述特征提取单元提取的特征,通过预先训练得到的预测通行概率模型对所述大门的通行概率进行预测,基于预测结果确定所述大门的通行状态;其中,
所述状态预测单元在基于预测结果确定所述大门的通行状态时,具体执行:
若预测的通行概率大于或等于预设的第一概率阈值,则确定所述大门可通行;
若预测的通行概率小于或等于预设的第二概率阈值,则确定所述大门不可通行,所述第一概率阈值大于所述第二概率阈值;
若预测的通行概率小于所述第一概率阈值且大于所述第二概率阈值,则进一步根据众包核实的结果,确定所述大门的通行状态;其中,
还包括:
用户识别单元,用于若所述状态预测单元确定所述大门可通行,则从所述穿行具有大门的区域类地理位置的轨迹数据中,识别内部用户的轨迹数据和非区域内用户的轨迹数据;
所述状态预测单元,还用于若确定所述大门可通行且所述大门在数据库中的记录为仅限内部用户通行,则从所述非区域内用户的轨迹数据中提取与穿行所述大门相关的特征,并基于提取的特征,通过所述预测通行概率模型对所述大门的通行概率进行预测;如果预测的通行概率大于或等于预设的第三概率阈值,则确定所述大门的通行状态变化为内、外部用户均可通行,更新所述记录述大门进入且实际从任意大门进入所述区域类地理位置的轨迹数量的比率。
12.根据权利要求11所述的装置,其中,所述第一获取单元,具体用于:
获取预设时段内的轨迹数据;
从所述轨迹数据中提取运动相关特征,所述运动相关特征包括轨迹平均速度、最高速度、速度方差、加速度、最高加速度、加速度方差、是否经过步行或骑行道路、是否经过高速道路中至少一种;
基于提取的运动相关特征,通过预先训练得到的车行轨迹分类模型对所述轨迹数据进行分类,得到车行类轨迹数据。
13.根据权利要求11所述的装置,还包括:
质量筛选单元,用于从所述第一获取单元获取的所述车行类轨迹数据中提取轨迹质量特征,所述轨迹质量特征包括轨迹偏离道路的最大垂直距离、平均垂直距离、垂直距离方差、在前预设排次的垂直距离平均值、轨迹点数量是否小于预设轨迹点数量阈值、平均速度是否小于预设平均速度阈值、最大线角度与路段的角度差、平均线角度与路段的角度差、线角度与路段的角度差方差、线角度与路段的角度差在前预设排次的平均值、轨迹与轨迹中心线的动态时间归整距离、轨迹与轨迹中心线的最长公共子序列相似度中的至少一个;基于提取的轨迹质量特征,通过预先训练得到的轨迹质量分类模型对所述轨迹数据进行质量分类;从所述车行类轨迹数据中过滤掉被分类为低质量的车行类轨迹数据。
14.根据权利要求11所述的装置,还包括:
用户识别单元,用于若所述状态预测单元确定所述大门可通行,则从所述穿行具有大门的区域类地理位置的轨迹数据中,识别内部用户的轨迹数据和非区域内用户的轨迹数据;
所述状态预测单元,还用于若确定所述大门可通行且所述大门在数据库中的记录为内、外部用户均可通行,则从所述非区域内用户的轨迹数据中提取与穿行所述大门相关的特征,并基于提取的特征,通过所述预测通行概率模型对所述大门的通行概率进行预测;如果预测的通行概率大于或等于预设的第四概率阈值且偏航率大于预设的偏航率阈值,则:确定所述大门的通行状态变化为仅内部用户可通行,或者进一步确定众包核实的结果;如果确定所述大门的通行状态变化为仅内部用户可通行,则更新所述记录;其中所述偏航率为:导航规划从所述大门进入但实际从其他大门进入所述区域类地理位置的轨迹数量与导航规划从所述大门进入且实际从任意大门进入所述区域类地理位置的轨迹数量的比率。
15.根据权利要求11或14所述的装置,其中,所述用户识别单元,具体用于:依据用户对所述区域类地理位置设置的标签,确定所述用户是否为所述区域类地理位置的区域内用户;或者,依据用户在所述区域类地理位置的驻留时间分布,确定所述用户是否为所述区域类地理位置的区域内用户。
16.根据权利要求11至14中任一项所述的装置,其中,所述与穿行所述大门相关的特征包括以下至少之一:
穿行所述大门的轨迹数量;
从所述大门进入所述区域类地理位置的轨迹数量与进入所述区域类地理位置的所有轨迹数量的比率;
从所述大门驶出所述区域类地理位置的轨迹数量与驶出所述区域类地理位置的所有轨迹数量的比率;
导航规划从所述大门进入但实际从其他大门进入所述区域类地理位置的轨迹数量与导航规划从所述大门进入且实际从任意大门进入所述区域类地理位置的轨迹数量的比率;
从所述大门进入所述区域类地理位置的单位时长环比率与从所述大门进入所述区域类地理位置的单位时长缩放因子的比值;
从所述大门驶出所述区域类地理位置的单位时长环比率与从所述大门驶出所述区域类地理位置的单位时长缩放因子的比值。
17.根据权利要求11至14中任一项所述的装置,还包括:
导航应用单元,用于在计算导航路线时将大门通行状态作为考虑因素之一;或者,
对于途径所述大门的导航路线,对所述大门的通行状态进行提示;或者,
针对基于检索所述区域类地理位置的导航路线,依据所述区域类地理位置所具有各大门的通行状态确定候选导航引导点;或者,
针对基于检索所述区域类地理位置的导航路线,依据用户在最近预设时段内习惯穿行的大门信息,从候选导航引导点中向用户推荐引导点;或者,
针对基于检索所述区域类地理位置的导航路线,将向用户推荐的引导点的大门通行状态进行提示。
18.一种训练通行概率预测模型的装置,包括:
数据获取单元,用于获取穿行具有大门的区域类地理位置的车行类轨迹数据以及对应的大门通行状态作为训练数据;
特征提取单元,用于从所述车行类轨迹数据中提取与穿行大门相关的特征;
模型训练单元,用于将所述特征提取单元提取的特征作为分类模型的输入,获得所述分类模型对大门通行概率的预测,依据预测结果优化所述分类模型,以得到所述通行概率预测模型;
其中优化目标为:最小化预测结果对应的大门通行状态与训练数据中大门通行状态的差异;其中,
所述与穿行大门相关的特征包括以下至少之一:
穿行所述大门的轨迹数量;
从所述大门进入所述区域类地理位置的轨迹数量与进入所述区域类地理位置的所有轨迹数量的比率;
从所述大门驶出所述区域类地理位置的轨迹数量与驶出所述区域类地理位置的所有轨迹数量的比率;
导航规划从所述大门进入但实际从其他大门进入所述区域类地理位置的轨迹数量与导航规划从所述大门进入且实际从任意大门进入所述区域类地理位置的轨迹数量的比率;
从所述大门进入所述区域类地理位置的单位时长环比率与从所述大门进入所述区域类地理位置的单位时长缩放因子的比值;
从所述大门驶出所述区域类地理位置的单位时长环比率与从所述大门驶出所述区域类地理位置的单位时长缩放因子的比值。
19. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的方法。
CN202010610821.2A 2020-06-29 2020-06-29 确定大门通行状态的方法、装置、设备和计算机存储介质 Active CN111858800B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010610821.2A CN111858800B (zh) 2020-06-29 2020-06-29 确定大门通行状态的方法、装置、设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010610821.2A CN111858800B (zh) 2020-06-29 2020-06-29 确定大门通行状态的方法、装置、设备和计算机存储介质

Publications (2)

Publication Number Publication Date
CN111858800A CN111858800A (zh) 2020-10-30
CN111858800B true CN111858800B (zh) 2024-03-26

Family

ID=72988278

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010610821.2A Active CN111858800B (zh) 2020-06-29 2020-06-29 确定大门通行状态的方法、装置、设备和计算机存储介质

Country Status (1)

Country Link
CN (1) CN111858800B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112380446B (zh) * 2020-11-30 2022-03-25 腾讯科技(深圳)有限公司 兴趣点的通行方向的确认方法和装置及存储介质
CN112926630B (zh) * 2021-01-29 2023-09-19 北京百度网讯科技有限公司 路线规划方法、装置、电子设备以及计算机可读介质
CN113011323B (zh) 2021-03-18 2022-11-29 阿波罗智联(北京)科技有限公司 通行状态的获取方法、相关装置、路侧设备及云控平台
CN114596549A (zh) * 2022-02-28 2022-06-07 北京百度网讯科技有限公司 数据处理方法、装置、电子设备和存储介质
CN115292562B (zh) * 2022-10-09 2022-12-16 深圳市铱云云计算有限公司 基于大数据的合格用户筛选方法、装置、介质和计算设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106157609A (zh) * 2015-04-17 2016-11-23 高德软件有限公司 一种路段状态的监测方法及装置
CN106710276A (zh) * 2017-03-21 2017-05-24 北京汽车集团有限公司 交通信息获取方法及装置
CN110672101A (zh) * 2019-09-20 2020-01-10 北京百度网讯科技有限公司 导航模型训练方法、装置、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110087959B (zh) * 2017-02-03 2022-06-03 本田技研工业株式会社 车辆控制系统、车辆控制方法及存储介质
WO2018232680A1 (en) * 2017-06-22 2018-12-27 Baidu.Com Times Technology (Beijing) Co., Ltd. EVALUATION FRAME FOR PREDICTED TRAJECTORIES IN A SELF-CONTAINING VEHICLE TRAFFIC PREDICTION

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106157609A (zh) * 2015-04-17 2016-11-23 高德软件有限公司 一种路段状态的监测方法及装置
CN106710276A (zh) * 2017-03-21 2017-05-24 北京汽车集团有限公司 交通信息获取方法及装置
CN110672101A (zh) * 2019-09-20 2020-01-10 北京百度网讯科技有限公司 导航模型训练方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Viji Paul Panakkal ; Rajbabu Velmurugan.Effective data association scheme for tracking closely moving targets using factor graphs.《2011 National Conference on Communications (NCC)》.2011,全文. *
基于二次谱聚类和HMM-RF混合模型的车辆行为识别方法研究;范菁;阮体洪;吴佳敏;董天阳;;计算机科学;20160515(05);全文 *

Also Published As

Publication number Publication date
CN111858800A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN111858800B (zh) 确定大门通行状态的方法、装置、设备和计算机存储介质
CN111489553B (zh) 一种路线规划方法、装置、设备和计算机存储介质
Wijermans et al. A landscape of crowd-management support: An integrative approach
US20220374712A1 (en) Decision making for motion control
CN112131233B (zh) 识别更新道路的方法、装置、设备和计算机存储介质
CN111612249B (zh) 用于预测人流量的方法、装置、设备以及存储介质
US20170032480A1 (en) Personalized travel planning and guidance system
US9995588B2 (en) Quantifying anomalous behavior by identifying anomalies at subtrajectories
US20210239486A1 (en) Method and apparatus for predicting destination, electronic device and storage medium
CN112507949A (zh) 目标跟踪方法、装置、路侧设备以及云控平台
US10007852B2 (en) Methods and apparatuses for performing object tracking using graphs
CN108021858A (zh) 移动客体识别方法及客体流量分析方法
CN112101527B (zh) 识别车道变化的方法和装置、电子设备和存储介质
CN114428828A (zh) 基于行驶轨迹挖掘新增道路方法、装置及电子设备
Nohekhan et al. A deep learning model for off-ramp hourly traffic volume estimation
CN110738366B (zh) 一种室外盲区行为预测方法
Ariyawansa et al. Review on state of art data mining and machine learning techniques for intelligent Airport systems
Nguyen et al. Deep learning system for travel speed predictions on multiple arterial road segments
CN117671979A (zh) 一种基于知识图谱的智慧城市数据管理系统与方法
Visuwasam et al. Spatio Temporal Tourism Tracking System Based on Adaptive Convolutional Neural Network.
US20200218998A1 (en) Identification of non-deterministic models of multiple decision makers
CN116592903B (zh) 车路协同环境下群体偏好的生态驾驶路径实时规划方法
CN112070288A (zh) 出发时间预估方法、装置、设备以及存储介质
Ehmke et al. Data chain management for planning in city logistics
Richly et al. Predicting location probabilities of drivers to improved dispatch decisions of transportation network companies based on trajectory data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant