CN112819229B - 一种基于分布式机器学习的行车站点优化更新方法和系统 - Google Patents

一种基于分布式机器学习的行车站点优化更新方法和系统 Download PDF

Info

Publication number
CN112819229B
CN112819229B CN202110156888.8A CN202110156888A CN112819229B CN 112819229 B CN112819229 B CN 112819229B CN 202110156888 A CN202110156888 A CN 202110156888A CN 112819229 B CN112819229 B CN 112819229B
Authority
CN
China
Prior art keywords
line
station
route
actual driving
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110156888.8A
Other languages
English (en)
Other versions
CN112819229A (zh
Inventor
王泽兵
蔡素贤
王皓桦
林华森
罗敬贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honorsun Xiamen Data Co ltd
Original Assignee
Honorsun Xiamen Data Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honorsun Xiamen Data Co ltd filed Critical Honorsun Xiamen Data Co ltd
Priority to CN202110156888.8A priority Critical patent/CN112819229B/zh
Publication of CN112819229A publication Critical patent/CN112819229A/zh
Application granted granted Critical
Publication of CN112819229B publication Critical patent/CN112819229B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开一种基于分布式机器学习的行车站点优化更新方法和系统。将固定时间段内单条线路全部行车的车况信息进行站内和上下行分类,获得上下行分类所对应的疑似单行站点数据;以单辆行车为单位,将疑似单行站点数据通过Bisecting k‑Means算法进行第一层聚类处理,获得每辆行车对应的初始单行站点数据;利用k‑Means算法对初始单行站点数据进行第二层聚类处理,获得每辆行车的最终单行站点数据,基于时间顺序将最终单行站点数据进行串联处理,获得每辆行车的实际行驶线路;以及将实际行驶线路与原始线路进行差异度计算,以更新差异度小于设定阈值的原始线路的站点位置信息,获得优化后的行车站点线路。解决现有技术中公交站更新存在时间的延迟和人工成本等技术问题。

Description

一种基于分布式机器学习的行车站点优化更新方法和系统
技术领域
本申请实施例涉及智能公交技术领域,具体涉及一种基于分布式机器学习的行车站点优化更新方法和系统。
背景技术
在地图上展示公交行驶线路往往是依据公交公司所给出的线路文件,当公交公司对公交线路进行调整变更后,原始站点数据信息往往不能及时更新,或是站点数据本身就存在误差,从而导致实际行车线路与地图数据库内站点位置偏差较大。目前更新站点信息大致有以下三种方式:向公交公司申请获得最新的线路文件;通过调用第三方地图服务商的API接口;经用户反馈,进行手工标注。上述三种更新站点信息的方式,都存在及时性的问题。如采用第一种方式,则公交公司没有通知到应用方线路已变更的义务;采用第二种方式,虽然不需要考虑站点更新问题,第三方地图服务商会维护站点数据,但时效性也不强,他们往往也是依赖第三种方式,即根据用户反馈来进行人工站点标注。而一旦涉及到用户反馈,也就会存在时间上的延迟和人工成本等问题。
发明内容
本申请实施例的目的在于提出了一种基于分布式机器学习的行车站点优化更新方法和系统,解决现有技术中公交站更新存在时间的延迟和人工成本等技术问题。
第一方面,本申请实施例提供了一种基于分布式机器学习的行车站点优化更新方法,该方法包括:
S1:将固定时间段内单条线路全部行车的车况信息进行站内和上下行分类,获得上下行分类所对应的疑似单行站点数据;
S2:以单辆行车为单位,将疑似单行站点数据通过Bisecting k-Means算法进行第一层聚类处理,获得每辆行车对应的初始单行站点数据;
S3:利用k-Means算法对初始单行站点数据进行第二层聚类处理,获得每辆行车的最终单行站点数据,基于时间顺序将最终单行站点数据进行串联处理,获得每辆行车的实际行驶线路;以及
S4:将实际行驶线路与原始线路进行差异度计算,以更新差异度小于设定阈值的原始线路的站点位置信息,获得优化后的行车站点线路。
在该方法中,基于Bisecting k-Means算法进行第一层聚类处理后,在利用k-Means算法进行第二层聚类处理后获得实际行车的最终站点数据,该方法减少对公交公司线路文件的依赖,而且可以动态更新公交站点信息,实现对异常线路及时发现,大幅缩短公交公司对线路调整的发现时间,降低用户反馈问题站点的可能性,经由人工审核,可对有问题的线路做进一步处理和校验,同时也解决了现有技术中公交站更新存在时间的延迟和人工成本等技术问题。
在一些实施例中,S2步骤前还包括利用墨卡托投影将疑似单行站点数据的经纬度坐标轴转化为墨卡托单元。墨卡托投影便于更准确的展示平面坐标分布,也方便后续运用欧式距离进行聚类算法的计算。
在一些实施例中,S3步骤还包括对最终单行站点数据中的每个最终单行站点和对应的原始线路站点的进行平均误差函数计算,具体的计算公式如下:
Figure GDA0003833137390000021
其中,N表示最终单行站点的个数,yi表示第i个最终单行站点的向量值,xi表示第i个原始线路站点的向量值,i表示自然数,且i≤N。
在一些实施例中,S3步骤后还包括对实际行驶线路和原始线路进行线路特征转换成两个行向量。行向量的便于后续实际行驶线路与原始线路进行差异度比较。
在一些实施例中,S4步骤还包括响应于将全部行车的实际行驶线路根据对应的差异度大小进行降序排序,选取差异度最小的实际行驶线路作为最优匹配线路,并根据最优匹配线路更新对应的站点信息。
第二方面,本申请实施例提供了一种基于分布式机器学习的行车站点优化更新系统,该系统包括:
疑似单行站点模块,配置用于将固定时间段内单条线路全部行车的车况信息进行站内和上下行分类,获得上下行分类所对应的疑似单行站点数据;
初始单行站点模块,配置用于以单辆行车为单位,将疑似单行站点数据通过Bisecting k-Means算法进行第一层聚类处理,获得每辆行车对应的初始单行站点数据;
实际行驶线路模块,配置用于利用k-Means算法对初始单行站点数据进行第二层聚类处理,获得每辆行车的最终单行站点数据,基于时间顺序将最终单行站点数据进行串联处理,获得每辆行车的实际行驶线路。
优化行车站点模块,配置用于将实际行驶线路与原始线路进行差异度计算,以更新差异度小于设定阈值的原始线路的站点位置信息,获得优化后的行车站点线路。
在一些实施例中,实际行驶线路模块还包括对最终单行站点数据中的每个最终单行站点和对应的原始线路站点的进行平均误差函数计算,具体的计算公式如下:
Figure GDA0003833137390000031
其中,N表示最终单行站点的个数,yi表示第i个最终单行站点的向量值,xi表示第i个原始线路站点的向量值,i表示自然数,且i≤N。
在一些实施例中,优化行车站点模块还包括响应于将全部行车的实际行驶线路根据对应的差异度大小进行降序排序,选取差异度最小的实际行驶线路作为最优匹配线路,并根据最优匹配线路更新对应的站点信息。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本申请实施例提供的一种基于分布式机器学习的行车站点优化更新方法和系统,从数据源中获取数据,这部分数据集中应能够获取行车时间、车牌号、线路信息、经纬度、上下行类型、开关门状态等特征,但是,真实数据集中可能存在各种各样的问题,比如线路信息陈旧,所以与实际行车的线路不一致。数据集按天为单位读取后经过数据清洗和特征工程等数据准备工作后,喂入本申请的基于分布式机器学习的行车站点优化更新系统的AI模型管线,最终输出结果。其是基于Bisecting k-Means算法进行第一层聚类处理后,在利用k-Means算法进行第二层聚类处理,减少对公交公司线路文件的依赖,动态更新公交站点信息,对异常线路及时发现,大幅缩短公交公司对线路调整的发现时间,降低用户反馈问题站点的可能性,经由人工审核,可对有问题的线路做进一步处理和校验。解决了现有技术中公交站更新存在时间的延迟和人工成本等技术问题。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是根据本申请的一种基于分布式机器学习的行车站点优化更新方法的一个实施例的流程图;
图2是根据本申请的一种基于分布式机器学习的行车站点优化更新方法的模型策略图;
图3是根据本申请的A模型效果分析图;
图4是根据本申请的上行站点墨卡托坐标效果分析图;
图5是根据本申请的C模型效果分析图;
图6是根据本申请的D模型效果分析图;
图7是根据本申请的B、C、D模型处理后的站点数量变化直方图;
图8是根据本申请的E模型效果分析图;
图9是根据本申请的F模型效果分析图;
图10是根据本申请的某班次的实际行驶线路和原始线路喂入F模型处理后的样例数据图;
图11是根据本申请的G模型处理后的样例数据图;
图12是根据本申请的一种基于分布式机器学习的行车站点优化更新系统的一个实施例的结构示意图;
图13是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
参考图1,其示出了根据本申请的一种基于分布式机器学习的行车站点优化更新方法的一个实施例的流程图100。该方法包括以下步骤:
步骤101,将固定时间段内单条线路全部行车的车况信息进行站内和上下行分类,获得上下行分类所对应的疑似单行站点数据。
在本实施例中,将某天某条线路的行车车况信息进行站内分类和上、下、环行分类,其中,行车车况信息具体包括记录时间、位置经度、位置纬度、上下行、上一站编号、下一站编号和开关状态等。可根据行车的开门信息的开关状态来判断该行车是否处于站点内,而上、下、环行分类是根据行车数据中的上下行类型判断,最后获得已分类好上下行类别的对应疑似单行站点数据。
步骤102,以单辆行车为单位,将疑似单行站点数据通过Bisecting k-Means算法进行第一层聚类处理,获得每辆行车对应的初始单行站点数据。
在本实施例中,将步骤101识别到的疑似单行站点数据分别以单辆行车为单位,进一步针对站点位置缩小站点选择范围。利用墨卡托投影将单辆行车的疑似单行站点数据的经纬度坐标轴转化为墨卡托单元,同时为了避免进入局部最小值,采用Bisecting k-Means对离散站点群进行簇中心计算,所得结果为初始单行站点数据集。
步骤103,利用k-Means算法对初始单行站点数据进行第二层聚类处理,获得每辆行车的最终单行站点数据,基于时间顺序将最终单行站点数据进行串联处理,获得每辆行车的实际行驶线路。
在本实施例中,同样用来进行站点识别,但除此之外需要对站点的选择进一步优化,以增加站点位置识别精度,采用k-Means算法进行聚类,获得最终单行站点数据。并将最终单行站点数据采用时间顺序方式串联成站点识别线路,获得每辆行车的实际行驶线路。
进一步优选的,对最终单行站点数据中的每个最终单行站点和对应的原始线路站点的进行平均误差函数计算,具体的计算公式如下:
Figure GDA0003833137390000061
其中,N表示最终单行站点的个数,yi表示第i个最终单行站点的向量值,xi表示第i个原始线路站点的向量值,i表示自然数,且i≤N。
步骤104,将实际行驶线路与原始线路进行差异度计算,以更新差异度小于设定阈值的原始线路的站点位置信息,获得优化后的行车站点线路。
在本实施例中,在进行差异度计算前,需要将实际行驶线路和原始线路进行线路特征变换处理,最后转换成两个行向量,而相关特征计算用于生成线路特征矩阵,主要是将实际行驶线路和原始线路向量化输出,然后将实际行驶线路与原始线路进行差异度计算,并更新差异度小于设定阈值的原始线路的站点位置信息,获得优化后的行车站点线路。
进一步优选的,响应于将全部行车的实际行驶线路根据对应的差异度大小进行降序排序,选取差异度小于设定阈值且差异度最小的实际行驶线路作为最优匹配线路,并根据最优匹配线路更新对应的站点信息,将最优匹配线路更新至公交站点数据库中。
更进一步优选的,为了区别某些车辆路线异常还是该线路异常,需要将全部行车的实际行驶线路汇总为车辆路径集,若仅有少数车辆的实际行驶线路与原始线路极不相同,则将不匹配车辆汇总为车辆路径异常集,若全部车辆的实际行驶线路与原始线路都极不相同,则将该原始线路判定为线路异常,并将车辆路径异常集和线路异常反馈给告警模块,进行相应的告警处理,最后由人工处理。如该单条线路有10辆行车航行,仅有1-3辆行车的实际行驶线路与原始线路不匹配,则将不匹配的实际行驶线路对应的行车汇总成车辆路径异常集,若10辆行车的实际行驶线路都与原始线路不匹配,则判断该原始线路为异常线路。
继续参考图2,图2示出了根据本申请的一种基于分布式机器学习的行车站点优化更新方法的模型策略图。该行车站点优化更新方法依次包括A、B、C、D、E、F、G模型,其中,A模型用来区分公交车是否停在停车站点内,并将捕获到的公交站的疑似站点数据经过B模型进行上、下和环行站点的分类,将经B模型分类好的上行站点数据、下行站点数据和环形站点数据,以单辆车为单位的分别经过C模型的第一层聚类处理,再分别进入D模型进行第二层聚类处理后,获得上、下和环行对应的最终站点数据,将每辆车的最终站点数据导入E模型根据时间顺序串联成每辆车的实际行驶线路,将每辆车的实际行驶线路和对应的原始记录线路分别输入F模型进行线路特征变换后,一起喂入G模型进行差异度匹配,获得更新站点的位置信息、车辆路径异常信息和线路异常信息。
在一些具体的实施例中,参考表1-表3和图3,图3示出了根据本申请的A模型效果分析图。表1为某条线路某天(9:00~17:00)的部分公交车况信息样例数据,表2为过A模型数据处理的部分疑似站点样例数据,表3为针对表1和表2的各个特征的说明。在A模型中输入表1的公交车况数据,使其根据开关状态捕获如表2的疑似站点数据,如果将疑似站点数据以x轴表示纬度位置,y轴表示经度位置的方向呈现(如图3所示),图中散点均为开门停车点,假定散点为疑似站点,从图3可知,上行站点与下行站点存在些许差异。
表1:
rcrd_time lo_lgt lo_ltt up_dn prvs_stn_cd next_stn_cd swtc_st
2020-10-12 10:00:00:530 119.312482 26.111547 1 null 2 0000000000000000000
2020-10-12 10:00:07:423 119.312268 26.111173 1 null 2 0000000000000000000
2020-10-12 10:00:08:670 119.312240 26.111078 1 null 2 0000000000000000000
2020-10-12 10:00:09:943 119.312220 26.110965 1 null 2 0000000000000000000
2020-10-12 10:00:11:188 119.312197 26.110852 1 null 2 0000000000000000000
2020-10-12 10:00:12:450 119.312140 26.110607 1 null 2 0000000000000000000
2020-10-12 10:00:13:721 119.312112 26.110480 1 null 2 0000000000000000000
2020-10-12 10:00:14:967 119.312095 26.110365 1 null 2 0000000000000000000
2020-10-12 10:00:16:231 119.312023 26.110100 1 null 2 0000000000000000000
2020-10-12 10:00:18:767 119.311985 26.109838 1 null 2 0000100000000000000
2020-10-12 10:00:20:023 119.311958 26.109722 1 null 2 0000100000000000000
2020-10-12 10:00:21:280 119.311937 26.109608 1 null 2 0000100000000000000
2020-10-12 10:00:22:532 119.311910 26.109370 1 null 2 0000100000000000000
2020-10-12 10:00:23:825 119.311900 26.109247 1 null 2 0000100000000000000
2020-10-12 10:00:25:064 119.311882 26.109125 1 null 2 0000100000000000000
2020-10-12 10:00:26:306 119.311833 26.108880 1 null 2 0000100000000000000
2020-10-12 10:00:27:559 119.311813 26.108753 1 null 2 0000100000000000000
2020-10-12 10:00:31:313 119.311742 26.108290 1 null 2 0000100000000000000
2020-10-12 10:00:33:815 119.311747 26.108113 1 null 2 0000100000000000000
2020-10-12 10:00:35:062 119.311765 26.108032 1 null 2 0000000000000000000
2020-10-12 10:00:36:303 119.311757 26.107963 1 null 2 0000000000000000000
2020-10-12 10:00:37:583 119.311757 26.107963 1 null 2 0000000000000000000
2020-10-12 10:00:38:838 119.311757 26.107963 1 null 2 0000000000000000000
2020-10-12 10:00:55:362 119.311757 26.107963 1 null 2 0000000000000000000
2020-10-12 10:00:56∶636 119.311757 26.107963 1 null 2 0000000000000000000
表2:
rcrd_time lo_lgt loltt up_dn prvs_stn_cd next_stn_cd
2020-10-12 10:02:12:404 119.305317 26.082123 1 7 9
2020-10-12 10:02:14:766 119.305317 26.082123 1 7 9
2020-10-12 10:02:17:286 119.305317 26.082123 1 7 9
2020-10-12 10:03:52:492 119.306545 26.077535 1 8 10
2020-10-12 10:03:53:739 119.306545 26.077535 1 8 10
2020-10-12 10:03:54:983 119.306545 26.077535 1 8 10
2020-10-12 10:05:02:277 119.307328 26.073600 1 9 11
2020-10-12 10:05:03:527 119.307328 26.073600 1 9 11
2020-10-12 10:05:04:797 119.307328 26.073600 1 9 11
2020-10-12 10:05:08:805 119.307328 26.073600 1 9 11
表3:
分类 特征名 含义 备注
基础信息 rcrd_time 记录时间 格式:YYYY-MM-DD HH24:MI:SS:MS
基础信息 lo_lgt 位置经度 重要特征且存在null数据
基础信息 lo_ltt 位置纬度 重要特征且存在null数据
基础信息 up_dn 上下行 0-上行;1-下行;2-环形,注:重要特征且存在null数据。
基础信息 prvs_stn_cd 上-站点编号 存在null数据
基础信息 next_stn_cd 下-站点编号 存在null数据
车身 swtc_st 开关状态 9到11位分别为:前门信号、中门信号和后门信号。
在一些具体的实施例中,参考表4、表5和图4,图4示出了根据本申请的上行站点墨卡托坐标效果分析图。表4和表5为过B模型数据处理的部分疑似单行站点样例数据。将经过A模型处理后的疑似站点数据输入B模型进行上、下和环行分类,并利用墨卡托投影将疑似单行站点数据的经纬度坐标轴转化为墨卡托单元(如图4所示),其以上行站点为例,并且增加了两个特征:x和y,这两个特征是由经纬度坐标系转换到墨卡托坐标系形成的,通过这样的坐标系统变换,可以更准确的展示平面坐标分布,同时方便后续运用欧式距离进行聚类算法的运算。
表4:
rcrd_time lo_lgt lo_ltt up_dn prvs_stn_cd next_stn_cd x y
2020-10-12 10:00:48:835 119.316757 26.047557 0 9 11 1.328228063234476E7 3004972.2747877976
2020-10-12 10:00:51:348 119.316757 26.047557 0 9 11 1.328228063234476E7 3004972.2747877976
2020-10-12 10:00:53:876 119.316757 26.047557 0 9 11 1.328228063234476E7 3004972.2747877976
2020-10-12 10:00:56:383 119.316757 26.047557 0 9 11 1.328228063234476E7 3004972.2747877976
2020-10-12 10:00:58:898 119.316757 26.047557 0 9 11 1.328228063234476E7 3004972.2747877976
2020-10-12 10:01:01:418 119.316757 26.047557 0 9 11 1.328228063234476E7 3004972.2747877976
2020-10-12 10:06:39:074 119.315755 26.061095 0 10 12 1.3282169090214984E7 3006649.790580949
表5:
rcrd_time lo_lgt lo_ltt up_dn prvs_stn_cd next_stn_cd x y
2020-10-12 10:06:41:557 119.315755 26.061095 0 10 12 1.3282169090214984E7 3006649.790580949
2020-10-12 10:06:44:045 119.315755 26.061095 0 10 12 1.3282169090214984E7 3006649.790580949
2020-10-12 10:06:46:531 119.315755 26.061095 0 10 12 1.3282169090214984E7 3006649.790580949
2020-10-12 10:09:57:722 119.315427 26.066447 0 11 13 1.3282132577422004E7 3007313.0191421774
2020-10-12 10:10:00:273 119.315427 26.066447 0 11 13 1.3282132577422004E7 3007313.0191421774
2020-10-12 10:10:02:791 119.315427 26.066447 0 11 13 1.3282132577422004E7 3007313.0191421774
2020-10-12 10:10:05:308 119.315427 26.066447 0 11 13 1.3282132577422004E7 3007313.0191421774
2020-10-12 10:10:07:810 119.315427 26.066447 0 11 13 1.3282132577422004E7 3007313.0191421774
2020-10-12 10:12:53:929 119.312197 26.067698 0 12 14 1.3281773015466742E7 3007468.049470206
在一些具体的实施例中,参考图5,图5示出了本申请的C模型效果分析图。将经过B模型上、下和环行分类和墨卡托单位转换后的疑似单行站点数据喂入C模型进行第一层聚类,C模型使用Bisecting k-Means算法进行第一层聚类,以缩小D模型站点的搜索空间。在具体实践过程中我们期望C模型输出站点将B模型聚类后的站点全部覆盖,并且在不丢失实际站点的条件下数量上较B模型有显著下降,即在同一个实际站点上识别的站点数量只多不少。在图5中可以看到经过C模型处理的浅灰色C点集将经过B模型处理的深灰色B点集全部覆盖,部分点还可看出C点在对应B点的中心处。
在一些具体的实施例中,参考图6,图6示出了本申请的D模型效果分析图。将经过C模型第一层聚类处理后的初始单行站点数据喂入D模型进行第二层聚类,D模型使用k-Means算法进行第二层聚类,以确定最终的站点位置。在具体实践过程中我们期望D模型输出站点将C模型聚类后的站点全部覆盖,并且识别后的站点数量不多不少恰好为实际站点数量。从图6可知,经D模型处理后的D点在对应的B模型和C模型处理后的B点集、C点集的中心且没有丢失站点信息。经过C模型和D模型的第一层聚类和第二层聚类,可将经过B模型识别到的站点数量大幅度下降,具体参考图7,图7示出了本申请的B、C、D模型处理后的站点数量变化直方图。由图7可知,B模型处理后的上行、下行或环行的疑似单行站点数据最多,经过C模型进行第一层聚类后,输出的数量下降了1/3有余,再经过D模型进行第二层聚类后,输出的站点数量相较于第一层聚类后更下降2/3,使得D模型的最终站点数量为我们所需的实际站点数。虽然单纯从量化指标上并不能完全代替站点图像的整体观察,但对于后期算法自动优化和模型性能评价依然具有重要的数学意义,下面给出站点平均误差函数,最终单行站点数据中的每个最终单行站点和对应的原始线路站点的进行平均误差函数计算,具体的计算公式如下:
Figure GDA0003833137390000111
其中,N表示最终单行站点的个数,yi表示第i个最终单行站点的向量值,xi表示第i个原始线路站点的向量值,i表示自然数,且i≤N。
在一些优选的实施例中,如果利用上述误差函数计算站点平均误差为10.03米;由于GPS本身存在一定的误差且驾驶员停车点会落在某个区间,计算后各站点平均误差在11米内,而且这个距离在人肉眼的可视范围,所以可认定该模型效果较为理想。
在一些具体的实施例中,参考表6、表7和图8,图8示出了根据本申请的E模型效果分析图。表6和表7为经过D模型处理后的部分最终单行站点样例数据,其中,表6和表7中的prediction列的值是D模型站点的顺序,但不是实际顺序,将一趟班次数据分组并按照纪元秒的最小值聚合,最后以最小纪元秒升序排列,即可得到如图8所示的站点实际顺序。如图8所示,散点即为进站数据,纵坐标为进站的日期时间信息,横坐标为对应纵坐标数据的纪元秒数据,纪元秒数据的设置主要是为了将时间信息在横轴上均匀分布,避免因时间进制的问题导致趟次间隔异常。从图8可以明显看出,在9:00~17:00期间,该行车共有两次上行航班。为了保证航班的站点数据的完整性,在此定义纪元秒间隔大于3600秒即一小时的前后站点为线路的首末站点,从这个阈值条件来挖掘一趟班次信息。同时针对班次不完整的情况使用原始站点文件中的站点数量进行校验,如果不匹配,则说明该趟班次数据可能不完整;接着进行下一趟班次的匹配,如果所有趟次的站点信息都与原始站点数量不同,则该线路可能有实际的线路调整,应交人工审核。
表6:
prediction featureX featureY min(epochSecond)
23 1.3283899106421404E7 3002431.8354561245 1609080420
6 1.3283953541652402E7 3002665.1086868676 1609080720
4 1.3283823297848172E7 3003173.0452892045 1609080780
2 1.3283607894633489E7 3004001.887279008 1609081140
16 1.3283184880568475E7 3004055.162745202 1609081320
24 1.3283165399657585E7 3004488.188033391 1609081380
10 1.3282979496107958E7 3004568.723488466 1609081500
21 1.3282800828325238E7 3004527.83620206 1609081560
5 1.328249136014083E7 3004732.893296947 1609081740
22 1.3282284027589228E7 3004961.185343084 1609081800
0 1.3282162411045536E7 3006647.9317999315 1609082220
12 1.3282126232211027E7 3007302.237719069 1609082280
18 1.3281764443865951E7 3007467.6776939277 1609082400
14 1.328131174460339E7 3007622.79229429 1609082520
15 1.3281223987738151E7 3008298.0041769557 1609082640
表7:
Figure GDA0003833137390000121
在一些具体的实施例中,参考图9和图10,图9示出了根据本申请的F模型效果分析图,图10示出了根据本申请的某班次的实际行驶线路和原始线路喂入F模型处理后的样例数据图。将经过E模型时间顺序排序处理的实际行驶线路的数据喂入F模型进行线路特征变换处理,同时,将原始线路也导入F模型进行线路特征变换处理,经过F模型后,一般形成两条向量,一条为原始线路文件的站点坐标向量,另一条为该趟班次经过计算后的站点向量,具体样例数据内容可参考如图10所示。在此,以原始线路为例说明,原始的线路数据是由多个坐标点所组成的,可表示为x和y两列向量所组成的矩阵。假设有25个站点,那该线路矩阵就有25个行向量,经过F模型特征变换后,这个矩阵将被压扁为一个如图9所示的具有25个元组,每个元组有2个组元即为横纵坐标,最终形成的行向量一共有50个元素。
在一些具体的实施例中,可以使用向量间距离计算的方式来计算实际行驶线路与原始线路的差异度,其差异度最终计算的结果越接近0则判定实际行驶线路与原始线路越相似。将F模型生成的两个向量导入G模型进行差异度计算,经过计算后的差异度值为69.32;为了形成对比,将实际行驶线路的上行班次向量进行反向处理,模拟一次下行班次向量,具体样例数据如图11所示,其与原始线路文件的上行向量计算差异度的结果为33914.42。可见,上下行线路差距较大,在实际使用时可设定阈值来判断线路是否存在差异,比如可设定k*10为设定阈值,其中,k为已知的站点数量。经过G模型处理,若实际行驶线路与原始线路的差异度小于等于设定阈值,则将该线路上全部行车的实际行驶线路汇总成车辆路径集,便于后续车辆路径异常判断,若实际行驶线路与原始线路的差异度大于设定阈值,则判断实际行驶线路为线路异常,并将线路异常反馈给告警模块,进行相应的告警处理,最后由人工处理。
在一些具体的实施例中,H模型负责收集G模型的产出,最终选取最优的线路来更新旧的线路数据,并对接后续的异常告警模块,将异常行驶线路的车辆抓取出来,以进行进一步处理。从C模型开始到G模型结束,实则为对车辆行驶信息的遍历过程,即给C模型投喂的数据以单辆车为单位。因为如果是以其他车辆进行输入,如按照线路进行投喂,则数据中混入多辆车的信息,这就有可能发生某辆车实际行驶的线路与数据中不相符的问题,如果有这种情况的发生,则会对CD模型进行干扰,故以单辆车为单位来过模型管线。
继续参考图12,其示出了根据本申请的一种基于分布式机器学习的行车站点优化更新系统的一个实施例的结构示意图,如图12所示,行车站点优化更新系统1200包括以下单元。
疑似单行站点模块1201,配置用于将固定时间段内单条线路全部行车的车况信息进行站内和上下行分类,获得上下行分类所对应的疑似单行站点数据;
初始单行站点模块1202,配置用于以单辆行车为单位,将疑似单行站点数据通过Bisecting k-Means算法进行第一层聚类处理,获得每辆行车对应的初始单行站点数据;
实际行驶线路模块1203,配置用于利用k-Means算法对初始单行站点数据进行第二层聚类处理,获得每辆行车的最终单行站点数据,基于时间顺序将最终单行站点数据进行串联处理,获得每辆行车的实际行驶线路。
优化行车站点模块1204,配置用于将实际行驶线路与原始线路进行差异度计算,以更新差异度小于设定阈值的原始线路的站点位置信息,获得优化后的行车站点线路。
在一些具体的实施例中,实际行驶线路模块1203还包括对最终单行站点数据中的每个最终单行站点和对应的原始线路站点的进行平均误差函数计算,具体的计算公式如下:
Figure GDA0003833137390000141
其中,N表示最终单行站点的个数,yi表示第i个最终单行站点的向量值,xi表示第i个原始线路站点的向量值,i表示自然数,且i≤N。
在一些具体的实施例中,优化行车站点模块1204还包括响应于将全部行车的实际行驶线路根据对应的差异度大小进行降序排序,选取差异度最小的实际行驶线路作为最优匹配线路,并根据最优匹配线路更新对应的站点信息。
下面参考图13,其示出了适于用来实现本申请实施例的电子设备的计算机系统1300的结构示意图。图13示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图13所示,计算机系统1300包括中央处理单元(CPU)1301,其可根据存储在只读存储器(ROM)1301中的程序或者从存储部分1308加载到随机访问存储器(RAM)1303中的程序而执行各种适当的动作和处理。在RAM 1303中存储系统1300操作所需的各种程序和数据。CPU 1301、ROM 1301以及RAM 1303通过总线1304彼此相连。输入/输出(I/O)接口1305也连接至总线1304。
以下部件连接至I/O接口1305:包括输入部分1306、输出部分1307、存储部分1308、通信部分1309、驱动器1310、可拆卸介质1311。驱动器1310可根据需要连接至I/O接口1305,可拆卸介质1311根据需要安装在驱动器1310上,以便于从其上读出的计算机程序根据需要被安装入存储部分1308。
特别地,根据本公开的实施例,上文参考流程图描述的过程可被实现为计算机软件程序。可以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码。程序代码可完全地在训练者计算机上执行、部分地在训练者计算机上执行、作为一个独立的软件包执行、部分在训练者计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到训练者计算机,或者可连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可通过软件的方式实现,也可通过硬件的方式来实现。所描述的模块也可设置在处理器中,例如,可描述为:一种处理器包括疑似单行站点模块、初始单行站点模块、实际行驶线路模块和优化行车站点模块。其中,这些模块的名称在某种情况下并不构成对该单元本身的限定,例如,疑似单行站点模块还可被描述为“将固定时间段内单条线路全部行车的车况信息进行站内和上下行分类,获得上下行分类所对应的疑似单行站点数据”。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:将固定时间段内单条线路全部行车的车况信息进行站内和上下行分类,获得上下行分类所对应的疑似单行站点数据;以单辆行车为单位,将疑似单行站点数据通过Bisecting k-Means算法进行第一层聚类处理,获得每辆行车对应的初始单行站点数据;利用k-Means算法对初始单行站点数据进行第二层聚类处理,获得每辆行车的最终单行站点数据,基于时间顺序将最终单行站点数据进行串联处理,获得每辆行车的实际行驶线路;以及将实际行驶线路与原始线路进行差异度计算,以更新差异度小于设定阈值的原始线路的站点位置信息,获得优化后的行车站点线路。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (8)

1.一种基于分布式机器学习的行车站点优化更新方法,其特征在于,所述方法包括:
S1:将固定时间段内单条线路全部行车的车况信息进行站内和上下行分类,获得所述上下行分类所对应的疑似单行站点数据;
S2:以单辆行车为单位,将所述疑似单行站点数据通过Bisecting k-Means算法进行第一层聚类处理,获得每辆行车对应的初始单行站点数据;
S3:利用k-Means算法对所述初始单行站点数据进行第二层聚类处理,获得每辆行车的最终单行站点数据,基于时间顺序将所述最终单行站点数据进行串联处理,获得每辆行车的实际行驶线路;以及
S4:将所述实际行驶线路与原始线路进行差异度计算,以更新所述差异度小于设定阈值的原始线路的站点位置信息,获得优化后的行车站点线路;
在进行差异度计算前,需要将所述实际行驶线路和原始线路进行线路特征变换处理,最后转换成两个行向量,而相关特征计算用于生成线路特征矩阵,主要是将所述实际行驶线路和原始线路向量化输出,然后将所述实际行驶线路与原始线路进行差异度计算,并更新差异;
响应于将所述全部行车的实际行驶线路根据对应的差异度大小进行降序排序,选取差异度小于设定阈值且差异度最小的实际行驶线路作为最优匹配线路,并根据所述最优匹配线路更新对应的站点信息。
2.根据权利要求1所述的方法,其特征在于,所述S2步骤前还包括利用墨卡托投影将所述疑似单行站点数据的经纬度坐标轴转化为墨卡托单元。
3.根据权利要求1所述的方法,其特征在于,所述S3步骤还包括对所述最终单行站点数据中的每个最终单行站点和对应的原始线路站点的进行平均误差函数计算,具体的计算公式如下:
Figure FDA0003833137380000011
其中,N表示最终单行站点的个数,yi表示第i个最终单行站点的向量值,xi表示第i个原始线路站点的向量值,i表示自然数,且i≤N。
4.一种基于分布式机器学习的行车站点优化更新系统,其特征在于,所述系统包括:
疑似单行站点模块,配置用于将固定时间段内单条线路全部行车的车况信息进行站内和上下行分类,获得所述上下行分类所对应的疑似单行站点数据;
初始单行站点模块,配置用于以单辆行车为单位,将所述疑似单行站点数据通过Bisecting k-Means算法进行第一层聚类处理,获得每辆行车对应的初始单行站点数据;
实际行驶线路模块,配置用于利用k-Means算法对所述初始单行站点数据进行第二层聚类处理,获得每辆行车的最终单行站点数据,基于时间顺序将所述最终单行站点数据进行串联处理,获得每辆行车的实际行驶线路;
优化行车站点模块,配置用于将所述实际行驶线路与原始线路进行差异度计算,以更新所述差异度小于设定阈值的原始线路的站点位置信息,获得优化后的行车站点线路;
在进行差异度计算前,需要将所述实际行驶线路和原始线路进行线路特征变换处理,最后转换成两个行向量,而相关特征计算用于生成线路特征矩阵,主要是将所述实际行驶线路和原始线路向量化输出,然后将所述实际行驶线路与原始线路进行差异度计算,并更新差异;
响应于将所述全部行车的实际行驶线路根据对应的差异度大小进行降序排序,选取差异度小于设定阈值且差异度最小的实际行驶线路作为最优匹配线路,并根据所述最优匹配线路更新对应的站点信息。
5.根据权利要求4所述的系统,其特征在于,所述实际行驶线路模块还包括对所述最终单行站点数据中的每个最终单行站点和对应的原始线路站点的进行平均误差函数计算,具体的计算公式如下:
Figure FDA0003833137380000021
其中,N表示最终单行站点的个数,yi表示第i个最终单行站点的向量值,xi表示第i个原始线路站点的向量值,i表示自然数,且i≤N。
6.根据权利要求4所述的系统,其特征在于,所述优化行车站点模块还包括响应于将所述全部行车的实际行驶线路根据对应的差异度大小进行降序排序,选取差异度最小的实际行驶线路作为最优匹配线路,并根据所述最优匹配线路更新对应的站点信息。
7.一种电子设备,包括:
一个或多个处理器;
存储系统,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3中任一所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一所述的方法。
CN202110156888.8A 2021-02-04 2021-02-04 一种基于分布式机器学习的行车站点优化更新方法和系统 Active CN112819229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110156888.8A CN112819229B (zh) 2021-02-04 2021-02-04 一种基于分布式机器学习的行车站点优化更新方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110156888.8A CN112819229B (zh) 2021-02-04 2021-02-04 一种基于分布式机器学习的行车站点优化更新方法和系统

Publications (2)

Publication Number Publication Date
CN112819229A CN112819229A (zh) 2021-05-18
CN112819229B true CN112819229B (zh) 2022-10-28

Family

ID=75861385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110156888.8A Active CN112819229B (zh) 2021-02-04 2021-02-04 一种基于分布式机器学习的行车站点优化更新方法和系统

Country Status (1)

Country Link
CN (1) CN112819229B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688275B (zh) * 2021-10-26 2022-02-18 武汉元光科技有限公司 一种公告数据的处理方法、装置以及处理设备
CN114543824A (zh) * 2022-01-14 2022-05-27 北京百度网讯科技有限公司 确定车辆行驶线路的方法、装置、设备、介质及产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564226A (zh) * 2018-04-25 2018-09-21 哈尔滨工业大学 一种基于出租车gps及手机信令数据的公交线路优化方法
CN110276977A (zh) * 2019-07-29 2019-09-24 广东工业大学 一种公交站点匹配方法、装置、设备及可读存储介质
CN111210612A (zh) * 2019-10-29 2020-05-29 浙江浙大中控信息技术有限公司 基于公交gps数据与站点信息提取公交线路轨迹的方法
CN112288131A (zh) * 2020-09-24 2021-01-29 和智信(山东)大数据科技有限公司 公交站点优化方法、电子设备及计算机可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951981A (zh) * 2017-02-24 2017-07-14 河海大学 一种车辆路径选择方法
DE102019101094A1 (de) * 2019-01-16 2020-07-16 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur Routenplanung in einem Navigationssystem eines Fahrzeugs, Navigationssystem für ein Fahrzeug und Fahrzeug mit demselben
CN112085249B (zh) * 2020-07-27 2022-11-04 北京工业大学 一种基于强化学习的定制公交线路规划方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564226A (zh) * 2018-04-25 2018-09-21 哈尔滨工业大学 一种基于出租车gps及手机信令数据的公交线路优化方法
CN110276977A (zh) * 2019-07-29 2019-09-24 广东工业大学 一种公交站点匹配方法、装置、设备及可读存储介质
CN111210612A (zh) * 2019-10-29 2020-05-29 浙江浙大中控信息技术有限公司 基于公交gps数据与站点信息提取公交线路轨迹的方法
CN112288131A (zh) * 2020-09-24 2021-01-29 和智信(山东)大数据科技有限公司 公交站点优化方法、电子设备及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
A Multi-Objective Robust Optimization Model for Customized Bus Routes;Changxi Ma;《 IEEE Transactions on Intelligent Transportation Systems》;20200902;全文 *

Also Published As

Publication number Publication date
CN112819229A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN112819229B (zh) 一种基于分布式机器学习的行车站点优化更新方法和系统
CN108072381B (zh) 一种路径规划的方法及装置
US20210188290A1 (en) Driving model training method, driver identification method, apparatuses, device and medium
CN108513676A (zh) 一种路况识别方法、装置及设备
CN112668172B (zh) 考虑车型和驾驶风格异质性的跟驰行为建模方法及其模型
CN101853291A (zh) 基于数据流的车辆故障诊断方法
DE102016210453A1 (de) Fahrzeug, System in Kommunikation mit einem Kommunikationsmodul des Fahrzeugs, und System in Kommunikation mit einer Gruppe von Fahrzeugen
CN113423063B (zh) 基于车载t-box的车辆监控方法、装置、车辆及介质
CN112700201A (zh) 货源推荐方法、电子设备和存储介质
CN115273480B (zh) 一种基于大数据分析的交通预警系统及其方法
CN113158922A (zh) 基于yolo神经网络的车流量统计方法、装置及设备
CN115713858A (zh) 一种基于交通大数据的智慧交通运行管控系统
Hamed et al. Fuel consumption prediction model using machine learning
CN109147322B (zh) 一种城市交通大数据处理中多源数据自适应融合方法
CN114186944A (zh) 一种冷链物流的数字化协同追溯方法及系统
US20170287232A1 (en) Method and system for providing direct feedback from connected vehicles
CN114138680A (zh) 数据构建、数据查询和测试方法、电子设备以及存储介质
CN110020666B (zh) 一种基于乘客行为模式的公共交通广告投放方法及系统
CN114066288B (zh) 一种基于智慧数据中心的营运道路应急检测方法及系统
CN114119256A (zh) 一种ubi危险化学品车辆驾驶行为采集分析系统及保费折扣方法
CN113393011A (zh) 预测限速信息的方法、装置、计算机设备和介质
CN112347376A (zh) 基于多时空聚类的出租车载客点推荐方法
CN116451084B (zh) 一种用于驾驶风格识别模型的训练样本预处理方法
US20240338980A1 (en) Dtc rulebook generation system and method
US20230260257A1 (en) Iterative refinement of annotated datasets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant