CN112215246B - 道路交通诊断方法、装置、电子设备及机器可读存储介质 - Google Patents

道路交通诊断方法、装置、电子设备及机器可读存储介质 Download PDF

Info

Publication number
CN112215246B
CN112215246B CN201910618668.5A CN201910618668A CN112215246B CN 112215246 B CN112215246 B CN 112215246B CN 201910618668 A CN201910618668 A CN 201910618668A CN 112215246 B CN112215246 B CN 112215246B
Authority
CN
China
Prior art keywords
data set
traffic
node
sample
decision tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910618668.5A
Other languages
English (en)
Other versions
CN112215246A (zh
Inventor
徐洁琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201910618668.5A priority Critical patent/CN112215246B/zh
Publication of CN112215246A publication Critical patent/CN112215246A/zh
Application granted granted Critical
Publication of CN112215246B publication Critical patent/CN112215246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明实施例提供了一种道路交通诊断方法、装置、电子设备及机器可读存储介质,获取待诊断道路的多个当前交通评价指标值,将多个当前交通评价指标值输入预先训练的交通诊断模型,得到待诊断道路的交通诊断结果。交通诊断模型是基于多个交通评价指标的样本值训练得到的、以多个交通评价指标为变量的多变量概率模型,是一种端到端的概率模型,是基于样本数据训练得到的,能够计算出多个交通评价指标在不同取值下所得到的交通诊断结果,因此,直接将获取到的待诊断道路的多个当前交通评价指标值输入该多变量概率模型,可以直接得到待诊断道路的交通诊断结果,明显减少了人工设置阈值的操作,从而保证了道路交通诊断结果的准确性。

Description

道路交通诊断方法、装置、电子设备及机器可读存储介质
技术领域
本发明涉及交通控制技术领域,特别是涉及一种道路交通诊断方法、装置、电子设备及机器可读存储介质。
背景技术
城市交通信号控制作为缓解道路拥堵、提高交通流安全的核心手段,在交通系统中起到了非常关键的作用。一方面,通过优化的信号控制策略提高车辆通行能力、减少延误时间;另一方面,通过调控信号相位切换时的关键参数保证车辆以及行人的安全。通过道路交通诊断,能够得到当前道路失衡、溢流、空放、正常等诊断结果,为交通信号控制提供了控制效果反馈与优化建议。
为了实现交通信号控制,会在道路上方架设监控设备或者在道路旁安装感应设备,通过监控设备或者感应设备,能够实时采集到道路的车辆通行间隔、停车次数、车辆排队长度等交通流信息,这些交通流信息直接或者间接地反映了当前的道路状况,因此,可以基于这些交通流信息来进行道路交通诊断。通常情况下,会针对不同的交通流信息设置不同的阈值,例如设置有通行间隔阈值、停车次数阈值、排队长度阈值,将实时采集的各交通流信息分别与这些阈值进行比较,基于比较结果来确定道路是否失衡、溢流、空放或者正常。
然而,上述道路交通诊断方法中,需要交通管理员根据经验设置不同的阈值,交通流信息越多,对应设置的阈值的种类越多,阈值设置的高低直接影响着交通诊断结果的准确性,而阈值的种类越多,交通诊断结果的准确性就越难得到保证。
发明内容
本发明实施例的目的在于提供一种道路交通诊断方法、装置、电子设备及机器可读存储介质,以保证道路交通诊断结果的准确性。具体技术方案如下:
第一方面,本发明实施例提供了一种道路交通诊断方法,所述方法包括:
获取待诊断道路的多个当前交通评价指标值;
将所述多个当前交通评价指标值输入预先训练的交通诊断模型,得到所述待诊断道路的交通诊断结果,所述交通诊断模型是基于多个交通评价指标的样本值训练得到的、以所述多个交通评价指标为变量的多变量概率模型。
可选的,所述交通诊断模型为多变量决策树模型;
在所述将所述多个当前交通评价指标值输入预先训练的交通诊断模型,得到所述待诊断道路的交通诊断结果之前,所述方法还包括:
获取样本集合,所述样本集合包括多个交通评价指标的多个样本值;
按照从多变量决策树的根节点至叶节点的顺序,依次针对各节点执行如下步骤,得到所述多变量决策树模型:
从所述样本集合中选取多个样本值,组成数据集合D,其中,所述数据集合D=(x(1),x(2),…,x(m)),所述数据集合D中的样本x(i)为多个样本值组成的n维列向量,i∈(1,m);
采用预设的降维方法,对所述数据集合D进行降维,得到降维后的数据集合D’,其中,所述数据集合D’=(z(1),z(2),…,z(m)),所述数据集合D’中的样本z(i)为n’维列向量,所述样本z(i)为对所述样本x(i)降维转换得到,所述n’小于所述n;
基于所述数据集合D’、不同的指定步长和设定步数,采用基尼指数计算方法,计算得到当前节点的划分阈值,并基于所述划分阈值,确定所述当前节点对应的多个交通评价指标的线性判定方式。
可选的,所述采用预设的降维方法,对所述数据集合D进行降维,得到降维后的数据集合D’,包括:
对所述数据集合D中的所有样本进行去均值化操作,得到数据集合X;
计算所述数据集合X的协方差矩阵;
对所述协方差矩阵进行特征值分解,得到从大至小的前n’个特征值对应的特征向量,并对各特征向量进行标准化处理;
将标准化处理后的各特征向量组成特征向量矩阵W;
根据所述特征向量矩阵W及所述数据集合D中的样本x(i),将所述样本x(i)降维转换为样本z(i),其中,z(i)=WTx(i)
基于所述样本z(i),组成数据集合D’,其中,所述数据集合D’=(z(1),z(2),…,z(m))。
可选的,所述基于所述划分阈值,确定所述当前节点对应的多个交通评价指标的线性判定方式,包括:
确定所述当前节点对应的多个交通评价指标的线性判定方式为:所述特征向量矩阵W与各交通评价指标组成的列向量的乘积小于所述划分阈值。
可选的,所述基于所述数据集合D’、不同的指定步长和设定步数,采用基尼指数计算方法,计算得到当前节点的划分阈值,包括:
针对不同的指定步长,分别执行如下步骤:
按照指定步长和设定步数,从所述数据集合D’中提取样本值,得到多个子数据集合;
针对各子数据集合,统计该子数据集合中不同交通评价指标类别的样本值的数目占该子数据集合样本值总数目的比例,并根据所述比例计算该子数据集合的基尼值;
根据所述各子数据集合的基尼值,计算以参考数据值为划分阈值的所述数据集合D’的基尼指数,所述参考数据值为根据设定初始值、所述指定步长和所述设定步数计算得到;
确定分别以各参考数据值为划分阈值的所述数据集合D’的基尼指数中的最小值对应的参考数据值为当前节点的划分阈值。
可选的,在所述得到多变量决策树模型之后,所述方法还包括:
获取验证集;
按照从所述多变量决策树模型的叶节点至根节点的顺序,依次针对各节点执行如下步骤:
利用所述验证集,对所述多变量决策树模型进行验证,得到验证结果;
当所述验证结果不满足预设准确度条件时,对所述多变量决策树模型进行剪枝,得到更新后的所述多变量决策树模型。
可选的,所述利用所述验证集,对所述多变量决策树模型进行验证,得到验证结果,包括:
利用所述验证集,测试所述多变量决策树模型的准确度,得到所述多变量决策树模型的第一准确度;
利用一个叶节点,替换与所述一个叶节点相连的上一层节点,并利用所述验证集,测试节点替换后的多变量决策树模型的准确度,得到所述节点替换后的多变量决策树模型的第二准确度;
在计算得到各叶节点替换所述上一层节点之后的各第二准确度之后,提取所述各第二准确度中的最大值;
根据所述最大值及所述第一准确度,计算所述最大值和所述第一准确度的差值占所述第一准确度的比例,作为验证结果。
可选的,所述预设准确度条件为所述比例小于或等于预设比例阈值;
所述当所述验证结果不满足预设准确度条件时,对所述多变量决策树模型进行剪枝,得到更新后的所述多变量决策树模型,包括:
当所述比例大于所述预设比例阈值时,将所述上一层节点替换为所述最大值对应的叶节点,并丢弃与所述上一层节点相连的叶节点,得到更新后的所述多变量决策树模型。
第二方面,本发明实施例提供了一种道路交通诊断装置,所述装置包括:
获取模块,用于获取待诊断道路的多个当前交通评价指标值;
诊断模块,用于将所述多个当前交通评价指标值输入预先训练的交通诊断模型,得到所述待诊断道路的交通诊断结果,所述交通诊断模型是基于多个交通评价指标的样本值训练得到的、以所述多个交通评价指标为变量的多变量概率模型。
可选的,所述交通诊断模型为多变量决策树模型;
所述装置还包括训练模块,所述训练模块用于:
获取样本集合,所述样本集合包括多个交通评价指标的多个样本值;
按照从多变量决策树的根节点至叶节点的顺序,依次针对各节点执行如下步骤,得到所述多变量决策树模型:
从所述样本集合中选取多个样本值,组成数据集合D,其中,所述数据集合D=(x(1),x(2),…,x(m)),所述数据集合D中的样本x(i)为多个样本值组成的n维列向量,i∈(1,m);
采用预设的降维方法,对所述数据集合D进行降维,得到降维后的数据集合D’,其中,所述数据集合D’=(z(1),z(2),…,z(m)),所述数据集合D’中的样本z(i)为n’维列向量,所述样本z(i)为对所述样本x(i)降维转换得到,所述n’小于所述n;
基于所述数据集合D’、不同的指定步长和设定步数,采用基尼指数计算方法,计算得到当前节点的划分阈值,并基于所述划分阈值,确定所述当前节点对应的多个交通评价指标的线性判定方式。
可选的,所述训练模块在用于所述采用预设的降维方法,对所述数据集合D进行降维,得到降维后的数据集合D’时,具体用于:
对所述数据集合D中的所有样本进行去均值化操作,得到数据集合X;
计算所述数据集合X的协方差矩阵;
对所述协方差矩阵进行特征值分解,得到从大至小的前n’个特征值对应的特征向量,并对各特征向量进行标准化处理;
将标准化处理后的各特征向量组成特征向量矩阵W;
根据所述特征向量矩阵W及所述数据集合D中的样本x(i),将所述样本x(i)降维转换为样本z(i),其中,z(i)=WTx(i)
基于所述样本z(i),组成数据集合D’,其中,所述数据集合D’=(z(1),z(2),…,z(m))。
可选的,所述训练模块在用于所述基于所述划分阈值,确定所述当前节点对应的多个交通评价指标的线性判定方式时,具体用于:
确定所述当前节点对应的多个交通评价指标的线性判定方式为:所述特征向量矩阵W与各交通评价指标组成的列向量的乘积小于所述划分阈值。
可选的,所述训练模块在用于所述基于所述数据集合D’、不同的指定步长和设定步数,采用基尼指数计算方法,计算得到当前节点的划分阈值时,具体用于:
针对不同的指定步长,分别执行如下步骤:
按照指定步长和设定步数,从所述数据集合D’中提取样本值,得到多个子数据集合;
针对各子数据集合,统计该子数据集合中不同交通评价指标类别的样本值的数目占该子数据集合样本值总数目的比例,并根据所述比例计算该子数据集合的基尼值;
根据所述各子数据集合的基尼值,计算以参考数据值为划分阈值的所述数据集合D’的基尼指数,所述参考数据值为根据设定初始值、所述指定步长和所述设定步数计算得到;
确定分别以各参考数据值为划分阈值的所述数据集合D’的基尼指数中的最小值对应的参考数据值为当前节点的划分阈值。
可选的,所述训练模块,还用于:
获取验证集;
按照从所述多变量决策树模型的叶节点至根节点的顺序,依次针对各节点执行如下步骤:
利用所述验证集,对所述多变量决策树模型进行验证,得到验证结果;
当所述验证结果不满足预设准确度条件时,对所述多变量决策树模型进行剪枝,得到更新后的所述多变量决策树模型。
可选的,所述训练模块在用于所述利用所述验证集,对所述多变量决策树模型进行验证,得到验证结果时,具体用于:
利用所述验证集,测试所述多变量决策树模型的准确度,得到所述多变量决策树模型的第一准确度;
利用一个叶节点,替换与所述一个叶节点相连的上一层节点,并利用所述验证集,测试节点替换后的多变量决策树模型的准确度,得到所述节点替换后的多变量决策树模型的第二准确度;
在计算得到各叶节点替换所述上一层节点之后的各第二准确度之后,提取所述各第二准确度中的最大值;
根据所述最大值及所述第一准确度,计算所述最大值和所述第一准确度的差值占所述第一准确度的比例,作为验证结果。
可选的,所述预设准确度条件为所述比例小于或等于预设比例阈值;
所述训练模块在用于所述当所述验证结果不满足预设准确度条件时,对所述多变量决策树模型进行剪枝,得到更新后的所述多变量决策树模型时,具体用于:
当所述比例大于所述预设比例阈值时,将所述上一层节点替换为所述最大值对应的叶节点,并丢弃与所述上一层节点相连的叶节点,得到更新后的所述多变量决策树模型。
第三方面,本发明实施例提供了一种电子设备,包括处理器和存储器,其中,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述机器可执行指令由所述处理器加载并执行,以实现本发明实施例第一方面所提供的方法。
第四方面,本发明实施例提供了一种机器可读存储介质,所述机器可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例第一方面所提供的方法。
本发明实施例提供的一种道路交通诊断方法、装置、电子设备及机器可读存储介质,获取待诊断道路的多个当前交通评价指标值,将多个当前交通评价指标值输入预先训练的交通诊断模型,得到待诊断道路的交通诊断结果。由于交通诊断模型是基于多个交通评价指标的样本值训练得到的、以多个交通评价指标为变量的多变量概率模型,交通诊断模型是一种端到端的概率模型,是基于样本数据训练得到的多变量概率模型,能够计算出多个交通评价指标在不同取值下所得到的交通诊断结果,因此,直接将获取到的待诊断道路的多个当前交通评价指标值输入该多变量概率模型,可以直接得到待诊断道路的交通诊断结果,明显减少了人工设置阈值的操作,从而保证了道路交通诊断结果的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例的道路交通诊断方法的流程示意图;
图2为本发明实施例的多变量决策树模型中节点的示意图;
图3为本发明另一实施例的道路交通诊断方法的流程示意图;
图4为本发明实施例的多变量决策树模型训练的流程示意图;
图5为本发明实施例的道路交通诊断装置的结构示意图;
图6为本发明实施例的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了保证道路交通诊断结果的准确性,本发明实施例提供了一种道路交通诊断方法、装置、电子设备及机器可读存储介质。
本发明实施例中的术语解释如下:
主成分分析:通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量的降维方法。
基尼值:反映从数据集合中随机抽取两个数据,其类别不一致的概率。
基尼指数:反映数据集合的纯度。
交通信号控制:采用交通信号控制设备,随交通变化特性来控制车辆和行人的通行。
交通诊断:根据交通评价指标,识别交通信号控制过程中所存在的问题的过程。
交通仿真:用系统仿真技术来研究交通行为,是一种对交通运动随时间和空间的变化进行跟踪描述的技术。
绿灯利用率:又称绿灯时间利用率,指绿灯时长被该时段通过道路的车流的利用程度。
车均延误:车辆通过道路指定区域时平均受到阻碍损失的时间。
排队长度:车辆等待通过道路指定区域时进行排队的车辆队伍长度。
去均值:是针对矩阵中每一个维度进行的运算,也就是说每一行减去这一行的均值。
下面,首先对本发明实施例所提供的道路交通诊断方法进行介绍。
本发明实施例所提供的道路交通诊断方法的执行主体可以为具有交通诊断功能的电子设备,电子设备中应该至少包括搭载有核心处理芯片的处理器。实现本发明实施例所提供的道路交通诊断方法的方式可以为设置于上述电子设备中的软件、硬件电路和逻辑电路中的至少一种方式。
如图1所示,本发明实施例所提供的一种道路交通诊断方法,可以包括如下步骤。
S101,获取待诊断道路的多个当前交通评价指标值。
待诊断道路为交通管理人员选择的需要进行诊断控制的路段、路口等,可以是十字路口、T字路口、直行路段等。在道路上方通常架设有监控设备(例如摄像头)或者在道路旁架设有感应设备(例如红外线感应器),监控设备可以进行道路拍摄,感应设备可以进行交通流感应,监控设备或者感应设备可以将实时采集到的数据发送给后台具有交通评价功能的电子设备,电子设备在接收到前端的监控设备或者感应设备发送的数据后,可以对数据进行评价分析,得到当前待诊断道路的绿灯利用率、车均延误、排队长度、最大车道排队长度等交通评价指标值,然后将这些交通评价指标值作为诊断输入发送给用于进行交通诊断的电子设备。
本发明实施例中,具有交通诊断功能的电子设备可以同时具有交通评价功能,因此,该电子设备可以直接接收前端的监控设备或者感应设备发送的数据,进行评价分析得到待诊断道路的当前交通评价指标值。
S102,将多个当前交通评价指标值输入预先训练的交通诊断模型,得到待诊断道路的交通诊断结果,其中,交通诊断模型是基于多个交通评价指标的样本值训练得到的、以多个交通评价指标为变量的多变量概率模型。
在本发明实施例中,预先训练得到一个交通诊断模型,该交通诊断模型是基于多个交通评价指标的样本值训练得到的,多个交通评价指标结合在一起决定了最终的诊断结果,作为样本的多个交通评价指标所产生的样本诊断结果是确定的,并且交通诊断模型是一种端到端的概率模型,将多个当前交通评价指标值输入交通诊断模型,直接可以得到对应的交通诊断结果,能够保证诊断结果的准确性。
在得到待诊断道路的交通诊断结果之后,可以利用交通诊断结果进行后续的交通信号控制、交通仿真等操作,后续的交通信号控制、交通仿真等操作可以采用传统的方式,这里不再赘述。
可选的,交通诊断模型可以为多变量决策树模型。
多变量决策树模型包括多个节点,根节点和中间节点对应为多个变量的线性组合的判定方式,叶节点为诊断结果。不同于传统的决策树,多变量决策树模型不是由单变量决定判定方式的决策树。
相应的,多变量决策树模型的训练方式可以包括如下步骤:
第1步,获取样本集合,其中,样本集合包括多个交通评价指标的多个样本值。
样本集合中包括有多个交通评价指标的多个样本值,所获取的样本集合中不同交通评价指标的样本值越多,则最终训练得到的模型就越准确。样本集合中除了包括多个交通评价指标的多个样本值以外,还可以包括不同的交通评指标的样本值的线性组合导致的失衡、溢流、空放、正常等结果。
第2步,按照从多变量决策树的根节点至叶节点的顺序,依次针对各节点执行以下第2.1步至第2.3步,得到多变量决策树模型。
第2.1步,从样本集合中选取多个样本值,组成数据集合D,其中,数据集合D=(x(1),x(2),…,x(m)),数据集合D中的样本x(i)为多个样本值组成的n维列向量,i∈(1,m)。
针对于某一个节点,在选取样本值时,是基于样本诊断结果进行选取的,并且如果一个节点选取了某些样本值,则在其他节点选取样本值时,不会继续选取这些样本值,而是从剩下的样本值中进行选取。
第2.2步,采用预设的降维方法,对数据集合D进行降维,得到降维后的数据集合D’,其中,数据集合D’=(z(1),z(2),…,z(m)),数据集合D’中的样本z(i)为n’维列向量,样本z(i)为对样本x(i)降维转换得到,n’小于n。
数据集合D中的样本x(i)之间可能存在相关性,而在本发明实施例中,需要分析出线性不相关的变量之间的线性组合,在得到数据集合D之后,可以采用主成分分析等降维方法对数据集合D进行降维,具体的,是通过正交变换将一组可能存在相关性的变量降维转换为一组线性不相关的变量。降维之后的维度n’一般与当前节点所需的变量数目相关,可以由管理人员设定。
第2.3步,基于数据集合D’、不同的指定步长和设定步数,采用基尼指数计算方法,计算得到当前节点的划分阈值,并基于该划分阈值,确定当前节点对应的多个交通评价指标的线性判定方式。
在得到降维后的数据集合D’后,可以采用基尼指数计算方法计算当前节点的划分阈值,基尼指数是由基尼值计算得到的,用来度量数据集合的纯度,直观来说,基尼值反映了从数据集合中随机抽取两个样本,其类别不一致的概率,因此基尼值越小,则数据集合的纯度就越高。
重复执行第2.1步至第2.3步,直至叶节点,即可得到多变量决策树模型。
可选的,上述第2.2步具体可以通过如下步骤实现:
对数据集合D中的所有样本进行去均值化操作,得到数据集合X;计算数据集合X的协方差矩阵;对协方差矩阵进行特征值分解,得到从大至小的前n’个特征值对应的特征向量,并对各特征向量进行标准化处理;将标准化处理后的各特征向量组成特征向量矩阵W;根据特征向量矩阵W及数据集合D中的样本x(i),将样本x(i)降维转换为样本z(i),其中,z(i)=WTx(i);基于样本z(i),组成数据集合D’,其中,数据集合D’=(z(1),z(2),…,z(m))。
在得到数据集合D之后,首先对数据集合D中的所有样本进行去均值化操作,具体的去均值化操作可以采用公式(1)。
其中,x(i)为数据集合D中的第i个样本,为多个样本值组成的n维列向量,m为数据集合中样本的总个数。
在对样本进行去均值化操作后,可以得到数据集合X,计算数据集合X的协方差矩阵XXT,然后对协方差矩阵XXT进行特征值分解,取出从大至小的前n’个特征值对应的特征向量,将所有的特征向量进行标准化,使得所有的特征向量统一,组成特征向量矩阵W=(ω12,…,ωn'),对数据集合D中的每一个样本x(i),转化为新的样本z(i)=WTx(i),得到数据集合D’=(z(1),z(2),…,z(m)),D’即为对D进行降维操作后得到的数据集合。
可选的,上述第2.3步中,基于划分阈值,确定当前节点对应的多个交通评价指标的线性判定方式,可以为:确定当前节点对应的多个交通评价指标的线性判定方式为:特征向量矩阵W与各交通评价指标组成的列向量的乘积小于划分阈值。
特征向量矩阵W为(ω12,…,ωn'),假设划分阈值为S,各交通评价指标组成的列向量为(x1,x2,…xn’)T,则线性判定方式为ω1x12x2+…+ωn'xn'<S,相应的,多变量决策树模型的节点如图2所示。
可选的,上述第2.3步中,基于数据集合D’、不同的指定步长和设定步数,采用基尼指数计算方法,计算得到当前节点的划分阈值的步骤中,针对不同的指定步长,分别执行如下步骤:
第一步,按照指定步长和设定步数,从数据集合D’中提取样本值,得到多个子数据集合。
指定步长和设定步数决定了从数据集合D’中提取样本值的方式,即每间隔多少个样本值进行一次提取以及最多提取多少个样本值,例如指定步长为2,设定步数为20,则限定了每间隔2个样本值进行一次样本值的提取,并且最多提取20个样本值。相应的,提取出的样本值可以组成多个子数据集合,子数据集合的个数等于设定步长加1。
第二步,针对各子数据集合,统计该子数据集合中不同交通评价指标类别的样本值的数目占该子数据集合样本值总数目的比例,并根据该比例计算该子数据集合的基尼值。
针对每一个子数据集合,可以统计该子数据集合中不同交通评价指标类别的样本值的数目占该子数据集合样本值总数目的比例pk,利用公式(2)即可计算得到子数据集合的基尼值。
其中,pk为子数据集合E中第k类交通评价指标的样本值的数目占子数据集合E样本值总数目的比例,pk’为子数据集合E中第k’类交通评价指标的样本值的数目占子数据集合E样本值总数目的比例,|y|为交通评价指标的总类数。
第三步,根据各子数据集合的基尼值,计算以参考数据值为划分阈值的所述数据集合D’的基尼指数,其中,参考数据值为根据设定初始值、指定步长和设定步数计算得到。
设定初始值S0,根据初始值S0、指定步长s和设定步长n,可以计算得到参考数据值S=S0+n*s,以S划分的数据集合D’的基尼指数可以利用公式(3)计算得到。
其中,Ev为第v个子数据集合,V=n+1。此时的Gini_index(D',S)表示经过以S为划分阈值,分割后的数据集合D’的不确定性。
第四步,确定分别以各参考数据值为划分阈值的数据集合D’的基尼指数中的最小值对应的参考数据值为当前节点的划分阈值。
将利用不同步长计算出来的参考数据值作为划分阈值时计算得到的基尼指数进行比较,选择分别以各参考数据值为划分阈值的数据集合D’的基尼指数中的最小值对应的参考数据值为当前节点的划分阈值。
通过上述步骤得到的多变量决策树模型为粗糙的多变量决策树模型,准确度可能并不是很理想,在得到粗糙的多变量决策树模型之后,还可以继续对该模型进行剪枝处理,得到准确度更高的多变量决策树模型。
可选的,在得到粗糙的多变量决策树模型之后,本发明实施例所提供的道路交通诊断方法,还可以执行如下步骤:
获取验证集。按照从多变量决策树模型的叶节点至根节点的顺序,依次针对各节点执行:利用验证集,对多变量决策树模型进行验证,得到验证结果;当验证结果不满足预设准确度条件时,对多变量决策树模型进行剪枝,得到更新后的多变量决策树模型。
验证集是包括了多个交通评价指标值以及不同的交通评指标值的线性组合导致的诊断结果。利用验证集可以对多变量决策树模型进行验证,将验证集中的交通指标值输入多变量决策树模型,即可得到诊断结果,将该诊断结果与验证集中对应的诊断结果进行比较,判断是否相同,输入多组交通指标值,对应的可以得到多个比较结果,可以得到整体的验证结果,将验证结果作为多变量决策树模型是否需要剪枝的判定条件,如果验证结果满足预设准确度条件,则不需要进行剪枝,如果验证结果不满足预设准确度条件,则需要进行剪枝。
可选的,利用验证集,对所述多变量决策树模型进行验证,得到验证结果的步骤,具体可以为:
利用验证集,测试多变量决策树模型的准确度,得到多变量决策树模型的第一准确度;利用一个叶节点,替换与一个叶节点相连的上一层节点,并利用验证集,测试节点替换后的多变量决策树模型的准确度,得到节点替换后的多变量决策树模型的第二准确度;在计算得到各叶节点替换所述上一层节点之后的各第二准确度之后,提取各第二准确度中的最大值;根据最大值及第一准确度,计算最大值和第一准确度的差值占第一准确度的比例,作为验证结果。
利用验证集,首先测试粗糙的多变量决策树模型的准确度,得到多变量决策树模型的第一准确度a%。从叶节点开始考虑,选择离叶节点最近的上一层节点f1,对该节点f1下的叶节点e1,e2,…,en,依次将其替换节点f1,如将f1替换为叶节点e1,再次用验证集对节点替换后的多变量决策树模型进行测试,得到第二准确度b1%,将f1替换为叶节点e2,再次用验证集对节点替换后的多变量决策树模型进行测试,得到第二准确度b2%,继续遍历节点f1下的叶节点直至en,得到第二准确度bn%,取b=max{b1,b2,…bn},计算(b-a)/a作为验证结果。
相应的,预设准确度条件可以为比例小于或等于预设比例阈值。
则当验证结果不满足预设准确度条件时,对多变量决策树模型进行剪枝,得到更新后的多变量决策树模型的步骤,具体可以为:
当比例大于预设比例阈值时,将上一层节点替换为最大值对应的叶节点,并丢弃与上一层节点相连的叶节点,得到更新后的多变量决策树模型。
针对各第二准确度中的最大值和第一准确度的差值占第一准确度的比例,预先设定有比例阈值,比例与比例阈值的关系可以作为预设准确度条件,例如设定预设准确度条件为比例小于或等于预设比例阈值,比如将预设比例阈值设置为10%,如果计算出来(b-a)/a大于10%,则说明比例大于预设比例阈值,不满足预设准确度条件,则需要进行剪枝,将节点f1替换为b所对应的最大准确度的叶节点,并删除节点f1的所有叶节点。
应用本发明实施例,获取待诊断道路的多个当前交通评价指标值,将多个当前交通评价指标值输入预先训练的交通诊断模型,得到待诊断道路的交通诊断结果。由于交通诊断模型是基于多个交通评价指标的样本值训练得到的、以多个交通评价指标为变量的多变量概率模型,交通诊断模型是一种端到端的概率模型,是基于样本数据训练得到的多变量概率模型,能够计算出多个交通评价指标在不同取值下所得到的交通诊断结果,因此,直接将获取到的待诊断道路的多个当前交通评价指标值输入该多变量概率模型,可以直接得到待诊断道路的交通诊断结果,明显减少了人工设置阈值的操作,从而保证了道路交通诊断结果的准确性。利用端到端的交通诊断模型,能够实现道路的自动诊断。
为了便于理解,下面从交通诊断模型的训练到道路交通诊断的整个流程进行详细说明,如图3所示,道路交通诊断主要包括如下步骤:
第一步,组织样本集合。
样本集合主要包括两部分,一部分是交通评价指标的样本值,交通评价指标包括{绿灯利用率、车均延误、排队长度、最大车道排队长度},另一部分是诊断结果,包括{失衡、溢流、空放、正常}。
第二步,多变量决策树模型训练。
多变量决策树模型训练的过程主要包括两部分:多变量决策树模型中节点的确定和划分阈值的选取。具体的多变量决策树模型训练的过程如图4所示。
S401,从样本集合中选取多个样本值,组成数据集合D。
S402,对数据集合D中的所有样本进行去均值化操作,得到数据集合X。
S403,计算协方差矩阵XXT
S404,对协方差矩阵XXT进行特征值分解,取出从大至小的前n’个特征值对应的特征向量,并对各特征向量进行标准化处理。
S405,将标准化处理后的各特征向量组成特征向量矩阵W。
S406,得到降维后的新的样本z(i)=WTx(i),组成数据集合D’=(z(1),z(2),…,z(m))。
S407,以参考数据值为划分阈值,计算数据集合D’的基尼指数。
S408,确定分别以各参考数据值为划分阈值的数据集合D’的基尼指数中的最小值对应的参考数据值为当前节点的划分阈值S。
S409,基于划分阈值S,确定当前节点对应的多个交通评价指标的线性判定方式为ω1x12x2+…+ωn'xn'<S。
模型训练过程中各步骤的具体计算过程参见图1所示实施例,这里不再赘述。
对于一个节点,提取过的样本值在下一个节点提取时不再使用,下一个节点会从样本集合中提取剩下的样本值,重复执行图4所示的步骤直至划分至叶节点,得到粗糙的多变量决策树模型。
第三步,剪枝。
使用验证集对上述粗糙的多变量决策树模型进行验证,并根据其验证结果进行剪枝,具体实施细节如下:
利用验证集,测试粗糙的多变量决策树模型的准确度,得到多变量决策树模型的第一准确度a%。
从叶节点开始考虑,选择离叶节点最近的上一层节点f1,对该节点f1下的叶节点e1,e2,…,en,依次将其替换节点f1,如将f1替换为叶节点e1,再次用验证集对节点替换后的多变量决策树模型进行测试,得到第二准确度b1%,将f1替换为叶节点e2,再次用验证集对节点替换后的多变量决策树模型进行测试,得到第二准确度b2%,继续遍历节点f1下的叶节点直至en,得到第二准确度bn%,取b=max{b1,b2,…bn},当(b-a)/a<10%(设定比例阈值为10%)时,则对节点f1进行剪枝,将节点f1替换为b所对应的最大准确度的叶节点,并删除节点f1的所有叶节点。
第四步,完成一次剪枝操作后,判断准确度是否符合要求。如果是则执行第五步,否则执行第六步。
第五步,得到最优的多变量决策树模型。
第六步,调整参数。并返回执行多变量决策树模型训练和剪枝的操作。
第七步,获取待诊断道路的多个当前交通评价指标值。
第八步,将多个当前交通评价指标值输入最优的多变量决策树模型,得到交通诊断结果。
相应于上述方法实施例,本发明实施例提供了一种道路交通诊断装置,如图5所示,该道路交通诊断装置可以包括:
获取模块510,用于获取待诊断道路的多个当前交通评价指标值;
诊断模块520,用于将所述多个当前交通评价指标值输入预先训练的交通诊断模型,得到所述待诊断道路的交通诊断结果,所述交通诊断模型是基于多个交通评价指标的样本值训练得到的、以所述多个交通评价指标为变量的多变量概率模型。
可选的,所述交通诊断模型可以为多变量决策树模型;
所述装置还可以包括训练模块,所述训练模块用于:
获取样本集合,所述样本集合包括多个交通评价指标的多个样本值;
按照从多变量决策树的根节点至叶节点的顺序,依次针对各节点执行如下步骤,得到所述多变量决策树模型:
从所述样本集合中选取多个样本值,组成数据集合D,其中,所述数据集合D=(x(1),x(2),…,x(m)),所述数据集合D中的样本x(i)为多个样本值组成的n维列向量,i∈(1,m);
采用预设的降维方法,对所述数据集合D进行降维,得到降维后的数据集合D’,其中,所述数据集合D’=(z(1),z(2),…,z(m)),所述数据集合D’中的样本z(i)为n’维列向量,所述样本z(i)为对所述样本x(i)降维转换得到,所述n’小于所述n;
基于所述数据集合D’、不同的指定步长和设定步数,采用基尼指数计算方法,计算得到当前节点的划分阈值,并基于所述划分阈值,确定所述当前节点对应的多个交通评价指标的线性判定方式。
可选的,所述训练模块在用于所述采用预设的降维方法,对所述数据集合D进行降维,得到降维后的数据集合D’时,具体可以用于:
对所述数据集合D中的所有样本进行去均值化操作,得到数据集合X;
计算所述数据集合X的协方差矩阵;
对所述协方差矩阵进行特征值分解,得到从大至小的前n’个特征值对应的特征向量,并对各特征向量进行标准化处理;
将标准化处理后的各特征向量组成特征向量矩阵W;
根据所述特征向量矩阵W及所述数据集合D中的样本x(i),将所述样本x(i)降维转换为样本z(i),其中,z(i)=WTx(i)
基于所述样本z(i),组成数据集合D’,其中,所述数据集合D’=(z(1),z(2),…,z(m))。
可选的,所述训练模块在用于所述基于所述划分阈值,确定所述当前节点对应的多个交通评价指标的线性判定方式时,具体可以用于:
确定所述当前节点对应的多个交通评价指标的线性判定方式为:所述特征向量矩阵W与各交通评价指标组成的列向量的乘积小于所述划分阈值。
可选的,所述训练模块在用于所述基于所述数据集合D’、不同的指定步长和设定步数,采用基尼指数计算方法,计算得到当前节点的划分阈值时,具体可以用于:
针对不同的指定步长,分别执行:
按照指定步长和设定步数,从所述数据集合D’中提取样本值,得到多个子数据集合;
针对各子数据集合,统计该子数据集合中不同交通评价指标类别的样本值的数目占该子数据集合样本值总数目的比例,并根据所述比例计算该子数据集合的基尼值;
根据所述各子数据集合的基尼值,计算以参考数据值为划分阈值的所述数据集合D’的基尼指数,所述参考数据值为根据设定初始值、所述指定步长和所述设定步数计算得到;
确定分别以各参考数据值为划分阈值的所述数据集合D’的基尼指数中的最小值对应的参考数据值为当前节点的划分阈值。
可选的,所述训练模块,还可以用于:
获取验证集;
按照从所述多变量决策树模型的叶节点至根节点的顺序,依次针对各节点执行如下步骤:
利用所述验证集,对所述多变量决策树模型进行验证,得到验证结果;
当所述验证结果不满足预设准确度条件时,对所述多变量决策树模型进行剪枝,得到更新后的所述多变量决策树模型。
可选的,所述训练模块在用于所述利用所述验证集,对所述多变量决策树模型进行验证,得到验证结果时,具体可以用于:
利用所述验证集,测试所述多变量决策树模型的准确度,得到所述多变量决策树模型的第一准确度;
利用一个叶节点,替换与所述一个叶节点相连的上一层节点,并利用所述验证集,测试节点替换后的多变量决策树模型的准确度,得到所述节点替换后的多变量决策树模型的第二准确度;
在计算得到各叶节点替换所述上一层节点之后的各第二准确度之后,提取所述各第二准确度中的最大值;
根据所述最大值及所述第一准确度,计算所述最大值和所述第一准确度的差值占所述第一准确度的比例,作为验证结果。
可选的,所述预设准确度条件可以为所述比例小于或等于预设比例阈值;
所述训练模块在用于所述当所述验证结果不满足预设准确度条件时,对所述多变量决策树模型进行剪枝,得到更新后的所述多变量决策树模型时,具体可以用于:
当所述比例大于所述预设比例阈值时,将所述上一层节点替换为所述最大值对应的叶节点,并丢弃与所述上一层节点相连的叶节点,得到更新后的所述多变量决策树模型。
应用本发明实施例,获取待诊断道路的多个当前交通评价指标值,将多个当前交通评价指标值输入预先训练的交通诊断模型,得到待诊断道路的交通诊断结果。由于交通诊断模型是基于多个交通评价指标的样本值训练得到的、以多个交通评价指标为变量的多变量概率模型,交通诊断模型是一种端到端的概率模型,是基于样本数据训练得到的多变量概率模型,能够计算出多个交通评价指标在不同取值下所得到的交通诊断结果,因此,直接将获取到的待诊断道路的多个当前交通评价指标值输入该多变量概率模型,可以直接得到待诊断道路的交通诊断结果,明显减少了人工设置阈值的操作,从而保证了道路交通诊断结果的准确性。
本发明实施例还提供了一种电子设备,如图6所示,包括处理器601和存储器602,其中,所述存储器602存储有能够被所述处理器601执行的机器可执行指令,所述机器可执行指令由所述处理器601加载并执行,以实现本发明实施例所提供的道路交通诊断方法。
上述存储器可以包括RAM(Random Access Memory,随机存取存储器),也可以包括NVM(Non-volatile Memory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括CPU(Central Processing Unit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(Digital Signal Processor,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
存储器602与处理器601之间可以通过有线连接或者无线连接的方式进行数据传输,并且芯片与其他设备之间可以通过有线通信接口或者无线通信接口进行通信。图6所示的仅为通过总线进行数据传输的示例,不作为具体连接方式的限定。
本发明实施例中,处理器通过读取存储器中存储的机器可执行指令,并通过加载和执行机器可执行指令,能够实现:电子设备获取待诊断道路的多个当前交通评价指标值,将多个当前交通评价指标值输入预先训练的交通诊断模型,得到待诊断道路的交通诊断结果。由于交通诊断模型是基于多个交通评价指标的样本值训练得到的、以多个交通评价指标为变量的多变量概率模型,交通诊断模型是一种端到端的概率模型,是基于样本数据训练得到的多变量概率模型,能够计算出多个交通评价指标在不同取值下所得到的交通诊断结果,因此,直接将获取到的待诊断道路的多个当前交通评价指标值输入该多变量概率模型,可以直接得到待诊断道路的交通诊断结果,明显减少了人工设置阈值的操作,从而保证了道路交通诊断结果的准确性。
另外,本发明实施例还提供了一种机器可读存储介质,所述机器可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例所提供的道路交通诊断方法。
本发明实施例中,机器可读存储介质存储有在运行时执行本发明实施例所提供的道路交通诊断方法的机器可执行指令,因此能够实现:电子设备获取待诊断道路的多个当前交通评价指标值,将多个当前交通评价指标值输入预先训练的交通诊断模型,得到待诊断道路的交通诊断结果。由于交通诊断模型是基于多个交通评价指标的样本值训练得到的、以多个交通评价指标为变量的多变量概率模型,交通诊断模型是一种端到端的概率模型,是基于样本数据训练得到的多变量概率模型,能够计算出多个交通评价指标在不同取值下所得到的交通诊断结果,因此,直接将获取到的待诊断道路的多个当前交通评价指标值输入该多变量概率模型,可以直接得到待诊断道路的交通诊断结果,明显减少了人工设置阈值的操作,从而保证了道路交通诊断结果的准确性。
对于电子设备以及机器可读存储介质实施例而言,由于其涉及的方法内容基本相似于前述的方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备以及机器可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (11)

1.一种道路交通诊断方法,其特征在于,所述方法包括:
获取待诊断道路的多个当前交通评价指标值;
将所述多个当前交通评价指标值输入预先训练的交通诊断模型,得到所述待诊断道路的交通诊断结果,所述交通诊断模型是基于多个交通评价指标的样本值训练得到的、以所述多个交通评价指标为变量的多变量概率模型;
其中,所述交通诊断模型为多变量决策树模型,所述多变量决策树模型的验证方式,包括:
获取验证集;
按照从所述多变量决策树模型的叶节点至根节点的顺序,依次针对各节点执行如下步骤:
利用所述验证集,测试所述多变量决策树模型的准确度,得到所述多变量决策树模型的第一准确度;利用一个叶节点,替换与所述一个叶节点相连的上一层节点,并利用所述验证集,测试节点替换后的多变量决策树模型的准确度,得到所述节点替换后的多变量决策树模型的第二准确度;在计算得到各叶节点替换所述上一层节点之后的各第二准确度之后,提取所述各第二准确度中的最大值;根据所述最大值及所述第一准确度,计算所述最大值和所述第一准确度的差值占所述第一准确度的比例,作为验证结果;当所述验证结果不满足预设准确度条件时,对所述多变量决策树模型进行剪枝,得到更新后的所述多变量决策树模型。
2.根据权利要求1所述的方法,其特征在于,在所述将所述多个当前交通评价指标值输入预先训练的交通诊断模型,得到所述待诊断道路的交通诊断结果之前,所述方法还包括:
获取样本集合,所述样本集合包括多个交通评价指标的多个样本值;
按照从多变量决策树的根节点至叶节点的顺序,依次针对各节点执行如下步骤,得到所述多变量决策树模型:
从所述样本集合中选取多个样本值,组成数据集合D,其中,所述数据集合D=(x(1),x(2),…,x(m)),所述数据集合D中的样本x(i)为多个样本值组成的n维列向量,i∈(1,m);
采用预设的降维方法,对所述数据集合D进行降维,得到降维后的数据集合D’,其中,所述数据集合D’=(z(1),z(2),…,z(m)),所述数据集合D’中的样本z(i)为n’维列向量,所述样本z(i)为对所述样本x(i)降维转换得到,所述n’小于所述n;
基于所述数据集合D’、不同的指定步长和设定步数,采用基尼指数计算方法,计算得到当前节点的划分阈值,并基于所述划分阈值,确定所述当前节点对应的多个交通评价指标的线性判定方式。
3.根据权利要求2所述的方法,其特征在于,所述采用预设的降维方法,对所述数据集合D进行降维,得到降维后的数据集合D’,包括:
对所述数据集合D中的所有样本进行去均值化操作,得到数据集合X;
计算所述数据集合X的协方差矩阵;
对所述协方差矩阵进行特征值分解,得到从大至小的前n’个特征值对应的特征向量,并对各特征向量进行标准化处理;
将标准化处理后的各特征向量组成特征向量矩阵W;
根据所述特征向量矩阵W及所述数据集合D中的样本x(i),将所述样本x(i)降维转换为样本z(i),其中,z(i)=WTx(i)
基于所述样本z(i),组成数据集合D’,其中,所述数据集合D’=(z(1),z(2),…,z(m))。
4.根据权利要求3所述的方法,其特征在于,所述基于所述划分阈值,确定所述当前节点对应的多个交通评价指标的线性判定方式,包括:
确定所述当前节点对应的多个交通评价指标的线性判定方式为:所述特征向量矩阵W与各交通评价指标组成的列向量的乘积小于所述划分阈值。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述基于所述数据集合D’、不同的指定步长和设定步数,采用基尼指数计算方法,计算得到当前节点的划分阈值,包括:
针对不同的指定步长,分别执行如下步骤:
按照指定步长和设定步数,从所述数据集合D’中提取样本值,得到多个子数据集合;
针对各子数据集合,统计该子数据集合中不同交通评价指标类别的样本值的数目占该子数据集合样本值总数目的比例,并根据所述比例计算该子数据集合的基尼值;
根据所述各子数据集合的基尼值,计算以参考数据值为划分阈值的所述数据集合D’的基尼指数,所述参考数据值为根据设定初始值、所述指定步长和所述设定步数计算得到;
确定分别以各参考数据值为划分阈值的所述数据集合D’的基尼指数中的最小值对应的参考数据值为当前节点的划分阈值。
6.根据权利要求1所述的方法,其特征在于,所述预设准确度条件为所述比例小于或等于预设比例阈值;
所述当所述验证结果不满足预设准确度条件时,对所述多变量决策树模型进行剪枝,得到更新后的所述多变量决策树模型,包括:
当所述比例大于所述预设比例阈值时,将所述上一层节点替换为所述最大值对应的叶节点,并丢弃与所述上一层节点相连的叶节点,得到更新后的所述多变量决策树模型。
7.一种道路交通诊断装置,其特征在于,所述装置包括:
获取模块,用于获取待诊断道路的多个当前交通评价指标值;
诊断模块,用于将所述多个当前交通评价指标值输入预先训练的交通诊断模型,得到所述待诊断道路的交通诊断结果,所述交通诊断模型是基于多个交通评价指标的样本值训练得到的、以所述多个交通评价指标为变量的多变量概率模型;
其中,所述交通诊断模型为多变量决策树模型,所述多变量决策树模型的验证方式,包括:
获取验证集;
按照从所述多变量决策树模型的叶节点至根节点的顺序,依次针对各节点执行如下步骤:
利用所述验证集,测试所述多变量决策树模型的准确度,得到所述多变量决策树模型的第一准确度;利用一个叶节点,替换与所述一个叶节点相连的上一层节点,并利用所述验证集,测试节点替换后的多变量决策树模型的准确度,得到所述节点替换后的多变量决策树模型的第二准确度;在计算得到各叶节点替换所述上一层节点之后的各第二准确度之后,提取所述各第二准确度中的最大值;根据所述最大值及所述第一准确度,计算所述最大值和所述第一准确度的差值占所述第一准确度的比例,作为验证结果;当所述验证结果不满足预设准确度条件时,对所述多变量决策树模型进行剪枝,得到更新后的所述多变量决策树模型。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括训练模块,所述训练模块用于:
获取样本集合,所述样本集合包括多个交通评价指标的多个样本值;
按照从多变量决策树的根节点至叶节点的顺序,依次针对各节点执行如下步骤,得到所述多变量决策树模型:
从所述样本集合中选取多个样本值,组成数据集合D,其中,所述数据集合D=(x(1),x(2),…,x(m)),所述数据集合D中的样本x(i)为多个样本值组成的n维列向量,i∈(1,m);
采用预设的降维方法,对所述数据集合D进行降维,得到降维后的数据集合D’,其中,所述数据集合D’=(z(1),z(2),…,z(m)),所述数据集合D’中的样本z(i)为n’维列向量,所述样本z(i)为对所述样本x(i)降维转换得到,所述n’小于所述n;
基于所述数据集合D’、不同的指定步长和设定步数,采用基尼指数计算方法,计算得到当前节点的划分阈值,并基于所述划分阈值,确定所述当前节点对应的多个交通评价指标的线性判定方式。
9.根据权利要求8所述的装置,其特征在于,所述训练模块在用于所述采用预设的降维方法,对所述数据集合D进行降维,得到降维后的数据集合D’时,具体用于:
对所述数据集合D中的所有样本进行去均值化操作,得到数据集合X;
计算所述数据集合X的协方差矩阵;
对所述协方差矩阵进行特征值分解,得到从大至小的前n’个特征值对应的特征向量,并对各特征向量进行标准化处理;
将标准化处理后的各特征向量组成特征向量矩阵W;
根据所述特征向量矩阵W及所述数据集合D中的样本x(i),将所述样本x(i)降维转换为样本z(i),其中,z(i)=WTx(i)
基于所述样本z(i),组成数据集合D’,其中,所述数据集合D’=(z(1),z(2),…,z(m))。
10.一种电子设备,其特征在于,包括处理器和存储器,其中,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述机器可执行指令由所述处理器加载并执行,以实现权利要求1-6任一项所述的方法。
11.一种机器可读存储介质,其特征在于,所述机器可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的方法。
CN201910618668.5A 2019-07-10 2019-07-10 道路交通诊断方法、装置、电子设备及机器可读存储介质 Active CN112215246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910618668.5A CN112215246B (zh) 2019-07-10 2019-07-10 道路交通诊断方法、装置、电子设备及机器可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910618668.5A CN112215246B (zh) 2019-07-10 2019-07-10 道路交通诊断方法、装置、电子设备及机器可读存储介质

Publications (2)

Publication Number Publication Date
CN112215246A CN112215246A (zh) 2021-01-12
CN112215246B true CN112215246B (zh) 2023-10-13

Family

ID=74047101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910618668.5A Active CN112215246B (zh) 2019-07-10 2019-07-10 道路交通诊断方法、装置、电子设备及机器可读存储介质

Country Status (1)

Country Link
CN (1) CN112215246B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113887336A (zh) * 2021-09-13 2022-01-04 广东晟腾地信科技有限公司 路口行人过街安全性评价方法及设备、计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714348A (zh) * 2014-01-09 2014-04-09 北京泰乐德信息技术有限公司 一种基于决策树的轨道交通故障诊断方法和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260628B (zh) * 2014-06-03 2019-01-11 腾讯科技(深圳)有限公司 分类器训练方法和装置、身份验证方法和系统
US20190019108A1 (en) * 2017-07-13 2019-01-17 General Electric Company Systems and methods for a validation tree

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714348A (zh) * 2014-01-09 2014-04-09 北京泰乐德信息技术有限公司 一种基于决策树的轨道交通故障诊断方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于决策树理论的交通流参数短时预测;薛红军 等;交通信息与安全;第34卷(第3期);65-70 *
道路交通安全态势感知的诊断模型;杨莹;诸云;王力祥;;中国安全科学学报(第07期);全文 *

Also Published As

Publication number Publication date
CN112215246A (zh) 2021-01-12

Similar Documents

Publication Publication Date Title
CN117471227B (zh) 汽车线束参数性能测试方法及测试系统
CN110444011B (zh) 交通流高峰识别方法、装置、电子设备及存储介质
CN114881343B (zh) 基于特征选择的电力系统短期负荷预测方法及装置
CN105894329A (zh) 一种数据分析方法和装置
CN110599040A (zh) 维修训练的评估方法、系统及终端设备
CN113988441A (zh) 电力无线网络链路质量预测、模型训练方法及装置
CN114325454A (zh) 一种多特征对电池健康度影响的确定方法、装置、设备及介质
CN112215246B (zh) 道路交通诊断方法、装置、电子设备及机器可读存储介质
CN112580780A (zh) 模型训练的处理方法、装置、设备和存储介质
CN108470194A (zh) 一种特征筛选方法及装置
CN116564409A (zh) 基于机器学习的转移性乳腺癌转录组测序数据识别方法
CN114333317B (zh) 一种交通事件的处理方法、装置、电子设备及存储介质
CN102709207B (zh) 质量评估设备、方法和使计算机执行质量评估方法的程序
CN113918433A (zh) 一种自适应的智慧网络设备性能指标异常检测装置及方法
CN113112067A (zh) 一种tfri权重计算模型的建立方法
CN116188834B (zh) 基于自适应训练模型的全切片图像分类方法及装置
CN109743200B (zh) 基于资源特征的云计算平台计算任务成本预测方法及系统
CN116776134A (zh) 一种基于PCA-SFFS-BiGRU的光伏出力预测方法
CN116738261A (zh) 基于聚类分箱的数值型特征离散化归因分析方法及装置
CN115963404A (zh) 一种电池荷电状态预测方法、设备和存储介质
CN103942403A (zh) 一种对海量变量进行筛选的方法及设备
CN113779391A (zh) 基于建模的智能锁开锁推荐方法、系统、装置及存储介质
CN111026661B (zh) 一种软件易用性全面测试方法及系统
CN115169705A (zh) 配送时长预测方法、装置、存储介质及计算机设备
CN115083173A (zh) 一种基于电警数据的单点定时信号控制时段划分方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant