CN110222822B - 黑盒预测模型内部特征因果图的构建方法 - Google Patents
黑盒预测模型内部特征因果图的构建方法 Download PDFInfo
- Publication number
- CN110222822B CN110222822B CN201910466860.7A CN201910466860A CN110222822B CN 110222822 B CN110222822 B CN 110222822B CN 201910466860 A CN201910466860 A CN 201910466860A CN 110222822 B CN110222822 B CN 110222822B
- Authority
- CN
- China
- Prior art keywords
- layer
- feature
- convolution
- features
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及黑盒预测模型内部特征因果图的构建方法,通过汽车前部的摄像头捕获道路前方的场景图像,将其送入黑盒模型,在将所提取到的场景特征映射为方向盘指令的同时,将特征可视化并以解释图的形式展示特征间的相关关系,最后再通过特征实数化和特征筛选转化为特征因果图,找出产生此指令的原因。该技术将深度学习模型提取到的车前部摄像头所捕获图像的特征映射为车的方向盘控制指令,并给出下达该指令的原因。每一条指令的原因的给出有助于研究者快速发现不符合真实环境的指令或不利于全局优化的指令,通过进一步调整,可以使自动驾驶模型的性能得到大大的提高,为其安全保障提供了解释的依据。
Description
技术领域
本发明涉及黑盒预测模型的可解释性研究领域,着重关注于深度学习模型的内部特征因果图的构建方法。
背景技术
深度学习是机器学习的一个重要分支,它在目标检测、图像分类等问题上都已经取得了较为显著的效果。深度神经网络完成某一特定任务都是通过设定网络层数、每一层对应的神经元个数和激活函数类型等来确定网络结构,再利用大量标签数据进行误差反向传播优化参数,这是一个“端到端”的模型,又叫作黑盒预测模型。然而,在诸如自动驾驶、金融决策、医疗健康等高风险领域,仅仅在预测的准确度方面展现出模型的良好性能是远远不够的,为了提高用户对产品的信任度、加大产品应用范围,了解模型所作出预测的依据是关键步骤之一。因此,有关黑盒预测模型的可解释性的研究在近几年备受关注。
通俗地说,解释预测模型实质是指找出造成模型生成此预测结果的原因。关于深度学习模型可解释性的研究较为经典的方法有:通过类激活映射方法找出特征单元,并以热力图的形式在生成结果中加以展示;在卷积神经网络中,利用反卷积技术生成卷积层所提取到的特征图。除此之外,与本发明联系最紧密的是特征解释图的生成。该技术是将图像数据送入卷积神经网络,在产生预测结果的同时生成一个特征解释图。该解释图的节点来自卷积层所提取到的特征对象,结合卷积层的空间位置确定节点在图中的层数以及边的连接方式。但是,这些可解释性方法很大程度上只能说明特征与预测结果间的相关关系,不足以找出导致预测结果产生的真正原因。
根据以上问题,结合统计学中因果关系发现原理,构建黑盒预测模型的特征因果图是提高可解释性的有效方法之一。特征因果图将呈现相邻层间部分对象特征的因果关系,最后一层的特征节点则是最终对预测结果产生影响的直接原因。该技术可以应用于自动驾驶领域,将深度学习模型提取到的车前部摄像头所捕获图像的特征映射为车的方向盘控制指令,并给出下达该指令的原因。每一条指令的原因的给出有助于研究者快速发现不符合真实环境的指令或不利于全局优化的指令,通过进一步调整,可以使自动驾驶模型的性能得到大大的提高,为其安全保障提供了解释的依据。
发明内容
针对现有技术在黑盒预测模型可解释性方面研究的不足,本发明提出一种用于解释深度学习模型内部特征的方法,并应用于自动驾驶领域。具体而言,通过汽车前部的摄像头捕获道路前方的场景图像,将其送入黑盒模型,在将所提取到的场景特征映射为方向盘指令的同时,将特征可视化并以解释图的形式展示特征间的相关关系,最后再通过特征实数化和特征筛选转化为特征因果图,找出产生此指令的原因。
为实现上述目的,本发明采用如下的技术方案:
一种用于解释深度学习模型内部特征的技术包含以下步骤:
步骤1:搭建深度卷积神经网络(CNN)框架,在将场景图像映射为方向盘指令的过程中,生成场景特征图像;
步骤2:分解特征图中的混合对象,利用部分对象及特征空间位置构建车辆操作指令解释图;
步骤3:对车辆操作指令解释图中的单一对象特征节点进行因果筛选;
步骤4:根据因果关系节点及其所处位置构建车辆操作指令因果图。
具体而言,对于步骤1中的利用深度卷积神经网络实现车辆自动驾驶的具体原理如下:
整个CNN的构建主要包括三个模块:输入/输出模块、卷积模块和全连接模块,如图2所示。
输入模块:存放汽车摄像头所捕获的场景图像;
卷积模块:包含卷积层、池化层和RELU层。
卷积层:针对汽车摄像头所捕获的场景图像(长、宽、深度为256*256*3),将其与一个5*5*3的卷积模板进行点积运算,卷积模板的深度必须与输入图像的深度相同。生成特征图的个数取决于卷积模板的个数,二者保持相等。原理如下:
卷积操作原理如公式(1)所示:
其中,input指的是汽车摄像头所捕获的场景图像;filter是指网络中设定的卷积模板;feature map则是汽车摄像头所捕获的图像与卷积模板进行点积操作后生成的特征图像。
池化层:设定大小为2*2且每次滑动步长为2的过滤器,对卷积层生成的特征图像进行特征压缩,即在特征图的每一个子区域中寻找最大值,并且只保留最大值特征。
RELU层:将上一层的输出特征送入激活函数f(x)=max(0,x)中,x则表示池化层的输出特征,目的是在神经网络进行反向传播的时候消除梯度爆炸。
全连接模块:该层设定1024个神经元,将最后一个卷积模块生成的数据送入全连接层,进行加权操作。
输出模块:设定16个神经元,对应16个汽车方向盘的转动方向,与上一层的特征向量进行加权和softmax操作,生成16个概率,概率总和为1。其中,概率最大的神经元对应的汽车方向盘转动方向即为最终预测结果。
根据卷积层生成的特征图像,结合神经网络空间结构建立特征解释图,具体方式为:将一个特征图像视为一个顶点,同一卷积层生成的特征图像视作特征解释图的同一层顶点,顶点之间构建边,边的方向等同于神经网络的传播方向。
对于步骤2中分解特征图像中的混合对象,利用部分对象及神经网络空间结构建立特征解释图的具体说明如下:
在自动驾驶过程中,场景特征图是根据步骤1所产生的,但场景特征图通常包含的都是混合对象模式,即一张场景特征图中可能既包括指示灯又包括测速仪等部分对象。因此,先将最后一个卷积层的特征图中的混合对象模式分解开,形成多个单一的部分对象特征,再自顶向下地寻找前一个卷积层所生成的特征图中的部分对象。在这过程中,将每个部分对象特征视为一个顶点,同一卷积层的部分对象特征视作特征解释图的同一层顶点,顶点之间构建边,边的方向等同于神经网络的传播方向。
解释图的构建步骤如下:
Step1:从层次最深的卷积层开始分解混合特征图中的部分对象模式,建立图的顶层GL;
Step2:通过顶层的模式/结点进一步分解相邻低卷积层的部分对象模式,构建GL-1;
Step3:不断迭代,直至第一个卷积层的部分对象模式被分解,构建G1;
Step4:通过全连接相邻层的顶点构建特征解释图的边,方向为G1→GL。
关于步骤3中的对解释图中的部分对象特征节点进行因果筛选的详细说明如下:
步骤3-1:将部分对象特征图用矩阵M表示,矩阵M中的元素值mpq为部分对象特征图中对应位置的像素值。
其中,Mij表示第i层的第j个部分对象的特征矩阵;矩阵大小为P×Q,矩阵Mij中的某个元素记为 表示矩阵Mij中元素的平均值;rij表示矩阵Mij经过函数映射所得的实数值;k表示某一层部分特征对象的数量。
步骤3-3:利用非线性最小二乘法拟合相邻层部分对象特征间的函数f,构建形如公式(3)所示的等式:
步骤3-4:利用加性噪音模型判定相邻层节点间的因果方向是否与特征所处网络中的空间位置方向相矛盾,若矛盾,则删除原有边,若该节点与前一层的所有结点均无因果关系,则删除该节点。判定因果关系的算法如下:
算法:
附图说明
结合附图和实施例对本发明进一步说明。
图1表示黑盒预测模型特征因果图的构建流程图;
图2表示卷积神经网络结构图;
图3表示特征解释图的生成示意图;
图4表示因果特征筛选流程图;
图5是特征因果图的生成示意图。
具体实施方式
现在结合附图对本发明作进一步详细的说明,如图1所示,本实施例提供了一种基于自动驾驶的黑盒预测模型的特征因果图构建,包括以下四个步骤:
步骤1:构建卷积神经网络,实现车辆的自动无人驾驶。它将车辆前端摄像头所捕获的场景图像进行了识别,从而转化为方向盘转动的指令。AlexNet、GoogLeNet等卷积神经网络对图像识别都有着卓越的性能,因此,为了实现车辆的自动驾驶,构建包括输入/输出模块、卷积模块和全连接模块的卷积神经网络是第一步,网络结构如图2所示。其中,最核心的部分是卷积模块,卷积模块包含卷积层、池化层和RELU层,卷积原理如下:
其中,input指的是汽车摄像头所捕获的场景图像;filter是指网络中设定的卷积模板;feature map则是汽车摄像头所捕获的图像与卷积模板进行点积操作后生成的特征图。
步骤2:分解特征图中的混合对象,生成特征解释图。在场景图像经过卷积操作后,会有特征图生成,通常,该特征图中的特征对象均为混合模式,即一张场景特征图中可能有红绿灯、测速仪、斑马线、花草、水滩等多个部分对象。所以,为了便于解释图的构建,先将特征图中的混合对象分解为部分对象,对应于解释图中的节点,即每个节点表示单一对象的特征图,再结合特征所处于网络的位置,全连接相邻层顶点,方向与神经网络传播方向保持一致,如图3所示。
解释图的构建步骤如下:
Step1:从层次最深的卷积层开始分解混合特征图中的部分对象模式,建立图的顶层GL;
Step2:通过顶层的模式/结点进一步分解相邻低卷积层的部分对象模式,构建GL-1;
Step3:不断迭代,直至第一个卷积层的部分对象模式被分解,构建G1。
Step4:通过全连接相邻层的顶点构建特征解释图的边,方向为G1→GL。
本发明的主要亮点在于步骤3、4,以车辆操作指令解释图为基础,利用因果筛选技术构建了基于黑盒预测模型的车辆操作指令因果图。车辆操作指令因果图呈现了在某一时刻,车辆接受到的指令与产生该指令的原因。
步骤3:对解释图中的单一对象特征节点进行因果筛选,找出对产生该指令有重大影响的单一对象,比如:汽车接受“减速并在50米后停下”的指令的原因是在特征图中有“红灯”、“测速仪”,而此时“斑马线”、“花草”、“水滩”则可能只是相关因素,而并非原因因素。因果筛选的流程如图4所示。
3-1:单一对象特征图的本质仍然是图像,针对场景图像,最后一个卷积层上对应的部分对象特征在语义上可能表示为红绿灯、测速仪、斑马线、花草、水滩等。因此,为了便于后续利用统计知识进行因果特征筛选,首先得用矩阵M进行表示,矩阵M中的元素值为单一对象特征图中对应位置的像素值。
3-3:在前两步对部分特征对象预处理的基础上,利用非线性最小二乘法方法拟合相邻层部分对象特征间的函数f,构建如下形式的等式:
3-4:假定相邻层间的部分对象特征均具有因果关系,而网络层次的空间位置是确定的,则决定了相邻层间特征的因果方向。再利用加性噪音模型判定相邻层节点间的因果方向是否与特征所处网络中的空间位置方向相矛盾,若矛盾,则无因果关系,否则,有因果关系。算法如下所示:
算法1:
步骤4:生成基于车辆自动驾驶的特征因果图。根据步骤3中判定相邻层间部分特征对象的因果关系结果,将有因果关系的相邻层节点的连接边保留,无因果关系的相邻层节点的连接边删除。若该节点与前一层的所有节点均无因果关系,则删除该节点。特征因果图的生成示意图如图5所示。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样性的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须依据权利要求范围来确定其技术性范围。
Claims (1)
1.黑盒预测模型内部特征因果图的构建方法,其特征在于包含以下步骤:
步骤1:搭建深度卷积神经网络CNN框架,在将场景图像映射为方向盘指令的过程中,生成场景特征图像;
步骤2:分解场景特征图像中的混合对象,利用部分对象及特征空间位置构建车辆操作指令解释图;
步骤3:对车辆操作指令解释图中的部分对象特征节点进行因果筛选;
步骤4:根据因果关系节点及其所处位置构建车辆操作指令因果图;
对于步骤1中整个CNN的构建包括三个模块:输入/输出模块、卷积模块和全连接模块;
输入模块:存放汽车摄像头所捕获的场景图像;
卷积模块:包含卷积层、池化层和RELU层;
卷积层:针对汽车摄像头所捕获的场景图像,场景图像长、宽、深度为256*256*3,将其与一个5*5*3的卷积模板进行点积运算,卷积模板的深度必须与输入图像的深度相同;生成特征图的个数取决于卷积模板的个数,二者保持相等;
原理如下:
卷积操作原理如公式(1)所示:
其中,input指的是汽车摄像头所捕获的场景图像;filter是指网络中设定的卷积模板;feature map则是汽车摄像头所捕获的图像与卷积模板进行点积操作后生成的特征图像;
池化层:设定大小为2*2且每次滑动步长为2的过滤器,对卷积层生成的特征图像进行特征压缩,即在特征图的每一个子区域中寻找最大值,并且只保留最大值特征;
RELU层:将上一层的输出特征送入激活函数f(x)=max(0,x)中,x则表示池化层的输出特征,目的是在神经网络进行反向传播的时候消除梯度爆炸;
全连接模块:该模块设定1024个神经元,将最后一个卷积模块生成的数据送入全连接层,进行加权操作;
输出模块:设定16个神经元,对应16个汽车方向盘的转动方向,与上一层的特征向量进行加权和softmax操作,生成16个概率,概率总和为1;其中,概率最大的神经元对应的汽车方向盘转动方向即为最终预测结果;
根据卷积层生成的特征图像,结合神经网络空间结构建立特征解释图,具体方式为:将一个特征图像视为一个顶点,同一卷积层生成的特征图像视作特征解释图的同一层顶点,顶点之间构建边,边的方向等同于神经网络的传播方向;
对于步骤2中分解特征图像中的混合对象,利用部分对象及神经网络空间结构建立特征解释图的具体说明如下:
在自动驾驶过程中,场景特征图是根据步骤1所产生的,但场景特征图通常包含的都是混合对象模式,即一张场景特征图中既包括指示灯又包括部分对象;因此,先将最后一个卷积层的特征图中的混合对象模式分解开,形成多个单一的部分对象特征,再自顶向下地寻找前一个卷积层所生成的特征图中的部分对象;在这过程中,将每个部分对象特征视为一个顶点,同一卷积层的部分对象特征视作特征解释图的同一层顶点,顶点之间构建边,边的方向等同于神经网络的传播方向;
解释图的构建步骤如下:
Step1:从层次最深的卷积层开始分解混合特征图中的部分对象模式,建立图的顶层GL;
Step2:通过顶层的模式/节点进一步分解相邻低卷积层的部分对象模式,构建GL-1;
Step3:不断迭代,直至第一个卷积层的部分对象模式被分解,构建G1;
Step4:通过全连接相邻层的顶点构建特征解释图的边,方向为G1→GL;
关于步骤3中的对解释图中的部分对象特征节点进行因果筛选的详细说明如下:
步骤3-1:将部分对象特征图用矩阵M表示,矩阵M中的元素值mpq为部分对象特征图中对应位置的像素值;
其中,Mii表示第i层的第j个部分对象的特征矩阵;矩阵大小为P×Q,矩阵Mij中的某个元素记为 表示矩阵Mij中元素的平均值;rij表示矩阵Mij经过函数映射所得的实数值;k表示某一层部分特征对象的数量;
步骤3-3:利用非线性最小二乘法拟合相邻层部分对象特征间的函数f,构建形如公式(3)所示的等式:
步骤3-4:利用加性噪音模型判定相邻层节点间的因果方向是否与特征所处网络中的空间位置方向相矛盾,若矛盾,则删除原有边,若该节点与前一层的所有节点均无因果关系,则删除该节点;判定因果关系的算法如下:
算法:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910466860.7A CN110222822B (zh) | 2019-05-31 | 2019-05-31 | 黑盒预测模型内部特征因果图的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910466860.7A CN110222822B (zh) | 2019-05-31 | 2019-05-31 | 黑盒预测模型内部特征因果图的构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110222822A CN110222822A (zh) | 2019-09-10 |
CN110222822B true CN110222822B (zh) | 2021-04-09 |
Family
ID=67818940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910466860.7A Active CN110222822B (zh) | 2019-05-31 | 2019-05-31 | 黑盒预测模型内部特征因果图的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110222822B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11544422B2 (en) * | 2019-09-16 | 2023-01-03 | Palo Alto Research Center Incorporated | Machine learning based systems and methods for real time, model based diagnosis |
CN111507461B (zh) * | 2020-04-13 | 2022-05-17 | 支付宝(杭州)信息技术有限公司 | 可解释性信息确定方法及装置 |
CN112819253A (zh) * | 2021-03-02 | 2021-05-18 | 华东师范大学 | 一种无人机避障和路径规划装置及方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BRPI0823224A2 (pt) * | 2008-11-06 | 2015-06-16 | Volvo Technology Corp | Método e sistema para determinação de dados de estrada |
US8676432B2 (en) * | 2010-01-13 | 2014-03-18 | GM Global Technology Operations LLC | Fault prediction framework using temporal data mining |
CN103229148B (zh) * | 2010-09-28 | 2016-08-31 | 西门子公司 | 运输车辆的适应性远程维护 |
CN102880053B (zh) * | 2012-09-29 | 2016-02-24 | 西北工业大学 | 基于预测模型的高超声速飞行器滑模控制方法 |
CN106156860A (zh) * | 2016-06-20 | 2016-11-23 | 韩山师范学院 | 一种快速且适用于高维网络的因果骨架构建方法 |
US10061312B1 (en) * | 2017-03-30 | 2018-08-28 | Intel Corporation | Sensor management system for computer assisted vehicles |
US10860019B2 (en) * | 2017-09-08 | 2020-12-08 | Motional Ad Llc | Planning autonomous motion |
CN108639062B (zh) * | 2018-05-08 | 2019-11-19 | 徐州徐工环境技术有限公司 | 一种车辆智能控制系统 |
CN109190709A (zh) * | 2018-09-12 | 2019-01-11 | 北京工业大学 | 一种针对大气污染物浓度预测的选择特征的方法 |
CN109325600A (zh) * | 2018-09-26 | 2019-02-12 | 广东工业大学 | 一种适用于多个隐混杂因子数据的发现方法及系统 |
CN109492760B (zh) * | 2018-12-21 | 2022-06-14 | 北京航空航天大学 | 基于深度模糊认知图模型的道路交通可解释预测方法 |
-
2019
- 2019-05-31 CN CN201910466860.7A patent/CN110222822B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110222822A (zh) | 2019-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111242208B (zh) | 一种点云分类方法、分割方法及相关设备 | |
CN109131348B (zh) | 一种基于生成式对抗网络的智能车驾驶决策方法 | |
CN110222822B (zh) | 黑盒预测模型内部特征因果图的构建方法 | |
CN111291809B (zh) | 一种处理装置、方法及存储介质 | |
CN114612476B (zh) | 一种基于全分辨率混合注意力机制的图像篡改检测方法 | |
CN111462192A (zh) | 一种人行道扫地机器人时空双流融合卷积神经网络动态避障方法 | |
CN112966747A (zh) | 一种基于无锚框检测网络改进的车辆检测方法 | |
CN113269133A (zh) | 一种基于深度学习的无人机视角视频语义分割方法 | |
CN114998638A (zh) | 基于动静态卷积融合神经网络的多视图三维点云分类方法 | |
CN115439507A (zh) | 基于多层次互增强与相关金字塔的三维视频目标跟踪方法 | |
CN115578416A (zh) | 一种无人机目标跟踪方法、系统、介质及电子设备 | |
Khan et al. | A hybrid defense method against adversarial attacks on traffic sign classifiers in autonomous vehicles | |
CN111259923A (zh) | 一种基于改进三维r-cnn算法的多目标检测方法 | |
CN117710841A (zh) | 一种无人机航拍图像的小目标检测方法、装置 | |
CN117274115A (zh) | 基于多尺度稀疏Transformer网络的图像增强方法及系统 | |
Liu et al. | HPL-ViT: A unified perception framework for heterogeneous parallel LiDARs in V2V | |
CN116820131A (zh) | 一种基于目标感知ViT的无人机跟踪方法 | |
CN116740516A (zh) | 基于多尺度融合特征提取的目标检测方法及系统 | |
CN115424225A (zh) | 一种面向自动驾驶系统的三维实时目标检测方法 | |
Sankaranarayanan et al. | Virtual mono-layered continuous containers for vehicle detection applications in intelligent transportation systems | |
Ran et al. | Adaptive fusion and mask refinement instance segmentation network for high resolution remote sensing images | |
Narmadha et al. | Robust Deep Transfer Learning Based Object Detection and Tracking Approach. | |
Dinakaran et al. | In-vehicle object detection in the wild for driverless vehicles | |
CN116486203B (zh) | 一种基于孪生网络和在线模板更新的单目标跟踪方法 | |
CN114326821B (zh) | 基于深度强化学习的无人机自主避障系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |