CN110309764A - 一种基于深度学习的多阶段驾驶员打电话行为检测方法 - Google Patents

一种基于深度学习的多阶段驾驶员打电话行为检测方法 Download PDF

Info

Publication number
CN110309764A
CN110309764A CN201910570621.6A CN201910570621A CN110309764A CN 110309764 A CN110309764 A CN 110309764A CN 201910570621 A CN201910570621 A CN 201910570621A CN 110309764 A CN110309764 A CN 110309764A
Authority
CN
China
Prior art keywords
driver
face
bounding box
phone call
hand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910570621.6A
Other languages
English (en)
Other versions
CN110309764B (zh
Inventor
高飞
李帅
葛一粟
卢书芳
张元鸣
陆佳炜
肖刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201910570621.6A priority Critical patent/CN110309764B/zh
Publication of CN110309764A publication Critical patent/CN110309764A/zh
Application granted granted Critical
Publication of CN110309764B publication Critical patent/CN110309764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于深度学习的多阶段驾驶员打电话行为检测方法,包括车窗检测模块对输入图像进行车窗检测;人脸检测模块对输入图像进行人脸检测;驾驶员定位模块将每个检测到的车窗内的驾驶员进行定位;人脸区域扩展模块对每个驾驶员的人脸区域进行扩展,以便后续驾驶员手部和驾驶员打电话行为的检测;驾驶员打电话行为检测模块在驾驶员人脸扩展区域上对驾驶员打电话行为进行检测;驾驶员手部检测模块在驾驶员人脸扩展区域上对驾驶员手部进行检测;驾驶员手部脸部相交判断模块对驾驶员手部和脸部是否相交进行判定;最终结果判断模块将驾驶员打电话行为检测结果和驾驶员手部脸部相交判断结果进行结合,作为最终的驾驶员打电话行为判定结果。

Description

一种基于深度学习的多阶段驾驶员打电话行为检测方法
技术领域
本发明涉及计算机图像处理及智能交通技术领域,具体涉及一种基于深度学习的多阶段驾驶员打电话行为检测方法。
背景技术
近年来,随着汽车数量的不断增加,交通事故的发生率也在不断增加,已成为危害人类生命安全的重要因素之一。研究表明,十分之一的致命车祸与分心驾驶有关,相比于醉酒驾驶、超速驾驶和未佩戴安全带造成的死亡,分心驾驶的死亡人数增加得更快。作为分心驾驶的一种,驾驶员打电话行为会严重分散驾驶员的注意力,降低驾驶员的反应速度和应变能力,更易引发交通事故。《中华人民共和国道路交通安全法实施条例》中对驾驶员拨打接听手持电话做出了相应的处罚条例。
当前有许多学者提出了不同的驾驶员打电话行为检测方法,其中与本发明较接近的技术方案为:发明专利(专利号:ZL201510332624.8,名称:基于智能监控系统的驾驶员开车打电话检测方法)阐述了一种利用Cascade级联分类器对人头两侧的前景区域进行人手打电话分类的方法,进而判断驾驶员是否有违章打电话的行为。发明专利(专利号:ZL201510013139.4,名称:一种基于SVM的驾驶员接打电话监控方法)阐述了一种利用SVM分类器进行驾驶员打电话行为的分类,详细监视驾驶员的手停留在耳朵旁边的时间,并根据驾驶员的手停留在耳朵旁边的时间长短判断驾驶员是否正在接打电话。发明专利(公开号:CN107301384A,名称:一种驾驶员接打电话行为检测方法及系统。)阐述了一种基于二值化图像的驾驶员打电话行为检测方法,对驾驶员图像进行二值化,同时对当前图像进行人脸检测并通过预设的映射关系根据人脸范围计算出接打电话检测区域,然后统计连续数帧内检测区域内特定像素点的比例是否大于阈值,从而判断驾驶员是否在接打电话。
综上所述,当前驾驶员打电话行为检测方法存在着如下不足:1)传统的分类器(如Cascade、SVM等)提取的特征表达能力有限,导致驾驶员打电话行为检测的准确率不高;2)由于驾驶员的人脸在驾驶图像中所占的比例较小,一阶段端到端的深度学习方法对驾驶员打电话行为检测效果不好。
发明内容
针对现有的驾驶员打电话行为检测方法存在的上述问题,本发明提出了一种基于深度学习的多阶段驾驶员打电话行为检测方法。
本发明的技术方案如下:
一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,包括如下步骤:
步骤1:利用卷积神经网络对样本图像进行训练,获取训练好的车窗检测模型、人脸检测模型、驾驶员手部检测模型以及驾驶员打电话行为检测模型,并利用车窗及驾驶员人脸的位置信息确定驾驶员的位置,具体为:
步骤1.1:利用车窗检测模块进行车窗定位,令检测到的车窗集合W={wi|i=0,1,...,n-1},其中wi表示检测到的第i个车窗边界框,n表示检测到的车窗数量;利用人脸检测模块进行驾驶员人脸检测,令检测到的人脸集合F={fj|j=0,1,...,m1-1},其中fj表示检测到的第j个人脸边界框,其中m1≥n,m1表示检测到的人脸数量;
步骤1.2:将车窗外的人脸边界框从人脸边界框集合中去除,具体为:令车窗内部的人脸边界框集合其中表示获取包含在第i个车窗边界框内的第j个人脸边界框,令其中表示第i个车窗边界框wi中包含的人脸边界框集合,fl i表示第i个车窗边界框wi中包含的第l个人脸边界框,m2表示车窗边界框wi包含的人脸数目;
步骤1.3:使用驾驶员位置定位模块,将每个车窗边界框wi内的副驾驶人员人脸边界框去除,具体为:令所有车窗边界框内的驾驶员人脸边界框集合其中表示获取车窗边界框wi中包含的人脸边界框集合FWi中左上角横坐标最大的人脸边界框,令Ffinal={hk|k=0,1,...,n-1};
步骤2:使用人脸区域扩展模块,对步骤1中得到的驾驶员人脸集合Ffinal中的每个人脸边界框hk进行扩展,令人脸扩展区域集合R={rk|k=0,1,...,n-1}作为驾驶员打电话以及驾驶员手部待检测区域,利用驾驶员手部检测模块和驾驶员打电话行为检测模块在人脸扩展区域rk上进行检测,具体为:
步骤2.1:利用驾驶员手部检测模块在人脸扩展区域rk上进行驾驶员手部检测,令在人脸扩展区域rk上检测到的驾驶员手部集合其中表示在第k个扩展区域上检测到的第r个驾驶员手部,利用驾驶员打电话行为检测模块在人脸扩展区域rk上进行驾驶员打电话检测,令检测结果resCk∈{true,false},resCk表示在第k个人脸扩展区域rk上得到的驾驶员打电话检测结果,false表示没有打电话,true表示打电话;
步骤2.2:将基于原图的驾驶员人脸边界框hk的坐标转化到扩展区域rk下,得到转化后的驾驶员人脸边界框集合Fcov={hck|k=0,1,...,n-1},hck表示第k个转换到人脸扩展区域集合R下的人脸边界框,利用驾驶员手部脸部相交判断模块,判断第k个人脸扩展区域上的人脸边界框hck与手部边界框是否相交,令判断结果resIk∈{true,false},true表示相交,false表示不相交;
步骤3:在最终结果判断模块中,结合步骤2.1中驾驶员打电话检测结果resCk与步骤2.2中驾驶员手部和脸部相交结果resIk作为最终的驾驶员打电话行为检测结果,令最终的驾驶员打电话行为检测结果集合resF={resfk|k=0,1,...,n-1},其中,resfk表示全图中第k辆车中的驾驶员打电话行为检测的结果,其中resfk=resCk&&resIk,resfk等于false表示第k辆车中的驾驶员没有打电话,resfk等于true表示第k辆车中的驾驶员在打电话。
进一步的,所述的一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,步骤1中所述的卷积神经网络包含52个卷积层和1个全连接层,所述的样本图像包括卡口完整图像以及人脸区域扩展图像。
所述的一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,所述的车窗检测模块、人脸检测模块、驾驶员手部检测模块和驾驶员打电话行为检测模块分别利用车窗检测模型、人脸检测模型、驾驶员手部检测模型进和驾驶员打电话行为检测模型进行检测。
所述的一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,步骤2.1中所述的人脸边界框hk扩展方法按如下步骤实现:
1)令人脸边界框hk=(xk,yk,wk,hk),人脸扩展区域rk=(Xk,Yk,Wk,Hk),其中xk,yk,wk,hk分别表示人脸边界框hk的左上角的横坐标、左上角的纵坐标、宽和高,分别表示人脸边界框hk的左上角的横坐标、左上角的纵坐标、宽以高Xk,Yk,Wk,Hk分别表示扩展区域rk的左上角的横坐标、左顶点的纵坐标、宽和高;
2)扩展过程如公式(1)所示:
其中,K为缩放倍数,取值范围为[1,2];进一步,根据公式(2)进行越界处理:
其中,Width和Height分别为原图的宽和高。
所述的一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,步骤2.2中基于原图的驾驶员人脸边界框hk转化到扩展区域rk的方法按如下步骤实现:
1)令hck=(XCk,YCk,WCk,HCk),其中XCk,YCk,WCk,HCk分别表示第k个扩展区域上的人脸边界框hck的左上角的横坐标、左上角的纵坐标、宽和高;
2)人脸边界框转化过程如公式(3)所示:
所述的一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,步骤2.2中判断人脸扩展区域上的人脸边界框hck与手部边界框是否相交方法按如下步骤实现:
1)令人脸边界框hck的中心坐标为Chc(X,Y),令手部边界框其中分别表示第k个扩展区域上的第r个手部边界框的左上角的横坐标、左上角的纵坐标、宽和高,令手部边界框的中心坐标为Ch(x,y),令Chc(X,Y)和Ch(x,y)的距离为d,两中心连线与水平线的夹角为θ,其中θ为锐角;
2)判断人脸扩展区域上的人脸边界框hck与手部边界框是否相交如公式(4)所示:
本发明的有益效果是:
1)相比于传统的分类方法,利用深度学习的方法提取驾驶员打电话行为的深度特征并进行分类,提高了驾驶员打电话行为检测的准确率;
2)利用三个阶段进行驾驶员打电话行为检测,第一阶段进行车窗及人脸检测,将副驾驶人员排除,从而实现驾驶员的定位;第二阶段将第一阶段检测到的驾驶员人脸区域进行K倍缩放,然后在扩展区域上进行驾驶员打电话行为检测以及驾驶员手部的检测;第三阶段结合第二阶段中驾驶员打电话行为检测的结果以及驾驶员手部与驾驶员人脸相交的结果作为最终驾驶员打电话行为检测的结果,本方法的优点如下:
1)由于驾驶员的人脸在驾驶图像中所占的比例较小,一阶段端到端的深度学习方法对驾驶员打电话行为检测效果不好,并且无法准确区分正副驾驶人员,本方法在人脸扩展区域上进行驾驶员打电话行为检测以及驾驶员手部的检测,可以大大提高驾驶员打电话行为检测的准确率;
2)结合驾驶员打电话行为检测的结果以及驾驶员手部与驾驶员人脸相交的结果作为最终驾驶员打电话行为检测的结果,进一步提高了驾驶员打电话行为检测的准确率。
附图说明
图1为本发明一种基于深度学习的多阶段驾驶员打电话行为检测方法的框架图。
图2为本发明一种基于深度学习的多阶段驾驶员打电话行为检测方法实施例的流程图。
图中:1-人脸检测模块,2-车窗检测模块,3-驾驶员位置定位模块,4-人脸区域扩展模块,5-驾驶员打电话行为检测模块,6-驾驶员手部检测模块,7-驾驶员手部脸部相交判断模块,8-最终结果判断模块,9-原图。
具体实施方式
下面结合附图和实施例,对本发明进行进一步的说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
基于深度学习的多阶段驾驶员打电话行为检测方法,包括如下步骤:
步骤1:利用卷积神经网络对样本图像进行训练,获取训练好的车窗检测模型、人脸检测模型、驾驶员手部检测模型以及驾驶员打电话行为检测模型,并利用车窗及驾驶员人脸的位置信息确定驾驶员的位置,具体为:
步骤1.1:利用车窗检测模块2进行车窗定位,令检测到的车窗集合W={wi|i=0,1,...,n-1},其中wi表示检测到的第i个车窗边界框,n表示检测到的车窗数量;利用人脸检测模块1进行驾驶员人脸检测,令检测到的人脸集合F={fj|j=0,1,...,m1-1},其中fj表示第j个检测到的人脸边界框,其中m1≥n,m1表示检测到的人脸数量;
步骤1.2:将车窗外的人脸边界框从人脸边界框集合中去除,具体为:令车窗内部的人脸边界框集合其中表示获取包含在第i个车窗边界框内的第j个人脸边界框,令其中表示第i个车窗边界框wi中包含的人脸边界框集合,fl i表示第i个车窗边界框wi中包含的第l个人脸边界框,m2表示车窗边界框wi包含的人脸数目;
步骤1.3:使用驾驶员位置定位模块3,将每个车窗边界框wi内的副驾驶人员人脸边界框去除,具体为:令所有车窗边界框内的驾驶员人脸边界框集合其中表示获取车窗边界框wi中包含的人脸边界框集合中左上角横坐标最大的人脸边界框,令Ffinal={hk|k=0,1,...,n-1};
步骤2:使用人脸区域扩展模块4,对步骤1中得到的驾驶员人脸集合Ffinal中的每个人脸边界框hk进行扩展,令人脸扩展区域集合R={rk|k=0,1,...,n-1}作为驾驶员打电话以及驾驶员手部待检测区域,利用驾驶员手部检测模块6和驾驶员打电话行为检测模块5在人脸扩展区域rk上进行检测,具体为:
步骤2.1:利用驾驶员手部检测模块6在人脸扩展区域rk上进行驾驶员手部检测,令在人脸扩展区域rk上检测到的驾驶员手部集合其中表示在第k个扩展区域上检测到的第r个驾驶员手部,利用驾驶员打电话行为检测模块5在人脸扩展区域rk上进行驾驶员打电话检测,令检测结果resCk∈{true,false},resCk表示在第k个人脸扩展区域rk上得到的驾驶员打电话检测结果,false表示没有打电话,true表示打电话;
步骤2.2:将基于原图9的驾驶员人脸边界框hk的坐标转化到扩展区域rk下,得到转化后的驾驶员人脸边界框集合Fcov={hck|k=0,1,...,n-1},hck表示第k个转换到人脸扩展区域集合R下的人脸边界框,利用驾驶员手部脸部相交判断模块7,判断第k个人脸扩展区域上的人脸边界框hck与手部边界框是否相交,令判断结果resIk∈{true,false},true表示相交,false表示不相交;
步骤3:在最终结果判断模块8中,结合步骤2.1中驾驶员打电话检测结果resCk与步骤2.2中驾驶员手部和脸部相交结果resIk作为最终的驾驶员打电话行为检测结果,令最终的驾驶员打电话行为检测结果集合resF={resfk|k=0,1,...,n-1},其中,resfk表示全图中第k辆车中的驾驶员打电话行为检测的结果,其中resfk=resCk&&resIk,resfk等于false表示第k辆车中的驾驶员没有打电话,resfk等于true表示第k辆车中的驾驶员在打电话;
其中步骤1中所述的卷积神经网络包含52个卷积层和1个全连接层,样本图像包括卡口完整图像以及人脸区域扩展图像。车窗检测模块2、人脸检测模块1、驾驶员手部检测模块6和驾驶员打电话行为检测模块5分别利用车窗检测模型、人脸检测模型、驾驶员手部检测模型进和驾驶员打电话行为检测模型进行检测;
其中步骤2.1中所述的人脸边界框hk扩展方法按如下步骤实现:
1)令人脸边界框hk=(xk,yk,wk,hk),人脸扩展区域rk=(Xk,Yk,Wk,Hk),其中xk,yk,wk,hk分别表示人脸边界框hk的左上角的横坐标、左上角的纵坐标、宽和高,分别表示人脸边界框hk的左上角的横坐标、左上角的纵坐标、宽以高Xk,Yk,Wk,Hk分别表示扩展区域rk的左上角的横坐标、左顶点的纵坐标、宽和高;
2)扩展过程如公式(1)所示:
其中,K为缩放倍数,取值范围为[1,2],本实施例中,K取值为1;进一步,根据公式(2)进行越界处理:
其中,Width和Height分别为原图的宽和高;
步骤2.2中基于原图的驾驶员人脸边界框hk转化到扩展区域rk的方法按如下步骤实现:
1)令hck=(XCk,YCk,WCk,HCk),其中XCk,YCk,WCk,HCk分别表示第k个扩展区域上的人脸边界框hck的左上角的横坐标、左上角的纵坐标、宽和高;
2)人脸边界框转化过程如公式(3)所示:
步骤2.2中判断人脸扩展区域上的人脸边界框hck与手部边界框是否相交方法按如下步骤实现:
1)令人脸边界框hck的中心坐标为Chc(X,Y),令手部边界框其中分别表示第k个扩展区域上的第r个手部边界框的左上角的横坐标、左上角的纵坐标、宽和高,令手部边界框的中心坐标为Ch(x,y),令Chc(X,Y)和Ch(x,y)的距离为d,两中心连线与水平线的夹角为θ,其中θ为锐角;
2)判断人脸扩展区域上的人脸边界框hck与手部边界框是否相交如公式(4)所示:

Claims (6)

1.一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,包括如下步骤:
步骤1:利用卷积神经网络对样本图像进行训练,获取训练好的车窗检测模型、人脸检测模型、驾驶员手部检测模型以及驾驶员打电话行为检测模型,并利用车窗及驾驶员人脸的位置信息确定驾驶员的位置,具体为:
步骤1.1:利用车窗检测模块进行车窗定位,令检测到的车窗集合W={wi|i=0,1,...,n-1},其中wi表示检测到的第i个车窗边界框,n表示检测到的车窗数量;利用人脸检测模块进行驾驶员人脸检测,令检测到的人脸集合F={fj|j=0,1,...,m1-1},其中fj表示检测到的第j个人脸边界框,其中m1≥n,m1表示检测到的人脸数量;
步骤1.2:将车窗外的人脸边界框从人脸边界框集合中去除,具体为:令车窗内部的人脸边界框集合其中表示获取包含在第i个车窗边界框内的第j个人脸边界框,令其中表示第i个车窗边界框wi中包含的人脸边界框集合,fl i表示第i个车窗边界框wi中包含的第l个人脸边界框,m2表示车窗边界框wi包含的人脸数目;
步骤1.3:使用驾驶员位置定位模块,将每个车窗边界框wi内的副驾驶人员人脸边界框去除,具体为:令所有车窗边界框内的驾驶员人脸边界框集合其中表示获取车窗边界框wi中包含的人脸边界框集合中左上角横坐标最大的人脸边界框,令Ffinal={hk|k=0,1,...,n-1};
步骤2:使用人脸区域扩展模块,对步骤1中得到的驾驶员人脸集合Ffinal中的每个人脸边界框hk进行扩展,令人脸扩展区域集合R={rk|k=0,1,...,n-1}作为驾驶员打电话以及驾驶员手部待检测区域,利用驾驶员手部检测模块和驾驶员打电话行为检测模块在人脸扩展区域rk上进行检测,具体为:
步骤2.1:利用驾驶员手部检测模块在人脸扩展区域rk上进行驾驶员手部检测,令在人脸扩展区域rk上检测到的驾驶员手部集合其中表示在第k个扩展区域上检测到的第r个驾驶员手部,利用驾驶员打电话行为检测模块在人脸扩展区域rk上进行驾驶员打电话检测,令检测结果resCk∈{true,false},resCk表示在第k个人脸扩展区域rk上得到的驾驶员打电话检测结果,false表示没有打电话,true表示打电话;
步骤2.2:将基于原图的驾驶员人脸边界框hk的坐标转化到扩展区域rk下,得到转化后的驾驶员人脸边界框集合Fcov={hck|k=0,1,...,n-1},hck表示第k个转换到人脸扩展区域集合R下的人脸边界框,利用驾驶员手部脸部相交判断模块,判断第k个人脸扩展区域上的人脸边界框hck与手部边界框是否相交,令判断结果resIk∈{true,false},true表示相交,false表示不相交;
步骤3:在最终结果判断模块中,结合步骤2.1中驾驶员打电话检测结果resCk与步骤2.2中驾驶员手部和脸部相交结果resIk作为最终的驾驶员打电话行为检测结果,令最终的驾驶员打电话行为检测结果集合resF={resfk|k=0,1,...,n-1},其中,resfk表示全图中第k辆车中的驾驶员打电话行为检测的结果,其中resfk=resCk&&resIk,resfk等于false表示第k辆车中的驾驶员没有打电话,resfk等于true表示第k辆车中的驾驶员在打电话。
2.如权利要求1所述的所述的一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,步骤1中所述的卷积神经网络包含52个卷积层和1个全连接层,所述的样本图像包括卡口完整图像以及人脸区域扩展图像。
3.如权利要求1所述的所述的一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,所述的车窗检测模块、人脸检测模块、驾驶员手部检测模块和驾驶员打电话行为检测模块分别利用车窗检测模型、人脸检测模型、驾驶员手部检测模型进和驾驶员打电话行为检测模型进行检测。
4.如权利要求1所述的所述的一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,步骤2.1中所述的人脸边界框hk扩展方法按如下步骤实现:
1)令人脸边界框hk=(xk,yk,wk,hk),人脸扩展区域rk=(Xk,Yk,Wk,Hk),其中xk,yk,wk,hk分别表示人脸边界框hk的左上角的横坐标、左上角的纵坐标、宽和高,分别表示人脸边界框hk的左上角的横坐标、左上角的纵坐标、宽以高Xk,Yk,Wk,Hk分别表示扩展区域rk的左上角的横坐标、左顶点的纵坐标、宽和高;
2)扩展过程如公式(1)所示:
其中,K为缩放倍数,取值范围为[1,2];进一步,根据公式(2)进行越界处理:
其中,Width和Height分别为原图的宽和高。
5.如权利要求1所述的所述的一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,步骤2.2中基于原图的驾驶员人脸边界框hk转化到扩展区域rk的方法按如下步骤实现:
1)令hck=(XCk,YCk,WCk,HCk),其中XCk,YCk,WCk,HCk分别表示第k个扩展区域上的人脸边界框hck的左上角的横坐标、左上角的纵坐标、宽和高;
2)人脸边界框转化过程如公式(3)所示:
6.如权利要求1所述的所述的一种基于深度学习的多阶段驾驶员打电话行为检测方法,其特征在于,步骤2.2中判断人脸扩展区域上的人脸边界框hck与手部边界框是否相交方法按如下步骤实现:
1)令人脸边界框hck的中心坐标为Chc(X,Y),令手部边界框其中分别表示第k个扩展区域上的第r个手部边界框的左上角的横坐标、左上角的纵坐标、宽和高,令手部边界框的中心坐标为Ch(x,y),令Chc(X,Y)和Ch(x,y)的距离为d,两中心连线与水平线的夹角为θ,其中θ为锐角;
2)判断人脸扩展区域上的人脸边界框hck与手部边界框是否相交如公式(4)所示:
CN201910570621.6A 2019-06-27 2019-06-27 一种基于深度学习的多阶段驾驶员打电话行为检测方法 Active CN110309764B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910570621.6A CN110309764B (zh) 2019-06-27 2019-06-27 一种基于深度学习的多阶段驾驶员打电话行为检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910570621.6A CN110309764B (zh) 2019-06-27 2019-06-27 一种基于深度学习的多阶段驾驶员打电话行为检测方法

Publications (2)

Publication Number Publication Date
CN110309764A true CN110309764A (zh) 2019-10-08
CN110309764B CN110309764B (zh) 2021-06-01

Family

ID=68077086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910570621.6A Active CN110309764B (zh) 2019-06-27 2019-06-27 一种基于深度学习的多阶段驾驶员打电话行为检测方法

Country Status (1)

Country Link
CN (1) CN110309764B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062319A (zh) * 2019-12-16 2020-04-24 武汉极目智能技术有限公司 一种基于主动红外图像的驾驶员打电话检测方法
CN111814568A (zh) * 2020-06-11 2020-10-23 开易(北京)科技有限公司 一种用于驾驶员状态监测的目标检测方法及装置
CN111860280A (zh) * 2020-07-15 2020-10-30 南通大学 一种基于深度学习的驾驶员违章行为识别系统
CN113591578A (zh) * 2021-06-30 2021-11-02 广州市瀚云信息技术有限公司 一种屏蔽器控制方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573659A (zh) * 2015-01-09 2015-04-29 安徽清新互联信息科技有限公司 一种基于svm的驾驶员接打电话监控方法
US20160180707A1 (en) * 2014-12-18 2016-06-23 Ford Global Technologies, Llc Rules of the road advisor using vehicle telematics
CN106056071A (zh) * 2016-05-30 2016-10-26 北京智芯原动科技有限公司 一种驾驶员打电话行为的检测方法及装置
CN106203385A (zh) * 2016-07-20 2016-12-07 东方网力科技股份有限公司 一种驾驶员手持电话行为检测方法及装置
CN106314356A (zh) * 2016-08-22 2017-01-11 乐视控股(北京)有限公司 车辆的控制方法、控制装置及车辆
CN106815574A (zh) * 2017-01-20 2017-06-09 博康智能信息技术有限公司北京海淀分公司 建立检测模型、检测接打手机行为的方法和装置
CN108960065A (zh) * 2018-06-01 2018-12-07 浙江零跑科技有限公司 一种基于视觉的驾驶行为检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160180707A1 (en) * 2014-12-18 2016-06-23 Ford Global Technologies, Llc Rules of the road advisor using vehicle telematics
CN104573659A (zh) * 2015-01-09 2015-04-29 安徽清新互联信息科技有限公司 一种基于svm的驾驶员接打电话监控方法
CN106056071A (zh) * 2016-05-30 2016-10-26 北京智芯原动科技有限公司 一种驾驶员打电话行为的检测方法及装置
CN106203385A (zh) * 2016-07-20 2016-12-07 东方网力科技股份有限公司 一种驾驶员手持电话行为检测方法及装置
CN106314356A (zh) * 2016-08-22 2017-01-11 乐视控股(北京)有限公司 车辆的控制方法、控制装置及车辆
CN106815574A (zh) * 2017-01-20 2017-06-09 博康智能信息技术有限公司北京海淀分公司 建立检测模型、检测接打手机行为的方法和装置
CN108960065A (zh) * 2018-06-01 2018-12-07 浙江零跑科技有限公司 一种基于视觉的驾驶行为检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田文洪等: ""基于卷积神经网络的驾驶员不安全行为识别"", 《电子科技大学学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062319A (zh) * 2019-12-16 2020-04-24 武汉极目智能技术有限公司 一种基于主动红外图像的驾驶员打电话检测方法
CN111062319B (zh) * 2019-12-16 2023-02-10 武汉极目智能技术有限公司 一种基于主动红外图像的驾驶员打电话检测方法
CN111814568A (zh) * 2020-06-11 2020-10-23 开易(北京)科技有限公司 一种用于驾驶员状态监测的目标检测方法及装置
CN111814568B (zh) * 2020-06-11 2022-08-02 开易(北京)科技有限公司 一种用于驾驶员状态监测的目标检测方法及装置
CN111860280A (zh) * 2020-07-15 2020-10-30 南通大学 一种基于深度学习的驾驶员违章行为识别系统
CN113591578A (zh) * 2021-06-30 2021-11-02 广州市瀚云信息技术有限公司 一种屏蔽器控制方法及装置

Also Published As

Publication number Publication date
CN110309764B (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN110309764A (zh) 一种基于深度学习的多阶段驾驶员打电话行为检测方法
CN103886308B (zh) 一种使用聚合通道特征和软级联分类器的行人检测方法
CN106056071B (zh) 一种驾驶员打电话行为的检测方法及装置
Rongben et al. Monitoring mouth movement for driver fatigue or distraction with one camera
CN102592143B (zh) 一种驾驶员行车中手持电话违规行为检测方法
CN104298969B (zh) 基于颜色与haar特征融合的人群规模统计方法
CN109685026B (zh) 一种驾驶员手持手机通话的实时监测方法
CN102073841B (zh) 一种不良视频检测方法及装置
CN103824081B (zh) 一种室外恶劣光照条件下的快速鲁棒交通标志检测方法
CN103268468B (zh) 机动车前排就坐者是否扣带安全带的自动检测方法
CN106910186A (zh) 一种基于cnn深度学习的桥梁裂缝检测定位方法
CN101702197A (zh) 一种道路交通标志的检测方法
CN104217217B (zh) 一种基于两层分类的车辆标志物检测方法与系统
CN109948418A (zh) 一种基于深度学习的违反导向违法自动审核方法
CN108388871B (zh) 一种基于车身回归的车辆检测方法
CN102855500A (zh) 一种基于Haar和HoG特征的前车检测方法
CN105160317A (zh) 一种基于区域分块行人性别识别方法
CN103679168A (zh) 文字区域检测方法及装置
CN104715244A (zh) 一种基于肤色分割和机器学习的多视角人脸检测方法
CN103390164A (zh) 基于深度图像的对象检测方法及其实现装置
CN102254152A (zh) 基于彩色跳变点和颜色密度的车牌定位方法
CN110348384A (zh) 一种基于特征融合的小目标车辆属性识别方法
CN106446792A (zh) 一种道路交通辅助驾驶环境下的行人检测特征提取方法
CN110414329A (zh) 一种基于图像的车辆行驶方向判断方法
CN108549901A (zh) 一种基于深度学习的快速迭代目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant