CN112560714A - 基于人工智能的酒驾检测方法、装置、服务器及存储介质 - Google Patents

基于人工智能的酒驾检测方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN112560714A
CN112560714A CN202011511944.7A CN202011511944A CN112560714A CN 112560714 A CN112560714 A CN 112560714A CN 202011511944 A CN202011511944 A CN 202011511944A CN 112560714 A CN112560714 A CN 112560714A
Authority
CN
China
Prior art keywords
vehicle
driver
facial expression
drunk driving
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011511944.7A
Other languages
English (en)
Inventor
吴晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Saiante Technology Service Co Ltd
Original Assignee
Shenzhen Saiante Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Saiante Technology Service Co Ltd filed Critical Shenzhen Saiante Technology Service Co Ltd
Priority to CN202011511944.7A priority Critical patent/CN112560714A/zh
Publication of CN112560714A publication Critical patent/CN112560714A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Abstract

本申请涉及人工智能技术领域,提供一种基于人工智能的酒驾检测方法、装置、服务器及存储介质,该方法包括:当车辆经过卡口电警时接收卡口电警发送的车辆图片,从而确定相应的车辆状态信息、过车时空信息以及驾驶员图像,并且将驾驶员图像输入至面部表情识别模型可以得到驾驶员的面部表情标签,如此,可以将车辆状态信息与过车时空信息这两个数据因素以及面部表情标签这个视觉因素处理为一个多维向量,并将这个多维向量输入至XgBoost模型中以确定驾驶员是否存在酒驾行为。可以看出,通过面部表情识别模型以及XgBoost可以实现酒驾的自动检测,即通过人工智能实现酒驾自动检测,并且,结合数据因素以及视觉因素可以提高酒驾检测的正确率。

Description

基于人工智能的酒驾检测方法、装置、服务器及存储介质
技术领域
本申请涉及人工智能,提供一种基于人工智能的酒驾检测方法、装置、服务器及存储介质。
背景技术
酒后驾驶是造成道路交通事故的主要原因之一,目前,酒驾的主要检测方式为人工检测,例如,交警在道路上设置临时检测口,通过便携式酒精检测仪对过往车辆驾驶员进行检测。但是,这种方式不仅耗费大量人力物力且检测效率也不高,因此,如何实现酒驾的自动检测成为当前研究的热点。
发明内容
基于此,本申请提供了一种基于人工智能的酒驾检测方法、装置、服务器及存储介质,以实现对酒驾的自动检测。
第一方面,本申请提供了一种基于人工智能的酒驾检测方法,包括:
当车辆经过卡口电警时,接收所述卡口电警发送的车辆图片,根据所述车辆图片确定所述车辆的车辆状态信息、过车时空信息以及所述车辆中驾驶员的驾驶员图像;
将所述驾驶员图像输入至面部表情识别模型中,得到所述驾驶员的面部表情标签,其中,所述面部表情识别模型为预先根据训练图像集与若干面部表情标签之间的对应关系训练得到的;
根据所述车辆状态信息、所述过车时空信息以及所述驾驶员的面部表情标签得到多维向量,并将所述多维向量输入至XgBoost模型中,以确定所述驾驶员是否存在酒驾行为。
第二方面,本申请提供了一种基于人工智能的酒驾检测装置,包括:
图片接收模块,用于当车辆经过卡口电警时,接收所述卡口电警发送的车辆图片;
信息确定模块,用于根据所述车辆图片确定所述车辆的车辆状态信息、过车时空信息以及所述车辆中驾驶员的驾驶员图像,并将所述驾驶员图像输入至面部表情识别模型中,得到所述驾驶员的面部表情标签,其中,所述面部表情识别模型为预先根据训练图像集与若干面部表情标签之间的对应关系训练得到的;
酒驾检测模块,用于根据所述车辆状态信息、所述过车时空信息以及所述驾驶员的面部表情标签得到多维向量,并将所述多维向量输入至XgBoost模型中,以确定所述驾驶员是否存在酒驾行为。
第三方面,本申请提供了一种服务器,包括处理器与存储器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如第一方面所述的基于人工智能的酒驾检测方法。
第四方面,本申请提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如第一方面所述的基于人工智能的酒驾检测方法。
本申请实施例提供的一种基于人工智能的酒驾检测方法、装置、服务器及存储介质,该方法包括:当车辆经过卡口电警时接收卡口电警发送的车辆图片,从而确定相应的车辆状态信息、过车时空信息以及驾驶员图像,并且将驾驶员图像输入至面部表情识别模型可以得到驾驶员的面部表情标签,如此,可以将车辆状态信息与过车时空信息这两个数据因素以及面部表情标签这个视觉因素处理为一个多维向量,并将这个多维向量输入至XgBoost模型中以确定驾驶员是否存在酒驾行为。可以看出,通过面部表情识别模型以及XgBoost可以实现酒驾的自动检测,并且,结合数据因素以及视觉因素可以提高酒驾检测的正确率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请各实施例一个可选的应用场景示意图;
图2为本申请实施例提供的一种基于人工智能的酒驾检测方法的流程示意图;
图3为本申请实施例中卷积神经网络的一种结构示意图;
图4为本申请实施例提供的一种基于人工智能的酒驾检测装置的结构示意性框图;
图5为本申请实施例提供的一种服务器的结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,本申请的说明书、权利要求书或上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序,不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请实施例提供一种基于人工智能的酒驾检测方法,该方法可以应用于服务器,示例性的,本申请实施例可以应用于如图1所示的应用场景,在该场景中,服务器可以部署于车辆管理部门等,且服务器分别与多个设置于道路上的卡口电警通信连接,如此,在车辆经过卡口电警时卡口电警会对车辆进行拍摄,并通过有线网络和/或无线网络将拍摄到的车辆图片发送给服务器,服务器在接收到该图片后执行本申请实施例所述的方法,检测相应驾驶员是否存在酒驾行为。需要说明的是,卡口,是公路车辆智能监测记录系统(intelligent monitoring and recording system of vehicles on highways)的简称,能够对受监控路面的车辆信息进行自动采集和处理;电警,又称为电子警察,是闯红灯自动记录系统(automatic detecting and recording system for violation of trafficsignal),可安装在信号控制的交叉路口或路段上,对指定车道内机动车闯红灯、不按规定路线行驶等行为进行不间断自动检测和记录。
在一些实施例中,本申请实施例提供的一种基于人工智能的酒驾检测方法,如图2所示,该方法包括但不限于步骤S10至步骤S30。
S10、当车辆经过卡口电警时,接收卡口电警发送的车辆图片,根据车辆图片确定车辆的车辆状态信息、过车时空信息以及车辆中驾驶员的驾驶员图像。
当车辆经过卡口电警时卡口电警会对该车辆进行拍摄,从而得到相应的车辆图片,基于此,由于卡口电警与服务器通信连接,因此卡口电警可以通过网络将该车辆图片发送给服务器。如此,服务器在接收到车辆图片时,可以根据该车辆图片去确定相应的车辆状态信息以及过车时空信息,其中,车辆状态信息用于表征车辆当前的行驶状态,可以包括车辆属性、车主属性、车辆行驶轨迹、车辆违法或车主代驾中的至少一种,车辆属性可以包括车辆类型、车辆品牌或车辆属地中的至少一种,车主属性可以包括性别、年龄、籍贯或驾龄中的至少一种;过车时空信息为车辆经过卡口电警的时间信息与空间信息,可以包括月份、星期、时段、辖区中的至少一种。另外,服务器可以对该车辆图片进行识别裁剪,以得到驾驶员图像,而具体的识别裁剪方式本申请实施例并不作限制。
在一些实施方式中,步骤S10中的“根据车辆图片确定车辆的车辆状态信息”包括但不限于步骤S101。
S101、根据车辆图片确定车辆的车牌号码,并根据车牌号码从数据库中获取对应车牌号码的行驶信息作为车辆的车辆状态信息。
具体的,由于车牌号码是车辆的身份标识信息,因此服务器可以根据车辆图片确定车牌号码,即确定车辆图片对应的实际车辆,例如,可以通过车牌识别以及ORC(opticalcharacter recognition,文字识别)等技术确定车牌号码,具体方式本申请实施例并不作限制;另外,由于在数据库(例如车辆管理部门的数据库)中存储有对应该车牌号码的行驶信息,因此服务器可以从数据库中获取这些信息并将这些信息作为车辆的车辆状态信息。
示例性的,服务器在接收到卡口电警发送的车辆图片时,根据该车辆图片确定车牌号码为A,从而向服务器获取对应车牌号码A的行驶信息,并将这些行驶信息作为车辆状态信息,例如车辆状态信息可以包括以下信息。
(
车辆属性:{车辆类型:小轿车,车辆品牌:奥迪,车辆属地:深圳},
车主属性:{性别:男,年龄:31,籍贯:广东广州,驾龄:5},
车辆行驶轨迹:异常,
车辆违法:超速,
车辆代驾:无
)
在一些实施方式中,步骤S10中的“根据车辆图片确定车辆的过车时空信息”包括但不限于步骤S102。
S102、将车辆图片中存储的拍摄地点信息以及拍摄时间信息作为车辆的过车时空信息。
具体的,卡口电警在拍摄并存储车辆图片时,可以将拍摄地点信息以及拍摄时间信息等存储于车辆图片中。因此,服务器可以将车辆图片中存储的拍摄地点信息以及拍摄时间信息作为车辆的过车时空信息。
示例性的,卡口电警拍摄的车辆图片中存储的拍摄时间信息包括“时间:2020/09/10 19:35:20”,以及存储的拍摄地点信息包括“地点:广东深圳宝安区宝安大道”,如此当服务器接收到该车辆图片时,可以将拍摄地点信息以及拍摄时间信息作为车辆的过车时空信息,例如过车时空信息可以包括以下信息。
(
月份:九,
星期:四,
时段:19点-18点,
辖区:深圳宝安区
)
S20、将驾驶员图像输入至面部表情识别模型中,得到驾驶员的面部表情标签。
其中,面部表情识别模型为预先训练得到的神经网络模型,具体为根据训练图像集与若干面部表情标签之间的对应关系训练得到的。因此,服务器可以将步骤S10得到的驾驶员图像输入至该模型中,以得到驾驶员的面部表情标签,其中,面部表情标签可以为脸色通红、脸色苍白、眼睛发红或目光呆滞等等。
在一些实施方式中,步骤S20包括但不限于步骤S201至步骤S204。
S201、将驾驶员图像处理为预设尺寸大小的图像。
具体的,在面部表情识别模型的训练过程中,可以将训练图像集的每张图像都处理为同一尺寸大小,例如都处理为512*512,如此在模型的训练过程中可以加快运算速度、减少模型参数以及加快模型收敛速度等等,因此服务器可以将步骤S10得到的驾驶员图像先处理为预设尺寸大小的图像,即处理为模型训练时的尺寸大小,例如处理为512*512,如此将处理后的驾驶员图像输入至面部表情识别模型中,可以更快速的得到相应的面部表情标签,从而提高了检测效率。
S202、将处理后的驾驶员图像输入至面部表情识别模型的特征提取层中,以得到相应的面部特征。
S203、将面部特征输入至面部表情识别模型的特征修正层中,以修正该面部特征。
S204、将修正后的面部特征输入至面部表情识别模型的概率计算层中,以计算出面部特征相对每个面部表情标签的概率值,并将概率值最大的面部表情标签作为驾驶员的面部表情标签。
具体的,面部表情识别模型包括特征提取层、特征修正层以及概率计算层,其中,特征提取层用于接收外部输入的图像并输出图像中的面部特征,简单理解就是用于提取图像中的面部特征,因此特征提取层可以包括卷积神经网络(Convolutional NeuralNetwork,简写为ConvNet或CNN),例如,卷积神经网络的网络结构如图3所示,其中,CBS具体为卷积层+批归一化(Batch Normalization,BN)+Swish激活函数,Res具体如图3中的Resunint所示。特征修正层用于将特征提取层输出的面部特征进行修正,即进行精调,从而提高了模型识别的准确度,例如,特征修正层可以包括全连接层(Fully Connected Layer)+Relu激活函数。概率计算层用于基于特征修正层输出的面部特征进行计算,即计算其相对每一个面部表情标签的概率值,并将概率值最大的面部表情标签作为输入图像的面部表情标签,例如,概率计算层可以包括全连接层+SoftMax激活函数。
基于此,将经过尺寸大小处理后的驾驶员图像输入至特征提取层,可以提取出面部特征,例如,面部特征可以为一特征矩阵;接着,将面部特征输入至特征修正层,可以对面部特征进行精调,以提高面部特征的精确度,例如,修正特征矩阵中的每一个矩阵元素;最后,将修正后的面部特征输入至概率计算层,可以计算出面部特征相对各个面部表情标签的概率值,例如,计算出面部特征相对“脸色通红”的概率值P1、相对“脸色苍白”的概率值P2、相对“眼睛发红”的概率值P3以及相对“目光呆滞”的概率值P4,如此,可以将概率值最大的面部表情标签作为该驾驶员图像的面部表情标签,即车辆图片的面部表情标签,例如,若P1、P2、P3、P4的值分别为0.65、0.1、0.15、0.1,则将“脸色通红”作为车辆图片的面部表情标签。
S30、根据车辆状态信息、过车时空信息以及驾驶员的面部表情标签得到多维向量,并将该多维向量输入至XgBoost模型中,以确定驾驶员是否存在酒驾行为。
XgBoost(eXtreme Gradient Boosting,极端梯度增强算法)模型是一种在GBDT(Gradient Boosting Decision Tree,梯度提升决策树)上做出的改进的一种模型,本申请实施例所述的XgBoost模型为预先训练好的分类模型,具体的,将一个向量输入至XgBoost模型中可以得到该向量相对酒驾的概率。基于此,为了提高酒驾检测的准确度,服务器可以将车辆状态信息与过车时空信息这两个数据因素以及面部表情标签这个视觉因素处理为一个多维向量,再将这个多维向量输入至XgBoost模型中,从而确定这个多维向量相对酒驾的概率值,进而确定车辆图片上的驾驶员是否存在酒驾行为。
在一些实施方式中,步骤S30中的“根据车辆状态信息、过车时空信息以及驾驶员的面部表情标签得到多维向量”包括步骤S301至步骤S302。
S301、基于预设的特征处理规则,分别将车辆状态信息、过车时空信息以及驾驶员的面部表情标签进行特征处理,得到多个子特征。
S302、将多个子特征进行拼接,得到多维向量。
具体的,车辆状态信息、过车时空信息以及面部表情标签基本上都是计算机不能直接处理的语言,因此可以基于预设的特征处理规则先进行特征处理,从而得到多个相应的子特征,如此将所有多个子特征进行拼接就可以得到一个多维向量。例如,基于预设的特征处理规则,将车辆状态信息进行特征处理后得到(子特征1,子特征2,子特征3),将过车时空信息进行特征处理后得到(子特征4,子特征5,子特征6),将面部表情标签进行特征处理得到(子特征7),如此进行拼接可以得到多维向量(子特征1,子特征2,子特征3,子特征4,子特征5,子特征6,子特征7)。
此外,特征处理规则可以根据实际情况合理设置,例如,车辆状态信息可以包括车辆属性、车主属性、车辆行驶轨迹、车辆违法以及车主代驾,其中,车辆属性可以包括车辆类型、车辆品牌以及车辆属地,车主属性可以包括性别、年龄、籍贯以及驾龄,本申请实施例提供一种特征处理规则如下:
1)车辆类型的特征处理。若车辆类型为小型汽车,例如小轿车、SUV等,则处理为1;若车辆类型为中型汽车,例如小货车、中巴车等,则处理为2;若车辆类型为大型汽车,例如大货车、大巴车等,则处理为3。
2)车辆品牌的特征处理。若车辆品牌为顶级豪车品牌,例如法拉利、兰博基尼等,则处理为1;若车辆品牌为豪车品牌,例如奥迪、宝马等,则处理为2;若车辆品牌为普通车品牌,例如大众、比亚迪等,则处理为3。
3)车辆属地的特征处理。若车辆为本地车,则处理为1;若车辆为本省车,则处理为2;若车辆为外省车,则处理为3。需要说明的是,本地、本省和外省的判断依据卡口电警的安装地点。
4)性别的特征处理。若驾驶员为男性,则处理为1;若驾驶员为女性,则处理为2。
5)年龄的特征处理。年龄为多少岁,则处理为多少,例如年龄为35岁,则处理为35。
6)籍贯的特征处理。若籍贯信息为本地,则处理为1;若籍贯信息为本省,则处理为2;若籍贯信息为外省,则处理为3。需要说明的是,本地、本省和外省的判断依据卡口电警的安装地点。
7)驾龄的特征处理。驾龄为多少年,则处理为多少,例如驾龄为5年,则处理为5。
8)车辆行驶轨迹的特征处理。若车辆行驶轨迹为正常轨迹,则处理为0;若车辆行驶轨迹为异常轨迹,则处理为1。
9)车辆违法的特征处理。若车辆不存在违法行为,则处理为0;若车辆存在违法行为,例如超速、闯红灯等,则处理为1。
10)车主代驾的特征处理。在车辆图片拍摄时间点,若车主没有使用代驾服务,则处理为0;若车主有使用代驾服务,则处理为1。
又例如,过车时空信息可以包括月份、星期、时段以及辖区,本申请实施例提供一种特征处理规则如下:
1)月份的特征处理。若月份为一月,则处理为1;若月份为二月,则处理为2;若月份为三月,则处理为3,以此类推,若月份为十二月,则处理为12。
2)星期的特征处理。若星期为星期一,则处理为1;若星期为星期二,则处理为2;若星期为星期三,则处理为3,以此类推,若星期为星期日,则处理为7。
3)时段的特征处理。若车辆图片的拍摄时间属于(0点,1点),则处理为1;若车辆图片的拍摄时间属于(1点,2点),则处理为2;若车辆图片的拍摄时间属于(2点,3点),则处理为3,以此类推,若车辆图片的拍摄时间属于(23点,24点),则处理为24。
4)辖区的特征处理。根据卡口电警的安装地点进行处理,例如,将深圳11个区分别用1-11表示,比如宝安区用1表示、南山区用2表示等,如此若卡口电警安装在深圳宝安,则处理为1;若卡口电警安装在深圳南山,则处理为2,以此类推。
又例如,面部表情标签可以包括脸色通红、脸色苍白、眼睛发红以及目光呆滞,本申请实施例提供一种特征处理规则如下:
1)面部表情标签的特征处理。若面部表情标签为脸色通红,则处理为1;若面部表情标签为脸色苍白,则处理为2;若面部表情标签为眼睛发红,则处理为3;若面部表情标签为目光呆滞,则处理为4。
在一些实施方式中,步骤S30中的“将多维向量输入至XgBoost模型中,以确定驾驶员是否存在酒驾行为”包括但不限于步骤S303至步骤S304。
S303、将多维向量输入至XgBoost模型中,得到驾驶员相对酒驾的概率值。
S304、若该概率值超过预设阈值,则确定驾驶员存在酒驾行为,若该概率值没有超过预设阈值,则确定驾驶员不存在酒驾行为。
具体的,在得到多维向量后服务器可以将其输入至XgBoost模型,XgBoost模型会根据多维向量的每个维度进行不断的二分,从而构造出多棵二叉树,每棵二叉树都会得到一个酒驾概率,然后将这多个酒驾概率进行加权平均就可以得到多维向量的酒驾概率,即得到驾驶员相对酒驾的概率值。如此,服务器就可以根据此概率值与预设阈值的大小关系确定驾驶员是否存在酒驾行为,若该概率值超过预设阈值,则确定驾驶员存在酒驾行为,若该概率值没有超过预设阈值,则确定驾驶员不存在酒驾行为。需要说明的是,XgBoost模型的计算过程为本领域技术人员熟知,此处不作赘述,并且,预设阈值的大小可以合理设置,例如0.5。
在一些实施例中,该方法还包括但不限于步骤S40。
S40、当确定驾驶员存在酒驾行为时,记录相应的酒驾信息。
具体的,在确定驾驶员存在酒驾行为时,服务器可以将相应的酒驾信息记录下来。在一些实施方式中,服务器可以将酒驾信息存储在区块链节点中,其中,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。在一些实施方式中,服务器还可以将酒驾信息发送给车管部门,以使管理人员采取相应的管理措施。
综上所述,当车辆经过卡口电警时服务器接收卡口电警发送的车辆图片时,从而确定相应的车辆状态信息以及过车时空信息,并且可以根据面部表情识别模型得到相应的面部表情标签,如此,可以将车辆状态信息与过车时空信息这两个数据因素以及面部表情标签这个视觉因素处理为一个多维向量,并将这个多维向量输入至XgBoost模型中以确定驾驶员是否存在酒驾行为。可以看出,通过人工智能可以实现酒驾的自动检测,并且,结合数据因素以及视觉因素可以提高酒驾检测的正确率。
此外,以下简述面部表情识别模型的训练过程:
1)构建模型。模型的具体结构如上所述,本领域技术人员可以根据上述论述构建出未训练的具体模型,此处不再赘述。
2)训练图像集的准备。可以通过网络爬取等方式获取大量的驾驶员图像,并且可以对获取到的图像进行数据清洗,以得到有效的驾驶员图像。
3)模型训练。将一张驾驶员图像输入至模型中,假设该驾驶员图像对应的面部识别标签为“脸色通红”,则不断调整模型中的各个模型参数,使其输出的结果也为“脸色通红”,以此类推,待所有驾驶员图像训练完成后完成对面部表情识别模型的训练,也就是说,训练完成后的面部表情识别模型中的各个模型参数是确定的。
在一些实施方式中,可以将训练后的面部表情识别模型存储于区块链节点中。
本申请实施例还提供了一种基于人工智能的酒驾检测装置,如图4所示,该装置包括:图片接收模块、信息确定模块以及酒驾检测模块。
其中,图片接收模块,用于当车辆经过卡口电警时,接收所述卡口电警发送的车辆图片。
信息确定模块,用于根据所述车辆图片确定所述车辆的车辆状态信息、过车时空信息以及所述车辆中驾驶员的驾驶员图像,并将所述驾驶员图像输入至面部表情识别模型中,得到所述驾驶员的面部表情标签,其中,所述面部表情识别模型为预先根据训练图像集与若干面部表情标签之间的对应关系训练得到的。
酒驾检测模块,用于根据所述车辆状态信息、所述过车时空信息以及所述驾驶员的面部表情标签得到多维向量,并将所述多维向量输入至XgBoost模型中,以确定所述驾驶员是否存在酒驾行为。
在一些实施方式中,信息确定模块,还用于根据所述车辆图片确定所述车辆的车牌号码,并根据所述车牌号码从数据库中获取对应所述车牌号码的行驶信息作为所述车辆的车辆状态信息,其中,所述车辆状态信息用于表征所述车辆当前的行驶状态。
在一些实施方式中,信息确定模块,还用于将所述车辆图片中存储的拍摄地点信息以及拍摄时间信息作为所述车辆的过车时空信息,其中,所述过车时空信息为所述车辆经过所述卡口电警的时间信息与空间信息。
在一些实施方式中,信息确定模块,还用于将所述驾驶员图像处理为预设尺寸大小的图像;将处理后的驾驶员图像输入至所述面部表情识别模型的特征提取层中,以得到相应的面部特征;将所述面部特征输入至所述面部表情识别模型的特征修正层中,以修正所述面部特征;将修正后的面部特征输入至所述面部表情识别模型的概率计算层中,以计算出所述面部特征相对每个面部表情标签的概率值,并将概率值最大的面部表情标签作为所述驾驶员的面部表情标签。
在一些实施方式中,酒驾检测模块,还用于基于预设的特征处理规则,分别将所述车辆状态信息、所述过车时空信息以及所述驾驶员的面部表情标签进行特征处理,得到多个子特征;将所述多个子特征进行拼接,得到多维向量。
在一些实施方式中,酒驾检测模块,还用于将所述多维向量输入至XgBoost模型中,得到所述驾驶员相对酒驾的概率值;若所述概率值超过预设阈值,则确定所述驾驶员存在酒驾行为,若所述概率值没有超过预设阈值,则确定所述驾驶员不存在酒驾行为。
在一些实施方式中,该装置还包括酒驾记录模块,该酒驾记录模块,用于当确定所述驾驶员存在酒驾行为时,记录相应的酒驾信息。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图5所示的服务器上运行。
本申请实施例还提供了一种服务器,如图5所示,该服务器包括处理器与存储器,所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现本申请实施例提供的任一项基于人工智能的酒驾检测方法。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,使所述处理器实现本发明实施例提供的任一项基于人工智能的酒驾检测方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读存储介质上,计算机可读存储介质可以包括计算机可读存储介质(或非暂时性介质)和通信介质(或暂时性介质)。
如本领域普通技术人员公知的,术语计算机可读存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机可读存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
示例性的,所述计算机可读存储介质可以是前述实施例所述的服务器的内部存储单元,例如所述服务器的硬盘或内存。所述计算机可读存储介质也可以是所述服务器的外部存储设备,例如所述服务器上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于人工智能的酒驾检测方法,其特征在于,包括:
当车辆经过卡口电警时,接收所述卡口电警发送的车辆图片,根据所述车辆图片确定所述车辆的车辆状态信息、过车时空信息以及所述车辆中驾驶员的驾驶员图像;
将所述驾驶员图像输入至面部表情识别模型中,得到所述驾驶员的面部表情标签,其中,所述面部表情识别模型为预先根据训练图像集与若干面部表情标签之间的对应关系训练得到的;
根据所述车辆状态信息、所述过车时空信息以及所述驾驶员的面部表情标签得到多维向量,并将所述多维向量输入至XgBoost模型中,以确定所述驾驶员是否存在酒驾行为。
2.根据权利要求1所述的方法,其特征在于,所述根据所述车辆图片确定所述车辆的车辆状态信息,包括:
根据所述车辆图片确定所述车辆的车牌号码,并根据所述车牌号码从数据库中获取对应所述车牌号码的行驶信息作为所述车辆的车辆状态信息,其中,所述车辆状态信息用于表征所述车辆当前的行驶状态。
3.根据权利要求1所述的方法,其特征在于,所述根据所述车辆图片确定所述车辆的过车时空信息,包括:
将所述车辆图片中存储的拍摄地点信息以及拍摄时间信息作为所述车辆的过车时空信息,其中,所述过车时空信息为所述车辆经过所述卡口电警的时间信息与空间信息。
4.根据权利要求1所述的方法,其特征在于,所述将所述驾驶员图像输入至面部表情识别模型中,得到所述驾驶员的面部表情标签,包括:
将所述驾驶员图像处理为预设尺寸大小的图像;
将处理后的驾驶员图像输入至所述面部表情识别模型的特征提取层中,以得到相应的面部特征;
将所述面部特征输入至所述面部表情识别模型的特征修正层中,以修正所述面部特征;
将修正后的面部特征输入至所述面部表情识别模型的概率计算层中,以计算出所述面部特征相对每个面部表情标签的概率值,并将概率值最大的面部表情标签作为所述驾驶员的面部表情标签。
5.根据权利要求1所述的方法,其特征在于,所述根据所述车辆状态信息、所述过车时空信息以及所述驾驶员的面部表情标签得到多维向量,包括:
基于预设的特征处理规则,分别将所述车辆状态信息、所述过车时空信息以及所述驾驶员的面部表情标签进行特征处理,得到多个子特征;
将所述多个子特征进行拼接,得到多维向量。
6.根据权利要求1所述的方法,其特征在于,所述将所述多维向量输入至XgBoost模型中,以确定所述驾驶员是否存在酒驾行为,包括:
将所述多维向量输入至XgBoost模型中,得到所述驾驶员相对酒驾的概率值;
若所述概率值超过预设阈值,则确定所述驾驶员存在酒驾行为,若所述概率值没有超过预设阈值,则确定所述驾驶员不存在酒驾行为。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
当确定所述驾驶员存在酒驾行为时,记录相应的酒驾信息。
8.一种基于人工智能的酒驾检测装置,其特征在于,包括:
图片接收模块,用于当车辆经过卡口电警时,接收所述卡口电警发送的车辆图片;
信息确定模块,用于根据所述车辆图片确定所述车辆的车辆状态信息、过车时空信息以及所述车辆中驾驶员的驾驶员图像,并将所述驾驶员图像输入至面部表情识别模型中,得到所述驾驶员的面部表情标签,其中,所述面部表情识别模型为预先根据训练图像集与若干面部表情标签之间的对应关系训练得到的;
酒驾检测模块,用于根据所述车辆状态信息、所述过车时空信息以及所述驾驶员的面部表情标签得到多维向量,并将所述多维向量输入至XgBoost模型中,以确定所述驾驶员是否存在酒驾行为。
9.一种服务器,其特征在于,包括处理器与存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7中任一项所述的基于人工智能的酒驾检测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的基于人工智能的酒驾检测方法。
CN202011511944.7A 2020-12-18 2020-12-18 基于人工智能的酒驾检测方法、装置、服务器及存储介质 Pending CN112560714A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011511944.7A CN112560714A (zh) 2020-12-18 2020-12-18 基于人工智能的酒驾检测方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011511944.7A CN112560714A (zh) 2020-12-18 2020-12-18 基于人工智能的酒驾检测方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN112560714A true CN112560714A (zh) 2021-03-26

Family

ID=75030609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011511944.7A Pending CN112560714A (zh) 2020-12-18 2020-12-18 基于人工智能的酒驾检测方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN112560714A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112561175A (zh) * 2020-12-18 2021-03-26 深圳赛安特技术服务有限公司 交通事故影响因子预测方法、装置、设备及存储介质
CN113326455A (zh) * 2021-05-08 2021-08-31 海南拍拍看信息技术有限公司 一种酒类产品的代驾防伪/追溯方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112561175A (zh) * 2020-12-18 2021-03-26 深圳赛安特技术服务有限公司 交通事故影响因子预测方法、装置、设备及存储介质
CN113326455A (zh) * 2021-05-08 2021-08-31 海南拍拍看信息技术有限公司 一种酒类产品的代驾防伪/追溯方法

Similar Documents

Publication Publication Date Title
CN111274881A (zh) 驾驶安全的监控方法、装置、计算机设备及存储介质
CN108268867B (zh) 一种车牌定位方法及装置
WO2021184570A1 (zh) 电动自行车驾驶行为的识别方法、装置和计算机设备
CN112560714A (zh) 基于人工智能的酒驾检测方法、装置、服务器及存储介质
WO2020258077A1 (zh) 一种行人检测方法及装置
US10607100B2 (en) Device for recognizing vehicle license plate number and method therefor
CN114495060B (zh) 一种道路交通标线识别方法及装置
Sayeed et al. Bangladeshi Traffic Sign Recognition and Classification using CNN with Different Kinds of Transfer Learning through a new (BTSRB) Dataset
CN112861567A (zh) 一种车型分类方法及装置
CN113160272B (zh) 目标跟踪方法、装置、电子设备及存储介质
CN113593256B (zh) 基于城市管理的无人机智能驱离控制方法、系统及云平台
CN112950961B (zh) 车流量统计方法、装置、设备和存储介质
CN111507380B (zh) 基于聚类的图片分类方法、系统、装置及存储介质
CN114283361A (zh) 状态信息的确定方法和装置、存储介质及电子装置
CN113221907A (zh) 一种车辆部件分割方法、装置、设备及存储介质
CN112101279B (zh) 目标物异常检测方法、装置、电子设备及存储介质
CN112614347B (zh) 套牌检测方法、装置、计算机设备及存储介质
CN113537087A (zh) 一种智慧交通信息处理方法、装置及服务器
CN110674820A (zh) 一种基于卷积神经网络的车牌校准识别方法、系统及电子设备
CN112861711A (zh) 区域入侵检测方法、装置、电子设备及存储介质
CN112906495B (zh) 一种目标检测方法、装置、电子设备及存储介质
CN114495061B (zh) 一种道路交通标志牌识别方法及装置
CN115861624B (zh) 摄像头被遮挡的检测方法、装置、设备及存储介质
CN117037502B (zh) 车辆处理信息生成方法、装置、设备和计算机可读介质
CN114332706A (zh) 目标事件的确定方法、装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination