CN113486856B - 一种驾驶员不规范行为检测方法 - Google Patents

一种驾驶员不规范行为检测方法 Download PDF

Info

Publication number
CN113486856B
CN113486856B CN202110875753.7A CN202110875753A CN113486856B CN 113486856 B CN113486856 B CN 113486856B CN 202110875753 A CN202110875753 A CN 202110875753A CN 113486856 B CN113486856 B CN 113486856B
Authority
CN
China
Prior art keywords
network model
image
training
driver
semantic segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110875753.7A
Other languages
English (en)
Other versions
CN113486856A (zh
Inventor
郝立颖
杨正凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN202110875753.7A priority Critical patent/CN113486856B/zh
Publication of CN113486856A publication Critical patent/CN113486856A/zh
Application granted granted Critical
Publication of CN113486856B publication Critical patent/CN113486856B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种基于语义分割和卷积神经网络的驾驶员不规范行为检测方法,包括构建语义分割网络模型;获取instance‑level_human_parsing数据集,对构建的语义分割网络模型进行训练;利用训练后的语义分割网络模型预测state farm distracted driver detection数据集中的每一张图像;对预测后的state farm distracted driver detection数据集中的每一张图像进行面部定位,并裁剪图片,重新定义图像尺寸;对预测后的state farm distracted driver detection数据集进行数据扩充;构建卷积神经网络模型;将数据扩充后的数据集分为训练集、验证集和测试集,并将训练集和验证集送入卷积神经网络模型中进行训练;利用训练后的卷积神经网络模型对测试集进行预测,输出识别结果图像。本发明解决现有技术在检测驾驶员的行为时往往表现不佳,不能准确检测驾驶员的行为的问题。

Description

一种驾驶员不规范行为检测方法
技术领域
本发明涉及智能交通技术领域,具体而言,尤其涉及一种基于语义分割和卷积神经网络的驾驶员不规范行为检测方法。
背景技术
复杂环境场景下的驾驶员检测就是要从实际的交通环境场景下,对图像内的驾驶员进行检测并准确识别出其行为。通过建立深度神经网络模型并利用完整的数据集进行训练,使其能够适应各种复杂的实际环境。Maitree Leekha等人提出了使用图割算法来对state farm distracted driver detection数据集中的驾驶员进行分割处理,但是在一些特定的光线角度影响下,并不能更好的将驾驶员分割出来。
在实际驾驶员驾车时,驾驶员的行为较多,检测麻烦,现有技术在检测驾驶员的行为时往往表现不佳,不能准确地将检测驾驶员的行为。
发明内容
根据上述提出的技术问题,提供一种基于语义分割和卷积神经网络的驾驶员不规范行为检测方法。
本发明采用的技术手段如下:
一种基于语义分割和卷积神经网络的驾驶员不规范行为检测方法,包括如下步骤:
S1、构建语义分割网络模型;
S2、获取crowd instance-level_human_parsing数据集,对构建的语义分割网络模型进行训练;
S3、利用训练后的语义分割网络模型,预测state farm distracted driverdetection数据集中的每一张图像;
S4、对预测后的state farm distracted driver detection数据集中的每一张图像进行面部定位,并裁剪图片,重新定义图像尺寸;
S5、对预测后的state farm distracted driver detection数据集进行数据扩充;
S6、构建卷积神经网络模型;
S7、将经过数据扩充后的state farm distracted driver detection数据集分为训练集、验证集和测试集,并将训练集和验证集送入卷积神经网络模型中进行训练;
S8、利用训练后的卷积神经网络模型,对所述测试集进行预测,输出识别结果图像。
进一步地,所述步骤S1中,构建的语义分割网络模型包括编码器单元和解码器单元;
编码器单元包括Res2Net50网络和Transformer网络,Res2Net50网络和Transformer网络对输入图像进行特征提取,得到下采样特征图和特征块;
解码器单元包括上采样模块和Coordinate Attention机制,特征块重塑尺寸后合并编码器单元的下采样特征图,上采样模块和Coordinate Attention机制对合并后的特征图中的特征进行聚集,再进行上采样操作,依次类推,直到获取图像的大小。
进一步地,所述Res2Net50网络用于融合特征图中不同尺度的信息,提取特征图中的全局和局部信息;所述Transformer网络用于捕捉特征图中的长距离信息,以获取更有效的特征块;所述Coordinate Attention机制用于多特征图中感兴趣的物体进行定位聚焦。
进一步地,所述步骤S2对语义分割网络模型进行训练的训练批次设置为N个,N大于等于30,且训练的输入图片大小为512*512,训练后的输出图片大小为512*512。
进一步地,所述步骤S3的具体实现过程如下:
加载训练后的语义分割网络模型;
加载state farm distracted driver detection数据集中的每一张图像;
将state farm distracted driver detection数据集中的每一张图像裁剪成大小为512*512的图片;
将裁减后的每一张图像送入语义分割网络模型中进行预测,输出大小为512*512的预测图像。
进一步地,所述步骤S4中,重新定义的图像尺寸为256*256。
进一步地,所述步骤S5中,对state farm distracted driver detection数据集进行数据扩充的方式,包括:
根据实际情况选择旋转、平移、缩放、随机遮挡、水平翻转、颜色色差和噪声扰动操作。
进一步地,所述步骤S6中,构建的卷积神经网络模型包括卷积层、最大池化层、全连接层以及输出层;
所述卷积层用于对输入数据进行特征提取;
所述最大池化层连接在卷积层之后,用于进行特征选择和信息过滤;
所述全连接层连接在最后一个最大池化层之后,用于对提取的特征进行非线性组合以得到输出;
所述输出层连接在全连接层之后,用于使用逻辑函数或归一化指数函数softmaxfunction输出分类标签。
进一步地,所述步骤S7中,将经过数据扩充后的state farm distracted driverdetection数据集分为训练集、验证集和测试集,具体包括:
将经过数据扩充后的state farm distracted driver detection数据集中的60%作为训练集;
将经过数据扩充后的state farm distracted driver detection数据集剩下的40%中的20%作为验证集;
将经过数据扩充后的state farm distracted driver detection数据集中剩下的20%作为测试集。
进一步地,所述步骤S8的具体实现过程如下:
加载训练后的卷积神经网络模型;
加载测试集中的每一张图像;
将测试集中的每一张图像送入卷积神经网络模型中进行预测,得到每一个类别的图像。
较现有技术相比,本发明具有以下优点:
1、本发明提供的基于语义分割和卷积神经网络的驾驶员不规范行为检测方法,采用语义分割模型对数据集进行处理,使得数据集中的司机被分割出来。
2、本发明提供的基于语义分割和卷积神经网络的驾驶员不规范行为检测方法,并没有直接使用神经网络中常用的大型分类网络,而是采用了自己搭建的小型分类网络,大大提高了神经网络在复杂环境下识别司机行为检测的准确性。
3、本发明提供的基于语义分割和卷积神经网络的驾驶员不规范行为检测方法,基于语义分割网络和卷积分类网络共同去检测司机行为,进一步提高了检测准确性。
基于上述理由本发明可在智能交通等领域广泛推广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图。
图2为本发明实施例提供的语义分割网络模型结构示意图。
图3为本发明实施例提供的利用语义分割网络模型预测后的效果图。
图4为本发明实施例提供的面部定位和裁减的效果图。
图5为本发明实施例提供的state farm distracted driver detection数据集的各类数量图。
图6为本发明实施例提供的卷积神经网络模型结构示意图。
图7为本发明实施例提供的是否使用语义分割网络对数据集处理的识别结果对比图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,本发明提供了一种基于语义分割和卷积神经网络的驾驶员不规范行为检测方法,包括如下步骤:
S1、构建语义分割网络模型;
S2、获取crowd instance-level_human_parsing数据集,对构建的语义分割网络模型进行训练;
S3、利用训练后的语义分割网络模型,预测state farm distracted driverdetection数据集中的每一张图像;
S4、对预测后的state farm distracted driver detection数据集中的每一张图像进行面部定位,并裁剪图片,重新定义图像尺寸;
S5、对预测后的state farm distracted driver detection数据集进行数据扩充;
S6、构建卷积神经网络模型;
S7、将经过数据扩充后的state farm distracted driver detection数据集分为训练集、验证集和测试集,并将训练集和验证集送入卷积神经网络模型中进行训练;
S8、利用训练后的卷积神经网络模型,对所述测试集进行预测,输出识别结果图像。
具体实施时,作为本发明优选的实施方式,如图2所示,所述步骤S1中,构建的语义分割网络模型包括编码器单元和解码器单元;
编码器单元包括Res2Net50网络和Transformer网络,Res2Net50网络和Transformer网络对输入图像进行特征提取,得到下采样特征图和特征块;其中,所述Res2Net50网络用于融合特征图中不同尺度的信息,提取特征图中的全局和局部信息;所述Transformer网络用于捕捉特征图中的长距离信息,以获取更有效的特征块;
解码器单元包括上采样模块和Coordinate Attention机制,特征块重塑尺寸后合并编码器单元的下采样特征图,上采样模块和Coordinate Attention机制对合并后的特征图中的特征进行聚集,再进行上采样操作,依次类推,直到获取图像的大小。其中,所述Coordinate Attention机制用于多特征图中感兴趣的物体进行定位聚焦。
具体实施时,作为本发明优选的实施方式,所述步骤S2对语义分割网络模型进行训练的训练批次设置为N个,N大于等于30,且训练的输入图片大小为512*512,训练后的输出图片大小为512*512。在本实施例中,一共训练30个批次。
具体实施时,作为本发明优选的实施方式,所述步骤S3的具体实现过程如下:
加载训练后的语义分割网络模型;
加载state farm distracted driver detection数据集中的每一张图像;
将state farm distracted driver detection数据集中的每一张图像裁剪成大小为512*512的图片;
将裁减后的每一张图像送入语义分割网络模型中进行预测,输出大小为512*512的预测图像,如图3所示。
具体实施时,作为本发明优选的实施方式,所述步骤S4中,由于在state farmdistracted driver detection数据集中,一些图像中的司机会有靠前或者靠后的情况,如果直接用固定尺寸裁剪,会出现将图像中的司机信息给裁剪了。通过定位图像中的面部部分,从而去灵活的裁剪图片,不仅可以保留图像中的有用信息还可以裁剪掉图像中无用的部分。还原图像中原有的信息,输出的图像大小为256*256。效果图如图4所示。
具体实施时,作为本发明优选的实施方式,所述步骤S5中,对state farmdistracted driver detection数据集进行数据扩充的方式,包括:
根据实际情况选择旋转、平移、缩放、随机遮挡、水平翻转、颜色色差和噪声扰动操作。
在本实施例中,数据集中一共包含26个司机共79726张图片,其中训练集有22425张图片。包含10个状态,10个状态如下表所示:
训练集中各类别包含的图片数量如图5所示。为了训练泛化能力强的模型,最好是使用大量的数据进行训练,这样模型就能从样本中的差异中得到更好的泛化能力,避免过拟合的情况发生。但是在实际中,由于训练的样本有限,本次的训练数据也只有2万张图像,用来训练还是不太够。为了解决这个问题,使用数据增强的方法。本实施例中,采用颜色色差方法。分别包括亮度增强、对比度增强、锐度增强和色度增强四种颜色色差方法。为了满足随机性,在训练集中的每一个类别中随机挑选出一些图像进行上述的四种操作。通过对训练集的扩充使得每一个类别的数量都是2500张图像。
具体实施时,作为本发明优选的实施方式,如图6所示,所述步骤S6中,构建的卷积神经网络模型包括卷积层、最大池化层、全连接层以及输出层;
所述卷积层用于对输入数据进行特征提取;
所述最大池化层连接在卷积层之后,用于进行特征选择和信息过滤;
所述全连接层连接在最后一个最大池化层之后,用于对提取的特征进行非线性组合以得到输出;
所述输出层连接在全连接层之后,用于使用逻辑函数或归一化指数函数softmaxfunction输出分类标签。
具体实施时,作为本发明优选的实施方式,所述步骤S7中,将经过数据扩充后的state farm distracted driver detection数据集分为训练集、验证集和测试集,具体包括:
将经过数据扩充后的state farm distracted driver detection数据集中的60%作为训练集;
将经过数据扩充后的state farm distracted driver detection数据集剩下的40%中的20%作为验证集;
将经过数据扩充后的state farm distracted driver detection数据集中剩下的20%作为测试集。
具体实施时,作为本发明优选的实施方式,所述步骤S8的具体实现过程如下:
加载训练后的卷积神经网络模型;
加载测试集中的每一张图像;
将测试集中的每一张图像送入卷积神经网络模型中进行预测,得到每一个类别的图像。识别的结果如图7所示。每一个类别的图像都有50张。
如图7所示是本实施例中是否使用语义分割网络对state farm distracteddriver detection数据集处理的识别结果对比图,从图中可以很明显地看出使用语义分割网络对state farm distracted driver detection数据集处理后,分类检测模型具有更好的检测性能,从而大大提高了复杂环境场景下驾驶员不规范行为的检测能力。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (8)

1.一种驾驶员不规范行为检测方法,其特征在于,包括如下步骤:
S1、构建语义分割网络模型,构建的语义分割网络模型包括编码器单元和解码器单元;
编码器单元包括Res2Net50网络和Transformer网络,Res2Net50网络和Transformer网络对输入图像进行特征提取,得到下采样特征图和特征块;所述Res2Net50网络用于融合特征图中不同尺度的信息,提取特征图中的全局和局部信息;所述Transformer网络用于捕捉特征图中的长距离信息,以获取特征块;
解码器单元包括上采样模块和Coordinate Attention机制,特征块重塑尺寸后合并编码器单元的下采样特征图,上采样模块和Coordinate Attention机制对合并后的特征图中的特征进行聚集,再进行上采样操作,依次类推,直到获取图像的大小;所述CoordinateAttention机制用于多特征图中感兴趣的物体进行定位聚焦;
S2、获取crowd instance-level_human_parsing数据集,对构建的语义分割网络模型进行训练;
S3、利用训练后的语义分割网络模型,预测state farm distracted driverdetection数据集中的每一张图像;
S4、对预测后的state farm distracted driver detection数据集中的每一张图像进行面部定位,并裁剪图片,重新定义图像尺寸;
S5、对预测后的state farm distracted driver detection数据集进行数据扩充;
S6、构建卷积神经网络模型;
S7、将经过数据扩充后的state farm distracted driver detection数据集分为训练集、验证集和测试集,并将训练集和验证集送入卷积神经网络模型中进行训练;
S8、利用训练后的卷积神经网络模型,对所述测试集进行预测,输出识别结果图像。
2.根据权利要求1所述的驾驶员不规范行为检测方法,其特征在于,所述步骤S2对语义分割网络模型进行训练的训练批次设置为N个,N大于等于30,且训练的输入图片大小为512*512,训练后的输出图片大小为512*512。
3.根据权利要求1所述的驾驶员不规范行为检测方法,其特征在于,所述步骤S3的具体实现过程如下:
加载训练后的语义分割网络模型;
加载state farm distracted driver detection数据集中的每一张图像;
将state farm distracted driver detection数据集中的每一张图像裁剪成大小为512*512的图片;
将裁剪后的每一张图像送入语义分割网络模型中进行预测,输出大小为512*512的预测图像。
4.根据权利要求1所述的驾驶员不规范行为检测方法,其特征在于,所述步骤S4中,重新定义的图像尺寸为256*256。
5.根据权利要求1所述的驾驶员不规范行为检测方法,其特征在于,所述步骤S5中,对预测后的state farm distracted driver detection数据集进行数据扩充的方式,包括:
根据实际情况选择旋转、平移、缩放、随机遮挡、水平翻转、颜色色差和噪声扰动操作。
6.根据权利要求1所述的驾驶员不规范行为检测方法,其特征在于,所述步骤S6中,构建的卷积神经网络模型包括卷积层、最大池化层、全连接层以及输出层;
所述卷积层用于对输入数据进行特征提取;
所述最大池化层连接在卷积层之后,用于进行特征选择和信息过滤;
所述全连接层连接在最后一个最大池化层之后,用于对提取的特征进行非线性组合以得到输出;
所述输出层连接在全连接层之后,用于使用逻辑函数或归一化指数函数softmaxfunction输出分类标签。
7.根据权利要求1所述的驾驶员不规范行为检测方法,其特征在于,所述步骤S7中,将经过数据扩充后的state farm distracted driver detection数据集分为训练集、验证集和测试集,具体包括:
将经过数据扩充后的state farm distracted driver detection数据集中的60%作为训练集;
将经过数据扩充后的state farm distracted driver detection数据集剩下的40%中的20%作为验证集;
将经过数据扩充后的state farm distracted driver detection数据集中剩下的20%作为测试集。
8.根据权利要求1所述的驾驶员不规范行为检测方法,其特征在于,所述步骤S8的具体实现过程如下:
加载训练后的卷积神经网络模型;
加载测试集中的每一张图像;
将测试集中的每一张图像送入卷积神经网络模型中进行预测,得到每一个类别的图像。
CN202110875753.7A 2021-07-30 2021-07-30 一种驾驶员不规范行为检测方法 Active CN113486856B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110875753.7A CN113486856B (zh) 2021-07-30 2021-07-30 一种驾驶员不规范行为检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110875753.7A CN113486856B (zh) 2021-07-30 2021-07-30 一种驾驶员不规范行为检测方法

Publications (2)

Publication Number Publication Date
CN113486856A CN113486856A (zh) 2021-10-08
CN113486856B true CN113486856B (zh) 2024-01-02

Family

ID=77944909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110875753.7A Active CN113486856B (zh) 2021-07-30 2021-07-30 一种驾驶员不规范行为检测方法

Country Status (1)

Country Link
CN (1) CN113486856B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114445748A (zh) * 2022-01-28 2022-05-06 深圳市中云慧通科技有限公司 一种视频人体特征检测、联动告警方法及存储介质
CN114419381B (zh) * 2022-04-01 2022-06-24 城云科技(中国)有限公司 一种语义分割方法及应用其的道路积水检测方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543502A (zh) * 2018-09-27 2019-03-29 天津大学 一种基于深度多尺度神经网络的语义分割方法
US10467500B1 (en) * 2018-12-31 2019-11-05 Didi Research America, Llc Method and system for semantic segmentation involving multi-task convolutional neural network
CN111178272A (zh) * 2019-12-30 2020-05-19 东软集团(北京)有限公司 一种识别驾驶员行为的方法、装置及设备
CN111275711A (zh) * 2020-01-08 2020-06-12 西安电子科技大学 基于轻量级卷积神经网络模型的实时图像语义分割方法
CN111292330A (zh) * 2020-02-07 2020-06-16 北京工业大学 基于编解码器的图像语义分割方法及装置
WO2020215236A1 (zh) * 2019-04-24 2020-10-29 哈尔滨工业大学(深圳) 图像语义分割方法和系统
CN112634276A (zh) * 2020-12-08 2021-04-09 西安理工大学 一种基于多尺度视觉特征提取的轻量级语义分割方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543502A (zh) * 2018-09-27 2019-03-29 天津大学 一种基于深度多尺度神经网络的语义分割方法
US10467500B1 (en) * 2018-12-31 2019-11-05 Didi Research America, Llc Method and system for semantic segmentation involving multi-task convolutional neural network
WO2020215236A1 (zh) * 2019-04-24 2020-10-29 哈尔滨工业大学(深圳) 图像语义分割方法和系统
CN111178272A (zh) * 2019-12-30 2020-05-19 东软集团(北京)有限公司 一种识别驾驶员行为的方法、装置及设备
CN111275711A (zh) * 2020-01-08 2020-06-12 西安电子科技大学 基于轻量级卷积神经网络模型的实时图像语义分割方法
CN111292330A (zh) * 2020-02-07 2020-06-16 北京工业大学 基于编解码器的图像语义分割方法及装置
CN112634276A (zh) * 2020-12-08 2021-04-09 西安理工大学 一种基于多尺度视觉特征提取的轻量级语义分割方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于图像分割的驾驶员分心行为识别研究;叶绿等;浙江科技学院学报;第32卷(第03期);第209-215页 *

Also Published As

Publication number Publication date
CN113486856A (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN112132156B (zh) 多深度特征融合的图像显著性目标检测方法及系统
CN111080628B (zh) 图像篡改检测方法、装置、计算机设备和存储介质
CN112560999B (zh) 一种目标检测模型训练方法、装置、电子设备及存储介质
CN111681273B (zh) 图像分割方法、装置、电子设备及可读存储介质
CN111080660B (zh) 一种图像分割方法、装置、终端设备及存储介质
US11651477B2 (en) Generating an image mask for a digital image by utilizing a multi-branch masking pipeline with neural networks
CN113486856B (zh) 一种驾驶员不规范行为检测方法
US11393100B2 (en) Automatically generating a trimap segmentation for a digital image by utilizing a trimap generation neural network
CN111369581A (zh) 图像处理方法、装置、设备及存储介质
CN112329702B (zh) 一种快速人脸密度预测和人脸检测方法、装置、电子设备及存储介质
CN110781980B (zh) 目标检测模型的训练方法、目标检测方法及装置
CN110909598B (zh) 一种基于深度学习的非机动车道交通违法行驶识别方法
CN112906794A (zh) 一种目标检测方法、装置、存储介质及终端
CN110689134A (zh) 执行机器学习过程的方法、装置、设备以及存储介质
CN110991414B (zh) 一种交通要素高精度分割方法、电子设备及存储介质
CN111062347B (zh) 一种自动驾驶中交通要素分割方法、电子设备及存储介质
CN115376089A (zh) 一种基于深度学习的车道线检测方法
CN114005019B (zh) 一种翻拍图像识别方法及其相关设备
CN114898269A (zh) 基于眼部特征和人脸特点实现深度伪造融合检测的系统、方法、装置、处理器及其存储介质
CN114241432A (zh) 车牌识别方法、设备及存储介质
CN110119736B (zh) 车牌位置识别方法、装置及电子设备
CN112396060A (zh) 基于身份证分割模型的身份证识别方法及其相关设备
CN112434585A (zh) 一种车道线的虚实识别方法、系统、电子设备及存储介质
CN116824135A (zh) 基于机器视觉的大气自然环境试验工业产品识别分割方法
CN113221818B (zh) 一种海面溢油特征智能检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant