CN117893413B

CN117893413B - 基于图像增强的车载终端人机交互方法

Info

Publication number: CN117893413B
Application number: CN202410298481.2A
Authority: CN
Inventors: 陶伟; 潘嗣南; 李晓虎; 王新元; 李晨
Original assignee: Bochuang Linkage Technology Co ltd
Current assignee: Bochuang Linkage Technology Co ltd
Filing date: 2024-03-15
Publication date: 2024-06-11
Anticipated expiration: 2044-03-15

Abstract

本发明公开了基于图像增强的车载终端人机交互方法，方法包括数据采集、数据预处理、建立图像增强模型、设计图像增强损失函数、设置图像增强模型超参数和建立指令识别模型。本发明属于图像处理技术领域，具体是指基于图像增强的车载终端人机交互方法，本方案通过构建亮度校正编码器动态调整图像的亮度；构建剩余通道注意力模块捕捉通道的重要性，并自适应地校准通道的权重；构建高频补充解码器补充编码过程中丢失的高频细节；基于感知损失函数促使生成图像匹配真实图像的内容和结构；保真度损失通过使用L1范数约束像素之间的差异；基于循环映射的混沌方法初始化搜索种群，通过设计个体适应度值权重和搜索策略，引入精英学习策略。

Description

基于图像增强的车载终端人机交互方法

技术领域

本发明涉及图像处理技术领域，具体是指基于图像增强的车载终端人机交互方法。

背景技术

随着智能汽车的快速发展，车载终端人机交互技术受到越来越多的关注。传统的车载终端人机交互方式主要通过物理按钮、触控屏幕等方式进行操作，但这些方式存在操作不便、视觉疲劳、安全性不高等问题。因此，基于图像增强的车载终端人机交互方法应运而生。但是一般人机交互模型存在采集原始图像不佳，图像增强模型对视觉质量及细节保留能力弱，以及图像还原能力差的问题；一般人机交互模型在图像增强方面存在损失函数无法适应图像的多样性导致图像感知质量差的问题；一般模型存在超参数设置不当，超参数搜索方法搜索灵活性差，鲁棒性低的问题。

发明内容

针对上述情况，为克服现有技术的缺陷，本发明提供了基于图像增强的车载终端人机交互方法，针对一般人机交互模型存在采集原始图像不佳，图像增强模型对视觉质量及细节保留能力弱，以及图像还原能力差的问题，本方案通过构建亮度校正编码器动态调整图像的亮度，以增强图像的光照效果；构建剩余通道注意力模块捕捉通道的重要性，并自适应地校准通道的权重；构建高频补充解码器通过低通滤波器、特征融合和上采样操作，补充编码过程中丢失的高频细节，从而提高图像的细节保留和还原能力；通过多尺度统计特征鉴别器，对生成的增强图像进行质量评估和鉴别；针对一般人机交互模型在图像增强方面存在损失函数无法适应图像的多样性导致图像感知质量差的问题，本方案通过将传统对抗损失与多尺度统计特征区分分支相结合，提高了对真实样本和生成样本的区分度，有助于提高生成图像的质量和逼真度；基于感知损失函数促使生成图像更好地匹配真实图像的内容和结构；保真度损失通过使用L1范数约束像素之间的差异，有效减少生成图像和真实图像之间的细节差异，从而提高图像的保真度和细节保持性；针对一般模型存在超参数设置不当，超参数搜索方法搜索灵活性差，鲁棒性低的问题，本方案基于循环映射的混沌方法初始化搜索种群，通过设计个体适应度值权重和搜索策略，引入精英学习策略，逐步提高种群的整体适应度，更好地探索搜索空间增加找到更优解的机会。

本发明采取的技术方案如下：本发明提供的基于图像增强的车载终端人机交互方法，该方法包括以下步骤：

步骤S1：数据采集；

步骤S2：数据预处理；

步骤S3：建立图像增强模型；

步骤S4：设计图像增强损失函数；

步骤S5：设置图像增强模型超参数；

步骤S6：建立指令识别模型。

进一步地，在步骤S1中，所述数据采集是采集车主指令图像数据。

进一步地，在步骤S2中，所述数据预处理是对采集的数据进行数据清洗、图像预处理、图像标注和数据集划分；所述数据清洗是对重复、缺失和错误的图像数据去除；所述图像预处理是将图像数据准备为统一的格式和质量；所述图像标注是对图像标注用户指令标签；所述数据集划分是将图像数据划分为训练集和测试集。

进一步地，在步骤S3中，所述建立图像增强模型具体包括以下步骤：

步骤S31：构建核心属性增强生成器，核心属性增强生成器包括亮度校正编码器、剩余通道注意力模块和高频补充解码器；亮度校正编码器的设计是基于局部差异动态调整亮度，以增强光照效果；剩余通道注意力模块在增强图像的同时捕捉通道的重要性，旨在提高通道映射特征的能力；在图像重建过程中，高频补充解码器补充了编码过程中丢失的高频细节；具体包括：

步骤S311：构建亮度校正编码器，亮度校正编码器由先验照明分支和特征提取分支两个分支组成；特征提取分支通过逐步降采样提取输入内容特征，并融合来自先验照明分支的亮度信息；包括：

步骤S3111：首先将RGB彩色图像转换为灰度空间，以反映整体和局部亮度级别的分布，每个图像点的亮度级别用不同饱和度的黑色表示；过程描述如下：

；

式中，[x^R,x^G,x^B]表示输出图像在RGB颜色空间中的颜色信号，表示归一化结果；x^gray表示灰度图像；

步骤S3112：将亮度权重参数连续下采样，获得一组亮度权重堆栈x^lum，x^lum包含四组不同尺寸的亮度权重，分别为1×256×256、1×128×28、1×64×64和1×32×32；在提取内容特征之前，x和被连接并输入到特征提取分支；表示如下：

；

式中，是第一个亮度权重参数；/>和/>分别是第i+1个和第i个亮度权重参数；/>是下采样操作；

步骤S3113：将亮度权重堆栈与内容特征进行完全融合，表示如下：

；

式中，F_i是第i层的内容特征；E_i和E_i+1分别是第i层和第i+1层内容特征对应的亮度权重；是完全融合操作；/>是逐元素相乘；

步骤S312：构建残差通道注意力模块，基于残差通道注意力模块获取全局信息，在全局特征图的不同区域应用不同的注意力，并自适应地校准通道的权重；通过全局最大池化和全局平均池化计算通道间的依赖关系，并基于全连接层操作将依赖关系映射为大小为256×1×1的权重向量；然后向量在宽度和高度上扩展到256×32×32的大小；特征图F₄和相应的权重进行相乘，以获得校准后的特征图；过程描述如下：

；

式中，F₄是由残差通道注意力模块提取的特征图；pool(·)是全局最大池化和全局平均池化的组合操作；fc(·)是全连接操作；Expand(·)是扩展操作；是残差通道注意力模块输出；

步骤S313：构建高频补充解码器，包括：

步骤S3131：使用低通滤波器增强边界轮廓细节；对于输入图像，将其分解为一组通过低通滤波处理后的图像分量：

；

式中，lap_n是第n个低通滤波器提取的图像分量；I_n和I_n+1分别是输入图像的第n个和第n+1个图像分量；upsample(·)是上采样操作；Gaussian(·)是基于固定高斯核的相邻像素加权平均运算操作；

步骤S3132：在高频补充解码器中，图像分量有5个级别；前4个层级是不同分辨率的高频残差，最后一层级是低分辨率图像；将特征进行特征融合表示如下：

；

式中，U_n是第n级别的上采样特征；Up_n-1是对第n-1级别的上采样特征进行上采样操作；D_n和D_n-1分别是第n级别和第n-1级别的低分辨率图像，是上采样特征、光照先验和高频残差三个特征的融合；Conv_n(·)是沿通道维度的降序操作；Concat(·)是沿通道维度的连接操作；F_5-n是高频残差；

步骤S32：构建多尺度统计特征鉴别器，首先，来自不同尺度的特征a被输送到自适应修改模块中，以便适应其他维度；接下来，计算逐通道统计特征的向量，具体是均值和最大值；然后通过多层感知机为每个向量获得最终的标量结果；过程表示如下：

；

式中，MSCDB(·)是多尺度统计特征鉴别器的输出；a_m是m层级的尺度特征；AM(·)是自适应修改操作，由卷积层组成，用于调整输入特征以适应其他维度；SC(·)是统计特征的计算，包括均值和最大值的计算；MLP(·)是多层感知机，用于从统计特征的向量中获得最终的标量结果。

进一步地，在步骤S4中，所述设计图像增强损失函数包括升级对抗损失、感知损失和保真度损失，具体包括：

步骤S41：设计升级对抗损失，结合传统对抗损失结合和多尺度统计特征区分分支的对抗损失得到升级对抗损失；表示如下：

；

式中，和/>分别是鉴别器和生成器的损失值；/>和/>分别是对于真实样本和输入图像的期望；D(y)和D(G(x))分别是鉴别器对真实样本和对生成样本的输出；G(x)是生成器对输入样本的输出；/>是多尺度统计特征区分分支的鉴别器输出；/>是升级对抗损失；λ是生成损失权重；

步骤S42：设计感知损失，使用VGG-19模型来提取图像特征，引入基于特征的距离损失，表示如下：

；

式中，L_per是感知损失；J是模型总层数；是第j层提取的图像特征；

步骤S43：设计保真度损失，使用L1范数来约束像素之间的差异；表示如下：

；

式中，L_ton是保真度损失；

步骤S44：设计图像增强损失函数，所用公式如下：

；

式中，L^G是图像增强损失；λ₁、λ₃和λ₃是各损失对应权重。

进一步地，在步骤S5中，所述设置图像增强模型超参数具体包括以下步骤：

步骤S51：初始化，基于图像增强模型和损失函数的超参数建立参数搜索空间；基于循环映射的混沌方法初始化搜索种群，将基于搜索个体位置建立的图像增强模型的性能作为搜索个体适应度值；初始化种群所用公式如下：

；

式中，k_i+1和k_i分别是第i+1个和第i个混沌值；α和β分别是控制步长和角速度的参数；X_i+1,j是第i+1个体j维度的位置；LOW_j和UP_j分别是j维度的搜索下限和搜索上限；

步骤S52：设计搜索参数，对于个体适应度值大于平均适应度值的个体，进行精细搜索；对于个体适应度值低于平均适应度值的个体，扩大搜索范围，所用公式如下：

；

式中，δ(t)是第t次迭代时的搜素权重；δ_max和δ_min分别是最大权重和最小权重；f_i(k)、f_max、f_min和f_avg分别是个体适应度值、种群最大适应度值、种群最小适应度值和种群平均适应度值；

步骤S53：设计搜索策略，所用公式如下：

；

式中，是学习率；/>是防止零学习的小的正数；t是当前迭代次数；T是最大迭代次数；X_i,j(t+1)和X_i,j(t)分别是第i个搜索个体j维度第t+1次迭代和第t次迭代时的位置；X_best,j(t)、X_rand,j(t)和X_p,j(t)分别是种群最优个体、随机个体、个体历史最优j维度第t次迭代时的位置；

步骤S54：引入精英学习策略，对当前种群个体根据适应度值的大小进行排名，从适应度值最好的10%个体位置中生成10%的新个体位置，并用适应度值最差的10%个体位置替换这10%新个体位置，同时保持中间解不变，表示如下：

；

式中，是新生成的个体位置；X_i是适应度值最好的10%个体位置；/>是适应度值最差的10%个体位置；Q是精英学习策略中控制生成的参数；d是搜索空间维度；f_i是个体适应度值；

步骤S55：迭代判定，预先设有适应度阈值，当存在搜索个体适应度值高于适应度值阈值时，基于个体位置建立图像增强模型；若达到最大迭代次数，则重新初始化种群位置进行搜索；否则继续迭代搜索。

进一步地，在步骤S6中，所述建立指令识别模型具体包括以下步骤：

步骤S61：模型架构设计，基于CSPDarknet骨干网络和YOLOv5算法构建深度学习模型；模型骨干网络由多个卷积层组成，包括卷积和池化层的组合；骨干网络用于从输入图像中提取特征，然后利用特征来预测每个检测到的物体的边界框和类别概率；检测层由多个卷积层组成，用于进行目标检测和分类；

步骤S62：添加卷积块注意力模块，卷积块注意力模块是一种注意力机制，包括通道注意力和空间注意力两个模块，用于增强图像中的重要特征并抑制无关特征；在指令识别中，通道注意力模块关注与指令相关的通道，而空间注意力模块降低非指令区域的重要性；

步骤S63：引入梯度加权类激活映射，梯度加权类激活映射是一种用于可视化输入图像中不同区域对于特定输出类别的重要性的深度学习技术；通过计算特定类别相对于最终卷积层的特征图的得分梯度，生成热图来表示不同区域对于分类的重要程度；颜色强度越高，表示区域对于分类的重要性越高；

步骤S64：车载终端人机交互，利用车载终端实时采集输入车主图像数据；基于图像增强模型实现图像增强，将增强后的图像输出值指令识别模型，将模型输出的用户指令给予用户，若收到确定指令，则执行模型输出的用户指令。

采用上述方案本发明取得的有益效果如下：

（1）针对一般人机交互模型存在采集原始图像不佳，图像增强模型对视觉质量及细节保留能力弱，以及图像还原能力差的问题，本方案通过构建亮度校正编码器动态调整图像的亮度，以增强图像的光照效果；构建剩余通道注意力模块捕捉通道的重要性，并自适应地校准通道的权重；构建高频补充解码器通过低通滤波器、特征融合和上采样操作，补充编码过程中丢失的高频细节，从而提高图像的细节保留和还原能力；通过多尺度统计特征鉴别器，对生成的增强图像进行质量评估和鉴别。

（2）针对一般人机交互模型在图像增强方面存在损失函数无法适应图像的多样性导致图像感知质量差的问题，本方案通过将传统对抗损失与多尺度统计特征区分分支相结合，提高了对真实样本和生成样本的区分度，有助于提高生成图像的质量和逼真度；基于感知损失函数促使生成图像更好地匹配真实图像的内容和结构；保真度损失通过使用L1范数约束像素之间的差异，有效减少生成图像和真实图像之间的细节差异，从而提高图像的保真度和细节保持性。

（3）针对一般模型存在超参数设置不当，超参数搜索方法搜索灵活性差，鲁棒性低的问题，本方案基于循环映射的混沌方法初始化搜索种群，通过设计个体适应度值权重和搜索策略，引入精英学习策略，逐步提高种群的整体适应度，更好地探索搜索空间增加找到更优解的机会。

附图说明

图1为本发明提供的基于图像增强的车载终端人机交互方法的流程示意图；

图2为步骤S4的流程示意图；

图3为步骤S5的流程示意图。

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例；基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要理解的是，术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的系统或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

实施例一，参阅图1，本发明提供的基于图像增强的车载终端人机交互方法，该方法包括以下步骤：

步骤S1：数据采集；

步骤S2：数据预处理，对采集的数据进行数据清洗、图像预处理、图像标注和数据集划分；

步骤S3：建立图像增强模型，构建亮度校正编码器动态调整图像的亮度；构建剩余通道注意力模块捕捉通道的重要性；构建高频补充解码器通过低通滤波器、特征融合和上采样操作，补充编码过程中丢失的高频细节；通过多尺度统计特征鉴别器，对生成的增强图像进行质量评估和鉴别；

步骤S4：设计图像增强损失函数，将传统对抗损失与多尺度统计特征区分分支相结合；基于感知损失函数促使生成图像匹配真实图像的内容和结构；保真度损失通过使用L1范数约束像素之间的差异；

步骤S5：设置图像增强模型超参数，基于循环映射的混沌方法初始化搜索种群，通过设计个体适应度值权重和搜索策略，引入精英学习策略；

步骤S6：建立指令识别模型。

实施例二，参阅图1，该实施例基于上述实施例，在步骤S1中，数据采集是采集车主指令图像数据。

实施例三，参阅图1，该实施例基于上述实施例，在步骤S2中，所述数据清洗是对重复、缺失和错误的图像数据去除；所述图像预处理是将图像数据准备为统一的格式和质量；所述图像标注是对图像标注用户指令标签；所述数据集划分是将图像数据划分为训练集和测试集。

实施例四，参阅图1，该实施例基于上述实施例，在步骤S3中，建立图像增强模型具体包括以下步骤：

；

步骤S313：构建高频补充解码器，包括：

；

通过执行上述操作，针对一般人机交互模型存在采集原始图像不佳，图像增强模型对视觉质量及细节保留能力弱，以及图像还原能力差的问题，本方案通过构建亮度校正编码器动态调整图像的亮度，以增强图像的光照效果；构建剩余通道注意力模块捕捉通道的重要性，并自适应地校准通道的权重；构建高频补充解码器通过低通滤波器、特征融合和上采样操作，补充编码过程中丢失的高频细节，从而提高图像的细节保留和还原能力；通过多尺度统计特征鉴别器，对生成的增强图像进行质量评估和鉴别。

实施例五，参阅图1和图2，该实施例基于上述实施例，在步骤S4中，设计图像增强损失函数包括升级对抗损失、感知损失和保真度损失，具体包括：

；

式中，L_ton是保真度损失；

步骤S44：设计图像增强损失函数，所用公式如下：

；

通过执行上述操作，针对一般人机交互模型在图像增强方面存在损失函数无法适应图像的多样性导致图像感知质量差的问题，本方案通过将传统对抗损失与多尺度统计特征区分分支相结合，提高了对真实样本和生成样本的区分度，有助于提高生成图像的质量和逼真度；基于感知损失函数促使生成图像更好地匹配真实图像的内容和结构；保真度损失通过使用L1范数约束像素之间的差异，有效减少生成图像和真实图像之间的细节差异，从而提高图像的保真度和细节保持性。

实施例六，参阅图1和图3，该实施例基于上述实施例，在步骤S5中，设置图像增强模型超参数具体包括以下步骤：

；

步骤S53：设计搜索策略，所用公式如下：

；

通过执行上述操作，针对一般模型存在超参数设置不当，超参数搜索方法搜索灵活性差，鲁棒性低的问题，本方案基于循环映射的混沌方法初始化搜索种群，通过设计个体适应度值权重和搜索策略，引入精英学习策略，逐步提高种群的整体适应度，更好地探索搜索空间增加找到更优解的机会。

实施例七，参阅图1，该实施例基于上述实施例，在步骤S6中，建立指令识别模型具体包括以下步骤：

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型。

以上对本发明及其实施方式进行了描述，这种描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

Claims

1.基于图像增强的车载终端人机交互方法，其特征在于：该方法包括以下步骤：

步骤S1：数据采集，所述数据采集是采集车主指令图像数据；

步骤S2：数据预处理，包括对采集的数据进行数据清洗、图像标准化、图像标注和数据集划分；

步骤S3：建立图像增强模型；

步骤S4：设计图像增强损失函数；

步骤S5：设置图像增强模型超参数；

步骤S6：建立指令识别模型；

在步骤S3中，所述建立图像增强模型具体包括以下步骤：

步骤S31：构建核心属性增强生成器，核心属性增强生成器包括亮度校正编码器、剩余通道注意力模块和高频补充解码器；具体包括：

步骤S311：构建亮度校正编码器；其中，亮度校正编码器由先验照明分支和特征提取分支两个分支组成；特征提取分支通过逐步降采样提取输入内容特征，并融合来自先验照明分支的亮度信息；包括：

步骤S3112：将亮度权重参数连续下采样，获得一组亮度权重堆栈x^lum，x^lum包含四组不同尺寸的亮度权重，分别为1×256×256、1×128×28、1×64×64和1×32×32；在提取内容特征之前，x^gray和被连接并输入到特征提取分支；表示如下：

式中，是第一个亮度权重参数；/>和/>分别是第i+1个和第i个亮度权重参数；是下采样操作；

式中，F_b是第b层的内容特征；E_b和E_b+1分别是第b层和第b+1层内容特征对应的亮度权重；是完全融合操作；⊙是逐元素相乘；

步骤S312：构建剩余通道注意力模块，基于剩余通道注意力模块获取全局信息，在全局特征图的不同区域应用不同的注意力，并自适应地校准通道的权重；通过全局最大池化和全局平均池化计算通道间的依赖关系，并基于全连接层操作将通道间的依赖关系映射为大小为256×1×1的权重向量；然后该权重向量在宽度和高度上扩展到256×32×32的大小；特征图F4和相应的权重向量进行相乘，以获得校准后的特征图；过程描述如下

RCAM(F₄)＝Expand(fc(pool(F₄)))·F₄；

式中，F₄是由剩余通道注意力模块提取的特征图；pool(·)是全局最大池化和全局平均池化的组合操作；fc(·)是全连接操作；Expand(·)是扩展操作；RCAM(·)是剩余通道注意力模块输出；

步骤S313：构建高频补充解码器，包括：

步骤S3132：在高频补充解码器中，图像分量有5个级别；前4个层级是不同分辨率的高频残差，最后一层级是低分辨率图像；随后进行特征融合的操作，具体表示如下：

式中，U_n1是第n1级别的上采样特征；Up_n1-1是对第n1-1级别的上采样特征进行上采样操作；D_n1和D_n1-1分别是第n1级别和第n1-1级别的低分辨率图像，D_n1是U_n1、F_5-n1和lap_n三者的融合；Conv_n(·)是沿通道维度的降序操作；Concat(·)是沿通道维度的连接操作；F_5-n1是高频残差；

步骤S32：构建多尺度统计特征鉴别器；其中，先将来自不同尺度的特征a被输送到自适应修改模块中，以便适应其他维度；接下来，计算逐通道的统计特征的向量，具体是均值和最大值；然后通过多层感知机为每个统计特征的向量获得最终的标量结果；过程表示如下：

MSCDB(a_m)＝MLP(SC(AM(a_m)))；

式中，MSCDB(·)是多尺度统计特征鉴别器的输出；a_m是m层级的尺度特征；AM(·)是自适应修改操作，由卷积层组成，用于调整输入特征以适应其他维度；SC(·)是统计特征的计算，包括均值和最大值的计算；MLP(·)是多层感知机，用于从统计特征的向量中获得最终的标量结果；

在步骤S4中，所述设计图像增强损失函数包括升级对抗损失、感知损失和保真度损失，具体包括：

步骤S41：设计升级对抗损失，结合传统对抗损失和多尺度统计特征区分分支的对抗损失得到升级对抗损失；表示如下：

式中，和/>分别是鉴别器和生成器的损失值；/>和/>分别是对于真实样本和输入图像的期望；D(y)和D(G(x))分别是鉴别器对真实样本和对生成样本的输出；G(x)是生成器对输入样本的输出；D′(·)是多尺度统计特征区分分支的鉴别器输出；/>是升级对抗损失；λ是生成损失权重；

式中，L_ton是保真度损失；

步骤S44：设计图像增强损失函数，所用公式如下：

式中，L^G是图像增强损失函数；λ₁、λ₂和λ₃是升级对抗损失、感知损失和保真度损失对应的权重；

在步骤S5中，所述设置图像增强模型超参数具体包括以下步骤：

步骤S51：初始化；其中，基于图像增强模型和图像增强损失函数的超参数建立参数搜索空间；基于循环映射的混沌方法初始化搜索种群，将基于搜索的个体位置建立的图像增强模型的性能作为个体适应度值；初始化搜索种群所用公式如下：

k_I+1＝k_I+β-(α-2π)sin(2πk_I)mod(1)；

X_I+1，j＝LOW_j+k_I+1(UP_j-LOW_j)；

式中，k_I+1和k_I分别是第I+1个和第I个个体的混沌值；α和β分别是控制步长和角速度的参数；X_I+1,j是第I+1个体j维度的位置；LOW_j和UP_j分别是j维度的搜索下限和搜索上限；

步骤S52：设计搜索参数；其中，对于个体适应度值大于平均适应度值的个体，进行精细搜索；对于个体适应度值低于平均适应度值的个体，扩大搜索范围，所用公式如下：

式中，δ(t)是第t次迭代时的搜素权重；δ_max和δ_min分别是最大权重和最小权重；f_I(t)、f_max、f_min和f_avg分别是第t次迭代时的个体适应度值、种群最大适应度值、种群最小适应度值和种群平均适应度值；

步骤S53：设计搜索策略，所用公式如下：

式中，是学习率；ε是防止零学习的小的正数；t是当前迭代次数；T是最大迭代次数；X_I,j(t+1)和X_I,j(t)分别是第I个个体j维度的第t+1次迭代和第t次迭代时的位置；X_best,j(t)、X_rand,j(t)和X_p,j(t)分别是种群最优个体、随机个体、个体历史最优j维度的第t次迭代时的位置；

步骤S54：引入精英学习策略，对当前种群个体根据适应度值的大小进行排名，从适应度值最好的10％个体位置中生成10％的新个体位置，并用适应度值最差的10％个体位置替换这10％新个体位置，同时保持中间解不变，表示如下：

式中，X_I，new是新生成的个体位置；X_I是适应度值最好的10％个体位置；X_I，worst是适应度值最差的10％个体位置；Q是精英学习策略中控制生成的参数；d是搜索空间维度；f_I是个体适应度值；

步骤S55：迭代判定；其中，预先设有适应度阈值，当存在个体适应度值高于适应度值阈值时，基于个体位置建立图像增强模型；若达到最大迭代次数，则重新初始化种群位置进行搜索；否则继续迭代搜索；

在步骤S6中，所述建立指令识别模型具体包括以下步骤：

步骤S61：模型架构设计；其中，基于包含CSPDarknet骨干网络的YOLOv5算法构建深度学习模型；

步骤S62：添加卷积块注意力模块；所述卷积块注意力模块包括通道注意力和空间注意力两个模块；在指令识别中，通道注意力模块关注与指令相关的通道，而空间注意力模块降低非指令区域的重要性；

步骤S63：引入梯度加权类激活映射；其中，通过计算图像类别相对于最终卷积层的特征图的得分梯度，生成热图来表示不同区域对于分类的重要程度；颜色强度越高，表示区域对于分类的重要性越高；

步骤S64：车载终端人机交互；其中，利用车载终端实时采集并输入车主指令图像数据；基于图像增强模型实现图像增强，将增强后的图像输出至指令识别模型，将指令识别模型输出的用户指令给予用户，若收到确定指令，则执行模型输出的用户指令。

2.根据权利要求1所述的基于图像增强的车载终端人机交互方法，其特征在于：在步骤S2中，所述数据清洗是对重复、缺失和错误的图像数据去除；所述图像标准化是将图像数据准备为统一的格式和质量；所述图像标注是对图像标注用户指令标签；所述数据集划分是将图像数据划分为训练集和测试集。