CN116894768B

CN116894768B - 一种基于人工智能的目标检测优化方法和系统

Info

Publication number: CN116894768B
Application number: CN202311160124.1A
Authority: CN
Inventors: 王强; 刘明鑫; 戴升鑫; 江森
Original assignee: Chengdu Aeronautic Polytechnic
Current assignee: Chengdu Aeronautic Polytechnic
Priority date: 2023-09-11
Filing date: 2023-09-11
Publication date: 2023-11-21
Anticipated expiration: 2043-09-11
Also published as: CN116894768A

Abstract

本发明属于目标检测领域，具体的，涉及一种基于人工智能的目标检测优化方法和系统，通过获取待检测目标的背景特征，基于所述背景特征对所述待检测目标进行场景聚类，得到所述待检测目标的检测场景；采用对应的特征提取策略获取候选检测特征并输入历史目标检测库中，得到所述历史目标检测库中的目标特征匹配度；选择大于第一匹配度阈值的历史目标特征，获取其对应的历史目标；根据除去所述历史目标特征的其他特征，将所述其他特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征进行优化处理，得到所述待检测目标的优化处理结果。本发明可自适应性对图片或视频中的目标进行多维度特征选择优化。

Description

一种基于人工智能的目标检测优化方法和系统

技术领域

本发明属于目标检测领域，具体的，涉及一种基于人工智能的目标检测优化方法和系统。

背景技术

在互联互通的时代，随着智能时代的到来，手机、相机的蓬勃发展，人们越来越热衷于拍照。现在的手机一般都带有美图功能，传统的那种美颜或者美丑功能已经根本满足不了大家的需求，因为大家的审美观点不一样，很多人不知道应该要往那个方向美化，美化到什么程度。

通过工作人员修图的方式对视频图像进行修图处理，从一方面来说，不仅对工作人员自身的审美和素养有着较高的要求，同时还在很大程度上耗费了工作人员大量的时间和精力，提高了人力资源和物力资源的消耗，延长了视频图像修图的周期，从另一方面来说，工作人员对视频图像进行修图时存在一定的主观差异性，无法确保视频图像的修图效果。

通过美颜模板对视频内人物进行修图分析和处理时，往往忽略了视频内人物的自身特点，使得视频内人物趋于相似，缺乏辨识度，在很大程度上降低了视频中人物修图的可靠性，从而影响视频的视觉效果和用户的满意度。

发明内容

为了解决当前图片或视频中人物或动物识别修饰的单一性，本发明请求保护一种一种基于人工智能的目标检测优化方法和系统，通过类似场景、类似目标的方法对图片或视频中的目标进行自适应优化修饰。

根据本发明第一方面，本发明请求保护基于人工智能的目标检测优化方法，包括：

获取待检测目标的背景特征，基于所述背景特征对所述待检测目标进行场景聚类，得到所述待检测目标的检测场景；

依据所述待检测目标的检测场景采用对应的特征提取策略获取所述待检测目标的候选检测特征，形成候选检测特征集；

将所述候选检测特征集输入历史目标检测库中，得到所述历史目标检测库中的目标特征匹配度；

选择所述目标特征匹配度大于第一匹配度阈值的历史目标特征，获取所述历史目标特征对应的历史目标；

获取所述历史目标的特征中除去所述历史目标特征的其他特征，将所述其他特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征；

依据所述待优化特征对所述待检测目标进行优化处理，得到所述待检测目标的优化处理结果。

进一步的，所述获取待检测目标的背景特征，基于所述背景特征对所述待检测目标进行场景聚类，得到所述待检测目标的检测场景，具体包括：

所述待检测目标为人物目标或动物目标；

所述待检测目标的背景特征包括颜色背景特征、光线背景特征和焦点背景特征；

所述场景聚类包括户外自然光场景、户外灯光场景、虚化场景、室内灯光场景、室内自然光场景；

所述虚化场景和户外自然光场景、户外灯光场景、室内灯光场景、室内自然光场景存在重叠场景；

当所述焦点背景特征表征所述待检测目标的背景焦点不统一时，对所述待检测目标进行场景聚类，得到所述待检测目标的检测场景为虚化场景；

当所述光线背景特征的红外光线强度值在待检测目标的检测范围内大于红外阈值且所述颜色背景特征的颜色分布值变化不均匀时，对所述待检测目标进行场景聚类，得到所述待检测目标的检测场景为室内灯光场景；

当所述光线背景特征的红外光线强度值在待检测目标的检测范围内大于红外阈值且所述颜色背景特征的颜色分布值变化均匀时，对所述待检测目标进行场景聚类，得到所述待检测目标的检测场景为户外灯光场景；

当所述光线背景特征的红外光线强度值在待检测目标的检测范围内不大于红外阈值且所述颜色背景特征的颜色分布值变化均匀时，对所述待检测目标进行场景聚类，得到所述待检测目标的检测场景为户外自然光场景；

当所述光线背景特征的红外光线强度值在待检测目标的检测范围内不大于红外阈值且所述颜色背景特征的颜色分布值变化不均匀时，对所述待检测目标进行场景聚类，得到所述待检测目标的检测场景为室内自然光场景；

当所述户外自然光场景、户外灯光场景、室内灯光场景、室内自然光场景中的焦点背景特征表征所述待检测目标的背景焦点不统一时，所述待检测目标的检测场景为户外自然光虚化场景、户外灯光虚化场景、室内灯光虚化场景、室内自然光虚化场景。

进一步的，所述依据所述待检测目标的检测场景采用对应的特征提取策略获取所述待检测目标的候选检测特征，形成候选检测特征集，具体包括：

当所述待检测目标的检测场景为户外自然光场景，采用第一特征提取策略获取所述待检测目标的第一候选检测特征，形成第一候选检测特征集；

当所述待检测目标的检测场景为户外灯光场景，采用第二特征提取策略获取所述待检测目标的第二候选检测特征，形成第二候选检测特征集；

当所述待检测目标的检测场景为室内灯光场景，采用第三特征提取策略获取所述待检测目标的第三候选检测特征，形成第三候选检测特征集；

当所述待检测目标的检测场景为室内自然光场景，采用第四特征提取策略获取所述待检测目标的第四候选检测特征，形成第四候选检测特征集。

进一步的，所述依据所述待检测目标的检测场景采用对应的特征提取策略获取所述待检测目标的候选检测特征，形成候选检测特征集，还包括：

所述采用第一特征提取策略获取所述待检测目标的第一候选检测特征，形成第一候选检测特征集为获取所述待检测目标的表情特征和运动特征，作为第一候选检测特征集；

所述采用第二特征提取策略获取所述待检测目标的第二候选检测特征，形成第二候选检测特征集为获取所述待检测目标的运动特征和肢体特征，作为第二候选检测特征集；

所述采用第三特征提取策略获取所述待检测目标的第三候选检测特征，形成第三候选检测特征集为获取所述待检测目标的声音特征和肢体特征，作为第三候选检测特征集；

所述采用第四特征提取策略获取所述待检测目标的第四候选检测特征，形成第四候选检测特征集为获取所述待检测目标的声音特征和表情特征，作为第四候选检测特征集。

进一步的，所述将所述候选检测特征集输入历史目标检测库中，得到所述历史目标检测库中的目标特征匹配度，具体包括：

所述历史目标检测库中存储有已检测优化完成的历史目标的表情特征库、运动特征库、声音特征库、肢体特征库；

将所述候选检测特征集输入历史目标检测库中，得到所述历史目标检测库中的目标特征匹配度时，具体包括：

将所述第一候选检测特征集的表情特征和运动特征分别与历史目标检测库中的表情特征库和运动特征库进行比对，得到所述历史目标检测库中匹配度分别最高的第一特征匹配度和第二特征匹配度；

将所述第二候选检测特征集的运动特征和肢体特征分别与历史目标检测库中的运动特征库和肢体特征库进行比对，得到所述历史目标检测库中匹配度分别最高的第三特征匹配度和第四特征匹配度；

将所述第三候选检测特征集的声音特征和肢体特征分别与历史目标检测库中的声音特征库和肢体特征库进行比对，得到所述历史目标检测库中匹配度分别最高的第五特征匹配度和第六特征匹配度；

将所述第四候选检测特征集的声音特征和表情特征分别与历史目标检测库中的声音特征库和表情特征库进行比对，得到所述历史目标检测库中匹配度分别最高的第七特征匹配度和第八特征匹配度；

将所述第一特征匹配度和第二特征匹配度的均值、第三特征匹配度和第四特征匹配度的均值、第五特征匹配度和第六特征匹配度的均值、第七特征匹配度和第八特征匹配度的均值分别作为第一目标特征匹配度、第二目标特征匹配度、第三目标特征匹配度、第四目标特征匹配度。

进一步的，所述选择所述目标特征匹配度大于第一匹配度阈值的历史目标特征，获取所述历史目标特征对应的历史目标，具体包括：

当所述第一目标特征匹配度大于第一匹配度阈值时，获取匹配度分别最高的所述表情特征库和运动特征库的特征对应的第一历史目标，或第一历史目标一和第一历史目标二；

当所述第二目标特征匹配度大于第一匹配度阈值时，获取匹配度分别最高的所述运动特征库和肢体特征库的特征对应的第二历史目标，或第二历史目标一和第二历史目标二；

当所述第三目标特征匹配度大于第一匹配度阈值时，获取匹配度分别最高的所述声音特征库和肢体特征库的特征对应的第三历史目标，或第三历史目标一和第三历史目标二；

当所述第四目标特征匹配度大于第一匹配度阈值时，获取匹配度分别最高的所述声音特征库和表情特征库的特征对应的第四历史目标，或第四历史目标一和第四历史目标二。

进一步的，所述获取所述历史目标的特征中除去所述历史目标特征的其他特征，将所述其他特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征，具体包括：

获取所述第一历史目标的声音特征和肢体特征，将所述第一历史目标的声音特征和肢体特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征；

获取所述第二历史目标的声音特征和表情特征，将所述第二历史目标的声音特征和表情特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征；

获取所述第三历史目标的表情特征和运动特征，将所述第三历史目标的表情特征和运动特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征；

获取所述第四历史目标的运动特征和肢体特征，将所述第四历史目标的运动特征和肢体特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征。

进一步的，所述获取所述历史目标的特征中除去所述历史目标特征的其他特征，将所述其他特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征，还包括：

获取所述第一历史目标一的声音特征和所述第一历史目标二的肢体特征，将所述第一历史目标一声音特征和所述第一历史目标二的肢体特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征；

获取所述第二历史目标一的声音特征和所述第二历史目标二的运动特征，将所述第二历史目标一的声音特征和第二历史目标二的运动特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征；

获取所述第三历史目标一的表情特征和所述第三历史目标二运动特征，将所述第三历史目标一的表情特征和所述第三历史目标二运动特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征；

获取所述第四历史目标一的表情特征和所述第四历史目标二肢体特征，将所述第四历史目标一的表情特征和所述第四历史目标二肢体特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征。

进一步的，所述依据所述待优化特征对所述待检测目标进行优化处理，得到所述待检测目标的优化处理结果，具体包括：

获取所述待优化特征的优化参数，依据所述优化参数对所述待检测目标的对应的特征进行优化处理，得到所述待检测目标的优化处理结果；

所述优化参数包括色度值调整、对比度调整、帧数频率调整、马赛克参数。

根据本发明第二发明，本发明请求保护一种基于人工智能的目标检测优化系统，其特征在于，包括：

场景聚类模块，获取待检测目标的背景特征，基于所述背景特征对所述待检测目标进行场景聚类，得到所述待检测目标的检测场景；

候选检测模块，依据所述待检测目标的检测场景采用对应的特征提取策略获取所述待检测目标的候选检测特征，形成候选检测特征集；

历史匹配模块，将所述候选检测特征集输入历史目标检测库中，得到所述历史目标检测库中的目标特征匹配度；

目标确定模块，选择所述目标特征匹配度大于第一匹配度阈值的历史目标特征，获取所述历史目标特征对应的历史目标；

优化决策模块，获取所述历史目标的特征中除去所述历史目标特征的其他特征，将所述其他特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征；

优化处理模块，依据所述待优化特征对所述待检测目标进行优化处理，得到所述待检测目标的优化处理结果；

所述一种基于人工智能的目标检测优化系统用于实现所述的一种基于人工智能的目标检测优化方法。

本申请请求保护一种基于人工智能的目标检测优化方法和系统，通过获取待检测目标的背景特征，基于所述背景特征对所述待检测目标进行场景聚类，得到所述待检测目标的检测场景；采用对应的特征提取策略获取候选检测特征并输入历史目标检测库中，得到所述历史目标检测库中的目标特征匹配度；选择大于第一匹配度阈值的历史目标特征，获取其对应的历史目标；根据除去所述历史目标特征的其他特征，将所述其他特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征进行优化处理，得到所述待检测目标的优化处理结果。本发明可自适应性对图片或视频中的目标进行多维度特征选择优化。

附图说明

图1为本发明所请求保护的一种基于人工智能的目标检测优化方法的工作流程图；

图2为本发明所请求保护的一种基于人工智能的目标检测优化系统的结构模块图。

具体实施方式

根据本发明第一实施例，参照附图1，本发明请求保护一种基于人工智能的目标检测优化方法，包括：

其中，在该实施例中，针对图片或视频中的待检测人物或动物等动态有生命目标进行检测优化，基于照片或视频的拍摄水平对其中的有生命目标进行修饰，使得其质量提升。

所述待检测目标为人物目标或动物目标；

其中，在该实施例中，虚化场景指在拍摄过程中，图像或视频中的背景部分由于焦点未对准或其他原因导致的模糊化而前景部分清晰显示的处理；

当光线背景特征的红外光线强度值在待检测目标的检测范围内大于红外阈值时，表明当前的红外线指数较强，认定当前场景为户外场景；

而当所述光线背景特征的红外光线强度值在待检测目标的检测范围内不大于红外阈值时，表明当前的红外线指数较弱，认定当前场景为室内场景；

当所述颜色背景特征的颜色分布值变化不均匀时，表明外界的颜色变化呈现渐变的状态，符合自然光的发散原理，认定当前场景为自然光场景；

当所述颜色背景特征的颜色分布值变化均匀时，表明外界的颜色变化呈现界限分割明显的状态，符合灯光的发散原理，认定当前场景为灯光场景。

其中，在该实施例中，当在户外场景下时，人物或动物的运动特征会在户外状态下表现清晰，此时需获取人物或动物的运动特征；

当在室内场景下时，人物或动物的声音特征的采集会在室内状态下更加准确，此时需获取人物或动物的声音特征；

当在自然光场景下时，人物或动物的表情特征更加自然，更具代表性，此时需获取人物或动物的表情特征；

当在灯光场景下时，人物或动物的肢体特征更加清晰，此时需获取人物或动物的肢体特征。

其中，在该实施例中，声音特征匹配为采集待识别视频声音数据；提取待识别视频声音数据的特征信息；对所有待识别视频声音数据匹配相应的通道号和时间信息，连同带有通道号和时间信息的录像构建数据库；在所述的数据库中以所述的特征信息为索引检索待识别视频声音数据，根据检索到的待识别视频声音数据的通道号和时间信息在所述的数据库中检索并确定相匹配的录像。

表情特征匹配为利用摄像装置采集待检测图片或视频；从所述待检测图片或视频中识别出人脸并进行表情特征的抽取而得到所述表情的分类；将所述分类与相应的输入结果相匹配；使用所述输入结果进行输入。对由高兴、生气、吃惊、及恐惧中的一个或多个组成的输入结果进行包括删除、修改或增加的编辑处理。

运动特征匹配为以运动动作序列为输入，进行定性检索，排除不相似的运动，输出候选运动集合：根据用户选定的特征节点对已有的运动索引进行动态的运动分段合并，生成新的运动索引并载入到内存；以时序数据匹配的方法建立待比较的运动特征序列之间的对应关系，并判断两者是否对应相等；运动动作之间的匹配条件为查询运动动作是否包含于由候选运动动作及其相邻运动动作组成的集合中。

肢体特征匹配为获取待检测图像，所述待检测图像中携带有用户的肢体信息，将所述待检测图像输入到肢体特征匹配模型，得到所述用户的肢体特征的分析结果；所述肢体特征匹配模型是基于训练数据和所述训练数据对应的分析结果进行训练得到的；所述训练数据为携带有肢体信息的历史目标，所述训练数据对应的分析结果为所述历史目标的预设分析结果。

所述优化参数至少包括色度值调整、对比度调整、帧数频率调整、马赛克参数。

根据本发明第二实施例，参照附图2，本发明请求保护一种基于人工智能的目标检测优化系统，其特征在于，包括：

本领域技术人员能够理解，本公开所披露的内容可以出现多种变型和改进。例如，以上所描述的各种设备或组件可以通过硬件实现，也可以通过软件、固件、或者三者中的一些或全部的组合实现。

本公开中使用了流程图用来说明根据本公开的实施例的方法的步骤。应当理解的是，前面或后面的步骤不一定按照顺序来精确的进行。相反，可以按照倒序或同时处理各种步骤。同时，也可以将其他操作添加到这些过程中。

本领域普通技术人员可以理解上述方法中的全部或部分的步骤可通过计算机程序来指令相关硬件完成，程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本公开并不限制于任何特定形式的硬件和软件的结合。

除非另有定义，这里使用的所有术语具有与本公开所属领域的普通技术人员共同理解的相同含义。还应当理解，诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义，而不应用理想化或极度形式化的意义来解释，除非这里明确地这样定义。

以上是对本公开的说明，而不应被认为是对其的限制。尽管描述了本公开的若干示例性实施例，但本领域技术人员将容易地理解，在不背离本公开的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此，所有这些修改都意图包含在权利要求书所限定的本公开范围内。应当理解，上面是对本公开的说明，而不应被认为是限于所公开的特定实施例，并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本公开由权利要求书及其等效物限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

1.一种基于人工智能的目标检测优化方法，其特征在于，包括：

依据所述待优化特征对所述待检测目标进行优化处理，得到所述待检测目标的优化处理结果；

所述将所述候选检测特征集输入历史目标检测库中，得到所述历史目标检测库中的目标特征匹配度，具体包括：

将第一候选检测特征集的表情特征和运动特征分别与历史目标检测库中的表情特征库和运动特征库进行比对，得到所述历史目标检测库中匹配度分别最高的第一特征匹配度和第二特征匹配度；

将第二候选检测特征集的运动特征和肢体特征分别与历史目标检测库中的运动特征库和肢体特征库进行比对，得到所述历史目标检测库中匹配度分别最高的第三特征匹配度和第四特征匹配度；

将第三候选检测特征集的声音特征和肢体特征分别与历史目标检测库中的声音特征库和肢体特征库进行比对，得到所述历史目标检测库中匹配度分别最高的第五特征匹配度和第六特征匹配度；

将第四候选检测特征集的声音特征和表情特征分别与历史目标检测库中的声音特征库和表情特征库进行比对，得到所述历史目标检测库中匹配度分别最高的第七特征匹配度和第八特征匹配度；

将所述第一特征匹配度和第二特征匹配度的均值、第三特征匹配度和第四特征匹配度的均值、第五特征匹配度和第六特征匹配度的均值、第七特征匹配度和第八特征匹配度的均值分别作为第一目标特征匹配度、第二目标特征匹配度、第三目标特征匹配度、第四目标特征匹配度；

所述选择所述目标特征匹配度大于第一匹配度阈值的历史目标特征，获取所述历史目标特征对应的历史目标，具体包括：

当所述第四目标特征匹配度大于第一匹配度阈值时，获取匹配度分别最高的所述声音特征库和表情特征库的特征对应的第四历史目标，或第四历史目标一和第四历史目标二；

所述获取所述历史目标的特征中除去所述历史目标特征的其他特征，将所述其他特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征，具体包括：

获取所述第四历史目标的运动特征和肢体特征，将所述第四历史目标的运动特征和肢体特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征；

所述获取所述历史目标的特征中除去所述历史目标特征的其他特征，将所述其他特征与所述待检测目标进行特征匹配，将匹配度小于第二匹配度阈值的特征作为所述待检测目标的待优化特征，还包括：

2.如权利要求1所述的一种基于人工智能的目标检测优化方法，其特征在于，所述获取待检测目标的背景特征，基于所述背景特征对所述待检测目标进行场景聚类，得到所述待检测目标的检测场景，具体包括：

所述待检测目标为人物目标或动物目标；

3.如权利要求2所述的一种基于人工智能的目标检测优化方法，其特征在于，所述依据所述待检测目标的检测场景采用对应的特征提取策略获取所述待检测目标的候选检测特征，形成候选检测特征集，具体包括：

4.如权利要求3所述的一种基于人工智能的目标检测优化方法，其特征在于，所述依据所述待检测目标的检测场景采用对应的特征提取策略获取所述待检测目标的候选检测特征，形成候选检测特征集，还包括：

5.如权利要求4所述的一种基于人工智能的目标检测优化方法，其特征在于，所述依据所述待优化特征对所述待检测目标进行优化处理，得到所述待检测目标的优化处理结果，具体包括：

6.一种基于人工智能的目标检测优化系统，其特征在于，包括：

所述一种基于人工智能的目标检测优化系统用于实现如权利要求1-5任一项所述的一种基于人工智能的目标检测优化方法。