CN115240194B

CN115240194B - 一种基于视觉的垃圾分类和云回收估价方法

Info

Publication number: CN115240194B
Application number: CN202210901317.7A
Authority: CN
Inventors: 唐军
Original assignee: Guangdong Xiaobailong Environmental Protection Technology Co ltd
Current assignee: Guangdong Xiaobailong Environmental Protection Technology Co ltd
Priority date: 2022-07-28
Filing date: 2022-07-28
Publication date: 2023-10-13
Anticipated expiration: 2042-07-28
Also published as: CN115240194A

Abstract

本发明公开一种基于视觉的垃圾分类和云回收估价方法，包括以下步骤：S1、用户对待识别垃圾进行拍照，作为图像输入数据；S2、对输入图像进行分类识别，设计BiWinT网络架构；S3、对于识别为不可回收物品的垃圾，给出分类投放指导；对于识别为可回收物品的垃圾，通过市场回收估价，用户在手机网上下单，获得上门回收服务。本发明针对现有基于视觉深度学习技术的垃圾识别方法识别准确度低的问题，设计了基于transformer网络的BiWinT网络架构，通过将pixel embedding和patchembedding分别输入固定窗口多头自注意力机制模块和带移动窗的多头自注意力机制模块，提升不同窗口的信息交换能力，提高识别精度；用户通过对垃圾拍照即可获知废品全种类识别、分类投放建议、废品回收估价三种信息。

Description

一种基于视觉的垃圾分类和云回收估价方法

技术领域

本发明涉及人工智能领域，具体涉及一种基于视觉的垃圾分类和云回收估价方法。

背景技术

我国是世界人口大国同时也是世界制造业大国，随着人们生活水平的提升，垃圾的数量也越来越多，国家出台了《生活垃圾分类制度实施方案》，引导人们开展生活垃圾分类，维护生态文明。然而目前垃圾分类多以图表方式说明，不方便记忆，一些通过手机小程序进行垃圾识别的应用也只能识别精度较差，对于全种类的垃圾识别分类功能还不够完善。对于一些可回收的二手物品，也仅有手机数码等电子产品有回收途径，而其他可回收物品只能通过线下的废品收购站收购，并且消费者无法得知最新的物品回收价格，就近变卖，无法达到最大化的废品变现。

已有技术存在的问题：

1、基于传统视觉技术的垃圾识别分类方法识别准确率较低，无法做到全种类垃圾识别分类；

2、现有物品回收应用仅限于手机数码产品，回收种类较少；

3、衣物、纸箱、大件家具等二手物品没有线上回收途径，消费者无法得知最新回收价格。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于视觉的垃圾分类和云回收估价方法。

本发明的技术方案如下：

一种基于视觉的垃圾分类和云回收估价方法，包括以下步骤：

S1、用户对待识别垃圾进行拍照，作为图像输入数据；

S2、对输入图像进行分类识别，设计BiWinT网络架构；

S3、对于识别为不可回收物品的垃圾，给出分类投放指导；

对于识别为可回收物品的垃圾，通过市场回收估价，用户在手机网上下单，获得上门回收服务。

步骤S2中，BiWinT网络架构的设计包括以下步骤：

S21、将步骤S1中的待识别垃圾图像，通过切块操作的方式平均切成个序列块，其中，每个块patch的大小是p×p，h、w分别是原图像的高和宽，组成一个块序列：每个块表示为/>i＝1,2,…N；

S22、对每个展平成由像素点构成的像素序列，通过线性映射操作生成pixelembedding：/>其中m为像素个数，i＝1,2,…N是块序号；

S23、创建patch embedding:来保存块的特征，并初始化为0，其中Z_class是class token，表示分类的信息；

S24、对每个pixel embedding和patch embedding，分别加一个像素位置编码pixel position encoding和块位置编码patch position encoding；

S25、将一个块对应的pixel embedding输入到inner WinT block中来处理特征，将处理后的输出通过全连接层变换后，与patch embedding结合，共同输入到outer WinTblock中处理；

S26、经过处理pixel embedding和patch embedding输出定义为BiWinT block；

S27、将BiWinT block堆叠起来，构成BiWinT网络；

S28、将BiWinT网络的输出输入到全连接的多层感知机头中来进行分类；

S29、输出分类结果。

步骤S27中，BiWinT网络由4个BiWinT block堆叠而成。

BiWinT block由一个固定窗口的多头自注意力机制模块和一个带移动窗的多头自注意力机制模块构成，其中pixel embedding输入到固定窗口多头自注意力机制模块中，经过处理后与patch embedding结合后输入到带移动窗的多头自注意力机制模块中，实现了不同窗口的信息交流。

步骤S3中，可回收物品的垃圾分为三大种类，包括生活杂物、电子数码和大件家具。

对于电子数码和大件家具，首先用户通过使用状况评估来提交物品基本情况信息，然后通过基于视觉的外观缺损智能检测，得到物品的外观缺损情况，再通过市场回收估价。

视觉检测指标为裂缝、掉漆、缺角、划伤和油污，其回收估价P_r为：其中P_M市场同类回收物品的平均回收价，S₁～S₅分别是裂缝、掉漆、缺角、划伤、油污的破损程度分数，θ是根据用户提交的物品情况信息作出的回收价格补偿。

相对于现有技术，本发明的有益效果在于：本发明针对现有基于视觉深度学习技术的垃圾识别方法识别准确度低的问题，设计了基于transformer网络的BiWinT(Bi-Window Transformer)网络架构，通过将pixel embedding和patchembedding分别输入固定窗口多头自注意力机制模块和带移动窗的多头自注意力机制模块，提升不同窗口的信息交换能力，提高识别精度；用户通过对垃圾拍照即可获知废品全种类识别、分类投放建议、废品回收估价三种信息；对于大件家具，通过用户描述与基于视觉的外观缺损检测，共同得到物品外观缺损情况，并结合市场价格给出回收估价；网上下单获得上门回收服务。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的方法流程图；

图2为BiWinT网络架构图；

图3为inner WinT block结构图；

图4为outer WinT block结构图；

图5为BiWinT Block结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。

实施例

请参阅图1，本实施例提供一种基于视觉的垃圾分类和云回收估价方法，包括以下步骤：

S1、用户对待识别垃圾进行拍照，作为图像输入数据；

S2、对输入图像进行分类识别，设计BiWinT网络架构，如图2所示；

BiWinT网络架构的设计包括以下步骤：

BiWinT block由一个固定窗口的多头自注意力机制模块和一个带移动窗的多头自注意力机制模块构成，其中pixel embedding输入到固定窗口多头自注意力机制模块中，经过处理后与patch embedding结合后输入到带移动窗的多头自注意力机制模块中，实现了不同窗口的信息交流；

S27、将4个BiWinT block堆叠起来，构成BiWinT网络；

S29、输出分类结果；

S3、对于识别为不可回收物品的垃圾，给出分类投放指导；

对于识别为可回收物品的垃圾，通过市场回收估价，用户在手机网上下单，获得上门回收服务；

可回收物品的垃圾分为三大种类，包括生活杂物、电子数码和大件家具，以便于分类回收；

视觉检测指标为裂缝、掉漆、缺角、划伤和油污，外观缺损情况矩阵如下：

其回收估价P_r为：其中P_M市场同类回收物品的平均回收价，S₁～S₅分别是裂缝、掉漆、缺角、划伤、油污的破损程度分数，θ是根据用户提交的物品情况信息作出的回收价格补偿，可结合企业的实际情况，给用户最大的回收价。

以上仅为本发明的较佳实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于视觉的垃圾分类和云回收估价方法，其特征在于，包括以下步骤：

S1、用户对待识别垃圾进行拍照，作为图像输入数据；

S2、对输入图像进行分类识别，设计BiWinT网络架构，BiWinT网络架构的设计包括以下步骤：

S21、将步骤S1中的待识别垃圾图像，通过切块操作的方式平均切成个序列块，其中，每个块patch的大小是p×p，h、w分别是原图像的高和宽，组成一个块序列：每个块表示为/>

S24、对每个pixel embedding和patch embedding，分别加一个像素位置编码pixelposition encoding和块位置编码patch position encoding；

S25、将一个块对应的pixel embedding输入到inner WinT block中来处理特征，将处理后的输出通过全连接层变换后，与patch embedding结合，共同输入到outer WinT block中处理；

S27、将BiWinT block堆叠起来，构成BiWinT网络，BiWinT网络由4个BiWinT block堆叠而成，BiWinT block由一个固定窗口的多头自注意力机制模块和一个带移动窗的多头自注意力机制模块构成，其中pixel embedding输入到固定窗口多头自注意力机制模块中，经过处理后与patch embedding结合后输入到带移动窗的多头自注意力机制模块中，实现了不同窗口的信息交流；

S29、输出分类结果；

S3、对于识别为不可回收物品的垃圾，给出分类投放指导；

2.根据权利要求1所述的一种基于视觉的垃圾分类和云回收估价方法，其特征在于，步骤S3中，可回收物品的垃圾分为三大种类，包括生活杂物、电子数码和大件家具。

3.根据权利要求2所述的一种基于视觉的垃圾分类和云回收估价方法，其特征在于，对于电子数码和大件家具，首先用户通过使用状况评估来提交物品基本情况信息，然后通过基于视觉的外观缺损智能检测，得到物品的外观缺损情况，再通过市场回收估价。

4.根据权利要求3所述的一种基于视觉的垃圾分类和云回收估价方法，其特征在于，视觉检测指标为裂缝、掉漆、缺角、划伤和油污，其回收估价P_r为：其中P_M市场同类回收物品的平均回收价，S₁～S₅分别是裂缝、掉漆、缺角、划伤、油污的破损程度分数，θ是根据用户提交的物品情况信息作出的回收价格补偿。