CN116503118A

CN116503118A - 一种基于分类选择强化预测模型的废旧家电价值评估系统

Info

Publication number: CN116503118A
Application number: CN202310349535.9A
Authority: CN
Inventors: 陈依崭; 黄逸; 黄辰晔; 李鹏飞; 黄新林
Original assignee: Tongji University
Current assignee: Tongji University
Priority date: 2023-04-03
Filing date: 2023-04-03
Publication date: 2023-07-28

Abstract

本发明涉及废旧家电回收技术领域，提出了一种基于分类选择强化预测模型的废旧家电价值评估系统，包含数据预处理模块、模型训练模块和价值预估输出模块。本发明采用分类选择强化预测模型，能够对废旧家电的价值进行更准确的评估和预测；本发明采用人工智能技术，实现了对废旧家电的自动化处理；本发明综合考虑废旧家电的回收成本、功能状况、使用时间等因素，对废旧家电的价值进行评估和预测；本发明可以应用于各种类型的废旧家电，还可以应用于其他领域的价值评估和预测，如二手车等领域。

Description

一种基于分类选择强化预测模型的废旧家电价值评估系统

技术领域

本发明涉及废旧家电回收技术领域，尤其涉及一种基于分类选择强化预测模型的废旧家电价值评估系统。

背景技术

随着人们消费水平的提高和技术的不断进步，新款家电的更新换代速度越来越快，废旧家电的数量也逐渐增多。这些废旧家电中，有些可能仍然可以修复和再利用，而有些则需要回收和处理。废旧家电的回收和处理需要对其进行价值评估，以确定其实际价值和处理方式。然而，目前的废旧家电评估方法往往只能根据简单的外观和使用情况来估价，准确性较低。此外，传统的评估方法需要专业技术人员进行现场评估，费用较高且效率低下，难以应对庞大的废旧家电回收市场。

针对以上问题，近年来，一些基于机器学习和人工智能技术的废旧家电价值评估方法逐渐被提出。这些方法主要利用废旧家电的数据特征和历史数据，通过机器学习算法进行建模和预测，能够有效地提高废旧家电的价值评估准确性和效率。然而，现有的方法仍然存在一些问题，例如缺乏对不同品牌、型号、使用情况和破损程度的评估模型，难以实现全面的价值评估；同时，现有方法对废旧家电的分类和预测也存在一定的误差，需要进一步提高其准确性和实用性。因此，需要一种更准确、更实用的废旧家电价值评估方法，以提高废旧家电回收的效率和准确性。利用机器学习算法、最大比合并算法以及随机森林分类预测算法，构建基于分类选择强化预测模型的废旧家电价值评估方法，可以更准确地估计废旧家电的价值，同时避免了传统评估方法的不足，提高了回收效率和准确性。

发明内容

现有的废旧家电回收方式往往只能根据简单的外观和使用情况来估价，准确性较低、耗费较多人力资源，需要进一步提升废旧家电价值评估的精度和效率。本发明首先利用包含减法聚类的自适应模糊推理系统(SCM-ANFIS)在内的不同机器学习方法对废旧家电价值进行评估，再利用最大比合并算法对不同模型评估价格进行加权合并，最后采用分类选择强化预测模型的方法对废旧家电进行价值评估，可以更准确地估计废旧家电的价值，提高废旧家电回收的效率和准确性。

本发明提供了一种基于分类选择强化预测模型的废旧家电价值评估系统，包含数据预处理模块、模型训练模块和价值预估输出模块。

本发明提供基于分类选择强化预测模型的废旧家电价值评估方法，该方法综合运用了机器学习算法、最大比合并算法和随机森林分类预测算法，通过特征工程和模型优化提高了模型的准确性和可靠性，避免了传统评估方法的不足，该方法能够实现自动化处理，减少人工干预和人工费用，适应庞大的废旧家电回收市场，提高了废旧家电回收效率和准确性。同时，分类选择强化预测模型的应用可以进一步提高评估结果的准确性。

本发明的有益效果是：

提高价值评估的准确性：本发明采用分类选择强化预测模型，能够对废旧家电的价值进行更准确的评估和预测。该模型可以有效地学习废旧家电的数据特征，提高废旧家电的价值预测精度，有利于确定废旧家电的实际价值和处理方式。

自动化处理：本发明采用人工智能技术，实现了对废旧家电的自动化处理。该方法不仅可以减少人工干预和费用，还可以适应庞大的废旧家电回收市场，提高回收效率和准确性。

综合考虑多种因素：本发明综合考虑废旧家电的回收成本、功能状况、使用时间等因素，对废旧家电的价值进行评估和预测。该方法能够全面评估废旧家电的实际价值，有利于决定废旧家电的处理方式和市场定价。

应用广泛：本发明可以应用于各种类型的废旧家电，包括电视机、冰箱、洗衣机、空调等。同时，该方法还可以应用于其他领域的价值评估和预测，如二手车等领域。

附图说明

图1是本发明流程框架；

图2是一种ANFIS网络架构；

图3是本发明部分评估数据。

具体实施方式

下面将结合具体实施例及其附图对本申请提供的技术方案作进一步说明。结合下面说明，本申请的优点和特征将更加清楚。

本发明技术方案涉及技术：

(1)数据预处理及特征提取

数据采集：收集废旧家电的相关数据，包括品牌、型号、生产日期、使用年限、损坏情况等信息(即x₁,x₂,…,x_k表示输入系统变量)，并对数据进行清洗和处理，对数据进行清洗、筛选和归一化处理，以便进行后续建模和预测分析。

特征工程：对数据进行特征提取和选择，提取出需要的特征作为输入变量，建立特征矩阵，将废旧家电的真实价值作为输出变量。

主成分分析：对废旧家电的数据特征进行提取和降维，选取对价值评估具有显著影响的特征，排除噪声和无效特征，构建废旧家电的特征向量。

(2)模型建立和优化

模型训练：

利用包含减法聚类的自适应模糊推理系统(SCM-ANFIS)在内的不同机器学习方法对废旧家电价值进行评估。

最大比合并算法：

利用最大比合并算法对不同评估模型进行加权组合形成最大比合并模型。

(3)废旧家电价值评估

设置标签：根据最大比合并以及SCM-ANFIS方法预测结果，设置好训练集标签，标注出不同情况应选择何种评估模型，形成新的数据集。

分类选择强化预测模型：利用随机森林分类器对新的废旧家电数据集进行分类预测，训练过程中采用自适应增强方法，选择最佳特征和树的数量，优化分类器的性能。

图1是本发明流程框架,主要包含数据预处理模块、模型训练模块和价值预估输出模块，各个模块功能如下：

(1)数据预处理模块：包括异常数据处理、热度编码、数据标准化、PCA降维子模块，具体如下

(11)异常数据处理：针废旧家电回收数据集(举例而非限定，如：品牌、型号、生产日期、使用年限、损坏情况等信息)，进行异常数据和噪声数据的处理，处理方法包括3sigma原则、Boxplot、Z-score、Grubbs，针对异常离群数据进行删除处理，针对空白数据利用均值进行补充。

(12)热度编码：由于数据集中涉及一些文字数据，如电视品牌、屏幕好坏等。这些文字信息不能被神经网络直接识别，需要转化为数值数据，因此需要对它们进行编码处理。热度编码被称为一位有效编码，假设需要对有M个状态进行热度编码，则热度编码的位数为M，编码中仅有一位有效位为1，其余为0。例如，对废旧家电家电中的屏幕好坏进行热度编码，其有好或坏两种状态可能，则屏幕为好的编码可以用“01”进行表示，屏幕为坏的编码可以用“10”进行表示。将所有的文字信息进行热度编码后再与原来的数据进行拼接，形成新的数据集。

(13)数据标准化：将已经进行编码后的数据按照11:1划分为训练集和测试集，训练集和测试集排序的顺序完全随机。将训练集和测试集进行标准化，进行标准化的目的是去除数据由于不同量纲、不同数量级造成的数值问题。本发明采用的数据标准化方法为0-1规范化(MinMax normalization)，将原始数据缩放到[0,1]区间内，设有数据x₁,x₂,…x_j,…x_n，其中x_max表示最大数据，x_min表示其中最小数据，则对应于原始数据x_j的处理后的新数据x′_j表示为：

Δ_j＝x_max-x_min (1)

x′_j＝(x_j-x_min)/Δ_j (2)

(14)PCA降维：主成分分析(PCA)是一种基于多元统计分析的检测方法，通常被用在Machine Learning中的特征提取和数据降维。PCA可以在不丢失太多信息的情况下用更少的主成分表示数据，从而降低数据的维数。

经过指标数据规范化后的训练集为X，一共有p个指标，有n个样本，表示有p个特征因子

X＝[X₁,X₂,…,X_i,…,X_p] (3)

X_i＝[x_i1,x_i2,…,x_ij,…,x_in]^T (4)

将X进行标准化矩阵操作得到矩阵Z，求解相关系数矩阵R

求解相关矩阵R的特征方程|R-λI_k|＝0中的未知数λ，解得p个特征根

{λ₁,…,λ_j,…,λ_p} (6)

Y_j表示第j个主成分的贡献率，贡献率的大小反应了它包含X＝[X₁,X₂,…,X_i,…,X_p]信息的多少。

计算特征根的累计贡献率C。如果选取m个指标来进行降维，一般来说m使得累计贡献率C大于0.85则已经表示这m个指标已经可以很大程度表示X相关信息。

本发明选择C大于0.9的数据指标作为主要数据输入特征。

(2)模型训练模块：

具体如下：

(21)将PCA降维后的数据利用SCM-ANFIS减法聚类的自适应网络模糊推理系统、BP神经网络、T-S模糊神经网络、随机森林、LSTM长短记忆网络五种模型进行训练。

BP神经网络是一种多层前馈神经网络，其学习算法使用反向传播算法来更新网络权重。

步骤为：

确定网络的拓扑结构，包括输入层、隐藏层和输出层的神经元数目；

初始化权重和偏置；

输入训练样本并计算输出；

计算误差，并通过反向传播算法调整权重和偏置，使误差最小化；

重复以上步骤直至误差满足要求。

T-S模糊神经网络是一种基于模糊逻辑的神经网络，T-S模糊神经网络的每个输出都是由一组线性函数的和组成，T-S模糊神经网络将输入变量映射到隶属度函数，然后使用模糊规则进行推理，并对每个规则的输出进行加权和。

步骤为：

确定输入和输出的变量范围，并设定模糊集的划分；

选择合适的隶属函数，并构建隶属度矩阵和规则库；

训练模型，包括前向传播和反向传播；

预测输出，计算误差并评估模型性能。

随机森林是在构建每棵决策树时，使用随机子集的训练数据和随机选择的特征子集来进行训练，以增加树的随机性，随机森林通过每棵决策树的投票来确定最终的输出。

步骤为：

从训练集中随机抽取一定数量的样本和特征；

构建多个决策树，并对每个决策树进行训练；

预测输出，将多个决策树的输出进行平均或加权平均；

计算误差并评估模型性能。

LSTM是一种特殊的循环神经网络，用于处理具有长期依赖性的序列数据。LSTM中的状态单元可以存储长期信息，而隐藏状态则可以传递短期信息。

步骤为：

确定网络的拓扑结构，包括LSTM层和输出层的神经元数目；

初始化权重和偏置；

输入训练样本并计算输出；

重复以上步骤直至误差满足要求。

(22)SCM-ANFIS采用if-then规则，设Rⁱ表示模糊规则，共有i条规则，其表达形式为：

Rⁱ：if x₁ is A_i1 and x₂ is A_i2 and…and x_kis A_ik,then y_i

＝c_i0+c_i1x₁+c_i2x₂+…+c_ikx_k

其中“if”部分是模糊的，被称为前件部分或者理由部分，x₁,x₂,…,x_k表示输入系统变量，A_i1,A_i2,…,A_ik表示对应的模糊集合，“then”部分是确定的，被称为后件部分或者推断部分，y表示家电回收价值推理结果(例如估计价值)，c_i0,c_i1,…,c_ik表示不同输入变量权重，图2展示了一种3输入1输出的ANFIS结构。ANFIS包含5层结构，ANFIS第一层计算归属度；第二层计算归属度权重；第三层计算正则化后归属度权重；第四层计算每个规则的输出；第五层为总和每个规则的输出作为系统输出。在SCM-ANFIS评估废旧家电回收价值中，所有的权重都通过训练集训练得到，下面介绍SCM-ANFIS废旧家电评估聚类方法。

(23)在训练集数据中的n个样本X_i＝[x₁,x₂,…,x_i,…,x_n]^T，先计算每个数据点的密度D_i。

r_a表示聚类的半径，聚类算法选择出密度最大的数据点作为中心，在计算其他数据点的密度时，需要去除其他聚类中心的影响。设x_i表示为已经选好的数据点，D_c表示其密度，则对公式10进行修正

r_b表示密度值显著减少的半径，表示靠近第1个聚类中心x_c的数据点的密度在修改后变小了，难以成为下一个聚类中心。不断重复以上步骤，选定下一个聚类中心，直到得到期望的聚类中心数量。

(24)利用训练集进行数据训练。将训练好的模型保存，输入到价值评估模块当中，不同模型输出价格为X_est1,X_est2,X_est3,X_est4,X_est5。

(25)将以上5种模型的训练集数据输出结果利用最大比合并方法计算不同模型的权重，在测试集中利用以上权重进行加权组合得到最大比合并方法CEM-MRC方法的输出结果X_MRC，最优方法的SCM-ANFIS模型输出结果为X_est1。

X_est1,X_est2,X_est3,X_est4,X_est5表示不同模型训练集的输出结果，为列向量，X_ACC表示训练集真实回收价格，N₁,N₂,N₃,N₄,N₅表示噪声或真实值与预测值之间的误差。

Y表示不同训练集输出结果组成的矩阵

令W＝(w₁ w₂ w₃ w₄ w₅)代表不同模型权重

则信噪比SNR可以表示为：

使得信噪比SNR最大，由于是已知固定值，则/>为常数，上式等于最大化以下公式：

由于是加权方式，所以w₁+w₂+w₃+w₄+w₅＝1，要使以上公式最大化，则需分母最小化：

可得：

则最大比合并废旧家电预估输出值为：

(3)价值评估模块

(31)利用训练集最大比合并方法构造辅助参考价格变量，即利用X_est1和X_MRC构造出预估真实价格X_price ₃，将以上三种价格(X_est1、X_MRC、X_price ₃)和PCA降维后的数据作为训练集输出部分送入模型进行训练。在训练集中将SCM-ANFIS与CEM-MRC中MAPE较低的方法进行标注，作为分类依据的标签一起组成新的数据集，标签如下：

(32)利用随机森林分类训练分类算法，实现分类选择的强化预测模型在测试集中自动选择X_est1或X_MRC，X_output＝switch(X_est1,X_MRC)，以达到减小整体评价误差的目的。

(33)随机森林分类预测步骤为：

(331)从新的数据集中随机选择N个样本，允许重复，用这些样本训练一棵决策树，作为随机森林中的一个子模型。

(332)随机从M个特征中选择m个特征，其中m<<M，然后用某种度量(如Gini指数)选择一个最佳的特征作为当前节点的分裂特征。

(333)按照步骤(332)一直递归地分裂节点，直到达到最大深度(max_depth)或者节点中的样本数小于最小拆分样本数时停止。每个叶子节点都代表一个分类结果。

(334)重复(331)-(333)步骤，构建多棵决策树。每棵决策树都是从不同的样本集和特征集中训练出来的。

(335)对于一个新的样本，让每棵决策树分别对其进行分类，并统计各类别的得票数，选择得票最多的类别作为随机森林的最终分类结果。

在这个过程中，通过调整随机森林的参数(如max_depth等)来控制模型的性能和复杂度。同时使用特征重要性评估方法来分析每个特征对分类结果的影响程度，以便于特征选择和模型优化。

(34)分类模型能根据以上数据训练后在测试集中评估出在何种情况下应选择哪一种方法进行模型评估。最终在测试集上输出废旧家电的评估结果，EEM-CS的方法将在SCM-ANFIS与CEM-MRC方法中选择一种进行输出，图3展示了部分本发明实验结果。

上述描述仅是对本申请较佳实施例的描述，并非是对本申请范围的任何限定。任何熟悉该领域的普通技术人员根据上述揭示的技术内容做出的任何变更或修饰均应当视为等同的有效实施例，均属于本申请技术方案保护的范围。

Claims

1.一种基于分类选择强化预测模型的废旧家电价值评估系统，特征在于，包含数据预处理模块、模型训练模块和价值预估输出模块。

2.如权利要求1所述的基于分类选择强化预测模型的废旧家电价值评估系统，特征在于，所述数据预处理模块：包括异常数据处理、热度编码、数据标准化、PCA降维子模块，具体如下：

(11)异常数据处理：针废旧家电回收数据集，进行异常数据和噪声数据的处理，针对异常离群数据进行删除处理，针对空白数据利用均值进行补充；

(12)热度编码：数据集中涉的文字数据，转化为数值数据，对它们进行编码处理；对废旧家电家电中的屏幕好坏进行热度编码，其有好或坏两种状态可能，则屏幕为好的编码用“01”进行表示，屏幕为坏的编码用“10”进行表示；将所有的文字信息进行热度编码后再与原来的数据进行拼接，形成新的数据集；

(13)数据标准化：将已经进行编码后的数据按照11:1划分为训练集和测试集，训练集和测试集排序的顺序完全随机；将训练集和测试集进行标准化；采用的数据标准化方法为0-1规范化即MinMax normalization，将原始数据缩放到[0,1]区间内，设有数据x₁,x₂,…x_j,…x_n，其中x_max表示最大数据，x_min表示其中最小数据，则对应于原始数据x_j的处理后的新数据x′_j表示为：

Δ_j＝x_max-x_min (1)

x′_j＝(x_j-x_min)/Δ_j (2)

(14)PCA降维：用更少的主成分表示数据，降低数据的维数；

X＝[X₁,X₂,…,X_i,…,X_p] (3)

X_i＝[x_i1,x_i2,…,x_ij,…,x_in]^T (4)

将X进行标准化矩阵操作得到矩阵Z，求解相关系数矩阵R

{λ₁,…,λ_j,…,λ_p} (6)

Y_j表示第j个主成分的贡献率，贡献率的大小反应了它包含X＝[X₁,X₂,…,X_i,…,X_p]信息的多少；

计算特征根的累计贡献率C；如果选取m个指标来进行降维，m使得累计贡献率C大于0.85则表示这m个指标可以表示X相关信息，选择C大于0.9的数据指标作为主要数据输入特征，

3.如权利要求1所述的基于分类选择强化预测模型的废旧家电价值评估系统，特征在于，所述模型训练模块，具体如下：

(21)将PCA降维后的数据利用SCM-ANFIS减法聚类的自适应网络模糊推理系统、BP神经网络、T-S模糊神经网络、随机森林、LSTM长短记忆网络五种模型进行训练；

Rⁱ：if x₁is A_i1and x₂is A_i2and…and x_kis A_ik,then y_i＝c_i0+c_i1x₁+c_i2x₂+…+c_ikx_k

其中“if”部分是模糊的，被称为前件部分或者理由部分，x₁,x₂,…,x_k表示输入系统变量，A_i1,A_i2,…,A_ik表示对应的模糊集合，“then”部分是确定的，被称为后件部分或者推断部分，y表示家电回收价值推理结果即为估计价值，c_i0,c_i1,…,c_ik表示不同输入变量权重；

ANFIS包含5层结构，ANFIS第一层计算归属度；第二层计算归属度权重；第三层计算正则化后归属度权重；第四层计算每个规则的输出；第五层为总和每个规则的输出作为系统输出；

(23)SCM-ANFIS废旧家电评估聚类方法：

在训练集数据中的n个样本X_i＝[x₁,x₂,…,x_i,…,x_n]^T，先计算每个数据点的密度D_i：

r_a表示聚类的半径，聚类算法选择出密度最大的数据点作为中心，在计算其他数据点的密度时，需要去除其他聚类中心的影响；设x_i表示为已经选好的数据点，D_c表示其密度，则对公式10进行修正

r_b表示密度值显著减少的半径，表示靠近第1个聚类中心x_c的数据点的密度在修改后变小了，难以成为下一个聚类中心；不断重复以上步骤，选定下一个聚类中心，直到得到期望的聚类中心数量；

(24)训练集各组数据，将训练好的模型保存，输入到价值评估模块当中，不同模型输出价格为X_est1,X_est2,X_est3,X_est4,X_est5；

(25)将以上5种模型的训练集数据输出结果利用最大比合并方法计算不同模型的权重，在测试集中利用以上权重进行加权组合得到最大比合并方法CEM-MRC的输出结果X_MRC，最优方法的SCM-ANFIS模型输出结果为X_est1；

X_est1,X_est2,X_est3,X_est4,X_est5表示不同模型训练集的输出结果，为列向量，X_ACC表示训练集真实回收价格，N₁,N₂,N₃,N₄,N₅表示噪声或真实值与预测值之间的误差，

Y表示不同训练集输出结果组成的矩阵

令W＝(w₁ w₂ w₃ w₄ w₅)代表不同模型权重

则信噪比SNR表示为：

使得信噪比SNR最大，是已知固定值，则/>为常数，上式等于最大化以下公式：

w₁+w₂+w₃+w₄+w₅＝1，要使以上公式(17)最大化，则需分母最小化：

得：

则最大比合并废旧家电预估输出值为：

4.如权利要求1所述的基于分类选择强化预测模型的废旧家电价值评估系统，特征在于，所述价值评估模块：

(31)利用训练集最大比合并方法构造辅助参考价格变量，即利用X_est1和X_MRC构造出预估真实价格X_price3，将以上三种价格即X_est1、X_MRC、X_price3和PCA降维后的数据作为训练集输出部分送入模型进行训练；在训练集中将SCM-ANFIS与CEM-MRC中平均绝对百分比误差MAPE较低的方法进行标注，作为分类依据的标签一起组成新的数据集，标签如下：

(32)利用随机森林分类训练分类算法，实现分类选择的强化预测模型在测试集中自动选择X_est1或X_MRC，X_output＝switch(X_est1,X_MRC)，以达到减小整体评价误差的目的；

(33)随机森林分类预测步骤为：

(331)从新的数据集中随机选择N个样本，允许重复，用这些样本训练一棵决策树，作为随机森林中的一个子模型；

(332)随机从M个特征中选择m个特征，其中m<<M，然后用Gini指数度量选择一个最佳的特征作为当前节点的分裂特征；

(333)按照步骤(332)一直递归地分裂节点，直到达到最大深度或者节点中的样本数小于最小拆分样本数时停止；每个叶子节点都代表一个分类结果；

(334)重复(331)-(333)步骤，构建多棵决策树；每棵决策树都是从不同的样本集和特征集中训练出来的；

(335)对于一个新的样本，让每棵决策树分别对其进行分类，并统计各类别的得票数，选择得票最多的类别作为随机森林的最终分类结果；

(34)分类模型输出废旧家电的评估结果，在SCM-ANFIS与CEM-MRC方法中选择一种进行输出。