CN116503118A - 一种基于分类选择强化预测模型的废旧家电价值评估系统 - Google Patents
一种基于分类选择强化预测模型的废旧家电价值评估系统 Download PDFInfo
- Publication number
- CN116503118A CN116503118A CN202310349535.9A CN202310349535A CN116503118A CN 116503118 A CN116503118 A CN 116503118A CN 202310349535 A CN202310349535 A CN 202310349535A CN 116503118 A CN116503118 A CN 116503118A
- Authority
- CN
- China
- Prior art keywords
- data
- value
- training
- model
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002699 waste material Substances 0.000 title claims abstract description 68
- 238000011156 evaluation Methods 0.000 title claims abstract description 37
- 230000002787 reinforcement Effects 0.000 title claims abstract description 10
- 238000011084 recovery Methods 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims description 51
- 238000000034 method Methods 0.000 claims description 38
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000007637 random forest analysis Methods 0.000 claims description 16
- 238000003066 decision tree Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 11
- 230000009467 reduction Effects 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 6
- 101100119167 Drosophila mojavensis Est-4 gene Proteins 0.000 claims description 4
- 101100226146 Drosophila mojavensis Est-5 gene Proteins 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 2
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 2
- 238000013145 classification model Methods 0.000 claims description 2
- 230000001502 supplementing effect Effects 0.000 claims description 2
- 238000007635 classification algorithm Methods 0.000 claims 1
- 238000002372 labelling Methods 0.000 claims 1
- 238000005259 measurement Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000000513 principal component analysis Methods 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 6
- 238000004064 recycling Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/048—Fuzzy inferencing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02W—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
- Y02W90/00—Enabling technologies or technologies with a potential or indirect contribution to greenhouse gas [GHG] emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Automation & Control Theory (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Processing Of Solid Wastes (AREA)
Abstract
本发明涉及废旧家电回收技术领域,提出了一种基于分类选择强化预测模型的废旧家电价值评估系统,包含数据预处理模块、模型训练模块和价值预估输出模块。本发明采用分类选择强化预测模型,能够对废旧家电的价值进行更准确的评估和预测;本发明采用人工智能技术,实现了对废旧家电的自动化处理;本发明综合考虑废旧家电的回收成本、功能状况、使用时间等因素,对废旧家电的价值进行评估和预测;本发明可以应用于各种类型的废旧家电,还可以应用于其他领域的价值评估和预测,如二手车等领域。
Description
技术领域
本发明涉及废旧家电回收技术领域,尤其涉及一种基于分类选择强化预测模型的废旧家电价值评估系统。
背景技术
随着人们消费水平的提高和技术的不断进步,新款家电的更新换代速度越来越快,废旧家电的数量也逐渐增多。这些废旧家电中,有些可能仍然可以修复和再利用,而有些则需要回收和处理。废旧家电的回收和处理需要对其进行价值评估,以确定其实际价值和处理方式。然而,目前的废旧家电评估方法往往只能根据简单的外观和使用情况来估价,准确性较低。此外,传统的评估方法需要专业技术人员进行现场评估,费用较高且效率低下,难以应对庞大的废旧家电回收市场。
针对以上问题,近年来,一些基于机器学习和人工智能技术的废旧家电价值评估方法逐渐被提出。这些方法主要利用废旧家电的数据特征和历史数据,通过机器学习算法进行建模和预测,能够有效地提高废旧家电的价值评估准确性和效率。然而,现有的方法仍然存在一些问题,例如缺乏对不同品牌、型号、使用情况和破损程度的评估模型,难以实现全面的价值评估;同时,现有方法对废旧家电的分类和预测也存在一定的误差,需要进一步提高其准确性和实用性。因此,需要一种更准确、更实用的废旧家电价值评估方法,以提高废旧家电回收的效率和准确性。利用机器学习算法、最大比合并算法以及随机森林分类预测算法,构建基于分类选择强化预测模型的废旧家电价值评估方法,可以更准确地估计废旧家电的价值,同时避免了传统评估方法的不足,提高了回收效率和准确性。
发明内容
现有的废旧家电回收方式往往只能根据简单的外观和使用情况来估价,准确性较低、耗费较多人力资源,需要进一步提升废旧家电价值评估的精度和效率。本发明首先利用包含减法聚类的自适应模糊推理系统(SCM-ANFIS)在内的不同机器学习方法对废旧家电价值进行评估,再利用最大比合并算法对不同模型评估价格进行加权合并,最后采用分类选择强化预测模型的方法对废旧家电进行价值评估,可以更准确地估计废旧家电的价值,提高废旧家电回收的效率和准确性。
本发明提供了一种基于分类选择强化预测模型的废旧家电价值评估系统,包含数据预处理模块、模型训练模块和价值预估输出模块。
本发明提供基于分类选择强化预测模型的废旧家电价值评估方法,该方法综合运用了机器学习算法、最大比合并算法和随机森林分类预测算法,通过特征工程和模型优化提高了模型的准确性和可靠性,避免了传统评估方法的不足,该方法能够实现自动化处理,减少人工干预和人工费用,适应庞大的废旧家电回收市场,提高了废旧家电回收效率和准确性。同时,分类选择强化预测模型的应用可以进一步提高评估结果的准确性。
本发明的有益效果是:
提高价值评估的准确性:本发明采用分类选择强化预测模型,能够对废旧家电的价值进行更准确的评估和预测。该模型可以有效地学习废旧家电的数据特征,提高废旧家电的价值预测精度,有利于确定废旧家电的实际价值和处理方式。
自动化处理:本发明采用人工智能技术,实现了对废旧家电的自动化处理。该方法不仅可以减少人工干预和费用,还可以适应庞大的废旧家电回收市场,提高回收效率和准确性。
综合考虑多种因素:本发明综合考虑废旧家电的回收成本、功能状况、使用时间等因素,对废旧家电的价值进行评估和预测。该方法能够全面评估废旧家电的实际价值,有利于决定废旧家电的处理方式和市场定价。
应用广泛:本发明可以应用于各种类型的废旧家电,包括电视机、冰箱、洗衣机、空调等。同时,该方法还可以应用于其他领域的价值评估和预测,如二手车等领域。
附图说明
图1是本发明流程框架;
图2是一种ANFIS网络架构;
图3是本发明部分评估数据。
具体实施方式
下面将结合具体实施例及其附图对本申请提供的技术方案作进一步说明。结合下面说明,本申请的优点和特征将更加清楚。
本发明技术方案涉及技术:
(1)数据预处理及特征提取
数据采集:收集废旧家电的相关数据,包括品牌、型号、生产日期、使用年限、损坏情况等信息(即x1,x2,…,xk表示输入系统变量),并对数据进行清洗和处理,对数据进行清洗、筛选和归一化处理,以便进行后续建模和预测分析。
特征工程:对数据进行特征提取和选择,提取出需要的特征作为输入变量,建立特征矩阵,将废旧家电的真实价值作为输出变量。
主成分分析:对废旧家电的数据特征进行提取和降维,选取对价值评估具有显著影响的特征,排除噪声和无效特征,构建废旧家电的特征向量。
(2)模型建立和优化
模型训练:
利用包含减法聚类的自适应模糊推理系统(SCM-ANFIS)在内的不同机器学习方法对废旧家电价值进行评估。
最大比合并算法:
利用最大比合并算法对不同评估模型进行加权组合形成最大比合并模型。
(3)废旧家电价值评估
设置标签:根据最大比合并以及SCM-ANFIS方法预测结果,设置好训练集标签,标注出不同情况应选择何种评估模型,形成新的数据集。
分类选择强化预测模型:利用随机森林分类器对新的废旧家电数据集进行分类预测,训练过程中采用自适应增强方法,选择最佳特征和树的数量,优化分类器的性能。
图1是本发明流程框架,主要包含数据预处理模块、模型训练模块和价值预估输出模块,各个模块功能如下:
(1)数据预处理模块:包括异常数据处理、热度编码、数据标准化、PCA降维子模块,具体如下
(11)异常数据处理:针废旧家电回收数据集(举例而非限定,如:品牌、型号、生产日期、使用年限、损坏情况等信息),进行异常数据和噪声数据的处理,处理方法包括3sigma原则、Boxplot、Z-score、Grubbs,针对异常离群数据进行删除处理,针对空白数据利用均值进行补充。
(12)热度编码:由于数据集中涉及一些文字数据,如电视品牌、屏幕好坏等。这些文字信息不能被神经网络直接识别,需要转化为数值数据,因此需要对它们进行编码处理。热度编码被称为一位有效编码,假设需要对有M个状态进行热度编码,则热度编码的位数为M,编码中仅有一位有效位为1,其余为0。例如,对废旧家电家电中的屏幕好坏进行热度编码,其有好或坏两种状态可能,则屏幕为好的编码可以用“01”进行表示,屏幕为坏的编码可以用“10”进行表示。将所有的文字信息进行热度编码后再与原来的数据进行拼接,形成新的数据集。
(13)数据标准化:将已经进行编码后的数据按照11:1划分为训练集和测试集,训练集和测试集排序的顺序完全随机。将训练集和测试集进行标准化,进行标准化的目的是去除数据由于不同量纲、不同数量级造成的数值问题。本发明采用的数据标准化方法为0-1规范化(MinMax normalization),将原始数据缩放到[0,1]区间内,设有数据x1,x2,…xj,…xn,其中xmax表示最大数据,xmin表示其中最小数据,则对应于原始数据xj的处理后的新数据x′j表示为:
Δj=xmax-xmin (1)
x′j=(xj-xmin)/Δj (2)
(14)PCA降维:主成分分析(PCA)是一种基于多元统计分析的检测方法,通常被用在Machine Learning中的特征提取和数据降维。PCA可以在不丢失太多信息的情况下用更少的主成分表示数据,从而降低数据的维数。
经过指标数据规范化后的训练集为X,一共有p个指标,有n个样本,表示有p个特征因子
X=[X1,X2,…,Xi,…,Xp] (3)
Xi=[xi1,xi2,…,xij,…,xin]T (4)
将X进行标准化矩阵操作得到矩阵Z,求解相关系数矩阵R
求解相关矩阵R的特征方程|R-λIk|=0中的未知数λ,解得p个特征根
{λ1,…,λj,…,λp} (6)
Yj表示第j个主成分的贡献率,贡献率的大小反应了它包含X=[X1,X2,…,Xi,…,Xp]信息的多少。
计算特征根的累计贡献率C。如果选取m个指标来进行降维,一般来说m使得累计贡献率C大于0.85则已经表示这m个指标已经可以很大程度表示X相关信息。
本发明选择C大于0.9的数据指标作为主要数据输入特征。
(2)模型训练模块:
具体如下:
(21)将PCA降维后的数据利用SCM-ANFIS减法聚类的自适应网络模糊推理系统、BP神经网络、T-S模糊神经网络、随机森林、LSTM长短记忆网络五种模型进行训练。
BP神经网络是一种多层前馈神经网络,其学习算法使用反向传播算法来更新网络权重。
步骤为:
确定网络的拓扑结构,包括输入层、隐藏层和输出层的神经元数目;
初始化权重和偏置;
输入训练样本并计算输出;
计算误差,并通过反向传播算法调整权重和偏置,使误差最小化;
重复以上步骤直至误差满足要求。
T-S模糊神经网络是一种基于模糊逻辑的神经网络,T-S模糊神经网络的每个输出都是由一组线性函数的和组成,T-S模糊神经网络将输入变量映射到隶属度函数,然后使用模糊规则进行推理,并对每个规则的输出进行加权和。
步骤为:
确定输入和输出的变量范围,并设定模糊集的划分;
选择合适的隶属函数,并构建隶属度矩阵和规则库;
训练模型,包括前向传播和反向传播;
预测输出,计算误差并评估模型性能。
随机森林是在构建每棵决策树时,使用随机子集的训练数据和随机选择的特征子集来进行训练,以增加树的随机性,随机森林通过每棵决策树的投票来确定最终的输出。
步骤为:
从训练集中随机抽取一定数量的样本和特征;
构建多个决策树,并对每个决策树进行训练;
预测输出,将多个决策树的输出进行平均或加权平均;
计算误差并评估模型性能。
LSTM是一种特殊的循环神经网络,用于处理具有长期依赖性的序列数据。LSTM中的状态单元可以存储长期信息,而隐藏状态则可以传递短期信息。
步骤为:
确定网络的拓扑结构,包括LSTM层和输出层的神经元数目;
初始化权重和偏置;
输入训练样本并计算输出;
计算误差,并通过反向传播算法调整权重和偏置,使误差最小化;
重复以上步骤直至误差满足要求。
(22)SCM-ANFIS采用if-then规则,设Ri表示模糊规则,共有i条规则,其表达形式为:
Ri:if x1 is Ai1 and x2 is Ai2 and…and xkis Aik,then yi
=ci0+ci1x1+ci2x2+…+cikxk
其中“if”部分是模糊的,被称为前件部分或者理由部分,x1,x2,…,xk表示输入系统变量,Ai1,Ai2,…,Aik表示对应的模糊集合,“then”部分是确定的,被称为后件部分或者推断部分,y表示家电回收价值推理结果(例如估计价值),ci0,ci1,…,cik表示不同输入变量权重,图2展示了一种3输入1输出的ANFIS结构。ANFIS包含5层结构,ANFIS第一层计算归属度;第二层计算归属度权重;第三层计算正则化后归属度权重;第四层计算每个规则的输出;第五层为总和每个规则的输出作为系统输出。在SCM-ANFIS评估废旧家电回收价值中,所有的权重都通过训练集训练得到,下面介绍SCM-ANFIS废旧家电评估聚类方法。
(23)在训练集数据中的n个样本Xi=[x1,x2,…,xi,…,xn]T,先计算每个数据点的密度Di。
ra表示聚类的半径,聚类算法选择出密度最大的数据点作为中心,在计算其他数据点的密度时,需要去除其他聚类中心的影响。设xi表示为已经选好的数据点,Dc表示其密度,则对公式10进行修正
rb表示密度值显著减少的半径,表示靠近第1个聚类中心xc的数据点的密度在修改后变小了,难以成为下一个聚类中心。不断重复以上步骤,选定下一个聚类中心,直到得到期望的聚类中心数量。
(24)利用训练集进行数据训练。将训练好的模型保存,输入到价值评估模块当中,不同模型输出价格为Xest1,Xest2,Xest3,Xest4,Xest5。
(25)将以上5种模型的训练集数据输出结果利用最大比合并方法计算不同模型的权重,在测试集中利用以上权重进行加权组合得到最大比合并方法CEM-MRC方法的输出结果XMRC,最优方法的SCM-ANFIS模型输出结果为Xest1。
Xest1,Xest2,Xest3,Xest4,Xest5表示不同模型训练集的输出结果,为列向量,XACC表示训练集真实回收价格,N1,N2,N3,N4,N5表示噪声或真实值与预测值之间的误差。
Y表示不同训练集输出结果组成的矩阵
令W=(w1 w2 w3 w4 w5)代表不同模型权重
则信噪比SNR可以表示为:
使得信噪比SNR最大,由于是已知固定值,则/>为常数,上式等于最大化以下公式:
由于是加权方式,所以w1+w2+w3+w4+w5=1,要使以上公式最大化,则需分母最小化:
可得:
则最大比合并废旧家电预估输出值为:
(3)价值评估模块
(31)利用训练集最大比合并方法构造辅助参考价格变量,即利用Xest1和XMRC构造出预估真实价格Xprice 3,将以上三种价格(Xest1、XMRC、Xprice 3)和PCA降维后的数据作为训练集输出部分送入模型进行训练。在训练集中将SCM-ANFIS与CEM-MRC中MAPE较低的方法进行标注,作为分类依据的标签一起组成新的数据集,标签如下:
(32)利用随机森林分类训练分类算法,实现分类选择的强化预测模型在测试集中自动选择Xest1或XMRC,Xoutput=switch(Xest1,XMRC),以达到减小整体评价误差的目的。
(33)随机森林分类预测步骤为:
(331)从新的数据集中随机选择N个样本,允许重复,用这些样本训练一棵决策树,作为随机森林中的一个子模型。
(332)随机从M个特征中选择m个特征,其中m<<M,然后用某种度量(如Gini指数)选择一个最佳的特征作为当前节点的分裂特征。
(333)按照步骤(332)一直递归地分裂节点,直到达到最大深度(max_depth)或者节点中的样本数小于最小拆分样本数时停止。每个叶子节点都代表一个分类结果。
(334)重复(331)-(333)步骤,构建多棵决策树。每棵决策树都是从不同的样本集和特征集中训练出来的。
(335)对于一个新的样本,让每棵决策树分别对其进行分类,并统计各类别的得票数,选择得票最多的类别作为随机森林的最终分类结果。
在这个过程中,通过调整随机森林的参数(如max_depth等)来控制模型的性能和复杂度。同时使用特征重要性评估方法来分析每个特征对分类结果的影响程度,以便于特征选择和模型优化。
(34)分类模型能根据以上数据训练后在测试集中评估出在何种情况下应选择哪一种方法进行模型评估。最终在测试集上输出废旧家电的评估结果,EEM-CS的方法将在SCM-ANFIS与CEM-MRC方法中选择一种进行输出,图3展示了部分本发明实验结果。
上述描述仅是对本申请较佳实施例的描述,并非是对本申请范围的任何限定。任何熟悉该领域的普通技术人员根据上述揭示的技术内容做出的任何变更或修饰均应当视为等同的有效实施例,均属于本申请技术方案保护的范围。
Claims (4)
1.一种基于分类选择强化预测模型的废旧家电价值评估系统,特征在于,包含数据预处理模块、模型训练模块和价值预估输出模块。
2.如权利要求1所述的基于分类选择强化预测模型的废旧家电价值评估系统,特征在于,所述数据预处理模块:包括异常数据处理、热度编码、数据标准化、PCA降维子模块,具体如下:
(11)异常数据处理:针废旧家电回收数据集,进行异常数据和噪声数据的处理,针对异常离群数据进行删除处理,针对空白数据利用均值进行补充;
(12)热度编码:数据集中涉的文字数据,转化为数值数据,对它们进行编码处理;对废旧家电家电中的屏幕好坏进行热度编码,其有好或坏两种状态可能,则屏幕为好的编码用“01”进行表示,屏幕为坏的编码用“10”进行表示;将所有的文字信息进行热度编码后再与原来的数据进行拼接,形成新的数据集;
(13)数据标准化:将已经进行编码后的数据按照11:1划分为训练集和测试集,训练集和测试集排序的顺序完全随机;将训练集和测试集进行标准化;采用的数据标准化方法为0-1规范化即MinMax normalization,将原始数据缩放到[0,1]区间内,设有数据x1,x2,…xj,…xn,其中xmax表示最大数据,xmin表示其中最小数据,则对应于原始数据xj的处理后的新数据x′j表示为:
Δj=xmax-xmin (1)
x′j=(xj-xmin)/Δj (2)
(14)PCA降维:用更少的主成分表示数据,降低数据的维数;
经过指标数据规范化后的训练集为X,一共有p个指标,有n个样本,表示有p个特征因子
X=[X1,X2,…,Xi,…,Xp] (3)
Xi=[xi1,xi2,…,xij,…,xin]T (4)
将X进行标准化矩阵操作得到矩阵Z,求解相关系数矩阵R
求解相关矩阵R的特征方程|R-λIk|=0中的未知数λ,解得p个特征根
{λ1,…,λj,…,λp} (6)
Yj表示第j个主成分的贡献率,贡献率的大小反应了它包含X=[X1,X2,…,Xi,…,Xp]信息的多少;
计算特征根的累计贡献率C;如果选取m个指标来进行降维,m使得累计贡献率C大于0.85则表示这m个指标可以表示X相关信息,选择C大于0.9的数据指标作为主要数据输入特征,
3.如权利要求1所述的基于分类选择强化预测模型的废旧家电价值评估系统,特征在于,所述模型训练模块,具体如下:
(21)将PCA降维后的数据利用SCM-ANFIS减法聚类的自适应网络模糊推理系统、BP神经网络、T-S模糊神经网络、随机森林、LSTM长短记忆网络五种模型进行训练;
(22)SCM-ANFIS采用if-then规则,设Ri表示模糊规则,共有i条规则,其表达形式为:
Ri:if x1is Ai1and x2is Ai2and…and xkis Aik,then yi=ci0+ci1x1+ci2x2+…+cikxk
其中“if”部分是模糊的,被称为前件部分或者理由部分,x1,x2,…,xk表示输入系统变量,Ai1,Ai2,…,Aik表示对应的模糊集合,“then”部分是确定的,被称为后件部分或者推断部分,y表示家电回收价值推理结果即为估计价值,ci0,ci1,…,cik表示不同输入变量权重;
ANFIS包含5层结构,ANFIS第一层计算归属度;第二层计算归属度权重;第三层计算正则化后归属度权重;第四层计算每个规则的输出;第五层为总和每个规则的输出作为系统输出;
(23)SCM-ANFIS废旧家电评估聚类方法:
在训练集数据中的n个样本Xi=[x1,x2,…,xi,…,xn]T,先计算每个数据点的密度Di:
ra表示聚类的半径,聚类算法选择出密度最大的数据点作为中心,在计算其他数据点的密度时,需要去除其他聚类中心的影响;设xi表示为已经选好的数据点,Dc表示其密度,则对公式10进行修正
rb表示密度值显著减少的半径,表示靠近第1个聚类中心xc的数据点的密度在修改后变小了,难以成为下一个聚类中心;不断重复以上步骤,选定下一个聚类中心,直到得到期望的聚类中心数量;
(24)训练集各组数据,将训练好的模型保存,输入到价值评估模块当中,不同模型输出价格为Xest1,Xest2,Xest3,Xest4,Xest5;
(25)将以上5种模型的训练集数据输出结果利用最大比合并方法计算不同模型的权重,在测试集中利用以上权重进行加权组合得到最大比合并方法CEM-MRC的输出结果XMRC,最优方法的SCM-ANFIS模型输出结果为Xest1;
Xest1,Xest2,Xest3,Xest4,Xest5表示不同模型训练集的输出结果,为列向量,XACC表示训练集真实回收价格,N1,N2,N3,N4,N5表示噪声或真实值与预测值之间的误差,
Y表示不同训练集输出结果组成的矩阵
令W=(w1 w2 w3 w4 w5)代表不同模型权重
则信噪比SNR表示为:
使得信噪比SNR最大,是已知固定值,则/>为常数,上式等于最大化以下公式:
w1+w2+w3+w4+w5=1,要使以上公式(17)最大化,则需分母最小化:
得:
则最大比合并废旧家电预估输出值为:
4.如权利要求1所述的基于分类选择强化预测模型的废旧家电价值评估系统,特征在于,所述价值评估模块:
(31)利用训练集最大比合并方法构造辅助参考价格变量,即利用Xest1和XMRC构造出预估真实价格Xprice3,将以上三种价格即Xest1、XMRC、Xprice3和PCA降维后的数据作为训练集输出部分送入模型进行训练;在训练集中将SCM-ANFIS与CEM-MRC中平均绝对百分比误差MAPE较低的方法进行标注,作为分类依据的标签一起组成新的数据集,标签如下:
(32)利用随机森林分类训练分类算法,实现分类选择的强化预测模型在测试集中自动选择Xest1或XMRC,Xoutput=switch(Xest1,XMRC),以达到减小整体评价误差的目的;
(33)随机森林分类预测步骤为:
(331)从新的数据集中随机选择N个样本,允许重复,用这些样本训练一棵决策树,作为随机森林中的一个子模型;
(332)随机从M个特征中选择m个特征,其中m<<M,然后用Gini指数度量选择一个最佳的特征作为当前节点的分裂特征;
(333)按照步骤(332)一直递归地分裂节点,直到达到最大深度或者节点中的样本数小于最小拆分样本数时停止;每个叶子节点都代表一个分类结果;
(334)重复(331)-(333)步骤,构建多棵决策树;每棵决策树都是从不同的样本集和特征集中训练出来的;
(335)对于一个新的样本,让每棵决策树分别对其进行分类,并统计各类别的得票数,选择得票最多的类别作为随机森林的最终分类结果;
(34)分类模型输出废旧家电的评估结果,在SCM-ANFIS与CEM-MRC方法中选择一种进行输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310349535.9A CN116503118A (zh) | 2023-04-03 | 2023-04-03 | 一种基于分类选择强化预测模型的废旧家电价值评估系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310349535.9A CN116503118A (zh) | 2023-04-03 | 2023-04-03 | 一种基于分类选择强化预测模型的废旧家电价值评估系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116503118A true CN116503118A (zh) | 2023-07-28 |
Family
ID=87317539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310349535.9A Pending CN116503118A (zh) | 2023-04-03 | 2023-04-03 | 一种基于分类选择强化预测模型的废旧家电价值评估系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116503118A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117085954A (zh) * | 2023-08-17 | 2023-11-21 | 上海霖承环保科技有限公司 | 一种基于大数据的家电回收智能分选系统及方法 |
CN117150282A (zh) * | 2023-09-16 | 2023-12-01 | 石家庄正和网络有限公司 | 一种基于预测模型的二手设备回收评估方法及系统 |
-
2023
- 2023-04-03 CN CN202310349535.9A patent/CN116503118A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117085954A (zh) * | 2023-08-17 | 2023-11-21 | 上海霖承环保科技有限公司 | 一种基于大数据的家电回收智能分选系统及方法 |
CN117085954B (zh) * | 2023-08-17 | 2024-03-22 | 上海霖承环保科技有限公司 | 一种基于大数据的家电回收智能分选系统及方法 |
CN117150282A (zh) * | 2023-09-16 | 2023-12-01 | 石家庄正和网络有限公司 | 一种基于预测模型的二手设备回收评估方法及系统 |
CN117150282B (zh) * | 2023-09-16 | 2024-01-30 | 石家庄正和网络有限公司 | 一种基于预测模型的二手设备回收评估方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cui et al. | Machine learning for direct marketing response models: Bayesian networks with evolutionary programming | |
CN116503118A (zh) | 一种基于分类选择强化预测模型的废旧家电价值评估系统 | |
CN111861013B (zh) | 一种电力负荷预测方法及装置 | |
CN107992976A (zh) | 热点话题早期发展趋势预测系统及预测方法 | |
CN111401599A (zh) | 一种基于相似性搜索和lstm神经网络的水位预测方法 | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及系统 | |
CN114580545A (zh) | 一种基于融合模型的风电机组齿轮箱故障预警方法 | |
CN111079926A (zh) | 基于深度学习的具有自适应学习率的设备故障诊断方法 | |
CN115099519A (zh) | 一种基于多机器学习模型融合的油井产量预测方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN113360848A (zh) | 一种时序数据预测方法及装置 | |
CN110807601A (zh) | 一种基于截尾数据的园区道路劣化分析方法 | |
CN114596726A (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
Aliev et al. | Genetic algorithms-based fuzzy regression analysis | |
CN117313795A (zh) | 一种基于改进dbo-lstm的智慧楼宇能耗预测方法 | |
Wang et al. | A Transformer-based multi-entity load forecasting method for integrated energy systems | |
CN117116045A (zh) | 一种基于时空序列深度学习的交通流量预测方法及装置 | |
CN117390550A (zh) | 考虑排放训练集的低碳园区碳排放动态预测方法及系统 | |
CN109635008B (zh) | 一种基于机器学习的设备故障检测方法 | |
Bibi et al. | Selecting the appropriate machine learning techniques for the prediction of software development costs | |
CN116303786A (zh) | 一种基于多维数据融合算法的区块链金融大数据管理系统 | |
Lunga et al. | Online forecasting of stock market movement direction using the improved incremental algorithm | |
Vijh et al. | Stock forecasting for time series data using convolutional neural network | |
Kotenko et al. | Formation of Indicators for Assessing Technical Reliability of Information Security Systems | |
CN113762591A (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |