CN111461219A - 一种基于光滑支撑向量回归融合的二手车估值方法 - Google Patents

一种基于光滑支撑向量回归融合的二手车估值方法 Download PDF

Info

Publication number
CN111461219A
CN111461219A CN202010248325.7A CN202010248325A CN111461219A CN 111461219 A CN111461219 A CN 111461219A CN 202010248325 A CN202010248325 A CN 202010248325A CN 111461219 A CN111461219 A CN 111461219A
Authority
CN
China
Prior art keywords
support vector
smooth support
vector regression
function
fusion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010248325.7A
Other languages
English (en)
Inventor
陶根元
徐国俊
詹晓航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fengche Shanghai Information Technology Co ltd
Original Assignee
Fengche Shanghai Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fengche Shanghai Information Technology Co ltd filed Critical Fengche Shanghai Information Technology Co ltd
Priority to CN202010248325.7A priority Critical patent/CN111461219A/zh
Publication of CN111461219A publication Critical patent/CN111461219A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)

Abstract

本发明公开了一种基于光滑支撑向量回归融合的二手车估值方法,包括以下步骤:获取二手车交易时的成交价格作为数据源,对数据源进行加工、清洗和脱敏;将脱敏后的数据源中的成交价格作为输入向量x并根据不同的影响因素进行分类,所述影响因素作为相对变量y,形成集合s{xi,yi};对所述集合进行约束优化;应用机器学习技术与光滑支撑向量回归及性能融合,得到融合预测模型,采用所述模型进行分析,得到二手车预测成交价格。通过利用光滑支撑向量回归算法约束优化数据源的集合,采用机器学习技术与光滑支撑向量回归算法进行融合,能够解决数据源约束优化后,预测基于越来越旧的统计参数值,从而导致二手车估价不够准确的技术问题。

Description

一种基于光滑支撑向量回归融合的二手车估值方法
技术领域
本发明涉及二手车估值方法,具体涉及一种基于光滑支撑向量回归融合的二手车估值方法。
背景技术
近年来,我国二手车交易量迅速扩大,2000年成交量只有25万辆,到2018年己达到1382万辆。规模庞大的中底层收入者是二手车的重要消费群体。二手车市场规模不断扩大的同时,我国二手车市场的价格评估体系却暴露出不适应市场需求的问题,价格评估中的随意性及较多的人为因素,影响了对二手车的合理评估,制约着二手车市场的有序发展。反观国外发达国家,二手车市场能够持续健康稳定地发展是与其合理的价格评估系统密不可分。目前,我国二手车市场仍有巨大的发展空间,二手车市场的有序发展也有利于新车市场以及整个汽车产业的良性发展。但是现有技术中的二手车估值方法都具有数据处理不是很干净,噪声太大,估值不准确,不符合市场规律的问题
发明内容
本发明的目的在于提供一种具有更快的收敛速度、更好的拟合精度和良好的预测性能的、基于光滑支撑向量回归融合的二手车估值方法,以解决上述背景技术中的不能精确地将数据源中的成交价格与影响因素进行约束、解决数据源约束优化后,预测基于越来越旧的统计参数值,从而导致二手车估价不够准确的技术问题。
为实现上述目的,本发明提供如下技术方案:一种基于光滑支撑向量回归融合的二手车估值方法,包括以下步骤:
S1:获取二手车交易时的成交价格作为数据源,对数据源进行加工、清洗和脱敏;
S2:将脱敏后的数据源中的成交价格作为输入向量x,xi∈Rd,i=1,2,……,m,并根据不同的影响因素进行分类,所述影响因素作为相对变量y,yi∈R,i=1,2,……,m,形成集合s{xi,yi};
S3:对所述集合进行约束优化;
S4:应用机器学习技术与光滑支撑向量回归及性能融合,得到融合预测模型,采用所述模型进行分析,得到二手车预测成交价格。
进一步地,所述影响因素为二手车的成交时间、二手车的型号、二手车的车系、二手车上牌时间、二手车的行驶里程、二手车耗油率。
进一步地,所述步骤S3中的约束优化具体包括以下步骤:
S31:建立所述数据源中的成交价格的线性函数f(x,w)=WTx+b,其中w作为加权系数矩阵,b为误差项;
S32:建立所述输入向量与所述相对变量之间的ε-不敏感损失函数:
Figure BDA0002434582720000021
S33:赋予控制加权常数c,以控制输入向量x处于近似误差与权重向量范数||w||之间:
Figure BDA0002434582720000022
通过S32步骤建立ε-不敏感损失函数之后,可以使线性聚集函数f(x,w)通过同时S34步骤最小化||w2||和线性ε-不敏感损失函数之和被估计;
S34:建立约束S33步骤得到的R值:
Figure BDA0002434582720000023
(wTx+b)-yi≤ε+ξi
Figure BDA0002434582720000024
其中ξi
Figure BDA0002434582720000025
i=1,2,……,m
ξi
Figure BDA0002434582720000026
为松弛变量,
Figure BDA0002434582720000027
超过目标值,ξi低于目标值,所述目标值超过ε;
S35:通过对所述集合进行约束优化,利用光滑支撑向量回归算法将输入向量xi∈Rd映射到高维特征空间Φ(xi)∈H,建立核函数K(xi,yi)执行映射Φ(·),将所述影响因素yi代入所述核函数K(xi,yi)中,得到约束优化后的所述集合。
进一步地,所述核函数K(xi,yi)为多项式函数:
K(xi,yi)=(xi·yi+1)d,其中d是多项式函数的次数。
进一步地,所述核函数K(xi,yi)为径向基函数:
K(xi,yi)=exp(-γ||xi-yi||),其中γ是径向基函数的常数。
进一步地,所述机器学习技术为人工神经网络算法、随机森林算法、支持向量机算法中的一种。
进一步地,所述S2步骤中的形成集合采用如下公式:
Figure BDA0002434582720000028
其中α为加权系数。
与现有技术相比,本发明的有益效果是:
1)通过利用光滑支撑向量回归算法,利用拉格朗日理论和Karush-Kuhn-Tucker条件求解上述约束优化问题,得到回归函数的期望权向量,能够最小化S34步骤得到的R值,进一步对无效数据去噪,进而优化了数据源的数据干净程度,使估值更加准确,同时光滑支撑向量回归方法具有更快的收敛速度、更好的拟合精度和良好的预测性能,能够更精确地将数据源中的成交价格与影响因素进行约束、优化。
2)通过利用光滑支撑向量回归算法约束优化数据源的集合,利用多项式函数或者径向基函数,通过引入线性ε-不敏感损失函数,重新构造目标函数,并根据拉格朗日优化理论推导出新的鲁棒模糊聚类神经网络后,采用人工神经网络算法、随机森林算法、支持向量机算法等机器学习技术中的一种与光滑支撑向量回归算法进行融合,能够减少数据源约束优化后,预测基于越来越老的统计参数值,因此二手车估价不够准确的技术问题。
附图说明
图1为本发明提供的基于光滑支撑向量回归融合的二手车估值方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的一种基于光滑支撑向量回归融合的二手车估值方法,包括以下步骤:
S1:获取二手车交易时的成交价格作为数据源,对数据源进行加工、清洗和脱敏;
S2:将脱敏后的数据源中的成交价格作为输入向量x,xi∈Rd,i=1,2,……,m,并根据不同的影响因素进行分类,所述影响因素作为相对变量y,yi∈R,i=1,2,……,m,形成集合s{xi,yi};
S3:对所述集合进行约束优化;
S4:应用机器学习技术与光滑支撑向量回归及性能融合,得到融合预测模型,采用所述模型进行分析,得到二手车预测成交价格。
其中,步骤S3中的约束优化具体包括以下步骤:
S31:建立所述数据源中的成交价格的线性函数f(x,w)=wTx+b,其中w作为加权系数矩阵,b为误差项;
S32:建立所述输入向量与所述相对变量之间的ε-不敏感损失函数:
Figure BDA0002434582720000031
S33:赋予控制加权常数c,以控制输入向量x处于近似误差与权重向量范数||w||之间:
Figure BDA0002434582720000041
通过S32步骤建立ε-不敏感损失函数之后,可以使线性聚集函数f(x,w)通过同时S34步骤最小化||w2||和线性ε-不敏感损失函数之和被估计;
S34:建立约束S33步骤得到的R值:
Figure BDA0002434582720000042
(wTx+b)-yi≤ε+ξi
Figure BDA0002434582720000043
其中ξi
Figure BDA0002434582720000044
i=1,2,……,m
ξi
Figure BDA0002434582720000045
为松弛变量,
Figure BDA0002434582720000046
超过目标值,ξi低于目标值,所述目标值超过ε;
通过S34步骤的最优化限制,利用拉格朗日理论和Karush-Kuhn-Tucker条件求解上述约束优化问题,得到回归函数的期望权向量,能够最小化S34步骤得到的R值,进一步对无效数据去噪;
S35:通过对所述集合进行约束优化,利用光滑支撑向量回归算法将输入向量xi∈Rd映射到高维特征空间Φ(xi)∈H,建立核函数K(xi,yi)执行映射Φ(·),将所述影响因素yi代入所述核函数K(xi,yi)中,得到约束优化后的所述集合。
进一步地,所述核函数K(xi,yi)为多项式函数:
K(xi,yi)=(xi·yi+1)d,其中d是多项式函数的次数。
进一步地,所述核函数K(xi,yi)为径向基函数:
K(xi,yi)=exp(-γ||xi-yi||),其中γ是径向基函数的常数。
通过引入线性ε-不敏感损失函数,重新构造网络的目标函数,并根据拉格朗日优化理论推导出新的鲁棒模糊聚类神经网络。
进一步地,所述机器学习技术为人工神经网络算法、随机森林算法、支持向量机算法中的一种。
进一步地,所述S2步骤中的形成集合采用如下公式:
Figure BDA0002434582720000047
其中α为加权系数。
进一步地,其中影响因素为二手车的成交时间、二手车的型号、二手车的车系、二手车上牌时间、二手车的行驶里程、二手车耗油率。
光滑支撑向量回归方法具有更快的收敛速度、更好的拟合精度和良好的预测性能,能够更精确地将数据源中的成交价格与影响因素进行约束、优化。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (7)

1.一种基于光滑支撑向量回归融合的二手车估值方法,其特征在于,包括以下步骤:
S1:获取二手车交易时的成交价格作为数据源,对数据源进行加工、清洗和脱敏;
S2:将脱敏后的数据源中的成交价格作为输入向量x,xi∈Rd,i=1,2,……,m,并根据不同的影响因素进行分类,所述影响因素作为相对变量y,yi∈R,i=1,2,……,m,形成集合s{xi,yi};
S3:对所述集合进行约束优化;
S4:应用机器学习技术与光滑支撑向量回归及性能融合,得到融合预测模型,采用所述模型进行分析,得到二手车预测成交价格。
2.根据权利要求1所述的一种基于光滑支撑向量回归融合的二手车估值方法,其特征在于,所述影响因素为二手车的成交时间、二手车的型号、二手车的车系、二手车上牌时间、二手车的行驶里程、二手车耗油率。
3.根据权利要求1所述的一种基于光滑支撑向量回归融合的二手车估值方法,其特征在于,所述步骤S3中的约束优化具体包括以下步骤:
S31:建立所述数据源中的成交价格的线性函数f(x,w)=WTx+b,其中w作为加权系数矩阵,b为误差项;
S32:建立所述输入向量与所述相对变量之间的ε-不敏感损失函数:
Figure FDA0002434582710000011
S33:赋予控制加权常数c,以控制输入向量x处于近似误差与权重向量范数||W||之间:
Figure FDA0002434582710000012
通过S32步骤建立ε-不敏感损失函数之后,可以使线性聚集函数f(x,w)通过同时S34步骤最小化||W2||和线性ε-不敏感损失函数之和被估计;
S34:建立约束S33步骤得到的R值:
Figure FDA0002434582710000013
(WTx+b)-yi≤ε+ξi
Figure FDA0002434582710000014
其中ξi
Figure FDA0002434582710000015
ξi
Figure FDA0002434582710000016
为松弛变量,
Figure FDA0002434582710000017
超过目标值,ξi低于目标值,所述目标值超过ε;
S35:通过对所述集合进行约束优化,利用光滑支撑向量回归算法将输入向量xi∈Rd映射到高维特征空间Φ(xi)∈H,建立核函数K(xi,yi)执行映射Φ(·),将所述影响因素yi代入所述核函数K(xi,yi)中,得到约束优化后的所述集合。
4.根据权利要求1所述的一种基于光滑支撑向量回归融合的二手车估值方法,其特征在于,所述核函数K(xi,yi)为多项式函数:
K(xi,yi)=(xi·yi+1)d,其中d是多项式函数的次数。
5.根据权利要求1所述的一种基于光滑支撑向量回归融合的二手车估值方法,其特征在于,所述核函数K(xi,yi)为径向基函数:
K(xi,yi)=exp(-γ||xi-yi||),其中γ是径向基函数的常数。
6.根据权利要求1所述的一种基于光滑支撑向量回归融合的二手车估值方法,其特征在于,所述机器学习技术为人工神经网络算法、随机森林算法、支持向量机算法中的一种。
7.根据权利要求1所述的一种基于光滑支撑向量回归融合的二手车估值方法,其特征在于,所述S2步骤中的形成集合采用如下公式:
Figure FDA0002434582710000021
其中α为加权系数。
CN202010248325.7A 2020-04-01 2020-04-01 一种基于光滑支撑向量回归融合的二手车估值方法 Pending CN111461219A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010248325.7A CN111461219A (zh) 2020-04-01 2020-04-01 一种基于光滑支撑向量回归融合的二手车估值方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010248325.7A CN111461219A (zh) 2020-04-01 2020-04-01 一种基于光滑支撑向量回归融合的二手车估值方法

Publications (1)

Publication Number Publication Date
CN111461219A true CN111461219A (zh) 2020-07-28

Family

ID=71681668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010248325.7A Pending CN111461219A (zh) 2020-04-01 2020-04-01 一种基于光滑支撑向量回归融合的二手车估值方法

Country Status (1)

Country Link
CN (1) CN111461219A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292457A (zh) * 2017-08-03 2017-10-24 哈尔滨工业大学(威海) 适用于小样本预测的消极支持向量机模型
CN108520310A (zh) * 2018-03-01 2018-09-11 河南师范大学 基于G-L混合噪声特性v-支持向量回归机的风速预报方法
CN108564415A (zh) * 2018-04-25 2018-09-21 济南浪潮高新科技投资发展有限公司 一种智能预测二手车价格的方法
CN109903071A (zh) * 2017-12-11 2019-06-18 优估(上海)信息科技有限公司 一种二手车定价方法、装置、设备及计算机可读介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292457A (zh) * 2017-08-03 2017-10-24 哈尔滨工业大学(威海) 适用于小样本预测的消极支持向量机模型
CN109903071A (zh) * 2017-12-11 2019-06-18 优估(上海)信息科技有限公司 一种二手车定价方法、装置、设备及计算机可读介质
CN108520310A (zh) * 2018-03-01 2018-09-11 河南师范大学 基于G-L混合噪声特性v-支持向量回归机的风速预报方法
CN108564415A (zh) * 2018-04-25 2018-09-21 济南浪潮高新科技投资发展有限公司 一种智能预测二手车价格的方法

Similar Documents

Publication Publication Date Title
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN111553759A (zh) 一种产品信息推送方法、装置、设备及存储介质
WO2002003256A1 (en) Method and system for the dynamic analysis of data
Zhang et al. Comparison of econometric models and artificial neural networks algorithms for the prediction of baltic dry index
CN107844865A (zh) 基于特征参数选取与lstm模型的股指预测方法
Sun et al. A new multiscale decomposition ensemble approach for forecasting exchange rates
CN112967088A (zh) 基于知识蒸馏的营销活动预测模型结构和预测方法
CN114549046A (zh) 基于融合模型的销售预测方法、系统、设备及存储介质
Karamizadeh et al. Using the clustering algorithms and rule-based of data mining to identify affecting factors in the profit and loss of third party insurance, insurance company auto
CN112418476A (zh) 一种超短期电力负荷预测方法
CN112950262A (zh) 销量预测方法、装置、计算机设备和存储介质
CN113159461A (zh) 基于样本迁移学习的中小微企业信用评价方法
CN115204541A (zh) 汽车数据评估方法、装置、计算机设备及应用
CN111340236A (zh) 一种基于债券估值数据与集成机器学习的债券违约预测方法
CN112562863A (zh) 流行病监测预警方法、装置、电子设备
CN107274065A (zh) 食物口感和风味的主观评价与光谱数据建模方法及系统
CN113822499A (zh) 一种基于模型融合的列车备件损耗预测方法
Liu et al. Product quality prediction method in small sample data environment
Yasir et al. Machine learning–assisted efficient demand forecasting using endogenous and exogenous indicators for the textile industry
CN108846128B (zh) 一种基于自适应噪音降噪编码器的跨领域文本分类方法
CN117764227A (zh) 一种用于加油站的客户流失预测装置
CN111461219A (zh) 一种基于光滑支撑向量回归融合的二手车估值方法
Eichhorn et al. Soft computing for automated surface quality analysis of exterior car body panels
Han et al. Second-hand car price prediction based on a mixed-weighted regression model
Deng et al. Imbalanced multiclass classification with active learning in strip rolling process

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200728