CN115170187A - 基于机器学习的二手车交易行为预测方法及系统 - Google Patents
基于机器学习的二手车交易行为预测方法及系统 Download PDFInfo
- Publication number
- CN115170187A CN115170187A CN202210789052.6A CN202210789052A CN115170187A CN 115170187 A CN115170187 A CN 115170187A CN 202210789052 A CN202210789052 A CN 202210789052A CN 115170187 A CN115170187 A CN 115170187A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- transaction
- behavior prediction
- target
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006399 behavior Effects 0.000 title claims abstract description 116
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000010801 machine learning Methods 0.000 title claims abstract description 29
- 238000005457 optimization Methods 0.000 claims abstract description 28
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种基于机器学习的二手车交易行为预测方法及系统,涉及互联网技术领域,该方法包括:获取待预测的目标车辆的车况信息和在库交易信息;提取目标车辆的车辆特征,并基于所述车辆特征构建衍生变量;将衍生变量输入至至少两个预设的行为预测模型中进行交易行为的预测,选择预测误差最小的目标行为预测模型进行参数优化;基于参数优化后的目标行为预测模型,确定目标车辆的交易行为预测结果,用以确定目标车辆的交易成功率,以及交易成功的周期。通过该方式,可以实现车辆交易行为及成交周期的精准预测,从而便于及时制定出相应的调价策略,为二手车交易的达成提供充分的数据支持。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种基于机器学习的二手车交易行为预测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本申请相关的背景技术信息,不必然构成在先技术。
近年来,我国全力推进可持续发展经济,不断提高资源利用率,鼓励推动节能环保型经济。同时,中国汽车市场的进一步发展,新车保有量不断增加,消费者换车需求彰显,未来二手车交易量与新车销量差距将进一步缩小,二手车市场具有广阔的发展前景。
现阶段,车辆供应商在进行二手车交易时,需要预测二手车的交易成功率、成交时间等,以便于及时制定出相应的调价策略,促进二手车交易达成。对于交易行为的预测,通常根据历史数据和经验决定,其主观性较强,且存在较大的误差。随着互联网技术的发展,基于机器学习算法预测二手车交易行为成为可能,但是仍存在以下难点:二手车交易行为的影响因素众多,如二手车的车况信息、历史交易信息、调价策略等、数据体量大,以及各影响因素之间具有高度耦合与强非线性等特性,因此,如何采用人工智能与大数据相结合的方法来对二手车交易行为进行精准预测,是目前仍需解决的问题。
发明内容
为了解决上述问题,本申请提供一种基于机器学习的二手车交易行为预测方法及系统,用以实现对二手车交易行为的精准预测。
为了实现上述目的,本申请主要包括以下几个方面:
第一方面,本申请实施例提供一种基于机器学习的二手车交易行为预测方法,包括:
获取待预测的目标车辆的车况信息和在库交易信息;
提取所述目标车辆的车辆特征,并基于所述车辆特征构建衍生变量;
将所述衍生变量输入至至少两个预设的行为预测模型中进行交易行为的预测,选择预测误差最小的目标行为预测模型进行参数优化;其中,各行为预测模型的搭建方式不同;
基于参数优化后的目标行为预测模型,确定所述目标车辆的交易行为预测结果,用以确定目标车辆的交易成功率,以及交易成功的周期。
在一种可能的实施方式中,获取待预测的目标车辆的车辆图像;从所述车辆图像中识别出车况信息;基于所述车况信息,在设定的车辆交易数据库中查找目标车辆的在库交易信息。
在一种可能的实施方式中,所述目标车辆的车辆特征有多个;在提取目标车辆的车辆特征之后,还包括:计算每两个车辆特征之间的皮尔逊相关系数,若皮尔逊相关系数大于预设系数阈值,则保留两个车辆特征中的任意一个特征。
在一种可能的实施方式中,所述在库交易信息包括交易日期、新车价格、上架价格;所述基于车辆特征构建衍生变量包括:将交易日期转换为数值型数据,将数值型数据作为衍生变量;和/或,基于新车价格和上架价格,确定目标车辆的折扣率,将所述折扣率作为衍生变量;和/或,基于交易日期,确定最后一次调价日期与上架日期的时间间隔,将所述时间间隔作为衍生变量;和/或,提取上架时间特征年份构建衍生变量上架时间年。
在一种可能的实施方式中,基于LightGBM算法、XGBoost算法和Catboost算法,分别构建行为预测模型;将衍生变量分别输入至各行为预测模型,使用五次交叉验证的平均评估指标作为行为预测模型的最终得分;根据各行为预测模型的得分,确定出预测误差最小的目标行为预测模型。
在一种可能的实施方式中,所述目标行为预测模型的参数优化方法包括:获取车辆交易数据集,所述车辆交易数据集包括车况信息和在库交易信息;对所述车辆交易数据集进行数据预处理;提取车辆特征并构建衍生变量,并将其输入至目标行为预测模型进行训练;根据预先设置的目标行为预测模型中各参数的优化搜索范围,采用网格搜索方法对各参数进行参数优化,得到参数优化后的预测模型。
在一种可能的实施方式中,所述数据预处理包括:删除车辆交易数据集中缺失值所占比例大于第一预设阈值的特征以及类别特征中最大类占比超过第二预设阈值的特征;和/或,选取特征的众数对具有缺失值的字段进行填充;和/或,剔除国别编号为0、上架价格大于新车价,以及上架价格大于预设价格阈值的数据。
第二方面,本申请实施例提供一种基于机器学习的二手车交易行为预测系统,包括:
信息获取模块,用于获取待预测的目标车辆的车况信息和在库交易信息;
特征提取模块,用于提取所述目标车辆的车辆特征,并基于所述车辆特征构建衍生变量;
模型选择模块,用于将所述衍生变量输入至至少两个预设的行为预测模型中进行交易行为的预测,选择预测误差最小的目标行为预测模型进行参数优化;其中,各行为预测模型的搭建方式不同;
预测模块,用于基于参数优化后的目标行为预测模型,确定所述目标车辆的交易行为预测结果,用以确定目标车辆的交易成功率,以及交易成功的周期。
第三方面,本申请实施例提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述第一方面和第一方面任一种可能的实施方式中所述的基于机器学习的二手车交易行为预测方法的步骤。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面和第一方面任一种可能的实施方式中所述的基于机器学习的二手车交易行为预测方法的步骤。
本申请的有益效果是:
本申请提供一种基于机器学习的二手车交易行为预测方法,首次提出将车况信息和在库交易信息进行车辆特征提取,并构建衍生变量,将衍生变量应用到预设的行为预测模型中,以实现对目标车辆成功率和交易成功周期的精准预测。同时,将至少两个行为预测模型同时应用于二手车交易行为预测的问题中,选取误差最小,泛化能力最强的目标行为预测模型作为最终模型,并进行参数优化,有利于提高目标车辆的交易行为预测结果的准确率,从而便于及时制定出相应的调价策略,为二手车交易的达成提供充分的数据支持。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是本申请实施例所提供的基于机器学习的二手车交易行为预测方法的流程示意图;
图2是本申请实施例所提供的优化后的LightGBM模型拟合效果图;
图3是本申请实施例所提供的基于机器学习的二手车交易行为预测系统的结构示意图;
图4是本申请实施例所提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图与实施例对本申请作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
请参阅图1,图1是本申请实施例所提供的基于机器学习的二手车交易行为预测方法的流程示意图,如图1中所示,所述基于机器学习的二手车交易行为预测方法包括以下步骤:
S101:获取待预测的目标车辆的车况信息和在库交易信息。
在具体实施中,首先获取待预测的目标车辆的车况信息,车况信息包括但不限于品牌、车系、车型、里程、车辆颜色、车辆所在城市、国标码、过户人次、载客人次、国别、厂商类型、年款、排量、变速箱、燃油类型、新车价、上牌日期、注册日期中的一个或多个;以及目标车辆的在库交易信息,在库交易信息包括但不限于上架日期,调价次数,调价幅度,成交日期,最后一次调价时间,最后一次调价日期中的一个或多个。
作为一可选实施方式,获取待预测的目标车辆的车辆图像;从所述车辆图像中识别出车况信息;基于所述车况信息,在设定的车辆交易数据库中查找目标车辆的在库交易信息。
在具体实施中,通过图像采集设备采集目标车辆的车辆图像,从车辆图像中识别出如品牌、车系、车型、颜色等车况信息,从网页中抓取新车价、上牌日期、注册日期等信息。进一步的,根据识别出的车况信息,在设定的车辆交易数据库中查找目标车辆的在库交易信息,以为预测该目标车辆的交易行为提供基础数据。
S102:提取所述目标车辆的车辆特征,并基于所述车辆特征构建衍生变量。
在具体实施中,车况信息和在库交易信息如表1中所示,从获取的车况信息和在库交易信息中提取目标车辆的车辆特征,如提取出调价次数,调价幅度,最后一次调价时间,最后一次调价价格等43个特征,其中,部分特征如表2中所示:
表1二手车的车况信息和在库交易信息
注:本数据展示为数据处理完的干净数据,故成交周期为对数变换后的值。该数据集的原始数据指标已经在相关文献中广泛使用,其优点有:(1)它们可以反应二手车影响成交周期的必要因素,如二手车辆的里程,上牌日期等;(2)他们的数据相对容易获得。
表2车辆特征表
作为一可选实施方式,所述目标车辆的车辆特征有多个;在提取目标车辆的车辆特征之后,还包括:计算每两个车辆特征之间的皮尔逊相关系数,若皮尔逊相关系数大于预设系数阈值,则保留两个车辆特征中的任意一个特征。
在具体实施中,为了在不影响预测精度的前提下,提高预测效率,本实施例在提取目标车辆的车辆特征之后,计算每两个车辆特征之间的皮尔逊相关系数,若皮尔逊相关系数大于预设系数阈值(如0.8),则保留两个车辆特征中的任意一个特征,相关性较高的车辆特征如表3中所示:
表3高相关性特征表
特征1 | 特征2 | 相关性 |
使用时长 | 上牌日期 | 0.99 |
新车价 | 排量 | 0.75 |
使用时长 | 里程 | 0.73 |
作为一可选实施方式,所述在库交易信息包括交易日期、新车价格、上架价格;所述基于车辆特征构建衍生变量包括:将交易日期转换为数值型数据,将数值型数据作为衍生变量;和/或,基于新车价格和上架价格,确定目标车辆的折扣率,将所述折扣率作为衍生变量;和/或,基于交易日期,确定最后一次调价日期与上架日期的时间间隔,将所述时间间隔作为衍生变量;和/或,提取上架时间特征年份构建衍生变量上架时间年。
在具体实施中,构建衍生特征:(1)将日期型数据转换为数值型数据。
(2)定义折扣率的公式为:
其中,折扣率为γ,新车价为new_price,上架价格为price。
其中,最后一次调价时间为lastadjusttime,上架时间为pulltime。
(4)提取上架时间特征年份构建衍生变量上架时间年。
对于日期型数据,计算机删除原始特征,并用衍生变量特征代替原始特征作为输入;而对于折扣率,计算机需保留新车价和上架价格。构建的衍生变量如表4所示:
表4衍生变量表
作为一可选实施方式,采用z-score规范化对预处理后的数据进行规范化处理,使数据集去除量纲的影响。
S103:将所述衍生变量输入至至少两个预设的行为预测模型中进行交易行为的预测,选择预测误差最小的目标行为预测模型进行参数优化;其中,各行为预测模型的搭建方式不同。
在具体实施中,为了提高目标车辆的交易行为预测结果的准确率,本实施例将至少两个行为预测模型同时应用于二手车交易行为预测的问题中,选取误差最小,泛化能力最强的目标行为预测模型作为最终模型,并进行参数优化。
作为一可选实施方式,基于LightGBM算法、XGBoost算法和Catboost算法,分别构建行为预测模型;将衍生变量分别输入至各行为预测模型,使用五次交叉验证的平均评估指标作为行为预测模型的最终得分;根据各行为预测模型的得分,确定出预测误差最小的目标行为预测模型。
在具体实施中,采用Mean Absolute Error作为行为预测模型的评估指标,二手车交易行为的预测属于回归问题,而Mean Absolute Error是回归问题中最常用的评估指标之一,其公式表示如下:
初始化LightGBM、XGBoost、Catboost模型,使用默认参数,包括树的最大深度,叶子个数,学习率等等,设置迭代次数与结束条件。
输入处理好的数据进行模型的训练,采用五折交叉验证方法进行模型评估。计算机使用五次交叉验证的平均评估指标作为模型最终得分,将模型的得分进行对比,各模型的对比结果如表5中所示:
表5模型评估比较表
模型 | Mae |
LightGBM | 0.6113122 |
XGBboost | 0.6228377 |
CatBoost | 1.6394653 |
从表5中可以看出,LightGBM模型的评估指标MAE明显小于XGBoost和CatBoost,因此本实施例选择LightGBM模型进行优化,构建目标行为预测模型。
作为一可选实施方式,所述目标行为预测模型的参数优化方法包括:获取车辆交易数据集,所述车辆交易数据集包括车况信息和在库交易信息;对所述车辆交易数据集进行数据预处理;提取车辆特征并构建衍生变量,并将其输入至目标行为预测模型进行训练;根据预先设置的目标行为预测模型中各参数的优化搜索范围,采用网格搜索方法对各参数进行参数优化,得到参数优化后的预测模型。
在具体实施中,初始化LightGBM模型的参数,包括树的最大深度,叶子个数,学习率,feature_fraction,bagging_fraction,等等,设置迭代次数与结束条件,以及设置参数优化搜索范围,并采用网格搜索方法对重要参数进行参数的优化。进行网格搜索优化参数区间及寻优后的参数值如下:
表6优化参数区间及寻优后的参数值
参数 | 寻优区间 | 初始化值 |
min_child_samples | [18,70,76,80,100] | 76 |
feature_fraction | [0.5,0.6,0.7,0.8,0.9] | 0.9 |
bagging_fraction | [0.6,0.7,0.8,0.9,1.0] | 0.7 |
num_leaves | [3,5,7,9] | 3 |
max_depth | [30,35,40,45,50] | 40 |
min_child_weight | [0.001,0.002,0.003] | 0.001 |
reg_lambda | [0.08,0.3,0.5,0.7,1] | 0.08 |
设置好LightGBM模型后,输入处理好的衍生变量,以交易成功的周期作为标签,对LightGBM模型进行训练,根据LightGBM自带的特征重要性排名获得最好的特征组合;根据网格搜索参数优化的结果重置LightGBM,基于特征重要性排序,选择前20个最重要的特征所谓新的特征组合,重新训练模型,最终利用5折交叉验证训练LightGBM模型获得参数优化后的最终模型。
最终模型的拟合效果图如图2所示,优化后的模型MAE由0.6113122降到0.6037073,优化后模型更加准确,参数优化效果显著。
作为一可选实施方式,所述数据预处理包括:
(1)缺失值删除:删除缺失值所占比例大于50%的特征以及类别特征中最大类占比超过98%的特征。
(2)缺失值填充:选取特征的众数对具有缺失值的字段进行填充。
(3)异常值处理:剔除国别编号为0的数据;剔除上架价格大于新车价的数据;
(4)绘制新车价,上架价格等特征的箱型图,并剔除小于QL-1.5IQR或大于QU+1.5IQR的值。其中QL为下四分位数,QU为上四分位数,为QL与QU之差。
(5)将上架价格大于75的数据判定为异常值,并将其剔除。
S104:基于参数优化后的目标行为预测模型,确定所述目标车辆的交易行为预测结果,用以确定目标车辆的交易成功率,以及交易成功的周期。
在具体实施中,将目标车辆的车辆特征输入至参数优化后的目标行为预测模型,得到目标车辆的交易行为预测结果,通过该交易行为预测结果可以确定目标车辆是否能够交易成功和交易成功周期,以预测当日日期为参考点,进一步预测出成交日期。根据该预测结果,制定相应的调价策略,为二手车交易的达成提供充分的数据支持。
实施例二
请参阅图3,图3是本申请实施例所提供的基于机器学习的二手车交易行为预测系统的结构示意图,如图3中所示,本申请实施例提供的基于机器学习的二手车交易行为预测系统300,包括:
信息获取模块310,用于获取待预测的目标车辆的车况信息和在库交易信息;
特征提取模块320,用于提取所述目标车辆的车辆特征,并基于所述车辆特征构建衍生变量;
模型选择模块330,用于将所述衍生变量输入至至少两个预设的行为预测模型中进行交易行为的预测,选择预测误差最小的目标行为预测模型进行参数优化;其中,各行为预测模型的搭建方式不同;
预测模块340,用于基于参数优化后的目标行为预测模型,确定所述目标车辆的交易行为预测结果,用以确定目标车辆的交易成功率,以及交易成功的周期。
实施例三
请参阅图4,图4是本申请实施例的一种计算机设备的示意图。如图4中所示,所述计算机设备400包括处理器410、存储器420和总线430。
所述存储器420存储有所述处理器410可执行的机器可读指令,当计算机设备400运行时,所述处理器410与所述存储器420之间通过总线430通信,所述机器可读指令被所述处理器410执行时,可以执行如上述图1所示方法实施例中的基于机器学习的二手车交易行为预测方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
实施例四
基于同一发明构思,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法实施例中所述的基于机器学习的二手车交易行为预测方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于机器学习的二手车交易行为预测方法,其特征在于,包括:
获取待预测的目标车辆的车况信息和在库交易信息;
提取所述目标车辆的车辆特征,并基于所述车辆特征构建衍生变量;
将所述衍生变量输入至至少两个预设的行为预测模型中进行交易行为的预测,选择预测误差最小的目标行为预测模型进行参数优化;其中,各行为预测模型的搭建方式不同;
基于参数优化后的目标行为预测模型,确定所述目标车辆的交易行为预测结果,用以确定目标车辆的交易成功率,以及交易成功的周期。
2.如权利要求1所述的基于机器学习的二手车交易行为预测方法,其特征在于,获取待预测的目标车辆的车辆图像;从所述车辆图像中识别出车况信息;基于所述车况信息,在设定的车辆交易数据库中查找目标车辆的在库交易信息。
3.如权利要求1所述的基于机器学习的二手车交易行为预测方法,其特征在于,所述目标车辆的车辆特征有多个;在提取目标车辆的车辆特征之后,还包括:计算每两个车辆特征之间的皮尔逊相关系数,若皮尔逊相关系数大于预设系数阈值,则保留两个车辆特征中的任意一个特征。
4.如权利要求1所述的基于机器学习的二手车交易行为预测方法,其特征在于,所述在库交易信息包括交易日期、新车价格、上架价格;所述基于车辆特征构建衍生变量包括:将交易日期转换为数值型数据,将数值型数据作为衍生变量;和/或,基于新车价格和上架价格,确定目标车辆的折扣率,将所述折扣率作为衍生变量;和/或,基于交易日期,确定最后一次调价日期与上架日期的时间间隔,将所述时间间隔作为衍生变量;和/或,提取上架时间特征年份构建衍生变量上架时间年。
5.如权利要求1所述的基于机器学习的二手车交易行为预测方法,其特征在于,基于LightGBM算法、XGBoost算法和Catboost算法,分别构建行为预测模型;将衍生变量分别输入至各行为预测模型,使用五次交叉验证的平均评估指标作为行为预测模型的最终得分;根据各行为预测模型的得分,确定出预测误差最小的目标行为预测模型。
6.如权利要求1所述的基于机器学习的二手车交易行为预测方法,其特征在于,所述目标行为预测模型的参数优化方法包括:获取车辆交易数据集,所述车辆交易数据集包括车况信息和在库交易信息;对所述车辆交易数据集进行数据预处理;提取车辆特征并构建衍生变量,并将其输入至目标行为预测模型进行训练;根据预先设置的目标行为预测模型中各参数的优化搜索范围,采用网格搜索方法对各参数进行参数优化,得到参数优化后的行为预测模型。
7.如权利要求6所述的基于机器学习的二手车交易行为预测方法,其特征在于,所述数据预处理包括:删除车辆交易数据集中缺失值所占比例大于第一预设阈值的特征以及类别特征中最大类占比超过第二预设阈值的特征;和/或,选取特征的众数对具有缺失值的字段进行填充;和/或,剔除国别编号为0、上架价格大于新车价,以及上架价格大于预设价格阈值的数据。
8.一种基于机器学习的二手车交易行为预测系统,其特征在于,包括:
信息获取模块,用于获取待预测的目标车辆的车况信息和在库交易信息;
特征提取模块,用于提取所述目标车辆的车辆特征,并基于所述车辆特征构建衍生变量;
模型选择模块,用于将所述衍生变量输入至至少两个预设的行为预测模型中进行交易行为的预测,选择预测误差最小的目标行为预测模型进行参数优化;其中,各行为预测模型的搭建方式不同;
预测模块,用于基于参数优化后的目标行为预测模型,确定所述目标车辆的交易行为预测结果,用以确定目标车辆的交易成功率,以及交易成功的周期。
9.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一项所述的基于机器学习的二手车交易行为预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一项所述的基于机器学习的二手车交易行为预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210789052.6A CN115170187A (zh) | 2022-07-06 | 2022-07-06 | 基于机器学习的二手车交易行为预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210789052.6A CN115170187A (zh) | 2022-07-06 | 2022-07-06 | 基于机器学习的二手车交易行为预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115170187A true CN115170187A (zh) | 2022-10-11 |
Family
ID=83491619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210789052.6A Pending CN115170187A (zh) | 2022-07-06 | 2022-07-06 | 基于机器学习的二手车交易行为预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115170187A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115600942A (zh) * | 2022-12-15 | 2023-01-13 | 中汽传媒(天津)有限公司(Cn) | 一种汽车零件交易管理方法及系统 |
CN115984002A (zh) * | 2023-02-22 | 2023-04-18 | 上海信宝博通电子商务有限公司 | 用于车辆交易管理的数据处理方法和装置 |
-
2022
- 2022-07-06 CN CN202210789052.6A patent/CN115170187A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115600942A (zh) * | 2022-12-15 | 2023-01-13 | 中汽传媒(天津)有限公司(Cn) | 一种汽车零件交易管理方法及系统 |
CN115984002A (zh) * | 2023-02-22 | 2023-04-18 | 上海信宝博通电子商务有限公司 | 用于车辆交易管理的数据处理方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115170187A (zh) | 基于机器学习的二手车交易行为预测方法及系统 | |
CN106022508A (zh) | 预测线上理财平台的用户邀请好友行为的方法和装置 | |
CN105488046A (zh) | 基于车辆保险业务的大数据分析系统 | |
CN108399453A (zh) | 一种电力客户信用等级评价方法和装置 | |
CN110704730A (zh) | 基于大数据的产品数据推送方法、系统及计算机设备 | |
CN111325248A (zh) | 降低贷前业务风险的方法及系统 | |
CN112232944B (zh) | 一种评分卡创建方法、装置和电子设备 | |
CN112732786A (zh) | 金融数据处理方法、装置、设备及存储介质 | |
CN110634060A (zh) | 一种用户信用风险的评估方法、系统、装置及存储介质 | |
CN110263136B (zh) | 基于强化学习模型向用户推送对象的方法和装置 | |
CN117235608B (zh) | 风险检测方法、装置、电子设备及存储介质 | |
CN113077189A (zh) | 一种小微企业生命周期评估的方法和装置 | |
CN113537693A (zh) | 人员风险等级获取方法、终端、存储装置 | |
CN117592856A (zh) | 基于石化企业产出量预测的算法流程 | |
CN107609700A (zh) | 一种基于机器学习的客户价值模型优化方法 | |
CN116882776A (zh) | 钢铁生产节能策略设置方法、装置、电子设备及存储介质 | |
CN115841345A (zh) | 跨境大数据智能化分析方法、系统以及存储介质 | |
CN110728582A (zh) | 信息处理的方法、装置、存储介质和处理器 | |
CN113052689B (zh) | 一种基于决策树的产品推荐方法及装置 | |
CN115564276A (zh) | 项目统计储备管理系统、方法及存储介质 | |
CN115393098A (zh) | 理财产品信息推荐方法及装置 | |
CN115035304A (zh) | 一种基于课程学习的图像描述生成方法及系统 | |
CN113592140A (zh) | 电费缴纳预测模型训练系统和电费缴纳预测模型 | |
CN113793220A (zh) | 基于人工智能模型的股市投资决策方法及相关设备 | |
CN114862092A (zh) | 一种基于神经网络的评标方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Country or region after: China Address after: 250353 University Road, Changqing District, Ji'nan, Shandong Province, No. 3501 Applicant after: Qilu University of Technology (Shandong Academy of Sciences) Address before: 250353 University Road, Changqing District, Ji'nan, Shandong Province, No. 3501 Applicant before: Qilu University of Technology Country or region before: China |