CN117035888A - 新能源车辆残值获取方法、装置、电子设备和存储介质 - Google Patents
新能源车辆残值获取方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117035888A CN117035888A CN202310994742.XA CN202310994742A CN117035888A CN 117035888 A CN117035888 A CN 117035888A CN 202310994742 A CN202310994742 A CN 202310994742A CN 117035888 A CN117035888 A CN 117035888A
- Authority
- CN
- China
- Prior art keywords
- residual value
- data
- vehicle
- influence
- value influence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 230000003068 static effect Effects 0.000 claims abstract description 109
- 238000012549 training Methods 0.000 claims abstract description 32
- 238000004364 calculation method Methods 0.000 claims description 56
- 238000012545 processing Methods 0.000 claims description 34
- 238000013139 quantization Methods 0.000 claims description 24
- 230000015654 memory Effects 0.000 claims description 22
- 238000012216 screening Methods 0.000 claims description 19
- 238000010606 normalization Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract description 8
- 238000012423 maintenance Methods 0.000 description 56
- 238000010801 machine learning Methods 0.000 description 27
- 230000008859 change Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000036541 health Effects 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 230000008439 repair process Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 239000002131 composite material Substances 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000446 fuel Substances 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 206010039203 Road traffic accident Diseases 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 230000003862 health status Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012821 model calculation Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Medical Informatics (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供了一种新能源车辆残值获取方法、装置、电子设备和存储介质,涉及车辆评估领域。方法包括:获取目标新能源车辆的残值影响静态数据和残值影响时序数据;其中,残值影响静态数据包括不具有时序特征的残值影响数据;残值影响时序数据包括具有时序特征的残值影响数据;将残值影响静态数据和残值影响时序数据输入目标车辆残值预测模型中,获取目标车辆残值预测模型输出的目标车辆残值影响系数;其中,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本残值影响时序数据和对应的样本车辆残值影响系数训练得到;根据目标车辆残值影响系数,获取目标新能源车辆的车辆残值。能够提高新能源车辆残值获取结果的可靠性。
Description
技术领域
本申请涉及车辆评估领域,具体而言,本申请涉及一种新能源车辆残值获取方法、装置、电子设备和存储介质。
背景技术
近年来,随着新能源汽车的日益普及,其市场份额持续增长,二手车交易市场迫切需要科学的方法来确定其残值。目前,车辆残值计算方法主要包括专家经验法、重置成本法和机器学习法。
根据专家经验法计算的车辆残值的准确性依赖于专家的个人经验,不同专家对车辆的评估存在差异,车辆残值计算过程不透明且计算的合理性有待考究。重置成本法基于车辆相关的统计数据和假设估计获取车辆残值,由于假设估计会造成对实际情况的简化,可能忽视与车辆残值相关的因素,导致计算得到的车辆残值难以反映车辆的实际残值。机器学习法需使用大量高质量数据训练模型,且车辆残值相关影响因素多,目前现有技术中用于进行车辆残值预测的模型受限于数据质量和影响因素数据的选择,导致模型无法准确捕捉到影响车辆残值的特征,使获取的车辆残值准确性较低。综上所述,专家经验法、重置成本法和机器学习法均存在获取的车辆残值可靠性低的问题。
在此情况下,亟需提供一种规范的新能源车辆残值获取方案,提高新能源车辆残值获取结果的可靠性。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,本申请实施例所提供的技术方案如下:
第一方面,本申请实施例提供了一种新能源车辆残值获取方法,包括:
获取目标新能源车辆的残值影响静态数据和残值影响时序数据;其中,残值影响静态数据包括不具有时序特征的残值影响数据;残值影响时序数据包括具有时序特征的残值影响数据;
将残值影响静态数据和残值影响时序数据输入目标车辆残值预测模型中,获取目标车辆残值预测模型输出的目标车辆残值影响系数;其中,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本残值影响时序数据和对应的样本车辆残值影响系数训练得到;
根据目标车辆残值影响系数,获取目标新能源车辆的车辆残值。
在本申请的一种可选实施例中,获取目标新能源车辆的残值影响静态数据和残值影响时序数据,具体包括:
获取目标新能源车辆的残值影响相关信息,对残值影响相关信息进行文本信息抽取和数据清洗预处理,获取预处理后的残值影响相关信息;
根据预设数据量化规则处理预处理后的残值影响相关信息,获取残值影响数据;
根据残值影响数据是否具有时序特征,将残值影响数据划分为残值影响静态数据和残值影响时序数据。
在本申请的一种可选实施例中,根据预设数据量化规则处理预处理后的残值影响相关信息,获取残值影响数据,具体包括:
根据预设数据量化规则处理预处理后的残值影响相关信息,获取多个残值影响量化值;
将多个残值影响量化值划分为至少一个影响类别分组;其中,影响类别分组中包括至少一个残值影响量化值;
根据每一影响类别分组中各残值影响量化值的权值,对影响类别分组对应的残值影响量化值进行加权融合,得到每一影响类别分组对应的残值影响数据。
在本申请的一种可选实施例中,将残值影响静态数据和残值影响时序数据输入目标车辆残值预测模型中,具体包括:
根据残值影响时序数据获取至少一个时序特征数据序列,并获取每一时序特征数据序列对应的中间时序特征;其中,中间时序特征包括时序特征数据序列中数据的时间依赖关系;
将残值影响静态数据和每一中间时序特征输入目标车辆残值预测模型中;
其中,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本中间时序特征训练和样本车辆残值影响系数得到;样本中间时序特征根据样本残值影响时序数据获取。
在本申请的一种可选实施例中,将残值影响静态数据和每一中间时序特征输入目标车辆残值预测模型中,具体包括:
对残值影响静态数据和中间时序特征中的所有待输入特征数据进行筛选,得到多个目标待输入特征数据;
将每一目标待输入特征数据输入目标车辆残值预测模型中。
在本申请的一种可选实施例中,对残值影响静态数据和中间时序特征中的所有待输入特征数据进行筛选,得到多个目标待输入特征数据,具体包括:
对残值影响静态数据和中间时序特征中的所有待输入特征数据进行筛选,得到多个原始目标待输入特征数据;
对原始目标待输入特征数据进行归一化处理,得到多个目标待输入特征数据。
在本申请的一种可选实施例中,目标车辆残值预测模型通过以下方式获取:
根据重置成本法,构建车辆残值影响系数计算公式;其中,车辆残值影响系数用于指示车辆成新率;
根据样本新能源车辆集中每一样本新能源车辆对应的样本车辆残值和样本新车购置价格,采用车辆残值影响系数计算公式,获取每一样本新能源车辆对应的样本车辆残值影响系数;
根据样本新能源车辆集中每一样本新能源车辆对应的样本残值影响静态数据、样本残值影响时序数据和样本车辆残值影响系数,获取目标车辆残值预测模型。
第二方面,本申请实施例提供了一种新能源车辆残值获取装置,包括:
数据信息获取模块,用于获取目标新能源车辆的残值影响静态数据和残值影响时序数据;其中,残值影响静态数据包括不具有时序特征的残值影响数据;残值影响时序数据包括具有时序特征的残值影响数据;
影响系数获取模块,用于将残值影响静态数据和残值影响时序数据输入目标车辆残值预测模型中,获取目标车辆残值预测模型输出的目标车辆残值影响系数;其中,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本残值影响时序数据和对应的样本车辆残值影响系数训练得到;
车辆残值获取模块,用于根据目标车辆残值影响系数,获取目标新能源车辆的车辆残值。
在本申请的一种可选实施例中,数据信息获取模块,具体用于:
获取目标新能源车辆的残值影响相关信息,对残值影响相关信息进行文本信息抽取和数据清洗预处理,获取预处理后的残值影响相关信息;
根据预设数据量化规则处理预处理后的残值影响相关信息,获取残值影响数据;
根据残值影响数据是否具有时序特征,将残值影响数据划分为残值影响静态数据和残值影响时序数据。
在本申请的一种可选实施例中,数据信息获取模块,具体用于:
根据预设数据量化规则处理预处理后的残值影响相关信息,获取多个残值影响量化值;
将多个残值影响量化值划分为至少一个影响类别分组;其中,影响类别分组中包括至少一个残值影响量化值;
根据每一影响类别分组中各残值影响量化值的权值,对影响类别分组对应的残值影响量化值进行加权融合,得到每一影响类别分组对应的残值影响数据。
在本申请的一种可选实施例中,影响系数获取模块,具体用于:
根据残值影响时序数据获取至少一个时序特征数据序列,并获取每一时序特征数据序列对应的中间时序特征;其中,中间时序特征包括时序特征数据序列中数据的时间依赖关系;
将残值影响静态数据和每一中间时序特征输入目标车辆残值预测模型中;
其中,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本中间时序特征和样本车辆残值影响系数训练得到;样本中间时序特征根据样本残值影响时序数据获取。
在本申请的一种可选实施例中,影响系数获取模块,具体用于:
对残值影响静态数据和中间时序特征中的所有待输入特征数据进行筛选,得到多个目标待输入特征数据;
将每一目标待输入特征数据输入目标车辆残值预测模型中。
在本申请的一种可选实施例中,影响系数获取模块,具体用于:
对残值影响静态数据和中间时序特征中的所有待输入特征数据进行筛选,得到多个原始目标待输入特征数据;
对原始目标待输入特征数据进行归一化处理,得到多个目标待输入特征数据。
在本申请的一种可选实施例中,新能源车辆残值获取装置,还包括:预测模型获取模块;预测模型获取模块,具体用于:
根据重置成本法,构建车辆残值影响系数计算公式;其中,车辆残值影响系数用于指示车辆成新率;
根据样本新能源车辆集中每一样本新能源车辆对应的样本车辆残值和样本新车购置价格,采用车辆残值影响系数计算公式,获取每一样本新能源车辆对应的样本车辆残值影响系数;
根据样本新能源车辆集中每一样本新能源车辆对应的样本残值影响静态数据、样本残值影响时序数据和样本车辆残值影响系数,获取目标车辆残值预测模型。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括存储器、处理器及存储在存储器上的计算机程序,处理器执行计算机程序以实现上述任一实施例所提供的新能源车辆残值获取方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例所提供的新能源车辆残值获取方法。
本申请实施例提供的技术方案带来的有益效果是:
本方案通过将影响新能源车辆残值的残值影响数据以是否具有时序特征进行划分,获取残值影响静态数据和残值影响时序数据,以残值影响静态数据和残值影响时序数据进行车辆残值的预测。相较于现有的仅选择截面数据作为模型输入的机器学习方案,本申请充分考虑数据在时间上的变化,使目标车辆残值预测模型能够更好的捕捉到车辆残值和时间相关的变化趋势和规律,并且能够更好地反映市场供需关系、经济因素等变动对车辆残值的影响,提高目标车辆残值预测模型的泛化能力和准确性,进而提高新能源车辆残值获取结果的可靠性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种新能源车辆残值获取方法的应用场景示意图;
图2为本申请实施例提供的一种新能源车辆残值获取方法的流程示意图;
图3为本申请实施例提供的一种车辆残值影响系数获取方法示意图;
图4为本申请实施例提供的一种新能源车辆残值获取装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面结合本申请中的附图描述本申请的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本申请实施例的技术方案的示例性描述,对本申请实施例的技术方案不构成限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“A和/或B”可以实现为“A”,或者实现为“B”,或者实现为“A和B”。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面对本申请涉及的术语及相关技术进行说明:
新能源车辆:即新能源汽车,指采用非常规的车用燃料作为动力来源(或使用常规的车用燃料、采用新型车载动力装置),综合车辆的动力控制和驱动方面的先进技术,形成的技术原理先进、具有新技术、新结构的汽车。新能源汽车包括纯电动汽车、增程式电动汽车、混合动力汽车、燃料电池电动汽车和氢发动机汽车等。
二手车:指办理完注册登记手续到达国家制度报废标准之前进行交易并转移所有权的汽车(包括三轮汽车和低速载货车等)、挂车和摩托车。在本方案中,二手车指新能源二手车(汽车)。
车辆成新率:反映车辆的新旧程度,也就是车辆的现行价值(即车辆残值)与其全新状态重置价值(即新车购置价格)的比值或比率。
针对相关技术中所存在的上述至少一个技术问题或需要改善的地方,本申请提出一种新能源车辆残值获取方法方案。
下面通过对几个示例性实施方式的描述,对本申请实施例的技术方案以及本申请的技术方案产生的技术效果进行说明。需要指出的是,下述实施方式之间可以相互参考、借鉴或结合,对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等,不再重复描述。
图1为本申请实施例提供的一种新能源车辆残值获取方法的应用场景示意图,下面结合图1对新能源车辆残值获取方法在新能源二手车交易市场的具体应用进行说明:
如图1所示,该应用场景(二手车交易市场)中包括终端101和服务器102,在用户在终端101中选择待计算残值的目标新能源车辆(即新能源二手车)后,服务器102可以从终端101中获取残值影响数据(即残值影响静态数据和残值影响时序数据),然后服务器102将残值影响数据输入训练好的目标车辆残值预测模型中,获取目标车辆残值预测模型输出的目标车辆残值影响系数,最后,根据车辆残值影响系数,获取目标新能源车辆的车辆残值,并将车辆残值发送给终端101。
上述应用场景中,终端可以是线上用户的智能手机或二手车交易市场线下门店中的平板电脑等,由终端将影响因素信息发送给服务器,由服务器执行车辆残值获取的任务。在其他应用场景中,方法中所有的步骤也可以由终端或服务器独立来执行。本领域技术人员可知,上述示例并不对本申请的新能源车辆残值获取方法的应用场景进行限制。
其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。终端(也可以称为用户终端或用户设备)可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备(例如智能音箱)、可穿戴电子设备(例如智能手表)、车载终端、智能家电(例如智能电视)、AR/VR设备等,但并不局限于此。
图2为本申请实施例提供的一种新能源车辆残值获取方法的流程示意图,如图2所示,本申请实施例中提供了一种新能源车辆残值获取方法,包括:
步骤S201,获取目标新能源车辆的残值影响静态数据和残值影响时序数据;其中,残值影响静态数据包括不具有时序特征的残值影响数据;残值影响时序数据包括具有时序特征的残值影响数据。
具体的,确定待计算残值的目标新能源车辆后,获取目标新能源车辆的残值影响静态数据和残值影响时序数据。
考虑影响目标新能源车辆残值的相关信息中存在与时间无关的信息(如品牌、型号和颜色等),以及与时间有关的信息(如里程数、电池充放电状况、电池健康状况等),对应的,根据与时间无关的信息可以获取不具有时序特征的残值影响数据(即残值影响静态数据),根据与时间有关的信息可以提取数据的时序特征,获取具有时序特征的残值影响数据(即残值影响时序数据)
举例来说,目标新能源车辆在正常使用过程中会按预设时间间隔将行驶数据(如行驶时间、里程数、平均时速和百公里耗电量等)发送至第三方数据平台进行存储,同时第三方数据平台还存储目标新能源车辆的保险信息(如投保情况和出险信息等)和维修记录(维修部件、维修时间和维修金额等),在目标新能源车辆进行交易时,现场检测目标新能源车辆的电池,获取电池数据(如电池出厂数据、电池健康分析数据、电池充放电分析数据和电池故障分析数据等)。
将第三方数据平台和现场检测获取的数据信息作为影响目标新能源车辆残值的相关信息,并将相关信息划分为与时间无关的信息和与时间有关的信息。分别根据与时间无关的信息和与时间有关的信息,获取残值影响静态数据和残值影响时序数据。
可以理解的是,目标新能源车辆的相关数据的获取渠道包括但不限于第三方数据平台、线下二手车交易市场和现场检测等。
另外,相关信息所包含的目标新能源车辆的数据信息的具体类型和数量可根据实际需求确定,对应的,相关信息对应数据类型可能为文本型、数值型和字符串型等,需对相关信息进行统一处理,获取残值影响静态数据和残值影响时序数据,使不同类型的数据均能适应机器学习模型的输入要求,对相关信息进行统一处理的具体方式可根据实际需求确定。
步骤S202,将残值影响静态数据和残值影响时序数据输入目标车辆残值预测模型中,获取目标车辆残值预测模型输出的目标车辆残值影响系数;其中,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本残值影响时序数据和对应的样本车辆残值影响系数训练得到。具体的,本实施例构建车辆残值影响系数作为计算车辆残值的中间变量,获取车辆残值影响系数和车辆残值中的任一值,即可确定另一值。对于目标新能源车辆的车辆残值预测,需通过目标车辆残值预测模型获取目标车辆残值影响系数,进一步计算车辆残值。
图3为本申请实施例提供的一种车辆残值影响系数获取方法示意图,如图3所示,在获取残值影响静态数据和残值影响时序数据后,将残值影响静态数据和残值影响时序数据输入训练好的目标车辆残值预测模型中,获取目标车辆残值预测模型输出的车辆残值影响系数。
目标车辆残值预测模型是预先训练好的机器学习模型,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本残值影响时序数据和对应的样本车辆残值影响系数训练得到。
可以理解的是,目标车辆残值预测模型的具体结构和训练方式可根据实际需求确定,例如,目标车辆残值预测模型的对应的机器学习模型包括但不限于决策树、支持向量机、随机森林和深度学习等,训练方法可以是对模型进行参数调优、交叉验证和解释评估,确定最优参数设置,利用最优参数重新训练选定的机器学习模型。
车辆残值影响系数确定的方法包括但不限于:
1、直接构造法,将车辆残值直接作为车辆残值影响系数,样本车辆残值可通过主观或客观的方法直接获取,获取方式包括但不限于专家经验判断、实际成交价格等。
2、混合构造法,通过加减乘除、线性变换等操作将两个或两个以上的变量字段构造成一个新的变量,将该变量作为车辆残值影响系数,新的变量包括但不限于成新率和折旧程度等。
3、综合构造法,通过构建多方渠道融合的车辆残值获取方式,将目标车辆残值预测模型渠道的对应的融合系数作为车辆残值影响系数,多方渠道融合的构建方式包括但不限于线性加权、多模型集成等。
可以理解的是,对于目标新能源车辆和样本新能源车辆而言,车辆残值影响系数与车辆残值的计算关系相同,计算关系可根据实际需求确定。另外,样本残值影响静态数据和样本残值影响时序数据与目标新能源车辆的残值影响静态数据和残值影响时序数据的获取方法一致,在此不做赘述。
举例来说,计算关系可以是车辆残值影响系数可以与车辆残值具有函数关系,或车辆残值影响系数与车辆残值和新车购置价格的比值具有函数关系。
步骤S203,根据目标车辆残值影响系数,获取目标新能源车辆的车辆残值。
具体的,在获取目标车辆残值影响系数之后,根据模型训练时对应的车辆残值影响系数与车辆残值的计算关系,获取目标新能源车辆的车辆残值。
举例来说,车辆残值影响系数与车辆残值的计算关系为车辆残值影响系数是车辆残值和新车购置价格的比值。根据样本车辆残值和样本车辆的新车购置价格的比值获取样本车辆残值影响系数,并根据样本新能源车辆的样本残值影响静态数据、样本残值影响时序数据和对应的样本车辆残值影响系数训练得到目标车辆残值预测模型。
可以理解的是,样本车辆残值可以根据样本新能源车辆的实际售卖价格和专家估计车辆残值确定。如,样本车辆已售出则以实际售卖价格(或加权平均后的实际售卖价格和专家估计车辆残值)为样本车辆残值,样本车辆未售出则以专家估计车辆残值为样本车辆残值。
将目标新能源车辆的残值影响静态数据和残值影响时序数据输入目标车辆残值预测模型中,得到模型的输出目标车辆残值影响系数,进一步计算目标车辆残值影响系数和目标新能源车辆的新车购置价格乘积,以该乘积作为目标新能源车辆的车辆残值。
本实施例提供的技术方案通过将影响新能源车辆残值的残值影响数据以是否具有时序特征进行划分,获取残值影响静态数据和残值影响时序数据,以残值影响静态数据和残值影响时序数据进行车辆残值的预测。相较于现有的仅选择截面数据作为模型输入的机器学习方案,本申请充分考虑数据在时间上的变化,使目标车辆残值预测模型能够更好的捕捉到车辆残值和时间相关的变化趋势和规律,并且能够更好地反映市场供需关系、经济因素等变动对车辆残值的影响,提高目标车辆残值预测模型的泛化能力和准确性,进而提高新能源车辆残值获取结果的可靠性。
在本申请的一种可选实施例中,获取目标新能源车辆的残值影响静态数据和残值影响时序数据,具体包括:
获取目标新能源车辆的残值影响相关信息,对残值影响相关信息进行文本信息抽取和数据清洗预处理,获取预处理后的残值影响相关信息;
根据预设数据量化规则处理预处理后的残值影响相关信息,获取残值影响数据;
根据残值影响数据是否具有时序特征,将残值影响数据划分为残值影响静态数据和残值影响时序数据。
具体的,考虑到目标新能源车辆的残值影响相关信息(即影响目标新能源车辆残值的相关信息)所包含的目标新能源车辆的数据信息的具体类型和数量众多,残值影响相关信息对应数据类型可能为文本型、数值型和字符串型等,需对相关信息进行统一处理,获取残值影响静态数据和残值影响时序数据,使不同类型的数据均能适应机器学习模型的输入要求。
可以理解的是,由于目标新能源车辆的残值影响相关信息的选择会影响后续数据处理的复杂程度以及模型训练的效果,进一步影响获取的车辆残值的准确性,可对车辆各个维度的数据进行分析,选择其中具有代表性的数据作为残值影响相关信息。
举例来说,根据对新能源二手车的相关数据进行分析,选择作为残值影响相关信息对应的数据包括但不限于以下几个维度:基本信息、出险情况、电池健康、充放电分析和故障管理水平等。
考虑到残值影响相关信息可能以不同的格式和表达方式呈现(如文本、表格和工单等),原始残值影响相关信息对应的数据内容中可能存在冗余信息、无关信息和错误信息等,需对获取的目标新能源车辆的残值影响相关信息进行文本信息抽取和数据清洗预处理,获取预处理后的残值影响相关信息。
举例来说,残值影响相关信息中包括新能源车辆的维修记录,对维修记录中的每一个部件进行匹配处理和文本信息抽取,获取每一部件对应的维修数据。由于每一个部件对应的维修记录中可能会存在特定名称或特殊字符,文本信息抽取的步骤包括但不限于提取、分词和去重等。
由于获取的维修数据可能会存在数据不完整的情况,需进一步对获取的维修数据进行数据清洗预处理,对获取的维修数据进行筛选、整理和转换等操作,去除无效或错误的数据,提高数据质量和可用性。
数据清洗预处理的方式包括但不限于:
1、缺失值处理:检测出缺失值,缺失值的处理方法包括但不限于删除法、插值法、常数填充法等。可以直接删除包含缺失值的字段,或使用包括但不限于均值、中位数和众数等描述性统计量来替换缺失值。
2、异常值处理:检测出异常值并对异常值进行剔除或替换处理。
3、数据类型转换:将数据转换为适当的格式,如转换日期时间格式、数值型转换为分类型等。
获取预处理后的残值影响相关信息后,由于预处理后的残值影响相关信息对应数据类型可能为文本型、数值型和字符串型等,需要对预处理后的残值影响相关信息进行量化,根据预设数据量化规则处理预处理后的残值影响相关信息,获取残值影响数据。
可以理解的是,预设数据量化规则可使输入模型数据规范化,能够使不同类型的数据均能适应机器学习模型的输入要求,提高模型的性能、加快收敛速度、降低异常值的影响,并减少计算负载。预设数据量化规则可根据实际需求确定。
举例来说,预设数据量化规则方法包括但不限于建立数值映射关系、独热编码(one-hotencoding)处理等,并可针对不同的数据类型设置不同的预设数据量化规则。
获取电池性能时,采用建立数值的映射关系的方式处理折旧程度影响因素信息中电池的满电续航里程数据,设置用户可接受的电池最低健康度(如40%),将最低健康度为映射为0,电池的最高健康度(100%)映射为1,将电池当前续航里程映射为0-1中的具体数值。
根据量化处理后的残值影响数据是否具有时序特征,将残值影响数据划分为残值影响静态数据和残值影响时序数据。
举例来说,量化处理后的残值影响数据包括车辆基本信息(包括车辆品牌、车身颜色和使用天数等),以及维修信息、电池健康和行驶数据对应的量化数据。其中,维修信息、电池健康和行驶数据对应的量化数据存在对应的时序特征(如里程数和时间的对应关系)。将车辆基本信息对应的量化数据划分为残值影响静态数据,将维修信息、电池健康和行驶数据对应的量化数据划分为残值影响时序数据。
本实施例提供的技术方案通过对残值影响相关信息进行文本信息抽取,能够有效的识别并提取残值影响相关信息中的所需信息,和处理缺失值,并进行数据清洗预处理,能够对数据进行筛选、整理和转换等操作,纠正数据中存在的问题,去除无效或错误的数据,提高数据质量和可用性。进一步对预处理后的残值影响相关信息进行数据量化处理,使不同类型的数据均能适应机器学习模型的输入要求,获取残值影响数据。并根据是否具有时序特征将获取残值影响数据划分为残值影响静态数据和残值影响时序数据,充分考虑数据在时间上的变化,使目标车辆残值预测模型能够更好的捕捉到车辆残值和时间相关的变化趋势和规律,并且能够更好地反映市场供需关系、经济因素等变动对车辆残值的影响,提高目标车辆残值预测模型的泛化能力和准确性,进而提高新能源车辆残值获取结果的可靠性。
在本申请的一种可选实施例中,根据预设数据量化规则处理预处理后的残值影响相关信息,获取残值影响数据,具体包括:
根据预设数据量化规则处理预处理后的残值影响相关信息,获取多个残值影响量化值;
将多个残值影响量化值划分为至少一个影响类别分组;其中,影响类别分组中包括至少一个残值影响量化值;
根据每一影响类别分组中各残值影响量化值的权值,对影响类别分组对应的残值影响量化值进行加权融合,得到每一影响类别分组对应的残值影响数据。
具体的,根据预设数据量化规则处理预处理后的残值影响相关信息,获取多个残值影响量化值。考虑到残值影响量化值数量较多,将多个残值影响量化值划分为至少一个影响类别分组。每一影响类别分组中包括至少一个残值影响量化值。
采取分类融合的方式,根据构建的影响类别分组中,各残值影响量化值的权值,对影响类别分组对应的残值影响量化值进行加权融合,得到每一影响类别分组对应的残值影响数据。
需要说明的是,将残值影响量化值划分为影响类别分组的方式,以及残值影响量化值的权值的获取方式均可根据实际需求确定。
举例来说,预处理后的残值影响相关信息中包括预处理后的维修记录、基本信息、保险情况、出险信息等。其中,预处理后的维修记录包括每一部件对应的维修数据,将每一部件的维修数据进行量化,获取每一部件对应的维修数据残值影响量化值。将每一部件对应的维修数据残值影响量化值划分为车辆维修影响类别分组。
获取新能源车辆的部件维修总表,部件维修总表的获取方式包括但不限于官方指导文件、真实数据汇总等。根据部件维修总表对每一部件的重要程度进行划分并赋予相应的权重,将该权重作为各残值影响量化值的权值。通过该权重对车辆维修影响类别分组中各部件对应的维修数据残值影响量化值进行加权融合,得到车辆维修影响类别分组对应的残值影响数据。
另外,可以理解的是,考虑到每一辆车可能存在多份维修记录,根据维修记录获取对应的残值影响数据时,可采取获取总的维修记录进行综合计算的残值影响数据方式,或者根据时间关系对每年的维修记录进行汇总,每一年的维修记录分别计算残值影响数据,最后进行汇总的方式,汇总的方式包括但不限于线性加权、选择最优得分和计算中位数得分等。
本实施例提供的技术方案通过对影响车辆残值的不同维度的信息对应的残值影响量化值进行划分,将残值影响量化值划分为不同的影响类别分组,对分组内的残值影响量化值进行加权融合得到每一分组对应的残值影响数据,能够实现影响车辆残值的不同维度多指标数据的综合分析,实现影响车辆残值因素的全面评估,针对不同数据的重要程度的不同赋予不同的权重,采取计算细粒度量化值,并进一步计算分组综合量化值的方式,构建多层次、多维度、全方位的科学计算流程,使获取的整体得分(即残值影响数据)更符合实际情况,不仅提高了残值计算的客观性和准确性,还实现了高效的自动化和规模化计算,使输入目标车辆残值预测模型更好的捕捉到车辆残值和时间相关的变化趋势和规律,进而提高新能源车辆残值获取结果的可靠性。
在本申请的一种可选实施例中,将残值影响静态数据和残值影响时序数据输入目标车辆残值预测模型中,具体包括:
根据残值影响时序数据获取至少一个时序特征数据序列,并获取每一时序特征数据序列对应的中间时序特征;其中,中间时序特征包括时序特征数据序列中数据的时间依赖关系;
将残值影响静态数据和每一中间时序特征输入目标车辆残值预测模型中;
其中,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本中间时序特征和样本车辆残值影响系数训练得到;样本中间时序特征根据样本残值影响时序数据获取。
具体的,现有技术中基于机器学习的车辆残值计算方案,普遍忽视了字段特征在时间上的变化趋势,仅选择截面数据(即某一时刻的静态数据)作为输入,而忽略了同一样本下各个字段特征的长短期依赖关系,对信息的利用程度较低。
本实施例中目标车辆残值预测模型的输入变量为残值影响静态数据和残值影响时序数据,考虑残值影响数据的时序特征,对于存在时序特征的部分输入变量(即残值影响时序数据),进一步挖掘序列中的时间依赖关系。时间依赖关系指在残值影响时序数据中数据与时间之间存在的某种关联或依赖性。
即根据残值影响时序数据获取至少一个时序特征数据序列,并获取每一时序特征数据序列对应的中间时序特征,中间时序特征包括时序特征数据序列中数据的时间依赖关系。
可以理解的是,中间时序特征的提取方式包括不限于使用长短期记忆网络(LongShort-TermMemory,LSTM)、双向长短期记忆网络(BidirectionalLSTM)和Tsfresh(TimeSeriesFresh)包等方式对残值影响时序数据进行特征提取,具体的提取方式可根据实际需求确定。
举例来说,残值影响时序数据中可包括多个类型(如里程数、电池充放电状况、电池健康状况等)的数据,针对不同的类型可分别获取对应的时序特征数据序列,采用长短期记忆网络分别挖掘每一时序特征数据序列中的长短期依赖关系(即时间依赖关系),获取每一时序特征数据序列对应的中间时序特征。
可以理解的是,长短期记忆网络会保留并传递各个时间步的隐藏状态,而隐藏状态是一种可以表示上下文信息的中间特征,隐藏状态会在每个时间步被更新和传递,所以提取的中间时序特征具有相同的维度和形式,即采用长短期记忆网络无需考虑时序特征数据序列之间的长度差异,提取的每一时序特征数据序列对应的中间时序特征在数据形式上是一致的。将数据形式一致的中间时序特征作为目标车辆残值预测模型的输入,能够有助于提高模型的稳定性,提高模型的训练速度,获得更好的模型性能。
目标车辆残值预测模型是预先训练好的机器学习模型,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本中间时序特征和样本车辆残值影响系数训练得到。样本中间时序特征根据样本残值影响时序数据获取。
另外,样本残值影响静态数据、样本残值影响时序数据和样本中间时序特征,与目标新能源车辆的残值影响静态数据、残值影响时序数据和中间时序特征的获取方法一致,在此不做赘述。
将残值影响静态数据和每一中间时序特征输入目标车辆残值预测模型中。
本实施例提供的技术方案通过提取残值影响时序数据中的时间依赖关系获取中间时间特征,将中间时间特征和残值影响静态数据作为目标车辆残值预测模型的输入。相较于现有的仅选择截面数据作为模型输入的机器学习方案,本申请充分考虑数据在时间上的变化,结合静态特征和时序特征可以提供更全面、综合的数据描述,使目标车辆残值预测模型能够更好的捕捉到车辆残值和时间相关的变化趋势和规律,并且能够更好地反映市场供需关系、经济因素等变动对车辆残值的影响,提高目标车辆残值预测模型的泛化能力和准确性,进而提高新能源车辆残值获取结果的可靠性。
在本申请的一种可选实施例中,将残值影响静态数据和每一中间时序特征输入目标车辆残值预测模型中,具体包括:
对残值影响静态数据和中间时序特征中的所有待输入特征数据进行筛选,得到多个目标待输入特征数据;
将每一目标待输入特征数据输入目标车辆残值预测模型中。
具体的,为了进一步减少模型的复杂度、提高模型的泛化能力,并去除冗余和噪声的影响,在将待输入特征输入模型前,还需要对所有待输入特征进行特征选取。
对残值影响静态数据和中间时序特征中的所有待输入特征数据进行特征选取,特征选取的方式包括但不限于主观判断法(Subjective judgement method)、相关系数法(Correlation coefficient method)、嵌入法(Embedded method)、主成分分析降维法(Principal Component Analysis,PCA)和包装法(Wrapper method)等,通过特征选取从所有待输入特征数据中筛选出多个目标待输入特征数据,并将每一目标待输入特征数据输入目标车辆残值预测模型中。
本实施例提供的技术方案通过对待输入特征进行特征选取能够筛选出最择最相关和最重要的目标待输入特征数据,以目标待输入特征数据作为目标车辆残值预测模型的输入,能够减少冗余特征数据和噪声,显著降低计算和存储的需求,加快模型的训练和推断速度,提高整体效率,减少模型的复杂度,降低过拟合的风险,提高模型的稳定性和准确性,进而提高新能源车辆残值获取结果的可靠性。
在本申请的一种可选实施例中,对残值影响静态数据和中间时序特征中的所有待输入特征数据进行筛选,得到多个目标待输入特征数据,具体包括:
对残值影响静态数据和中间时序特征中的所有待输入特征数据进行筛选,得到多个原始目标待输入特征数据;
对原始目标待输入特征数据进行归一化处理,得到多个目标待输入特征数据。
具体的,为了提高机器学习模型的性能和效果,在将特征数据输入目标车辆残值预测模型前,除了进行特征选取外,还需要对特征数据进行归一化处理。
在获取残值影响静态数据和中间时序特征中的所有待输入特征数据后,通过特征选取从所有待输入特征数据中筛选出多个原始目标待输入特征数据,并对每一原始目标待输入特征数据进行归一化处理,得到多个目标待输入特征数据,将每一目标待输入特征数据输入目标车辆残值预测模型中。
举例来说,归一化方法可以是将每一原始目标待输入特征数据归一化至共同区间
可以理解的是,归一化方法包括但不限于最小-最大缩放(Min-Max Scaling)、均值-方差归一化(mean-variance)、标准化(Standardization)和正则化(Normalization)等,采用的归一化处理方法可以根据实际需求确定。
本实施例提供的技术方案通过对输入目标车辆残值预测模型的特征数据进行归一化处理,能够将不同尺度和范围的特征缩放到相似的范围内,以消除特征数据之间的量纲差异,并保证每个特征数据对模型的贡献相对均衡,特征尺度相似的数据更容易被模型学习和理解,有效提高模型的训练速度,并减少模型对极端值的敏感度,使模型更加稳定,帮助模型更好地捕捉数据的真实模式和关系,提高模型的性能并提高模型在新数据上的泛化能力,进而提高新能源车辆残值获取结果的可靠性。
在本申请的一种可选实施例中,目标车辆残值预测模型通过以下方式获取:
根据重置成本法,构建车辆残值影响系数计算公式;其中,车辆残值影响系数用于指示车辆成新率;
根据样本新能源车辆集中每一样本新能源车辆对应的样本车辆残值和样本新车购置价格,采用车辆残值影响系数计算公式,获取每一样本新能源车辆对应的样本车辆残值影响系数;
根据样本新能源车辆集中每一样本新能源车辆对应的样本残值影响静态数据、样本残值影响时序数据和样本车辆残值影响系数,获取目标车辆残值预测模型。
其中,车辆成新率反映车辆的新旧程度,也就是车辆的现行价值(即车辆残值)与其全新状态重置价值(即新车购置价格)的比值或比率。
具体的,目前,基于机器学习的车辆残值计算方案通常直接采用车辆残值作为模型输出的因变量,并不能直接体现新能源二手车的折旧或磨损程度对车辆的影响,残值的计算效果会有较大偏差。该方式直接输出的车辆残值存在缺乏解释性,很难解释具体的预测结果是如何得出的问题。并且,直接将车辆残值作为输出意味着需要使用大量的二手车价格数据进行模型训练,模型在实际应用中可能需要不断更新和调整,在特殊车型或者样本有限的情况下,模型的预测能力和准确性受到限制,无法更好的适用于不同类型的车辆和市场情况。
因此,目前基于机器学习的车辆残值计算方案存在车辆残值精确性受限、数据依赖性和可解释性差等缺点和问题。
本实施例构建用于指示车辆成新率的车辆残值影响系数作为计算车辆残值的中间变量,获取车辆残值影响系数和车辆残值中的任一值,即可确定另一值。对于目标新能源车辆的车辆残值预测,需通过目标车辆残值预测模型获取目标车辆残值影响系数,进一步计算车辆残值。
采用车辆残值影响系数作为模型输出,可以提供对车辆残值的影响程度的量化信息,可以更清楚地确定车辆的折旧情况,将模型的输出转换为更直观和可解释的形式,有助于理解车辆残值计算的逻辑和依据,从而增加对模型结果的理解和信任。并且采用车辆残值影响系数作为输出的模型可以更广泛地应用于不同类型和不同属性的车辆,更好的适用于不同类型的车辆和市场情况。
在进行目标车辆残值预测模型的获取时,需确定输入模型的样本数据。在确定样本数据前,需确定目标车辆残值预测模型对应因变量车辆残值影响系数的获取方式。
车辆残值影响系数用于指示车辆成新率,即将车辆残值影响系数设置为车辆残值和新车购置价比值(即车辆成新率)的相关系数,更准确地反映车辆使用期间的价值损耗情况,使车辆残值影响系数更具适用性和准确性。具体的车辆残值影响系数的计算方法可根据实际需求确定。
举例来说,可将车辆残值影响系数设置为车辆成新率,或将车辆残值影响系数设置为车辆成新率的对数值。
可以理解的是,由于车辆成新率通常受到多个因素的综合影响,而这些因素之间的关系往往是非线性的。通过将车辆残值影响系数设置为非线性函数,可以更准确地捕捉这种复杂的关系,反映不同因素对车辆残值的影响,并更好地模拟实际情况,提高建模的准确性和预测的精度。
可用于设置车辆残值影响系数与车辆成新率的函数关系包括但不限于幂函数关系、对数函数关系、使用逻辑斯蒂(Logistic)函数或双曲正切(Tanh)函数等。
采用重置成本法的车辆残值计算公式为:
P=Pnew×C
式中,P为车辆残值,Pnew为新车购置价格,C为车辆成新率。
根据上述公式,构建车辆残值影响系数计算公式,车辆残值影响系数计算公式根据实际需求确定。
由于车辆残值影响系数用于指示车辆成新率,即通过车辆残值和新车购置价比值以及车辆残值影响系数计算公式,即可计算车辆残值影响系数。
根据样本新能源车辆集中每一样本新能源车辆对应的样本车辆残值和样本新车购置价格,采用车辆残值影响系数计算公式,获取每一样本新能源车辆对应的样本车辆残值影响系数。
将样本新能源车辆集中每一样本新能源车辆对应的样本残值影响静态数据、样本残值影响时序数据和样本车辆残值影响系数作为用于训练目标车辆残值预测模型的样本数据。
可以理解的是,目标车辆残值预测模型的具体结构和训练方式可根据实际需求确定,例如,目标车辆残值预测模型的对应的机器学习模型包括但不限于决策树、支持向量机、随机森林和深度学习等,训练方法可以是对模型进行参数调优、交叉验证和解释评估,确定最优参数设置,利用最优参数重新训练选定的机器学习模型。
另外,样本残值影响静态数据和样本残值影响时序数据与目标新能源车辆的残值影响静态数据和残值影响时序数据的获取方法一致,在此不做赘述。
本实施例提供的技术方案通过构建用于指示车辆成新率的车辆残值影响系数作为计算车辆残值的中间变量,进一步结合新车购置价格确定车辆残值,相较于直接采用车辆残值作为模型输出的因变量的基于机器学习的车辆残值计算方案,将模型的输出转换为更直观和可解释的形式,有助于理解车辆残值计算的逻辑和依据,从而增加对模型结果的理解和信任,进而提高新能源车辆残值获取结果的可靠性。并且采用车辆残值影响系数作为输出的模型可以更广泛地应用于不同类型和不同属性的车辆,更好的适用于不同类型的车辆和市场情况。
下面再通过一个具体示例对本申请实施例方案的具体应用进行详细说明:
从第三方平台共计获取64条新能源二手车的完整数据和交易数据,提取所需要的字段数据。以任一新能源二手车作为样本数据的数据处理方法为例,新能源二手车的字段数据信息如表1所示,出险信息如表2所示。
表1
/>
/>
表2
对具体字段进行预处理工作,预处理的方式包括数据类型转换、提取有效信息、剔除异常值和填补缺失值等。在对实施例中的数据信息进行描述统计之后,各个字段均不存在异常值和缺失值,但为了确保其他车辆数据的完整性,对异常值进行剔除,并对缺失值和剔除后的异常值采用填补规则进行填补,缺失值填补规则如表3所示。
表3
采用混合构造法构造目标车辆残值预测模型的因变量(即车辆残值影响系数lnY),基于专家参考价格和车辆购置成本构建车辆成新率Y,并进行对数处理,同时选取专家参考价作为实际的车辆残值,以此作后续残值比较依据。
结合车辆历史维修记录与相关技术规范文件综合得到新能源汽车的部件维修总表。根据不同的部件名称,需要先提取出特定格式或特殊字符,再删去方位词、形容词、维修动词等不必要的修饰,最后进行去重、归纳,得到汽车维修的部件总表。
进一步对每一个维修部件的重要程度进行划分,并赋予相应的权重。本实施例中维修部件根据重要性程度依次被赋予1分、2分、3分以及4分。
其中,1分对应常规部件,重要程度较低,对其进行维修与更换不能直接反映车辆损失的严重程度;2分对应较重要部件,这些部件通常在中小事故里受到损伤;3分对应重要部件,是汽车构架中最重要的部分,这些部件受损通常意味着遭遇了较大事故;4分专门针对新能源汽车的电池部件,考虑到电池是新能源汽车的核心部件,其性能的优劣程度很大程度上决定了整辆车的价值。
同时,为了避免出现“维修常规部件过多导致得分过低”的现象,需要依次对1、2、3、4分的累积扣分设置不同的上限。
对维修记录中的每一个部件进行匹配处理。本实施例根据部件名称的不同形式,依次采用四种不同的匹配处理方式,具体处理方式介绍如下:
1、涉及到“全损车”、“水淹车”、“全损项目”等相关字样或者维修金额达到新车购置价的60%以上时,判定此次事故为重大交通事故,综合得分为0,不再后续的字段匹配。
2、涉及到“全车拆装”、“返厂维修”等相关字样时,意味着遭遇了一定程度的交通事故,对该项维修信息额外赋值,其他字段将继续进行匹配操作。
3、涉及到“无”、“其他”、“不详”等相关字样且部件维修个数小于固定阈值时,将会根据损失金额的大小进行赋值,其他字段将继续进行匹配操作。
4、除去上述三种特殊情况,对于常规维修部件而言,需要先提取出特定格式或特殊字符,再删去方位词、形容词、维修动词等不必要的修饰;考虑到信息调取时容易出现部件名未切分的情况,如“保险杠前叶前门叶子板”,需要进一步自定义停用词,进行分词切割处理;最后依次计算维修部件i与重要部件j的匹配程度,匹配程度计算公式如下所示:
/>
其中,Dij为维修部件i与重要部件j的匹配程度,n表示两个部件重复的字符个数,ni、nj分别表示维修部件与重要部件的字符个数。在出现多个匹配程度大于设定阈值的部件名时,优先选择匹配程度较高、赋值分数较大的部件,从而记录对应的部件分值。
本实施例将确定车辆损失得分的计算分成两步,具体计算方式介绍如下:
1、首先确定单份维修记录的综合得分。以满分100为上限,对维修类型“更换”和“维修”两种方式分别赋予不同的权重,而对于上述第2和3中匹配处理方式,直接视作“更换”处理;之后依次扣除加权后的部件分值,进而得到单份维修记录的综合得分。
2、在得到单份维修记录的综合得分之后,以相同的方式获取同一车辆下其他维修记录的综合得分。为了消除不同价位的车辆维修费用存在差异的问题,选取车辆损失金额作为权重,加权计算最终得分,维修记录的综合得分计算公式如下所示:
其中,u表示维修记录数量,mi表示该维修记录的车辆损失金额,∑mi表示该车辆的车辆损失金额累计值,si表示该维修记录的综合得分。
需要注意的是,如果综合得分si中曾出现0值时,则认为该车辆遭遇过重大车辆受损事故,最终得分直接判定为0,而不再进行加权计算。
本实施例将维修数据不完整时数据缺失情况分成三类,数据缺失的具体处理方式如下所示:
1、车辆损失金额缺失,但维修记录完整
预先设定某一阈值,优先选取同一车辆下其他维修记录的平均损失金额作为临时金额,如果筛选条数小于阈值,则用信息池中的平均损失金额临时代替,进而根据上述步骤计算该记录的综合得分,之后再对临时金额进行如下修正:如果所得到的得分小于设定的最低得分阈值,则认为此起事故等级较高,以新车购置价的60%作为最终损失金额;如果大于最低得分阈值,则在信息池中筛选出综合得分上下浮动α%的所有记录,将其平均值作为最终损失金额,从而参与最终得分的计算。如果筛选所得的记录条数小于阈值,则依次以(α+iθ)%重新筛选,直至满足条件为止,其中i=1,2,3…。本实施例将α设置为1,θ设置为0.1。
2、车辆损失金额完整,但维修记录缺失
根据车辆损失金额,如果其大于新车购置价的60%,则判定此次事故等级较高,综合得分为0;反之,则在信息池中筛选出金额上下浮动β%的所有记录,将其得分均值作为该维修记录的综合得分,从而参与最终得分的计算。如果筛选所得的记录条数小于阈值,则依次以(β+kμ)%重新筛选,直至满足条件为止,其中k=1,2,3…。本实施例将β设置为10,μ设置为1。
3、车辆损失金额与维修记录均缺失
同样设定某一阈值,优先选取同一车辆下其他维修记录的平均损失金额和平均综合得分,如果筛选条数小于阈值,则选择信息池中的平均损失金额和平均综合得分,从而参与最终得分的计算。
需要注意的是,本实施例中额外构建了车辆损失信息池,即一定数量的车辆损失计算结果,包括车辆ID、损失金额和损失得分。
本实施例根据对应的释义采用不同的量化规则确定其他输入变量,部分字段的规则如下所示:
1、使用天数
使用天数X反映了汽车的折旧程度,使用的时间越长,汽车自然损耗的程度就越大,其原始值的计算方式下所示:
使用天数X=当前计算日期-初次登记日期
根据字段说明,使用天数X对应的量化值X*计算方式如下所示:
2、历史事故数
事故次数Z反映了汽车在使用过程中的人为损伤程度,事故次数越多,对汽车的损伤程度越高,事故次数Z对应的量化值Z*计算方式如下所示:
本实施例采用了长短期记忆网络(LSTM,Long Short-Term Memory)提取出具有时序特征的输入变量,进一步挖掘序列中的长短期关系。表4为本实施例部分序列数据,对于每一个样本的序列数据,逐步作为一个batch(批次)输入到LSTM模型中,学习序列中的时间依赖关系,并选择最后一个时间步的隐藏状态作为特征表示。
表4
本实施例选取了包装法(Wrapper)对所有输入变量进行特征选取,以支持向量机模型作为基学习器,采用留一法(Leave-One-Out)选取最优参数,以均方误差作为衡量指标,逐步添加直到找到最优的特征组合。表5为本实施例模型的变量字段,本实施例中最终得到模型的变量字段共13个。
表5
变量 | 字段名称 | 变量 | 字段名称 |
X1 | 车辆品牌 | X8 | 自放电率评分 |
X2 | 使用天数 | X9 | 是否有营业记录 |
X3 | 充电次数 | X10 | 温度一致性评分 |
X4 | 新车购置价 | X11 | 百公里耗电评价 |
X5 | 车牌变更次数 | X12 | 充电电芯平均压差 |
X6 | 电池整体评价 | X13 | 车辆损失计算得分 |
X7 | 月均行驶里程 |
对于所有输入变量,本实施例采用了最小值-最大值归一化(min-max)方法,归一化至区间[0,1],归一化计算公式如下所示:
鉴于新能源二手汽车交易数据有限的现实条件,以及各种机器学习模型在小样本数据集上的表现情况,本实施例最终采用了支持向量机模型作为合适的机器学习模型。
本实施例按照8:2的比例将64条新能源二手车随机分为训练集与测试集,其中训练集包括51辆新能源二手车,测试集包括13辆新源能二手车。在训练数据集的基础上采用留一法进行交叉验证,以预测残值的均方误差作为衡量指标,均方误差计算方式如下所示:
其中,Yi表示实际的车辆残值,是模型计算的车辆残值。需要注意的是,/>是由车辆成新率/>与新车购置价Pi计算得到的,模型计算的车辆残值计算公式如下所示:
进而得到最优的模型参数,实施例中最优参数设置为:核函数选定为径向基(Radial Basis Function,RBF)核函数,惩罚参数C=219,径向基核函数中的参数γ=2-11。此时模型在训练集上的均方误差MSE达到最小值3.2884。
对于训练集中的51辆新能源二手车,表6为训练集车辆的实际残值与模型计算残值对比。对于测试集中的13辆新源能二手车,表7为测试集车辆的实际残值与模型计算残值对比。由此可以看出,绝大部分新能源二手汽车的残值预测结果与专家参考价格比较相近,本实施例提供的目标车辆残值预测模型的具有不错的泛化能力和准确性。
表6
/>
表7
序号 | 车辆ID | 实际残值(万元) | 模型计算残值(万元) |
1 | 02 | 22.80 | 21.39 |
2 | 05 | 7.46 | 7.29 |
…… | …… | …… | …… |
…… | …… | …… | …… |
12 | 62 | 3.55 | 4.36 |
13 | 64 | 4.30 | 4.35 |
本实施例提供的新能源车辆残值获取方法,从历史信息的角度切入,构建了完整的车辆价值损失计算流程,综合考虑了多个维度的因素,反映车辆残值因变量的设定更加合理,同时对进一步利用了序列数据中的长短期依赖关系,以建立合适的机器学习计算模型,提高了新能源二手车残值计算的客观性和准确性,实现了高效的自动化和规模化计算,具有更广泛的适用性和应用前景。
图4为本申请实施例提供的一种新能源车辆残值获取装置的结构示意图,如图4所示,该装置40可以包括:数据信息获取模块401、影响系数获取模块402和车辆残值获取模块403;
数据信息获取模块401,用于获取目标新能源车辆的残值影响静态数据和残值影响时序数据;其中,残值影响静态数据包括不具有时序特征的残值影响数据;残值影响时序数据包括具有时序特征的残值影响数据;
影响系数获取模块402,用于将残值影响静态数据和残值影响时序数据输入目标车辆残值预测模型中,获取目标车辆残值预测模型输出的目标车辆残值影响系数;其中,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本残值影响时序数据和对应的样本车辆残值影响系数训练得到;
车辆残值获取模块403,用于根据目标车辆残值影响系数,获取目标新能源车辆的车辆残值。
本实施例提供的技术方案通过将影响新能源车辆残值的残值影响数据以是否具有时序特征进行划分,获取残值影响静态数据和残值影响时序数据,以残值影响静态数据和残值影响时序数据进行车辆残值的预测。相较于现有的仅选择截面数据作为模型输入的机器学习方案,本申请充分考虑数据在时间上的变化,使目标车辆残值预测模型能够更好的捕捉到车辆残值和时间相关的变化趋势和规律,并且能够更好地反映市场供需关系、经济因素等变动对车辆残值的影响,提高目标车辆残值预测模型的泛化能力和准确性,进而提高新能源车辆残值获取结果的可靠性。
本申请实施例的装置可执行本申请实施例所提供的方法,其实现原理相类似,本申请各实施例的装置中的各模块所执行的动作是与本申请各实施例的方法中的步骤相对应的,对于装置的各模块的详细功能描述具体可以参见前文中所示的对应方法中的描述,此处不再赘述。
在本申请的一种可选实施例中,数据信息获取模块,具体用于:
获取目标新能源车辆的残值影响相关信息,对残值影响相关信息进行文本信息抽取和数据清洗预处理,获取预处理后的残值影响相关信息;
根据预设数据量化规则处理预处理后的残值影响相关信息,获取残值影响数据;
根据残值影响数据是否具有时序特征,将残值影响数据划分为残值影响静态数据和残值影响时序数据。
在本申请的一种可选实施例中,数据信息获取模块,具体用于:
根据预设数据量化规则处理预处理后的残值影响相关信息,获取多个残值影响量化值;
将多个残值影响量化值划分为至少一个影响类别分组;其中,影响类别分组中包括至少一个残值影响量化值;
根据每一影响类别分组中各残值影响量化值的权值,对影响类别分组对应的残值影响量化值进行加权融合,得到每一影响类别分组对应的残值影响数据。
在本申请的一种可选实施例中,影响系数获取模块,具体用于:
根据残值影响时序数据获取至少一个时序特征数据序列,并获取每一时序特征数据序列对应的中间时序特征;其中,中间时序特征包括时序特征数据序列中数据的时间依赖关系;
将残值影响静态数据和每一中间时序特征输入目标车辆残值预测模型中;
其中,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本中间时序特征和样本车辆残值影响系数训练得到;样本中间时序特征根据样本残值影响时序数据获取。
在本申请的一种可选实施例中,影响系数获取模块,具体用于:
对残值影响静态数据和中间时序特征中的所有待输入特征数据进行筛选,得到多个目标待输入特征数据;
将每一目标待输入特征数据输入目标车辆残值预测模型中。
在本申请的一种可选实施例中,影响系数获取模块,具体用于:
对残值影响静态数据和中间时序特征中的所有待输入特征数据进行筛选,得到多个原始目标待输入特征数据;
对原始目标待输入特征数据进行归一化处理,得到多个目标待输入特征数据。
在本申请的一种可选实施例中,新能源车辆残值获取装置,还包括:预测模型获取模块;预测模型获取模块,具体用于:
根据重置成本法,构建车辆残值影响系数计算公式;其中,车辆残值影响系数用于指示车辆成新率;
根据样本新能源车辆集中每一样本新能源车辆对应的样本车辆残值和样本新车购置价格,采用车辆残值影响系数计算公式,获取每一样本新能源车辆对应的样本车辆残值影响系数;
根据样本新能源车辆集中每一样本新能源车辆对应的样本残值影响静态数据、样本残值影响时序数据和样本车辆残值影响系数,获取目标车辆残值预测模型。
本申请实施例中提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,该处理器执行上述计算机程序以实现上述新能源车辆残值获取方法的步骤,与相关技术相比可实现:通过将影响新能源车辆残值的残值影响数据以是否具有时序特征进行划分,获取残值影响静态数据和残值影响时序数据,以残值影响静态数据和残值影响时序数据进行车辆残值的预测。相较于现有的仅选择截面数据作为模型输入的机器学习方案,本申请充分考虑数据在时间上的变化,使目标车辆残值预测模型能够更好的捕捉到车辆残值和时间相关的变化趋势和规律,并且能够更好地反映市场供需关系、经济因素等变动对车辆残值的影响,提高目标车辆残值预测模型的泛化能力和准确性,进而提高新能源车辆残值获取结果的可靠性。
在一个可选实施例中提供了一种电子设备,图5为本申请实施例提供的一种电子设备的结构示意图,如图5所示,图5所示的电子设备50包括:处理器501和存储器503。其中,处理器501和存储器503相连,如通过总线502相连。可选地,电子设备500还可以包括收发器504,收发器504可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器504不限于一个,该电子设备500的结构并不构成对本申请实施例的限定。
处理器501可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器501也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线502可包括一通路,在上述组件之间传送信息。总线502可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线502可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器503可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其他磁存储设备、或者能够用于携带或存储计算机程序并能够由计算机读取的任何其他介质,在此不做限定。
存储器503用于存储执行本申请实施例的计算机程序,并由处理器501来控制执行。处理器501用于执行存储器503中存储的计算机程序,以实现前述方法实施例所示的步骤。
本申请实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)、可穿戴设备等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。
需要说明的是,本申请上述的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”、“1”、“2”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除图示或文字描述以外的顺序实施。
应该理解的是,虽然本申请实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本申请实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本申请实施例对此不限制。
以上所述仅是本申请部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的方案技术构思的前提下,采用基于本申请技术思想的其他类似实施手段,同样属于本申请实施例的保护范畴。
Claims (10)
1.一种新能源车辆残值获取方法,其特征在于,包括:
获取目标新能源车辆的残值影响静态数据和残值影响时序数据;其中,所述残值影响静态数据包括不具有时序特征的残值影响数据;所述残值影响时序数据包括具有时序特征的残值影响数据;
将所述残值影响静态数据和所述残值影响时序数据输入目标车辆残值预测模型中,获取所述目标车辆残值预测模型输出的目标车辆残值影响系数;其中,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本残值影响时序数据和对应的样本车辆残值影响系数训练得到;
根据所述目标车辆残值影响系数,获取所述目标新能源车辆的车辆残值。
2.根据权利要求1所述的新能源车辆残值获取方法,其特征在于,所述获取目标新能源车辆的残值影响静态数据和残值影响时序数据,具体包括:
获取所述目标新能源车辆的残值影响相关信息,对所述残值影响相关信息进行文本信息抽取和数据清洗预处理,获取预处理后的残值影响相关信息;
根据预设数据量化规则处理所述预处理后的残值影响相关信息,获取残值影响数据;
根据所述残值影响数据是否具有时序特征,将所述残值影响数据划分为所述残值影响静态数据和所述残值影响时序数据。
3.根据权利要求2所述的新能源车辆残值获取方法,其特征在于,所述根据预设数据量化规则处理所述预处理后的残值影响相关信息,获取残值影响数据,具体包括:
根据预设数据量化规则处理所述预处理后的残值影响相关信息,获取多个残值影响量化值;
将所述多个残值影响量化值划分为至少一个影响类别分组;其中,所述影响类别分组中包括至少一个残值影响量化值;
根据每一影响类别分组中各残值影响量化值的权值,对所述影响类别分组对应的残值影响量化值进行加权融合,得到每一影响类别分组对应的残值影响数据。
4.根据权利要求1-3任一项所述的新能源车辆残值获取方法,其特征在于,所述将所述残值影响静态数据和所述残值影响时序数据输入目标车辆残值预测模型中,具体包括:
根据所述残值影响时序数据获取至少一个时序特征数据序列,并获取每一时序特征数据序列对应的中间时序特征;其中,所述中间时序特征包括所述时序特征数据序列中数据的时间依赖关系;
将所述残值影响静态数据和每一中间时序特征输入所述目标车辆残值预测模型中;
其中,所述目标车辆残值预测模型根据样本新能源车辆的所述样本残值影响静态数据、样本中间时序特征和所述样本车辆残值影响系数训练得到;所述样本中间时序特征根据所述样本残值影响时序数据获取。
5.根据权利要求4所述的新能源车辆残值获取方法,其特征在于,所述将所述残值影响静态数据和每一中间时序特征输入所述目标车辆残值预测模型中,具体包括:
对所述残值影响静态数据和所述中间时序特征中的所有待输入特征数据进行筛选,得到多个目标待输入特征数据;
将每一所述目标待输入特征数据输入所述目标车辆残值预测模型中。
6.根据权利要求5所述的新能源车辆残值获取方法,其特征在于,所述对所述残值影响静态数据和所述中间时序特征中的所有待输入特征数据进行筛选,得到多个目标待输入特征数据,具体包括:
对所述残值影响静态数据和所述中间时序特征中的所有待输入特征数据进行筛选,得到多个原始目标待输入特征数据;
对所述原始目标待输入特征数据进行归一化处理,得到多个目标待输入特征数据。
7.根据权利要求1-3任一项所述的新能源车辆残值获取方法,其特征在于,所述目标车辆残值预测模型通过以下方式获取:
根据重置成本法,构建车辆残值影响系数计算公式;其中,所述车辆残值影响系数用于指示车辆成新率;
根据样本新能源车辆集中每一样本新能源车辆对应的样本车辆残值和样本新车购置价格,采用所述车辆残值影响系数计算公式,获取每一样本新能源车辆对应的样本车辆残值影响系数;
根据样本新能源车辆集中每一样本新能源车辆对应的所述样本残值影响静态数据、所述样本残值影响时序数据和所述样本车辆残值影响系数,获取所述目标车辆残值预测模型。
8.一种新能源车辆残值获取装置,其特征在于,包括:
数据信息获取模块,用于获取目标新能源车辆的残值影响静态数据和残值影响时序数据;其中,所述残值影响静态数据包括不具有时序特征的残值影响数据;所述残值影响时序数据包括具有时序特征的残值影响数据;
影响系数获取模块,用于将所述残值影响静态数据和所述残值影响时序数据输入目标车辆残值预测模型中,获取所述目标车辆残值预测模型输出的目标车辆残值影响系数;其中,目标车辆残值预测模型根据样本新能源车辆的样本残值影响静态数据、样本残值影响时序数据和对应的样本车辆残值影响系数训练得到;
车辆残值获取模块,用于根据所述目标车辆残值影响系数,获取所述目标新能源车辆的车辆残值。
9.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310994742.XA CN117035888A (zh) | 2023-08-08 | 2023-08-08 | 新能源车辆残值获取方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310994742.XA CN117035888A (zh) | 2023-08-08 | 2023-08-08 | 新能源车辆残值获取方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117035888A true CN117035888A (zh) | 2023-11-10 |
Family
ID=88622020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310994742.XA Pending CN117035888A (zh) | 2023-08-08 | 2023-08-08 | 新能源车辆残值获取方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117035888A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101998A (zh) * | 2020-09-15 | 2020-12-18 | 北京嘀嘀无限科技发展有限公司 | 残值确定方法、模型获取方法、装置、设备及存储介质 |
CN113052633A (zh) * | 2021-03-26 | 2021-06-29 | 中国第一汽车股份有限公司 | 车辆残值评估方法、装置、设备及介质 |
CN115034821A (zh) * | 2022-06-16 | 2022-09-09 | 平安银行股份有限公司 | 一种车辆估值方法、装置、计算机设备及存储介质 |
CN116449212A (zh) * | 2023-03-17 | 2023-07-18 | 奇瑞新能源汽车股份有限公司 | 一种电动汽车锂离子电池残值快速评估方法及系统 |
-
2023
- 2023-08-08 CN CN202310994742.XA patent/CN117035888A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101998A (zh) * | 2020-09-15 | 2020-12-18 | 北京嘀嘀无限科技发展有限公司 | 残值确定方法、模型获取方法、装置、设备及存储介质 |
CN113052633A (zh) * | 2021-03-26 | 2021-06-29 | 中国第一汽车股份有限公司 | 车辆残值评估方法、装置、设备及介质 |
CN115034821A (zh) * | 2022-06-16 | 2022-09-09 | 平安银行股份有限公司 | 一种车辆估值方法、装置、计算机设备及存储介质 |
CN116449212A (zh) * | 2023-03-17 | 2023-07-18 | 奇瑞新能源汽车股份有限公司 | 一种电动汽车锂离子电池残值快速评估方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111340616B (zh) | 线上贷款的审批方法、装置、设备及介质 | |
CN110264270B (zh) | 一种行为预测方法、装置、设备和存储介质 | |
CN107704512A (zh) | 基于社交数据的金融产品推荐方法、电子装置及介质 | |
CN109636482B (zh) | 基于相似度模型的数据处理方法及系统 | |
CN111931989A (zh) | 基于深度学习神经网络的电力系统短期负荷预测方法 | |
CN112785377B (zh) | 基于数据分布的订单完工期预测模型构建方法及预测方法 | |
CN111199469A (zh) | 用户还款模型生成方法、装置及电子设备 | |
CN110766481A (zh) | 客户数据处理方法、装置、电子设备及计算机可读介质 | |
CN113837596A (zh) | 一种故障确定方法、装置、电子设备及存储介质 | |
CN111754317A (zh) | 一种金融投资数据测评方法及系统 | |
CN113807469A (zh) | 一种多能源用户价值预测方法、装置、存储介质和设备 | |
CN114548586A (zh) | 一种基于混合模型的短期电力负荷预测方法及系统 | |
CN111626543A (zh) | 电力相关数据的处理方法及装置 | |
CN111626855A (zh) | 债券信用利差预测方法及系统 | |
CN105405051A (zh) | 金融事件预测方法和装置 | |
CN111179055A (zh) | 授信额度调整方法、装置和电子设备 | |
CN113298121B (zh) | 基于多数据源建模的消息发送方法、装置和电子设备 | |
CN113919432A (zh) | 一种分类模型构建方法、数据分类方法及装置 | |
CN113450004A (zh) | 电力信用报告生成方法、装置、电子设备及可读存储介质 | |
CN112801315A (zh) | 电力二次设备的状态诊断方法、装置及终端 | |
CN115423600B (zh) | 数据筛选方法、装置、介质及电子设备 | |
CN111582589A (zh) | 一种租车出险预测方法、装置、设备及存储介质 | |
CN116451125A (zh) | 一种新能源车车主识别方法、装置、设备及存储介质 | |
CN116527398A (zh) | 物联网卡风险识别方法、装置、设备及存储介质 | |
CN117035888A (zh) | 新能源车辆残值获取方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |