CN108280674A - 一种利用大数据进行二手车估值的方法及系统 - Google Patents

一种利用大数据进行二手车估值的方法及系统 Download PDF

Info

Publication number
CN108280674A
CN108280674A CN201711479971.9A CN201711479971A CN108280674A CN 108280674 A CN108280674 A CN 108280674A CN 201711479971 A CN201711479971 A CN 201711479971A CN 108280674 A CN108280674 A CN 108280674A
Authority
CN
China
Prior art keywords
function
valuation
library
used car
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711479971.9A
Other languages
English (en)
Inventor
蓬蕾
程博
杨永健
高飘飘
刘志文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Ding Ding Technology Co Ltd
Original Assignee
Guangdong Ding Ding Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Ding Ding Technology Co Ltd filed Critical Guangdong Ding Ding Technology Co Ltd
Priority to CN201711479971.9A priority Critical patent/CN108280674A/zh
Publication of CN108280674A publication Critical patent/CN108280674A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种利用大数据进行二手车估值的方法的系统,包括以下步骤:S11、获取用户输入的待估值二手车的车型信息;S12、从估值模型的函数数据库中获取对应的估值函数,并从估值模型的参数数据库中获得对应的所有函数参数后,将车型信息代入到估值函数中,计算获得待估值二手车的市场估值价格;其中,车型信息包括型号、上牌时间、里程、车况、交易地点和/或颜色;估值模型是基于大数据训练获得的多元非线性计算模型,由函数数据库和参数数据库组成。本发明估值准确度高,而且稳定性高,可以较为准确地估算获得二手车的价格,可广泛应用于二手车估值行业中。

Description

一种利用大数据进行二手车估值的方法及系统
技术领域
本发明涉及数据处理领域,特别是涉及一种利用大数据进行二手车估值的方法及系统。
背景技术
随着二手车交易的蓬勃发展,原来依靠估值师经验的定价方式已经不能满足市场需求。随着大量二手车交易数据的积累,应用机器学习建立数学模型根据车辆的各种特征对车辆进行估值已经成为可能和未来的方向。
二手车交易过程中,如何进行二手车估值是一个重要的前提,传统的二手车估值方法主要有如下几种:一、凭经验人工估值,这种方式依靠估值师经验,难以保证估值的规模化而且成本非常高,不能满足市场需求。二、通过寻找最相近的已成交车源的成交价并在其基础上做一定修正后作为估值。这种方案依赖几个最相近的已成交车源的价格,而成交价和买卖双方的议价能力有很大关系,导致其随机性比较强。因此过于依赖于几个车源的方法会容易被随机性干扰,导致不稳定的结果。三、依靠车源的几个特征,例如车龄、里程、车况这些因素和成交价之间的线性关系计算估值,这种方法过于简化了车源特征和成交价之间的关系,诸如市场动态,地域差别,配置,品牌等重要因素都被忽视,从而导致结果的准确度和解释性都很差。总的来说,现在的二手车估值方法存在着较多的不稳定性,准确度低。
发明内容
为了解决上述的技术问题,本发明的目的是提供一种利用大数据进行二手车估值的方法,本发明的另一目的是提供一种利用大数据进行二手车估值的系统。
本发明解决其技术问题所采用的第一技术方案是:
一种利用大数据进行二手车估值的方法,包括以下步骤:
S11、获取用户输入的待估值二手车的车型信息;
S12、从估值模型的函数数据库中获取对应的估值函数,并从估值模型的参数数据库中获得对应的所有函数参数后,将车型信息代入到估值函数中,计算获得待估值二手车的市场估值价格;
其中,所述车型信息包括型号、上牌时间、里程、车况、交易地点和/或颜色;
所述估值模型是基于大数据训练获得的多元非线性计算模型,由函数数据库和参数数据库组成。
进一步,所述估值模型是通过以下步骤训练获得的:
S01、获取最近一段时间内二手车的多组历史交易数据;
S02、结合预设的车型数据库,将每组历史交易数据解析为价格以及多个与二手车相关的影响因素;
S03、根据解析结果,针对每种车型,从预设的备选函数库中选取合适的估值函数以及各影响因素的影响函数,并计算获得估值函数和各影响函数相应的函数参数;
S04、将历史交易数据中价格扣除上述影响因素带来的影响后,利用广义时间序列方法外推获得当前和未来几周的价格趋势预测结果,进而建立对应的时间影响函数,并获得对应的函数参数;
S05、将获得的每种车型的估值函数、各影响函数以及时间影响函数组成函数数据库,并将所有函数参数组成参数数据库后,得到由函数数据库和参数数据库构成的估值模型;
其中,所述影响因素包括车型标准折旧因素、配置价值折旧因素、城市影响因素、交易类型影响因素和个体因子影响因素,所述估值函数为各影响函数的线性或非线性函数,所述各影响函数为对应影响因素的线性或非线性函数,且估值函数和各影响函数中包含至少一个非线性函数。
进一步,所述参数数据库包括车型标准折旧库、配置价值折旧库、城市影响参数库、交易类型影响参数库、个体因子影响参数库和时间影响参数库。
进一步,所述步骤S03中,所述从预设的备选函数库中选取合适的估值函数以及各影响因素的影响函数的步骤中,采用的选取原则为:
从预设的备选函数库中选取函数组成不同的估值函数和各影响函数的函数组合后,代入解析得到的价格以及多个影响因素进行计算,最后选择总体拟合度最好的函数组合。
进一步,还包括如下的估值模型更新步骤:
S21、定期获取最近一段时间内的二手车的历史交易数据;
S22、结合预设的车型数据库,解析获得每个历史交易数据对应的车型和配置情况;
S23、将解析后的历史交易数据存储到历史数据库中;
S24、当判断历史数据库的新增记录累计达到预设阈值时,进行估值模型更新。
进一步,所述步骤S24中所述进行估值模型更新的步骤,具体包括:
S241、对每个新增记录的历史交易数据进行交叉数据清洗处理,剔除不具备代表性的历史交易数据;
S242、对剔除后剩下的所有历史交易数据进行解析后,基于解析结果,根据估值模型的估值函数,更新估值模型的车型标准折旧库、配置价值折旧库、城市影响参数库、交易类型影响参数库和个体因子影响参数库;
S243、利用广义时间序列方法外推获得当前和未来几周的价格趋势预测结果后,更新估值模型的时间影响参数库。
进一步,所述历史交易数据包括城市、车型、型号、年款、里程、上牌年月、颜色,还包括交易类型、过户次数、车况和/或保养情况。
本发明解决其技术问题所采用的第二技术方案是:
一种利用大数据进行二手车估值的系统,包括存储介质和处理器,所述存储介质存储有至少一个指令,所述处理器用于加载所述至少一个指令,从而执行以下步骤:
S11、获取用户输入的待估值二手车的车型信息;
S12、从估值模型的函数数据库中获取对应的估值函数,并从估值模型的参数数据库中获得对应的所有函数参数后,将车型信息代入到估值函数中,计算获得待估值二手车的市场估值价格;
其中,所述车型信息包括型号、上牌时间、里程、车况、交易地点和/或颜色;
所述估值模型是基于大数据训练获得的多元非线性计算模型,由函数数据库和参数数据库组成。
本发明解决其技术问题所采用的第三技术方案是:
一种利用大数据进行二手车估值的系统,包括车型数据库、输入模块、计算模块和用于为计算模块提供估值模型的模型存储模块,所述车型数据库与计算模块连接;
所述输入模块,用于获取用户输入的待估值二手车的车型信息;
所述计算模块,用于从估值模型的函数数据库中获取对应的估值函数,并从估值模型的参数数据库中获得对应的所有函数参数后,将车型信息代入到估值函数中,计算获得待估值二手车的市场估值价格;
其中,所述车型信息包括型号、上牌时间、里程、车况、交易地点和/或颜色;
所述估值模型是基于大数据训练获得的多元非线性计算模型,由函数数据库和参数数据库组成。
本发明方法、系统的有益效果是:本发明从基于大数据训练获得的估值模型的函数数据库中获取对应的估值函数,并从估值模型的参数数据库中获得对应的所有函数参数后,将用户输入车型信息代入到估值函数中,可以计算获得待估值二手车的市场估值价格。本发明基于大数据训练获得的估值模型来进行二手车估值,估值准确度高,而且稳定性高,可以较为准确地估算获得二手车的价格。
附图说明
图1是本发明的利用大数据进行二手车估值的方法的流程图;
图2是本发明的估值模型的建立过程流程图;
图3是本发明的利用大数据进行二手车估值的系统的结构框图。
具体实施方式
实施例一
参照图1,本发明提供了一种利用大数据进行二手车估值的方法,包括以下步骤:
S11、获取用户输入的待估值二手车的车型信息;本步骤中,可以通过APP、网站或者API接口,获取用户输入的数据;
S12、从估值模型的函数数据库中获取对应的估值函数,并从估值模型的参数数据库中获得对应的所有函数参数后,将车型信息代入到估值函数中,计算获得待估值二手车的市场估值价格;
其中,所述车型信息包括型号、上牌时间、里程、车况、交易地点和/或颜色;
所述估值模型是基于大数据训练获得的多元非线性计算模型,由函数数据库和参数数据库组成。
本方法采用基于大数据训练获得的估值模型来进行二手车估值,估值准确度高,而且稳定性高,可以较为准确地估算获得二手车的价格。
步骤S12中,将车型信息代入到估值函数中这一步骤,具体为:首先根据用户输入的车型信息,结合预设的车型数据库,匹配获得对应的车型配置信息,然后将车型信息和车型配置信息转换为数值变量后,再代入估值函数中进行计算。具体信息转化过程可以采用现有数据处理中的通用做法,例如采用标识码来标识一些重要信息,采用总时长来标识上牌时间等。
进一步作为优选的实施方式,参照图2,所述估值模型是通过以下步骤S01~S05训练获得的:
S01、获取最近一段时间内二手车的多组历史交易数据;
S02、结合预设的车型数据库,将每组历史交易数据解析为价格以及多个与二手车相关的影响因素;
结合预设的车型数据库进行解析的过程:首先通过品牌匹配表找到车型数据库中对应的标准品牌名称。其次新增车源的车型及型号名称会与该品牌下所属各车型和型号逐一进行模糊匹配,找到和车源名称匹配度最好的前几名候选型号。然后再结合配置的相符情况以及销售时间和年款的匹配情况等综合进行打分,分数最高且高于阈值者被认为匹配成功。调取匹配上的标准型号的车型及配置信息补入新增车源记录完成解析。因此解析得到的除了价格之外的信息,均为本实施例中所指的影响因素。影响因素实际上是与车辆的品牌、车型、配置、城市、时间、交易类型、车龄、里程、车况、颜色等与价格相关的特性,每个特性都可能在不同的方面对二手车的价格造成影响,本发明将这些特性归纳为车型标准折旧因素、配置价值折旧因素、城市影响因素、交易类型影响因素和个体因子影响因素。
本步骤中,解析后,进行数据清洗,再执行步骤S03,从而使得估值模型更为准确。
具体的数据清洗原理如下:清洗的逻辑就是判断某个车源是否离群,如果离群就不进入建模。而这个“群”是从不同维度定义的。例如如果按照车龄划分群,每个车龄保值率都有差异。比如3年保值率仍然为90%的车,其交易记录就会被认为是不具有代表性的记录。这里仅仅列举了按照车龄和保值率关系进行清洗的维度。其他涉及清洗的相关维度还有里程,车身类型,车型,地域等。如果认为是不具有代表性的记录,将不能用于更新估值模型,将其进行剔除。
S03、根据解析结果,针对每种车型,从预设的备选函数库中选取合适的估值函数以及各影响因素的影响函数,并计算获得估值函数和各影响函数相应的函数参数;
S04、将历史交易数据中价格扣除上述影响因素带来的影响后,利用广义时间序列方法外推获得当前和未来几周的价格趋势预测结果,进而建立对应的时间影响函数,并获得对应的函数参数;
具体的,将历史交易数据中价格扣除上述影响因素带来的影响的过程,是指将二手车的价格减去采用步骤S03建立的估值函数所计算获得的市场估值价格,将得到的差值作为时间影响因素所导致的价格差,因此根据该价格差,利用广义时间序列方法外推获得当前和未来几周的价格趋势预测结果。
S05、将获得的每种车型的估值函数、各影响函数以及时间影响函数组成函数数据库,并将所有函数参数组成参数数据库后,得到由函数数据库和参数数据库构成的估值模型;
其中,所述影响因素包括车型标准折旧因素、配置价值折旧因素、城市影响因素、交易类型影响因素和个体因子影响因素,所述估值函数为各影响函数的线性或非线性函数,所述各影响函数为对应影响因素的线性或非线性函数,且估值函数和各影响函数中包含至少一个非线性函数。在组成函数数据库和参数数据库的过程中,同时关联存储其每个估值函数和影响函数对应的车型信息,方便后续进行匹配。
例如,通过步骤S01~S05计算获得,针对某种车型,其估值函数为其中,Z1~Zn分别表示不同影响因素对应的影响函数,且 表示估值函数的参数,F1~Fn均为函数符号,Xi表示影响因素,表示影响因素变形参数,其中i=1,2,3…,n。
进一步作为优选的实施方式,所述参数数据库包括车型标准折旧库、配置价值折旧库、城市影响参数库、交易类型影响参数库、个体因子影响参数库和时间影响参数库。
具体的,本实施例中,车型数据库被配置为:包含每个型号车辆的特征信息,例如该型号所属车型和品牌、新车在售时间段、年款、厂商建议价、重要的配置信息、以及物理参数诸如长宽高排量等信息。
各参数库的详细描述如下:
一、车型标准折旧库,记载了每个车型根据车龄增长的折旧曲线。对于不同城市这个折旧曲线可以不同。则在建立估值模型的过程中,针对不同城市,车型标准折旧库的参数可以是不同的。
二、配置价值折旧库:记载了车辆的每个重点配置信息特有的折旧曲线,这个折旧曲线可以与车型折旧曲线相同,也可以不同。
三、城市影响参数库:记载每个城市的二手车价格相对全国平均的整体偏移情况、该城市中与整体偏移不相符的特殊车型是哪些及这些车型个体偏移情况。
四、交易类型影响参数库:记录不同交易类型对于价格造成的价差。这个交易类型的价差会随着城市变化而变化。
五、时间影响参数库:记录二手车市场的整体变化趋势曲线。每个城市有自己的市场走势,估值时取最近一期的时间点上的值进行估算。更具体的,时间影响参数库是时间序列结构的结果。季节,宏观经济和政策对价格的影响是通过时间序列趋势来反应的。这个趋势是扣除价格中因为车型,交易类型,车辆个体信息等因素和基期不同而引起的差异后得到历史趋势。这个趋势用广义时间序列的方法外推可以进行短期预测从而得到当前和未来几周的趋势预测。因此本实施例通过计算后建立对应的时间影响函数,并获得对应的函数参数,可以在估值模型中体现该随时间变化的趋势。
六、个体因子影响参数库:包含各类个体因子影响的参数和函数,这些函数可以将里程、上牌时间、车况、颜色等个体因子的变化情况折算为对二手车价格影响的值。不同城市不同车型的这一套影响参数可以不同。
进一步作为优选的实施方式,所述步骤S03中,所述从预设的备选函数库中选取合适的估值函数以及各影响因素的影响函数的步骤中,采用的选取原则为:
从预设的备选函数库中选取函数组成不同的估值函数和各影响函数的函数组合后,代入解析得到的价格以及多个影响因素进行计算,最后选择总体拟合度最好的函数组合。
另外,需要注意,本实施例对每种车型,均选择总体拟合度最好的估值函数和多个影响函数,并计算时间影响函数,从而构建的估值模型中,每种车型均具有根据最好拟合原则挑选获得的估值函数以及对应的影响函数,从而每种车型均可以得到最为准确的估值结果。
本实施例中,所述备选函数库中包括以下函数:多项式函数、指数函数族、分段函数、三角函数、双曲函数和/或示性函数。另外,在本发明公开技术方案的前提下,选择线性函数作为估值函数,也是落在本发明的保护范围内的。
本实施例中,训练获得估值模型的原理如下:每台车的价格是基于以上提及的各因素综合影响后产生的。也就是说每台车的交易记录里面都蕴含着各因素影响价格的规律。本实施例所述多组历史交易数据中包含有几百万台车的相应记录。每条记录包含了该车的价格和以上各类影响因素的取值情况。因此,可以从大量历史交易数据里面提取各类影响因素如何影响价格的规律,因为这些影响因素是有交互的,所以本发明在解析的时候要充分考虑到影响因素之间的交互性,而不能够对影响因素单独一一拆解,因此解析是在多元变量上同时进行。通过估值函数和不同影响因素对应的影响函数的选取,也体现了本方法所获得估值模型的各影响因素之间的交互性。例如,本估值模型将每个城市的特殊车型的偏移情况就输出记录到了城市影响参数库,该城市影响参数库描述了某车型在某城市卖得比其他城市显著的好或者不好的情况,并通过参数给出具体在价格上差异是多少,这就是车型和城市的交互影响,该交互影响被记录在城市影响参数库种。类似的其他各库其实都包括了交互影响,例如车型库里面包含了车型和城市的交互影响等等。
影响因素之间的交互影响:很多影响因素对于价格的影响不是1加1等于2这样线性可加的关系。车型类型,地域和颜色之间有交互影响的例子如下:银灰色在广州中级豪华轿车如宝马5系上是正常的颜色而在黑龙江同级别车型上却是减分的颜色,另外,在广州中级SUV的车型上也是减分颜色。因此光知道车源是银灰色不能判断其对价格的影响,还必须结合地域和车型才能判断它的影响是多少。影响因素之间的交互影响把握的程度,对估值模型的估值准确度和稳定性有很强的影响。本实施例中所选取的各影响因素可以在保证估值模型稳定性的前提下,获得最高的估值准确度。
进一步作为优选的实施方式,还包括如下的估值模型更新步骤:
S21、定期获取最近一段时间内的二手车的历史交易数据;
S22、结合预设的车型数据库,解析获得每个历史交易数据对应的车型和配置情况;
S23、将解析后的历史交易数据存储到历史数据库中;
S24、当判断历史数据库的新增记录累计达到预设阈值时,进行估值模型更新。
进一步作为优选的实施方式,所述步骤S24中所述进行估值模型更新的步骤,具体包括:
S241、对每个新增记录的历史交易数据进行交叉数据清洗处理,剔除不具备代表性的历史交易数据;本步骤中,交叉数据清洗处理的过程与步骤S02中所提到的一致,这里不再赘述;
S242、对剔除后剩下的所有历史交易数据进行解析后,基于解析结果,根据估值模型的估值函数,更新估值模型的车型标准折旧库、配置价值折旧库、城市影响参数库、交易类型影响参数库和个体因子影响参数库;
S243、利用广义时间序列方法外推获得当前和未来几周的价格趋势预测结果后,更新估值模型的时间影响参数库。
进一步作为优选的实施方式,所述历史交易数据包括城市、车型、型号、年款、里程、上牌年月、颜色,还包括交易类型、过户次数、车况和/或保养情况。
实施例二
本实施例是实施例一的详细实例,具体包括:
步骤1,获取用户输入的待估值二手车的车型信息如下:
型号:北京奔驰奔驰C级2013款C 260 CGI时尚型;
地点:广州;
里程:4.7万公里;
上牌时间:2014年4月;
使用情况:非营运;
颜色:白色;
车况:优秀;
交易类型:二手车商零售;
过户次数:2;
估值时间:2017年3月;
步骤2,结合预设的车型数据库,调取获得该二手车的重要的车辆配置信息:
排量:1.8;
马力:156;
发动机类型:涡轮增压;
变速箱类型:自动;
驱动方式:前驱;
排量:国四;
MSRP:38.8万。MSRP表示厂商建议零售价。
步骤3,将车型信息和车辆配置信息转换为数值变量。
例如将上牌时间转换为车龄,得到35个月的数值变量,将“2013款”转换为车款年龄“4年”的数值变量,将车辆“是否最新一代”转换为“0”或“1”的标志码,其中,0用于标识该车不是最新一代,1用于标识该车为最新一代。
步骤4、计算各影响因素对二手车价格的影响:
a、计算起点::MSRP 38.8万;
b、查询估值函数:通过估值模型的函数数据库查找对应的估值函数,索引关键字为:奔驰C+广州,得到估值函数为:
(MSRP+上牌时间影响*配置影响+年款影响+里程影响+交易类型影响+其他个体影响)*颜色影响*城市影响*交易时间影响
需要注意,本发明的估值函数不仅仅只有上述加和乘的组合,也可以有其他组合方式,例如指数形式、对数形式等,本实施例不一一列举。
c、根据上牌时间计算获得上牌时间影响价格为:-9.6万,具体为:
1)、查车型标准折旧库,索引关键字为:奔驰C,2013款,广州,35个月,得到年&月车龄影响系数,以及影响函数G(.),这里车龄影响系数则为影响函数的函数参数。
2)进行上牌时间对于二手车价格的影响计算:
G(35个月*月车龄影响系数,3年*年车龄影响系数)=-9.6万
d、根据“2013款”计算获得影响价格为:-0.78万,过程与上述步骤c相似,同样是在车型标准折旧库中进行匹配,索引关键字为:奔驰C,广州,13款。
e、同样在车型标准折旧库中进行匹配,索引关键字为:奔驰C,广州,13款,匹配获得该车型为非最新一代,折价-1.9万。
f、根据车辆颜色,在个体因子影响参数库中采用索引关键字“奔驰C,广州,白色”匹配获得影响值为“99%”。
g、根据车辆配置,在配置价值折旧库中查找“奔驰C,广州”,得到影响值为“115%”。
h、根据里程,在个体因子影响参数库采用索引关键字“奔驰C,广州,4.7万公里”匹配获得折价为-1.3万。
i、根据城市,在城市影响参数库中,查找“奔驰C,广州”,得到影响值为“97%”。
j、根据时间,在时间影响参数库中,查找“奔驰C,广州,2017年3月”,得到影响值为“96%”。
k、根据交易类型,在交易类型影响参数库中,查找“奔驰C,广州,车商零售”,得到折价为+1.2万。
l、对其它个体因素,在个体因子影响参数库中查找得到对应的折价为0.7万。
m、将上述影响因素的影响结果一起计算获得该二手车的估值为:
(38.8-9.6*115%-0.78-1.9-1.3+1.2+0.7)*99%*97%*96%=23.67万
经过大量数据验证,可以获得采用本方法进行二手车估值,估值失误的概率明显降低,且估值平均误差在5%左右,对应交易量大的车型以及城市,误差可降低到3%以内,因此,本方法可以准确地根据二手车的车型信息估算获得二手车的价格。
实施例三
参照图3,一种利用大数据进行二手车估值的系统,包括存储介质100和处理器200,所述存储介质100存储有至少一个指令,所述处理器200用于加载所述至少一个指令,从而执行以下步骤:
S11、获取用户输入的待估值二手车的车型信息;
S12、从估值模型的函数数据库中获取对应的估值函数,并从估值模型的参数数据库中获得对应的所有函数参数后,将车型信息代入到估值函数中,计算获得待估值二手车的市场估值价格;
其中,所述车型信息包括型号、上牌时间、里程、车况、交易地点和/或颜色;
所述估值模型是基于大数据训练获得的多元非线性计算模型,由函数数据库和参数数据库组成。
本实施例的利用大数据进行二手车估值的系统,可执行本发明实施例一所提供的利用大数据进行二手车估值的系统方法,可执行实施例一的任意组合实施步骤,具备该方法相应的功能和有益效果。
实施例四
一种利用大数据进行二手车估值的系统,包括车型数据库、输入模块、计算模块和用于为计算模块提供估值模型的模型存储模块,所述车型数据库与计算模块连接;
所述输入模块,用于获取用户输入的待估值二手车的车型信息;
所述计算模块,用于从估值模型的函数数据库中获取对应的估值函数,并从估值模型的参数数据库中获得对应的所有函数参数后,将车型信息代入到估值函数中,计算获得待估值二手车的市场估值价格;
其中,所述车型信息包括型号、上牌时间、里程、车况、交易地点和/或颜色;
所述估值模型是基于大数据训练获得的多元非线性计算模型,由函数数据库和参数数据库组成。
本实施例的利用大数据进行二手车估值的系统,可执行本发明实施例一所提供的利用大数据进行二手车估值的系统方法,可执行实施例一的任意组合实施步骤,具备该方法相应的功能和有益效果。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。

Claims (9)

1.一种利用大数据进行二手车估值的方法,其特征在于,包括以下步骤:
S11、获取用户输入的待估值二手车的车型信息;
S12、从估值模型的函数数据库中获取对应的估值函数,并从估值模型的参数数据库中获得对应的所有函数参数后,将车型信息代入到估值函数中,计算获得待估值二手车的市场估值价格;
其中,所述车型信息包括型号、上牌时间、里程、车况、交易地点和/或颜色;
所述估值模型是基于大数据训练获得的多元非线性计算模型,由函数数据库和参数数据库组成。
2.根据权利要求1所述的一种利用大数据进行二手车估值的方法,其特征在于,
所述估值模型是通过以下步骤训练获得的:
S01、获取最近一段时间内二手车的多组历史交易数据;
S02、结合预设的车型数据库,将每组历史交易数据解析为价格以及多个与二手车相关的影响因素;
S03、根据解析结果,针对每种车型,从预设的备选函数库中选取合适的估值函数以及各影响因素的影响函数,并计算获得估值函数和各影响函数相应的函数参数;
S04、将历史交易数据中价格扣除上述影响因素带来的影响后,利用广义时间序列方法外推获得当前和未来几周的价格趋势预测结果,进而建立对应的时间影响函数,并获得对应的函数参数;
S05、将获得的每种车型的估值函数、各影响函数以及时间影响函数组成函数数据库,并将所有函数参数组成参数数据库后,得到由函数数据库和参数数据库构成的估值模型;
其中,所述影响因素包括车型标准折旧因素、配置价值折旧因素、城市影响因素、交易类型影响因素和个体因子影响因素,所述估值函数为各影响函数的线性或非线性函数,所述各影响函数为对应影响因素的线性或非线性函数,且估值函数和各影响函数中包含至少一个非线性函数。
3.根据权利要求2所述的一种利用大数据进行二手车估值的方法,其特征在于,所述参数数据库包括车型标准折旧库、配置价值折旧库、城市影响参数库、交易类型影响参数库、个体因子影响参数库和时间影响参数库。
4.根据权利要求2所述的一种利用大数据进行二手车估值的方法,其特征在于,所述步骤S03中,所述从预设的备选函数库中选取合适的估值函数以及各影响因素的影响函数的步骤中,采用的选取原则为:
从预设的备选函数库中选取函数组成不同的估值函数和各影响函数的函数组合后,代入解析得到的价格以及多个影响因素进行计算,最后选择总体拟合度最好的函数组合。
5.根据权利要求3所述的一种利用大数据进行二手车估值的方法,其特征在于,还包括如下的估值模型更新步骤:
S21、定期获取最近一段时间内的二手车的历史交易数据;
S22、结合预设的车型数据库,解析获得每个历史交易数据对应的车型和配置情况;
S23、将解析后的历史交易数据存储到历史数据库中;
S24、当判断历史数据库的新增记录累计达到预设阈值时,进行估值模型更新。
6.根据权利要求5所述的一种利用大数据进行二手车估值的方法,其特征在于,所述步骤S24中所述进行估值模型更新的步骤,具体包括:
S241、对每个新增记录的历史交易数据进行交叉数据清洗处理,剔除不具备代表性的历史交易数据;
S242、对剔除后剩下的所有历史交易数据进行解析后,基于解析结果,根据估值模型的估值函数,更新估值模型的车型标准折旧库、配置价值折旧库、城市影响参数库、交易类型影响参数库和个体因子影响参数库;
S243、利用广义时间序列方法外推获得当前和未来几周的价格趋势预测结果后,更新估值模型的时间影响参数库。
7.根据权利要求1所述的一种利用大数据进行二手车估值的方法,其特征在于,
所述历史交易数据包括城市、车型、型号、年款、里程、上牌年月、颜色,还包括交易类型、过户次数、车况和/或保养情况。
8.一种利用大数据进行二手车估值的系统,其特征在于,包括存储介质和处理器,所述存储介质存储有至少一个指令,所述处理器用于加载所述至少一个指令,从而执行以下步骤:
S11、获取用户输入的待估值二手车的车型信息;
S12、从估值模型的函数数据库中获取对应的估值函数,并从估值模型的参数数据库中获得对应的所有函数参数后,将车型信息代入到估值函数中,计算获得待估值二手车的市场估值价格;
其中,所述车型信息包括型号、上牌时间、里程、车况、交易地点和/或颜色;
所述估值模型是基于大数据训练获得的多元非线性计算模型,由函数数据库和参数数据库组成。
9.一种利用大数据进行二手车估值的系统,其特征在于,包括车型数据库、输入模块、计算模块和用于为计算模块提供估值模型的模型存储模块,所述车型数据库与计算模块连接;
所述输入模块,用于获取用户输入的待估值二手车的车型信息;
所述计算模块,用于从估值模型的函数数据库中获取对应的估值函数,并从估值模型的参数数据库中获得对应的所有函数参数后,将车型信息代入到估值函数中,计算获得待估值二手车的市场估值价格;
其中,所述车型信息包括型号、上牌时间、里程、车况、交易地点和/或颜色;
所述估值模型是基于大数据训练获得的多元非线性计算模型,由函数数据库和参数数据库组成。
CN201711479971.9A 2017-12-29 2017-12-29 一种利用大数据进行二手车估值的方法及系统 Pending CN108280674A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711479971.9A CN108280674A (zh) 2017-12-29 2017-12-29 一种利用大数据进行二手车估值的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711479971.9A CN108280674A (zh) 2017-12-29 2017-12-29 一种利用大数据进行二手车估值的方法及系统

Publications (1)

Publication Number Publication Date
CN108280674A true CN108280674A (zh) 2018-07-13

Family

ID=62802714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711479971.9A Pending CN108280674A (zh) 2017-12-29 2017-12-29 一种利用大数据进行二手车估值的方法及系统

Country Status (1)

Country Link
CN (1) CN108280674A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087144A (zh) * 2018-08-10 2018-12-25 广州朗讯猛虎汽车检测有限公司 一种二手车检测与估值系统
CN110544135A (zh) * 2019-09-10 2019-12-06 金瓜子科技发展(北京)有限公司 一种数据处理方法和装置
CN110555024A (zh) * 2019-08-13 2019-12-10 广东数鼎科技有限公司 一种基于人工智能算法的精准汽车型号匹配系统
CN110634021A (zh) * 2019-09-06 2019-12-31 深圳壹账通智能科技有限公司 基于大数据的车辆估值方法、系统、设备及可读存储介质
CN112101407A (zh) * 2020-08-04 2020-12-18 优车库网络科技发展(深圳)有限公司 二手车交易方法、装置、计算机设备及存储介质
CN113421106A (zh) * 2020-11-30 2021-09-21 阿里巴巴集团控股有限公司 商品数据的处理方法、装置及电子设备
CN113450161A (zh) * 2021-07-16 2021-09-28 上海先赞科技有限公司 按维修状态调整的飞机和发动机基准价值测算方法
CN114971738A (zh) * 2022-06-13 2022-08-30 安徽风之星二手车市场管理有限公司 一种基于二手车的估值系统
CN116883029A (zh) * 2023-07-13 2023-10-13 上海信宝博通电子商务有限公司 一种对象估值方法、装置、设备及介质
CN117372101A (zh) * 2023-09-28 2024-01-09 苏州优与汽车科技有限公司 基于多维度影响因子的二手车自动化评价方法及定价方法
CN117670382A (zh) * 2023-12-05 2024-03-08 广州穗圣信息科技有限公司 一种利用大数据进行二手车估值的方法及系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087144A (zh) * 2018-08-10 2018-12-25 广州朗讯猛虎汽车检测有限公司 一种二手车检测与估值系统
CN110555024B (zh) * 2019-08-13 2022-03-29 广东数鼎科技有限公司 一种基于人工智能算法的精准汽车型号匹配系统
CN110555024A (zh) * 2019-08-13 2019-12-10 广东数鼎科技有限公司 一种基于人工智能算法的精准汽车型号匹配系统
CN110634021A (zh) * 2019-09-06 2019-12-31 深圳壹账通智能科技有限公司 基于大数据的车辆估值方法、系统、设备及可读存储介质
WO2021042896A1 (zh) * 2019-09-06 2021-03-11 深圳壹账通智能科技有限公司 基于大数据的车辆估值方法、系统、设备及可读存储介质
CN110544135A (zh) * 2019-09-10 2019-12-06 金瓜子科技发展(北京)有限公司 一种数据处理方法和装置
CN112101407A (zh) * 2020-08-04 2020-12-18 优车库网络科技发展(深圳)有限公司 二手车交易方法、装置、计算机设备及存储介质
CN113421106A (zh) * 2020-11-30 2021-09-21 阿里巴巴集团控股有限公司 商品数据的处理方法、装置及电子设备
CN113450161A (zh) * 2021-07-16 2021-09-28 上海先赞科技有限公司 按维修状态调整的飞机和发动机基准价值测算方法
CN113450161B (zh) * 2021-07-16 2023-10-03 上海先赞科技有限公司 按维修状态调整的飞机和发动机基准价值测算方法
CN114971738A (zh) * 2022-06-13 2022-08-30 安徽风之星二手车市场管理有限公司 一种基于二手车的估值系统
CN116883029A (zh) * 2023-07-13 2023-10-13 上海信宝博通电子商务有限公司 一种对象估值方法、装置、设备及介质
CN117372101A (zh) * 2023-09-28 2024-01-09 苏州优与汽车科技有限公司 基于多维度影响因子的二手车自动化评价方法及定价方法
CN117670382A (zh) * 2023-12-05 2024-03-08 广州穗圣信息科技有限公司 一种利用大数据进行二手车估值的方法及系统

Similar Documents

Publication Publication Date Title
CN108280674A (zh) 一种利用大数据进行二手车估值的方法及系统
CN108256052B (zh) 基于tri-training的汽车行业潜在客户识别方法
CN108154275A (zh) 基于大数据的汽车残值预测模型及预测方法
CN107590688A (zh) 目标客户的识别方法及终端设备
CN109615454A (zh) 确定用户金融违约风险的方法及装置
CN109299807A (zh) 一种二手车定价优化方法及系统
CN105931068A (zh) 一种持卡人消费画像的生成方法及装置
CN106875206A (zh) 信息获取、评估、问卷调查方法、装置及服务器
CN110766428A (zh) 一种数据价值评估系统以及方法
CN109636482B (zh) 基于相似度模型的数据处理方法及系统
CN107767179A (zh) 电子券的质量评价方法及装置
CN108710905A (zh) 一种基于多模型联合的备件数量预测方法和系统
CN110751524A (zh) 一种基于强化学习的优惠券智能派送方法
CN110348902A (zh) 一种烟草零售终端销售信息的获取设备及方法
CN112711711A (zh) 基于知识库的客户营销线索推荐方法及装置
CN113159837A (zh) 车辆价格的评估方法及装置
CN113570398A (zh) 推广数据处理方法、模型训练方法、系统和存储介质
CN111861679A (zh) 一种基于人工智能的商品推荐方法
CN115147144A (zh) 数据处理方法及电子设备
CN111753386B (zh) 一种数据处理方法及装置
CN117036046A (zh) 一种债券收益率数据的处理方法及系统
CN111507779A (zh) 一种对商品进行等级划分的方法和装置
CN115689245A (zh) 一种用于确定不同场景下骑手的背单量的方法及装置
CN115393098A (zh) 理财产品信息推荐方法及装置
CN112926997A (zh) 一种客户关系管理系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180713