CN116468453A - 车辆信息处理和估计子模型生成方法、装置及存储介质 - Google Patents

车辆信息处理和估计子模型生成方法、装置及存储介质 Download PDF

Info

Publication number
CN116468453A
CN116468453A CN202310289161.6A CN202310289161A CN116468453A CN 116468453 A CN116468453 A CN 116468453A CN 202310289161 A CN202310289161 A CN 202310289161A CN 116468453 A CN116468453 A CN 116468453A
Authority
CN
China
Prior art keywords
target
vehicle
model
sample
valuation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310289161.6A
Other languages
English (en)
Inventor
周康生
黄佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Love Car Technology Co ltd
Original Assignee
Beijing Love Car Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Love Car Technology Co ltd filed Critical Beijing Love Car Technology Co ltd
Priority to CN202310289161.6A priority Critical patent/CN116468453A/zh
Publication of CN116468453A publication Critical patent/CN116468453A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0278Product appraisal
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种车辆信息处理和估计子模型生成方法、装置及存储介质。在本申请实施例中,设置车型特征库和不同车型特征对应的估价子模型,车型特征库中维护有车辆特征信息和车型特征的对应关系,根据车辆特征信息,匹配车型特征库中的目标车型特征,对车况描述信息进行特征转换,得到目标车况特征,将目标车型特征和目标车况特征输入至目标车型特征对应的目标估价子模型进行车辆估价,得到该车辆的估测交易信息。整个过程中,采用车型特征库和估价子模型相结合的方式进行车辆估价,车辆价格信息不再由卖方主观决定,可提高估价信息准确度,提高车辆交易成功率。

Description

车辆信息处理和估计子模型生成方法、装置及存储介质
本案是申请号为202111627069.3、申请日为2021年12月28日,专利名称为
“车辆信息处理方法、装置、设备及存储介质”的专利申请的分案申请。
技术领域
本申请涉及互联网技术领域,尤其涉及一种车辆信息处理方法、装置、设备及存储介质。
背景技术
随着我国的机动车数量不断增长,二手车的人均保有量也随之增加,但是,目前并没有评判二手车资产价值的标准。用户可以通过在线车辆交易平台进行车辆交易,但是会涉及确定车辆价格信息的问题,通常是卖方提供车辆的直接报价,这样的报价比较有主观性,导致信息准确度不高,影响交易成功率。因此,在一些线上展销场景或线下收车场景中,亟需一种快速对二手车进行估价的方法。
发明内容
本申请的多个方面提供一种车辆信息处理方法、装置、设备及存储介质,用以使得车辆价格信息不再由卖方主观决定,可提高估价信息准确度,提高车辆交易成功率。
本申请实施例提供一种车辆信息处理方法,包括:获取目标车辆的车辆数据,车辆数据包括:目标车辆的车辆特征信息和车况描述信息;根据车辆特征信息,匹配车型特征库中与车辆特征信息对应的目标车型特征,并对车况描述信息进行特征转换,得到目标车况特征;根据目标车型特征,从估价服务模型包括的多个估价子模型中选择目标估价子模型,不同估价子模型对应不同的车型特征;将目标车型特征和目标车况特征,输入至目标估价子模型中进行车辆估价,得到目标车辆的估测交易信息。
本申请实施例还提供一种车辆信息处理装置,包括:获取模块、匹配模块、转换模块、选择模块以及估价模块;获取模块,用于获取目标车辆的车辆数据,车辆数据包括:目标车辆的车辆特征信息和车况描述信息;匹配模块,用于根据车辆特征信息,匹配车型特征库中与车辆特征信息对应的目标车型特征;转换模块,用于对车况描述信息进行特征转换,得到目标车况特征;选择模块,用于根据目标车型特征,从估价服务模型包括的多个估价子模型中选择目标估价子模型,不同估价子模型对应不同的车型特征;估价模块,用于将目标车型特征和目标车况特征,输入至目标估价子模型中进行车辆估价,得到目标车辆的估测交易信息。
本申请实施例还提供一种车辆信息处理设备,包括:存储器和处理器;存储器,用于存储计算机程序;处理器,与存储器耦合,用于执行计算机程序,以用于:获取目标车辆的车辆数据,车辆数据包括:目标车辆的车辆特征信息和车况描述信息;根据车辆特征信息,匹配车型特征库中与车辆特征信息对应的目标车型特征,并对车况描述信息进行特征转换,得到目标车况特征;根据目标车型特征,从估价服务模型包括的多个估价子模型中选择目标估价子模型,不同估价子模型对应不同的车型特征;将目标车型特征和目标车况特征,输入至目标估价子模型中进行车辆估价,得到目标车辆的估测交易信息。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,当计算机程序被处理器执行时,致使处理器实现本申请实施例提供的车辆信息处理方法中的步骤。
在本申请实施例中,设置车型特征库和不同车型特征对应的估价子模型,车型特征库中维护有车辆特征信息和车型特征的对应关系,根据车辆特征信息,匹配车型特征库中的目标车型特征,对车况描述信息进行特征转换,得到目标车况特征,将目标车型特征和目标车况特征输入至目标车型特征对应的目标估价子模型进行车辆估价,得到该车辆的估测交易信息。整个过程中,采用车型特征库和估价子模型相结合的方式进行车辆估价,车辆价格信息不再由卖方主观决定,可提高估价信息准确度,提高车辆交易成功率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请示例性实施例提供的一种车辆信息处理方法的流程示意图;
图2为本申请示例性实施例提供的一种车型特征库的结构示意图;
图3本申请示例性实施例提供的一种车辆信息处理系统的结构示意图;
图4本申请示例性实施例提供的一种车辆信息处理装置的结构示意图;
图5本申请示例性实施例提供的一种车辆信息处理设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
针对现有技术中卖方提供车辆的直接报价,报价具有主观性,导致车辆价格信息不准确,影响交易成功率的问题。一种对车辆进行估价的方法包括:针对二手车“一车一况”的特性,即不同二手车具有不同的车况信息,可以采用专用检测设备对每辆车进行详细的车况检测和评估,具体可针对车辆进行上千种检测,得到上千种车况信息,基于该检测到的上千种车况信息对车辆进行估计,得到该车辆的估价信息。另一种对车辆进行估价的方法,包括:定价师采用“现行市价法”和“重置成本法”等估价规则,以及采用询价的方式对车辆进行估价,得到该车辆的估价信息。又一种对车辆进行估价的方法,包括:第三方交易平台获取二手车价格展示数据进行估价,采用机器学习模型对车辆信息进行估价,提供估价的精度。
在本申请实施例中,设置车型特征库和不同车型特征对应的估价子模型,车型特征库中维护有车辆特征信息和车型特征的对应关系,根据车辆特征信息,匹配车型特征库中的目标车型特征,对车况描述信息进行特征转换,得到目标车况特征,将目标车型特征和目标车况特征输入至目标车型特征对应的目标估价子模型进行车辆估价,得到该车辆的估测交易信息。整个过程中,采用车型特征库和估价子模型相结合的方式进行车辆估价,车辆价格信息不再由卖方主观决定,可提高估价信息准确度,提高车辆交易成功率。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本申请示例性实施例提供的一种车辆信息处理方法的流程示意图。
如图1所示,该方法包括:
101、获取目标车辆的车辆数据,车辆数据包括:目标车辆的车辆特征信息和车况描述信息;
102、根据车辆特征信息,匹配车型特征库中与车辆特征信息对应的目标车型特征,并对车况描述信息进行特征转换,得到目标车况特征;
103、根据目标车型特征,从估价服务模型包括的多个估价子模型中选择目标估价子模型,不同估价子模型对应不同的车型特征;
104、将目标车型特征和目标车况特征,输入至目标估价子模型中进行车辆估价,得到目标车辆的估测交易信息。
在本实施例中,车辆特征信息是指一些不会随着时间或车辆驾驶人员的驾驶行为而改变的车辆特征。例如,车辆特征可以包含但不限于:车系、年款或品牌等。车况描述信息是指一些可能随着时间的推移或者车辆驾驶人员的驾驶行为而改变的车辆参数。例如,车况描述信息可以包含但不限于:骨架、内饰、外观或车漆等车辆部件的使用状况信息、车龄、行驶里程或过户次数等。
在本实施例中,并不限定获取目标车辆的车辆数据的实施方式。需要说明的是,本实施例中提供的车辆数据不是目标车辆详细的车辆数据,目标车辆详细的车辆数据是指一种专业检测人员通过上千种车辆检测工具,对目标车辆进行详细的检测,得到的车辆数据。本实施例中的目标车辆的车辆数据是车辆驾驶人员或专业检测人员采用便携式工具、感官以及查表等方式,对目标车辆进行粗粒度检测得到的。下面介绍三种车辆驾驶人员或专业检测人员等对目标车辆进行粗粒度检测的实施方式。
在一可选实施例中,车辆驾驶人员或专业检测人员可以通过便携式工具、感官或查表的方式对目标车辆进行粗粒度的检测,以得到车辆数据。其中,便携式工具可以包含但不限于:漆面检测仪、汽车故障诊断仪或汽车轮胎磨损检测仪等等,基于便携式工具对目标车辆进行检测,可以得到目标车辆的车况描述信息。例如,可以通过漆面检测仪检测目标车辆车漆厚度是否均匀,目标车辆是否有补漆行为等,从而将漆面检测仪检测到的车漆数据,作为车况描述信息的一部分。
在另一可选实施例中,车辆驾驶人员或专业检测人员可以通过感官,对目标车辆进行检测,具体是指通过眼睛看、手部触摸或者鼻子闻等方式,对目标车辆进行粗粒度检测,从而得到目标车辆的车况描述信息。例如,可以通过眼睛查看目标车辆的外观是否存在碰撞痕迹,在目标车辆存在碰撞痕迹的情况下,将车辆碰撞痕迹描述信息作为车况描述信息的一部分。
在又一可选实施例中,车辆驾驶人员或专业检测人员可以获取目标车辆的车标或车型等信息,通过查表的方式,获取车辆的厂商或年款等,并将车辆的厂商、年款、车标或车型等作为车辆特征信息的一部分。另外,还可以获取目标车辆的所有人提供的目标车辆的行驶证,基于该行驶证获取目标车辆的车辆特征信息。
在本实施例中,在获取车况描述信息之后,可以对车况描述信息进行特征转换,得到目标车况特征。其中,特征转换是指将车况描述信息由原始的描述文字转换为数据化信息的车况特征,例如,特征转换包含但不限于:连续变量离散化、类别变量编码、时间型或日期型变量转换、缺失值处理或特征组合等。其中,连续变量离散化是指将车况描述信息中的连续性信息转换为数值型的车况特征的方式,例如,行驶里程是车况描述信息中的连续性特征,可以将行驶里程大于20km的里程描述信息用0表示,将行驶里程小于或等于20km的里程描述信息用1表示。类别变量编码是一种将车况描述信息中的类别型信息编码成数值型车况特征的方式。例如,车况描述信息的车辆颜色可以是红色、白色以及黑色,则可以用100表示黑色,用010表示红色,用001表示白色。时间型或日期型变量转换是一种将车况描述信息中的时间型信息或日期型信息转化为数值型车况特征的方式。例如,车龄是车况描述信息中的连续性特征,可以将车龄大于5的车龄描述信息用0表示,将车龄小于或等于5的车龄描述信息用1表示。缺失值处理时一种对车况描述信息中缺失的信息进行处理的方式。缺失值处理的方式包含但不限于:用0替换该缺失值、用该缺失值对应的平均值替换该缺失值、用该缺失值对应的众数替换该缺失值或者用预测模型预测该缺失值。例如,若车况描述信息中的车辆行驶里程信息缺失,则可以用车辆行驶里程的平均值替换该缺失值。特征组合是一种对车况特征进行组合以得到组合特征的方式,可以生成对估价更有预测能力和泛化能力的特征。例如,对地理位置接近的城市进行聚合,得到车辆所属的地理区域信息,将该地理区域信息作为车况特征的一种特征组合。
在本实施例中,维护有车型特征库,车型特征库中维护有车型标识(如车型ID)与车型特征的对应关系。其中,如图2所示,对车型特征库中车型特征的种类进行了分层梳理和构建,展示了一种车型特征库的结构示意图。其中,车型特征库中的车型特征包含但不限于:车辆的国别信息、主品牌、驱动能源信息、车辆结构、排量、厂商、工厂性质(进口、合资或自主)、图片、口碑、新车价格、市场价以及历史均价格等信息。车系级别包括但不限于:小型、紧凑型、中型或大型等。车型可以包含但不限于:高级车型、豪华车型或三厢车型等。车型标识包括:车系、年款或品牌等,其中,车型特征库中的车型特征和车型标识需要定期更新,更新的周期并不限定,对于一些国别、品牌或车辆年款等信息定期更新的周期可以是半个月、一个月或者半年等,对于一些统计型的车型特征,例如,车辆的历史成交信息、市场价或历史均价等,可以每天或每周进行更新。
在本实施例中,车型特征库中维护有车型标识与车型特征之间的对应关系,可以根据车辆特征信息,反查车型标识信息,即匹配车型特征库中的车型标识,若车辆特征信息匹配中车型特征库中的车型标识,则获取该车型标识对应的车型特征,将该车型标识对应的车型特征作为目标车型特征。例如,目标车辆的车辆特征信息为品牌、车系和年款,根据品牌、车系和年款可匹配车型标识,从而基于该车型标识与车型特征的对应关系,确定车辆特征信息对应的目标车型特征,该目标车型特征包括:国别、主品牌、驱动能源、车辆结构、排量、工厂性质、厂商、图片、口碑、油耗、新车价、市场价以及历史均价格等信息中的一项或几项。
在本实施例中,车型特征库中维护有丰富、全面以及详细的车型特征,根据目标车辆的车型特征信息,匹配车型特征库中与车辆特征信息对应的目标车型特征,基于目标车型特征对目标车辆进行车辆估价,无需获取目标车辆的详细信息,一方面可以节省采集车辆特征信息的人力成本,提高车辆特征信息的获取效率,另一方面可以提高车辆估价的准确率。
在本实施例中,可采用估价服务模型对目标车辆进行车辆估价,估价服务模型包括多个估价子模型,不同估价子模型对应不同的车型特征。在获取到目标车型特征之后,可根据目标车型特征,从估价服务模型包括的多个估价子模型中选择目标估价子模型,将目标车型特征和目标车况特征,输入至目标估价子模型中进行车辆估价,得到目标车辆的估测交易信息。
在本申请实施例中,设置车型特征库和不同车型特征对应的估价子模型,车型特征库中维护有车辆特征信息和车型特征的对应关系,根据车辆特征信息,匹配车型特征库中的目标车型特征,对车况描述信息进行特征转换,得到目标车况特征,将目标车型特征和目标车况特征输入至目标车型特征对应的目标估价子模型进行车辆估价,得到该车辆的估测交易信息。整个过程中,采用车型特征库和估价子模型相结合的方式进行车辆估价,车辆价格信息不再由卖方主观决定,可提高估价信息准确度,提高车辆交易成功率。
在一可选实施例中,不同车型特征对应的车辆交易情况差异较大,不同车型特征对应的样本数据也存在较大的差异,为了提高车辆估价的准确率,实现车辆的精准估价,可预先根据车型特征对样本数据进行分组,基于分组后的样本数据训练估价子模型,以提高车辆估价的准确率,实现车辆的精准估价。具体地,可以获取样本数据,样本数据包括样本车辆的车辆数据和实际交易信息,实际交易信息包括交易价格、交易时间以及交易地点等信息;根据获取到的车辆数据,对样本数据进行分组,得到多个初始样本组,每个初始样本组中包括的样本数据所对应的样本车辆具有相同车型特征;根据多个初始样本组中的样本数量,对多个初始样本组进行整合处理,得到可参与模型训练的多个目标样本组;根据多个目标样本组分别训练估价服务模型中的多个估价子模型,其中,每个目标样本组用于训练一个估价子模型。
在本实施例中,并不限定根据多个初始样本组中的样本数量,对多个初始样本组进行整合处理,得到可参与模型训练的多个目标样本组的实施方式,需要说明的是,对样本数据进行分组以及对多个初始样本组进行整合处理不是一成不变的,会定期根据样本数据中车型特征的数量分布情况及时调整,以提高估价的准确率。下面示例性地介绍三种方式,但并不限于此。
示例X1:针对多个初始样本组中存在的样本数量超过设定的第一数量阈值的第一初始样本组,将第一初始样本组作为可参与模型训练的第一目标样本组,第一目标样本组可参与估价服务模型中第一估价子模型的训练;其中,第一数量阈值可以是5千、2万或10万等,具体可视情况而定。
示例X2:若车型特征C对应初始样本组的数量较少,则采用车型特征C对应的样本数据进行模型训练,得到估价子模型,该估价子模型的估价准确率较低,无法满足车辆估价需求。在本实施例中,可根据车型特征C对应的相似样本组进行模型训练,得到车型特征C对应的估价子模型,采用相似样本组的实际交易信息对于车型特征C对应车辆的估价具有一定的参考性,可提高车型特征C对应车辆的估价准确性。其中,相似样本组是指与车型特征C具有至少一种相同的车型参数的初始样本组,其中,车型参数是指车型特征的参数,例如,车型参数可以包含但不限于:车型、年款、品牌或系列。
具体地,在车型特征包括至少两种车型参数的情况下,针对多个初始样本组中存在的样本数量低于设定的第二数量阈值的第二初始样本组,第二数量阈值小于或等于第一数量阈值,第二初始样本组的数量低于第二数量阈值,可认为第二样本组的数量较少,此时,若第二初始样本组对应的相似样本组的样本数量超过设定的第三数量阈值,第三数量阈值大于第二数量阈值,则可以认为第二初始样本组对应的相似样本组的数量较多,将第二初始样本组及其相似样本组作为可参与模型训练的第二目标样本组;其中,相似样本组与第二初始样本组的车辆特征信息具有至少一种相同的车型参数,第二目标样本组可参与估价服务模型中第二估价子模型的训练。
示例X3:针对多个初始样本组中存在样本数量低于设定的第二数量阈值的第二初始样本组,若第二初始样本组对应的相似样本组的样本数量未超过设定的第三数量阈值,则认为第二样本组对应的相似样本组的数量也较少,可以将第二初始样本组及其竞对样本组作为可参与模型训练的第三目标样本组;其中,竞对样本组与第二初始样本组中的样本车辆属于不同品牌;第三目标样本组可参与估价服务模型中第三估价子模型的训练。
在本实施例中,并不限定根据多个目标样本组分别训练估价服务模型中的多个估价子模型的实施方式。在一可选实施例中,针对每个目标样本组直接进行训练,得到该目标样本组对应的估价子模型。在另一可选实施例中,对分组前获取到的样本数据进行特征提取,得到全量特征,全量特征包括:原始特征、组合特征以及数值型特征;基于全量特征进行模型训练,得到基准模型;将该基准模型作为训练估价子模型的初始模型,基于每个目标样本组中样本数据对应的原始特征,分别对基准模型进行精调,得到每个目标样本组对应的估价子模型,从而得到多个目标样本组对应的多个估价子模型。
可选地,对分组前的样本数据进行特征提取,得到全量特征的实施方式,包括:对分组前的样本数据进行特征提取,得到原始特征,原始特征包括:车型特征、车况特征中的至少一种;对原始特征进行特征转换,得到数值型特征;对原始特征进行特征组合,得到组合特征;将数值型特征、组合特征以及原始特征作为全量特征。其中,对原始特征进行组合,可以是对不同车型特征进行组合,也可以是对不同车况特征进行组合,还可以是对车型特征和车况特征进行组合。例如,对车辆特征中的车系和车况特征中的车龄进行特征组合,如品牌A的5系与车龄3年进行特征组合、品牌B的3系与车龄8年进行特征组合等。对原始特征记性特征转换,得到数值型特征的方式,可以包含但不限于:连续变量离散化、类别变量编码以及时间型或日期型变量转换等,可参见前述对车况描述信息进行特征转换的实施方式,在此不再详述。
可选地,基于各个目标样本组中样本数据对应的原始特征,分别对基准模型进行精调,得到各个目标样本组对应的估价子模型的实施方式,包括:针对任一目标样本组,根据任一目标样本组中样本数据的原始特征,对任一目标样本组中的样本数据进行二次分类,得到原始特征中的目标特征对应的样本子分组,目标特征可以是车况特征或车型特征中的一种,例如,目标特征可以是车况特征中的车辆是否运营,也可以是车辆特征中的车辆品牌;根据目标特征对应的样本子分组,分别对基准模型进行精调,得到目标特征分别对应的特征子模型;根据目标特征分别对应的特征子模型,确定任一目标样本组对应的估价子模型。其中,可以直接将目标特征分别对应的特征子模型,作为目标样本组对应的估价子模型,也即目标样本组对应多个估价子模型;或者目标特征具有多个,可以采用多个目标特征依次对基准模型进行精调,从而得到最终的估价子模型;或者还可以是根据每个目标特征对基准模型进行精调,得到多个特征子模型,对多个特征子模型进行模型融合,得到目标样本组对应的估价子模型。
在一可选实施例中,需要对估价服务模型的平均估价准确率进行评估和监控,在平均估价准确率低于设定阈值的情况下,可能是行业内的数据发生了变化,例如,芯片涨价,车辆涨价等,此时需要搜集新的样本数据,对估价服务模型进行更新,形成模型评估与闭环反馈,在不需要人为干预的情况下,估价服务模型可自行迭代和学习,实现了估价服务模型的自适应更新能力,提高了估价服务模型车辆估价的准确率。具体地,可以获取第一车辆的实际交易信息,第一车辆是通过估价服务模型进行车辆估价,且交易成功的车辆;根据第一车辆对应的估测交易信息和实际交易信息,从车型特征维度计算估价服务模型的平均估价准确率,或者根据第一车辆对应的估测交易信息和实际交易信息,从车况特征维度计算估价服务模型的平均估价准确率,或者根据第一车辆对应的估测交易信息和实际交易信息,从车型特征维度和车况特征维度计算估价服务模型的平均估价准确率。例如,可以从车辆的车型、年款或成交价格等维度细粒度确定平均估价准确率。例如,计算车辆估价的平均绝对值误差(Mean Absolute Error,MAE),MAE表示估测交易价格和实际交易价格之间绝对误差的平均值,将MAE作为估价服务模型的平均估价准确率,MAE的计算公式为:
其中,m是第一车辆的数量,X表示车型特征和/或车况特征,xi为车型参数或车况参数,h(xi)为估测交易价格,yi为实际交易价格。
在本实施例中,若该平均估价准确率低于设定准确率阈值,则对估价服务模型进行更新,使得更新后的估价服务模型的平均估价准确率高于设定准确率阈值,从而可以基于该更新后的估价服务模型进行车辆估价。其中,设定准确率阈值可以包含但不限于:80%、95%或98%等。其中,并不限定对估价服务模型进行更新的实施方式。下面进行详细说明。
在一可选实施例中,若该平均估价准确率低于设定准确率阈值,则搜集新增样本,基于新增样本后的样本数据中不同车型特征样本数量,对新增样本后的样本数据进行重新组分,得到重新分组后的目标样本组,基于重新分组后的目标样本组,训练估价服务模型中的估价子模型。其中,对新增样本后的样本数据进行重新组分的方式可参见前述实施例中,根据多个初始样本组中的样本数量,对多个初始样本组进行整合处理,得到可参与模型训练的多个目标样本组的实施方式,在此不再赘述。
在另一可选实施例中,对于平均估价准确率较低的车型特征,可以将该车型特征对应的样本数据纳入单独的分组,并适度采用车辆展销交易信息以及定价师人工标注样本数据的方式,对该车型特征的目标样本组进行样本数据的扩充,以优化估价精度。具体地,针对车型特征维度的平均估价准确率,若平均估价准确率低于设定的准确率阈值,且设定准确率阈值与平均估价准确率的差值超过设定的差值阈值,则根据车型特征对应车辆的展销价格以及人工标注数据,对车型特征所属的目标样本组进行样本数量扩充,得到扩充后的目标样本组;根据扩充后的目标样本组,训练目标车辆所属的车型特征对应的估价子模型。
在本实施例中,图1所示的车辆信息处理方法,可由车辆信息处理系统来实现,如图3所示,该车辆信息处理系统包括线上部分和离线部分,其中,线上部分用于执行图1所示的步骤101-104,线上部分20包括:参数录入模块201、估价接口模块202、车型特征库203以及估价服务模块204;离线部分30主要用于估价服务模型的训练和调优,离线部分30主要包括样本准备模块301、特征抽取模块302、模型训练模块303和模型评估模块304;另外,车辆信息处理系统还包括连接线上部分和线下部分的自适应模块305,该自适应更新模块用于帮助估价模型的自动优化和调整,该自适应模块305由模型反馈单元305a和模型应用单元305b组成。其中,参数录入模块主要用于获取目标车辆的车辆数据,并对车辆数据的合法性进行校验。如下表1为一种车辆数据的示例性展示,但并不限于此。
输入参数 车辆数据
车型 小型、中型或大型
首次上牌时间 年月
所在城市 城市地名
行驶里程 数值(公里)
车身颜色 红色、白色或黑色
过户次数 整数
车况等级 差、一般、良好
使用性质 是否运营
表1
其中,估价接口模块用于对参数录入模块获取的车辆数据进行限流、权限校验、熔断和降级等处理,并将获取的车辆数据提供给估价服务模块。估价服务模块根据车辆数据中的车辆特征信息,匹配车型特征库中与车辆特征信息对应的目标车型特征,并对车辆数据中的车况描述信息进行特征转换,得到目标车况特征;根据目标车型特征,从估价服务模型包括的多个估价子模型中选择目标估价子模型,不同估价子模型对应不同的车型特征;将目标车型特征和目标车况特征,输入至目标估价子模型中进行车辆估价,得到目标车辆的估测交易信息。
其中,对于离线部分,样本准备模块主要用于获取用于训练估价服务模型的样本数据,该样本数据的质量可直接决定估价服务模型的准确性。其中,样本数据主要采用二手车拍卖场景和线下门店交易场景的车辆交易数据作为样本数据,并适当将二手车线上展销场景的展示价格数据引入模型训练过程中。特征抽取模块主要用于采用特征转换、特征组合等手段对车辆特征或车况特征进行特征加工。特征抽取是为了生成对估测交易信息更有预测能力和泛化能力的特征。其中,模型训练模块采用类别增强(Categorical Boosting,CatBoost)算法进行模型训练,CatBoost算法是一种可以高效合理地处理类别型特征的算法。主要思路如下:(a)根据不同车型特征的样本数据量,对样本数据进行了分组,在分组的基础上进行差异性估价。主要采用三种方式进行分组:根据车辆数据,对样本数据进行分组,得到多个初始样本组,每个初始样本组中包括的样本数据所对应的样本车辆具有相同车型特征;1)针对多个初始样本组中存在的样本数量超过设定的第一数量阈值的第一初始样本组,将第一初始样本组作为可参与模型训练的第一目标样本组;2)针对多个初始样本组中存在的样本数量低于设定的第二数量阈值的第二初始样本组,若第二初始样本组对应的相似样本组的样本数量超过设定的第三数量阈值,则将第二初始样本组及其相似样本组作为可参与模型训练的第二目标样本组;3)针对多个初始样本组中存在样本数量低于设定的第二数量阈值的第二初始样本组,若第二初始样本组对应的相似样本组的样本数量未超过设定的第三数量阈值,则将第二初始样本组及其竞对样本组作为可参与模型训练的第三目标样本组。其中,样本数据的分组并不是一成不变的,会定期根据车型特征对应样本数据的数据分布情况及时进行调整。
(b)当完成样本数据的分组之后,采用CatBoost模型的基准模型和精调模型两层模型架构设计,进行估价服务模型的训练。(1)针对样本数据中的全量特征进行模型训练,得到基准模型,并将该基准模型作为下一层模型的初始模型;(2)采用各个目标样本组中样本数据对应的原始特征,分别对基准模型进行精调,并适当的引入展销价格数据扩充样本数据,以增加样本数据的覆盖率,提高估价服务模型的准确率。在针对包括竞对样本组的第三目标样本组进行模型精调时,可采用定价师的人工标注样本对样本数据进行优化。
其中,模型评估模块包括:可以采用“拟合优度(判定系数或决定系数)”等评估指标对估价服务模型进行评估,拟合优度可体现估价服务模型中车辆特征对估测交易信息的影响程度,拟合优度越大,表示车辆特征对估测交易信息的影响程度大,是能够直观判断拟合优劣的指标。除了拟合优度之外,还可以确定估价的平均绝对值误差MAE,模型的估价稳定性以及一定误差范围内的估价准确率,包括误差3%、5%、10%、15%内的准确率。其中,MAE表示估测交易价格和实际交易价格之间绝对误差的平均值。平均绝对值误差从不同的车型特征维度或车况特征维度拆解评估效果,如按城市、车源渠道、价格、车型特征等维度细粒度评测估价准确率的差异。
其中,自适应模块主要通过模型应用单元和模型反馈单元互相协调完成。模型应用单元主要包括两方面的功能,1)通过设定准确率阈值,并和线上部分的估价服务模型进行对比,若线上部分平均估价准确率低于设定准确率阈值,且设定准确率阈值与平均估价准确率的差值超过设定的差值阈值,则自动更新线上模型,否则暂时不更新,具体地,可以针对线上部分和线下部分分别设定估价服务模型,定期计算线下部分的估价服务模型与线上部分估价服务模型估价准确率的差值,若该差值大于设定的差值阈值,则根据线下部分的估价服务模型,更新线上部分的估价服务模型;2)车型特征库或样本数据等定时更新,按照不同特征的变化频率设定更新频率,一般分天粒度和周粒度更新。模型反馈单元主要包括对线上部分的估价准确率和样本数据分布量进行评测和监控,并反作用于模型更新,主要包括三个方面的功能。1)收集车型新增样本,并定期更新到样本数据库中;2)根据车型样本量的分布情况重新进行车型分组,并在分组基础上优化模型;3)将估价误差相对较大的车型特征对应的样本数据纳入单独的分组,并适度采用二手车展销价格数据和定价师人工标注数据进行样本数据的扩充,以优化估价精度。
在本申请实施例中,以车辆拍卖和门店线下交易场景中的真实交易价格为基础,对车型特征库进行统一建设和定期维护更新,按车型特征对样本数据进行分组,并根据分层模型的设计训练估价服务模型,使车辆在没有详细车况描述信息的情况下,仍然能获得相对较高精度的车辆估价,并能根据线上估价的精度和样本数据量的分布情况,及时对估价服务模型进行自适应优化调整,持续迭代车辆估价的效果。
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤101至步骤103的执行主体可以为设备A;又比如,步骤101和102的执行主体可以为设备A,步骤103的执行主体可以为设备B;等等。
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
图4为本申请示例性实施例提供的一种车辆信息处理装置的结构示意图,如图4所示,该车辆信息处理装置包括:获取模块41、匹配模块42、转换模块43、选择模块44以及估价模块45。
获取模块41,用于获取目标车辆的车辆数据,车辆数据包括:目标车辆的车辆特征信息和车况描述信息;
匹配模块42,用于根据车辆特征信息,匹配车型特征库中与车辆特征信息对应的目标车型特征;转换模块43,用于对车况描述信息进行特征转换,得到目标车况特征;
选择模块44,用于根据目标车型特征,从估价服务模型包括的多个估价子模型中选择目标估价子模型,不同估价子模型对应不同的车型特征;
估价模块45,用于将目标车型特征和目标车况特征,输入至目标估价子模型中进行车辆估价,得到目标车辆的估测交易信息。
在一可选实施例中,车辆信息处理装置还包括:分组模块、整合模块以及训练模块;获取模块,还用于获取样本数据,样本数据包括样本车辆的车辆数据和实际交易信息;分组模块,用于根据车辆数据,对样本数据进行分组,得到多个初始样本组,每个初始样本组中包括的样本数据所对应的样本车辆具有相同车型特征;整合模块,用于根据多个初始样本组中的样本数量,对多个初始样本组进行整合处理,得到可参与模型训练的多个目标样本组;训练模块,用于根据多个目标样本组分别训练估价服务模型中的多个估价子模型,其中,每个目标样本组用于训练一个估价子模型。
在一可选实施例中,车型特征包括至少两种车型参数,则整合模块具体用于:针对多个初始样本组中存在的样本数量超过设定的第一数量阈值的第一初始样本组,将第一初始样本组作为可参与模型训练的第一目标样本组,第一目标样本组可参与估价服务模型中第一估价子模型的训练;针对多个初始样本组中存在的样本数量低于设定的第二数量阈值的第二初始样本组,若第二初始样本组对应的相似样本组的样本数量超过设定的第三数量阈值,则将第二初始样本组及其相似样本组作为可参与模型训练的第二目标样本组;相似样本组与第二初始样本组的车辆特征信息具有至少一种相同的车型参数,第二目标样本组可参与估价服务模型中第二估价子模型的训练;针对多个初始样本组中存在样本数量低于设定的第二数量阈值的第二初始样本组,若第二初始样本组对应的相似样本组的样本数量未超过设定的第三数量阈值,则将第二初始样本组及其竞对样本组作为可参与模型训练的第三目标样本组;竞对样本组与第二初始样本组中的样本车辆属于不同品牌;第三目标样本组可参与估价服务模型中第三估价子模型的训练。
在一可选实施例中,训练模块具体用于:对分组前的样本数据进行特征提取,得到全量特征,全量特征包括:原始特征、组合特征以及数值型特征;基于全量特征进行模型训练,得到基准模型;基于各个目标样本组中样本数据对应的原始特征,分别对基准模型进行精调,得到各个目标样本组对应的估价子模型。
在一可选实施例中,训练模块具体用于:对分组前的样本数据进行特征提取,得到原始特征,原始特征包括:车型特征、车况特征中的至少一种;对原始特征进行特征转换,得到数值型特征;对原始特征进行特征组合,得到组合特征;将数值型特征、组合特征以及原始特征作为全量特征。
在一可选实施例中,训练模块具体用于:针对任一目标样本组,根据任一目标样本组中样本数据的原始特征,对任一目标样本组中的样本数据进行二次分类,得到原始特征中的目标特征对应的样本子分组;根据目标特征对应的样本子分组,分别对基准模型进行精调,得到目标特征分别对应的特征子模型;根据目标特征分别对应的特征子模型,确定任一目标样本组对应的估价子模型。
在一可选实施例中,车辆信息处理装置还包括:计算模块、搜集模块以及更新模块;获取模块还用于:获取第一车辆的实际交易信息,第一车辆是通过估价服务模型进行车辆估价,且交易成功的车辆;计算模块,用于根据第一车辆对应的估测交易信息和实际交易信息,从车型特征维度和/或车况特征维度计算估价服务模型的平均估价准确率;若平均估价准确率低于设定准确率阈值,则搜集模块用于搜集新增样本,更新模块,用于根据新增样本后的样本数据对估价服务模型进行更新。
在一可选实施例中,车辆信息处理装置还包括:扩充模块;扩充模块用于针对车型特征维度的平均估价准确率,若平均估价准确率低于设定的准确率阈值,且设定准确率阈值与平均估价准确率的差值超过设定的差值阈值,则根据车型特征对应车辆的展销价格以及人工标注数据,对车型特征所属的目标样本组进行样本数量扩充,得到扩充后的目标样本组;训练模块,还用于根据扩充后的目标样本组,训练目标车辆所属的车型特征对应的估价子模型。
本申请实施例提供的车辆信息处理装置,设置车型特征库和不同车型特征对应的估价子模型,车型特征库中维护有车辆特征信息和车型特征的对应关系,根据车辆特征信息,匹配车型特征库中的目标车型特征,对车况描述信息进行特征转换,得到目标车况特征,将目标车型特征和目标车况特征输入至目标车型特征对应的目标估价子模型进行车辆估价,得到该车辆的估测交易信息。整个过程中,采用车型特征库和估价子模型相结合的方式进行车辆估价,车辆价格信息不再由卖方主观决定,可提高估价信息准确度,提高车辆交易成功率。
图5为本申请示例性实施例提供的一种车辆信息处理设备的结构示意图。如图5所示,该设备包括:存储器54和处理器55。
存储器54,用于存储计算机程序,并可被配置为存储其它各种数据以支持在车辆信息处理设备上的操作。这些数据的示例包括用于在车辆信息处理设备上操作的任何应用程序或方法的指令。
存储器54可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
处理器55,与存储器54耦合,用于执行存储器54中的计算机程序,以用于:获取目标车辆的车辆数据,车辆数据包括:目标车辆的车辆特征信息和车况描述信息;根据车辆特征信息,匹配车型特征库中与车辆特征信息对应的目标车型特征,并对车况描述信息进行特征转换,得到目标车况特征;根据目标车型特征,从估价服务模型包括的多个估价子模型中选择目标估价子模型,不同估价子模型对应不同的车型特征;将目标车型特征和目标车况特征,输入至目标估价子模型中进行车辆估价,得到目标车辆的估测交易信息。
在一可选实施例中,处理器55还用于:获取样本数据,样本数据包括样本车辆的车辆数据和实际交易信息;根据车辆数据,对样本数据进行分组,得到多个初始样本组,每个初始样本组中包括的样本数据所对应的样本车辆具有相同车型特征;根据多个初始样本组中的样本数量,对多个初始样本组进行整合处理,得到可参与模型训练的多个目标样本组;根据多个目标样本组分别训练估价服务模型中的多个估价子模型,其中,每个目标样本组用于训练一个估价子模型。
在一可选实施例中,车型特征包括至少两种车型参数,则处理器55在根据多个初始样本组中的样本数量,对多个初始样本组进行整合处理,得到可参与模型训练的多个目标样本组时,具体用于:针对多个初始样本组中存在的样本数量超过设定的第一数量阈值的第一初始样本组,将第一初始样本组作为可参与模型训练的第一目标样本组,第一目标样本组可参与估价服务模型中第一估价子模型的训练;针对多个初始样本组中存在的样本数量低于设定的第二数量阈值的第二初始样本组,若第二初始样本组对应的相似样本组的样本数量超过设定的第三数量阈值,则将第二初始样本组及其相似样本组作为可参与模型训练的第二目标样本组;相似样本组与第二初始样本组的车辆特征信息具有至少一种相同的车型参数,第二目标样本组可参与估价服务模型中第二估价子模型的训练;针对多个初始样本组中存在样本数量低于设定的第二数量阈值的第二初始样本组,若第二初始样本组对应的相似样本组的样本数量未超过设定的第三数量阈值,则将第二初始样本组及其竞对样本组作为可参与模型训练的第三目标样本组;竞对样本组与第二初始样本组中的样本车辆属于不同品牌;第三目标样本组可参与估价服务模型中第三估价子模型的训练。
在一可选实施例中,处理器55在根据多个目标样本组分别训练估价服务模型中的多个估价子模型时,具体用于:对分组前的样本数据进行特征提取,得到全量特征,全量特征包括:原始特征、组合特征以及数值型特征;基于全量特征进行模型训练,得到基准模型;基于各个目标样本组中样本数据对应的原始特征,分别对基准模型进行精调,得到各个目标样本组对应的估价子模型。
在一可选实施例中,处理器55在对分组前的样本数据进行特征提取,得到全量特征时,具体用于:对分组前的样本数据进行特征提取,得到原始特征,原始特征包括:车型特征、车况特征中的至少一种;对原始特征进行特征转换,得到数值型特征;对原始特征进行特征组合,得到组合特征;将数值型特征、组合特征以及原始特征作为全量特征。
在一可选实施例中,处理器55在基于各个目标样本组中样本数据对应的原始特征,分别对基准模型进行精调,得到各个目标样本组对应的估价子模型时,具体用于:针对任一目标样本组,根据任一目标样本组中样本数据的原始特征,对任一目标样本组中的样本数据进行二次分类,得到原始特征中的目标特征对应的样本子分组;根据目标特征对应的样本子分组,分别对基准模型进行精调,得到目标特征分别对应的特征子模型;根据目标特征分别对应的特征子模型,确定任一目标样本组对应的估价子模型。
在一可选实施例中,处理器55还用于:获取第一车辆的实际交易信息,第一车辆是通过估价服务模型进行车辆估价,且交易成功的车辆;根据第一车辆对应的估测交易信息和实际交易信息,从车型特征维度和/或车况特征维度计算估价服务模型的平均估价准确率;若平均估价准确率低于设定准确率阈值,则搜集新增样本,根据新增样本后的样本数据对估价服务模型进行更新。
在一可选实施例中,处理器55还用于:针对车型特征维度的平均估价准确率,若平均估价准确率低于设定的准确率阈值,且设定准确率阈值与平均估价准确率的差值超过设定的差值阈值,则根据车型特征对应车辆的展销价格以及人工标注数据,对车型特征所属的目标样本组进行样本数量扩充,得到扩充后的目标样本组;根据扩充后的目标样本组,训练目标车辆所属的车型特征对应的估价子模型。
本申请实施例提供的车辆信息处理设备,设置车型特征库和不同车型特征对应的估价子模型,车型特征库中维护有车辆特征信息和车型特征的对应关系,根据车辆特征信息,匹配车型特征库中的目标车型特征,对车况描述信息进行特征转换,得到目标车况特征,将目标车型特征和目标车况特征输入至目标车型特征对应的目标估价子模型进行车辆估价,得到该车辆的估测交易信息。整个过程中,采用车型特征库和估价子模型相结合的方式进行车辆估价,车辆价格信息不再由卖方主观决定,可提高估价信息准确度,提高车辆交易成功率。
进一步,如图5所示,该车辆信息处理设备还包括:通信组件56、显示器57、电源组件58、音频组件59等其它组件。图5中仅示意性给出部分组件,并不意味着车辆信息处理设备只包括图5所示组件。需要说明的是,图5中虚线框内的组件为可选组件,而非必选组件,具体可视车辆信息处理设备的产品形态而定。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,当计算机程序被处理器执行时,致使处理器能够实现图1所示方法中的各步骤。
上述图5中的通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G、3G、4G/LTE、5G等移动通信网络,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
上述图5中的显示器包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
上述图5中的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
上述图5中的音频组件,可被配置为输出和/或输入音频信号。例如,音频组件包括一个麦克风(MIC),当音频组件所在设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器或经由通信组件发送。在一些实施例中,音频组件还包括一个扬声器,用于输出音频信号。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (14)

1.一种车辆信息处理方法,其特征在于,包括:
获取目标车辆的车辆数据,所述车辆数据表征所述目标车辆的目标车型特征和目标车况特征;
根据所述目标车型特征,从估价服务模型包括的多个估价子模型中选择目标估价子模型,不同估价子模型对应不同的车型特征;
将所述目标车型特征和所述目标车况特征,输入至所述目标估价子模型中进行车辆估价,得到所述目标车辆的估测交易信息;
所述目标估价子模型的生成过程,通过如下步骤实现:
根据样本数据中的车辆数据对所述样本数据进行分组,得到所述目标估价子模型对应的目标初始样本组;
根据所述目标初始样本组的样本数量,确定用于训练所述目标估价子模型的目标样本组,所述目标样本组包括所述目标估价子模型对应的目标初始样本组,或者所述目标初始样本组及其相似样本组,或者所述目标初始样本组及其竞对样本组;
基于从分组前的样本数据中提取到的全量特征进行模型训练,得到基准模型;
基于所述目标样本组中的样本数据对应的原始特征,对所述基准模型进行精调,得到所述目标估价子模型。
2.根据权利要求1所述的方法,其特征在于,所述目标车辆的车辆数据包括:所述目标车辆的车辆特征信息和车况描述信息;所述方法还包括:
根据所述车辆特征信息,匹配车型特征库中与所述车辆特征信息对应的目标车型特征;
对所述车况描述信息进行特征转换,得到目标车况特征。
3.根据权利要求1所述的方法,其特征在于,根据样本数据中的车辆数据对所述样本数据进行分组,得到所述目标估价子模型对应的目标初始样本组,包括:
获取样本数据,所述样本数据包括样本车辆的车辆数据和实际交易信息;
根据所述车辆数据,对所述样本数据进行分组,得到多个初始样本组,多个初始样本组中包括:目标估价子模型对应的目标初始样本组,所述目标初始样本组中包括的样本数据所对应的样本车辆具有相同车型特征。
4.根据权利要求3所述的方法,其特征在于,所述车型特征包括至少两种车型参数,则根据所述目标初始样本组的样本数量,确定用于训练所述目标估价子模型的目标样本组,包括:
若所述目标初始样本组的样本数量超过设定的第一数量阈值,则将所述目标初始样本组作为可参与所述目标估价子模型训练的目标样本组;
若所述目标初始样本组的样本数量低于设定的第二数量阈值,且所述目标初始样本组对应的相似样本组的样本数量超过设定的第三数量阈值,则将所述目标初始样本组及其相似样本组作为可参与所述目标估价子模型训练的目标样本组;
若所述目标初始样本组的样本数量低于设定的第二数量阈值,且所述目标初始样本组对应的相似样本组的样本数量未超过设定的第三数量阈值,则将所述目标初始样本组及其竞对样本组作为可参与所述目标估价子模型训练的目标样本组;所述竞对样本组与所述目标初始样本组中的样本车辆属于不同品牌。
5.根据权利要求1所述的方法,其特征在于,对分组前的样本数据进行特征提取,得到全量特征,包括:
对分组前的样本数据进行特征提取,得到原始特征,所述原始特征包括:车型特征、车况特征中的至少一种;
对所述原始特征进行特征转换,得到数值型特征;
对所述原始特征进行特征组合,得到组合特征;
将所述数值型特征、所述组合特征以及所述原始特征作为全量特征。
6.根据权利要求5所述的方法,其特征在于,基于所述目标样本组中的样本数据对应的原始特征,对所述基准模型进行精调,得到所述目标估价子模型,包括:
根据所述目标样本组中样本数据的原始特征,对所述目标样本组中的样本数据进行二次分类,得到所述原始特征中的目标特征对应的样本子分组;
根据所述目标特征对应的样本子分组,分别对所述基准模型进行精调,得到所述目标特征分别对应的特征子模型;
根据所述目标特征分别对应的特征子模型,确定所述目标样本组对应的目标估价子模型。
7.根据权利要求1所述的方法,其特征在于,还包括:
获取第一车辆的实际交易信息,所述第一车辆是通过所述目标估价子模型进行车辆估价,且交易成功的车辆;
根据所述第一车辆对应的估测交易信息和实际交易信息,从车型特征维度和/或车况特征维度计算所述目标估价子模型的平均估价准确率;
若所述平均估价准确率低于设定准确率阈值,则搜集新增样本,根据所述新增样本后的样本数据对所述目标估价子模型进行更新。
8.根据权利要求7所述的方法,其特征在于,还包括:
针对车型特征维度的平均估价准确率,若所述平均估价准确率低于设定的准确率阈值,且所述设定准确率阈值与所述平均估价准确率的差值超过设定的差值阈值,则根据所述车型特征对应车辆的展销价格以及人工标注数据,对所述车型特征所属的目标样本组进行样本数量扩充,得到扩充后的目标样本组;
根据所述扩充后的目标样本组,训练目标车辆所属的车型特征对应的目标估价子模型。
9.一种估计子模型生成方法,其特征在于,包括:
根据样本数据中的车辆数据对所述样本数据进行分组,得到目标初始样本组;
根据所述目标初始样本组的样本数量,确定用于训练目标估价子模型的目标样本组,所述目标样本组包括所述目标估价子模型对应的目标初始样本组,或者所述目标初始样本组及其相似样本组,或者所述目标初始样本组及其竞对样本组;
基于从分组前的样本数据中提取到的全量特征进行模型训练,得到基准模型;
基于所述目标样本组中样本数据对应的原始特征,对所述基准模型进行精调,得到所述目标估价子模型。
10.一种车辆信息处理装置,其特征在于,包括:获取模块,选择模块、输入模块和生成模块;
获取模块,用于获取目标车辆的车辆数据,所述车辆数据表征目标车辆的目标车型特征和目标车况特征;
选择模块,用于根据所述目标车型特征,从估价服务模型包括的多个估价子模型中选择目标估价子模型,不同估价子模型对应不同的车型特征;
输入模块,用于将所述目标车型特征和所述目标车况特征,输入至所述目标估价子模型中进行车辆估价,得到所述目标车辆的估测交易信息;
目标估价子模型的生成过程,通过生成模块实现,生成模块,用于:
根据样本数据中的车辆数据对所述样本数据进行分组,得到所述目标估价子模型对应的目标初始样本组;根据所述目标初始样本组的样本数量,确定用于训练所述目标估价子模型的目标样本组,所述目标样本组包括所述目标估价子模型对应的目标初始样本组,或者所述目标初始样本组及其相似样本组,或者所述目标初始样本组及其竞对样本组;基于从分组前的样本数据中提取到的全量特征进行模型训练,得到基准模型;基于所述目标样本组中的样本数据对应的原始特征,对所述基准模型进行精调,得到所述目标估价子模型。
11.一种估计子模型生成装置,其特征在于,包括:分组模块、确定模块、训练模块和精调模块;
分组模块,用于根据样本数据中的车辆数据对所述样本数据进行分组,得到目标初始样本组;
确定模块,用于根据所述目标初始样本组的样本数量,确定用于训练目标估价子模型的目标样本组,所述目标样本组包括所述目标估价子模型对应的目标初始样本组,或者所述目标初始样本组及其相似样本组,或者所述目标初始样本组及其竞对样本组;
训练模块,用于基于从分组前的样本数据中提取到的全量特征进行模型训练,得到基准模型;
精调模块,用于基于所述目标样本组中样本数据对应的原始特征,对所述基准模型进行精调,得到所述目标估价子模型。
12.一种车辆信息处理设备,其特征在于,包括:存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,与所述存储器耦合,用于执行所述计算机程序,以实现权利要求1-8任一项所述方法中的步骤。
13.一种估计子模型生成设备,其特征在于,包括:存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,与所述存储器耦合,用于执行所述计算机程序,以实现权利要求9所述方法中的步骤。
14.一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被处理器执行时,致使所述处理器实现权利要求1-9任一项所述方法中的步骤。
CN202310289161.6A 2021-12-28 2021-12-28 车辆信息处理和估计子模型生成方法、装置及存储介质 Pending CN116468453A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310289161.6A CN116468453A (zh) 2021-12-28 2021-12-28 车辆信息处理和估计子模型生成方法、装置及存储介质

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202310289161.6A CN116468453A (zh) 2021-12-28 2021-12-28 车辆信息处理和估计子模型生成方法、装置及存储介质
CN202111627069.3A CN114493668B (zh) 2021-12-28 2021-12-28 车辆信息处理方法、装置、设备及存储介质

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202111627069.3A Division CN114493668B (zh) 2021-12-28 2021-12-28 车辆信息处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116468453A true CN116468453A (zh) 2023-07-21

Family

ID=81496107

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310289161.6A Pending CN116468453A (zh) 2021-12-28 2021-12-28 车辆信息处理和估计子模型生成方法、装置及存储介质
CN202111627069.3A Active CN114493668B (zh) 2021-12-28 2021-12-28 车辆信息处理方法、装置、设备及存储介质

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202111627069.3A Active CN114493668B (zh) 2021-12-28 2021-12-28 车辆信息处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (2) CN116468453A (zh)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651160A (zh) * 2016-12-08 2017-05-10 北京五八信息技术有限公司 二手车车辆质量评估方法和装置
CN110019990B (zh) * 2017-07-14 2023-05-23 阿里巴巴集团控股有限公司 样本筛选的方法和装置、业务对象数据搜索的方法和装置
US11531927B2 (en) * 2017-11-28 2022-12-20 Adobe Inc. Categorical data transformation and clustering for machine learning using natural language processing
CN108647272B (zh) * 2018-04-28 2020-12-29 江南大学 一种基于数据分布的小样本扩充对脱丁烷塔底丁烷浓度进行预测的方法
CN111080396A (zh) * 2019-11-15 2020-04-28 杭州拼便宜网络科技有限公司 一种基于竞对商品的商品定价方法、装置及存储介质
CN111242680A (zh) * 2020-01-08 2020-06-05 中联财联网科技有限公司 一种基于机器学习算法的二手车估值方法与系统
US11354689B2 (en) * 2020-03-30 2022-06-07 Capital One Services, Llc Methods and systems for determining auction prices
CN111783016B (zh) * 2020-07-03 2021-05-04 支付宝(杭州)信息技术有限公司 一种网站分类方法、装置及设备
CN112364219A (zh) * 2020-10-26 2021-02-12 北京五八信息技术有限公司 内容发布方法、装置、电子设备及存储介质
CN112559747A (zh) * 2020-12-15 2021-03-26 北京百度网讯科技有限公司 事件分类处理方法、装置、电子设备和存储介质
CN112633926A (zh) * 2020-12-23 2021-04-09 北京车智赢科技有限公司 车辆估价模型的生成方法、车辆的估价方法
CN113298197B (zh) * 2021-07-28 2021-11-02 腾讯科技(深圳)有限公司 数据聚类方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN114493668A (zh) 2022-05-13
CN114493668B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
Tekouabou Intelligent management of bike sharing in smart cities using machine learning and Internet of Things
US10373260B1 (en) Imaging processing system for identifying parts for repairing a vehicle
CA2837338C (en) System and method for analysis and presentation of used vehicle pricing data
US20150213556A1 (en) Systems and Methods of Predicting Vehicle Claim Re-Inspections
CN110704730A (zh) 基于大数据的产品数据推送方法、系统及计算机设备
US20160012494A1 (en) Computer-implemented method of valuing automotive assets
CN105808637A (zh) 个性化推荐方法和装置
CN109636482B (zh) 基于相似度模型的数据处理方法及系统
CN111242680A (zh) 一种基于机器学习算法的二手车估值方法与系统
CN110910180A (zh) 信息推送方法、装置、电子设备和存储介质
Lipyanina et al. Assessing the investment risk of virtual IT company based on machine learning
CN110633919A (zh) 经营实体的评估方法及其装置
Ayvaz et al. A grey system for the forecasting of return product quantity in recycling network
CN114493668B (zh) 车辆信息处理方法、装置、设备及存储介质
CN110728582A (zh) 信息处理的方法、装置、存储介质和处理器
US20210065227A1 (en) Information processing method and information processing apparatus
Kathiravan et al. Predicting the Sale Price of Pre-Owned Vehicles with the Ensemble ML Model
CN114399340A (zh) 一种二手车辆的出售价值计算方法
Wong et al. Information processing constraints in travel behaviour modelling: A generative learning approach
Ifthikar et al. Valuation of Used Vehicles: A Computational Intelligence Approach
Jing et al. Residual Value Prediction
Bodendorf et al. A Business Model Analysis for Vehicle Generated Data as a Marketable Product or Service in the Automotive Industry
CN116703622B (zh) 一种车辆损伤鉴定方法及系统
US20230394234A1 (en) System and method for external vehicle mapping
CN116703250A (zh) 二手车业务监督预测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination