一种基于大数据的人车多因子评估方法及系统
技术领域
本发明涉及汽车行业数据分析领域,具体而言,涉及一种基于大数据的人车多因子评估方法及系统。
背景技术
车联网已成为物联网领域一个巨大金矿,然而,车联网经过多年的发展,成功的车联网应用十分有限,二手车市场仍处于传统的交易模式,无法形成大规模成熟的商业化应用。想要实现车联网及其应用的真正价值,开展基于电信网和互联网的汽车数据业务,就必须建立在一个车联网良性的网络生态系统上,车辆及其衍生数据的深层挖掘和精准分析是提供创新车联网产品和所有汽车服务的核心基础。“汽车大数据”并不仅限于海量结构化数据,它还包括博客、点击流数据、机器和传感数据和社交媒体等非结构数据。汽车大数据分析面临的最大挑战就是严重缺乏技术熟练的汽车及衍生行业的交叉学科专业人才,且新一代分析工具与传统BI和数据仓库所需要的熟练技能不尽相同。
在现有的汽车行业及其衍生领域,存在以下亟待解决的问题和需求:1)二手车交易不透明问题。目前的二手车交易仅根据市场价格和不完善的车况检测评估,无法解决里程表篡改、报废车翻新卖出、二手车商垄断操控二手车市场价格、二手车质保无有效依据、非4S店的数据无法获取、二手车安全隐患巨大等突出问题。2)车险业务范围窄,评价体系待完善。目前车险主要业务范围是针对新车,新兴的针对二手车的延保服务产品仅以车辆使用年限、有无大事故等简单的二手车数据进行评估,评估风险相当大。目前某些保险公司尝试的UBI(基于用户使用习惯的车辆保险)业务处于早期阶段,评价体系待完善空间巨大。3)汽车金融业务类别单一,无有效评估体系。目前的汽车金融业务基本为单一的买车分期贷款业务,仅根据车主的征信记录等简单信息进行评估,且无法有效提供汽车信贷、汽车担保等新兴业务模式。
要解决上述问题,一方面需要更加完善的数据支撑(如车辆历史数据、车主及其所处环境的衍生数据等),另一方面需要专门针对汽车及其衍生行业的大数据分析方法。目前已有的汽车大数据分析方法有以下问题和不足之处:1)没有对图片、视频、音频等非结构化汽车数据的专业分析方法;2)对汽车衍生数据(如车主背景信息、所处环境)的处理分析方法未考虑或考虑不完善,考虑不完善表现在,无法有效地针对某一特定分析目标分析人、车、环境之间的关联,大量碎片化的信息未有效形成贡献或无法区分有效信息造成大量的冗余问题。3)目前的汽车大数据分析日标未精准面向车辆生产厂商、经销商(包括二手车经销商)、保险公司、维修保养店、消费者五类群体的差异化定制化需求,无法产生高附加值的数据分析产品和数据分析价值。
为了改变目前的汽车数据服务和分析方法滞后的状况,满足二手车交易、汽车保险、汽车金融、汽车维修保养、汽车设计及汽车相关领域对汽车数据分析的精细化需求和汽车相关业务的创新性需求,本发明提供了一种基于大数据的人车多因子评估方法及系统,建立人车综合评分子系统、车辆质保评估子系统、车辆精估子系统和车主信用分析子系统,以至少解决上述问题。
发明内容
本发明公开了一种基于大数据的人车多因子评估方法及系统,对获取的人和车辆及所处环境的海量数据进行解析和特定的逻辑规则分析,产生标准变量、加工变量、多次加工变量、元变量集,通过多角度模型学习方法建立子模型,基于多个子模型进行逻辑加权运算,分别建立人车综合评分子系统、车辆质保评估子系统、车辆精估子系统和车主信用分析子系统。
根据本发明的一个方面,提供了一种基于大数据的人车多因子评估方法,如图1所示,其特征在于,包括:
1)获取人车原始数据,所述人车原始数据的类型包括用户数据、环境数据、车辆数据。所述用户数据包括但不限于买方特征数据、卖方特征数据、买方行为数据、卖方行为数据;所述环境数据包括但不限于环境历史数据、监管政策数据;所述车辆数据包括但不限于车辆维修保养数据、车辆保险数据、车辆品牌数据。
2)分析所述人车原始数据的含义,解析所述人车原始数据为标准变量,所述标准变量具有特定的数据格式,如变量名称缩写+变量值数字或编号代码等,便于数据的统一化处理。解析所述人车原始数据为标准变量的具体内容包括但不限于IP地址解析、身份证号码解析、车牌号码解析、发动机号码解析、非结构化数据解析。
3)解析标准变量和/或分析多个标准变量之间的关系,根据特定的逻辑规则产生加工变量。所述加工变量包括但不限于多个所述标准变量的一致性对比结果、多个所述标准变量的等级分类结果、车辆是否曾召回、车辆出险程度分级。所述逻辑规则包括但不限于关键信息提取、差值计算、关联信息推导、信息分级。
4)解析已有的所述加工变量,分析标准变量和已有的加工变量之间的关系,根据特定的逻辑规则产生多次加工变量,所述多次加工变量包括但不限于年龄与车龄的差值、召回严重程度、出险关联影响。所述逻辑规则包括但不限于关键信息提取、差值计算、关联信息推导、信息分级。
5)组合所述标准变量、所述加工变量、所述多次加工变量为多个元变量集,每个所述元变量集表示用户、环境、车辆的一个特定方面。所述元变量集包括但不限于车辆召回变量集、车辆保养变量集、卖方驾驶习惯变量集、买卖双方及车辆所属地域对比变量集、车辆出险维修保养所属地域对比变量集、车辆出险维修保养时间对比变量集、卖方个人属性变量集、区域天气历史变量集、买卖双方及车辆所属地域对比变量集、用户用车习惯变量集、用户个人属性变量集、用户消费贷款信息变量集。
6)基于所述标准变量、所述加工变量、所述多次加工变量、所述元变量集建立子模型,进行多角度模型学习。所述子模型包括但不限于新车市场价格预测子模型、车辆磨损程度评分子模型、车况历史评分子模型、车辆网络口碑评分子模型、车辆品牌满意度评分子模型、车辆磨损预测子模型、车辆出险预测子模型、车主画像评分子模型、用户延保意愿预测子模型、车主个人属性信用评估子模型、车主用车信用评估子模型、车主金融信用评估子模型。优选地,对所述子模型进行多角度模型学习的具体方法是,采用聚类分析方法将所述标准变量和/或多个所述元变量集放在特定的数据类型中,采用神经网络方法进行预测分析,基于所述特定的数据类型和所述预测分析结果进行关联分析,建立所述子模型的关联规则库、算法库和专家意见库。
7)基于一个或多个子模型进行逻辑加权运算,分别建立人车综合评分模型、车辆质保模型、车辆精估模型、车主信用模型。优选地,所述人车综合评分模型基于车辆磨损程度评分子模型、车况历史评分子模型、车主画像评分子模型、车辆网络口碑评分子模型、车辆品牌满意度评分子模型输出的五个评分结果进行逻辑加权运算,输出人车综合评分结果,其中,每个所述评分结果的加权系数是每个所述子模型与所述人车综合评分模型的关联程度值的归一化数值,所述关联程度值由专家意见库给出。优选地,所述车主信用模型基于车主个人属性信用评估子模型、车主用车信用评估子模型、车主金融信用评估子模型输出的三个评估结果进行逻辑加权运算,输出车主信用评估结果,包括车主信用综合评估等级、车主个人属性信用等级、车主用车信用等级、车主金融信用等级。优选地,所述车辆质保模型基于车辆磨损预测子模型、车辆出险预测子模型、用户延保意愿预测子模型输出进行逻辑加权运算,输出车辆质保评估分析结果,包括车辆次年磨损等级和维修成本预测结果、车辆次年出险概率和出险等级预测结果、用户延保概率和倾向的延保方式预测结果。优选地,所述车辆精估模型基于新车市场价格预测子模型、车辆磨损程度评分子模型、车况历史评分子模型、车辆网络口碑评分子模型、车辆品牌满意度评分子模型、车辆磨损预测子模型、车辆出险预测子模型输出的七个评分结果进行逻辑加权运算,输出车辆精估结果,包括车辆当前交易估值、车辆交易价值预测曲线。
根据本发明的另一个方面,提供了一种基于大数据的人车多因子评估系统,如图1所示,其特征在于,包括:
1)数据采集模块,用于获取人车原始数据,所述人车原始数据的类型包括用户数据、环境数据、车辆数据。
2)原始数据解析模块,用于分析所述人车原始数据的含义,解析所述人车原始数据为标准变量,所述标准变量具有特定的数据格式。
3)变量加工模块,用于解析标准变量和/或分析多个标准变量之间的关系,根据特定的逻辑规则产生加工变量。
4)多次加工变量模块,用于解析已有的所述加工变量,分析标准变量和已有的加工变量之间的关系,根据特定的逻辑规则产生多次加工变量。
5)元变量集组合模块,用于组合所述标准变量、所述加工变量、所述多次加工变量为多个元变量集,每个所述元变量集表示用户、环境、车辆的一个特定方面。
6)子模型建立模块,用于基于所述标准变量、所述加工变量、所述多次加工变量、所述元变量集建立子模型,进行多角度模型学习,建立所述子模型的关联规则、算法和专家意见。
7)数据库,用于存储数据,包括人车原始数据库、标准变量库、加工变量库、多次加工变量库、子模型库、元变量集库、逻辑规则库、算法库、专家意见库。
8)人车综合评分子系统,用于基于一个或多个子模型进行逻辑运算,建立人车综合评分模型。优选地,所述人车综合评分子系统基于车辆磨损程度评分子模型、车况历史评分子模型、车主画像评分子模型、车辆网络口碑评分子模型、车辆品牌满意度评分子模型输出的五个评分结果进行逻辑加权运算,输出人车综合评分结果,其中,每个所述评分结果的加权系数是每个所述子模型与所述人车综合评分模型的关联程度值的归一化数值,所述关联程度值由专家意见库给出。
9)车辆质保评估子系统,用于基于一个或多个子模型进行逻辑运算,建立车辆质保模型。优选地,所述车辆质保评估子系统基于车辆磨损预测子模型、车辆出险预测子模型、用户延保意愿预测子模型输出进行逻辑加权运算,输出车辆质保评估分析结果,包括车辆次年磨损等级和维修成本预测结果、车辆次年出险概率和出险等级预测结果、用户延保概率和倾向的延保方式预测结果。
10)车辆精估子系统,用于基于一个或多个子模型进行逻辑运算,建立车辆精估模型。优选地,如图2,所述车辆精估子系统基于新车市场价格预测子模型612、车辆磨损程度评分子模型613、车况历史评分子模型614、车辆网络口碑评分子模型615、车辆品牌满意度评分子模型616、车辆出险预测子模型617、车辆磨损预测子模型618输出的七个评分结果进行逻辑加权运算1001,输出车辆精估结果,包括车辆当前交易估值、车辆交易价值预测曲线。
本发明提出的方法及系统可同时为个人、二手车商、保险公司、汽车生产厂商和4S店五类目标人群提供精细化汽车数据业务和咨询服务,精准实现人和车辆及所处环境的碎片化信息处理和定位,从根本上解决二手车交易中买卖双方信息不对称的问题,颠覆二手车缺乏多次交易后质量保障的传统,提高车辆再次交易的价值,同时可在汽车保险、汽车金融、汽车维修保养、汽车设计及汽车相关领域提供创新型业务,市场价值巨大。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明人车多因子评估方法及系统的示意图;
图2是本发明车辆精估子系统的示意图;
图3是本发明实施例1中人车综合评分子系统的示意图;
图4是本发明实施例2中车辆质保评估子系统的示意图;
图5是本发明实施例3中车主信用分析子系统的示意图。
具体实施方式
下文中将参考附图并结合两个实施例来详细说明本发明。需要说明的是,在不冲突的情况下,木申请中的实施例及实施例中的特征可以相互组合。
根据本发明实施例1,提供了一种人车综合评分子系统,如图3所示。在本发明实施例中,数据采集模块01获取海量人车原始数据,通过原始数据解析模块02、变量加工模块03、多次加工变量模块04、元变量集组合模块05产生标准变量、加工变量、多次加工变量和元变量集,子模型建立模块06基于多个所述标准变量、所述加工变量、所述多次加工变量、多个所述元变量集建立5个子模型,进行多角度模型学习,5个子模型分别为车辆磨损程度评分子模型601、车况历史评分子模型602、车主画像评分子模型603、车辆网络口碑评分子模型604、车辆品牌满意度评分子模型605。人车综合评分子系统08基于上述5个评分子模型输出的5个评分结果进行逻辑加权运算,输出人车综合评分结果。
本实例的具体步骤为:
步骤一:数据采集模块01获取海量人车原始数据,人车原始数据的类型包括用户数据、环境数据、车辆数据。获取的海量人车原始数据可以来自汽车本身、汽车相关网站媒体、汽车相关企事业部门(如车辆生产厂家、车辆销售企业、保险公司、汽车维修保养店、汽车租赁公司、车辆管理部门等)以及车辆的个人和企业用户的相关数据等,获取的通信方式包括电信网(有线、无线)、互联网和移动互联网等。获取的海量人车原始数据包括各种结构化数据和图片、视频、声音、表单等非结构化数据。在本实例中,数据采集模块01获取海量人车原始数据包括车辆品牌、车系、车系年款、车牌号、身份证号、IP地址、查询时间、图片、视频、声音、表单等非结构化数据等。上述数据据取方式可以是在网页或手机端(如HTML5前端页面)由客户输入相关信息,或者通过传感器终端/网络(如统计软件)获取相关信息。
步骤二:原始数据解析模块02分析数据采集模块01获取的人车原始数据的含义,在去除重复信息、错误信息和无用信息后,解析每个人车原始数据为标准变量,所述标准变量具有特定的数据格式,如变量名称缩写+变量值数字或编号代码等,便于数据的统一化处理。在本实例中,原始数据解析模块02的主要解析内容如表格所示:
步骤三:变量加工模块03解析标准变量和/或分析多个标准变量之间的关系,根据特定的逻辑规则产生加工变量,逻辑规则包括但不限于关键信息提取、差值计算、关联信息推导、信息分级。在本实例中,变量加工模块03产生的加工变量如表格所示:
步骤四:多次加工变量模块04解析已有的所述加工变量,分析标准变量和已有的加工变量之间的关系,根据特定的逻辑规则产生多次加工变量,逻辑规则包括但不限于关键信息提取、差值计算、关联信息推导、信息分级。在本实例中,多次变量加工模块04产生的加工变量如表格所示:
步骤五:元变量集组合模块05组合所述标准变量、所述加工变量、所述多次加工变量为多个元变量集,每个所述元变量集表示用户、环境、车辆的一个特定方面。在本实例中,元变量集组合模块05产生的元变量集如表格所示:
步骤六:子模型建立模块06基于多个所述标准变量、所述加工变量、所述多次加工变量、多个所述元变量集建立子模型,进行多角度模型学习。在本实例中,子模型建立模块06建立了5个子模型,分别为车辆磨损程度评分子模型601、车况历史评分子模型602、车主画像评分子模型603、车辆网络口碑评分子模型604、车辆品牌满意度评分子模型605。每个子模型基于的标准变量、加工变量、多次加工变量、元变量集以及进行多角度模型学习的方法如表格所示:
步骤七:人车综合评分模型建立模块08基于上述5个评分子模型输出的5个评分结果a1,a2,a3,a4,a5进行逻辑加权运算801,输出人车综合评分结果。其中,加权系数k1,k2,k3,k4,k5是各评分子模型与人车综合评分模型的关联程度的归一化数值,关联程度值由关联规则库和专家意见库给出。
根据本发明实施例2,提供了一种车辆质保评估子系统,如图4所示,在获取车辆和车主以及相关环境的原始数据后,进行原始数据的解析,生成具有特定数据格式的标准变量、加工变量、多次加工变量、元变量集;基于如表格所示的多个标准变量、加工变量、多次加工变量、元变量集进行多角度模型学习,分别建立车辆磨损预测子模型606、车辆出险预测子模型607、用户延保意愿预测子模型608;最后基于上述三个子模型输出的预测结果b1,b2,b3进行逻辑加权运算901(加权系数f1,f2,f3由关联规则库和专家意见库给出),输出车辆质保评估分析结果,包括车辆次年磨损等级和维修成本预测结果、车辆次年出险概率和出险等级预测结果、用户延保概率和倾向的延保方式预测结果。
根据本发明实施例3,提供了一种车主信用分析子系统,如图5所示,包括前置的HTML5业务界面12、包含HTML5业务后台101的数据采集模块01、原始数据解析模块02、变量加工模块03、多次加工变量模块04、元变量集组合模块05、子模型建立模块06、数据库07、车主信用分析子系统11、MIS模块13。车辆和车主以及相关环境的原始数据一部分通过前置的HTML5业务界面12由用户输入获取,另一部分通过查询数据库07获取;原始数据解析模块02、变量加工模块03、多次加工变量模块04、元变量集组合模块05进行原始数据的解析,生成具有特定数据格式的标准变量、加工变量、多次加工变量、元变量集;子模型建立模块06基于输出的多个标准变量、加工变量、多次加工变量、元变量集进行多角度模型学习,建立车主个人属性信用评估子模型609、车主用车信用评估子模型610、车主金融信用评估子模型611,车主信用分析子系统11基于上述3个子模型的评估结果进行逻辑加权运算1101,输出车主信用综合评估等级、车主个人属性信用等级、车主用车信用等级、车主金融信用等级。MIS界面由管理员通过用户名及密码登录,可以图表、文字、分级评述等方式展示车主信用分析结果,并可将相应客户信息和分析结果生成EXCEL表格或者word文档等格式导出。
本实例的具体步骤如下:
步骤一:用户在前置的HTML5业务界面12中输入身份证号码、车牌号码、车辆品牌、车系、年份等信息,点击提交后输入到数据采集模块01,数据采集模块01中的HTML5业务后台101进行用户输入信息的基本检查、删除错误信息,与前置的HTML5业务界面12和数据库07等进行交互。通过查询数据库07获取其它车主信用相关原始数据,数据库07存储的数据包括电话号码归属地数据、身份证归属地数据、车辆品牌分类数据、保险公司分类数据、保单险种分类数据、车险价格数据、车辆召回品牌时间数据、车辆质量投诉排名数据、车辆基本信息数据、车辆网络口碑数据、车辆品牌满意度评分数据、城市分级数据、车辆品牌分级数据、星座分级数据等。
步骤二:原始数据解析模块02、变量加工模块03、多次加工变量模块04、元变量集组合模块05进行原始数据的解析,生成具有特定数据格式的标准变量、加工变量、多次加工变量、元变量集如下:标准变量:车主出生日期、性别、车辆品牌、车系、年款、星座、消费记录、贷款记录、人民银行征
信记录、车辆维修保养信息等;
1)加工变量:车主年龄、车龄、星座等级、车辆品牌等级、出险次数、保养次数、违章次数等;
2)多次加工变量:年龄与车龄的差值、是否按时保养、里程记录是否正常等;
3)元变量集:车主个人属性元变量集、车辆保养信息元变量集、车辆维修信息元变量集、违章信息元变量集、车主消费贷款信息元变量集等。
步骤三:子模型建立模块06基于输出的多个标准变量、加工变量、多次加工变量、元变量集进行多角度模型学习,建立3个子模型,分别为车主个人属性信用评估子模型609、车主用车信用评估子模型610、车主金融信用评估子模型611。每个子模型通过对所对应的标准变量、加工变量、多次加工变量、元变量集进行关联分析,建立多条关联规则,分别产生输出结果如下:
4)车主个人属性信用评估结果c1:从性别、职业、工作地点、住所、星座、年龄与车龄差值、社交习惯等方面评估,产生输出结果为换车频率、再次购车的意向车型及概率、再次购车的意向价格区间、再次购买同一车辆品牌的概率、年行驶里程数区间等;
5)车主用车信用评估结果c2:从驾驶习惯、违章记录、是否按时保养、是否及时维修、车辆出险频次和严重程度等方面评估,产生输出结果为次年违章次数区间、次年保养方式(保养店面类型选择、是否自行购买保养用品以及购买途径等)、次年车辆出险频次和严重程度、次年车辆磨损程度等;
6)车主金融信用评估结果c3:从车主消费习惯、贷款信用、购买金融产品的承担风险能力等方面评估,产生输出结果为车主分期付款购车可接受的首付金额、贷款金额、一次性服务费、利率,购车倾向的回馈方式(返现、车辆装饰、购物返券等)。
步骤四:车主信用分析子系统11基于3个子模型的评估结果c1,c2,c3进行逻辑加权运算1101,根据数据库07里的关联规则库和专家意见库确定每个子模型输出的每个结果的权重g1,g2,g3,输出车主信用综合评估等级、车主个人属性信用等级、车主用车信用等级、车主金融信用等级,等级可分为极好、好、一般、较差四个等级。
步骤五:车主信用分析子系统将车主信用分析结果一方面输出到前置的HTML5业务界面,以图表、文字、分级评述等方式进行分析结果展示;一方面输出到MIS,供MIS同步客户信息,并可将相应客户信息和分析结果生成EXCEL表格或者word文档等格式导出。
本发明提出的方法及系统可同时为个人、二手车商、保险公司、汽车生产厂商和4S店五类目标人群提供精细化汽车数据业务和咨询服务,精准实现人和车辆及所处环境的碎片化信息处理和定位,从根本上解决二手车交易中买卖双方信息不对称的问题,颠覆二手车缺乏多次交易后质量保障的传统,提高车辆再次交易的价值,同时可在汽车保险、汽车金融、汽车维修保养、汽车设计及汽车相关领域提供创新型业务,市场价值巨大。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。