CN107622408B - 购车线索交易转化的预估方法和预估装置 - Google Patents
购车线索交易转化的预估方法和预估装置 Download PDFInfo
- Publication number
- CN107622408B CN107622408B CN201610560339.6A CN201610560339A CN107622408B CN 107622408 B CN107622408 B CN 107622408B CN 201610560339 A CN201610560339 A CN 201610560339A CN 107622408 B CN107622408 B CN 107622408B
- Authority
- CN
- China
- Prior art keywords
- data
- purchasing
- user
- classification
- clue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种购车线索交易转化的预估方法和预估装置,该预估方法包括:对用户购车线索数据和用户购车行为数据进行预处理,以构造可用数据;根据所述可用数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度;根据所述特征分类相关度对所述原始特征数据进行选择,以获取训练特征数据;根据所述训练特征数据构建预估模型;根据所述预估模型对待预估的用户购车线索数据进行交易转化的预估。本发明的技术方案通过预估模型实现对购车线索交易转化的自动化分类;降低对购车线索交易转化分类所花费的人力和时间成本;同时提高购车线索交易转化的效率和准确率。
Description
技术领域
本发明涉及数据挖掘领域,具体而言,本发明涉及一种购车线索交易转化的预估方法和预估装置。
背景技术
近来,我国汽车销量正在缓慢增长,面对我国车市整体增速缓慢的局面,我国的汽车销售行业竞争也愈演愈烈,在如此激烈的市场竞争环境中,如何针对购车线索精确制定营销方案成为关键。
目前,我国汽车行业中的购车线索数量非常庞大,就近年购车线索数量已经突破几千万条;但是,其中大多数购车线索的利用率都很低;为了提高购车线索的利用率,需靠人工跟踪购车线索并确定该购车线索是否实现了交易转化;但对于大量的购车线索数据,人工跟踪购车线索有很大的不确定性,还会耗费大量的人力和时间的成本,且覆盖率不高。
发明内容
为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:
本发明的实施例提出了一种购车线索交易转化的预估方法,包括:
对用户购车线索数据和用户购车行为数据进行预处理,以构造可用数据;
根据可用数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度;
根据特征分类相关度对原始特征数据进行选择,以获取训练特征数据;
根据训练特征数据构建预估模型;
根据预估模型对待预估的用户购车线索数据进行交易转化的预估。
优选地,预估方法还包括:
根据购车交易业务类型,将用户购车线索数据分类为实现交易转化的用户购车线索数据和未实现交易转化的用户购车线索数据;
其中,根据训练特征数据构建预估模型,包括:
基于对用户购车线索数据的转化分类结果,确定获取到的训练特征数据相应的转化类别;
根据训练特征数据,并结合与训练特征数据相应的转化类别,来构建预估模型。
优选地,根据特征分类相关度对原始特征数据进行选择,以获取训练特征数据,包括:
选取特征分类相关度大于预定的相关度阈值的每一特征分类下的原始特征数据作为训练特征数据。
优选地,预估方法还包括:
对获取到的训练特征数据进行去重以及数据平衡化处理。
本发明的另一实施例提出了一种购车线索交易转化的预估装置,包括:
数据预处理模块,用于对用户购车线索数据和用户购车行为数据进行预处理,以构造可用数据;
提取模块,用于根据可用数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度;
选择模块,用于根据特征分类相关度对原始特征数据进行选择,以获取训练特征数据;
构建模块,用于根据训练特征数据构建预估模型;
预估模块,用于根据预估模型对待预估的用户购车线索数据进行交易转化的预估。
优选地,预估装置还包括:
分类模块,用于根据购车交易业务类型,将用户购车线索数据分类为实现交易转化的用户购车线索数据和未实现交易转化的用户购车线索数据;
构建模块,用于基于对用户购车线索数据的转化分类结果,确定获取到的训练特征数据相应的转化类别;
根据训练特征数据,并结合与训练特征数据相应的转化类别,来构建预估模型。
优选地,选择模块包括:
获取单元,用于选取特征分类相关度大于预定的相关度阈值的每一特征分类下的原始特征数据作为训练特征数据。
优选地,选择模块还包括:
数据处理单元,用于对获取到的训练特征数据进行去重以及数据平衡化处理。
本发明的技术方案通过提取构造的可用数据的特征数据,并对该特征数据进行选择,作为构建的预估模型的训练数据;通过预估模型实现对购车线索交易转化的自动化分类;降低对购车线索交易转化分类所花费的人力和时间成本;同时提高购车线索交易转化的效率和准确率。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明中一个实施例的购车线索交易转化的预估方法的流程示意图;
图2为本发明的具体实施例中构造可用数据的示意图;
图3为本发明的具体实施例中特征分类下的原始特征数据在各个转化类别下的分布示意图;
图4为本发明的具体实施例中特征分类相关度的示意图;
图5为本发明的具体实施例中构建预估模型的流程示意图;
图6为本发明中另一实施例的购车线索交易转化的预估装置的结构框架示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
图1为本发明一个实施例的购车线索交易转化的预估方法的流程示意图。
步骤S101:对用户购车线索数据和用户购车行为数据进行预处理,以构造可用数据;步骤S102:根据可用数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度;步骤S103:根据特征分类相关度对原始特征数据进行选择,以获取训练特征数据;步骤S104:根据训练特征数据构建预估模型;步骤S105:根据预估模型对待预估的用户购车线索数据进行交易转化的预估。
本发明的方案中,通过提取构造的可用数据的特征数据,并对该特征数据进行选择,作为构建的预估模型的训练数据;通过预估模型实现对购车线索交易转化的自动化分类;降低对购车线索交易转化分类所花费的人力和时间的成本;同时提高购车线索交易转化的效率和准确率。以下针对各个步骤的具体实现做进一步的说明:
步骤S101:对用户购车线索数据和用户购车行为数据进行预处理,以构造可用数据。
具体地,整合用户购车线索数据和用户购车行为数据;对整合后的数据进行清洗,以获取可用数据。
首先,获取用户购车线索数据及用户购车行为数据。
其中,获取用户购车线索数据的方式包括当不限于:针对该用户在购车网站上的注册信息,在用户历史行为记录库中进行查询以获取到该用户的用户购车线索数据。用户购车线索数据包括但不限于:用户所在城市、用户年龄、用户计划购买的车型以及该用户是否想要置换车辆。
其中,获取用户购车行为数据的方式包括但不限于:针对该用户在购车网站上进行账号登陆并对该购车网站的页面进行浏览,在用户历史行为记录库中进行查询以获取到该用户的用户购车行为数据;用户购车行为数据包括但不限于:产生用户购车线索数据的日期后的三个月内,该用户关注的车辆的评测、用户关注的车辆报价、用户关注的车辆的性能和用户关注的车辆品牌的口碑。
随后,将用户购车线索数据和该用户购车行为数据进行匹配,并对所有匹配后的数据进行数据清洗,以获取可用数据。
例如,将用户年龄与用户关注的车辆报价进行匹配,如30岁-宝马1系-30万;若所有匹配后的数据中出现不完整的数据、错误的数据或重复的数据,则去除这些不符合要求的数据,例如匹配后的数据中出现多个“30岁-宝马1系-30万”,则去除其中的冗余数据。
图2为本发明的具体实施例中构造可用数据的示意图。其中,可用数据包括但不限于:用户年龄与用户关注的车辆品牌、用户年龄与用户关注的车型以及用户年龄与用户关注的车辆价格。通过将用户购车线索数据和用户购车行为数据相结合,构造可用数据,使得后续得到的训练数据范围更为广泛和准确;进一步使得商家更加准确的了解消费者的购车需求和习惯,有助于商家实现精确营销方案的制定。
优选地,该预估方法还包括:根据购车交易业务类型,将用户购车线索数据分类为实现交易转化的用户购车线索数据和未实现交易转化的用户购车线索数据。
其中,购车交易业务类型包括但不限于:商家电话回访、商家邮件回访和用户购车的付款订单。
具体地,实现交易转化的用户购车线索数据为根据购车交易业务类型确定购买车辆的用户所对应的用户购车线索数据;未实现交易转化的用户购车线索数据为根据购车交易业务类型确定未购买车辆的用户所对应的用户购车线索数据。通过根据购车交易业务类型确定用户购车线索数据的转化类型,明确预估模型的训练目的。
步骤S102:根据可用数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度。
其中,原始特征数据包括但不限于:用户年龄与用户关注的车辆品牌、用户年龄与用户关注的车型和用户年龄与用户关注的车辆价格。
具体地,对可用数据进行分词并去除分词停用词,以对可用数据进行原始特征数据的提取;基于每一特征分类下的原始特征数据在各个转化类别下的分布率,确定特征分类相关度。例如,通过统计算法确定每一特征分类下的原始特征数据在各个转化类别下的分布率,并基于权重算法确定特征分类相关度。图3示出了特征分类下的原始特征数据在各个转化类别下的分布示意图,其中左侧图为特征分类下的原始特征数据在交易已转化类别下的分布图,右侧图为特征分类下的原始特征数据在交易未转化类别下的分布图;图4示出了特征分类相关度的示意图。
步骤S103:根据特征分类相关度对原始特征数据进行选择,以获取训练特征数据。具体地,选取特征分类相关度大于预定的相关度阈值的每一特征分类下的原始特征数据作为训练特征数据。例如,当用户年龄与用户关注的车辆报价的特征数据的特征分类相关度大于预定的相关度阈值,则将用户年龄与用户关注的车辆报价的特征数据作为训练特征数据。通过根据特征分类相关度对原始特征数据进行选择,减小特征数据量的大小,选取能够将购车线索数据划分为实现交易转化和未实现交易转化的类别的更为有效和精确的特征数据,同时也为后续步骤的数据处理和模型建立以及模型训练提高了计算速度。
具体地,预估方法还包括:对获取到的训练特征数据进行去重以及数据平衡化处理,例如通过simhash算法对训练特征数据进行去重,通过过抽样法对训练特征数据进行平衡化处理。
步骤S104:根据训练特征数据构建预估模型。如图5所示,构建预估模型的步骤具体包括:步骤S201:基于对用户购车线索数据的转化分类结果,确定获取到的训练特征数据相应的转化类别;步骤S202:根据训练特征数据,并结合与训练特征数据相应的转化类别,来构建预估模型。
具体地,基于转化分类后的实现交易转化的用户购车线索数据和未实现交易转化的用户购车线索数据,确定获取到的实现交易转化的训练特征数据和未实现交易转化的训练特征数据。根据训练特征数据,并结合与实现交易转化的训练特征数据和未实现交易转化的训练特征数据,构建预估模型。
更具体地,根据训练特征数据构建预估模型的方法,进一步包括:将训练特征数据转化为多维空间内的点;在多维空间内寻找将多维空间内的点分类的最优分类超平面。
具体地,通过升维变化原理将所有训练特征数据转化为多维空间内的点,通过最优分类函数确定将多维空间内的点分类的最优分类超平面,从而构建该预估模型,如支持向量机模型。通过将所有训练特征数据转化为多维空间内的点,以便于更好的将训练特征数据进行精确的分类;根据最优分类超平面使得待预估的用户购车线索数据的分类效果更好,且提升购车线索预估的运行速度,且不需要占用太多的内存。
步骤S105:根据预估模型对待预估的用户购车线索数据进行交易转化的预估。具体地,通过预估模型确定的最优分类超平面对待预估的用户购车线索数据进行交易转化预估的分级。
更具体地,将待预估的用户购车线索数据输入到预估模型,基于待预估的用户购车线索数据和训练特征数据确定的最优分类超平面将待预估的用户购车线索数据划分为实现交易转化的用户购车线索数据和未实现交易转化的用户购车线索数据。本发明的预估方法不但实现了对购车线索交易转化的自动化分类,更进一步的提高了用户购车线索的利用率,且精确了商家的后续制定销售计划。
图6为本发明中另一实施例的购车线索交易转化的预估装置的结构框架示意图。
数据预处理模块301对用户购车线索数据和用户购车行为数据进行预处理,以构造可用数据;提取模块302根据可用数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度;选择模块303根据特征分类相关度对原始特征数据进行选择,以获取训练特征数据;构建模块304根据训练特征数据构建预估模型;预估模块305根据预估模型对待预估的用户购车线索数据进行交易转化的预估。以下针对各个模块的具体实现做进一步的说明:
数据预处理模块301对用户购车线索数据和用户购车行为数据进行预处理,以构造可用数据;更进一步包括:整合单元和清洗单元。
具体地,整合单元整合用户购车线索数据和用户购车行为数据;清洗单元对整合后的数据进行清洗,以获取可用数据。
首先,整合单元获取用户购车线索数据及用户购车行为数据。
其中,获取用户购车线索数据的方式包括当不限于:针对该用户在购车网站上的注册信息,在用户历史行为记录库中进行查询以获取到该用户的用户购车线索数据。用户购车线索数据包括但不限于:用户所在城市、用户年龄、用户计划购买的车型以及该用户是否想要置换车辆。
其中,获取用户购车行为数据的方式包括但不限于:针对该用户在购车网站上进行账号登陆并对该购车网站的页面进行浏览,在用户历史行为记录库中进行查询以获取到该用户的用户购车行为数据;用户购车行为数据包括但不限于:产生用户购车线索数据的日期后的三个月内,该用户关注的车辆的评测、用户关注的车辆报价、用户关注的车辆的性能和用户关注的车辆品牌的口碑。
随后,整合单元将用户购车线索数据和该用户购车行为数据进行匹配,清洗单元对所有匹配后的数据进行数据清洗,以获取可用数据。例如,整合单元将用户年龄与用户关注的车辆报价进行匹配,如30岁-宝马1系-30万;若所有匹配后的数据中出现不完整的数据、错误的数据或重复的数据,则清洗单元去除这些不符合要求的数据,例如匹配后的数据中出现多个“30-岁宝马1系-30万”,则去除其中的冗余数据。
图2示出了构造可用数据的示意图,其中,可用数据包括但不限于:用户年龄与用户关注的车辆品牌、用户年龄与用户关注的车型以及用户年龄与用户关注的车辆价格。通过数据预处理模块301将用户购车线索数据和用户购车行为数据相结合,构造可用数据,使得后续得到的训练数据范围更为广泛和准确;进一步使得商家更加准确的了解消费者的购车需求和习惯,有助于商家实现精确营销方案的制定。
优选地,预估装置还包括:分类模块;分类模块根据购车交易业务类型,将用户购车线索数据分类为实现交易转化的用户购车线索数据和未实现交易转化的用户购车线索数据。
其中,购车交易业务类型包括但不限于:商家电话回访、商家邮件回访和用户购车的付款订单。
具体地,实现交易转化的用户购车线索数据为根据购车交易业务类型确定购买车辆的用户所对应的用户购车线索数据;未实现交易转化的用户购车线索数据为根据购车交易业务类型确定未购买车辆的用户所对应的用户购车线索数据。通过分类模块根据购车交易业务类型确定用户购车线索数据的转化类型,明确预估模型的训练目的。
提取模块302根据可用数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度;进一步包括提取单元和统计单元。
其中,原始特征数据包括但不限于:用户年龄与用户关注的车辆品牌、用户年龄与用户关注的车型和用户年龄与用户关注的车辆价格。
具体地,提取单元对可用数据进行分词并去除分词停用词,以对可用数据进行原始特征数据的提取;统计单元基于每一特征分类下的原始特征数据在各个转化类别下的分布率,确定特征分类相关度。例如,统计单元通过统计算法确定每一特征分类下的原始特征数据在各个转化类别下的分布率,并基于权重算法确定特征分类相关度。图3示出了特征分类下的原始特征数据在各个转化类别下的分布示意图,其中左侧图为特征分类下的原始特征数据在交易已转化类别下的分布图,右侧图为特征分类下的原始特征数据在交易未转化类别下的分布图;图4示出了特征分类相关度的示意图。
选择模块303根据特征分类相关度对原始特征数据进行选择,以获取训练特征数据。具体地,选择模块303选取特征分类相关度大于预定的相关度阈值的每一特征分类下的原始特征数据作为训练特征数据。例如,当用户年龄与用户关注的车辆报价的特征数据的特征分类相关度大于预定的相关度阈值,则获取单元将用户年龄与用户关注的车辆报价的特征数据作为训练特征数据。通过选择模块303根据特征分类相关度对原始特征数据进行选择,减小特征数据量的大小,选取能够将购车线索数据划分为实现交易转化和未实现交易转化的类别的更为有效和精确的特征数据,同时也为后续步骤的数据处理和模型建立以及模型训练提高了计算速度。
具体地,预估装置还包括:数据处理模块,对获取到的训练特征数据进行去重以及数据平衡化处理,例如数据处理模块通过simhash算法对训练特征数据进行去重,通过过抽样法对训练特征数据进行平衡化处理。
构建模块304根据训练特征数据构建预估模型。具体地,构建模块304基于对用户购车线索数据的转化分类结果,确定获取到的训练特征数据相应的转化类别;根据训练特征数据,并结合与训练特征数据相应的转化类别,来构建预估模型。
具体地,构建模块304基于转化分类后的实现交易转化的用户购车线索数据和未实现交易转化的用户购车线索数据,确定获取到的实现交易转化的训练特征数据和未实现交易转化的训练特征数据。根据训练特征数据,并结合与实现交易转化的训练特征数据和未实现交易转化的训练特征数据,构建预估模型。
更具体地,构建模块304,进一步包括:转化单元和寻找单元。
转化单元将训练特征数据转化为多维空间内的点;寻找单元在多维空间内寻找将多维空间内的点分类的最优分类超平面。
具体地,转化单元通过升维变化原理将所有训练特征数据转化为多维空间内的点;寻找单元通过最优分类函数确定将多维空间内的点分类的最优分类超平面,从而构建该预估模型,如支持向量机模型。转化单元通过将所有训练特征数据转化为多维空间内的点,以便于更好的将训练特征数据进行精确的分类;寻找单元根据最优分类超平面使得待预估的用户购车线索数据的分类效果更好,且提升购车线索预估的运行速度,且不需要占用太多的内存。
预估模块305根据预估模型对待预估的用户购车线索数据进行交易转化的预估。具体地,预估模块305通过预估模型确定的最优分类超平面对待预估的用户购车线索数据进行交易转化预估的分级。
更具体地,预估模块305将待预估的用户购车线索数据输入到预估模型,基于待预估的用户购车线索数据和训练特征数据确定的最优分类超平面将待预估的用户购车线索数据划分为实现交易转化的用户购车线索数据和未实现交易转化的用户购车线索数据。本发明的预估装置不但实现了对购车线索交易转化的自动化分类,更进一步的提高了用户购车线索的利用率,且精确了商家的后续制定销售计划。
本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随即存储器)、EPROM(Erasable ProgrammableRead-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically ErasableProgrammable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (8)
1.一种购车线索交易转化的预估方法,其特征在于,包括:
获取待预估的用户购车线索数据;
采用预构建的预估模型对所述待预估的用户购车线索数据进行交易转化的预估,确定所述待预估的用户购车线索数据是否为已实现交易转化的用户购车线索数据;
其中,所述预估模型的构建包括:
对用户购车线索数据和用户购车行为数据进行预处理,以构造可用数据,包括:将用户购车线索数据和用户购车行为数据进行匹配,并对所有匹配后的数据进行数据清洗,以获得可用数据;
根据所述可用数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度,包括:基于每一特征分类下的原始特征数据在各个转化类别下的分布率,确定特征分类相关度;
根据所述特征分类相关度对所述原始特征数据进行选择,以获取训练特征数据;
根据所述训练特征数据构建预估模型,包括:将所述训练特征数据转化为多维空间内的点,通过最优分类函数确定将多维空间内的点分类的最优分类超平面,以构建所述预估模型。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据购车交易业务类型,将所述用户购车线索数据分类为实现交易转化的用户购车线索数据和未实现交易转化的用户购车线索数据;
其中,根据所述训练特征数据构建预估模型,包括:
基于对用户购车线索数据的转化分类结果,确定获取到的训练特征数据相应的转化类别;
根据所述训练特征数据,并结合与所述训练特征数据相应的转化类别,来构建预估模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述特征分类相关度对所述原始特征数据进行选择,以获取训练特征数据,包括:
选取特征分类相关度大于预定的相关度阈值的所述每一特征分类下的原始特征数据作为所述训练特征数据。
4.根据权利要求3所述的方法,其特征在于,还包括:
对获取到的所述训练特征数据进行去重以及数据平衡化处理。
5.一种购车线索交易转化的预估装置,其特征在于,包括:
预估模块,用于获取待预估的用户购车线索数据;采用预构建的预估模型对所述待预估的用户购车线索数据进行交易转化的预估,确定所述待预估的用户购车线索数据是否为已实现交易转化的用户购车线索数据;
其中,所述预估模型采用以下模块构建:
数据预处理模块,用于对用户购车线索数据和用户购车行为数据进行预处理,以构造可用数据,包括:将用户购车线索数据和用户购车行为数据进行匹配,并对所有匹配后的数据进行数据清洗,以获得可用数据;
提取模块,用于根据所述可用数据进行原始特征的提取,并确定每一特征分类下的原始特征数据的特征分类相关度,包括:基于每一特征分类下的原始特征数据在各个转化类别下的分布率,确定特征分类相关度;
选择模块,用于根据所述特征分类相关度对所述原始特征数据进行选择,以获取训练特征数据;
构建模块,用于根据所述训练特征数据构建预估模型,包括:转化单元,用于将所述训练特征数据转化为多维空间内的点;寻找单元,用于通过最优分类函数确定将多维空间内的点分类的最优分类超平面,以构建所述预估模型。
6.根据权利要求5所述的装置,其特征在于,还包括:
分类模块,用于根据购车交易业务类型,将所述用户购车线索数据分类为实现交易转化的用户购车线索数据和未实现交易转化的用户购车线索数据;
所述构建模块,用于基于对用户购车线索数据的转化分类结果,确定获取到的训练特征数据相应的转化类别;
根据所述训练特征数据,并结合与所述训练特征数据相应的转化类别,来构建预估模型。
7.根据权利要求6所述的装置,其特征在于,所述选择模块包括:
获取单元,用于选取特征分类相关度大于预定的相关度阈值的所述每一特征分类下的原始特征数据作为所述训练特征数据。
8.根据权利要求7所述的装置,其特征在于,所述选择模块还包括:
数据处理单元,用于对获取到的所述训练特征数据进行去重以及数据平衡化处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610560339.6A CN107622408B (zh) | 2016-07-15 | 2016-07-15 | 购车线索交易转化的预估方法和预估装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610560339.6A CN107622408B (zh) | 2016-07-15 | 2016-07-15 | 购车线索交易转化的预估方法和预估装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107622408A CN107622408A (zh) | 2018-01-23 |
CN107622408B true CN107622408B (zh) | 2021-10-01 |
Family
ID=61087586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610560339.6A Active CN107622408B (zh) | 2016-07-15 | 2016-07-15 | 购车线索交易转化的预估方法和预估装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107622408B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709767B (zh) * | 2020-05-06 | 2024-02-23 | 口碑(上海)信息技术有限公司 | 一种数据处理方法及装置 |
CN111859289B (zh) * | 2020-06-17 | 2024-04-19 | 北京嘀嘀无限科技发展有限公司 | 交通工具的交易转化率预估方法、装置、电子设备及介质 |
CN114547482B (zh) * | 2022-03-03 | 2023-01-20 | 智慧足迹数据科技有限公司 | 业务特征生成方法、装置、电子设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6004015B2 (ja) * | 2013-02-01 | 2016-10-05 | 富士通株式会社 | 学習方法、情報処理装置および学習プログラム |
CN104933075A (zh) * | 2014-03-20 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 用户属性预测平台和方法 |
CN104050242B (zh) * | 2014-05-27 | 2018-03-27 | 哈尔滨理工大学 | 基于最大信息系数的特征选择、分类方法及其装置 |
CN105260371B (zh) * | 2014-07-17 | 2018-12-07 | 华为技术有限公司 | 一种特征选择方法及装置 |
CN105430073A (zh) * | 2015-11-12 | 2016-03-23 | 北京易车互联信息技术有限公司 | 一种基于用户行为的消息推送方法及系统 |
-
2016
- 2016-07-15 CN CN201610560339.6A patent/CN107622408B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107622408A (zh) | 2018-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101999471B1 (ko) | 정보 추천 방법 및 장치 | |
CN102262647B (zh) | 信息处理装置、信息处理方法和程序 | |
CN105117440A (zh) | 确定待推荐应用app的方法及装置 | |
CN108805598B (zh) | 相似度信息确定方法、服务器及计算机可读存储介质 | |
EP2350819A2 (en) | Determining user similarities based on location histories | |
CN108717654B (zh) | 一种基于聚类特征迁移的多电商交叉推荐方法 | |
Duivesteijn et al. | Different slopes for different folks: mining for exceptional regression models with cook's distance | |
CN107622408B (zh) | 购车线索交易转化的预估方法和预估装置 | |
CN114119137A (zh) | 风险控制方法和装置 | |
CN106296286A (zh) | 广告点击率的预估方法和预估装置 | |
CN107220745B (zh) | 一种意图行为数据的识别方法、系统及设备 | |
CN111222976A (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN108109004A (zh) | 相似人群扩展方法、装置及电子设备 | |
CN104915423A (zh) | 获取目标用户的方法和装置 | |
CN112435078A (zh) | 一种用户忠诚度分类的方法 | |
CN116402539B (zh) | 基于大数据的拓客方法、系统、设备及存储介质 | |
KR20220073295A (ko) | 부동산 시세 추정 장치 및 그 방법 | |
CN107622409B (zh) | 购车能力的预测方法和预测装置 | |
CN110633919A (zh) | 经营实体的评估方法及其装置 | |
CN103324641A (zh) | 信息记录推荐方法和装置 | |
CN113592551A (zh) | 购车用户行为数据分析处理方法、装置及设备 | |
CN110020957A (zh) | 维修对象的定损方法及装置、电子设备 | |
CN109670153A (zh) | 一种相似帖子的确定方法、装置、存储介质及终端 | |
CN105389714A (zh) | 一种从行为数据识别用户特性的方法 | |
CN111860554B (zh) | 风险监控方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |