CN116629904A

CN116629904A - 一种基于大数据的客户分层匹配方法

Info

Publication number: CN116629904A
Application number: CN202310508128.8A
Authority: CN
Inventors: 王汐滟
Original assignee: Digital Juyun Suzhou Technology Co ltd
Current assignee: Digital Juyun Suzhou Technology Co ltd
Priority date: 2023-05-08
Filing date: 2023-05-08
Publication date: 2023-08-22

Abstract

本发明公开了一种基于大数据的客户分层匹配方法，通过开发商的内部数据源和云数据源中提取房产属性信息与客户属性信息，通过房产属性信息形成待匹配房产清单，根据客户属性信息进行客户分层分类，把房源和客户意向进行双向匹配，形成房产‑客户的匹配对，进行主动、智能、有预测性地房源与客户需求的匹配，并在此基础上，形成对不同楼盘项目具有定制化的和针对性的购房人群推荐，来精准的为地产项目和客户提供服务。

Description

一种基于大数据的客户分层匹配方法

技术领域

本发明属于大数据分析技术领域，具体涉及一种基于大数据的客户分层匹配方法。

背景技术

随着大数据云计算的发展和5G网络的传输，数据分析在广泛领域得到发展，大数据包括结构化、半结构化和非结构化数据，非结构化数据越来越成为数据的主要部分，随着社会的不断进步，城市建设的步伐越来越迅速，一座座高楼拔地而起，人们购房能力也在不断提升，传统手段是以地推、分享楼盘等方式来吸引客户上门，客户买房意愿和需求并不明确，缺少对客户信息和房屋信息的分析方法，无法确定房源和客户的匹配度，所以不能把握客户的实际需求，以致用户类别定位不准确，无法精准确定用户对房源内容的兴趣度，导致推荐的房源不符合用户。

发明内容

针对上述现有技术的不足，一种基于大数据的客户分层匹配方法，包括以下步骤：

部署大数据存储系统，所述大数据存储系统包括房产数据库和客户数据库，从所述房产数据库中获取待售房产的房产属性信息，从所述客户数据库中获取目标客户总数以及对应的客户属性信息；

通过市场比较法对待售房产的房产属性信息进行分析，根据分析结果对待售房产进行分层分类处理，得到待匹配房产清单；

构建客户分层模型，将目标客户总数、客户属性信息、预设客户分层层级总数和各个客户层级作为分层数据集输入到所述客户分层模型中进行分层分类处理，得到目标客户分层表单；

采用对应分析法对所述待匹配房产清单的待售房产和所述目标客户分层表单中的目标客户进行配对，得到待售房产与目标客户之间的匹配对；

根据所述匹配对向目标客户推荐对应的待售房产。

在一些实施例的一些可选的实现方式中，所述从所述房产数据库中获取待售房产的房产属性信息，包括获取待售房产位置、面积、用途、使用年期、交易条件、影响地价的区域和土地价格作为房产属性信息。

在一些实施例的一些可选的实现方式中，所述从所述客户数据库中获取目标客户的客户属性信息，包括获取客户年龄段、客户资产等级、客户收入级别和客户教育程度类别作为客户属性信息。

在一些实施例的一些可选的实现方式中，所述通过市场比较法对待售房产的房产属性信息进行分析，根据分析结果对待售房产进行分层分类处理，得到待匹配房产清单，包括：

确定比对基准：选取三个以上与待售房产的房产属性信息最接近，属同一供需圈内相邻地区或类似地区的已交易房产作为比对基准；

建立价格比对基础：根据选取的已交易房产，建立价格比对基础；

交易情况修正：将由于特殊因素造成的已交易房产的价格偏差予以排除，将其成交价格修正为正常的市场价格；

区域因素修正：将区域因素中的各因子对地价的影响程度求和，得出区域因素条件指数，再按公式计算；区域内的各因子包括商业繁华程度、交通条件、公用设施及基础设施水平、区域环境条件、城镇规划、土地使用限制、产业集聚程度；

计算比准价格：根据交易情况修正和区域因素修正后求取出待售房产的比准价格；

构建房产清单：根据比准价格构建基于按照价格和面积对应排列的待匹配房产清单。

在一些实施例的一些可选的实现方式中，在构建所述构建客户分层模型之前，还包括构建算法输入，构建算法输入的步骤为：

建立无向图

G＝(V，E)

其中，V＝{1,2,...,n}表示节点集，E＝{(i,j)|若节点i和节点j有连边}表示边集；

利用NLP技术将目标客户总数、目标客户的客户属性信息、预设客户分层层级总数和各个客户层级进行文本数据特征向量化，得到数字格式的数据集，

将所述数据集作为无向图的节点集V上的数据集进行表示：

Data＝{(x₁，y₁)，(x₂，y₂)，...，(x_n，y_n)}

其中，n＝|V|-表示无向图上的节点总数；

x_i＝(x_i1，x_i2，...，x_ip)^T∈R^p表示无向图第i个节点上的特征变量的观测；

y_i＝(y_i1，y_i2，...y_ic)^T∈R^c表示无向图第i个节点上的层级，用one-hot向量表示：如果节点i属于第j类，y_ij＝1，否则y_ij＝0；

i表示目标客户总数，j表示目标客户的各个客户层级，p表示特征向量维度数，c是分层任务中考虑的预设客户分层层级总数，y_L表示无向图有层级观测值的节点构成的集合，y_U表示无层级观测值的节点构成的集合；

在一些实施例的一些可选的实现方式中，所述构建客户分层模型，将目标客户总数、客户属性信息、预设客户分层层级总数和各个客户层级作为分层数据集输入到所述客户分层模型中进行分层分类处理，包括：

步骤1：构造无向图上归一化的拉普拉斯矩阵：

L＝I-D^-1/2AD^-1/2

其中,I表示单位矩阵，D表示无向图的度矩阵，A表示无向图的邻接矩阵，其第ij个元素定义为：若(i，j)∈E，则A_ij＝1，若则A_ij＝0；

步骤2：对L进行谱分解：

其中，λ₁≤λ₂≤...≤λ_n表示L的n个特征根；

Λ＝diag(λ₁，λ₂，...，λ_n)表示L的n个特征根为对角元的对角矩阵；

u₁，u₂，…，u_n表示对应的n个特征向量；

U＝(u₁，u₂，…，u_n)表示对应的n个特征向量组成的矩阵；

步骤3：构建带有图卷积运算的客户分层模型：

其中，x_i＝(x_i1，x_i2，...x_ip)^T∈R^p表示第i个节点上的特征变量的观测；

表示第i个节点上的输出向量，用于预测该节点的层级；softmax表示向量的softmax变换；p_K(λ_i/2)表示K阶的伯恩斯坦多项式；θ_k表示待估计的卷积核参数，f表示带有q＝64个隐藏单元的隐藏层的多层感知器。

在一些实施例的一些可选的实现方式中，还包括，根据无向图的节点集V上的数据集和所述客户分层模型，构造分层预测的损失函数：

其中，由所述客户分层模型进行计算。

在一些实施例的一些可选的实现方式中，还包括对所述客户分层模型进行优化，优化步骤包括：

根据所述损失函数，使用优化算法训练客户分层模型中卷积核参数θ_k和线性特征变换层的参数W₁和W₂；

采用深度学习框架进行训练，得到参数估计和线性特征变换层的参数矩阵估计/>和/>

根据参数估计和参数矩阵估计得到最终的客户分层模型：

其中，

在一些实施例的一些可选的实现方式中，所述得到目标客户分层表单，包括：

基于最终的客户分层模型的输出结果，按照客户属性信息将所有目标客户分层分类到对应的各个层级之中，形成所述目标客户分层表单。

在一些实施例的一些可选的实现方式中，所述采用对应分析法对所述待匹配房产清单的待售房产和所述目标客户分层表单中的目标客户进行配对，得到待售房产与目标客户之间的匹配对，包括：采用的对应分析法为双向指示种分析方法、典范对应分析方法或质性数据分析方法。

本发明的有益效果：

通过开发商的内部数据源和云数据源中提取房产属性信息与客户属性信息，通过房产属性信息形成待匹配房产清单，根据客户属性信息进行客户分层分类，把房源和客户意向进行双向匹配，形成房产-客户的匹配对，进行主动、智能、有预测性地房源与客户需求的匹配，并在此基础上，形成对不同楼盘项目具有定制化的和针对性的购房人群推荐，来精准的为地产项目和客户提供服务。

附图说明

图1为本发明的总体流程图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制；相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

一种基于大数据的客户分层匹配方法，包括以下步骤S100-S500：

S100：部署大数据存储系统，所述大数据存储系统包括房产数据库和客户数据库，从所述房产数据库中获取待售房产的房产属性信息，从所述客户数据库中获取目标客户总数以及对应的客户属性信息；

其中，本实施例采用基于大数据存储HBase数据模型，HBase是可以提供实时计算的分布式数据库，数据被保存在HDFS分布式文件系统上，由HDFS保证期高容错性，但是在生产环境中，HBase上的数据是以StoreFile(HFile)二进制流的形式存储在HDFS上block块儿中；但是HDFS并不知道的hbase存的是什么，它只把存储文件是为二进制文件，也就是说，hbase的存储数据对于HDFS文件系统是透明的；

S200：通过市场比较法对待售房产的房产属性信息进行分析，根据分析结果对待售房产进行分层分类处理，得到待匹配房产清单；

将由于特殊因素造成的价格偏差予以排除，将其成交价格修正为正常的市场价格；房产交易模式日趋扩大化发展，业务模式也更加灵活多变，原始数据收集与处理模式多种多样；交易情况修正是排除交易行为中的一些特殊因素所造成的价格偏差，将其成交价格修正为正常市场价格；

将区域因素中的各因子对地价的影响程度求和，得出区域因素条件指数，再按公式计算；区域内的各因子包括商业繁华程度、交通条件、公用设施及基础设施水平、区域环境条件、城镇规划、土地使用限制、产业集聚程度；不同用途的待售房产，影响其价格的区域因子不同，区域因素修正的具体因子应根据待售房产的用途确定；

计算过程包括以下步骤：

首先求取土地价格；

以待售房产与其相应范围内土地所产生的总的净收益中，减掉归属于土地的净收益，求得待售房产的净收益；

将次净收益以待售房产的还原率还原，就可求取待售房产的比准价格。

本实施例以60－200平方面积，价格为40－200万的房产为建表基准，构建待匹配房产清单，将待售房产分为15类，如下表1所示：

	40－70万	70－100万	100－130万	130－160万	160万以上
						60平方以下	1	3	5
60－100平方	2	4	6	9	12
						100－140平方			7	10	13
140－180平方				11	14
						180平方以上					15

表1

S300：构建客户分层模型，将目标客户总数、客户属性信息、预设客户分层层级总数和各个客户层级作为分层数据集输入到所述客户分层模型中进行分层分类处理，得到目标客户分层表单；

建立无向图

G＝(V，E)

利用NLP技术将目标客户总数、目标客户的客户属性信息、预设客户分层层级总数和各个客户层级进行文本数据特征向量化，得到数字格式的数据集，将所述数据集作为无向图的节点集V上的数据集进行表示：

Data＝{(x₁，y₁)，(x₂，y₁)，...，(x_n，y_n)}

其中，n＝|V|-表示无向图上的节点总数；

x_i＝(x_i1，x_i2，...x_ip)^T∈R^p表示无向图第i个节点上的特征变量的观测；

i表示目标客户总数，j表示目标客户的各个客户层级(本实施例中，将预设的客户层级分为工薪级、中产级和富裕级，所以j的取值为1－3)，p表示特征向量维度数(即目标客户的客户属性信息的数量，包括客户年龄段、客户资产等级、客户收入级别和客户教育程度类别，即p的取值为6)，c是分层任务中考虑的预设客户分层层级总数(因为本实施例中预设的客户层级为3级，所以层级总数为3，c的取值为3)，y_L表示无向图有层级观测值的节点构成的集合，y_U表示无层级观测值的节点构成的集合；

步骤1：构造无向图上归一化的拉普拉斯矩阵：

L＝I-D^-1/2AD^-1/2

其中,I表示单位矩阵，D表示无向图的度矩阵，其是一个对角矩阵，第i个对角元的值等于和节点i连边的个数，A表示无向图的邻接矩阵，其第ij个元素定义为：若(i，i)∈E，则A_ij＝1，若则A_ij＝0；

步骤2：对L进行谱分解：

其中，λ₁≤λ₂≤…≤λ_n表示L的n个特征根；

u₁，u₂，…，u_n表示对应的n个特征向量；

U＝(u₁，u₂，...，u_n)表示对应的n个特征向量组成的矩阵；

步骤3：构建带有图卷积运算的客户分层模型：

其中，x_i＝(x_i1，x_i2，...，x_ip)^T∈R^p表示第i个节点上的特征变量的观测；

其中，向量的softmax变换为：

f的定义如下：

W₁是p×q的从输入层到隐藏层的特征变换未知参数矩阵；

W₂是qxc的隐藏层到输出层的特征变换未知参数矩阵；

ReLu(b₁，b₂，...，b_q)＝(max{0，b₁}，max{0，b₂}，...，max{0，b_q})

表示非线性激活函数；

其中，由所述客户分层模型进行计算。

根据所述损失函数，使用优化算法(本实施例采用Adam优化算法)训练客户分层模型中卷积核参数θ_k和线性特征变换层的参数W₁和W₂；

采用深度学习框架(本实施例采用深度学习框架PyTorch)进行训练，得到参数估计和线性特征变换层的参数矩阵估计/>和/>

根据参数估计和参数矩阵估计得到最终的客户分层模型：

其中，

由于在本实施例中，对待售房产匹配度影响最高的维度为：客户资产等级和客户收入级别；对待售房产匹配度影响中等的维度为：客户年龄段；对待售房产匹配度影响最低的维度为：客户教育程度类别，所以，主要以客户资产等级、客户收入级别和客户年龄段为主要影响维度形成目标客户分层表单，将目标客户分为15类，如表2所示：

	工薪级	中产级	富裕级
				25岁以下	32％	21％	7％
25－35岁	27％	36％	8％
				35－45岁	15％	29％	10％
45－55岁	18％	17％	12％
				55－65岁	33％	24％	12％

表2

其中，表示的是各个类别的客户与目标客户总的占比。

S400：采用对应分析法对所述待匹配房产清单的待售房产和所述目标客户分层表单中的目标客户进行配对，得到待售房产与目标客户之间的匹配对；

其中，对应分析(Correspondence analysis)也称关联分析或R-Q型因子分析，是近年新发展起来的一种多元相依变量统计分析技术，通过分析由定性变量构成的交互汇总表来揭示变量间的联系(即可以揭示同一变量的各个类别之间的差异，以及不同变量各个类别之间的对应关系)。对应分析的基本思想是将一个表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来，其最大特点是能把众多的样品和众多的变量同时作到同一张图解上，将样品的大类及其属性在图上直观而又明了地表示出来，具有直观性；另外，它还省去了因子选择和因子轴旋转等复杂的数学运算及中间过程，可以从因子载荷图上对样品进行直观的分类，而且能够指示分类的主要参数(主因子)以及分类的依据，是一种直观、简单、方便的多元统计方法。由于对应分析是一种视觉化的数据分析方法，它能够将几组看不出任何联系的数据，通过视觉上可以接受的定位图展现出来，因而可主要应用在市场细分、产品定位、地质研究以及计算机工程等领域中，本实施例中将待匹配房产清单和所述目标客户分层表单作为样表，采用对应分析进行待售房产与目标客户之间配对。进一步的，进行对应分析的方法可以但不限于为现有的双向指示种分析方法、典范对应分析方法或质性数据分析方法等。

S500：根据所述匹配对向目标客户推荐对应的待售房产。

通过房产估价和目标客户分层，然后基于对应分析得到的待售房产与人之间的匹配关系，有效地对难销售、价格偏高、处于郊区或地段不好的待售房产匹配合适的目标客户，降低项目销售难度。

以上仅是本发明优选的实施方式，需指出的是，对于本领域技术人员在不脱离本技术方案的前提下，作出的若干变形和改进的技术方案应同样视为落入本权利要求书要求保护的范围。

Claims

1.一种基于大数据的客户分层匹配方法，其特征在于：包括以下步骤：

根据所述匹配对向目标客户推荐对应的待售房产。

2.根据权利要求1所述的方法，其特征在于：所述从所述房产数据库中获取待售房产的房产属性信息，包括获取待售房产位置、面积、用途、使用年期、交易条件、影响地价的区域和土地价格作为房产属性信息。

3.根据权利要求2所述的方法，其特征在于：所述从所述客户数据库中获取目标客户的客户属性信息，包括获取客户年龄段、客户资产等级、客户收入级别和客户教育程度类别作为客户属性信息。

4.根据权利要求3所述的方法，其特征在于：所述通过市场比较法对待售房产的房产属性信息进行分析，根据分析结果对待售房产进行分层分类处理，得到待匹配房产清单，包括：

5.根据权利要求4所述的方法，其特征在于：在构建所述构建客户分层模型之前，还包括构建算法输入，构建算法输入的步骤为：

建立无向图

G＝(V，E)

其中，V＝{1，2，...，n}表示节点集，E＝{(i，j)|若节点i和节点j有连边}表示边集；

将所述数据集作为无向图的节点集V上的数据集进行表示：

Data＝{(x₁，y₁)，(x₂，y₂)，...，(x_n，y_n)}

其中，n＝|V|-表示无向图上的节点总数；

y_i＝(y_i1，y_i2，...，y_ic)^T∈R^c表示无向图第i个节点上的层级，用one-hot向量表示：如果节点i属于第j类，y_ij＝1，否则y_ij＝0；

i表示目标客户总数，j表示目标客户的各个客户层级，p表示特征向量维度数，c是分层任务中考虑的预设客户分层层级总数，y_L表示无向图有层级观测值的节点构成的集合，y_U表示无层级观测值的节点构成的集合。

6.根据权利要求5所述的方法，其特征在于：所述构建客户分层模型，将目标客户总数、客户属性信息、预设客户分层层级总数和各个客户层级作为分层数据集输入到所述客户分层模型中进行分层分类处理，包括：

步骤1：构造无向图上归一化的拉普拉斯矩阵：

L＝I-D^-1/2AD^-1/2

其中，I表示单位矩阵，D表示无向图的度矩阵，A表示无向图的邻接矩阵，其第ij个元素定义为：若(i，j)∈E，则A_ij＝1，若则A_ij＝0；

步骤2：对L进行谱分解：

其中，λ₁≤λ₂≤…≤λ_n表示L的n个特征根；

u₁，u₂，…，u_n表示对应的n个特征向量；

U＝(u₁，u₂，…，u_n)表示对应的n个特征向量组成的矩阵；

步骤3：构建带有图卷积运算的客户分层模型：

其中，x_i＝(x_i1,x_i2，...，x_ip)^T∈R^p表示第i个节点上的特征变量的观测；

7.根据权利要求6所述的方法，其特征在于：还包括，根据无向图的节点集V上的数据集和所述客户分层模型，构造分层预测的损失函数：

其中，由所述客户分层模型进行计算。

8.根据权利要求7所述的方法，其特征在于：还包括对所述客户分层模型进行优化，优化步骤包括：

根据参数估计和参数矩阵估计得到最终的客户分层模型：

其中，

9.根据权利要求8所述的方法，其特征在于：所述得到目标客户分层表单，包括：

10.根据权利要求9所述的方法，其特征在于：所述采用对应分析法对所述待匹配房产清单的待售房产和所述目标客户分层表单中的目标客户进行配对，得到待售房产与目标客户之间的匹配对，包括：采用的对应分析法为双向指示种分析方法、典范对应分析方法或质性数据分析方法。