CN116629904A - 一种基于大数据的客户分层匹配方法 - Google Patents
一种基于大数据的客户分层匹配方法 Download PDFInfo
- Publication number
- CN116629904A CN116629904A CN202310508128.8A CN202310508128A CN116629904A CN 116629904 A CN116629904 A CN 116629904A CN 202310508128 A CN202310508128 A CN 202310508128A CN 116629904 A CN116629904 A CN 116629904A
- Authority
- CN
- China
- Prior art keywords
- client
- property
- layering
- attribute information
- sold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000004458 analytical method Methods 0.000 claims description 32
- 230000000875 corresponding effect Effects 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 19
- 238000012937 correction Methods 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 10
- 238000007405 data analysis Methods 0.000 claims description 7
- 238000013500 data storage Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000002457 bidirectional effect Effects 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 claims description 4
- 230000007613 environmental effect Effects 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 claims description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于大数据的客户分层匹配方法,通过开发商的内部数据源和云数据源中提取房产属性信息与客户属性信息,通过房产属性信息形成待匹配房产清单,根据客户属性信息进行客户分层分类,把房源和客户意向进行双向匹配,形成房产‑客户的匹配对,进行主动、智能、有预测性地房源与客户需求的匹配,并在此基础上,形成对不同楼盘项目具有定制化的和针对性的购房人群推荐,来精准的为地产项目和客户提供服务。
Description
技术领域
本发明属于大数据分析技术领域,具体涉及一种基于大数据的客户分层匹配方法。
背景技术
随着大数据云计算的发展和5G网络的传输,数据分析在广泛领域得到发展,大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分,随着社会的不断进步,城市建设的步伐越来越迅速,一座座高楼拔地而起,人们购房能力也在不断提升,传统手段是以地推、分享楼盘等方式来吸引客户上门,客户买房意愿和需求并不明确,缺少对客户信息和房屋信息的分析方法,无法确定房源和客户的匹配度,所以不能把握客户的实际需求,以致用户类别定位不准确,无法精准确定用户对房源内容的兴趣度,导致推荐的房源不符合用户。
发明内容
针对上述现有技术的不足,一种基于大数据的客户分层匹配方法,包括以下步骤:
部署大数据存储系统,所述大数据存储系统包括房产数据库和客户数据库,从所述房产数据库中获取待售房产的房产属性信息,从所述客户数据库中获取目标客户总数以及对应的客户属性信息;
通过市场比较法对待售房产的房产属性信息进行分析,根据分析结果对待售房产进行分层分类处理,得到待匹配房产清单;
构建客户分层模型,将目标客户总数、客户属性信息、预设客户分层层级总数和各个客户层级作为分层数据集输入到所述客户分层模型中进行分层分类处理,得到目标客户分层表单;
采用对应分析法对所述待匹配房产清单的待售房产和所述目标客户分层表单中的目标客户进行配对,得到待售房产与目标客户之间的匹配对;
根据所述匹配对向目标客户推荐对应的待售房产。
在一些实施例的一些可选的实现方式中,所述从所述房产数据库中获取待售房产的房产属性信息,包括获取待售房产位置、面积、用途、使用年期、交易条件、影响地价的区域和土地价格作为房产属性信息。
在一些实施例的一些可选的实现方式中,所述从所述客户数据库中获取目标客户的客户属性信息,包括获取客户年龄段、客户资产等级、客户收入级别和客户教育程度类别作为客户属性信息。
在一些实施例的一些可选的实现方式中,所述通过市场比较法对待售房产的房产属性信息进行分析,根据分析结果对待售房产进行分层分类处理,得到待匹配房产清单,包括:
确定比对基准:选取三个以上与待售房产的房产属性信息最接近,属同一供需圈内相邻地区或类似地区的已交易房产作为比对基准;
建立价格比对基础:根据选取的已交易房产,建立价格比对基础;
交易情况修正:将由于特殊因素造成的已交易房产的价格偏差予以排除,将其成交价格修正为正常的市场价格;
区域因素修正:将区域因素中的各因子对地价的影响程度求和,得出区域因素条件指数,再按公式计算;区域内的各因子包括商业繁华程度、交通条件、公用设施及基础设施水平、区域环境条件、城镇规划、土地使用限制、产业集聚程度;
计算比准价格:根据交易情况修正和区域因素修正后求取出待售房产的比准价格;
构建房产清单:根据比准价格构建基于按照价格和面积对应排列的待匹配房产清单。
在一些实施例的一些可选的实现方式中,在构建所述构建客户分层模型之前,还包括构建算法输入,构建算法输入的步骤为:
建立无向图
G=(V,E)
其中,V={1,2,...,n}表示节点集,E={(i,j)|若节点i和节点j有连边}表示边集;
利用NLP技术将目标客户总数、目标客户的客户属性信息、预设客户分层层级总数和各个客户层级进行文本数据特征向量化,得到数字格式的数据集,
将所述数据集作为无向图的节点集V上的数据集进行表示:
Data={(x1,y1),(x2,y2),...,(xn,yn)}
其中,n=|V|-表示无向图上的节点总数;
xi=(xi1,xi2,...,xip)T∈Rp表示无向图第i个节点上的特征变量的观测;
yi=(yi1,yi2,...yic)T∈Rc表示无向图第i个节点上的层级,用one-hot向量表示:如果节点i属于第j类,yij=1,否则yij=0;
i表示目标客户总数,j表示目标客户的各个客户层级,p表示特征向量维度数,c是分层任务中考虑的预设客户分层层级总数,yL表示无向图有层级观测值的节点构成的集合,yU表示无层级观测值的节点构成的集合;
在一些实施例的一些可选的实现方式中,所述构建客户分层模型,将目标客户总数、客户属性信息、预设客户分层层级总数和各个客户层级作为分层数据集输入到所述客户分层模型中进行分层分类处理,包括:
步骤1:构造无向图上归一化的拉普拉斯矩阵:
L=I-D-1/2AD-1/2
其中,I表示单位矩阵,D表示无向图的度矩阵,A表示无向图的邻接矩阵,其第ij个元素定义为:若(i,j)∈E,则Aij=1,若则Aij=0;
步骤2:对L进行谱分解:
其中,λ1≤λ2≤...≤λn表示L的n个特征根;
Λ=diag(λ1,λ2,...,λn)表示L的n个特征根为对角元的对角矩阵;
u1,u2,…,un表示对应的n个特征向量;
U=(u1,u2,…,un)表示对应的n个特征向量组成的矩阵;
步骤3:构建带有图卷积运算的客户分层模型:
其中,xi=(xi1,xi2,...xip)T∈Rp表示第i个节点上的特征变量的观测;
表示第i个节点上的输出向量,用于预测该节点的层级;softmax表示向量的softmax变换;pK(λi/2)表示K阶的伯恩斯坦多项式;θk表示待估计的卷积核参数,f表示带有q=64个隐藏单元的隐藏层的多层感知器。
在一些实施例的一些可选的实现方式中,还包括,根据无向图的节点集V上的数据集和所述客户分层模型,构造分层预测的损失函数:
其中,由所述客户分层模型进行计算。
在一些实施例的一些可选的实现方式中,还包括对所述客户分层模型进行优化,优化步骤包括:
根据所述损失函数,使用优化算法训练客户分层模型中卷积核参数θk和线性特征变换层的参数W1和W2;
采用深度学习框架进行训练,得到参数估计和线性特征变换层的参数矩阵估计/>和/>
根据参数估计和参数矩阵估计得到最终的客户分层模型:
其中,
在一些实施例的一些可选的实现方式中,所述得到目标客户分层表单,包括:
基于最终的客户分层模型的输出结果,按照客户属性信息将所有目标客户分层分类到对应的各个层级之中,形成所述目标客户分层表单。
在一些实施例的一些可选的实现方式中,所述采用对应分析法对所述待匹配房产清单的待售房产和所述目标客户分层表单中的目标客户进行配对,得到待售房产与目标客户之间的匹配对,包括:采用的对应分析法为双向指示种分析方法、典范对应分析方法或质性数据分析方法。
本发明的有益效果:
通过开发商的内部数据源和云数据源中提取房产属性信息与客户属性信息,通过房产属性信息形成待匹配房产清单,根据客户属性信息进行客户分层分类,把房源和客户意向进行双向匹配,形成房产-客户的匹配对,进行主动、智能、有预测性地房源与客户需求的匹配,并在此基础上,形成对不同楼盘项目具有定制化的和针对性的购房人群推荐,来精准的为地产项目和客户提供服务。
附图说明
图1为本发明的总体流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制;相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
一种基于大数据的客户分层匹配方法,包括以下步骤S100-S500:
S100:部署大数据存储系统,所述大数据存储系统包括房产数据库和客户数据库,从所述房产数据库中获取待售房产的房产属性信息,从所述客户数据库中获取目标客户总数以及对应的客户属性信息;
其中,本实施例采用基于大数据存储HBase数据模型,HBase是可以提供实时计算的分布式数据库,数据被保存在HDFS分布式文件系统上,由HDFS保证期高容错性,但是在生产环境中,HBase上的数据是以StoreFile(HFile)二进制流的形式存储在HDFS上block块儿中;但是HDFS并不知道的hbase存的是什么,它只把存储文件是为二进制文件,也就是说,hbase的存储数据对于HDFS文件系统是透明的;
在一些实施例的一些可选的实现方式中,所述从所述房产数据库中获取待售房产的房产属性信息,包括获取待售房产位置、面积、用途、使用年期、交易条件、影响地价的区域和土地价格作为房产属性信息。
在一些实施例的一些可选的实现方式中,所述从所述客户数据库中获取目标客户的客户属性信息,包括获取客户年龄段、客户资产等级、客户收入级别和客户教育程度类别作为客户属性信息。
S200:通过市场比较法对待售房产的房产属性信息进行分析,根据分析结果对待售房产进行分层分类处理,得到待匹配房产清单;
在一些实施例的一些可选的实现方式中,所述通过市场比较法对待售房产的房产属性信息进行分析,根据分析结果对待售房产进行分层分类处理,得到待匹配房产清单,包括:
确定比对基准:选取三个以上与待售房产的房产属性信息最接近,属同一供需圈内相邻地区或类似地区的已交易房产作为比对基准;
建立价格比对基础:根据选取的已交易房产,建立价格比对基础;
交易情况修正:将由于特殊因素造成的已交易房产的价格偏差予以排除,将其成交价格修正为正常的市场价格;
将由于特殊因素造成的价格偏差予以排除,将其成交价格修正为正常的市场价格;房产交易模式日趋扩大化发展,业务模式也更加灵活多变,原始数据收集与处理模式多种多样;交易情况修正是排除交易行为中的一些特殊因素所造成的价格偏差,将其成交价格修正为正常市场价格;
区域因素修正:将区域因素中的各因子对地价的影响程度求和,得出区域因素条件指数,再按公式计算;区域内的各因子包括商业繁华程度、交通条件、公用设施及基础设施水平、区域环境条件、城镇规划、土地使用限制、产业集聚程度;
将区域因素中的各因子对地价的影响程度求和,得出区域因素条件指数,再按公式计算;区域内的各因子包括商业繁华程度、交通条件、公用设施及基础设施水平、区域环境条件、城镇规划、土地使用限制、产业集聚程度;不同用途的待售房产,影响其价格的区域因子不同,区域因素修正的具体因子应根据待售房产的用途确定;
计算比准价格:根据交易情况修正和区域因素修正后求取出待售房产的比准价格;
计算过程包括以下步骤:
首先求取土地价格;
以待售房产与其相应范围内土地所产生的总的净收益中,减掉归属于土地的净收益,求得待售房产的净收益;
将次净收益以待售房产的还原率还原,就可求取待售房产的比准价格。
构建房产清单:根据比准价格构建基于按照价格和面积对应排列的待匹配房产清单。
本实施例以60-200平方面积,价格为40-200万的房产为建表基准,构建待匹配房产清单,将待售房产分为15类,如下表1所示:
40-70万 | 70-100万 | 100-130万 | 130-160万 | 160万以上 | |
60平方以下 | 1 | 3 | 5 | ||
60-100平方 | 2 | 4 | 6 | 9 | 12 |
100-140平方 | 7 | 10 | 13 | ||
140-180平方 | 11 | 14 | |||
180平方以上 | 15 |
表1
S300:构建客户分层模型,将目标客户总数、客户属性信息、预设客户分层层级总数和各个客户层级作为分层数据集输入到所述客户分层模型中进行分层分类处理,得到目标客户分层表单;
在一些实施例的一些可选的实现方式中,在构建所述构建客户分层模型之前,还包括构建算法输入,构建算法输入的步骤为:
建立无向图
G=(V,E)
其中,V={1,2,...,n}表示节点集,E={(i,j)|若节点i和节点j有连边}表示边集;
利用NLP技术将目标客户总数、目标客户的客户属性信息、预设客户分层层级总数和各个客户层级进行文本数据特征向量化,得到数字格式的数据集,将所述数据集作为无向图的节点集V上的数据集进行表示:
Data={(x1,y1),(x2,y1),...,(xn,yn)}
其中,n=|V|-表示无向图上的节点总数;
xi=(xi1,xi2,...xip)T∈Rp表示无向图第i个节点上的特征变量的观测;
yi=(yi1,yi2,...yic)T∈Rc表示无向图第i个节点上的层级,用one-hot向量表示:如果节点i属于第j类,yij=1,否则yij=0;
i表示目标客户总数,j表示目标客户的各个客户层级(本实施例中,将预设的客户层级分为工薪级、中产级和富裕级,所以j的取值为1-3),p表示特征向量维度数(即目标客户的客户属性信息的数量,包括客户年龄段、客户资产等级、客户收入级别和客户教育程度类别,即p的取值为6),c是分层任务中考虑的预设客户分层层级总数(因为本实施例中预设的客户层级为3级,所以层级总数为3,c的取值为3),yL表示无向图有层级观测值的节点构成的集合,yU表示无层级观测值的节点构成的集合;
在一些实施例的一些可选的实现方式中,所述构建客户分层模型,将目标客户总数、客户属性信息、预设客户分层层级总数和各个客户层级作为分层数据集输入到所述客户分层模型中进行分层分类处理,包括:
步骤1:构造无向图上归一化的拉普拉斯矩阵:
L=I-D-1/2AD-1/2
其中,I表示单位矩阵,D表示无向图的度矩阵,其是一个对角矩阵,第i个对角元的值等于和节点i连边的个数,A表示无向图的邻接矩阵,其第ij个元素定义为:若(i,i)∈E,则Aij=1,若则Aij=0;
步骤2:对L进行谱分解:
其中,λ1≤λ2≤…≤λn表示L的n个特征根;
Λ=diag(λ1,λ2,...,λn)表示L的n个特征根为对角元的对角矩阵;
u1,u2,…,un表示对应的n个特征向量;
U=(u1,u2,...,un)表示对应的n个特征向量组成的矩阵;
步骤3:构建带有图卷积运算的客户分层模型:
其中,xi=(xi1,xi2,...,xip)T∈Rp表示第i个节点上的特征变量的观测;
表示第i个节点上的输出向量,用于预测该节点的层级;softmax表示向量的softmax变换;pK(λi/2)表示K阶的伯恩斯坦多项式;θk表示待估计的卷积核参数,f表示带有q=64个隐藏单元的隐藏层的多层感知器。
其中,向量的softmax变换为:
f的定义如下:
W1是p×q的从输入层到隐藏层的特征变换未知参数矩阵;
W2是qxc的隐藏层到输出层的特征变换未知参数矩阵;
ReLu(b1,b2,...,bq)=(max{0,b1},max{0,b2},...,max{0,bq})
表示非线性激活函数;
在一些实施例的一些可选的实现方式中,还包括,根据无向图的节点集V上的数据集和所述客户分层模型,构造分层预测的损失函数:
其中,由所述客户分层模型进行计算。
在一些实施例的一些可选的实现方式中,还包括对所述客户分层模型进行优化,优化步骤包括:
根据所述损失函数,使用优化算法(本实施例采用Adam优化算法)训练客户分层模型中卷积核参数θk和线性特征变换层的参数W1和W2;
采用深度学习框架(本实施例采用深度学习框架PyTorch)进行训练,得到参数估计和线性特征变换层的参数矩阵估计/>和/>
根据参数估计和参数矩阵估计得到最终的客户分层模型:
其中,
在一些实施例的一些可选的实现方式中,所述得到目标客户分层表单,包括:
基于最终的客户分层模型的输出结果,按照客户属性信息将所有目标客户分层分类到对应的各个层级之中,形成所述目标客户分层表单。
由于在本实施例中,对待售房产匹配度影响最高的维度为:客户资产等级和客户收入级别;对待售房产匹配度影响中等的维度为:客户年龄段;对待售房产匹配度影响最低的维度为:客户教育程度类别,所以,主要以客户资产等级、客户收入级别和客户年龄段为主要影响维度形成目标客户分层表单,将目标客户分为15类,如表2所示:
工薪级 | 中产级 | 富裕级 | |
25岁以下 | 32% | 21% | 7% |
25-35岁 | 27% | 36% | 8% |
35-45岁 | 15% | 29% | 10% |
45-55岁 | 18% | 17% | 12% |
55-65岁 | 33% | 24% | 12% |
表2
其中,表示的是各个类别的客户与目标客户总的占比。
S400:采用对应分析法对所述待匹配房产清单的待售房产和所述目标客户分层表单中的目标客户进行配对,得到待售房产与目标客户之间的匹配对;
在一些实施例的一些可选的实现方式中,所述采用对应分析法对所述待匹配房产清单的待售房产和所述目标客户分层表单中的目标客户进行配对,得到待售房产与目标客户之间的匹配对,包括:采用的对应分析法为双向指示种分析方法、典范对应分析方法或质性数据分析方法。
其中,对应分析(Correspondence analysis)也称关联分析或R-Q型因子分析,是近年新发展起来的一种多元相依变量统计分析技术,通过分析由定性变量构成的交互汇总表来揭示变量间的联系(即可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系)。对应分析的基本思想是将一个表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来,其最大特点是能把众多的样品和众多的变量同时作到同一张图解上,将样品的大类及其属性在图上直观而又明了地表示出来,具有直观性;另外,它还省去了因子选择和因子轴旋转等复杂的数学运算及中间过程,可以从因子载荷图上对样品进行直观的分类,而且能够指示分类的主要参数(主因子)以及分类的依据,是一种直观、简单、方便的多元统计方法。由于对应分析是一种视觉化的数据分析方法,它能够将几组看不出任何联系的数据,通过视觉上可以接受的定位图展现出来,因而可主要应用在市场细分、产品定位、地质研究以及计算机工程等领域中,本实施例中将待匹配房产清单和所述目标客户分层表单作为样表,采用对应分析进行待售房产与目标客户之间配对。进一步的,进行对应分析的方法可以但不限于为现有的双向指示种分析方法、典范对应分析方法或质性数据分析方法等。
S500:根据所述匹配对向目标客户推荐对应的待售房产。
通过房产估价和目标客户分层,然后基于对应分析得到的待售房产与人之间的匹配关系,有效地对难销售、价格偏高、处于郊区或地段不好的待售房产匹配合适的目标客户,降低项目销售难度。
以上仅是本发明优选的实施方式,需指出的是,对于本领域技术人员在不脱离本技术方案的前提下,作出的若干变形和改进的技术方案应同样视为落入本权利要求书要求保护的范围。
Claims (10)
1.一种基于大数据的客户分层匹配方法,其特征在于:包括以下步骤:
部署大数据存储系统,所述大数据存储系统包括房产数据库和客户数据库,从所述房产数据库中获取待售房产的房产属性信息,从所述客户数据库中获取目标客户总数以及对应的客户属性信息;
通过市场比较法对待售房产的房产属性信息进行分析,根据分析结果对待售房产进行分层分类处理,得到待匹配房产清单;
构建客户分层模型,将目标客户总数、客户属性信息、预设客户分层层级总数和各个客户层级作为分层数据集输入到所述客户分层模型中进行分层分类处理,得到目标客户分层表单;
采用对应分析法对所述待匹配房产清单的待售房产和所述目标客户分层表单中的目标客户进行配对,得到待售房产与目标客户之间的匹配对;
根据所述匹配对向目标客户推荐对应的待售房产。
2.根据权利要求1所述的方法,其特征在于:所述从所述房产数据库中获取待售房产的房产属性信息,包括获取待售房产位置、面积、用途、使用年期、交易条件、影响地价的区域和土地价格作为房产属性信息。
3.根据权利要求2所述的方法,其特征在于:所述从所述客户数据库中获取目标客户的客户属性信息,包括获取客户年龄段、客户资产等级、客户收入级别和客户教育程度类别作为客户属性信息。
4.根据权利要求3所述的方法,其特征在于:所述通过市场比较法对待售房产的房产属性信息进行分析,根据分析结果对待售房产进行分层分类处理,得到待匹配房产清单,包括:
确定比对基准:选取三个以上与待售房产的房产属性信息最接近,属同一供需圈内相邻地区或类似地区的已交易房产作为比对基准;
建立价格比对基础:根据选取的已交易房产,建立价格比对基础;
交易情况修正:将由于特殊因素造成的已交易房产的价格偏差予以排除,将其成交价格修正为正常的市场价格;
区域因素修正:将区域因素中的各因子对地价的影响程度求和,得出区域因素条件指数,再按公式计算;区域内的各因子包括商业繁华程度、交通条件、公用设施及基础设施水平、区域环境条件、城镇规划、土地使用限制、产业集聚程度;
计算比准价格:根据交易情况修正和区域因素修正后求取出待售房产的比准价格;
构建房产清单:根据比准价格构建基于按照价格和面积对应排列的待匹配房产清单。
5.根据权利要求4所述的方法,其特征在于:在构建所述构建客户分层模型之前,还包括构建算法输入,构建算法输入的步骤为:
建立无向图
G=(V,E)
其中,V={1,2,...,n}表示节点集,E={(i,j)|若节点i和节点j有连边}表示边集;
利用NLP技术将目标客户总数、目标客户的客户属性信息、预设客户分层层级总数和各个客户层级进行文本数据特征向量化,得到数字格式的数据集,
将所述数据集作为无向图的节点集V上的数据集进行表示:
Data={(x1,y1),(x2,y2),...,(xn,yn)}
其中,n=|V|-表示无向图上的节点总数;
xi=(xi1,xi2,...,xip)T∈Rp表示无向图第i个节点上的特征变量的观测;
yi=(yi1,yi2,...,yic)T∈Rc表示无向图第i个节点上的层级,用one-hot向量表示:如果节点i属于第j类,yij=1,否则yij=0;
i表示目标客户总数,j表示目标客户的各个客户层级,p表示特征向量维度数,c是分层任务中考虑的预设客户分层层级总数,yL表示无向图有层级观测值的节点构成的集合,yU表示无层级观测值的节点构成的集合。
6.根据权利要求5所述的方法,其特征在于:所述构建客户分层模型,将目标客户总数、客户属性信息、预设客户分层层级总数和各个客户层级作为分层数据集输入到所述客户分层模型中进行分层分类处理,包括:
步骤1:构造无向图上归一化的拉普拉斯矩阵:
L=I-D-1/2AD-1/2
其中,I表示单位矩阵,D表示无向图的度矩阵,A表示无向图的邻接矩阵,其第ij个元素定义为:若(i,j)∈E,则Aij=1,若则Aij=0;
步骤2:对L进行谱分解:
其中,λ1≤λ2≤…≤λn表示L的n个特征根;
Λ=diag(λ1,λ2,...,λn)表示L的n个特征根为对角元的对角矩阵;
u1,u2,…,un表示对应的n个特征向量;
U=(u1,u2,…,un)表示对应的n个特征向量组成的矩阵;
步骤3:构建带有图卷积运算的客户分层模型:
其中,xi=(xi1,xi2,...,xip)T∈Rp表示第i个节点上的特征变量的观测;
表示第i个节点上的输出向量,用于预测该节点的层级;softmax表示向量的softmax变换;pK(λi/2)表示K阶的伯恩斯坦多项式;θk表示待估计的卷积核参数,f表示带有q=64个隐藏单元的隐藏层的多层感知器。
7.根据权利要求6所述的方法,其特征在于:还包括,根据无向图的节点集V上的数据集和所述客户分层模型,构造分层预测的损失函数:
其中,由所述客户分层模型进行计算。
8.根据权利要求7所述的方法,其特征在于:还包括对所述客户分层模型进行优化,优化步骤包括:
根据所述损失函数,使用优化算法训练客户分层模型中卷积核参数θk和线性特征变换层的参数W1和W2;
采用深度学习框架进行训练,得到参数估计和线性特征变换层的参数矩阵估计/>和/>
根据参数估计和参数矩阵估计得到最终的客户分层模型:
其中,
9.根据权利要求8所述的方法,其特征在于:所述得到目标客户分层表单,包括:
基于最终的客户分层模型的输出结果,按照客户属性信息将所有目标客户分层分类到对应的各个层级之中,形成所述目标客户分层表单。
10.根据权利要求9所述的方法,其特征在于:所述采用对应分析法对所述待匹配房产清单的待售房产和所述目标客户分层表单中的目标客户进行配对,得到待售房产与目标客户之间的匹配对,包括:采用的对应分析法为双向指示种分析方法、典范对应分析方法或质性数据分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310508128.8A CN116629904A (zh) | 2023-05-08 | 2023-05-08 | 一种基于大数据的客户分层匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310508128.8A CN116629904A (zh) | 2023-05-08 | 2023-05-08 | 一种基于大数据的客户分层匹配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116629904A true CN116629904A (zh) | 2023-08-22 |
Family
ID=87616285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310508128.8A Pending CN116629904A (zh) | 2023-05-08 | 2023-05-08 | 一种基于大数据的客户分层匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116629904A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117391583A (zh) * | 2023-10-23 | 2024-01-12 | 南京鑫智链科技信息有限公司 | 采购数据管理方法及平台 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109242523A (zh) * | 2018-07-06 | 2019-01-18 | 成都正合云智数据科技有限公司 | 一种专用于房产销售行业的购房人群画像方法及其实现装置 |
CN111260443A (zh) * | 2020-01-17 | 2020-06-09 | 青梧桐有限责任公司 | 基于房主需求和租户需求的派单优化方法及系统 |
CN111310030A (zh) * | 2020-01-20 | 2020-06-19 | 昊居科技有限公司 | 一种房屋推送方法 |
CN112837135A (zh) * | 2021-03-10 | 2021-05-25 | 于志强 | 一种住房租赁系统 |
CN112926701A (zh) * | 2021-05-10 | 2021-06-08 | 北京人人云图信息技术有限公司 | 一种基于gcn半监督的航空乘客的分类方法和系统及其设备 |
US20220114603A1 (en) * | 2020-10-09 | 2022-04-14 | Jpmorgan Chase Bank, N.A. | Systems and methods for tracking data shared with third parties using artificial intelligence-machine learning |
CN115878902A (zh) * | 2023-02-16 | 2023-03-31 | 北京同方凌讯科技有限公司 | 基于神经网络模型的融媒体平台自动信息关键主题提取系统 |
-
2023
- 2023-05-08 CN CN202310508128.8A patent/CN116629904A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109242523A (zh) * | 2018-07-06 | 2019-01-18 | 成都正合云智数据科技有限公司 | 一种专用于房产销售行业的购房人群画像方法及其实现装置 |
CN111260443A (zh) * | 2020-01-17 | 2020-06-09 | 青梧桐有限责任公司 | 基于房主需求和租户需求的派单优化方法及系统 |
CN111310030A (zh) * | 2020-01-20 | 2020-06-19 | 昊居科技有限公司 | 一种房屋推送方法 |
US20220114603A1 (en) * | 2020-10-09 | 2022-04-14 | Jpmorgan Chase Bank, N.A. | Systems and methods for tracking data shared with third parties using artificial intelligence-machine learning |
CN112837135A (zh) * | 2021-03-10 | 2021-05-25 | 于志强 | 一种住房租赁系统 |
CN112926701A (zh) * | 2021-05-10 | 2021-06-08 | 北京人人云图信息技术有限公司 | 一种基于gcn半监督的航空乘客的分类方法和系统及其设备 |
CN115878902A (zh) * | 2023-02-16 | 2023-03-31 | 北京同方凌讯科技有限公司 | 基于神经网络模型的融媒体平台自动信息关键主题提取系统 |
Non-Patent Citations (1)
Title |
---|
王楠: "自然语言理解与行业知识图谱 概念、方法与工程落地", 北京:机械工业出版社, pages: 127 - 128 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117391583A (zh) * | 2023-10-23 | 2024-01-12 | 南京鑫智链科技信息有限公司 | 采购数据管理方法及平台 |
CN117391583B (zh) * | 2023-10-23 | 2024-04-05 | 南京鑫智链科技信息有限公司 | 采购数据管理方法及平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Caruso et al. | Cluster Analysis for mixed data: An application to credit risk evaluation | |
Maghsoodi et al. | CLUS-MCDA: A novel framework based on cluster analysis and multiple criteria decision theory in a supplier selection problem | |
Ic et al. | Development of a quick credibility scoring decision support system using fuzzy TOPSIS | |
Chuang | Application of hybrid case-based reasoning for enhanced performance in bankruptcy prediction | |
Kizielewicz et al. | Comparison of Fuzzy TOPSIS, Fuzzy VIKOR, Fuzzy WASPAS and Fuzzy MMOORA methods in the housing selection problem | |
Chatterjee et al. | Supplier selection in Telecom supply chain management: a Fuzzy-Rasch based COPRAS-G method | |
Chen et al. | An integrated method for supplier selection from the perspective of risk aversion | |
US20090276391A1 (en) | Creation of neuro-fuzzy expert system from online analytical processing (olap) tools | |
Bi et al. | A deep neural networks based recommendation algorithm using user and item basic data | |
Chen et al. | Supply chain finance platform evaluation based on acceptability analysis | |
Zhang et al. | Improvement of collaborative filtering recommendation algorithm based on intuitionistic fuzzy reasoning under missing data | |
CN116629904A (zh) | 一种基于大数据的客户分层匹配方法 | |
Zhang et al. | A novel hybrid correlation measure for probabilistic linguistic term sets and crisp numbers and its application in customer relationship management | |
Agustyaningrum et al. | Online shopper intention analysis using conventional machine learning and deep neural network classification algorithm | |
Sarihi et al. | Development and comparative analysis of the fuzzy inference system-based construction labor productivity models | |
Merigo et al. | Aggregation operators in economic growth analysis and entrepreneurial group decision-making | |
Haga et al. | Initial stage clustering when estimating accounting quality measures with self-organizing maps | |
CN117057852B (zh) | 一种基于人工智能技术的互联网营销系统及方法 | |
CN113240209A (zh) | 一种基于图神经网络的城市产业集群发展路径预测方法 | |
Arevalillo | Ensemble learning from model based trees with application to differential price sensitivity assessment | |
Naji et al. | Holistic multi-criteria performance measurement system for the maintenance function | |
Supriya et al. | House Price Prediction System using Machine Learning Algorithms and Visualization | |
Guikema et al. | Sensitivity analysis for multi-attribute project selection problems | |
Cheng et al. | A K-means Algorithm for Construction of Enterprise Innovation System Based on Data Mining Technology | |
Suryani et al. | Prediction Of Election Participant With Malang City Demographic Data Using The K-Nn Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |