CN110992109B - 基于关联规则的房地产客户分析方法、装置及存储介质 - Google Patents
基于关联规则的房地产客户分析方法、装置及存储介质 Download PDFInfo
- Publication number
- CN110992109B CN110992109B CN201911291493.8A CN201911291493A CN110992109B CN 110992109 B CN110992109 B CN 110992109B CN 201911291493 A CN201911291493 A CN 201911291493A CN 110992109 B CN110992109 B CN 110992109B
- Authority
- CN
- China
- Prior art keywords
- data
- customer
- item set
- real estate
- behavior data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000013507 mapping Methods 0.000 claims abstract description 7
- 230000006399 behavior Effects 0.000 claims description 68
- 230000006854 communication Effects 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 10
- 238000007418 data mining Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000005065 mining Methods 0.000 claims description 5
- 238000011161 development Methods 0.000 abstract description 3
- 230000002349 favourable effect Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2246—Trees, e.g. B+trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于关联规则的房地产客户分析方法、装置及存储介质,该方法通过采集客户行为数据,形成原始数据池;按照预先定义的客户行为数据N元组,将原始数据池中的客户行为数据,以客户为单位,映射填入到该客户对应的N元组中,对不存在行为数据的组别项设置为空值,对不满足所有组别属性的客户行为数据丢弃;N元组包括性别、年龄、工作、家庭成员、资产、来访频率、居住地;基于已映射填入客户数据的各N元组,构建字典顺序前缀树,输出频繁项集;利用关联规则对频繁项集进行分析,得到客户购买意向;可形成行业客户意向的判断标准,有利于指导项目的销售工作开展。
Description
技术领域
本发明涉及房地产数据分析领域,尤其涉及一种基于关联规则的房地产客户分析方法、装置及存储介质。
背景技术
目前地产公司在项目销售过程中会接待大量的潜在客户,在客户的接待过程中进行客户的购买意向判定和预测,完全根据销售人员自我进行判断进行。而销售人员依赖传统的接待方式,和客户的接触和信息的了解往往是非常局限和被动的。不同的销售人员因为自身能力和经验等原因,无法形成有效的判断标准,因此目前如何统一进行客户意向的判断,如何形成统一的判定标准是面临的主要问题。
发明内容
本发明提供的基于关联规则的房地产客户分析方法、装置及存储介质,主要解决的技术问题是:形成客户意向的判断标准。
为解决上述技术问题,本发明提供一种基于关联规则的房地产客户分析方法方法,包括:
采集客户行为数据,形成原始数据池;
按照预先定义的客户行为数据N元组,将所述原始数据池中的客户行为数据,以客户为单位,映射填入到该客户对应的所述N元组中,对不存在行为数据的组别项设置为空值,对不满足所有组别属性的客户行为数据丢弃;所述N元组包括性别、年龄、工作、家庭成员、资产、来访频率、居住地;
基于已映射填入客户数据的各所述N元组,构建字典顺序前缀树,输出频繁项集;
利用关联规则对所述频繁项集进行分析,得到客户购买意向。
可选的,所述采集客户行为数据包括:按照设定时间窗口长度,采集客户行为数据。
可选的,所述输出频繁项集包括:
采用数据挖掘算法对所述字典顺序前缀树各数据项集进行扫描,计算所述数据项集的权值总和,判断所述权值总和与设定最小支持率阈值的大小关系,根据所述大小关系判定所述数据项集是否属于频繁项集,如是,输出该频繁项集。
可选的,所述根据所述大小关系判定所述数据项集是否属于频繁项集,包括:
在所述权值总和大于等于所述设定最小支持率阈值时,判定所述数据项集属于频繁项集;相反,则判定所述数据项集不属于频繁项集。
可选的,还包括:
若判定所述数据项集不属于频繁项集,则不再对所述数据项集进行子孙节点的扩展。
可选的,所述计算所述数据项集的权值总和包括:
获取与所述数据项集对应的数据频次、权重标准值,计算所述数据频次、与所述权重标准值之间的乘积,作为所述数据项集的权值总和。
可选的,所述权重标准值是预先按照行业经验设定的。
本发明还提供一种装置,包括处理器、存储器及通信总线;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的一个或者多个程序,以实现如上任一项所述的基于关联规则的房地产客户分析方法的步骤。
本发明还提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一项所述的基于关联规则的房地产客户分析方法的步骤。
本发明的有益效果是:
根据本发明提供的基于关联规则的房地产客户分析方法、装置及存储介质,该方法通过采集客户行为数据,形成原始数据池;按照预先定义的客户行为数据N元组,将原始数据池中的客户行为数据,以客户为单位,映射填入到该客户对应的N元组中,对不存在行为数据的组别项设置为空值,对不满足所有组别属性的客户行为数据丢弃;N元组包括性别、年龄、工作、家庭成员、资产、来访频率、居住地;基于已映射填入客户数据的各N元组,构建字典顺序前缀树,输出频繁项集;利用关联规则对频繁项集进行分析,得到客户购买意向;可形成行业客户意向的判断标准,有利于指导项目的销售工作开展。
附图说明
图1为本发明实施例一的基于关联规则的房地产客户分析方法流程示意图;
图2为本发明实施例一的字典顺序前缀树结构示意图;
图3为本发明实施例一的字典顺序前缀树节点合并示意图;
图4为本发明实施例二的装置结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例一:
房地产客户作为潜在购房需求的用户,往往会对购买行为做多维度的考察和咨询之后,形成最终的购买行为,本实施例在对客户的行为进行分析的过程中,通过其行为之间关联关系,形成最终的分析模型。
请参见图1,图1为本实施例一的基于关联规则的房地产客户分析方法流程示意图;该方法主要包括如下步骤:
S101、采集客户行为数据,形成原始数据池。
本实施例中,客户行为数据主要包括客户对项目的访问数据,包括线上线上访问数据。客户的行为数据符合流数据的特点,数据流可被视为一个随时间延续而无限增长的动态数据集合。在地产销售业务场景中,流数据是时序过程中,客户通过在线上线下发生的项目访问行为数据,由于客户在不同时间维度下,产生的行为数据,所反映客户的意向程度并不相同,例如三天内的看房数据,相比于3个月以前的看房数据,更能说明客户购买意向更强。即,随着时间的流逝,客户的购买欲望可能会持续衰减,流数据的处理时间不能太长,以免随着时间的累计,各个数据项的权重偏移甚至失效;除此之外,流数据不能永远汇聚进行全集计算,因为不断膨胀的计算数据集导致效率下降。
为此,本实施例按照设定时间窗口长度,采集客户行为数据,以获取到最近时间段的客户行为数据。对于在设定时间窗口长度外的客户行为数据,由于不具有较高的使用价值,不能准确反映客户意向情况,故不作采集处理;同时也避免数据量大带来的计算效率下降、对系统性能要求高的问题。
本实施例中,为了丰富客户行为数据,提供了多种产品手段进行信息收集。
悦家云电子楼书,丰富的房源信息让购房者在手机端随时了解楼盘详细信息,并对楼盘进行横向对比;集合了空中看盘、720度看房、配套细览、房贷计算器等功能。并在每个功能下都设置了锚点,锚点是在产品的各个关键位置设置的捕获客户行为的触发机制,在客户点击、停留、使用设置了锚点的产品功能点时,系统会捕获客户行为,形成流水日志,可用于上述获取客户行为数据。目前锚点数量有一百多个。客户在使用这些功能的时候,行为轨迹会被完整记录,帮助我们能深度了解客户需求,做到精准服务。
悦家云销售,通过职业顾问进行客户接待,将接待过程中和客户沟通了解到的客户信息,录入到客档系统中,形成丰富的客户行为数据维度。
悦家C端客户服务,通过非房地产的产品组合,将客户在非房地产领域的兴趣度行为进行充分收集,提供多维度的客户信息数据,便于建立丰富的客户画像信息。
通过多维度的信息采集,最终形成客户行为数据的原始数据池。
S102、按照预先定义的客户行为数据N元组,将原始数据池中的客户行为数据,以客户为单位,映射填入到该客户对应的N元组中,对不存在行为数据的组别项设置为空值,对不满足所有组别属性的客户行为数据丢弃;N元组包括性别、年龄、工作、家庭成员、资产、来访频率、居住地。
用户行为的定义是关联规则挖掘的重要基础,采用线上线下相结合的方法进行用户的行为定义,保证用户行为定位的合理性。本实施例中,客户数据行为定义为N元组CDate={Sex,Age,Job,Family,Property,Rate,Location,...},其属性分别代表客户性别、年龄、工作、家庭成员、资产、来访频率、居住地等属性。作为在购房过程中销售人员和客户沟通过程的数据集合,根据所对应场景的不同特点,线上产品在线即时沟通咨询,线下和销售人员的沟通交流等,各类异构数据混合在一起,共同构成了客户行为数据的集合。
将原始数据池中的客户行为数据,以客户为单位,映射填入到该客户对应的N元组中,对不存在行为数据的组别项设置为空值,对不满足所有组别属性的客户行为数据丢弃;通过对用户数据的采集和抽象梳理,将其压缩到一棵字典顺序前缀树。
字典顺序前缀树是一种特殊的前缀树,由频繁项头表和项前缀树构成。所谓前缀树,是一种存储候选项集的数据结构,树的分支用项名标识,树的节点存储后缀项,路径表示项集。
S103、基于已映射填入客户数据的各N元组,构建字典顺序前缀树,输出频繁项集。
当构造字典顺序前缀树结构时,还需要对每个节点的权值进行更新,权值的计算方式为每个节点按照行业经验定义权重标准值,通过节点数据频次*权重标准值,得出权值。权重标准根据项目情况动态调整,假设权重值均设置为1,数据频次即每次行为数据中该数据项的次数,比如数据集A包含数据项d1,d2,即可记为数据项d1,d2数据频次为1,权重为1,以此类推。
利用数据符合正态分布的特性,进行树形结构的排序,在进行排序的同时,计算各个节点的权重值,计算方式利用数据频次*权重标准值计算所得;例如,现有数据项集合I={A,B,C,D},其中,A、B、C、D分别代表四种不同的行为数据属性,则构建出一棵构造字典顺序前缀树结构如图2所示。
根节点R为数的父节点,树的k层节点到根节点的路径代表k项集,同一个路径上的节点集合即对应他们之间的关联关系。
采用数据挖掘算法对字典顺序前缀树各数据项集进行扫描,计算数据项集的权值总和,判断权值总和与设定最小支持率阈值的大小关系,根据大小关系判定数据项集是否属于频繁项集,如是,输出该频繁项集。
在权值总和大于等于设定最小支持率阈值时,判定数据项集属于频繁项集;相反,则判定数据项集不属于频繁项集。若判定数据项集不属于频繁项集,则不再对数据项集进行子孙节点的扩展。从而节省遍历时间,提高算法搜索效率。
其中,计算所述数据项集的权值总和包括:
获取与数据项集对应的数据频次、权重标准值,计算数据频次与权重标准值的乘积,作为数据项集的权值总和。
其中,权重标准值是预先按照行业经验设定的。
当新数据集到来时,将新到的数据集进行数据项处理,满足系统数据项的提取。按照字典顺序插入到树结构中,并对插入的数据项集影响到的节点权重值进行更新计算,计算方式利用数据频次*权重标准值计算所得;最后采用数据挖掘算法对行为数据的频繁项集进行挖掘。
数据挖掘算法的过程包括:
a)设定所设计的最小节点支持率阈值为θ,对行为数据树结构进行扫描,对每种数据项频繁度进行检测。当权重小于θ代表该数据项本身数据样本过小,不推荐继续进行计算,放弃该数据项。同时当该树结构中,超过一半的节点不满足最小支持率阈值θ时,则表示该数据集样本量过低,不推荐继续分析。
b)对于树根节点的第一个子节点A所组成的子树,根据字典顺序树的特点,它已经完全包含了与数据项A相关的所有其他流的完整信息,所以可以深度遍历其子孙节点,并对权重值与最小支持率阈值进行比较,当权重值大于最小支持率阈值时,则判断该节点是属于频繁项集。
c)在遍历比较的过程中,如果其中某个节点不能满足最小支持率阈值条件,即当权重值小于最小支持率阈值时,就不需要对其子孙节点进行拓展,从而节省遍历时间,提高算法搜索效率。
d)当完成搜索之后,就将得到的频繁项集输出,这样就完成了对数据项A相关的频繁项集的挖掘;当对其他节点相关的流数据进行挖掘时,就要将树结构进行相应的变化,如B节点与AB节点进行合并,并将它们的子孙节点进行对应的组合,C节点与AC节点进行合并,并将它们的子孙节点进行对应的组合,得到以A节点为根节点的前缀树,请参见图3。
e)对于树根节点的第二个子节点B相关的流频繁项集,可以通过深度遍历以B节点为根节点的子树进行获取。依此类推,就可以找到任意节点的频繁项集,并将其输出。
S104、利用关联规则对频繁项集进行分析,得到客户购买意向。
按照系统挖掘的客户关联行为关系,对相关性系统进行客户画像描述,对每种行为按照购买意向偏好行为关联规则和购买意向倾斜度的匹配,最终达到客户画像真实度的呈现。通过分析得到的各个维度数据的关联关系,系统可以对关联程度较高的行为,在客户画像中进行体现。在实际应用过程中,可以发现比如:20-30岁年龄断的用户偏向购买两室左右的户型产品,50岁以上用户偏向购买现有居住地附近的楼盘等关联规则。
如何判断客户的真实购买意向一直困扰销售人员的难题,日常接待过程中销售人员和客户接触的时间有限,与客户的交流往往只是通过项目的相关介绍开展,无法从每个客户的角度出发深度的进行购房的行为交流,从而难以通过在较短的时间内与客户的接触进行准确的意向判定。
购买意向通常指定客户对于房屋购买的概率程度,通常决定客户进行房屋购买的因素有多个维度,比如价格,位置,配套,个人爱好等。对于面向全国的房地产企业而言,各个地区的房地产市场和客户行为其实是有较大差异,因此统一客户的行为判断标准是否有效,并形成一定的标准是企业促进提升销售效率的关键方法。本实施例通过对客户成交信息和客户项目访问行为数据进行关联分析,从而形成正反馈的模型分析闭环。
本发明提供的基于关联规则的房地产客户分析方法,通过采集客户行为数据,形成原始数据池;按照预先定义的客户行为数据N元组,将原始数据池中的客户行为数据,以客户为单位,映射填入到该客户对应的N元组中,对不存在行为数据的组别项设置为空值,对不满足所有组别属性的客户行为数据丢弃;N元组包括性别、年龄、工作、家庭成员、资产、来访频率、居住地;基于已映射填入客户数据的各N元组,构建字典顺序前缀树,输出频繁项集;利用关联规则对频繁项集进行分析,得到客户购买意向;可形成行业客户意向的判断标准,有利于指导项目的销售工作开展。
实施例二:
本实施例在上述实施例一的基础上,提供一种装置,可用于实现上述实施例一中所述基于关联规则的房地产客户分析方法的步骤,请参见图4,该装置主要包括处理器41、存储器42及通信总线43;
通信总线43用于实现处理器41和存储器42之间的连接通信;
处理器41用于执行存储器42中存储的一个或者多个程序,以实现如上实施例一中所述基于关联规则的房地产客户分析方法的步骤。具体请参见上述实施例一中关于基于关联规则的房地产客户分析方法的描述,在此不再赘述。
本实施例还提供一种存储介质,该存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如实施例一中所述基于关联规则的房地产客户分析方法的步骤。具体请参见上述实施例一中关于基于关联规则的房地产客户分析方法的描述,在此不再赘述。
显然,本领域的技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (8)
1.一种基于关联规则的房地产客户分析方法,其特征在于,包括:
采集客户在线上线下发生的项目访问行为数据,形成原始数据池;
按照预先定义的客户行为数据N元组,将所述原始数据池中的客户行为数据,以客户为单位,映射填入到该客户对应的所述N元组中,对不存在行为数据的组别项设置为空值,对不满足所有组别属性的客户行为数据丢弃;所述N元组包括性别、年龄、工作、家庭成员、资产、来访频率、居住地;
基于已映射填入客户数据的各所述N元组,构建字典顺序前缀树,采用数据挖掘算法对所述字典顺序前缀树各数据项集进行扫描,计算所述数据项集的权值总和,判断所述权值总和与设定最小支持率阈值的大小关系,根据所述大小关系判定所述数据项集是否属于频繁项集,如是,输出频繁项集;
其中,数据挖掘算法的过程包括:
a)设定所设计的最小节点支持率阈值为θ,对行为数据树结构进行扫描,对每种数据项频繁度进行检测;当权重小于θ代表该数据项本身数据样本过小,不推荐继续进行计算,放弃该数据项;同时当该树结构中,超过一半的节点不满足最小支持率阈值θ时,则表示该数据集样本量过低,不推荐继续分析;
b)对于树根节点的第一个子节点A所组成的子树,根据字典顺序树的特点,它已经完全包含了与数据项A相关的所有其他流的完整信息,所以可以深度遍历其子孙节点,并对权重值与最小支持率阈值进行比较,当权重值大于最小支持率阈值时,则判断该节点是属于频繁项集;
c)在遍历比较的过程中,如果其中某个节点不能满足最小支持率阈值条件,即当权重值小于最小支持率阈值时,就不需要对其子孙节点进行拓展,从而节省遍历时间,提高算法搜索效率;
d)当完成搜索之后,就将得到的频繁项集输出,这样就完成了对数据项A相关的频繁项集的挖掘;
e)对于树根节点的第二个子节点B相关的流频繁项集,可以通过深度遍历以B节点为根节点的子树进行获取;依此类推,就可以找到任意节点的频繁项集,并将其输出;
利用关联规则对所述频繁项集进行分析,得到客户购买意向。
2.如权利要求1所述的基于关联规则的房地产客户分析方法,其特征在于,所述采集客户行为数据包括:按照设定时间窗口长度,采集客户行为数据。
3.如权利要求1所述的基于关联规则的房地产客户分析方法,其特征在于,所述根据所述大小关系判定所述数据项集是否属于频繁项集,包括:
在所述权值总和大于等于所述设定最小支持率阈值时,判定所述数据项集属于频繁项集;相反,则判定所述数据项集不属于频繁项集。
4.如权利要求1所述的基于关联规则的房地产客户分析方法,其特征在于,还包括:
若判定所述数据项集不属于频繁项集,则不再对所述数据项集进行子孙节点的扩展。
5.如权利要求1所述的基于关联规则的房地产客户分析方法,其特征在于,所述计算所述数据项集的权值总和包括:
获取与所述数据项集对应的数据频次、权重标准值,计算所述数据频次与所述权重标准值之间的乘积,作为所述数据项集的权值总和。
6.如权利要求5所述的基于关联规则的房地产客户分析方法,其特征在于,所述权重标准值是预先按照行业经验设定的。
7.一种装置,其特征在于,所述装置包括处理器、存储器及通信总线;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的一个或者多个程序,以实现如权利要求1至6中任一项所述的基于关联规则的房地产客户分析方法的步骤。
8.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至6中任一项所述的基于关联规则的房地产客户分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911291493.8A CN110992109B (zh) | 2019-12-16 | 2019-12-16 | 基于关联规则的房地产客户分析方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911291493.8A CN110992109B (zh) | 2019-12-16 | 2019-12-16 | 基于关联规则的房地产客户分析方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110992109A CN110992109A (zh) | 2020-04-10 |
CN110992109B true CN110992109B (zh) | 2022-09-02 |
Family
ID=70093821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911291493.8A Active CN110992109B (zh) | 2019-12-16 | 2019-12-16 | 基于关联规则的房地产客户分析方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110992109B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523944A (zh) * | 2020-04-26 | 2020-08-11 | 北京深演智能科技股份有限公司 | 浏览数据处理方法、装置、非易失性存储介质和处理 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7698170B1 (en) * | 2004-08-05 | 2010-04-13 | Versata Development Group, Inc. | Retail recommendation domain model |
CN108346085A (zh) * | 2018-01-30 | 2018-07-31 | 南京邮电大学 | 基于加权频繁项集挖掘算法的电商平台个性化推荐方法 |
CN109344150A (zh) * | 2018-08-03 | 2019-02-15 | 昆明理工大学 | 一种基于fp-树的时空数据挖掘分析方法 |
CN109426998A (zh) * | 2017-08-29 | 2019-03-05 | 北京京东尚科信息技术有限公司 | 信息推送方法和装置 |
CN109558435A (zh) * | 2018-10-24 | 2019-04-02 | 南京邮电大学 | 一种面向精准营销的加权频繁项集挖掘算法 |
CN109858999A (zh) * | 2018-12-29 | 2019-06-07 | 重庆金链科技有限公司 | 一种保险产品推荐方法、装置、设备及可读存储介质 |
CN110162566A (zh) * | 2019-04-15 | 2019-08-23 | 平安普惠企业管理有限公司 | 业务数据的关联分析方法、装置、计算机设备及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101427248B (zh) * | 2006-04-27 | 2013-05-22 | 英特尔公司 | 用于基于内容的分割与挖掘的基于系统的方法 |
US8301665B2 (en) * | 2009-09-08 | 2012-10-30 | International Business Machines Corporation | Accelerated drill-through on association rules |
WO2013143878A2 (en) * | 2012-03-27 | 2013-10-03 | Telefonica, S.A. | A method and a system to generate personalized selection of items for a given user in an online computing system |
CN104361036B (zh) * | 2014-10-29 | 2017-10-17 | 国家电网公司 | 告警事件关联规则挖掘方法 |
CN104850577A (zh) * | 2015-03-19 | 2015-08-19 | 浙江工商大学 | 一种基于有序复合树结构的数据流最大频繁项集挖掘方法 |
CN106294617A (zh) * | 2016-07-29 | 2017-01-04 | 浪潮软件集团有限公司 | 一种高效挖掘关联规则中频繁项集的方法 |
CN106570128A (zh) * | 2016-11-03 | 2017-04-19 | 南京邮电大学 | 一种基于关联规则分析的挖掘算法 |
CN109559156A (zh) * | 2018-10-30 | 2019-04-02 | 广东原昇信息科技有限公司 | 基于客户属性及营销数据的客户意向有监督预测方法 |
-
2019
- 2019-12-16 CN CN201911291493.8A patent/CN110992109B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7698170B1 (en) * | 2004-08-05 | 2010-04-13 | Versata Development Group, Inc. | Retail recommendation domain model |
CN109426998A (zh) * | 2017-08-29 | 2019-03-05 | 北京京东尚科信息技术有限公司 | 信息推送方法和装置 |
CN108346085A (zh) * | 2018-01-30 | 2018-07-31 | 南京邮电大学 | 基于加权频繁项集挖掘算法的电商平台个性化推荐方法 |
CN109344150A (zh) * | 2018-08-03 | 2019-02-15 | 昆明理工大学 | 一种基于fp-树的时空数据挖掘分析方法 |
CN109558435A (zh) * | 2018-10-24 | 2019-04-02 | 南京邮电大学 | 一种面向精准营销的加权频繁项集挖掘算法 |
CN109858999A (zh) * | 2018-12-29 | 2019-06-07 | 重庆金链科技有限公司 | 一种保险产品推荐方法、装置、设备及可读存储介质 |
CN110162566A (zh) * | 2019-04-15 | 2019-08-23 | 平安普惠企业管理有限公司 | 业务数据的关联分析方法、装置、计算机设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
关联规则挖掘算法及其应用研究;林景亮;《中国优秀硕士学位论文全文数据库 信息科技》;20080715(第7期);全文 * |
挖掘滑动时间衰减窗口中网络流频繁项集;赖军等;《计算机应用研究》;20110315;第28卷(第3期);第896-897页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110992109A (zh) | 2020-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3779841B1 (en) | Method, apparatus and system for sending information, and computer-readable storage medium | |
CN107609152B (zh) | 用于扩展查询式的方法和装置 | |
US9569499B2 (en) | Method and apparatus for recommending content on the internet by evaluating users having similar preference tendencies | |
CN107808314B (zh) | 用户推荐方法及装置 | |
TWI559158B (zh) | 於商業分析中之關係發現之方法、電腦系統及電腦程式產品 | |
CN104077723B (zh) | 一种社交网络推荐系统及方法 | |
CN107870984A (zh) | 识别搜索词的意图的方法和装置 | |
CN111814065B (zh) | 信息传播路径分析方法、装置、计算机设备及存储介质 | |
KR102307517B1 (ko) | 네트워크 기반 상품 추천 방법 및 장치 | |
CN111626767B (zh) | 资源数据的发放方法、装置及设备 | |
CN109190027A (zh) | 多源推荐方法、终端、服务器、计算机设备、可读介质 | |
CN110992109B (zh) | 基于关联规则的房地产客户分析方法、装置及存储介质 | |
CN110490682B (zh) | 分析商品属性的方法和装置 | |
US10296928B1 (en) | System and methods for measuring and influencing customer trajectory within a product space | |
US20120265588A1 (en) | System and method for recommending new connections in an advertising exchange | |
CN111611469A (zh) | 标识信息确定方法及装置、电子设备和存储介质 | |
CN115423555A (zh) | 一种商品推荐方法、装置、电子设备及存储介质 | |
CN110827101A (zh) | 一种店铺推荐的方法和装置 | |
CN111460300B (zh) | 网络内容推送方法、装置及存储介质 | |
CN110347923B (zh) | 一种可回溯的快速裂变式构建用户画像的方法 | |
Hung | Using Cloud Services to Develop Marketing Information System Applications | |
CN110738538B (zh) | 识别相似物品的方法和装置 | |
CN109710853A (zh) | 一种人工智能分类匹配方法及系统 | |
CN110941714A (zh) | 分类规则库构建方法、应用分类方法及装置 | |
CN112559897B (zh) | 匹配关系的识别方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |