CN107194715A - 社会行为数据模型的构建方法 - Google Patents

社会行为数据模型的构建方法 Download PDF

Info

Publication number
CN107194715A
CN107194715A CN201710224931.3A CN201710224931A CN107194715A CN 107194715 A CN107194715 A CN 107194715A CN 201710224931 A CN201710224931 A CN 201710224931A CN 107194715 A CN107194715 A CN 107194715A
Authority
CN
China
Prior art keywords
data
model
client
social action
action data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710224931.3A
Other languages
English (en)
Inventor
陈乐焱
许飞月
陶波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Fine Point Data Polytron Technologies Inc
Original Assignee
Guangdong Fine Point Data Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Fine Point Data Polytron Technologies Inc filed Critical Guangdong Fine Point Data Polytron Technologies Inc
Priority to CN201710224931.3A priority Critical patent/CN107194715A/zh
Publication of CN107194715A publication Critical patent/CN107194715A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Abstract

本发明公开了一种数据分析技术,具体是社会行为数据模型的构建方法,包括如下步骤:获取客户基本信息;获取不同方面的社会行为数据;对社会行为数据进行标准化处理;利用标准化后的数据建立社会行为数据模型;通过对此模型的分析,建立算法对客户下一阶段行为进行预测;获取客户后续阶段行为作为反馈来验证并修正所建立的数据模型、预测模型;所述修正是将客户后续阶段的行为数据作为验证数据,将后续阶段的数据与预测模型输出的预测结果相比较,形成正、反例;通过正例与反例更正数据模型与预测模型的权值。本发明社会行为数据模型能够准确预测客户的行为需求。

Description

社会行为数据模型的构建方法
技术领域
本发明属于数据分析技术领域,涉及一种社会行为数据模型的构建方法。
背景技术
近些年来,随着居民生活水平的提高,保险行业迅速崛起,依据人生经历不同阶段的不同需要,有着多元化的保险产品,比如:医疗保险、车辆保险、退休保险、资产承传保险等,每个人总有保险理财的需要。新“国十条”的颁布,高屋建瓴的规划了保险行业的发展态势,提出要把现代保险服务业建设成为完善金融体系的支柱力量,保险行业在市场经济和社会管理的地位逐步突显,在社会中的地位也逐步深入。
在大数据时代下,从客户的留存资料、产品了解、价格询问到购买的不同阶段中,分析出潜在客户完整行为数据,了解消费者或流失或成功购买产品的原因是至关重要的。因此需要专业的数据处理分析来做细致的归因分析,为未来的销售拟定合理的计划。
发明内容
本发明的目的在于提供一种能够自学习的行为分析方法,用于准确预测客户的行为需求。
为达到上述目的,本发明的基础方案如下:
一种社会行为数据模型的构建方法,包括如下步骤:
步骤01:获取客户基本信息;
步骤02:获取不同方面的社会行为数据;
步骤03:对社会行为数据进行标准化处理;
步骤04:利用标准化后的数据建立社会行为数据模型;
步骤05:通过对此模型的分析,建立算法对客户下一阶段行为进行预测;
步骤06:获取客户后续阶段行为作为反馈来验证并修正所建立的数据模型、预测模型;
所述修正是将客户后续阶段的行为数据作为验证数据,将后续阶段的数据与预测模型输出的预测结果相比较,若后续行为数据与预测结果不相同,则客户该阶段的行为数据可作为反例,否则作为正例;通过正例与反例对数据模型与预测模型进行训练,并更正数据模型与预测模型的权值;
训练的方法采用神经网络算法。
进一步,所述步骤01中还包括以下步骤:
步骤0101:从各大网络平台上查找客户个人基本信息;
步骤0102:从各大网络平台上查找客户相关人员基本信息。
进一步,所述步骤02中还包括以下步骤:
步骤0201:从各大网络平台上获取客户社会行为数据;
步骤0202:从各大网络平台上获取客户社会行为数据相关的时间数据、位置数据、事件数据;社会行为数据包含购买行为数据、分享行为数据、关注行为数据与查找行为数据。
进一步,所述步骤03中还包括以下步骤:
步骤0301:利用分布式计算处理海量数据;
步骤0302:利用Spss软件对处理后的数据进行标准化处理。
所述分布式计算具体为:
利用Hadoop系统进行离线数据处理;
利用Storm系统进行实时数据处理。
两系统(Hadoop系统、Storm系统)是根据待处理的数据的类型而分别启动的,两系统的启动不存在次序上关联。
所述数据模型包括用户兴趣喜好模型、生活习惯模型、消费能力模型、现阶段收入模型与家庭构成模型。
网络平台包含购物、社交、消费以及门户网站登记过用户个人信息的平台。
采用本发明的技术方案,具有如下技术效果:
本发明基于大数据时代下信息透明化、公开化的特性,利用采集到的数据形成提取处理、数据建模、预测建模和预测分析输出反馈的处理步骤。本发明不仅能够利用已知的数据来预测客户的行为需求,而且由于能够接受每一次处理的结果作为下一次迭代的输入,因此有着数据模型和预测模型的自学习能力,此外由于数据模型的实时分析功能,可以实现模型的不断更新,实现精准的数据处理步骤。
附图说明
图1是本发明社会行为数据模型的构建方法的流程图。
具体实施方式
下面通过具体实施方式对本发明作进一步详细的说明:
实施例基本如附图1所示:
下面对本发明作进一步的详细说明,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。
如图1所示,本发明的社会行为数据模型的构建方法的主要包含有步骤01获取客户基本信息;步骤02获取不同方面的社会行为数据;步骤03对社会行为数据进行标准化处理;步骤04利用标准化后的数据建立社会行为数据模型;步骤05通过对此模型的分析,建立算法对客户下一阶段行为进行预测;步骤06获取客户后续阶段行为作为反馈来验证所建立的数据模型、预测模型的准确性;步骤07更新数据模型和预测模型;步骤08将预测结果输出;步骤09调整数据模型和预测模型。
步骤01主要包含两个步骤:步骤0101从各大网络平台上查找客户个人基本信息;步骤0102从各大网络平台上查找客户相关人员基本信息。其中各大网络平台包括购物、社交、消费以及门户网站等登记过用户个人信息的平台。基本信息包括年龄、性别、职位、所处地域、家庭成员、兴趣爱好等。
步骤02主要包含两个步骤:步骤0201从各大网络平台上获取客户社会行为数据;步骤0202从各大网络平台上获取客户社会行为数据相关的时间数据、位置数据、事件数据。社会行为数据依网络平台的不同特点,包含着购买行为数据、分享行为数据、关注行为数据、查找行为数据等。时间数据是指该行为数据出现的时间节点,位置数据是指该行为数据出现的具体网络平台,事件数据是指该行为数据的具体指代事件。
步骤03主要包含两个步骤:步骤0301利用分布式计算处理海量数据;步骤0302利用Spss软件对处理后的数据进行标准化处理。所述分布式计算具体为:利用Hadoop系统进行离线数据处理;利用Storm系统进行实时数据处理。所述数据模型包括用户兴趣喜好模型、生活习惯模型、消费能力模型、现阶段收入模型、家庭构成模型等。此处的兴趣喜好数据主要包含理财观、消费观、投资观等;生活习惯数据主要包括饮食习惯、作息习惯、劳动习惯、驾驶习惯、就医习惯等;消费能力数据分为低档消费、中档消费、高档消费、奢侈品消费等;现阶段收入数据分为无收入、低等收入、中等收入、高等收入等;家庭构成数据分为未婚、已婚无子、三口之家、四口之家及以上。
以消费能力模型为例:可分为低档、中档、高档、奢侈品消费档。
可根据属性:比如有食品花费、奢侈品花费、服饰花费等三个属性来预测这几个阶段的消费能力。跟三个属性对应的有三个权值,C1、C2、C3。
C1*食品花费+C2*奢侈品花费+C3*服饰花费=消费总值。
消费总值为社会经验给出,首先给定一些确定好处于哪种消费阶段(即已知消费总值范围)的客户信息,给定C1、C2、C3的初始值,例如1,2,1。然后根据神经网络算法来训练得到最终合适的权值。选定合适的权值即可以预测未知处于哪种消费阶段的客户的消费的阶段。
对于后续阶段的用户数据,将客户后续阶段(已知改客户的消费阶段)的行为数据作为验证数据,将后续阶段的数据与预测结果相比较,若后续行为数据与预测结果不相同,则客户该阶段的行为数据可作为反例,否则作为正例进行训练,修正系统的权值。
步骤03的具体步骤包含:获取客户后续阶段行为作为验证数据,若此数据同预测数据相同,则执行步骤07,步骤08;否则执行步骤09,步骤07、09都能改变系统权值,但是正例即预测正确的情况下,仅是小改动,即更新数据、预测模型,反例则作较大改动,即调整数据、预测模型;改动的方式可以采用神经网络算法来实现。
将预测数据作为负反馈步骤04,反馈步骤05。
步骤05通过对此模型的分析,建立算法对客户下一阶段行为进行预测;对社会行为数据模型的分析具体是指将社会行为数据模型提供的各变量组内均值做最大-最小规范化后,划分出各类的优势特征和弱势特征,从而给各组一个描述性的名字。给出的名字反映的是该组最大特征,但并不是唯一特征。分析步骤中把各变量规范化为0~10的公式如下:
V_N=((V-MIN_V)/(MAX_V-MIN_V))×10
式中,V是被规范化的值、V_N是被规范化后的值、MIN_V是V值所在变量的最小值、MAX_N是V值所在变量的最大值。这样变量的所有值将会被规范化为从0到10的区间,原值被等比缩放。这样一个值在同一个变量中比其他值大还是小就很明显了。各值只和同一个变量的其他值有可比性。在分析步骤中,规范化后的值被标上了不同颜色,这样对各类进行分析的时候对其优势字段、弱势字段就能一目了然。分析步骤中判断一个变量是否优势字段,不光看某类中这个变量大还是小,还要看其他类在该变量上的取值情况。例如,如果某类中一个变量取值很大,但是其它类在该变量上的取值同样也很大,那么这个变量就不是优势变量。
一开始,直接给定预测结果为空,然后应用神经网络算法根据社会行为数据以及当前社会行为数据模型中的其他变量,推定社会行为与其他变量的正相关或负相关;然后再根据各变量的值推定,推定哪些变量能够直接导致客户相应社会行为的优势变量;从而形成自身关于优势变量判定、客户社会行为预测的预测模型,即当促成某一社会行为的优势变量的数量与值较多、较大时,预测客户将采取相应的行为。
所述更新、调整的手段可以采用神经网络算法,也可以先在正例集合中任选一个变量,到反例集合中逐个比较。与反例变量的取值构成“选择子相容”的,则舍去该正例变量,相反则保留。按此思想循环所有正例种子,将得到正例的规则(选择子的合取式)。这样便能优化数据、预测模型,使促使预测准确的变量保留,去除干扰其准确性的变量。比较典型的算法还有michalski的aq11方法、洪家荣改进的aq15方法以及他的ae5方法。
以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims (5)

1.一种社会行为数据模型的构建方法,其特征在于,包括如下步骤: 步骤01:获取客户基本信息;
步骤02:获取不同方面的社会行为数据;
步骤03:对社会行为数据进行标准化处理;
步骤04:利用标准化后的数据建立社会行为数据模型;
步骤05:通过对此模型的分析,建立算法对客户下一阶段行为进行预测;
步骤06:获取客户后续阶段行为作为反馈来验证并修正所建立的数据模型、预测模型;所述数据模型包括用户兴趣喜好模型、生活习惯模型、消费能力模型、现阶段收入模型与家庭构成模型;
所述修正是将客户后续阶段的行为数据作为验证数据,将后续阶段的数据与预测模型输出的预测结果相比较,若后续行为数据与预测结果不相同,则客户该阶段的行为数据可作为反例,否则作为正例;通过正例与反例对数据模型与预测模型进行训练,并更正数据模型与预测模型的权值。
2.如权利要求1所述社会行为数据模型的构建方法,其特征在于,
所述步骤01中还包括以下步骤:
步骤0101:从各大网络平台上查找客户个人基本信息;
步骤0102:从各大网络平台上查找客户相关人员基本信息。
3.如权利要求1所述社会行为数据模型的构建方法,其特征在于,所述步骤02中还包括以下步骤:
步骤0201:从各大网络平台上获取客户社会行为数据;
步骤0202:从各大网络平台上获取客户社会行为数据相关的时间数据、位置数据、事件数据;社会行为数据包含购买行为数据、分享行为数据、关注行为数据与查找行为数据。
4.如权利要求1所述社会行为数据模型的构建方法,其特征在于,所述步骤03中还包括以下步骤:
步骤0301:利用分布式计算处理海量数据;
步骤0302:利用Spss软件对处理后的数据进行标准化处理;
所述分布式计算具体为:
利用Hadoop系统进行离线数据处理;
利用Storm系统进行实时数据处理。
5.如权利要求2或3所述社会行为数据模型的构建方法,其特征在于,网络平台包含购物、社交、消费以及门户网站登记过用户个人信息的平台。
CN201710224931.3A 2017-04-07 2017-04-07 社会行为数据模型的构建方法 Pending CN107194715A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710224931.3A CN107194715A (zh) 2017-04-07 2017-04-07 社会行为数据模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710224931.3A CN107194715A (zh) 2017-04-07 2017-04-07 社会行为数据模型的构建方法

Publications (1)

Publication Number Publication Date
CN107194715A true CN107194715A (zh) 2017-09-22

Family

ID=59872082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710224931.3A Pending CN107194715A (zh) 2017-04-07 2017-04-07 社会行为数据模型的构建方法

Country Status (1)

Country Link
CN (1) CN107194715A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108109096A (zh) * 2017-12-29 2018-06-01 航天科工智慧产业发展有限公司 一种智慧检务预防职务犯罪的方法
CN108182605A (zh) * 2018-01-11 2018-06-19 厦门快商通信息技术有限公司 一种基于用户画像的用户行为预测方法及系统
CN108256681A (zh) * 2018-01-15 2018-07-06 吉浦斯信息咨询(深圳)有限公司 一种收入水平预测方法、装置、存储介质和系统
CN108446291A (zh) * 2017-12-27 2018-08-24 深圳萨摩耶互联网金融服务有限公司 用户信用的实时评分方法及评分系统
CN110956479A (zh) * 2018-09-26 2020-04-03 北京高科数聚技术有限公司 基于销售线索交互记录的产品推荐方法
CN112132622A (zh) * 2020-09-25 2020-12-25 北京达佳互联信息技术有限公司 数据预估方法及装置
CN113657635A (zh) * 2020-05-12 2021-11-16 中国移动通信集团湖南有限公司 一种预测通信用户流失的方法及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004801A (zh) * 2010-12-30 2011-04-06 焦点科技股份有限公司 一种信息分类的方法
CN102508860A (zh) * 2011-09-29 2012-06-20 广州中浩控制技术有限公司 一种基于xbrl实例文档的数据挖掘方法
CN105894336A (zh) * 2016-05-25 2016-08-24 北京比邻弘科科技有限公司 一种基于移动互联网的大数据挖掘方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004801A (zh) * 2010-12-30 2011-04-06 焦点科技股份有限公司 一种信息分类的方法
CN102508860A (zh) * 2011-09-29 2012-06-20 广州中浩控制技术有限公司 一种基于xbrl实例文档的数据挖掘方法
CN105894336A (zh) * 2016-05-25 2016-08-24 北京比邻弘科科技有限公司 一种基于移动互联网的大数据挖掘方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446291A (zh) * 2017-12-27 2018-08-24 深圳萨摩耶互联网金融服务有限公司 用户信用的实时评分方法及评分系统
CN108109096A (zh) * 2017-12-29 2018-06-01 航天科工智慧产业发展有限公司 一种智慧检务预防职务犯罪的方法
CN108182605A (zh) * 2018-01-11 2018-06-19 厦门快商通信息技术有限公司 一种基于用户画像的用户行为预测方法及系统
CN108256681A (zh) * 2018-01-15 2018-07-06 吉浦斯信息咨询(深圳)有限公司 一种收入水平预测方法、装置、存储介质和系统
CN110956479A (zh) * 2018-09-26 2020-04-03 北京高科数聚技术有限公司 基于销售线索交互记录的产品推荐方法
CN113657635A (zh) * 2020-05-12 2021-11-16 中国移动通信集团湖南有限公司 一种预测通信用户流失的方法及电子设备
CN113657635B (zh) * 2020-05-12 2023-10-27 中国移动通信集团湖南有限公司 一种预测通信用户流失的方法及电子设备
CN112132622A (zh) * 2020-09-25 2020-12-25 北京达佳互联信息技术有限公司 数据预估方法及装置
CN112132622B (zh) * 2020-09-25 2021-07-16 北京达佳互联信息技术有限公司 数据预估方法及装置

Similar Documents

Publication Publication Date Title
CN107194715A (zh) 社会行为数据模型的构建方法
Van Giffen et al. Overcoming the pitfalls and perils of algorithms: A classification of machine learning biases and mitigation methods
CN106844787B (zh) 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法
Castro-Nuño et al. Tourism and GDP: A meta-analysis of panel data studies
US8892540B2 (en) Dynamic sustainability search engine
CN103886487A (zh) 基于分布式的b2b平台的个性化推荐方法与系统
CN107895277A (zh) 在应用程序中推送贷款广告的方法、电子装置及介质
Wu et al. An approach of product usability evaluation based on Web mining in feature fatigue analysis
CN106779808A (zh) 一种商圈中消费者空间行为分析系统及方法
CN108038746A (zh) 基于关键用户和时间上下文的二部图推荐方法
CN107194532A (zh) 基于大数据的保险业务分析方法
CN108198631A (zh) 循证医疗结果生成方法与装置
CN108320798A (zh) 病症结果生成方法与装置
Baltes Marketing technology (Martech)–the most important dimension of online marketing
CN107833088A (zh) 内容提供方法、装置及智能设备
Chun Multi-attribute sequential decision problem with optimizing and satisficing attributes
Sharma et al. E-Commerce product comparison portal for classification of customer data based on data mining
CN106294410A (zh) 一种个性化信息推送时间的确定方法及确定系统
Bhanushali et al. A detailed and significant analysis of The Effects of Big-Data over The Revolution of Internet Marketing
Sacchelli et al. Climate change, wine and sustainability: a quantitative discourse analysis of the international scientific literature
Rasiah et al. Production linkages, technological intensities and economic performance: small and medium enterprises in Malaysian manufacturing
Al-Ahmari A methodology for selection and evaluation of advanced manufacturing technologies
Camiciottoli et al. The integration of netnography and text mining for the representation of brand image in fashion blogs
CN111651583A (zh) 一种基于标签特征及协同过滤的保险文章推荐方法
Choeh et al. Personalized Approach for Recommending Useful Product Reviews Based on Information Gain.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170922

RJ01 Rejection of invention patent application after publication