CN104133833A - 一种数据挖掘方法及系统 - Google Patents
一种数据挖掘方法及系统 Download PDFInfo
- Publication number
- CN104133833A CN104133833A CN201410227688.7A CN201410227688A CN104133833A CN 104133833 A CN104133833 A CN 104133833A CN 201410227688 A CN201410227688 A CN 201410227688A CN 104133833 A CN104133833 A CN 104133833A
- Authority
- CN
- China
- Prior art keywords
- data
- fuzzy
- obfuscation
- rule
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000007418 data mining Methods 0.000 title abstract description 3
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000011156 evaluation Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000009472 formulation Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 235000013405 beer Nutrition 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/048—Fuzzy inferencing
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Fuzzy Systems (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Automation & Control Theory (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种数据挖掘方法,其特征在于,该方法包括:根据模糊评价规则对用户数据信息进行模糊逻辑处理,得到模糊化的数据;根据制定的推理规则对模糊化的数据进行推理,得出对事物的偏好程度值;经过去模糊化的处理,得出对事物的具体偏好程度。本发明提供的方法能够解决现有方法对大数据处理不够精确以及复杂度过高的问题。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种数据挖掘方法及系统。
背景技术
随着信息技术的飞速发展,云计算成为了IT行业最时尚的话题,而云计算作为计算资源的底层,支撑着上层的大数据处理。而对于我们用户来说最关心的还是上层的数据,在日益激励的电子商务企业竞争中,根据用户喜好为用户提供个性化的服务就显得至关重要,此时,大数据就体现了它巨大的商业价值,通过收集顾客的购买行为和购买偏好等数据,因人而异地对顾客提供独特的产品和针对性服务。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据信息进行专业化信息处理,换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键是提高对数据的“加工”能力,通过“加工”实现对数据的增值。收集到的数据具有量大、类型繁多、价值密度低及速度快时效高等特点,如何从大量的数据中提取有用的信息,得出准确率高的用户偏好成为数据挖掘最亟待解决的问题。目前的算法都存在一定的缺陷,对大数据的处理不够精确且复杂度过高。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供一种数据挖掘方法,能够通过模糊逻辑处理方法及制定的推理规则,从而提取最有用的信息,来解决对大数据处理不够精确以及复杂度过高的问题。
(二)技术方案
为了达到以上目的,本发明通过以下技术方案予以实现:
一种数据挖掘方法,该方法包括:
根据模糊评价规则对用户数据信息进行模糊逻辑处理,得到模糊化的数据;
根据制定的推理规则对模糊化的数据进行推理,得出对各种事物的偏好程度值;
经过去模糊化的处理,得出对各种事物的具体偏好程度。
优选地,所述用户数据信息包括用户年龄、性别、职业、购买行为、购买偏好以及购买能力。
优选地,所述得到的模糊化的数据为0~1之间的数字。
优选地,所述模糊评价规则是根据用户偏好的类型而制定的规则。
优选地,所述模糊评定规则具体是由隶属度函数组成,不同的评定规则形成隶属度矩阵,收集得到的值乘以隶属度矩阵,从而得到模糊化数据。
优选地,所述制定的推理规则包括根据事物的关联性而制定的规则。
优选地,所述偏好程度值为0~1之间的数字。
一种数据挖掘系统,该系统包括模糊化模块、推理模块以及去模糊化模块;
模糊化模块,用于根据模糊评价规则对用户数据信息进行模糊逻辑处理,得到模糊化的数据;
推理模块,根据制定的推理规则对模糊化的数据进行推理,得出对各种事物的偏好程度值;
去模糊化模块,用于去模糊化的处理,得出对各种事物的具体偏好程度。
(三)有益效果
本发明至少有如下有益效果:
本发明提供了一种数据挖掘方法,通过数据信息进行模糊逻辑处 理,从而根据制定的推理规则对用户的偏好进行推理,以此来提取最有用的信息,如此就能够解决现有方法对大数据处理不够精确以及复杂度过高的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
图1是本发明实施例中的一种数据挖掘方法的流程图。
图2是本发明另一实施例提供的一种数据挖掘系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,本发明实施例提供了一种数据挖掘方法,其具体步骤如下:
S1:根据模糊评价规则对用户数据信息进行模糊逻辑处理,得到模糊化的数据。
其中,所述模糊评价规则是根据用户偏好的类型而制定的规则。所述用户数据信息包括用户年龄、性别、职业、购买行为、购买偏好以及购买能力等。
所述模糊评定规则具体是由隶属度函数组成,不同的评定规则形成隶属度矩阵,收集得到的值乘以隶属度矩阵,从而得到模糊化数据。所述得到的模糊化的数据为0~1之间的数字,越接近1说明信息越有 用,越接近用户的偏好。
S2:根据制定的推理规则对模糊化的数据进行推理,得出对各类型事物的偏好程度值。
其中,偏好程度值为从0~1之间的数据,同样地越靠近1说明对某项事物越偏好。由于用户的偏好会随着时间、以及环境动态的变化,因此我们制定的推理规则是动态变化的,来更准确推导用户的偏好。其中很重要的一点是把相关联的事物进行制定相应的推理规则。比如,美国数据分析年轻的爸爸去超市买尿片的同时一般都会买啤酒;又如用户处于25~26之间,最近有看家电方面的信息,通过分析处理可以推导出,这个人有可能在装修房子,可以推送一下装修房子相关的产品信息。
S3:经过去模糊化的处理,得出对各种事物的具体偏好程度。
本发明实施例提供的一种数据挖掘方法,通过数据信息进行模糊逻辑处理,从而根据制定的推理规则对用户的偏好进行推理,以此来提取最有用的信息,如此就能够解决现有方法对大数据处理不够精确以及复杂度过高的问题。
本发明另一实施例还提供了一种数据挖掘系统,该系统包括模糊化模块、推理模块以及去模糊化模块;
模糊化模块,用于根据模糊评价规则对用户数据信息进行模糊逻辑处理,得到模糊化的数据;
推理模块,根据制定的推理规则对模糊化的数据进行推理,得出对各种事物的偏好程度值;
去模糊化模块,用于去模糊化的处理,得出对各种事物的具体偏好程度。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不 使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种数据挖掘方法,其特征在于,该方法包括:
根据模糊评价规则对用户数据信息进行模糊逻辑处理,得到模糊化的数据;
根据制定的推理规则对模糊化的数据进行推理,得出对事物的偏好程度值;
经过去模糊化的处理,得出对事物的具体偏好程度。
2.根据权利要求1所述的方法,其特征在于,所述用户数据信息包括用户年龄、性别、职业、购买行为、购买偏好以及购买能力。
3.根据权利要求1所述的方法,其特征在于,所述模糊化的数据为0~1之间的数字。
4.根据权利要求1所述的方法,其特征在于,所述模糊评价规则是根据用户偏好的类型而制定的规则。
5.根据权利要求4所述的方法,其特征在于,所述模糊评定规则具体是由隶属度函数组成,不同的评定规则形成不同的隶属度矩阵,收集得到的值乘以所述隶属度矩阵,从而得到模糊化数据。
6.根据权利要求1所述的方法,其特征在于,所述制定的推理规则包括根据事物的关联性而制定的规则。
7.根据权利要求1所述的方法,其特征在于,所述偏好程度值为0~1之间的数字。
8.一种数据挖掘系统,其特征在于,该系统包括模糊化模块、推理模块以及去模糊化模块;
模糊化模块,用于根据模糊评价规则对用户数据信息进行模糊逻辑处理,得到模糊化的数据;
推理模块,根据制定的推理规则对模糊化的数据进行推理,得出对各种事物的偏好程度值;
去模糊化模块,用于去模糊化的处理,得出对各种事物的具体偏好程度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410227688.7A CN104133833A (zh) | 2014-05-27 | 2014-05-27 | 一种数据挖掘方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410227688.7A CN104133833A (zh) | 2014-05-27 | 2014-05-27 | 一种数据挖掘方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104133833A true CN104133833A (zh) | 2014-11-05 |
Family
ID=51806511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410227688.7A Pending CN104133833A (zh) | 2014-05-27 | 2014-05-27 | 一种数据挖掘方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104133833A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017121054A1 (zh) * | 2016-01-15 | 2017-07-20 | 深圳大学 | 一种在线评分方法及其系统 |
CN113256274A (zh) * | 2021-07-14 | 2021-08-13 | 支付宝(杭州)信息技术有限公司 | 基于专家系统的业务处理方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102214345A (zh) * | 2011-07-19 | 2011-10-12 | 纽海信息技术(上海)有限公司 | 网购引导装置及方法 |
CN102222279A (zh) * | 2011-06-14 | 2011-10-19 | 华南理工大学 | 基于模糊综合评判法的制革行业技术的评估方法 |
-
2014
- 2014-05-27 CN CN201410227688.7A patent/CN104133833A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102222279A (zh) * | 2011-06-14 | 2011-10-19 | 华南理工大学 | 基于模糊综合评判法的制革行业技术的评估方法 |
CN102214345A (zh) * | 2011-07-19 | 2011-10-12 | 纽海信息技术(上海)有限公司 | 网购引导装置及方法 |
Non-Patent Citations (5)
Title |
---|
杨群翔: "《网络营销》", 30 September 2006, 沈阳:东北财经大学出版社, pages: 186 * |
王连波: ""模糊推理在网络故障诊断中的应用研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
王连波: ""模糊推理在网络故障诊断中的应用研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 September 2007 (2007-09-15), pages 16 - 18 * |
葛新成 等: ""模糊控制的现状与发展概述"", 《现代防御技术》 * |
葛新成 等: ""模糊控制的现状与发展概述"", 《现代防御技术》, vol. 36, no. 3, 30 June 2008 (2008-06-30), pages 52 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017121054A1 (zh) * | 2016-01-15 | 2017-07-20 | 深圳大学 | 一种在线评分方法及其系统 |
CN113256274A (zh) * | 2021-07-14 | 2021-08-13 | 支付宝(杭州)信息技术有限公司 | 基于专家系统的业务处理方法及装置 |
CN113256274B (zh) * | 2021-07-14 | 2022-02-25 | 支付宝(杭州)信息技术有限公司 | 基于专家系统的业务处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI665607B (zh) | Information push method and device | |
CN103778214B (zh) | 一种基于用户评论的商品属性聚类方法 | |
CN106021329A (zh) | 基于用户相似度的稀疏数据协同过滤推荐方法 | |
CN105426486A (zh) | 一种基于用户行为数据的手机app推送方法 | |
CN102214212A (zh) | 基于多重链接的微博网络节点权重排序方法 | |
US10264082B2 (en) | Method of producing browsing attributes of users, and non-transitory computer-readable storage medium | |
CN104111938A (zh) | 一种信息推荐的方法及装置 | |
CN109977312A (zh) | 一种基于内容标签的知识库推荐系统 | |
US20130311484A1 (en) | Method and system for social credit scoring | |
CN107203883A (zh) | 一种风险控制方法和设备 | |
CN106708868A (zh) | 一种互联网数据分析方法及系统 | |
CN106250398A (zh) | 一种投诉事件的投诉内容分类判定方法及装置 | |
CN104133833A (zh) | 一种数据挖掘方法及系统 | |
CN113032671B (zh) | 内容处理方法、装置、电子设备和存储介质 | |
CN114065038A (zh) | 基于大数据的头条资讯推荐方法及装置 | |
Yadav et al. | Investigating Emerging Trends in Sustainable Fashion Research: Topics, Challenges, Strategies and Future Directions | |
CN104462480A (zh) | 基于典型性的评论大数据挖掘方法 | |
CN110930184A (zh) | 基于混合推荐算法的潜在客户挖掘与客户选型方法 | |
CN106095761A (zh) | 一种多准则目标决策方法及装置 | |
CN109255101A (zh) | 基于机器学习和抽样算法的微博粉丝数获取方法及装置 | |
KR20160015657A (ko) | 집단지성을 통한 개인화 맞춤 정보 제공 시스템 및 이를 위한 제공 방법 | |
Kim et al. | Crowdsourced promotions in doubt: Analyzing effective crowdsourced promotions | |
Iman et al. | Machine learning methods in individual migration behavior | |
JS et al. | An assessment of stream water quality of the Rio San Juan, Nuevo Leon, Mexico, 1995-1996. | |
Chen et al. | Dynamic box office forecasting based on microblog data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination |