CN107704575A - 基于数据挖掘的用户行为分析方法及用户行为分析装置 - Google Patents

基于数据挖掘的用户行为分析方法及用户行为分析装置 Download PDF

Info

Publication number
CN107704575A
CN107704575A CN201710918236.7A CN201710918236A CN107704575A CN 107704575 A CN107704575 A CN 107704575A CN 201710918236 A CN201710918236 A CN 201710918236A CN 107704575 A CN107704575 A CN 107704575A
Authority
CN
China
Prior art keywords
data
analyzed
user behavior
user
different classes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710918236.7A
Other languages
English (en)
Inventor
梁树军
张建伟
殷知磊
陈明
张阳
黄艳
李璞
张卓
王旭辉
杜春峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University of Light Industry
Original Assignee
Zhengzhou University of Light Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University of Light Industry filed Critical Zhengzhou University of Light Industry
Priority to CN201710918236.7A priority Critical patent/CN107704575A/zh
Publication of CN107704575A publication Critical patent/CN107704575A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Abstract

本发明提供了一种基于数据挖掘的用户行为分析方法及用户行为分析装置,基于数据挖掘的用户行为分析方法包括:采集不同网络环境下的用户行为数据;对采集到的用户行为数据进行分类处理,以得到不同类别的待分析数据,并将不同类别的待分析数据存储于分布式文件系统上;将不同类别的待分析数据分配至分布式文件系统中的多个数据节点上;基于每个数据节点对其所分配到的待分析数据进行预处理与聚合;根据聚合后的待分析数据,确定用户在不同网络环境下的兴趣数据。通过本发明的技术方案,基于对不同网络环境下的用户行为数据的挖掘分析来确定用户行为,实现了对用户行为数据的精细化分析,同时将数据分散至多个数据点进行分析,确保了数据挖掘效率。

Description

基于数据挖掘的用户行为分析方法及用户行为分析装置
技术领域
本发明涉及数据分析技术领域,具体而言,涉及一种基于数据挖掘的用户行为分析和一种基于数据挖掘的用户行为分析装置。
背景技术
随着互联网的商用和广泛部署,为了给用户提供全面、优质的个性化服务,在互联网应用这一领域,用户行为分析指的是统计和分析用户接入网络服务全过程当中产生的实时性和历史性的用户行为信息。
随着时间周期逐渐增大,互联网用户产生和应用的数据量日益增大,海量用户数据的出现和数据结构的多样化,对于用户行为的分析,相关技术中存在一些问题:第一,大多基于WEB 日志进行数据挖掘,但这些日志并不足以及时描述用户访问网站时的情景:第二,大型网站一般拥有庞大的在线用户,产生的实时行为和上下文信息量巨大,因此,系统的存储能力和计算速度更强,才能及时地将分析结果反馈给用户;第三,数据分析过程比较粗糙,不能针对不同网络环境进行分类分析。而目前,大多数用户行为分析系统采用关系数据库技术与传统的数据处理方法,不能很好满足海量数据的高效分析。
发明内容
本发明正是基于上述技术问题至少之一,提出了一种新的基于数据挖掘的用户行为分析方案,能够基于对不同网络环境下的用户行为数据的挖掘分析来确定用户行为,实现了对用户行为数据的精细化分析,同时将数据分散至多个数据点进行分析,确保了数据挖掘效率。
有鉴于此,本发明提出了一种新的基于数据挖掘的用户行为分析方法,包括:采集不同网络环境下的用户行为数据;对采集到的用户行为数据进行分类处理,以得到不同类别的待分析数据,并将不同类别的待分析数据存储于分布式文件系统上;将所述不同类别的待分析数据分配至所述分布式文件系统中的多个数据节点上;基于每个所述数据节点对其所分配到的待分析数据进行预处理与聚合;根据聚合后的待分析数据,确定用户在不同网络环境下的兴趣数据。
在该技术方案中,通过对采集的不同环境下的用户行为数据进行分离处理,以获得不同类别的待分析数据,将获得的待分析数据分配至分布式文件系统中的多个数据节点上,基于每个数据节点完成对其所分配到的待分析数据的预处理与聚合,将海量数据分析任务分散处理,有效降低了计算量和复杂度,确保了数据挖掘效率,此外根据聚合后的待分析数据,确定用户在不同网络环境下的兴趣数据,实现了对用户行为数据的精细化分析。
在上述技术方案中,优选地,还包括:获取用户所使用的当前网络环境;从所述用户在不同网络环境下的兴趣数据中,查找与当前网络环境相对应的目标兴趣数据;搜索与所述目标兴趣数据相关联的网址,并推荐至用户。
在该技术方案中,通过为用户推荐与其兴趣数据相关联的网址,用户可根据需求直接访问网址,而无需浪费精力查找,提升了用户的使用体验。
在上述技术方案中,优选地,所述将所述不同类别的待分析数据分配至所述分布式文件系统中的多个数据节点上的步骤,具体包括:统计所述不同类别的待分析数据的类别数量;根据所述不同类别的待分析数据的类别数量,确定占用所述分布式文件系统中的数据节点的数量,其中,所述分布式文件系统中的数据节点的数量等于所述不同类别的待分析数据的类别数量;依照数据类别将所述不同类别的待分析数据分配至所述分布式文件系统中的数据节点上。
在该技术方案中,采用与待分析数据的类别数量相等的数据节点,依类进行数据分析,确保了数据分析效率。
在上述任一项技术方案中,优选地,所述采集不同网络环境下的用户行为数据的步骤,具体包括:采用爬虫技术采集不同网路环境下的用户行为数据。
在上述任一项技术方案中,优选地,所述不同网络环境包括移动数据网络环境、无线网络环境。
根据本发明的第二方面,提出了一种基于数据挖掘的用户行为分析装置,包括:采集单元,用于采集不同网络环境下的用户行为数据;第一处理单元,用于对采集到的用户行为数据进行分类处理,以得到不同类别的待分析数据,并将不同类别的待分析数据存储于分布式文件系统上;分配单元,用于将所述不同类别的待分析数据分配至所述分布式文件系统中的多个数据节点上;第二处理单元,用于基于每个所述数据节点对其所分配到的待分析数据进行预处理与聚合;第一确定单元,用于根据聚合后的待分析数据,确定用户在不同网络环境下的兴趣数据。
在该技术方案中,通过对采集的不同环境下的用户行为数据进行分离处理,以获得不同类别的待分析数据,将获得的待分析数据分配至分布式文件系统中的多个数据节点上,基于每个数据节点完成对其所分配到的待分析数据的预处理与聚合,将海量数据分析任务分散处理,有效降低了计算量和复杂度,确保了数据挖掘效率,此外根据聚合后的待分析数据,确定用户在不同网络环境下的兴趣数据,实现了对用户行为数据的精细化分析。
在上述技术方案中,优选地,还包括:获取单元,用于获取用户所使用的当前网络环境;查找单元,用于从所述用户在不同网络环境下的兴趣数据中,查找与当前网络环境相对应的目标兴趣数据;推荐单元,用于搜索与所述目标兴趣数据相关联的网址,并推荐至用户。
在该技术方案中,通过为用户推荐与其兴趣数据相关联的网址,用户可根据需求直接访问网址,而无需浪费精力查找,提升了用户的使用体验。
在上述任一项技术方案中,优选地,所述分配单元包括:统计单元,用于统计所述不同类别的待分析数据的类别数量;第二确定单元,用于根据所述不同类别的待分析数据的类别数量,确定占用所述分布式文件系统中的数据节点的数量,其中,所述分布式文件系统中的数据节点的数量等于所述不同类别的待分析数据的类别数量;第三处理单元,用于依照数据类别将所述不同类别的待分析数据分配至所述分布式文件系统中的数据节点上。
在该技术方案中,采用与待分析数据的类别数量相等的数据节点,依类进行数据分析,确保了数据分析效率。
在上述任一项技术方案中,优选地,所述采集单元具体用于:采用爬虫技术采集不同网路环境下的用户行为数据。
在上述任一项技术方案中,优选地,所述不同网络环境包括移动数据网络环境、无线网络环境。
通过以上技术方案,能够基于对不同网络环境下的用户行为数据的挖掘分析来确定用户行为,实现了对用户行为数据的精细化分析,同时将数据分散至多个数据点进行分析,确保了数据挖掘效率。
附图说明
图1示出了根据本发明的实施例的基于数据挖掘的用户行为分析方法的示意流程图;
图2示出了根据本发明的实施例的基于数据挖掘的用户行为分析装置的示意框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的实施例的基于数据挖掘的用户行为分析方法的示意流程图。
如图1所示,根据本发明的实施例的基于数据挖掘的用户行为分析方法,包括:
步骤102,采集不同网络环境下的用户行为数据。
优选地,采用爬虫技术采集不同网路环境下的用户行为数据。
步骤104,对采集到的用户行为数据进行分类处理,以得到不同类别的待分析数据,并将不同类别的待分析数据存储于分布式文件系统上。
步骤106,将所述不同类别的待分析数据分配至所述分布式文件系统中的多个数据节点上。
步骤108,基于每个所述数据节点对其所分配到的待分析数据进行预处理与聚合。
步骤110,根据聚合后的待分析数据,确定用户在不同网络环境下的兴趣数据。
在该技术方案中,通过对采集的不同环境下的用户行为数据进行分离处理,以获得不同类别的待分析数据,将获得的待分析数据分配至分布式文件系统中的多个数据节点上,基于每个数据节点完成对其所分配到的待分析数据的预处理与聚合,将海量数据分析任务分散处理,有效降低了计算量和复杂度,确保了数据挖掘效率,此外根据聚合后的待分析数据,确定用户在不同网络环境下的兴趣数据,实现了对用户行为数据的精细化分析。其中,用户行为数据包括用户用网类型、浏览页面的时间、频率、在页面上的操作信息、搜索关键词等。
在上述技术方案中,优选地,还包括:获取用户所使用的当前网络环境;从所述用户在不同网络环境下的兴趣数据中,查找与当前网络环境相对应的目标兴趣数据;搜索与所述目标兴趣数据相关联的网址,并推荐至用户。
在该技术方案中,通过为用户推荐与其兴趣数据相关联的网址,用户可根据需求直接访问网址,而无需浪费精力查找,提升了用户的使用体验。
在上述技术方案中,优选地,所述将所述不同类别的待分析数据分配至所述分布式文件系统中的多个数据节点上的步骤,具体包括:统计所述不同类别的待分析数据的类别数量;根据所述不同类别的待分析数据的类别数量,确定占用所述分布式文件系统中的数据节点的数量,其中,所述分布式文件系统中的数据节点的数量等于所述不同类别的待分析数据的类别数量;依照数据类别将所述不同类别的待分析数据分配至所述分布式文件系统中的数据节点上。
在该技术方案中,采用与待分析数据的类别数量相等的数据节点,依类进行数据分析,确保了数据分析效率。
在上述任一项技术方案中,优选地,所述不同网络环境包括移动数据网络环境、无线网络环境。
图2示出了根据本发明的实施例的基于数据挖掘的用户行为分析装置的示意框图。
如图2所示,根据本发明的实施例的基于数据挖掘的用户行为分析装置200,包括:采集单元202、第一处理单元204、分配单元206、第二处理单元208和第一确定单元210。
其中,采集单元202用于采集不同网络环境下的用户行为数据;第一处理单元204用于对采集到的用户行为数据进行分类处理,以得到不同类别的待分析数据,并将不同类别的待分析数据存储于分布式文件系统上;分配单元206用于将所述不同类别的待分析数据分配至所述分布式文件系统中的多个数据节点上;第二处理单元208用于基于每个所述数据节点对其所分配到的待分析数据进行预处理与聚合;第一确定单元210用于根据聚合后的待分析数据,确定用户在不同网络环境下的兴趣数据。
其中,优选地,采集单元202具体用于:采用爬虫技术采集不同网路环境下的用户行为数据。
在该技术方案中,通过对采集的不同环境下的用户行为数据进行分离处理,以获得不同类别的待分析数据,将获得的待分析数据分配至分布式文件系统中的多个数据节点上,基于每个数据节点完成对其所分配到的待分析数据的预处理与聚合,将海量数据分析任务分散处理,有效降低了计算量和复杂度,确保了数据挖掘效率,此外根据聚合后的待分析数据,确定用户在不同网络环境下的兴趣数据,实现了对用户行为数据的精细化分析。
在上述技术方案中,优选地,还包括:获取单元212用于获取用户所使用的当前网络环境;查找单元214用于从所述用户在不同网络环境下的兴趣数据中,查找与当前网络环境相对应的目标兴趣数据;推荐单元216用于搜索与所述目标兴趣数据相关联的网址,并推荐至用户。
在该技术方案中,通过为用户推荐与其兴趣数据相关联的网址,用户可根据需求直接访问网址,而无需浪费精力查找,提升了用户的使用体验。
在上述任一项技术方案中,优选地,所述分配单元206包括:统计单元2062,用于统计所述不同类别的待分析数据的类别数量;第二确定单元2064,用于根据所述不同类别的待分析数据的类别数量,确定占用所述分布式文件系统中的数据节点的数量,其中,所述分布式文件系统中的数据节点的数量等于所述不同类别的待分析数据的类别数量;第三处理单元2066,用于依照数据类别将所述不同类别的待分析数据分配至所述分布式文件系统中的数据节点上。
在该技术方案中,采用与待分析数据的类别数量相等的数据节点,依类进行数据分析,确保了数据分析效率。
在上述任一项技术方案中,优选地,所述不同网络环境包括移动数据网络环境、无线网络环境。
以上结合附图详细说明了本发明的技术方案,本发明的技术方案提出了一种新的基于数据挖掘的用户行为分析方案,基于数据挖掘的用户行为分析方案,能够基于对不同网络环境下的用户行为数据的挖掘分析来确定用户行为,实现了对用户行为数据的精细化分析,同时将数据分散至多个数据点进行分析,确保了数据挖掘效率。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于数据挖掘的用户行为分析方法,其特征在于,包括:
采集不同网络环境下的用户行为数据;
对采集到的用户行为数据进行分类处理,以得到不同类别的待分析数据,并将不同类别的待分析数据存储于分布式文件系统上;
将所述不同类别的待分析数据分配至所述分布式文件系统中的多个数据节点上;
基于每个所述数据节点对其所分配到的待分析数据进行预处理与聚合;
根据聚合后的待分析数据,确定用户在不同网络环境下的兴趣数据。
2.根据权利要求1所述的基于数据挖掘的用户行为分析方法,其特征在于,还包括:
获取用户所使用的当前网络环境;
从所述用户在不同网络环境下的兴趣数据中,查找与当前网络环境相对应的目标兴趣数据;
搜索与所述目标兴趣数据相关联的网址,并推荐至用户。
3.根据权利要求1所述的基于数据挖掘的用户行为分析方法,其特征在于,所述将所述不同类别的待分析数据分配至所述分布式文件系统中的多个数据节点上的步骤,具体包括:
统计所述不同类别的待分析数据的类别数量;
根据所述不同类别的待分析数据的类别数量,确定占用所述分布式文件系统中的数据节点的数量,其中,所述分布式文件系统中的数据节点的数量等于所述不同类别的待分析数据的类别数量;
依照数据类别将所述不同类别的待分析数据分配至所述分布式文件系统中的数据节点上。
4.根据权利要求1至3中任一项所述的基于数据挖掘的用户行为分析方法,所述不同网络环境包括移动数据网络环境、无线网络环境。
5.一种基于数据挖掘的用户行为分析装置,其特征在于,包括:
采集单元,用于采集不同网络环境下的用户行为数据;
第一处理单元,用于对采集到的用户行为数据进行分类处理,以得到不同类别的待分析数据,并将不同类别的待分析数据存储于分布式文件系统上;
分配单元,用于将所述不同类别的待分析数据分配至所述分布式文件系统中的多个数据节点上;
第二处理单元,用于基于每个所述数据节点对其所分配到的待分析数据进行预处理与聚合;
第一确定单元,用于根据聚合后的待分析数据,确定用户在不同网络环境下的兴趣数据。
6.根据权利要求5所述的基于数据挖掘的用户行为分析装置,其特征在于,还包括:
获取单元,用于获取用户所使用的当前网络环境;
查找单元,用于从所述用户在不同网络环境下的兴趣数据中,查找与当前网络环境相对应的目标兴趣数据;
推荐单元,用于搜索与所述目标兴趣数据相关联的网址,并推荐至用户。
7.根据权利要求5所述的基于数据挖掘的用户行为分析装置,其特征在于,所述分配单元包括:
统计单元,用于统计所述不同类别的待分析数据的类别数量;
第二确定单元,用于根据所述不同类别的待分析数据的类别数量,确定占用所述分布式文件系统中的数据节点的数量,其中,所述分布式文件系统中的数据节点的数量等于所述不同类别的待分析数据的类别数量;
第三处理单元,用于依照数据类别将所述不同类别的待分析数据分配至所述分布式文件系统中的数据节点上。
8.根据权利要求5至7中任一项所述的基于数据挖掘的用户行为分析装置,所述不同网络环境包括移动数据网络环境、无线网络环境。
CN201710918236.7A 2017-09-30 2017-09-30 基于数据挖掘的用户行为分析方法及用户行为分析装置 Pending CN107704575A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710918236.7A CN107704575A (zh) 2017-09-30 2017-09-30 基于数据挖掘的用户行为分析方法及用户行为分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710918236.7A CN107704575A (zh) 2017-09-30 2017-09-30 基于数据挖掘的用户行为分析方法及用户行为分析装置

Publications (1)

Publication Number Publication Date
CN107704575A true CN107704575A (zh) 2018-02-16

Family

ID=61183268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710918236.7A Pending CN107704575A (zh) 2017-09-30 2017-09-30 基于数据挖掘的用户行为分析方法及用户行为分析装置

Country Status (1)

Country Link
CN (1) CN107704575A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059315A (zh) * 2019-04-16 2019-07-26 广东省科技基础条件平台中心 一种科技资源感知融合决策方法
WO2020000207A1 (zh) * 2018-06-26 2020-01-02 深圳市爱的网络科技有限公司 用户兴趣采集方法、装置、计算机装置及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246725A (zh) * 2013-05-06 2013-08-14 上海河广信息科技有限公司 一种基于无线网络的数据业务推送系统和方法
CN104573021A (zh) * 2015-01-12 2015-04-29 浪潮软件集团有限公司 一种针对互联网行为进行分析的方法
CN104615765A (zh) * 2015-02-13 2015-05-13 中国联合网络通信集团有限公司 一种移动用户上网记录的数据处理方法及装置
US20150339371A1 (en) * 2012-06-28 2015-11-26 Nokia Corporation Method and apparatus for classifying significant places into place categories
CN106682206A (zh) * 2016-12-30 2017-05-17 郑州云海信息技术有限公司 一种大数据处理方法及系统
CN106934014A (zh) * 2017-03-10 2017-07-07 山东省科学院情报研究所 一种基于Hadoop的网络数据挖掘与分析平台及其方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150339371A1 (en) * 2012-06-28 2015-11-26 Nokia Corporation Method and apparatus for classifying significant places into place categories
CN103246725A (zh) * 2013-05-06 2013-08-14 上海河广信息科技有限公司 一种基于无线网络的数据业务推送系统和方法
CN104573021A (zh) * 2015-01-12 2015-04-29 浪潮软件集团有限公司 一种针对互联网行为进行分析的方法
CN104615765A (zh) * 2015-02-13 2015-05-13 中国联合网络通信集团有限公司 一种移动用户上网记录的数据处理方法及装置
CN106682206A (zh) * 2016-12-30 2017-05-17 郑州云海信息技术有限公司 一种大数据处理方法及系统
CN106934014A (zh) * 2017-03-10 2017-07-07 山东省科学院情报研究所 一种基于Hadoop的网络数据挖掘与分析平台及其方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
仇星: "三网合一的用户行为分析系统的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020000207A1 (zh) * 2018-06-26 2020-01-02 深圳市爱的网络科技有限公司 用户兴趣采集方法、装置、计算机装置及计算机可读存储介质
CN110059315A (zh) * 2019-04-16 2019-07-26 广东省科技基础条件平台中心 一种科技资源感知融合决策方法
CN110059315B (zh) * 2019-04-16 2023-07-07 广东省科技基础条件平台中心 一种科技资源感知融合决策方法

Similar Documents

Publication Publication Date Title
CN101192227B (zh) 一种基于分布式计算网络的日志文件分析方法和系统
CN102663064B (zh) 一种收藏夹数据的处理方法及装置
CN103714084B (zh) 推荐信息的方法和装置
CN102663048B (zh) 一种搜索结果提供方法及装置
CN104077415B (zh) 搜索方法及装置
CN103577478B (zh) 网页推送方法及系统
CN103885987B (zh) 一种音乐推荐方法和系统
CN102831193A (zh) 基于分布式多级聚类的话题检测装置及方法
CN105260414B (zh) 用户行为相似性计算方法及装置
CN102591942A (zh) 一种应用自动推荐的方法及装置
CN104503988B (zh) 搜索方法及装置
CN103377240B (zh) 信息提供方法、处理服务器及合并服务器
CN105930527B (zh) 搜索方法及装置
CN103530365A (zh) 获取资源的下载链接的方法及系统
CN108446964A (zh) 一种基于移动流量dpi数据的用户推荐方法
Yu et al. A coupled clustering approach for items recommendation
CN107896153A (zh) 一种基于移动用户上网行为的流量套餐推荐方法及装置
CN108829704A (zh) 一种大数据分布式挖掘分析服务技术
CN107704575A (zh) 基于数据挖掘的用户行为分析方法及用户行为分析装置
CN109409940A (zh) 基于路径的浏览处理方法、装置、设备和存储介质
CN104281629A (zh) 从网页中提取图片的方法、装置及客户端设备
CN103227941B (zh) 数据推送系统及数据推送方法
CN104484367A (zh) 一种数据挖掘分析系统
CN105426407A (zh) 一种基于内容分析的web数据采集方法
CN105989019B (zh) 一种清洗数据的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180216